深度求索官方(DeepSeek)8月21日宣布,正式对外发布DeepSeek-V3.1,表示这个最新模型使用了UE8M0 FP8 Scale的参数精度,并且透露UE8M0 FP8是针对即将发布的下一代国产芯片而设计。
8月21日,深度求索通过其微信公众号宣布,正式发布 DeepSeek-V3.1。本次升级包含以下主要变化:
1,混合推理架构:一个模型同时支持思考模式与非思考模式;
2,更高的思考效率:相比之前发布的DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;
3,更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
深度求索官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
深度求索表示,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。并且解释称,UE8M0 FP8是针对即将发布的下一代国产芯片设计。
此前由于DeepSeek没有推出R2版本,有谣言称是因为深度求索用国产芯片进行模型训练遇到困难,模型的稳定性达不到预期,国产芯片厂家甚至派了一支工程师团队常驻深度求索提供技术支持。
深度求索最新发布的升级和透露的国产芯片信息无疑粉碎了这一谣言。扬子晚报/紫牛新闻记者 宋世锋
校对 朱亚萍