作 者丨见习记者李益文
编 辑丨叶映橙 江佩佩
8月21日午间,DeepSeek官方宣布V3.1版本正式发布,带来多项重要升级。新版本采用混合推理架构,支持思考与非思考模式的自由切换,响应效率显著提升,Agent能力也进一步增强。
据DeepSeek官方介绍,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,对分词器11及chat template进行了较大调整,与 DeepSeek-V3 存在明显差异。DeepSeek官微在置顶留言里说,UE8M0 FP8是针对即将发布的下一代国产芯片设计。
同时, DeepSeek进行了价格调整,模型的API接口调用价格有所上涨。自9月6日凌晨起,取消夜间时段优惠,输入价格上,缓存命中时为0.5元/百万tokens,缓存未命中的价格则为4元/百万tokens(此前V3为2元/百万tokens);输出价格为12元/百万tokens(此前V3为8元/百万tokens)。
官方提到,V3.1的基础模型在V3的基础上重新做了外扩训练,一共增加训练了840B tokens。基础模型与后训练模型均已在Huggingface与魔搭开源。
公开资料显示,每日互动成立于2010年,公司主营业务是为商业主体和政府部门提供丰富的数据智能产品、服务与解决方案。
今年初,DeepSeek爆火后,市场曾有传言称,每日互动通过全资子公司杭州应景科技有限公司持有DeepSeek开发团队——幻方量化14.50%的股权,是幻方量化的二股东,能够通过资本纽带深度参与幻方量化的战略决策,共享发展红利。受此预期推动,每日互动股价曾走出5天4板的行情。
不过,每日互动随后便发布公告澄清:经公司核实,深度求索的关联公司——幻方科技的一位重要股东确实曾为每日互动创始核心骨干成员;但截至本公告披露日,每日互动未持有深度求索和幻方科技的股权,也尚未向DeepSeek提供语料数据。
(声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)