原创 DeepSeek 更新,一句话让国产芯片集体暴涨!
创始人
2025-08-25 13:33:00
0

DeepSeek V3.1 一上线,官方的一条留言就把整个 AI 圈炸了。

新的架构、下一代国产芯片,短短不到 20 个字,却信息量满满,引发热议。

这两天老狐看了不少科普文后,简单理解就是:国产 AI 正在走向软硬协同阶段,未来模型有望实质性减少对英伟达、AMD 等国外算力的依赖。

同时,这次更新还打破了“性能越高成本越贵”的行业魔咒,让金融、医疗等高算力场景的应用想象空间一下子被打开。

资本市场的反应也很直接:DeepSeek 一官宣,国产芯片概念股应声大涨,每日互动尾盘直线拉升,收盘大涨 13.62%。

有网友调侃说:国产芯片迎来史诗级暴涨,DeepSeek 一句话,周五大盘直接冲上 3800 点。

这两天,DeepSeek 官方上线 V3.1 版本,没铺天盖地宣传,就像平常一样低调发个公告。

老狐整理了一下这次 V3.1 的更新,最核心、最有革命性的创新,就是它的混合推理架构——Hybrid Reasoning Architecture。

这个架构能同时支持思考模式和非思考模式,用户可以随时切换,想慢慢分析就慢慢分析,想快速出结果也没问题。

以前 DeepSeek 的产品线里,分工很清楚:V3 模型擅长通用对话,R1 模型更偏深度思考。这种分离式架构好处是,各个模型都能在自己擅长的领域表现不错,但用户来回切换很麻烦。

现在,V3.1 打破了这种壁垒,把通用对话、复杂推理、专业编程等多种核心功能集成在同一个模型里,让使用体验更灵活,效率更高。

不仅如此,V3.1 的推理效率也大幅提升。官方数据显示,思考模式下,它在各项任务的平均表现和前代顶级 R1-0528 持平,但输出的 token 数量减少了 20% 到 50%。非思考模式下,输出长度也更短,但性能不打折。

这背后其实是“思维链压缩”在起作用:模型在训练阶段学会生成更简洁、高效的推理路径,同时保证答案准确。简单理解,就是算法更聪明了。

为什么要这样做?很简单:省钱!

过去,思维链虽然能让模型推理更强,但冗长的中间步骤会带来高昂计算成本和 API 调用费用,想大规模应用就很难

V3.1 的思维链压缩,正好解决了这个问题,把高级 AI 推理能力从学术工具变成了可大规模商业化使用的经济方案。

社区测试中,DeepSeek V3.1 在 Aider 多语言编程测试里,分数已经超过了 Claude 4 Opus,而且成本还更低。

这下开发者都在刷屏了,Hugging Face 上的热度也蹭蹭往上。

值得一提的是,DeepSeek 官宣 V3.1 的时候提到,这次模型用了 UE8M0 FP8 Scale 的参数精度,同时对分词器和 chat template 也做了不小的调整,所以和之前的 V3 有明显区别。

说到 DeepSeek V3.1 用的 “UE8M0 FP8”, 老狐简单学习后科普一下:

FP8 就是把普通浮点数压缩成 8 位来存,既省空间又省算力。

再加上 MXFP8 的“块缩放”思路:把数据分块,每块用自己的缩放系数,这样既不会丢太多信息,又能节省更多资源。

名字里的 U、E、M 可以理解为“无符号 + 指数 + 尾数”。UE8M0 里所有 8 位都用来表示指数,没有尾数和符号位,这让处理器复原数据时非常轻松:只要移动指数位就行,不用做复杂乘法,速度快、路径短。

这个格式的另一个优势是动态范围大,可以同时表示很大和很小的数,不容易溢出或被压成 0,也就是在保证 8 位张量精度的同时,把信息损失降到最低。

这对国产新芯片特别合适,以前大部分国产 AI 芯片用的还是 FP16/INT8,没法原生用 FP8。

为什么说它更适合下一代国产芯片?目前大部分国产 AI 加速器还是 FP16/INT8 方案,没有完整的 FP8 单元。

新一代芯片,比如摩尔线程 MUSA 3.1 GPU、芯原 VIP9000 NPU,都开始支持原生 FP8,DeepSeek V3.1 的 UE8M0 格式正好匹配这些硬件。

总结一句话:UE8M0 FP8 让模型在新一代国产芯片上跑得更省空间、更快、更稳,同时保持精度。

这也是为什么 DeepSeek 官微特别提到它,为国产 AI 带来了更低成本、高性能的新可能。

再来看看更新后一些体验,大家关心的官网能不能直接访问,官方也给出了答案。

打开官网一看,DeepSeek 把 App 和网页端的“深度思考(R1)”改成了“深度思考”,官方确认了网友之前的猜测——模型已经更新了。

看看万能的网友们,都玩出了什么新花样。

推特 X 上有 AI 博主分析新模型生成的小球跳动效果更符合物理定律了,还能调重力、摩擦、旋转速度、弹跳这些参数。

还有人直接用 DeepSeek V3.1 做了个振动编码,当场变身 VJ。

更有网友让 V3.1 给自己画了个自画像,画风意外特别。

不过,社区中还是有部分用户吐槽翻译和写作,SYSTEM PROMPT 需要现场写指令,中英夹杂和错词偶尔出现,有点乱。

感兴趣的狐友们,现在可以上官网自行体验一番了~

老狐觉得每次 DeepSeek 更新都让人期待下一次,几乎快成了国产 AI 的精神图腾了,一起期待 DeepSeek R2 吧。

参考资料:

DeepSeek、智东西、X、微博等网络

编辑:不吃麦芽糖

相关内容

北斗智能电位采集仪的使用方...
北斗智能电位采集仪(常集成于北斗智能测试桩中)通过高精度传感器与北...
2025-10-13 20:34:37
半导体板块强势发力,科创板...
今日,半导体板块强势发力,华虹公司涨停,沪硅产业、中科飞测、晶合集...
2025-10-13 20:34:16
原创 ...
前言 自特朗普第二次任期以来,中美两国的关系丝毫没有转变,甚至朝...
2025-10-13 20:33:40
vivo X300系列全球...
快科技10月13日消息,vivo X300系列正式亮相,这次viv...
2025-10-13 20:33:26
闻泰科技突遭“黑天鹅”!半...
正在有序剥离ODM业务的闻泰科技(600745.SH),半导体业务...
2025-10-13 20:06:12
半导体芯片板块午后持续走强...
今日,半导体芯片板块午后持续走强。截至收盘,中证云计算与大数据主题...
2025-10-13 20:06:00
上海AIoT芯片龙头冲刺港...
芯片累计出货超过10亿颗。 作者 | ZeR0 编辑 | 漠影 芯...
2025-10-13 20:05:47
选冰箱看这里!嵌入式冰箱机...
当家装一体化成为品质生活的标配,零嵌入冰箱既要满足 “视觉和谐” ...
2025-10-13 19:37:13
电力设备行业资金流出榜:宁...
沪指10月13日下跌0.19%,申万所属行业中,今日上涨的有6个,...
2025-10-13 19:37:04

热门资讯

电力设备行业资金流出榜:宁德时... 沪指10月13日下跌0.19%,申万所属行业中,今日上涨的有6个,涨幅居前的行业为有色金属、环保,涨...
炸了一夜,俄军大轰炸,基辅大停... “炸!炸!炸!基辅大停电”!就在乌克兰总统在泽连斯基宣布,“如果基辅停电,那俄罗斯首都莫斯科就停电”...
数据显示:中国限制美国牛肉后,... 【文/观察者网 熊超然】“中方事实上对美国牛肉实施的禁令,让澳大利亚养牛户和出口商从中受益。”10月...
油价调整!加满一箱油将少花3元... 人民网北京10月13日电 (记者罗知之)据国家发展改革委网站消息,近期国际市场油价波动运行,根据10...
中航光电:截至10月10日股东... 证券之星消息,中航光电(002179)10月13日在投资者关系平台上答复投资者关心的问题。 投资者提...
电子洁净车间建设方案 电子洁净车间是电子行业(如半导体、显示面板、电子元器件、集成电路等)生产的核心基础设施,其核心需求是...
荷兰“抢劫”闻泰科技,安世半导... 文|高见pro 10月12日,闻泰科技发布一则公告,其核心半导体子公司安世半导体(Nexperia...
港股收评:跌幅收窄恒指跌1.5... 格隆汇10月13日|午后跌幅持续收窄,恒生指数收跌1.52%报25889点,盘中曾一度跌至3.6%,...
荷兰政府对中企控股的半导体公司... 10月13日,有记者就荷兰将对闻泰科技的控股子公司安世半导体采取限制措施提问,外交部发言人林剑表示中...
中京电子(002579)披露股... 截至2025年10月13日收盘,中京电子(002579)报收于11.78元,较前一交易日下跌2.16...