现如今的国产科技正在疯狂的崛起,但想真正的崛起,绝不是一家手机厂商可以做到的,而是大家联合起来一起发力。
比如近期有消息称DeepSeek V4优先适配华为芯片,并放弃英伟达,这对于科技市场来说,真的是非常少见。
因为如今全球大模型公司还在为抢购英伟达H100焦头烂额,然而DeepSeek却将完全运行在华为昇腾芯片上。
所以从这个角度来说,意味着国产科技正在崛起的过程中,那么让我们长话短说,一起来聊一聊具体的信息吧。

据《The Information》等多家外媒报道,DeepSeek新一代大语言模型V4,已基于包括华为在内的最新国产AI芯片完成深度优化。
而且为确保V4在国产硬件上高效运行,DeepSeek过去数月与华为及寒武纪密切合作,对模型底层程序进行了调整与重写,并同步开展测试验证。
最为关键的是,DeepSeek此次未向美国AI芯片供应商开放测试,而是将国产芯片厂商置于优先位置。
不仅如此,DeepSeek还同步开发了两款针对不同应用场景优化的V4衍生版本,同样基于中国芯片设计。

与此同时,为应对基于V4的云服务上线需求,阿里巴巴、字节跳动和腾讯等科技巨头已提前下单华为新一代AI芯片,订单规模达数十万颗。
这意味着,中国AI大模型正在逐步摆脱对英伟达CUDA生态的依赖,开启全栈国产化的新阶段,自然是非常好的消息。
而为什么是华为芯片,笔者觉得昇腾950系列芯片的实力是非常够用的,并且将分阶段推出版本和大家见面。
其中昇腾950PR芯片已率先在2026年第一季度发布,该芯片采用华为自研的高带宽内存,主要面向推理Prefill阶段和推荐业务场景。

而昇腾950DT芯片则计划于2026年第四季度推出,更注重推理Decode阶段和训练场景,两款芯片的微架构将升级为SIMD/SIMT,算力分别达到1PFLOPS和2PFLOPS。
关键在2026年3月的华为中国合作伙伴大会上,搭载昇腾950PR处理器的AI训练推理加速卡Atlas 350已正式发布,并进入商用阶段。
据华为官方介绍,Atlas 350单卡FP4精度算力达1.56P,带宽达1.4TB/s,FP4算力为英伟达H20的2.87倍,HBM容量112GB(为H20的1.16倍),多模态生成速度提升60%。
此外,Atlas 350是目前国内唯一支持FP4低精度的推理产品,且昇腾950PR芯片还支持FP32、FP16、BF16、FP8、MXFP8、FP4等多种数据格式,互联带宽2TB/s,内存容量128GB、带宽1.6TB/s。

不过华为副董事长徐直军此前曾公开表示,由于美国制裁,华为无法到台积电投片,单颗芯片的算力相比英伟达存在差距。
但华为在超节点互联技术上实现突破,能够做到万卡级的超节点集群,通过计算、互联和生态的协同优化,昇腾正逐步缩小与国际顶尖水平的差距。
再加上IDC此前发布的报告显示2025年中国AI加速服务器市场中,本土芯片厂商的市占率已攀升至约41%,其中以华为占据国产芯片总出货量近半。
所以随着昇腾950系列芯片的推出,华为在国产AI芯片市场的领先地位将进一步巩固,或许这也是DeepSeek V4进行采用的原因之一。

另外据路透社报道,DeepSeek未向英伟达开放V4的性能优化测试,仅向华为等国内芯片厂商提供了模型早期访问权限。
而且最终适配效果超预期,V4在昇腾芯片上推理速度提升35倍,能耗降低40%,完全满足商用标准,结合政务、金融等领域已开启大规模测试,标志着国产AI算力具备大规模商用能力。
这一决策引发市场连锁反应,阿里、字节、腾讯已提前下单数十万颗华为昇腾950PR芯片,推动该芯片价格近几周上涨20%,本月已启动大规模量产。
同时科大讯飞等国内厂商也宣布将新一代大模型与昇腾算力深度适配,据悉V4预计4月发布,其全栈国产方案已震撼全球AI界。

总之,DeepSeek V4放弃英伟达、优先适配华为芯片,标志着中国AI大模型开始真正摆脱对国外算力的依赖。
所以大家对此有什么想表达的吗?欢迎回复讨论。