当特朗普在TruthSocial宣布“允许英伟达向中国交付H200芯片”时,全球半导体行业多少有些惊讶,然而在这一消息影响的直接对象——中国市场,反而显得有些平静了。 这款曾被拜登政府严防死守的高性能AI芯片,如今却要带着25%的“过路费”重返中国市场。 这场戏剧性转折背后,是美方在技术封锁松动还是商业利益间的博弈呢?
也许事情远比表面上的复杂得多。

在特朗普宣布H200向中国解禁的消息后,英伟达的发言人就在声明里表示,“我们赞赏特朗普总统允许美国芯片产业参与竞争,从而支持美国高薪就业和制造业的决定。 向经商务部审核批准的商业客户提供H200芯片,这一深思熟虑的平衡对美国来说意义重大。”
显然,这是英伟达所期望的。
有消息称,12月初的时候,黄仁勋分别拜会了特朗普和共和党参议员,讨论了对华芯片销售的问题。 从现在的消息看,双方是提前达到了“交易”。
显然,此前美国的“GAIN AI法案”(《人工智能促进法案》)在今天中美半导体产业环境的现实和英伟达等芯片公司的利益面前,还是开始松动了。
这大致会让黄仁勋多少松上一口气的。
在11月份,金融时报和彭博社就曝出了黄仁勋在一个私人场合的“牢骚”,其中就显示出了十分焦虑与不安。 在谈到芯片管制时,他是有些愤怒了的,“这些出口管制是我们干过的最蠢的事。 你就是给了他们 50年来最好的全国总动员任务。 这就跟吃了类固醇的斯普特尼克时刻一样。”
更让黄仁勋焦虑的是,一年多前英伟达的AI芯片拥有中国95%的份额,而到最近,其市场份额基本归零。 当然最大的不甘是中国国产芯片在技术上的巨大进步,“别低估华为。 他们的升腾910C在大多数负载下已经只比H100慢8-12%,而且他们现在每月能造20万片。”
这就是黄仁勋不停地与特朗普与美国高层不停勾兑的原因,也是这次特朗普放开H200禁令的根源。

特朗普政府的这次芯片解禁,看似是对中国AI算力的管控放松,但真实的意图藏在了两个“尾巴”里。
一个是特朗普所说的“英伟达最为高端的Blackwell芯片和下一代Rubin芯片不包含在此次交易中”,对美国来说,这两款支持万亿参数大模型训练的芯片,才是真正决定人工智能竞赛走向的战略性武器。 原则上说,对于我国AI算力打击,其实并没有放松,之所以选择解禁H200芯片,其根源在于国产替代芯片在技术上已经接近H200的水平,再限制已经没有了意义。
二是特朗普对出售对象的设计,美国将允许英伟达向中国和其他国家的核准客户(approved customers)交付其H200产品。 这里面的核准客户以及包括对美“国家安全约束”则说明,这次英伟达获准出售的H200,不仅并不是中国AI芯片不能生产的芯片,能买到的企业,也必须的美国商务部核准的。
大胆推测一下,即使销售允许,大概率原来上了美国实体清单的企业和机构也是无法获得H200的,而真正能获得芯片的企业,应该是华尔街资本深度投资的互联网企业。
从这次美国允许英伟达H200出售的心思可以看出,英伟达也好,后续要加入的的英特尔和AMD也好,美国政府想要的,不仅仅是精准管控中国的AI算力芯片,而且要让中国市场贡献出更大的利润,并同时能压制中国国产芯片的发展进程。

“战场”上拿不到的,永远别想在谈判桌上拿到。 这次美国允许英伟达出售H200的事,也再印证了这一道理。
对于看似“天大”的好消息,中国企业却反应平淡,这里面核心的原因在于,近两年间,随着国产替代芯片的快速进步,大多数企业的AI算力中心已经切换到了两种模式。 有媒体报道,某头部AI企业的CTO透露,“我们现在采购H200更多是作为备胎,主要算力已经切换到国产平台。”同时,有企业的测试对比数据显示,在千亿参数大模型训练中,20片升腾910B集群的效能相当于18片H200,但成本仅为后者的60%。 阿里、百度等云服务商已启动“双轨制”采购,在进口芯片与国产芯片间保持动态平衡。
时间倒回2022年10月,当拜登政府将英伟达高端芯片列入出口管制,恐怕没想到中国企业的反应速度。 华为在禁令发布72小时内就向重点客户交付了升腾替代方案,寒武纪则在叁个月后推出思元590,性能直接对标A100。 最让业界震惊的是,这些国产芯片并非简单仿制,而是选择了更前沿的技术路线。
中国国产替代的加速令英伟达等美方企业如坐针毡。 华为升腾910B芯片实测性能已达H20的90%,中科院计算所发布的“寒武纪”系列更在特定场景超越国际同类产品。 美国半导体工业协会报告指出,中国AI芯片自给率已从2020年的12%提升至2023年的37%。
中国AI芯片的发展远比现在看到的更为乐观,工信部最新指导意见更要求关键基础设施的AI算力国产化率2025年达到50%,这是建立在国产AI芯片的供应能力和技术进步上的规划。
或许真正令黄仁勋和英伟达们焦虑的是今年9月份华为发布的升腾950/960/970系列。 明年上市的升腾950系列支持FP8/MXFP8/MXFP4等低数值精度数据格式,算力可达到1P和2P,提升训练效率和推理吞吐,并特别支持华为自研的HiF8,在保持FP8的高效的同时,精度非常接近FP16。 同时华为结合推理不同阶段对算力、内存和访存带宽等不同需求,自研了两种低成本HBM(高带宽内存),不同的HBM与升腾950裸芯片合封,分别构成升腾950PR:面向Prefill和推荐场景,以及升腾950DT:面向Decode和训练场景。
更重要的2027年四季度即将推出Atlas 960超节点,它基于15488颗升腾960芯片组成,其总算力、内存容量、互联带宽在Atlas 950基础上再翻倍。 其中,FP8总算力将达到30E FLOPS,而FP4总算力将达到60 EFLOPS;内存容量达到4460TB,互联带宽达到34PB/s。
也许只要生产环节跟得上,中国两年后在算力供应上,根本不用担心算力跟不上。
更重要的是表面看是芯片之争,实则是整个算力生态的博弈。 过去两年,中国AI企业已经悄然重建了从编译器到框架的完整工具链。 华为CANN异构计算架构现已支持超90%的TensorFlow/PyTorch算子,寒武纪MLU软件栈甚至能自动将CUDA代码转换为原生指令。
所以,对于特朗普的这次芯片解禁,无论是中国企业还是中国政府,都显得平静,“注意到相关报道,中方一贯主张,中美通过合作实现互利共赢”。