目前在训练芯片领域,英伟达几乎处于垄断地位。全球几乎所有公司都要靠英伟达的AI芯片训练模型,科技大厂自研芯片越顺利,对英伟达越不利
文|《财经》研究员 吴俊宇
编辑 | 谢丽容
全球主要云计算厂商(如亚马逊AWS、微软Azure、谷歌云、甲骨文OCI、阿里云、华为云等),目前几乎都在使用英伟达的AI芯片。不过,云厂商一直期望能够自研AI芯片,摆脱对英伟达的依赖。
国际市场调研机构TechInsights 2024年数据显示,英伟达目前在AI芯片市场份额高达65%。AI芯片主要分成训练、推理两类。在训练芯片市场,英伟达几乎处于垄断地位。全球几乎所有公司,都要靠英伟达的AI芯片训练模型。
今年3月,英伟达创始人黄仁勋曾在GTC(Nvidia GPU Technology Conference)2025大会披露,美国四大云厂商——亚马逊AWS、微软Azure、谷歌GCP、甲骨文OCI 2024年采购了130万枚Hopper(H100/H200)系列芯片,2025年将采购360万枚Blackwell系列芯片(GB200)。
作为全球最大云厂商,亚马逊AI芯片自研步伐正在加快。它自研的Trainium系列AI芯片已大规模出货。 6月20日,《财经》在亚马逊云科技中国峰会了解到,亚马逊自研的AI训练芯片Trainium 3将于2025年末量产。亚马逊自研的上代Trainium 2芯片,也已经被亚马逊投资的AI创业公司Anthropic用于训练大模型。
亚马逊自研AI芯片已大规模出货
Trainium 3在2024年12月初首次被发布,但当时尚未大规模量产。亚马逊AWS CEO(首席执行官)Matt Garman(马特·加曼)在re:Ivent演讲时曾披露,Trainium 3芯片性能比其前代产品Trainium 2提升两倍,能效提高40%。这款芯片采用了台积电的3nm工艺制程,这是数据中心芯片最先进的工艺。
亚马逊管理层在2024年报后的投资者电话会中曾披露,公司在全力开发Trainium 3,预计将于2025年底发布预览版,并随后将Defining(直译为定义,指芯片设计最初阶段,对芯片功能、功耗、性能、成本等指标进行规划)Trainium 4。
Anthropic使用Trainium 2训练大模型被认为是一个重要突破。因为,目前大部分云厂商的自研AI芯片通常只被用于推理这种难度更低的工作。自研AI芯片用于训练,需要进行大量软件适配工作。这需要亚马逊和Anthropic共同投入工程师进行反复测试。
Anthropic联合创始人兼首席计算官Tom Brown(汤姆·布朗)2024年12月曾宣布“雷尼尔计划”(Project Rainier)——Anthropic未来将使用一个拥有数十万Trainium 2芯片的集群。芯片数量将是Anthropic当时算力集群的5倍以上(报道详见)。
亚马逊管理层在2025年一季度财报电话会中披露,Trainium 2相比其他AI芯片,性价比高出30%-40%。 一位亚马逊AWS中国区人士介绍,Anthropic和亚马逊的紧密战略关系是这些合作的基础。
Anthropic是一家对标OpenAI的AI创业公司。它和亚马逊AWS深度绑定。大部分亚马逊AWS的客户,都会默认首选Claude系列模型。国际创投数据库Crunchbase显示,Anthropic 2023年至今已完成14次融资,总金额182亿美元。其中,亚马逊向Anthropic三次投资80亿美元,是Anthropic最大投资者。
科技大厂自研芯片越顺利,对英伟达越不利
2025年,生成式AI的落地在加速。这将导致算力消耗大幅增长。几乎所有云计算厂商都在加大资本开支,用于采购芯片、服务器,建设数据中心。
亚马逊管理层在2024年财报后的电话会议曾披露,计划2025年投入1000亿美元资本支出,增速接近30%,主要用于云业务。这在全球科技公司的资本开支计划中是最高的(报道详见)。
亚马逊1000亿美元资本开支,其中很大一部分会被用于采购芯片。一位中国云厂商战略规划人士曾分析,科技公司的资本开支,80%被用于算力基础设施。算力开支中,至少30%被用于采购AI芯片。如果照此计算,亚马逊2025年AI芯片采购支出可能超过200亿美元。
目前,亚马逊没有公布AI芯片中,自研芯片和英伟达芯片的占比。但亚马逊管理层在2024年12月的re:Ivent曾明确表示,未来AI训练/推理自研芯片的采购比例将提升。
在亚马逊的算力集群中,自研AI芯片占比越大,英伟达AI芯片占比相应就会越小。这是个此消彼长的关系,而且类似情况也出现在其他云厂商——目前,包括亚马逊、微软、谷歌、华为、阿里、百度等科技公司都在自研AI芯片,这些自研芯片都会蚕食英伟达的市场。
《财经》了解到,目前华为的自研芯片昇腾、百度的自研芯片昆仑芯都被用于训练大模型。 英伟达过去无可替代的垄断地位正在松动。
英伟达2024年报披露,目前超过45%的收入来自大型云厂商及科技公司。亚马逊、微软、华为、阿里、百度等大型科技公司自研芯片越顺利,对英伟达的未来业绩增长就越不利。
事实上,亚马逊的CPU(中央处理器)已实现了类似替代工作。目前,亚马逊全球新增算力的一半以上都是基于Arm架构Graviton系列自研芯片,数量已超过英特尔、AMD销售的x86系列芯片(报道详见)。
一位中国云厂商芯片负责人曾对《财经》表示,云计算需要降低计算成本。理论上说,在实现量产的前提下,自研芯片通常比英特尔、英伟达的芯片采购成本、运营成本更低。节省下来的成本可以让利给客户,用于降低算力价格,最终实现云计算的规模优势。
责编 | 张生婷
题图 | 视觉中国
上一篇:长春从“光学摇篮”迈向光电城