微软发布第二代AI推理芯片Maia 200
创始人
2026-01-31 02:09:19
0

微软近日宣布推出MAIa 200,这是一款被描述为突破性推理加速器和推理动力源的第二代AI芯片。该芯片的发布标志着AI的未来可能不仅仅在于AI模型能生成多少Token,而在于如何以最优化的方式完成这一过程。

Maia 200专为异构AI基础设施而设计,适用于多种环境,特别针对大型推理模型的推理任务进行了优化开发。微软声称这是目前任何超大规模云服务商中性能最强的自研芯片,也是微软迄今为止部署的最高效的推理系统。

性能优势显著

根据微软提供的数据,Maia 200在性能方面表现突出。在4位浮点(FP4)性能方面,Maia 200比第三代Amazon Trainium性能高出3倍,8位浮点(FP8)性能则超过了Google第七代TPU。

具体数据显示,Maia 200具备以下特性:峰值4位浮点性能达10,145 teraflops,而AWS Trainium3仅为2,517;峰值8位浮点性能为5,072 teraflops,相比之下Trainium3为2,517,Google TPU第七代为4,614;高带宽内存(HBM)速度达每秒7 terabits,超过Trainium的4.9和Google TPU第七代的7.4;HBM容量为216GB,高于Trainium的144GB和Google TPU第七代的192GB。

此外,微软表示Maia 200每美元的性能比目前机群中的最新一代硬件提升30%。大量的高带宽内存允许模型在尽可能接近计算单元的位置运行。微软称:"实际上,Maia 200能够轻松运行目前最大的模型,并为未来更大的模型留有充足空间。"

技术创新架构

Maia 200在数据传输方面采用了创新方法,通过重新设计的内存子系统为模型提供数据。该系统包含专门的直接内存访问(DMA)引擎、片上静态随机存取内存(SRAM)以及专门的片上网络(NoC)结构。这些技术的结合实现了高带宽数据传输,同时提升了Token吞吐量。

微软特别强调Maia 200是专门为现代大语言模型而设计的。该公司表示,具有前瞻性的客户不仅需要文本提示功能,还需要支持多模态能力(声音、图像、视频)的访问,这些能力支持更深层的推理功能、多步骤智能体,以及最终的自主AI任务。

应用场景与集成

作为异构AI基础设施的一部分,Maia 200将为多种模型提供服务,包括OpenAI最新的GPT-5.2系列。该芯片与Microsoft Azure无缝集成,Microsoft Foundry和Microsoft 365 Copilot也将从中受益。微软的超级智能团队还计划使用Maia 200进行强化学习(RL)和合成数据生成,以改进内部模型。

从规格角度来看,Maia 200在多个方面超越了Amazon的Trainium和Inferentia以及Google的TPU v4i和v5i。该芯片采用3nm工艺制造,相比之下Amazon和Google芯片采用7nm或5nm工艺,在计算、互连和内存能力方面都表现出色。

行业分析师认为,微软的方法与其他超大规模云服务商有所不同。微软将推理视为战略核心,并为智能体AI驱动的环境构建了优化平台。

市场前景与部署

Maia 200目前已在微软位于爱荷华州得梅因附近的美国中部数据中心区域部署。下一步将在亚利桑那州凤凰城附近的美国西部3数据中心区域推出,随后扩展到其他区域,但具体时间和地点尚未公布。

开发者和早期采用者可以注册预览版Maia 200软件开发工具包(SDK),该工具包提供了为Maia 200构建和优化模型的工具,包括PyTorch集成、Triton编译器、优化内核库,以及访问Maia低级编程语言的功能。

Q&A

Q1:Maia 200相比其他云服务商的AI芯片有什么优势?

A:Maia 200在4位浮点性能方面比Amazon Trainium3高出3倍,8位浮点性能超过Google第七代TPU。同时采用3nm工艺制造,拥有216GB HBM容量和每秒7 terabits的高带宽内存速度,每美元性能比现有硬件提升30%。

Q2:Maia 200适合什么样的AI应用场景?

A:Maia 200专门针对大型推理模型优化,特别适合需要高吞吐量和大内存的工作负载。它支持现代大语言模型,包括多模态能力(声音、图像、视频),支持深层推理、多步骤智能体和自主AI任务。

Q3:如何使用Maia 200芯片?

A:开发者可以注册预览版Maia 200软件开发工具包,该工具包提供PyTorch集成、Triton编译器等工具。目前芯片已在微软美国中部数据中心部署,与Azure平台无缝集成,未来将扩展到更多区域。

相关内容

微光股份:预计2025年净...
以本次披露业绩预告均值计算,公司近年市盈率(TTM)图如下所示: ...
2026-01-31 03:38:54
光电股份涨2.02%,成交...
来源:新浪证券-红岸工作室 1月27日,光电股份盘中上涨2.02%...
2026-01-31 03:38:51
朝阳区劲松老年家园|社区嵌...
导语:在城区养老,最难得的是“不离烟火、不负安康”——既守得住熟悉...
2026-01-31 03:09:13
经济热点快评 | 中国咋成...
来源:市场资讯 (来源:江苏现代能源微网) “中国电力增长势头惊人...
2026-01-31 03:09:09
原创 ...
2026年1月底,A股上市公司开始密集披露2025年的业绩成绩单。...
2026-01-31 03:09:05
信息工程学院召开2025年...
为深学细悟习近平新时代中国特色社会主义思想,持续夯实基层团组织建设...
2026-01-31 03:09:01
(图表)2025年我国规上...
新华社图表,北京,2026年1月30日 工业和信息化部1月30日...
2026-01-31 03:08:52
AI需求爆发,又一家国产芯...
继中微半导、国科微宣布相关芯片产品涨价后,近日,国产芯片厂商英集芯...
2026-01-31 02:39:49
民德电子(300656)披...
截至2026年1月30日收盘,民德电子(300656)报收于31....
2026-01-31 02:39:47

热门资讯

微软发布第二代AI推理芯片Ma... 微软近日宣布推出MAIa 200,这是一款被描述为突破性推理加速器和推理动力源的第二代AI芯片。该芯...
开年首单半导体“A吃A”!江丰... 2026年首单半导体“A吃A”来了! 1月29日晚间,“国产靶材巨头”江丰电子(300666.SZ)...
鑫闻界丨半导体企业扎堆港股IP... 齐鲁晚报·齐鲁壹点 王赟 中国芯片设计公司、沪交所上市的澜起科技闯进了港交所,1月30日起至2月4日...
半导体设备板块本周回调,指数跌... 本周,中证云计算与大数据主题指数下跌1.3%,中证芯片产业指数下跌2.1%,中证半导体材料设备主题指...
利扬芯片:预计2025年度净利... 每经AI快讯,利扬芯片1月30日晚间发布业绩预告,预计2025年年度将出现亏损,实现归属于母公司所有...
中盛科技取得直流电机控制电路专... 国家知识产权局信息显示,中盛科技(东莞)有限公司取得一项名为“一种直流电机控制电路”的专利,授权公告...
用电量折射经济结构变化 深圳去... 来源:21世纪经济报道 21世纪经济报道记者 林典驰 深圳报道 近日,21世纪经济报道记者从南方电...
六角形半导体取得基于USB接口... 国家知识产权局信息显示,合肥六角形半导体有限公司取得一项名为“一种基于USB接口的数据传输系统和方法...
浪潮信息取得机箱和电子设备专利 国家知识产权局信息显示,浪潮电子信息产业股份有限公司取得一项名为“一种机箱和电子设备”的专利,授权公...
杭州麦唐取得非接触式IC卡测试... 国家知识产权局信息显示,杭州麦唐科技有限公司取得一项名为“一种非接触式IC卡的测试方法、系统及相关组...