微软发布第二代AI推理芯片Maia 200
创始人
2026-01-31 02:09:19
0

微软近日宣布推出MAIa 200,这是一款被描述为突破性推理加速器和推理动力源的第二代AI芯片。该芯片的发布标志着AI的未来可能不仅仅在于AI模型能生成多少Token,而在于如何以最优化的方式完成这一过程。

Maia 200专为异构AI基础设施而设计,适用于多种环境,特别针对大型推理模型的推理任务进行了优化开发。微软声称这是目前任何超大规模云服务商中性能最强的自研芯片,也是微软迄今为止部署的最高效的推理系统。

性能优势显著

根据微软提供的数据,Maia 200在性能方面表现突出。在4位浮点(FP4)性能方面,Maia 200比第三代Amazon Trainium性能高出3倍,8位浮点(FP8)性能则超过了Google第七代TPU。

具体数据显示,Maia 200具备以下特性:峰值4位浮点性能达10,145 teraflops,而AWS Trainium3仅为2,517;峰值8位浮点性能为5,072 teraflops,相比之下Trainium3为2,517,Google TPU第七代为4,614;高带宽内存(HBM)速度达每秒7 terabits,超过Trainium的4.9和Google TPU第七代的7.4;HBM容量为216GB,高于Trainium的144GB和Google TPU第七代的192GB。

此外,微软表示Maia 200每美元的性能比目前机群中的最新一代硬件提升30%。大量的高带宽内存允许模型在尽可能接近计算单元的位置运行。微软称:"实际上,Maia 200能够轻松运行目前最大的模型,并为未来更大的模型留有充足空间。"

技术创新架构

Maia 200在数据传输方面采用了创新方法,通过重新设计的内存子系统为模型提供数据。该系统包含专门的直接内存访问(DMA)引擎、片上静态随机存取内存(SRAM)以及专门的片上网络(NoC)结构。这些技术的结合实现了高带宽数据传输,同时提升了Token吞吐量。

微软特别强调Maia 200是专门为现代大语言模型而设计的。该公司表示,具有前瞻性的客户不仅需要文本提示功能,还需要支持多模态能力(声音、图像、视频)的访问,这些能力支持更深层的推理功能、多步骤智能体,以及最终的自主AI任务。

应用场景与集成

作为异构AI基础设施的一部分,Maia 200将为多种模型提供服务,包括OpenAI最新的GPT-5.2系列。该芯片与Microsoft Azure无缝集成,Microsoft Foundry和Microsoft 365 Copilot也将从中受益。微软的超级智能团队还计划使用Maia 200进行强化学习(RL)和合成数据生成,以改进内部模型。

从规格角度来看,Maia 200在多个方面超越了Amazon的Trainium和Inferentia以及Google的TPU v4i和v5i。该芯片采用3nm工艺制造,相比之下Amazon和Google芯片采用7nm或5nm工艺,在计算、互连和内存能力方面都表现出色。

行业分析师认为,微软的方法与其他超大规模云服务商有所不同。微软将推理视为战略核心,并为智能体AI驱动的环境构建了优化平台。

市场前景与部署

Maia 200目前已在微软位于爱荷华州得梅因附近的美国中部数据中心区域部署。下一步将在亚利桑那州凤凰城附近的美国西部3数据中心区域推出,随后扩展到其他区域,但具体时间和地点尚未公布。

开发者和早期采用者可以注册预览版Maia 200软件开发工具包(SDK),该工具包提供了为Maia 200构建和优化模型的工具,包括PyTorch集成、Triton编译器、优化内核库,以及访问Maia低级编程语言的功能。

Q&A

Q1:Maia 200相比其他云服务商的AI芯片有什么优势?

A:Maia 200在4位浮点性能方面比Amazon Trainium3高出3倍,8位浮点性能超过Google第七代TPU。同时采用3nm工艺制造,拥有216GB HBM容量和每秒7 terabits的高带宽内存速度,每美元性能比现有硬件提升30%。

Q2:Maia 200适合什么样的AI应用场景?

A:Maia 200专门针对大型推理模型优化,特别适合需要高吞吐量和大内存的工作负载。它支持现代大语言模型,包括多模态能力(声音、图像、视频),支持深层推理、多步骤智能体和自主AI任务。

Q3:如何使用Maia 200芯片?

A:开发者可以注册预览版Maia 200软件开发工具包,该工具包提供PyTorch集成、Triton编译器等工具。目前芯片已在微软美国中部数据中心部署,与Azure平台无缝集成,未来将扩展到更多区域。

相关内容

哈啰普惠申请嵌入式设备升级...
国家知识产权局信息显示,上海哈啰普惠科技有限公司、上海造父智能科技...
2026-06-03 10:24:18
博世汽车部件申请针对嵌入式...
国家知识产权局信息显示,博世汽车部件(苏州)有限公司申请一项名为“...
2026-06-03 10:23:50
时代电气招标结果:DC-D...
证券之星消息,根据天眼查APP-财产线索数据整理,株洲中车时代电气...
2026-06-03 10:23:16
全志科技(300458.S...
格隆汇6月1日丨全志科技(300458.SZ)在互动平台表示,公司...
2026-06-03 10:23:03
中山福昆航空科技申请多源冗...
国家知识产权局信息显示,中山福昆航空科技有限公司申请一项名为“一种...
2026-06-03 10:22:41
通嘉科技取得应用于电源转换...
国家知识产权局信息显示,通嘉科技股份有限公司取得一项名为“应用于电...
2026-06-03 10:22:24
厦门鑫众通电子取得基于人工...
国家知识产权局信息显示,厦门鑫众通电子有限公司取得一项名为“基于人...
2026-06-03 10:22:00
锐锋焰申请基于多电位域动态...
国家知识产权局信息显示,深圳锐锋焰科技有限公司申请一项名为“一种基...
2026-06-03 10:21:45
上海隧道工程申请大功率变频...
国家知识产权局信息显示,上海隧道工程有限公司申请一项名为“大功率变...
2026-06-03 10:21:31

热门资讯

天津港取得港口低电压穿越控制系... 国家知识产权局信息显示,天津港股份有限公司;天津电气科学研究院有限公司取得一项名为“一种港口低电压穿...
华虹半导体取得P型掺杂控制栅的... 国家知识产权局信息显示,华虹半导体(无锡)有限公司取得一项名为“一种P型掺杂控制栅的浮栅型分栅闪存工...
乾照光电申请一种LED芯片专利... 国家知识产权局信息显示,厦门乾照光电股份有限公司申请一项名为“一种LED芯片”的专利,公开号CN12...
智遨通申请用于改善应力的集成电... 国家知识产权局信息显示,智遨通(天津)信息技术有限公司申请一项名为“一种用于改善应力的集成电路的芯片...
“超级芯片”发布!英伟达,股价... 当地时间周一,中东局势再度趋于紧张引发国际油价大涨,市场流动性吃紧令美国股市承受一定压力,金融、工业...
南瑞继保申请一种换流器专利,能... 国家知识产权局信息显示,南京南瑞继保电气有限公司、南京南瑞继保工程技术有限公司、常州博瑞电力自动化设...
华金资本:公司子公司主营铝电解... 证券之星消息,华金资本(000532)06月01日在投资者关系平台上答复投资者关心的问题。 投资者提...
超级电容概念异动拉升 胜业电气... 超级电容概念异动拉升,胜业电气30cm涨停, 火炬电子触及涨停, 江海股份涨超6%,刷新历史高点, ...
莱特光电(688150)6月1... 证券之星消息,截至2026年6月1日收盘,莱特光电(688150)报收于49.99元,下跌7.77%...
杰普特光电取得轮廓提取生成方法... 国家知识产权局信息显示,深圳市杰普特光电股份有限公司取得一项名为“轮廓提取生成方法、系统、装置及电子...