Nvidia Blackwell 芯片在训练基准测试中领跑
创始人
2025-06-06 06:05:57
0

Nvidia正在向全球的数据中心以及其称为 AI 工厂的区域推出其 AI芯片,今日该公司宣布其 Blackwell 芯片在 AI 基准测试中表现领先。

Nvidia 与其合作伙伴正加速利用最新的训练和推理进展,推动下一代 AI 应用的训练和部署。

Nvidia 的 Blackwell架构旨在满足这些新型应用对性能日益增长的要求。在最新一轮的 MLPerf Training 基准测试(自 2018 年该基准测试推出以来的第 12 轮)中,Nvidia 的 AI 平台在所有基准测试中均在大规模场景下展现出最高性能,并且在针对大语言模型(LLM)的最苛刻测试 —— Llama 3.1 405B 预训练 —— 中为提交的每一项结果提供了支持。

Nvidia 在 MLPerf 训练基准测试上大力宣传了其优异的性能。

Nvidia 平台是唯一一个在所有 MLPerf Training v5.0 基准测试上均提交结果的平台 —— 这突显了其在包括大语言模型、推荐系统、多模态大语言模型、目标检测以及图神经网络在内的多样化 AI 工作负载中的卓越性能和多功能性。

本轮大规模提交测试使用了两台由 NVidia Blackwell 平台驱动的 AI 超级计算机:Tyche,基于 Nvidia GB200 NVL72 机架级系统构建;以及 Nyx,基于 Nvidia DGX B200 系统。此外,Nvidia 还与 CoreWeave 及 IBM合作,利用总共 2,496 个 Blackwell GPU 和 1,248 个 Nvidia Grace CPU 提交了 GB200 NVL72 的测试结果。

在全新的 Llama 3.1 405B 预训练基准测试中,Blackwell 在相同规模下的性能比上一代架构提高了 2.2 倍。

Nvidia Blackwell 正在驱动 AI 工厂的发展。

在 Llama 2 70B LoRA 微调基准测试中,采用八个 Blackwell GPU 驱动的 Nvidia DGX B200 系统,其性能比前一轮使用相同数量 GPU的提交提升了 2.5 倍。

这些性能的跃升突显了 Blackwell 架构的创新进展,包括高密度液冷机架、每个机架 13.4TB 的一致性内存、第五代 Nvidia NVLink 与 Nvidia NVLink Switch 互连技术以实现规模扩展,以及 Nvidia Quantum-2 InfiniBand 网络技术以实现横向扩展。此外,Nvidia NeMo 框架软件栈的创新进一步提升了新一代多模态大语言模型训练的水平,这对将具备自主决策能力的 AI 应用推向市场至关重要。

这些具备自主决策能力的 AI 应用未来将运行于所谓的 AI 工厂 —— 自主 AI 经济的引擎。这些新应用将生成 Tokens 以及可以应用于几乎每个行业和学术领域的有价值的智能信息。

Nvidia 数据中心平台涵盖了 GPU、CPU、高速互连以及网络,同时还包括众多软件,如 Nvidia CUDA-X 库、NeMo 框架、Nvidia TensorRT-LLM 及 Nvidia Dynamo。这个高度优化的软硬件系统组合使各组织能够更加迅速地训练和部署模型,从而显著缩短实现价值的时间。

Blackwell 在 AI 训练中轻松超越了其前代产品 Hopper。

Nvidia 的合作生态系统在本轮 MLPerf 测试中广泛参与。除了与 CoreWeave 和 IBM 合作提交的测试之外,ASUS、Cisco、Giga Computing、Lambda、Lenovo、Quanta Cloud Technology 和 Supermicro等公司也提交了令人瞩目的测试结果。

首批使用 GB200 进行 MLPerf Training 测试的项目由 MLCommons Association 及其 125 多个成员和附属机构开发。其“训练时间”指标确保训练过程能够产出达到预定精度的模型,而其标准化的基准测试规则则确保了不同测试之间的公平比较。所有结果在发布前均经过同行评审。

—— 关于训练基准测试的基础

Nvidia 的最新 AI 处理器展现出了优秀的扩展性。

Dave Salvator,曾是科技媒体的一员,现在担任 Nvidia 加速计算集团的加速计算产品总监。在一次新闻发布会上,Salvator 指出,Nvidia 首席执行官 Jensen Huang谈及 AI 扩展定律的概念,其中包括预训练阶段,也就是从零开始教授 AI 模型知识。Salvator 表示,这一重型计算过程构成了 AI 的骨干。

之后,Nvidia 进入了后训练扩展阶段。这一阶段相当于模型上学,例如通过微调,将不同的数据集引入已训练到一定程度的预训练模型中,以赋予其针对特定数据集的额外领域知识。

Nvidia 已经从单纯制造芯片转型为构建 AI 基础设施的企业。

最后,还有测试时扩展或推理能力,也有时称为长时间思考。另一说法为自主决策 AI,即具备实际思考、推理和解决问题能力的 AI,通过提出问题,能够得到相对简单的答案。测试时扩展和推理技术实际上可处理更复杂的任务,并提供丰富的分析。

此外,还有生成式 AI,可按需生成内容,该内容可能包括文本摘要、翻译,同时也覆盖视觉内容甚至音频内容。AI 领域中涉及多种扩展模式。在本轮测试中,Nvidia 重点关注了预训练和后训练的测试结果。

Salvator 表示:“这正是 AI 进入我们所说的投资阶段之处。而当你进入推理并部署这些模型,开始生成 Tokens 时,你就开始从 AI 投资中获得回报。”

MLPerf 基准测试现已进行到第 12 轮,其历史可追溯至 2018 年。支撑该测试的联盟拥有超过 125 个成员,并且该基准测试既用于推理也用于训练测试。业界普遍认为这些基准测试十分严谨。

Salvator 补充道:“我相信大家已经注意到,AI 领域的性能宣称有时可能有些不尽如人意,而 MLPerf 则试图将这种混乱局面理顺。每个参与者都需完成相同的工作量,所有人都必须达到相同的收敛标准。一旦提交结果,这些结果便由其他提交者进行审核和验证,大家也可以提问甚至质疑结果。”

训练方面最直观的指标是训练一个达到收敛状态的 AI 模型所花费的时间,也就是达到规定精度所需的时间。Salvator 表示,这是一个“同尺度下”的比较,同时考虑到了不断变化的工作负载。

今年,基准测试中新增了 Llama 3.140 5b 工作负载,用以替代此前测试中的 ChatGPT 170 5b 工作负载。Salvator 指出,在这些测试中,Nvidia 创下了多项记录。Nvidia GB200 NVL72 驱动的 AI 工厂刚刚下线,从 Hopper 到 Blackwell 这一代芯片,Nvidia 在图像生成测试中实现了 2.5 倍的性能提升。

Salvator 说:“我们仍处于 Blackwell 产品生命周期的较早阶段,因此预计随着软件优化的不断完善以及市场上出现更新、计算量更大的工作负载,Blackwell 架构的性能将持续提升。”

他指出,Nvidia 是唯一在所有基准测试中均提交了测试结果的公司。

Salvator 还表示:“我们能取得如此卓越的性能,归功于多种因素。包括我们的第五代 NVLink 和 NVSwitch 技术使性能提升高达 2.66 倍,再加上 Blackwell 架构本身的优异设计,以及我们持续不断的软件优化,使得这一性能成为可能。”

他补充道:“由于 Nvidia 的历史积淀,我们长期以来被称为 GPU 先驱。我们固然生产出色的 GPU,但公司已从单纯的芯片制造商转型为系统解决方案提供商,如我们的 DGX 服务器;再到如今构建整机架和数据中心(例如我们的机架设计已成为参考设计,帮助合作伙伴更快进入市场),乃至构建整个数据中心,最终形成所谓的 AI 工厂。整个过程真是一段极具趣味的历程。”

相关内容

哈啰普惠申请嵌入式设备升级...
国家知识产权局信息显示,上海哈啰普惠科技有限公司、上海造父智能科技...
2026-06-03 10:24:18
博世汽车部件申请针对嵌入式...
国家知识产权局信息显示,博世汽车部件(苏州)有限公司申请一项名为“...
2026-06-03 10:23:50
时代电气招标结果:DC-D...
证券之星消息,根据天眼查APP-财产线索数据整理,株洲中车时代电气...
2026-06-03 10:23:16
全志科技(300458.S...
格隆汇6月1日丨全志科技(300458.SZ)在互动平台表示,公司...
2026-06-03 10:23:03
中山福昆航空科技申请多源冗...
国家知识产权局信息显示,中山福昆航空科技有限公司申请一项名为“一种...
2026-06-03 10:22:41
通嘉科技取得应用于电源转换...
国家知识产权局信息显示,通嘉科技股份有限公司取得一项名为“应用于电...
2026-06-03 10:22:24
厦门鑫众通电子取得基于人工...
国家知识产权局信息显示,厦门鑫众通电子有限公司取得一项名为“基于人...
2026-06-03 10:22:00
锐锋焰申请基于多电位域动态...
国家知识产权局信息显示,深圳锐锋焰科技有限公司申请一项名为“一种基...
2026-06-03 10:21:45
上海隧道工程申请大功率变频...
国家知识产权局信息显示,上海隧道工程有限公司申请一项名为“大功率变...
2026-06-03 10:21:31

热门资讯

博世汽车部件申请针对嵌入式设备... 国家知识产权局信息显示,博世汽车部件(苏州)有限公司申请一项名为“针对嵌入式设备的升级方法、装置、存...
中山福昆航空科技申请多源冗余电... 国家知识产权局信息显示,中山福昆航空科技有限公司申请一项名为“一种多源冗余电源智能切换系统及方法”的...
威奇尔电子取得大屏视频信号模拟... 国家知识产权局信息显示,宁波威奇尔电子有限公司取得一项名为“一种大屏视频信号模拟器”的专利,授权公告...
派菲克申请异性UCM超导材料高... 国家知识产权局信息显示,江苏派菲克新材料有限公司申请一项名为“一种异性UCM超导材料的高压浮动区熔炉...
AI应用大爆发,半导体领跌!6... 【导读】科创 50 指数半日跌超 3% ,半导体下挫,煤炭、软件板块领涨 中国基金报记者张舟 今天是...
SK集团会长崔泰源会见英伟达C... 据韩联社报道,韩国SK集团会长崔泰源6月1日在中国台北会见 英伟达(NVDA.US)首席执行官(CE...
英伟达发布RTX Spark芯... 观点网讯:6月1日,英伟达正式进军个人电脑芯片市场,推出全新RTX Spark超级芯片,意在打破英特...
存储芯片概念回暖 云汉芯城涨近... 存储芯片概念盘中回暖, 云汉芯城涨近15%, 中电港一度触及涨停, 强一股份、 太极实业、 雅创电子...
满坤科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示满坤科技(301132)新获得一项实用新型专利授权,专利名为“...
众华电子取得蓝牙模块放置装置专... 国家知识产权局信息显示,众华电子科技(太仓)有限公司取得一项名为“一种蓝牙模块放置装置”的专利,授权...