云天励飞大算力芯片战略:把百万Tokens推理成本降低100倍以上
创始人
2026-02-05 21:14:03
0

2月3日,云天励飞正式举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力AI推理芯片战略布局。

会上,云天励飞提出“训练追赶、推理超车”的战略方向,并发布了基于“PD分离”思路的芯片路线图:力争实现百万Tokens推理成本降低100倍以上的目标,推动AI从技术尝鲜走向普惠生产力。

云天励飞董事长兼CEO陈宁博士发表演讲

01 战略方向:训练追赶,推理超车

云天励飞董事长兼CEO陈宁博士在会上指出,训练芯片与推理芯片在算力需求上存在显著差异。训练芯片更侧重“绝对值”,对算力规模、带宽能力以及科学计算的复杂精度要求更高,且对成本相对不敏感;推理芯片的核心考量则在于成本、效率与市场经济学,关键在于每一个 Token 背后的边际成本与整体性价比。

陈宁表示,公司致力于持续降低百万Token的成本,目标是通过下一代芯片实现“百万 Tokens 一分钱”。未来三年,公司希望将成本进一步降至“百万 Tokens 0.1分钱”,以加速大模型应用的规模化落地。

对于未来五年的中国芯片产业发展,陈宁提出“训练追赶、推理超车”的策略:在训练芯片领域,目标是持续追赶,尽量保持差距不被拉大;而在推理芯片领域,依托中国丰富的应用场景、强大的基础设施能力以及开源模型生态,有机会实现突破与超车。

云天励飞董事长兼CEO陈宁博士发表演讲

02 基于“PD 分离”架构,三年规划三代芯片

针对大模型时代云推理场景的需求,云天励飞CTO李爱军在会上介绍了公司的技术解构与路线图。

他表示,云天励飞将全力投入云推理场景的大算力芯片研发,基于对大模型推理计算特征的理解,按照“PD分离”的系统架构规划两类大算力芯片:

  • P芯片(Prefill):面向计算密集型需求设计,满足Prefill阶段的高算力要求;
  • D芯片(Decode):面向访存密集型需求设计,满足Decode阶段的高带宽需求。

李爱军介绍,公司在芯片微架构层面针对Attention及AFN等计算特点进行细粒度分析,并在底层实现针对性优化。在一个包含1024颗芯片的超节点内,P芯片与D芯片可实现有效组合,以满足大模型云推理的集群化部署需求。

云天励飞CTO李爱军介绍公司芯片产品规划

未来三年,云天励飞规划了三代芯片产品:

  • 今年(第一年):打造第一代超节点P芯片,面向百万级长上下文场景进行 Prefill 推理优化,算力水平对标Hopper架构;
  • 明年(第二年):研发第一代超节点D芯片,聚焦Decode推理的低时延目标,算力水平对标Blackwell架构;
  • 2028年(第三年):推出第二代超节点D芯片,面向毫秒级推理时延目标进一步优化,带动Prefill与Decode性能提升,算力层面有望看齐下一代Rubin芯片。

云天励飞高级副总裁、CFO兼董秘邓浩然介绍公司资本、人才与产能情况

03 GPNPU架构的四大技术亮点

李爱军表示,上述路线图的核心支撑是云天励飞的GPNPU架构。GPNPU不仅是处理器架构,也体现了对大模型推理系统架构的整体理解,其主要技术亮点包括四个方面:

  • GPGPU级通用编程能力(CUDA兼容):面向国内芯片“易用性”痛点,GPNPU架构强调对主流CUDA等生态的兼容与迁移支持,以降低客户模型部署与迁移门槛;
  • 极致能效的NPU内核:围绕推理效率与能效比进行深度优化,提升推理侧性价比;
  • 引入3D Memory 结构:采用3D Memory结构,以获得更高带宽与更低访问时延,提升推理效率;
  • 算力积木架构:公司延续过去五年在国产工艺上的探索,以“算力积木”架构定义下一代芯片的Scale-up超节点,以满足万亿级乃至十万亿级 MoE 架构大模型的推理需求。

推理时代的竞争,本质是“单位推理成本”的竞争。只有把推理做得足够便宜、足够稳定、足够易用,AI才能从“看得见的能力”走向“用得起的生产力”。

未来,云天励飞将以GPNPU架构为核心,大力推进云端大算力芯片,强化软硬协同与存储体系攻坚,力争将百万Tokens推理成本降低100倍以上,推动大模型从示范应用走向规模化交付。

相关内容

哈啰普惠申请嵌入式设备升级...
国家知识产权局信息显示,上海哈啰普惠科技有限公司、上海造父智能科技...
2026-06-03 10:24:18
博世汽车部件申请针对嵌入式...
国家知识产权局信息显示,博世汽车部件(苏州)有限公司申请一项名为“...
2026-06-03 10:23:50
时代电气招标结果:DC-D...
证券之星消息,根据天眼查APP-财产线索数据整理,株洲中车时代电气...
2026-06-03 10:23:16
全志科技(300458.S...
格隆汇6月1日丨全志科技(300458.SZ)在互动平台表示,公司...
2026-06-03 10:23:03
中山福昆航空科技申请多源冗...
国家知识产权局信息显示,中山福昆航空科技有限公司申请一项名为“一种...
2026-06-03 10:22:41
通嘉科技取得应用于电源转换...
国家知识产权局信息显示,通嘉科技股份有限公司取得一项名为“应用于电...
2026-06-03 10:22:24
厦门鑫众通电子取得基于人工...
国家知识产权局信息显示,厦门鑫众通电子有限公司取得一项名为“基于人...
2026-06-03 10:22:00
锐锋焰申请基于多电位域动态...
国家知识产权局信息显示,深圳锐锋焰科技有限公司申请一项名为“一种基...
2026-06-03 10:21:45
上海隧道工程申请大功率变频...
国家知识产权局信息显示,上海隧道工程有限公司申请一项名为“大功率变...
2026-06-03 10:21:31

热门资讯

天津港取得港口低电压穿越控制系... 国家知识产权局信息显示,天津港股份有限公司;天津电气科学研究院有限公司取得一项名为“一种港口低电压穿...
华虹半导体取得P型掺杂控制栅的... 国家知识产权局信息显示,华虹半导体(无锡)有限公司取得一项名为“一种P型掺杂控制栅的浮栅型分栅闪存工...
乾照光电申请一种LED芯片专利... 国家知识产权局信息显示,厦门乾照光电股份有限公司申请一项名为“一种LED芯片”的专利,公开号CN12...
智遨通申请用于改善应力的集成电... 国家知识产权局信息显示,智遨通(天津)信息技术有限公司申请一项名为“一种用于改善应力的集成电路的芯片...
“超级芯片”发布!英伟达,股价... 当地时间周一,中东局势再度趋于紧张引发国际油价大涨,市场流动性吃紧令美国股市承受一定压力,金融、工业...
南瑞继保申请一种换流器专利,能... 国家知识产权局信息显示,南京南瑞继保电气有限公司、南京南瑞继保工程技术有限公司、常州博瑞电力自动化设...
华金资本:公司子公司主营铝电解... 证券之星消息,华金资本(000532)06月01日在投资者关系平台上答复投资者关心的问题。 投资者提...
超级电容概念异动拉升 胜业电气... 超级电容概念异动拉升,胜业电气30cm涨停, 火炬电子触及涨停, 江海股份涨超6%,刷新历史高点, ...
莱特光电(688150)6月1... 证券之星消息,截至2026年6月1日收盘,莱特光电(688150)报收于49.99元,下跌7.77%...
杰普特光电取得轮廓提取生成方法... 国家知识产权局信息显示,深圳市杰普特光电股份有限公司取得一项名为“轮廓提取生成方法、系统、装置及电子...