近日,深度求索(DeepSeek)发布旗舰模型V4的预览版本并同步开源,迅速掀起了一波国产芯片的适配热潮。据不完全统计,目前至少有8家国产AI芯片厂商官宣了适配方案,为广大开发者和企业提供了多样化的国产算力选择。
DeepSeek“跑”在国产芯片上,在此次DeepSeek新模型发布之初就已初露端倪。在官方技术报告中,DeepSeek将华为昇腾与英伟达并列写入硬件验证清单。而且几乎在V4发布的同时,华为就表示“本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持”。
记者专门就其中提到的“芯模协同”请教了相关专家。专家解释,这意味着在“做模型的时候,芯片就已经一起适配,双方团队很可能在研发阶段就一起工作”。举例来说,模型可以基于芯片来设计;模型厂商也直接给芯片厂商提出要求,让芯片针对模型来优化。这比业内通常提及的“0 Day适配”要更加提前、更具深度。专家还把这种开发模式比作汽车里的“原厂设计”——更强调系统性、安全性与量产可行性,是出厂时的“原始状态”。

对于DeepSeek“跑”在国产芯片上,国外同样关注。路透社报道称,DeepSeek决定专门针对华为芯片优化V4版本,标志着其在战略上从依赖美国半导体转向更多采用中国本土AI设备。英伟达首席执行官黄仁勋更在早前表示,若DeepSeek的最新一代大模型率先选择在华为先进芯片平台上发布并全面适配,“那么这对美国在全球人工智能领域的战略地位而言,无疑将是一个灾难性的打击。”
一段时间以来,中国大模型的研发高度依赖英伟达的GPU及其CUDA生态,国产AI芯片更多作为“可用”的备份选项。就在一年多以前,当DeepSeek横空出世,国内AI产业既兴奋,又有些“手忙脚乱”。为了让新模型尽快“上线”,芯片公司、算力企业、互联网大厂的工程师们不得不放弃春节假期,进行适配和优化。时至今日,当又一个“DeepSeek时刻”到来时,国产芯片已经在“准备好了”的基础上,多了份淡定和从容。
AI竞逐,不进则退。如果说,一年前破圈的DeepSeek还只是一个“孤勇者”,那么现在中国AI早已“百花齐放春满园”——“基模”有“五虎”,GPU有“四小龙”,还有成千上万的高校院所、企业、个人开发者,大家你追我赶、各展所长,在差异化竞争中找到了定位和长期发展的路径。
更为关键的是,人工智能技术发展到今天,牵引和带动作用越来越强。对于中国这样的大国来说,发展AI如果还“在别人的墙基上砌房子”,不仅会带来高昂的成本,更存在“卡脖子”的风险。过去一年来,国内AI产业无惧排挤打压、奋起直追,通过协同创新,走出了一条依靠本土产业链、兼具成本优势和安全保障的发展道路。越来越多的企业和开发者拥抱国产软硬件平台,推动“国产算力+国产大模型”生态加速走向成熟。在互联网的“上半场”,我们一度因为“缺芯少魂”在一些领域受制于人。来到AI的“下半场”,自主可控的软硬件底座更加坚实,中国正把发展AI的主动权牢牢掌握在自己手中。
需要客观认识到,当前,国产算力的能力主要集中在推理侧,在训练侧仍需提升。DeepSeek—V4虽是开源领域最领先的模型,仍落后于顶尖闭源模型。在创新的长跑中,中国AI还需要一步一个脚印往前走。正像DeepSeek在发布新款模型时所说的那样:“我们将始终秉持长期主义的原则理念,在尝试与思考中踏实前行,努力向实现通用人工智能的目标不断靠近。”
作者:谷业凯