5月30日,工信部印发《算力互联互通行动计划》(以下简称《行动计划》)。《行动计划》提出,到2028年,基本实现全国公共算力标准化互联,逐步形成具备智能感知、实时发现、随需获取的算力互联网。
什么是算力互联互通?如何实现算力互联互通?需要建设哪些基础设施?实现算力互联互通对我国技术及经济发展有什么好处?我国超大规模市场优势,对实现算力互联互通有何帮助?实现算力互联互通的过程中,能否做到隐私保护?
中关村信息消费联盟理事长项立刚在接受《每日经济新闻》记者(以下简称每经记者)电话采访时表示,我国拥有庞大的市场,不同应用场景对算力有着多样化的需求,这为算力资源的灵活调度提供了广阔空间。通过实现互联互通,可将闲置算力资源调配给有需求的用户,从而显著提升计算中心的使用效率,进而盘活整个市场。同时,也能够打破国外芯片厂商的垄断。
工作人员在中国移动智算中心(呼和浩特)机房中维护设备 新华社发(苏雅立摄)
算力互联互通可打破不同模型之间缺乏整合的局限性
本次《行动计划》的出台,是为了加快构建算力互联互通体系,实现不同主体、不同架构的公共算力资源标准化互联,提高公共算力资源使用效率和服务水平,促进算力高质量发展。那么,什么是算力互联互通?
项立刚告诉每经记者,过去,不同的芯片对应着不同的模型,彼此之间缺乏互通性。这导致算力开发必须局限于使用特定芯片,而且模型构建也必须使用与之匹配的芯片模型。这种局限性使得众多芯片和算力的潜力无法得到有效整合。
算力的互联互通,旨在打破这种局限,实现无论何种模型,都能够使用不同的算卡、不同的芯片来执行。
如何实现算力互联互通?需要建设哪些基础设施?
每经记者注意到,《行动计划》提出,要集中力量开展高性能传输协议等网络传输技术研究。推动数据通信产业高质量发展,加快高性能路由器、高速无损网络技术研究,支撑数据高效入算、算力无损互联。攻克算力标识关键技术,研制新型算力标识网关,提高多样化算力感知能力。全面突破算网云调度技术,优化各类算力资源管理、算网融合协同调用及算力应用云化编排部署。
项立刚认为,要实现算力互联互通,需要打通训练过程,构建一个可兼容的通用体系。针对兼容问题,可以通过开发专用接口,利用一款软件将不同芯片进行整合,从而实现全部芯片的兼容。此外,标准必须统一,接口需要开放,包括格式、算子等基础要素都应参照共同的标准。
《行动计划》指出,要制定算力互联标准化指南,建立算力互联互通标准体系。推动不同算力服务主体间使用统一调用接口和通信协议,促进算力应用和数据灵活迁移调度,增强算力资源可调用能力。
项立刚向记者举了一个例子:就好比我们要修建一条道路,让各种各样的车辆在上面行驶。对于车辆,肯定有一定要求,比如小汽车的重量、车辆间距等,这些都有明确标准,这样才能保证它们共同运行。
再比如,如果电脑文件格式各不相同,比如图片格式有GIF、JPG、PNG等,而用户使用一个浏览器或读图软件去查看图片,当遇到不支持的格式时,就无法打开,这就无法形成一个共通的平台。因此,我们需要打通格式、接口、文件等方面的差异,使其能在任何一个计算平台或模型上计算。
算力互联互通有助于打破高价芯片垄断
实现算力互联互通对我国技术及经济发展有什么好处?
“实现互联互通之后,无论是某一厂家生产的新旧版本芯片之间,还是不同厂家生产的芯片之间,都能够实现兼容。这样一来,之前已经建成的计算中心就可以实现复用,从而提高效率、降低成本、增强能力。”项立刚告诉每经记者。
记者注意到,《行动计划》提出,要充分发挥我国超大规模市场优势,以推动算力互联互通为主线,先试点后推广、先互联再成网,构建数字经济发展新底座,有力支撑制造强国、网络强国和数字中国建设。
我国超大规模市场优势,对实现算力互联互通有何帮助?对此项立刚认为,我国拥有庞大的市场,不同应用场景对算力有着多样化的需求,这为算力资源的灵活调度提供了广阔空间。
项立刚还分别从计算中心的使用者和建设者的角度阐述了算力互联互通的好处。
对于计算中心的使用者而言,若要构建并训练模型,自行建设计算中心往往面临高昂成本。此时,可借助其他市场主体已建成的计算中心进行训练,待训练完成后,再向其支付相应费用。
对于计算中心的建设者来说,若仅服务于某一种特定训练任务,可能会导致计算中心长时间闲置,造成资源浪费。通过实现互联互通,可将闲置算力资源调配给有需求的用户,从而显著提升计算中心的使用效率,进而盘活整个市场,同时也能够打破国外芯片厂商的垄断。
由于市场参与者众多、需求各异,不同批次、不同场景下的算力需求也各不相同。正是这种庞大且多元化的市场环境,为算力的互联互通创造了可能与机遇。若市场规模狭小,单一主体自建自用,便无需考虑互联互通的问题。而我国存在大、中、小型各类企业,同时也有着丰富多样的应用场景和需求,这使得互联互通成为提升算力资源利用效率、满足多样化需求的必然选择。
数据清洗是算力互联互通的关键步骤
《行动计划》同时提及隐私保护。在实现算力互联互通的过程中,为何会涉及隐私保护?
对此项立刚告诉每经记者,如果不同算力平台实现互联互通,就会涉及大量数据处理,其中包括数据清洗这一关键步骤。
“以购买火车票为例,你在购票平台上填写的信息,如身份证号、姓名、出发地和目的地等,这些都属于个人隐私信息。这些信息非常具体,甚至包含了你的出生年月、性别等详细内容。”项立刚表示,当这些数据被用于其他场景时,就需要进行数据清洗,将其中的个人隐私信息,如姓名、身份证号等具体信息去除,只保留一些基本的、非个人化的特征,例如性别、出发地和目的地等。
他强调,经过清洗后的数据,虽然不再包含个人的具体信息,但仍然可以用于训练和分析。例如,通过大量类似的数据分析,可以得出一些普遍趋势,比如早上通勤人群中,男性占比是多少、他们通常会选择什么样的路线和交通工具等。这种分析结果反映的是群体行为的普遍特征,而不是某个具体个人的信息。
“因此,在数据处理过程中,数据清洗是必不可少的环节。它既能保护个人隐私,又能使数据能够用于有价值的分析和训练,从而得出具有普遍意义的结论。”项立刚说。
每日经济新闻