说到人工智能发展,说到中国的芯片水平,经常看到有人出来问,高端芯片行吗?意思是说中国高端芯片有差距,所以人工智能就落后。
我看这些人没有科学常识,甚至没有人脑子。
人工智能芯片训练的时候是需要高效率的芯片进行训练,而且这个芯片的性能也在不断地提升。这个我想我们都没有意见。如果这个芯片的性能越高,训练的效率越高,可能训练的速度越快。这个我们也没有意见。所以用高端芯片当然是一件好事情。我相信芯片也会一直不断发展,不断提升性能。
但是人工智能到底是什么训练出来的?是芯片训练出来的,不是高端芯片训练出来的。低端芯片一样可以训练,只是速度慢一些、耗电多一些而已。
比如我们训练一个模型,用高端芯片可以提升30% 的效率,节省30% 的能源。我们当然愿意用高端芯片来训练。但是,用普通的芯片能不能也训练出来?其实也可以训练出来,无非是训练的时间会增加一些,能耗会增加一些,成本会不会增加,不一定。
为什么成本增加不一定呢?道理很简单。你要做一个训练,建立一个计算中心,这是一个综合成本。比如说你需要做土建,土建也有成本。比如说买芯片也有成本。还有这个过程大量的耗电也有成本。一定要用高端芯片去建这个智算中心,高端芯片的价格现在涨得很高,你用高端芯片很可能成本就非常高了。
用普通的芯片大量的整合起来,能不能训练?也是可以训练的。比如说训练一个模型需要5000张卡,训练100个小时。用高端芯片呢,只要1000张卡,训练100个小时。那5000张卡也是可以的。中国现在已经建立起42个万卡集群。并且这万卡集群还可以整合起来,调度资源。
人工智能要进行大模型的训练,其实训练是比较少的。模型就那么多,训练一次需要进行调整,过一段时间再进行训练。并不是一直都在进行训练。人工智能大多数时间需要进行的是推理,就是训练完了以后,用这个模型推理去完成工作。推理可以用各种各样的芯片,大部分推理只需要调用少量的资源。
这件事情和我们背乘法口诀表一个意思。训练就是要学会背乘法口诀表,需要花很多时间。推理呢?学会了乘法口诀表,你去买菜,两斤菜,两块钱一斤,你就知道是多少钱。
背乘法口诀表,一个聪明的孩子一背就会了,这就是高端芯片训练的很快,效率很高,好不好?非常好。不那么聪明的孩子能不能背会呢?其实也能背会,多花点时间,老师多管一管、磨一磨,其实也会了。不那么聪明的孩子以后发展的好不好呢?其实也未必肯定好,有时候不聪明的孩子比聪明的孩子发展的还好。
所以人工智能,很多人跟着美国人去焦虑,觉得没有高端芯片就活不下去。实际情况最好有高端芯片,没有高端芯片也能发展。美国的情况,有了高端芯片,它没电它也不行。除了这些硬的方面之外,还有算法,还有数据,多个方面能够影响人工智能的智算处理。
再说了,中国现在的高端芯片也渐渐的在赶上了,也有很多不错的芯片可以进行选择。
苹果的手机用着3纳米的芯片,我就没看出比华为的手机性能更强。
影响人工智能信息处理水平的有能源基础建设的能力、智算中心的技术、计算芯片、存储芯片,后面还有通信系统、数据集群能力。
我们说高端芯片很重要,但是要把万卡、十万卡整合起来,这是需要连接器件的。现在美国普遍采用铜缆,这个效率就比较低,而且功耗也高。中国已经开始用光器件进行连接,就这一项可以影响百分之十几的效率。但是中国公司不是上市公司,并不需要炒作股价,这样的信息不会在外面炒。
美国在高端芯片上一段时间确实处在领先地位,这个是事实,但是这不是决定人工智能发展的唯一力量。人工智能发展是由多种力量综合影响的。事实上,除了芯片这一块,美国在大部分领域都是短板。最后,人工智能的能力,美国肯定干不过中国。说到这些,我还没有讨论应用和智能终端产品。
中国为什么对于芯片并不急?因为真不需要急,完全够用了。本轮大规模建设期已经完成。
