当前位置: 首页 > 科技观察

比超高端GPU快数百倍,摩尔定律的未来是“光”吗?

时间:2023-03-21 14:35:59 科技观察

本文转载自雷锋网。如需转载,请在雷锋网官网申请授权。自从各家芯片厂商开始关注芯片小型化进程以来,业界关于“摩尔定律是否走到尽头”的讨论就从未停止过。中国工程院院士徐居延曾以下一波芯片技术浪潮为主题,列举了CMOS与新器件、冯诺依曼架构和新兴架构四类技术方向:一是硅CMOS技术的结合和冯·诺依曼“硅冯”范式;一类是可以进入类似于CMOS的二进制开关的“类硅”模式,以及新器件与冯·诺依曼架构的结合;另一种仍然是使用现有的硅CMOS器件技术,但不是通过冯诺依曼架构,而是通过突触传输,一种集存储和计算为一体的“类脑”模型;最后一类是基于新兴架构和新设备的“新兴”范式。光,可以被视为最后出现的范例之一,在电子芯片的竞争中被抛在了后面。但现在有了新的突破,有潜力成为后摩尔时代与众不同的强者。本月,光子计算芯片公司玺智科技发布了其最新的高性能光子处理器,该处理器在单个光子中集成了超过10000个光子器件,运行1GHz系统时钟,运行特定循环神经网络的速度堪比计算机。当前的高端GPU。一百次,充分验证了光子芯片的优越性。光子计算迷失在通用计算赛道既然光子计算对芯片性能的提升远超电子芯片,那么自墨子时代以??来人类就已经发现的光为什么不能在芯片领域超越电子呢??玺智科技创始人兼CEO沉奕辰玺智科技创始人兼CEO沉奕辰告诉雷锋网(公众号:雷锋网),其实在半导体刚刚起步的时候,有两种技术范式,光和电.经过一段时间的发展,几乎整个行业都涵盖了基于数字电子的计算范式。数字电子计算范式能够获胜有两个原因。一方面,图灵计算的兴起,包括冯诺依曼的数字芯片架构,让数字芯片通过逻辑门实现几乎所有的通用计算,得到广泛应用。另一方面,在20世纪80年代,当基于逻辑门的光子数字计算与电子计算在通用计算赛道上竞争时,它们都是基于晶体管的。晶体管的尺寸一直没能突破波长限制,不能小于100nm,从此被电子芯片打败。然而,近年来,情况发生了变化。尤其是电子芯片发展以来,在计算能力、数据传输和存储等方面遇到了瓶颈,电子计算技术范式难以继续寻求突破。算力瓶颈是第三次人工智能浪潮下讨论最多的问题。晶体管小型化带来的电子隧穿现象,使得在先进制造工艺下无法进一步降低晶体管的功耗。因此,一些公司希望通过扩大芯片面积,但最后发现,更大的面积需要更长的铜线,而更长的铜线会产生更多的热量。因此,芯片的能效比并没有随着面积的扩大而有很大的提升。Nvidia通过电互连芯片来提升计算能力,但受限于互连带宽,互连100个芯片或板卡只能达到单板计算能力的10倍,互连效率不高。现在,光学计算的架构正在发生变化。人工智能计算的普及也为光计算带来了更广阔的前景。“我们认为,光是解决这些困境的最合适的底层技术。”沉奕辰给出了自己的答案。光计算与电子计算完全不同。它以光子信息处理为载体,以光学硬件代替电子硬件,以光计算代替电计算,擅长快速并行处理高度复杂的计算任务。他认为,一方面,光已经充分证明了它在通信领域的优越性。目前,所有的远距离通信,包括数据中心服务器之间的通信,都是基于光纤传输。另一方面,越来越多的人工智能做线性计算,而光的干涉本身就是一个线性工程,与电相比具有天然的优势。这个答案有很强的论据。2016年,麻省理工学院沉一辰博士的研究团队创造了第一个光学系统,并于2017年在顶级期刊NaturePhotonics的封面上发表了这一成果。有两个创新点。在硬件方面,采用光学干涉仪作为基本矩阵运算单元,有效替代传统电子晶体管。在算法方面,在不牺牲性能的前提下,开发了一系列有效降低深度学习计算量、适配光子芯片的算法。光子计算成果实验结果的发布,激发了全球一大批人对光子AI芯片的关注。沉奕辰本人也是从麻省理工团队入行,创立了LightelligenceTechnology,一家专注于光子芯片相关技术研发的公司。).公司成立一年半时,汐知科技成功研发出全球首款光子芯片原型板,并成功演示了利用光子芯片运行GoogleTensorflow自带的卷积神经网络模型处理MNIST数据集,即使用计算机基准机器学习模型处理数据集来识别手写数字。整个模型95%以上的计算都由光子芯片处理。这块原型板的问世向世界证明了用光子代替电子进行AI计算的可行性。测试结果表明,光子芯片的加工精度接近电子芯片(97%以上)。在这块原型板发布不到两年后,2021年12月,汐知科技又取得了新进展,发布了高性能光子计算进程——PACE(PhotonicArithmeticComputingEngine,光子计算引擎)——单颗光子芯片集成了超过10,000个光子设备,运行1GHz的系统时钟,运行特定的递归神经网络,可以比当前的高端GPU快数百倍。“相比2019年推出的原型板,我们的PACE光子器件集成度提高了大约两个数量级,从100个光子器件增加到10000个光子器件;操作系统时钟提高了四个数量级,基本达到了当前电子芯片的时钟。”沉亦辰说道。值得注意的是,PACE并不是纯光子芯片。PACE包括一个64x64光学矩阵。核心部分由集成硅光子芯片和CMOS微电子芯片倒装堆叠在3D封装中组成。其中,电芯片主要用于数据存储和数模混合调度,光芯片主要用于数据计算。“我们相信,电存储技术,尤其是高速存储读取,将在很长一段时间内领先于光。这就是我们使用光电协同的原因。”沉亦辰解释道。PACE运行时,每个输入向量值首先从片上存储中提取出来,通过数模转换器转换成模拟值,通过电子芯片与光模块之间的微凸块施加到相应的光调制器上。光子芯片形成一个输入光矢量。然后,输入光矢量通过光学矩阵完成运算,产生输出光矢量,到达一组光电探测器阵列,从而将光强转换为电流信号。最后,电信号通过微凸块返回到电子芯片,再通过跨阻放大器和模数转换器返回到数字域。沉奕辰表示,汐知科技使用的光调制器是基于马赫-曾德尔干涉仪方案的小型高速可调光调制器,用于光对光干涉和算法协同优化。由于光在传播过程中不放热,完成矩阵运算所需时间更短,延迟低于电子芯片,矩阵乘法的并行能力更强。PACE采用迭代法解决世界上难以高效解决的数学问题——多项式复杂性非确定性问题,涉及生物信息中的蛋白质结构预测、物流交通调度、材料研发等,具有广阔的应用前景商业应用。玺智科技也做出了自己的产品规划。计划在2022年起1-3年内在算力强、延迟痛点的应用场景落地,比如金融、云服务厂商,然后强化培训市场。布局,最终延伸至GPU、车用芯片等市场。“突破”摩尔定律,完全替代还是平行发展?事实上,除了曦智科技,不少大厂也开始投入光子计算芯片的研发。据了解,华为、英特尔、英伟达目前已经接入光子计算。光子计算赛道上的玩家越来越多。是否意味着未来,光子计算芯片将具备完全替代电子芯片、“突破”摩尔定律的能力?回到摩尔定律的讨论,虽然光子计算是另一条完全不同的技术路线,但硅光子芯片仍然基于传统的CMOS工艺,依靠现有的生态、固件和软件来满足基本的设计需求。在制程制造方面,只需要在步骤上稍作改动,例如在制造光探测器时引入其他新设备。以前,基于光的晶体管体积庞大,在与电子计算的竞争中落败,但现在光子计算改变了原来用晶体管与电子计算竞争的路径,利用线性计算的优势制作光学器件,一个光器件的计算性能相当于数千个电晶体管,而65nm或45nmCMOS工艺可以满足现有光芯片的所有工艺要求。甚至未来硅光子技术迭代对工艺的要求也不会特别苛刻,更多的是主频和波长的迭代。这意味着即使摩尔定律逼近物理极限,也不会对光子计算芯片产生太大影响。然而,这并不意味着光子芯片可以完全取代电子芯片。沉奕辰表示,在可预见的未来,将是光子与电子芯片深度结合的光电混合计算。曦智科技的光电混合芯片与客户的交互是通过电子芯片完成的。所有的指令编译器和SDK都承载在电子芯片上。与电芯片相比,光芯片主要承载线性计算和数据网络两部分。电子芯片的优势在于兼容现有的市场环境和软件环境。“光和电的关系就像新能源汽车和燃油车,只是发动机和电池变了,轮胎等设备还是老样子,会有效兼容现有的使用场景。光不会完全取代电……”沉亦辰说道。