了解Nvidia的研发已经成为一年一度的NvidiaSpringGTC大会的常规特色。例如,首席科学家兼研究高级副总裁BillDally每年都会提供Nvidia研发组织的概况和当前优先事项的一些细节。在2022年,Dally的主要工作重点是Nvidia正在开发和用于改进Nvidia自家产品的AI工具。如果你愿意接受,这其实是一个逆向营销的巧妙案例:英伟达从一家做显卡运行AI工具的公司,变成了一家用AI工具做显卡的公司。是的,Nvidia已经开始使用AI智能来有效改进和加速其显卡设计。Dally在2022年的GTC演讲中这样描述:“我们的设计团队是一个大约300人的团队,试图在Nvidia的产品设计中探索更具前瞻性的领导地位。我们有点像远光灯,试图照亮Nvidia中的明亮事物距离。团队松散地组织成两半。供应部分负责提供显卡的技术。它使显卡本身变得更好,从电路,到VLSI设计方法,架构网络,编程系统,以及图形卡和基于图形的软件的读入存储系统。”“需求部分试图通过开发需要显卡良好运行的软件系统和技术来推动对Nvidia产品的需求。例如,我们有三个不同的图形研究小组,因为我们在不断推动计算机图形学的边界。我们也有五个不同的AI小组,因为现在使用GPU运行AI是一件大事,而且只会变得越来越热。我们也在做机器人和自动驾驶汽车。团队。”“我们也有面向地理的实验室,例如我们的多伦多和特拉维夫人工智能实验室。”偶尔,Nvidia会抽出其中一些小组来重组一个moonshot项目,例如,一个这样的项目导致了Nvidia的实时光线追踪技术。光线追踪项目的组织结构图一如既往,2022年的研究与Dally的谈话是前一年的,但也有新的信息。例如,该部门肯定从2019年的175人左右增长了很多。毫无疑问,Nvidia在开发自动驾驶系统和机器人方面的努力也有所加强.Dally并没有多谈CPU上的设计工作,这无疑是在提升。以下是Dally关于Nvidia在设计芯片中越来越多地使用AI的谈话的一小段摘录。绘制压降图:“作为人工智能专家智能,我们自然希望使用AI来设计更好的芯片,”Dally说。Nvidia的显卡设计部门通过几种不同的方式来做到这一点。第一种也是最明显的方法是利用现有的计算机辅助设计工具并将AI模型整合到其中。例如,显卡设计部门有一款设计辅助软件工具,其中AI实时绘制NvidiaGPU图形产品中电源变化的位置图,实时预测电压格跌落程度。通常,电压降是通过电流乘以电阻降来计算的,而在传统的CAD工具上计算这个值需要三个小时。因为这是一个迭代的过程,如果一直使用传统的工具,设计部门的工作量会变得很大。这个概念展示了Nvidia的图形卡设计部门想要做的是在相同的数据上训练AI模型。在开发人员在一堆设计上尝试过之后,他们会向AI提供功率图。AI的推理时间仅为三秒。当然,如果算上上面powermap的特征值提取时间,就是18分钟。无论如何,与传统效果相比,这是一个非常快的结果。在类似的前提下,显卡设计部门也尝试了不使用卷积神经网络,而是使用图神经网络的AI。这样做的目的是估计显卡电路中不同节点的开关频率,这实际上驱动了前面例子中的电源特征值输入效率。作为一个副作用,Nvidia的开发人员能够比传统工具更快地获得非常准确的图形卡电路功耗估计,并且只需要一小部分时间。预测寄生元件Dally特别喜欢的设计项目之一,几年前他作为电路设计师花了相当多的时间,使用图形神经网络AI来预测寄生元件(在设计时没有预期或预期的电子元件)将如何表现。添加到最终产品中。过去,电路设计是一个非常反复的过程,设计师会画出带有一堆晶体管标志的电路原理图。但他不知道董事会的表现如何。直到布局设计师采用该原理图,制作布局样本并附加寄生参数,设计师才能运行电路仿真并查看其中哪些部分不符合预期的设计规范。然后设计师又要回去修改他的原理图,麻烦版图设计师重新来一遍,这是一个很长的、反复的、非常不人道的劳动密集型过程。Nvidia的显卡设计部门现在可以做的是训练神经网络来预测寄生组件,而不是让布局设计师创建布局样本来寻找缺陷。因此,电路设计人员可以非常快速地进行迭代,而无需在循环中重复手动设计-放置-重新设计步骤。根据Dally的说法,与地面实况相比,Nvidia的设计AI现在可以非常准确地预测这些寄生效应。布局/布线拥塞同时,我们还可以预测到芯片布局/布线导致的拥塞问题,这对芯片布局至关重要。按照正常流程,芯片设计者会做一个网格表,运行布局布线过程。通常,此过程非常耗时,可能需要几天时间。只有这样,设计师才能获得显卡样品的实际拥塞情况,而设计图的初始布局是不够的。设计人员需要对此进行重构并以不同方式放置宏,以避免出现红色区域(如下图所示)。红色区域有太多交错的线穿过给定区域,就像“交通堵塞”的有点版本。在这种情况下,使用AI辅助设计后,不需要运行布局和布线,可以拿这些网格列表,用图像神经网络AI对拥塞位置进行基本预测,结果是相当准确。.它并不完美,但它显示了哪些区域存在问题。然后设计团队可以在特定区域采取行动并快速迭代,而无需一遍又一遍地重复全局布局和布线。现有的芯片标准单元设计自动化的方法都是利用AI来评估人的设计,但在未来,能够利用AI来完成设计会更加令人兴奋。Dally举了两个例子来说明AI是如何完成芯片设计的。第一个系统称为NVCell,它结合了模拟低温退火和强化学习,从根本上设计数字集成电路的标准单元库。每次设计人员实施芯片技术升级时——例如,从7nm优化到5nm——设计人员都会创建一个单元库。一个单元就像一个与门和一个或门,一个完整的加速器。现在,Nvidia的设计部??门拥有数千个这样的单元库。这些单元需要在新技术框架内并遵循一套复杂的设计标准进行重新设计。第二种是使用强化学习模型来设计晶体管布局。设计师大多使用强化学习来放置晶体管。然而,更重要的是,晶体管放置后,设计规则中通常会出现很多错误,找到它们就像玩电子游戏一样。其实强化学习就擅长于此。一个很好的例子是强化学习在Atari视频游戏中的应用。所以,它就像一个Atari视频游戏,只是这次它是一个纠正标准单元设计错误的游戏。使用强化学习,Nvidia的设计师可以筛选出出现的设计规则错误并加以修复。这样设计者就基本可以完成标准单元的设计工作了。如下图所示,92%的单元库都可以用这个工具来制作,而且不会出现设计规则或电路的错误。此外,12%的户型比人工设计的户型更小。一般来说,人工智能设计的单元在单元复杂度方面与人工设计的单元一样好。这有助于设计师完成两件事。首先,人工智能的应用可以大大节省劳动力。如果没有人工智能,一个10人的团队需要大约一年的时间才能建立一个新的技术基础。如今,设计人员可以使用几个GPU并运行几天。然后,人类只需要干预剩下的8%的AI没能完成的单元。在大多数情况下,设计师通常可以使用AI做出更好的设计。这样,不仅省时省力,还能让事情变得更好。
