当前位置: 首页 > 科技观察

图灵奖获得者JackDongarra:超级计算的顶端还有很大空间

时间:2023-03-16 20:18:19 科技观察

超级计算机可以说是科学计算的奥林匹克冠军。通过数值模拟,超级计算机丰富了我们对世界的理解:无论是数光年之外的宇宙中的恒星、地球上的天气和气候,还是人体的运作。四十多年来,JackDongarra一直是高性能计算领域的推动力。今年早些时候,2021ACMA.M.图灵奖授予Dongarra,以表彰他“对数值算法和工具库的开创性贡献,这些贡献使高性能计算软件能够跟上硬件在过去40年的指数级发展。”.9月,作家本尼·莫尔斯(BennieMols)在德国举行的第9届海德堡桂冠论坛期间会见了Dongarra,讨论了高性能计算的现在和未来。72岁的Dongarra是田纳西大学的杰出教授,自1989年以来一直是美国能源部橡树岭国家实验室的杰出研究员。BennieMols是荷兰阿姆斯特丹的科技作家。以下为访谈内容Q1:过去几十年,您从事科学研究的动力是什么?A:我的主要研究方向是数学,尤其是数值线性代数,我所有的工作都来自于此。对于物理、化学等需要计算的学科——尤其是求解线性方程组——一款能够计算出答案的软件无疑是非常重要的。同时,还必须保证软件的运行与机器的架构一致,这样才能真正获得机器所能达到的高性能。Q2:软件在超级计算机上运行最重要的要求是什么?A:我们希望软件的计算结果是准确的。我们希望科学界能够使用和理解这个软件,甚至为它的改进做出贡献。我们希望软件性能良好,并且可以跨不同机器移植。我们希望代码可读且可靠。最终,我们希望软件能够提高用户的生产力。开发满足所有这些要求的软件是一个非常重要的过程。这个级别的工程往往有数百万行代码,大约每10年,我们就会看到机器架构发生一些重大变化。这将导致需要重构算法和体现它们的软件。软件跟随硬件,超级计算的顶端还有很大的空间来实现更好的机器性能。Q3:当前高性能计算的哪些发展让您感到兴奋?答:我们的高性能超级计算机是基于第三方组件构建的。比如你我也可以买高端的芯片,但是高性能的电脑就需要很多了。通常我们在高性能计算机上使用一些GPU形式的加速器。我们把多块芯片开发板放在一个机架上,这些机架很多在一起就构成了一台超级计算机。我们使用第三方组件的原因是它更便宜,但如果你专门设计芯片来进行科学计算,你会得到更好的超级计算机,这是一个令人兴奋的想法。事实上,这正是亚马逊、Facebook、谷歌、微软、腾讯、百度和阿里巴巴等公司正在做的事情;他们正在制造自己的芯片。他们可以这样做是因为他们有很多钱,而大学的钱有限,所以不幸的是他们不得不使用第三方产品。这与我的另一个担忧有关:我们如何留住科学人才,而不是让他们去为薪水更高的大公司工作?Q4:对于HPC的未来,还有哪些其他重要的发展?A:有一些重要的事情。很明显,机器学习已经对科学计算产生了重大影响,而且这种影响只会越来越大。我认为机器学习是一种工具,可以帮助解决计算科学家想要解决的问题。这与另一个重要的发展密切相关。传统上,我们的硬件使用64位浮点运算,因此数字也用64位表示。但是,如果使用更少的位,例如32、16甚至8位,则可以加快计算速度。但是加快计算速度,你就会失去精度。然而,AI计算通常似乎是用更少的位来完成的,16位甚至8位。这是一个需要探索的领域,我们需要找出降尺度何时有效,何时无效。另一个研究领域是如何从低精度计算开始,得到一个近似值,然后使用更高精度的计算来细化结果。Q5:超级计算机的功耗是多少?答:当今性能最好的超级计算机消耗20或30兆瓦才能达到百亿亿级速度。如果地球上的每个人每秒都进行一次计算,那么超大规模计算机在一秒钟内完成的工作需要四年多的时间。也许20年后,我们将达到zettaflops的规模,这是21次浮点运算的10次方。然而,功耗可能成为一个限制因素。你将需要一台100或200兆瓦的机器,目前它太耗电了。Q6:您如何看待量子计算在未来高性能计算中的作用?A:我认为量子计算能解决的问题是有限的。它不会解决像三维偏微分方程这样的问题。我们经常为此使用超级计算机,例如气候建模。未来,我们将构建一个包含不同类型计算工具的集成工具。我们将拥有处理器和加速器,我们将拥有帮助机器学习的工具,我们可能拥有像大脑一样进行神经形态计算的设备,我们将拥有光学计算机,此外,我们将拥有量子计算机解决特定问题。