当前位置: 首页 > 科技观察

最快AI电脑启动,每秒40万亿次浮点运算!拼接出最大的宇宙3D地图

时间:2023-03-17 20:45:40 科技观察

计算机探索宇宙的史诗级时刻!近日,号称全球最快的人工智能工作负载超级计算机Perlmutte宣布启用。由6,144个NvidiaA100张量核心图形处理器提供动力,这台新的超级计算机将负责拼接有史以来最大的可见宇宙3D地图。而且,它有望击退物理天空中的乌云——暗能量。宇宙在膨胀吗?是的!让宇宙不断膨胀的“罪魁祸首”是暗能量。作为宇宙中最神秘的物质,它看不见摸不着。为了捕捉它,人类在地球上设置了许多相关实验,但收效甚微。但现在,一台具备强大AI性能的超级计算机或许可以帮到我们。近日,英伟达与美国国家能源研究科学计算中心(NERSC)开启了一个“开关”——Perlmutte,该计算机被称为全球最快的人工智能工作负载超级计算机。这台以天体物理学家SaulPerlmutter命名的新型超级计算机拥有6,144个NvidiaA100TensorCoreGPU,将负责拼接有史以来最大的可见宇宙3D地图。不仅如此,Perlmutter还将处理来自“宇宙相机”暗能量摄谱仪(DESI)的数据,这是一种宇宙相机,一次曝光最多可以捕捉5000个星系。处理海量DESI数据绘制最大可见宇宙3D地图那么,如何拼凑宇宙3D地图呢?不久前,5月17日,DESI首发上线,开始了为期五年的数据抓取之旅。在之前为期四个月的试运行中,DESI捕获了400万个星系的光谱,比之前所有光谱调查的总和还多。Perlmutter要做的就是总结DESI的数据。根据官方网站,Perlmutter的GPU在一个晚上捕捉了数十次曝光。在以前的系统上,可能需要数周或数月才能准备好一年的数据以供发布,但Perlmutter将能够在短短几天内完成这项工作。“我很高兴我们在GPU上获得了20倍的加速,”NERSC的数据架构师RollinThomas说,他正在帮助研究人员为Perlmutter准备代码。RollinThomas难掩对Perlmutter性能的信心,因为Perlmutter是全球最大的A100驱动系统,20多个应用程序正准备成为首批搭载6159个NVIDIAA100TensorCoreGPU的应用程序。NERSC正式投入使用后,Perlmutter将为7000多名研究人员提供近4exaflops的AI性能。暗能量主要是通过2011年诺贝尔奖获得者SaulPerlmutter的工作发现的。在物理宇宙学中,暗能量是一种难以察觉的能量形式,它充满空间并增加宇宙的膨胀率。暗能量假说是当今宇宙加速膨胀观测最流行的解释之一。在宇宙标准模型中,暗能量作为作用于时空结构本身的某种能量,占宇宙质量能量的68.3%。暗能量是一种均匀的负压,会导致时空结构膨胀。1998年,高红移超新星搜索队观测组发表了Ia型超新星观测数据,表明宇宙正在加速膨胀。随后,在1999年,超新星宇宙学计划证实了这一结果。这项工作获得了2011年的诺贝尔物理学奖。但遗憾的是,我们对它的研究还不够准确,而DESI的地图给我们带来了揭开暗能量之谜的新希望。毫无疑问,珀尔穆特的作用将是无穷无尽的。除了拼凑出宇宙的3D地图,还可以帮助探索绿色能源等亚原子相互作用。NERSC的应用程序性能专家BrandonCook说:“过去不可能对像电池接口这样的大型系统进行完整的原子模拟,但现在科学家们计划用Perlmutter来做到这一点。”我们知道,传统的超级计算机几乎无法处理QuantumEspresso等程序无法处理在纳秒内生成几个原子模拟所需的数学运算。但通过将其高度精确的模拟与机器学习相结合,科学家们可以在更长的时间内研究更多的原子。这就是NVIDIAA100中的张量核心发挥其独特作用的地方。它们加速了深度学习所需的模拟和混合精度计算的双精度浮点数学运算。Perlmutter基于HPECrayShasta平台,包括Slingshot互连,这是一个具有GPU加速节点和纯CPU节点的异构系统。该系统分两个阶段进行安装——最近公布的第一阶段包括该系统的GPU加速节点和一个临时文件系统;第二阶段将在2021年晚些时候添加仅使用CPU的节点。“这使Perlmutter成为地球上使用16位和32位混合精度数学AI使用最快的系统,”Nvidia高级产品营销经理DionHarris在一份报告中说。今天的博文。劳伦斯伯克利国家实验室的第二阶段系统可能会更强。”Perlmutter的A100GPU使用NvidiaTensorCore技术和直接液体冷却。此外,它是NERSC的第一台具有全闪存暂存文件系统的超级计算机。根据NERSC的说法,35PBLustre文件系统将以超过5TB/秒的速度移动数据,使其成为同类中最快的存储系统。Perlmutter安装的第一阶段包括12个GPU加速机柜,容纳超过1,500个节点。第二阶段今年晚些时候将增加12个CPU机架和3000多个节点。第一阶段的每个GPU加速节点都有四个基于NVIDIAAmpereGPU架构的A100TensorCoreGPU和256GB内存。每个第一阶段节点还有一个AMD“米兰”CPU。第一阶段系统还包括非计算节点(NCN)、20个用户访问节点(NCN-UAN–登录节点)和服务节点。根据NERSC,一些NCN-UAN可用于部署容器化用户环境,使用g用于编排的Kubernetes。Phase1机柜没有连接门,蓝色和红色线用于直接液体冷却系统Phase2每个CPU节点将有两个AMDMilanCPU,每个节点有512GB内存。Phase2系统还增加了20个登录节点和4个大内存节点。支持多种编程环境,探索具有计算极限的宇宙极限除了CCE、GNU和LLVM编译器外,Perlmutter编程环境还将使用NVDIAHPCSDK(软件开发工具包)支持多种并行编程模型,例如用于C、C++和Fortran代码的MPI、OpenMP、CUDA和OpenACC。虽然人类用肉体探索宇宙的能力有限,但计算机没有这个障碍。例如,去年10月,夏威夷大学马诺阿分校天文研究所的一组天文学家借助AI神经网络,创建了迄今为止最全面的“天文成像目录”,包括恒星、星系和类星体等。该系统还确定了到星系的距离,最大误差在3%以内。根据夏威夷大学的说法,最终结果是“世界上最大的恒星、星系和类星体3D成像目录”。甚至,微软的物理学家们用80页的论文证明了“模拟矩阵”:宇宙是一台自学成才的计算机。一个进化规律的自学习系统据作者介绍,宇宙也进化出了一个类似于深度学习框架的自学习系统。我们知道深度学习框架是一组构建块,每个组件都是模型或算法的一部分。您可以自己设计积木堆。因此,我们能否想象宇宙会演化出一个可操作的法则矩阵架构,而这个法则本身是从一个自动教学系统演化而来的,而这个自动教学系统是从最可能的最小初始条件产生的?在论文中,作者描述了几个模型,这些模型实现了“自导向和自作用”:一个有7,088个节点和7,304个边的图,由抽样可能的未来组成在生活中,物理定律来源于我们的观察,所以最初的物理定律会极其简单,但经过世代相传,该定律具有自我延续和学习发展的能力。也许,宇宙并不是从大爆炸开始的,而是粒子之间简单的相互作用。本文围绕受限玻尔兹曼机(RBM)展开讨论。Hinton等人提出的受限玻尔兹曼机是一种生成式随机神经网络。概念非常抽象,是一个类物理学的机器学习模型。然而,受限玻尔兹曼机是最简单的一类深度神经网络结构,由两层神经元组成。一层是可见层(绿色),一层是隐藏层(蓝色)。了解宇宙未知的一面一直是天文学家努力的方向。有AI做“队友”,我们是否会加速星海探索宇宙之旅?