当前位置: 首页 > 科技观察

美国重夺世界第一超级计算机!人类实现百亿亿级E级超算,Frontier连续两年霸占全球Top500

时间:2023-03-18 13:51:12 科技观察

榜单。四连冠的日本选手藤开终于跌下“神坛”。在刚刚公布的2022年全球超级计算Top500榜单中,橡树岭国家实验室前沿(ORNL)获得第一名。凭借1.102Exaflop/s的HPL分数,Frontier不仅是有史以来最强大的超级计算机,也是第一台真正的“E级超级计算机”。相比之下,中国的神威太湖之光和天河二号下滑至第六和第九。去年,美国将神威太湖之光的处理器供应商神威列入实体清单,或多或少影响了中国超算的发展。本次上榜Top500的64位浮点运算总算力为4.4exaflops,较六个月前上榜提升44.7%。Frontier:突破100亿次那么,Frontier的性能到底达到了怎样的“逆天”?!简单来说,其背后468台超级计算机的计算能力加起来,根本不是一台Frontier的对手。除了如此炫目的计算能力,Frontier还是全球最快的AI超级计算机之一。在HPL-AI基准测试的混合精度性能测试中,Frontier跑出了6.88ExaFlops的成绩。用大白话来说,这种性能相当于每秒向由860亿个神经元组成的代理中的每个神经元发出6800万条指令。使用这个训练的AI模型,真的是一级方程式赛车上的火箭发动机,可以直接在赛道上起飞。新Frontier占地372平方米,由74个HPECrayEX机柜组成,可容纳9408个节点。其中,每个节点都有一个AMDMilan“Trento”7A53EpycCPU,搭配512GBDDR4内存和4个AMDRadeonInstinctMI250XGPU。该系统总共有602,112个CPU内核连接到4.6PB的DDR4内存。此外,37,888个具有8,138,240个内核的AMDMI250XGPU搭配4.6PBHBM内存(每个GPU128GB)。CPU和GPU使用基于以太网的HPECraySlingshot-11网络结构连接。存储接入性能卓越的存储子系统,容量700PB,吞吐量75TB/s,性能150亿IOPS。元数据层分布在480个NVMeSSD上,提供10PB的总容量,而5,400个NVMeSSD为主要高速存储层提供11.5PB的容量。同时,47,700个PMR驱动器提供679PB的容量。在散热方面,基于水冷的系统允许6,000加仑的水通过350马力的泵“移动”到整个系统,从而将温度控制在85度左右。直观地说,这些泵可以在30分钟内注满一个奥林匹克规格的游泳池。Frontier不仅是世界上最快的超级计算机,也是最环保的超级计算机。Frontier的能耗比也在全球超级计算机环保等级Green500榜单中排名第一。由第三代AMDEpyc处理器和InstinctMI250x加速器组成的单个机架单元的能效为每瓦62.68gigaflops。然而,将Frontier组装在一起并不容易,ORNL必须采购685个不同数量的6000万个零件。此外,它还必须应对建设过程中芯片短缺的问题。ORNL有167个受影响的零件编号,或200万个零件。AMD缺少MI200GPU的15个编号部件。ORNL与ASCR合作,为这些部件获得了国防优先和分配系统(DPAS)评级,这意味着美国政府可以使用年度国防预算以远高于市场价格的价格购买这些部件。很快,“短缺”的问题就解决了。经过这波操作,是否能解开很多人心中的所谓“疑惑”呢?美国:为了我们的国防,加紧搞超级计算!虽然花费那么多,但是用处却很大。在英伟达老黄这样的富豪想做地球数字孪生的时代,各国官方部门的超级计算机在发展AI处理海量数据、模拟气候、工业应用等方面的作用越来越大。即使橡树森林自己用不完算力,也可以出租或出售。该行业迫切需要计算能力。而这在国外也有先例:在预测机床材料加工结果的实验??中,日本DMG森精机机床自带工控机用了8个小时,而富岳只用了10分钟就完成了。中国:玩你的把戏,让我看看新榜单中,中国和美国仍然是上榜最多的国家。从超级计算机上榜数量来看,中国依然有173台,与上期持平,继续高居榜首。美国从上期的150台下降到127台,排名第二。尽管如此,这两个国家仍占TOP500总榜单的60%。日本、德国、法国分别以34台、31台、22台位列3-5位。虽然Frontier正式成为世界上最强大的超级计算机,但仍无法与去年公布的两台中国超级计算机相提并论。但是,这两个系统都还没有向Top500提交测试数据。根据披露的数据,多家外媒推断,神威海光超算在HPL基准测试中的峰值约为1.3exaflops/1.05exaflops,而天河三号的峰值可以达到1.7exaflops/1.3exaflops的持续值。不过,考虑到美国在芯片上的种种“卡脖子”,中国超算排名的后果很可能成为制裁的“靶子”。想必短时间内也看不到相关数据。更新。从上榜数量来看,中国以34.6%高居榜首,美国以25.4%位列第二。中美争霸的趋势依然存在。在综合性能排名中,美国依然拥有不可动摇的优势,以47.3%的总算力稳居第一。不难看出,此次登顶的Frontier对于美国稳固霸主地位功不可没。此外,Top500榜单还统计了1990年以来超级算力的进步趋势,并进行了线性回归。表中横轴为时间,纵轴为算力(取对数)。绿点为上榜超算的总算力,黄色三角为上榜冠军的算力,蓝色方块为上榜最后(第500)个超算的算力。颜色对应的直线是线性回归的结果。可以看出,这3条直线大致符合摩尔定律对算力增长的预测判断。都说摩尔定律死了,但在超级计算领域,它似乎还活得好好的。欧洲崛起:前10名中有7个席位美国并不是唯一取得显着进步的地区。欧洲也表现出色。从整体排名来看,美国、中国、日本占据前三,前十中其余七席全部被欧洲国家占据。其中,德国31人上榜,法国22人上榜,意大利14人上榜。芬兰新部署的LUMI超级计算机以151.9petaflops的FP64性能险胜美国Summit,排名第三。此外,法国GENCI-CINES的Adastra以46.1petaflops的表现险些夺得第10名。虽然远不及LUMI,但Adastra仍然是欧洲第二强大的超级计算机。LUMI和Adastra等系统说明了另一种趋势。与Frontier一样,它们基于HPE的全AMDCrayEX平台,使用第三代EpycCPU和InstinctGPU。为何不进行GPU加速:仍然很糟糕AMD长期以来首次在Top500的系统中占据主机CPU的代表性份额,但英特尔至强处理器仍然占据主导地位。从本世纪初开始,英特尔就开始在高性能计算领域发力。只用了几年的时间,就挤掉了IBM、惠普等几个大玩家。2017年到2020年,英特尔在高性能计算领域的市场份额一度达到顶峰,超过90%。截至目前,英特尔的份额仍高达77.4%,下降了4.2个百分点,而AMD的份额恰好增长了这个数字。预计Epycs将获得更多的动力来对抗XeonSP。而且,AMD有后来居上的势头。在2022年全球超级计算机Top500榜单中,目前依托AMD产品的超级计算机有94台,年增长率达95%。而AMD的InstinctMI200加速器是其中7款首次采用。另一个问题是,为什么不使用GPU加速器呢?可能是因为贵?GPU加速器作为计算引擎,可以大幅提升性能和性价比,但目前在Top500榜单的超算架构中,加速器并未占据主导地位。这些GPU加速器主要来自Nvidia。但是,除了英伟达自己的HPC中心有大量需要移植到GPU上的应用程序并不缺钱,全球其他数以千计的HPC中心仍然缺钱。这些HPC代码是专门为CPU编写的。在目前的Top500榜单中,只有170台超级计算机使用了GPU加速器——当然,其中大部分来自英伟达。另一个因素是更便宜的CPU本身现在正在添加类似于GPU的加速计算功能,例如向量和现在的矩阵计算。这比将CPU程序转移到GPU更省钱,也更容易编程。我们可能永远不会看到主要由GPU加速系统组成的Top500列表。事实上,在“富岳”、“太湖之光”等排名靠前的超算系统中,CPU基本上充当了GPU的角色,进行向量和矩阵计算。