超级计算机作为一个国家最重要的工具,是众多前沿科学研究的有力支柱。随着人工智能的迅猛发展,智能超级计算机成为科研界和产业界的新热点;全球各大科研机构、企业巨头、初创公司纷纷推出自己的智能超级计算机。近日,国际测试委员会(BenchCouncil)在2020青岛创新节期间举行的智能计算机大会和芯片大会联合主论坛上发布了全球首个智能超算榜单HPCAI500。日本富士通位居榜首,腾讯位居第四,中日美三国企业包揽榜单前九名。HPCAI500榜单通过科学合理的实验,从人工智能性能评价标准AIBench:图像分类和极端天气分析(目标检测)中,评选出最能代表智能超算应用场景的测试项目。考虑到模型精度在人工智能领域的重要性,HPCAI500采用每秒有效浮点运算(VFLOPS)作为主要性能指标,这是一个兼顾系统性能和模型精度的指标。除了VFLOPS,HPCAI500还将训练人工智能模型所需的时间和对应模型所能达到的准确率作为辅助指标。榜单显示,日本富士通公司推出的智能超级计算机系统以每秒3141亿次运算的有效浮点运算速度位居榜首。排名第二和第三的智能超级计算机系统分别来自美国谷歌和日本索尼公司,中国腾讯推出的智能超级计算机系统位列第四。榜单前三名的智能超级计算机系统均采用大规模人工智能加速器(如GPU、TPU等)和相应的高性能算法,提升人工智能性能。日本富士通公司的智能超级计算机系统使用了多达2048个TeslaV100GPU,并提出了新颖的通信算法来进行不同层次的优化。HPCAI500VFLOPS排名TimeRequiredtoTrainAImodelsonDifferentSupercomputersTrainingAImodelsonDifferentSupercomputersAccuracyAchievedbyTrainingAIModelsonDifferentSupercomputers此外,国际测试委员会(BenchCouncil)还发布了智能芯片的性能榜单,评测了近20款主流人工智能芯片配置按性能排名。该排名基于最新的人工智能性能评估标准AIBench。AIBench旨在客观、公正、全面地评估当前蓬勃发展的各类人工智能系统,引领人工智能系统研发的正确方向。包含3个互联网人工智能场景和17个人工智能任务,能够反映真实的人工智能应用场景。是最全面的人工智能性能评价标准。智能芯片性能榜单对各种硬件的性能进行了排名,对芯片采购商具有参考价值,对智能芯片的设计方向也具有参考价值。对于图像分类负载,Google的TPU的性能是NvidiaGPU的8倍以上,但其通用性不如NvidiaGPU。软件开发人员需要针对某些负载对其进行优化,这会带来额外的开发成本。同时从榜单中可以看出,Facebook主导的开源软件框架Pytorch虽然支持TPU,但是性能非常差,尤其是I/O利用率远低于Tensorflow,谷歌主导的软件框架,使得TPU无法发挥其全部性能。目前,国内不少厂商在智能芯片上投入巨资,却忽视了与软件开发框架的协同优化。谷歌对TPU和Tensorflow的软硬件协同设计和优化,值得国内智能芯片厂商借鉴和学习。智能芯片排名(图像分类)智能芯片排名(目标检测)智能芯片排名(学习排序)
