北京时间11月16日晚10点,AMD正式发布首款基于全新CDNA架构及配套ROCm4.0的InstinctMI100加速显卡生态系统。 首次正式亮相的CDNA架构专为高性能计算而打造,基于该架构打造的AMDInstinctMI100加速显卡将进一步迈向百亿级计算时代,同时也是AMD的全新旗舰。AMD开辟了一条新的产品前进发展道路。 AMD高级副总裁兼服务器业务总经理DanMcNamara表示,在高性能计算方面,整个行业发展非常迅速。我们看到的趋势是工作负载的多样性在增加,高性能计算已经进入很多领域,包括从传统科学研究、气象研究、生命科学、电子设计自动化到商业应用,从AI、机器学习到算法训练等,如何通过CPU与GPU的结合更好地服务客户,为客户带来更高的单位性价比,降低总体拥有成本,将是AMD极其重要的战略之一。 不过,用户最关心的还是这次发布的全新加速显卡。AMD平台解决方案工程研发全球副总裁BradMccredie对此进行了全面解读。 纵观过去20年,整个高性能计算经历了三个阶段,即TERASCALE、PETASCALE和现在的EXASCALE。在这个过程中,我们需要一系列的技术来支持exascale这样的exascale计算。 作为专为高性能计算打造的业界领先GPU产品,AMDInstinctMI100旨在推动百亿亿次级计算时代的到来,可实现10TF(万亿双精度计算速度),采用Matrix核心技术。与AMD上一代产品相比,性能提升巨大,可实现高达70%的AI计算提升;与竞争对手相比,它的单位性能也是两倍。尤其是搭配第二代AMDEPYC处理器使用时,还能为系统提供更强的加速性能。 20年前,ASCI怀特超级计算机进入超级计算领域,率先突破10TF级别。20年后,现在单个GPU仅用6兆瓦的性能就可以达到这样的性能水平。这是AMDInstinctMI100加速显卡。可以说,这是20年后的一大成就。 目前市面上的GPU大多采用通用架构,也就是说这种架构既用于游戏图形处理,也用于复杂的数学处理。水平计算的发展。AMD选择将这两部分分开,我们已经熟悉的游戏行业的RDNA架构,以及超算的CDNA架构。这种分离可以帮助利益相关者进一步优化域中的工作负载。 以AMDInstinctMI100为例,CDNA架构可以在同一芯片上放置两倍数量的计??算单元,并可以嵌入微架构,更好地适应AI和高性能计算工作负载。同时,16位浮点计算和混合精度计算的性能可提升7倍以上。此外,通过Infinity架构可将GPU带宽提升4倍,通过HBM2显存可将位宽提升20%。 上面多次提到的AMDInstinctMI100加速显卡正在接近百亿亿次计算时代,AMDInstinctMI100的双精度计算性能可以达到11.5TF的水平,单精度计算的水平将甚至更高。 据报道,橡树岭国家实验室使用MI100进行相关工作负载。在分子动力学负载下,速度相比v100加速显卡提升了3倍。在FluidTurbulence工作负载中,它也比v100加速显卡有2.6倍的速度优势。从早期客户使用的效果来看,这个数据是很有说服力的。 此外,AMD还强调需要世界一流的硬件和世界一流的生态作为配套。为此,还推出了开源软件站ROCm4.0,为百亿亿级计算提供了新的基础。 该平台不仅可以让MI100的性能相比前两代产品提升5-8倍,还为开发者提供了简单快捷的代码迁移功能,甚至可以在短短的时间内完成部分代码迁移一天。迁移工作。 自从发布代号为“罗马”的第二代EPYC处理器以来,AMD在服务器市场取得了不俗的成绩,至今仍是市场上业界领先的x86服务器。根据Intersect360此前的调查显示,从2016年至今,用户对EPYC处理器的前瞻印象和好感度翻了三倍多。 现在,继MI100加速显卡和ROCm4.0开源平台的推出后,AMD不仅将进一步完善AMD在服务器市场的产品布局,相信也将为客户带来更加卓越的HPC工作基础和推广百亿亿次级时代首先到来!
