AMD发布CDNA架构InstinctMI100加速显卡加速进入百亿级时代

时间：2023-03-18 18:32:38 科技观察

北京时间11月16日晚10点，AMD正式发布首款基于全新CDNA架构及配套ROCm4.0的InstinctMI100加速显卡生态系统。　　首次正式亮相的CDNA架构专为高性能计算而打造，基于该架构打造的AMDInstinctMI100加速显卡将进一步迈向百亿级计算时代，同时也是AMD的全新旗舰。AMD开辟了一条新的产品前进发展道路。　　AMD高级副总裁兼服务器业务总经理DanMcNamara表示，在高性能计算方面，整个行业发展非常迅速。我们看到的趋势是工作负载的多样性在增加，高性能计算已经进入很多领域，包括从传统科学研究、气象研究、生命科学、电子设计自动化到商业应用，从AI、机器学习到算法训练等，如何通过CPU与GPU的结合更好地服务客户，为客户带来更高的单位性价比，降低总体拥有成本，将是AMD极其重要的战略之一。　　不过，用户最关心的还是这次发布的全新加速显卡。AMD平台解决方案工程研发全球副总裁BradMccredie对此进行了全面解读。　　纵观过去20年，整个高性能计算经历了三个阶段，即TERASCALE、PETASCALE和现在的EXASCALE。在这个过程中，我们需要一系列的技术来支持exascale这样的exascale计算。　　作为专为高性能计算打造的业界领先GPU产品，AMDInstinctMI100旨在推动百亿亿次级计算时代的到来，可实现10TF（万亿双精度计算速度），采用Matrix核心技术。与AMD上一代产品相比，性能提升巨大，可实现高达70%的AI计算提升；与竞争对手相比，它的单位性能也是两倍。尤其是搭配第二代AMDEPYC处理器使用时，还能为系统提供更强的加速性能。　　20年前，ASCI怀特超级计算机进入超级计算领域，率先突破10TF级别。20年后，现在单个GPU仅用6兆瓦的性能就可以达到这样的性能水平。这是AMDInstinctMI100加速显卡。可以说，这是20年后的一大成就。　　目前市面上的GPU大多采用通用架构，也就是说这种架构既用于游戏图形处理，也用于复杂的数学处理。水平计算的发展。AMD选择将这两部分分开，我们已经熟悉的游戏行业的RDNA架构，以及超算的CDNA架构。这种分离可以帮助利益相关者进一步优化域中的工作负载。　　以AMDInstinctMI100为例，CDNA架构可以在同一芯片上放置两倍数量的计??算单元，并可以嵌入微架构，更好地适应AI和高性能计算工作负载。同时，16位浮点计算和混合精度计算的性能可提升7倍以上。此外，通过Infinity架构可将GPU带宽提升4倍，通过HBM2显存可将位宽提升20%。　　上面多次提到的AMDInstinctMI100加速显卡正在接近百亿亿次计算时代，AMDInstinctMI100的双精度计算性能可以达到11.5TF的水平，单精度计算的水平将甚至更高。　　据报道，橡树岭国家实验室使用MI100进行相关工作负载。在分子动力学负载下，速度相比v100加速显卡提升了3倍。在FluidTurbulence工作负载中，它也比v100加速显卡有2.6倍的速度优势。从早期客户使用的效果来看，这个数据是很有说服力的。　　此外，AMD还强调需要世界一流的硬件和世界一流的生态作为配套。为此，还推出了开源软件站ROCm4.0，为百亿亿级计算提供了新的基础。　　该平台不仅可以让MI100的性能相比前两代产品提升5-8倍，还为开发者提供了简单快捷的代码迁移功能，甚至可以在短短的时间内完成部分代码迁移一天。迁移工作。　　自从发布代号为“罗马”的第二代EPYC处理器以来，AMD在服务器市场取得了不俗的成绩，至今仍是市场上业界领先的x86服务器。根据Intersect360此前的调查显示，从2016年至今，用户对EPYC处理器的前瞻印象和好感度翻了三倍多。　　现在，继MI100加速显卡和ROCm4.0开源平台的推出后，AMD不仅将进一步完善AMD在服务器市场的产品布局，相信也将为客户带来更加卓越的HPC工作基础和推广百亿亿次级时代首先到来！

上一篇：如何在Windows10中重置或修复单个Office365应用程序

下一篇：苹果暴露严重安全漏洞！黑客可以完全控制设备？

AMD发布CDNA架构InstinctMI100加速显卡加速进入百亿级时代相关文章