行业基准测试机构 MLPerf 今天发布了最新测试结果。
与往常一样,NVIDIA 再次主导市场上的商业硬件和软件产品。
MLPerf 由全球 80 多家公司和大学组成,创建了行业培训和推理处理的基准。
MLPerf的人工智能基准测试分为三类,包括商业类、预览类和研究类。
这些基准测试衡量大型系统(例如,全球第七快的超级计算机 NVIDIA Kong)以及单个服务器(例如,8GPU DGX A)的训练性能。
新的 MLPerf V0.7 结果仅用于训练,新的推理基准可能会在未来几个月内发布。
在商用类别中,NVIDIA 大幅打破了 MLPerf 基准测试中的 16 项 AI 性能记录。
这是NVIDIA连续第三次在MLPerf训练测试中展现最强表现。
当年 12 月,NVIDIA 在 MLPerf 训练基准测试中首次创下了 6 项记录,次年 7 月,NVIDIA 再次刷新了 8 项记录。
ATensor Core GPU 在加速器的所有八个 MLPerf 基准测试中展示了最快的性能。
在实现整体最快的大规模解决方案方面,使用 HDR InfiniBand 互连多个 DGX A 系统的 DGX SuperPOD 系统在性能方面树立了八个新的里程碑。
NVIDIA在测试中使用的产品基于最新的NVIDIA Ampere架构和Volta架构。
测试结果表明,与 MLPerf 第一轮训练测试中使用的基于 VGPU 的系统相比,今天的 DGX A 系统在相同的吞吐量下可以实现高达 4 倍的性能提升。
同时,得益于最新的软件优化,基于NVIDIA V的DGX-1系统还可实现高达2倍的性能提升。
NVIDIA 在基于 DGX SuperPOD 的内部集群 Kongus 上运行了系统的 MLPerf 测试。
DGX SuperPOD 是一个适用于大规模 GPU 集群的公共参考架构,可在数周内完成部署。
Selene也是绿榜上全球第二大节能系统。
软件为人工智能的战略发展铺平了道路。
今年5月,NVIDIA发布了两款应用框架——用于对话式AI的Jarvis和用于推荐系统的Merlin。
Merlin 包含 HugeCTR 培训框架,为最新的 MLPerf 基准测试结果提供支持。
这些应用程序框架只是列表的一部分。
此外,还有针对汽车行业市场的NVIDIA DRIVE、针对医疗健康市场的Clara、针对机器人市场的Isaac、针对零售/智慧城市市场的Metropolis。
NVIDIA 生态系统在 MLPerf 基准测试中展示了令人印象深刻的结果。
在提交结果的9家公司中,除了NVIDIA之外,还有6家公司提交了基于NVIDIA GPU的测试结果,其中包括3家云服务提供商(阿里云、谷歌云和腾讯云)和3家服务器制造商(戴尔、富士通和浪潮),凸显了NVIDIA生态系统的优势。
使用NVIDIA AI平台参与基准测试的合作伙伴大多数使用NVIDIA软件中心NGC中的容器,以及用于竞赛的公共框架。
由近两打云服务提供商和 OEM(包括这些MLPerf合作伙伴)组成的生态系统已经采用或计划采用 NVIDIA AGPU 来构建在线实例、服务器和 PCIe 卡。