全球AI领域“奥林匹克”近日发布排行榜!戴尔的5台服务器在各自类别的排名中获得了“金奖”。这并不容易,因为今年的参赛人数和投稿人数分别是往年的2倍和6倍。祝贺戴尔!MLPerf?AI性能基准测试MLPerf?由图灵奖获得者DavidPatterson于2018年联合顶尖学术机构发起。是目前国际上最具权威和影响力的人工智能性能基准测试。购买人工智能系统时的重要参考。MLPerf?AI性能基准测试包括两个领域:Training(训练)和Inference(推理),分为封闭任务(Closed)赛道和开放任务(Open)赛道。开放优化能力侧重考察参赛厂商的AI技术创新能力,而固定任务则因为更加公平地考察参赛厂商的硬件系统和软件优化能力,成为更有价值的AI性能标杆。谁能在本次测试中获得更多的领先优势,谁的AI能力就会更加出色。在本轮MLPerfv2.0测试中,戴尔科技每个类别提交了167个结果,在封闭数据中心类别中排名第二。此外,只有戴尔提交了不同主机操作系统的结果。在此,恭喜我们的四台服务器PowerEdgeXE8545、PowerEdgeR750xa、PowerEdgeXE2420、PowerEdgeXR12在MLPerfv2.0中取得了优异的成绩!多个类别中单加速卡性能第一与其他同样配备NVIDIAA100GPU的系统相比,戴尔PowerEdgeXE8545和PowerEdgeR750xa在竞争中脱颖而出,测试结果涵盖图像分类、对象检测、语音到文本、用例,例如医学成像、自然语言处理和推荐引擎。NVIDIAA100GPU在深度学习领域广受欢迎。测试结果显示了搭载NVIDIAA100GPU的戴尔PowerEdgeXE8545和PowerEdgeR750xa服务器在该领域的突出优势。基于PCIe的服务器性能,在基于PCIe的4-GPU服务器中排名第一,戴尔PowerEdgeR750xa在图像分类、对象检测、语音到文本、自然语言处理和推荐用例等多项基准测试中也表现出色,排名第一.DellPowerEdgeR750xa是经过验证的PowerEdgeR750服务器的GPU优化版本,非常适合AI、ML和DL工作负载。支持4x300W双宽或6x75W单宽加速卡,提供最多8个PCIeGen4插槽,最多支持8个NVMeSSD。最低多流延迟,排名第一戴尔PowerEdgeXE8545服务器在使用NVIDIA多实例GPU(多实例GPU,MIG)的图像分类和对象检测用例中获得最低多流延迟第一名,显示了PowerEdgeXE8545在边缘类别中具有很强的优势。AI工作负载的强大动力是DellPowerEdgeXE8545,这是一款双插槽4U机架式服务器,具有多达128个第三代AMDEPYC处理器内核、四个NVIDIAA100GPU和NVIDIAvGPU软件优化性能。此外,PowerEdgeXE8545在语音转文本、对象检测、自然语言处理和医学图像分割等多个基准测试中获得了系统性能第二名的成绩。T4推理结果第一与使用NVIDIAT4GPU的其他系统相比,戴尔PowerEdgeXE2420服务器在图像分类、语音到文本和推荐用例方面取得了最高的推理结果。DellPowerEdgeXE2420服务器是一款专业的边缘服务器,专为流分析、制造物流和5G蜂窝处理等对环境要求苛刻的边缘应用而设计。此外,该服务器支持高达2993MT/s的16xDDR4RDIMM/LR-DIMM,非常适合低延迟和大型存储边缘应用。在功耗方面每瓦性能排名第一,配备A2GPU的戴尔PowerEdgeXR12服务器的功耗数据与其他配备A2GPU的服务器相比,在ResNet50、RNNT、BERT和DLRM基准测试中的每瓦性能均排名第一。DellPowerEdgeXR12是一款坚固耐用、符合海事标准的2U服务器,适用于电信、军事、零售和其他节能环境。它是图像分类、对象检测、语音转文本、自然语言处理和推荐引擎的不错选择。结语感谢权威AI对标机构对戴尔服务器在AI领域的出色表现的验证和肯定。作为全球领先的IT端到端解决方案提供商,戴尔科技在AI领域深耕多年,积累了先进的技术和丰富的行业应用经验。能够与客户和合作伙伴共同加速人工智能应用落地,加速人工智能创新成果转化。附:戴尔服务器在MLPerfInferencev2.0中的Benchmark结果为了更贴近实际使用情况,MLPerf推理测试对于数据中心类别有两个必需的场景:离线和服务器。离线场景意味着任务所需的所有数据都在本地可用。服务器场景在请求时以突发方式在线传输数据。对于服务器场景,性能指标是每秒查询数(QPS)。对于离线场景,性能指标是每秒离线样本数。一般来说,更高的吞吐量意味着更好的结果。在下图中,Y轴是指数刻度,代表吞吐量,X轴代表被测系统(SUT)及其对应的模型。图1至图6显示了各种SUT在ResNet50、BERT、SSD、3dUnet、RNNT和DLRM模式、服务器和离线场景下的单卡性能:图1:MLPerfInferencev2.0ResNet50percard结果图2:MLPerfInferencev2.0BERT默认和高精度每卡结果图3:MLPerfInferencev2.0SSD-ResNet34每卡结果图4:MLPerfInferencev2.03DU-Netper卡结果图5:MLPerfInferencev2.0RNNT每卡结果图6:MLPerfInferencev2.0DLRM默认值和每张卡的高精度结果
