当前位置: 首页 > 科技观察

戴尔科技PowerEdge服务器 可充分满足人工智能工作负载和业务需求

时间:2023-03-20 15:15:51 科技观察

DellTechnologiesPowerEdge服务器可以充分满足人工智能工作负载和更快的业务需求。一千多年来,人们一直相信亚里士多德的论点。直到1589年(也有1590年的手稿记载),出生于意大利比萨的物理学家伽利略爬上比萨斜塔,从同一高度同时抛下两个重量不同的球体,两个球体落下同时落地。这就是我们在中学物理课本上学过的自由落体实验。比萨大学由教皇克莱门特六世于1343年创立,是意大利乃至欧洲最古老的大学之一。600多年办学历史,培养了无数杰出人物。比萨大学是伽利略的母校。在完成著名的比萨斜塔实验的那一年,伽利略年仅26岁,已是比萨大学的教授。在伽利略实验430多年后的今天,比萨大学依然是欧洲顶尖学府,其物理、数学、计算机科学、历史、医学等专业均位居世界前列。当前流行的人工智能也是比萨大学的一个重点研究方向。比萨大学希望在AI深度学习、机器学习、数据分析等领域为师生提供灵活的基础设施环境,让AI应用的部署和管理更加灵活。去年,比萨大学选择戴尔PowerStore为师生提供方便快捷的数据访问和应用能力。而这一次,比萨大学依然选择了戴尔:通过与戴尔科技的合作,戴尔科技为比萨大学提供了AI计算平台解决方案,在戴尔PowerEdgeR740XDGPU加速服务器和Vmware虚拟化软件平台上,通过NVIDIAAI企业软件,用于创建和部署AI应用程序。通过GPU虚拟化技术,更多师生可以同时在线使用GPU算力。比萨大学CTOMaurizioDavini在接受采访时表示:“我们的测试表明,通过NVIDIAAIEnterprise的最新技术成果,运行在虚拟机上的GPU加速应用程序可以实现几乎与裸机相当的加速性能环境。”NVIDIAAIEnterprise(以下简称NVAIE)解决方案是戴尔科技、NVIDIA、Vmware于2021年联合推出的解决方案,旨在帮助用户解决构建企业级人工智能平台的技术痛点。与云平台、大中型互联网公司、专业AI公司等早期AI用户相比,很多企业用户接触AI技术的时间较晚。从头开始构建人工智能平台,然后开发人工智能应用程序是比较困难的。他们经常面临这样的困扰:目前主流的AI框架和优化库基本上都是开源软件,学习成本比较高;缺乏快速创建、扩展和释放人工智能计算和存储资源的软件解决方案和商业支持服务;目前的AI应用部署多采用裸机或开源容器化方案,缺乏对企业数据中心常用的资源管理和调度机制的整合和优化,如虚拟化。在这方面,NVAIE包括一整套针对AI和数据分析应用程序优化的集成软件堆栈和硬件堆栈,允许用户在高性能、可扩展且具有成本效益的基础架构上运行AI应用程序。戴尔科技提供的经过NVIDIA官方认证的AI基础设施,与Vmware虚拟化和容器编排平台紧密结合,简化AI平台的管理、部署、运维和监控。NVAIE解决方案的系统架构和功能组件NVAIE自下而上主要包括三层功能组件:⑴NVIDIACertifiedSystem认证系统硬件NVIDIACertifiedSystem(NVIDIACertifiedSystem)是NVIDIAAIEnterprise软件部署和运行的硬件基础平台.认证体系的认证规范比一般的GPU兼容性验证更加严格。GPU服务器需要通过25类真实GPU应用负载的验证测试,包括AI训练、AI推理、数据分析等负载。测试项目包括兼容性、性能、安全性、可管理性、可扩展性等。⑵VmwarevSphere/Redhet/K8S软件平台NVAIE1.0和1.1版本工作在VmwarevSphere环境下,提供对VmwareTanzu的支持。针对VmwarevSphere环境全面优化,单节点或多节点性能接近裸机水平。通过与vCenter的集成,用户可以通过图形界面操作的vCenter轻松启用和使用GPUMIG特性,无需额外的命令行操作。NVAIE方案通过与vSphereSR-IOV、ATS地址转换服务等机制的深度集成和性能优化,在VM虚拟机层面支持GPUDirectRDMA,加速多机多卡GPU分布式训练性能。今年3月,NVIDIAAIEnterprise2.0还增加了对Redhat和Kubernetes云原生软件平台的支持。(3)NVIDIAAIEnterprise软件套件封装在DellTechnologies基础设施硬件和Vmware虚拟化软件平台上,允许用户运行数百款AI和数据分析应用软件。其中,NVIDIA选择了11款由NVIDIA开发或优化的用户AI模型训练和推理计算中最常用的AI软件,组成NVAIE软件套件,涵盖了从AI基础设施优化到迁移部署的方方面面。NVIDIAAIEnterprise软件套件的商业销售,包括企业版和教育版。购买NVIDIAAIEnterprise软件套件商业授权的用户,在使用套件中的任意一款或多款软件时,将获得NVIDIA的商业软件支持服务。NVIDIA和DellTechnologies的测试数据证明,通过对AI应用软件在vSphere软件层面的深度优化,NVAIE方案可以在虚拟机上实现接近裸机环境部署AI应用的计算性能体验。机器级别,并支持跨主机多节点横向扩展。在2021年MLPerf组织的AIInferencev1.1基准测试中,在戴尔科技提交的PowerEdgeR7525服务器上,NVIDIAAIEnterprise的性能数据跑在三块NVIDIAA100GPU加速卡上,每个AI模型都达到了94.4%在虚拟化平台上。%至100%等效裸机性能。DellTechnologies提供了一套非常丰富的GPU加速产品,已通过NVIDIA认证体系的官方认证,包括目前热销的PowerEdge服务器家族的GPU服务器,如R750xa、XE8545、R750、R7525、DSS8440等。;VxRail,通过NVIDIA认证体系认证的GPU超融合平台。对于选择NVAIE解决方案的用户,戴尔科技可以提供NVIDIA官方认证支持的计算设施、存储设施、网络设施,以及NVIDIAAIEnterprise软件和Vmware软件的销售和软件部署服务,整体解决方案和一站式服务让企业在后续的实施和运维中避免因软硬件适配带来的额外麻烦,帮助企业轻松应对AI时代的严峻挑战。