当前位置: 首页 > 科技观察

浪潮携三大AI算力主力亮相百度AI开发者大会

时间:2023-03-20 21:16:02 科技观察

7月4-5日,百度Create2018在北京举行。这是世界上第一个以AI为主题的开发者大会。也是百度AI产业生态的集中展示。作为百度计算基础设施领域的重要合作伙伴和AI生态的重要成员,浪潮参加了此次大会,并在大会上展示了三款不同规模的AI基础设施平台解决方案,其中AI服务器AGX-2支持NVIDIA最新的Volta架构,配置32GB显存的NVIDIA?Tesla?V100GPU加速器,显存容量较上一代提升一倍。最大SR-AI机柜服务器(百度代号X-Man)是浪潮与百度联合开发的超大规模AI计算集群,可支持64个GPU。浪潮GX4是一款高性能GPUAI计算产品,具有很强的灵活性和可扩展性,能够很好地满足不同规模的深度学习模型训练和在线推理的需求,以及不同类型AI应用对底层架构的需求。  2017年,百度公布了完整的AI开放生态战略,通过开放战略构建了强大且具有竞争力的AI生态。作为领先的IT基础设施供应商,浪潮为BAT提供了90%以上的AI计算系统解决方案。  三款产品覆盖所有用户需求  此次浪潮展示的AI平台主要有AGX-2、GX4和SR-AI三款解决方案,可有效覆盖不同规模的AI线下训练应用。  浪潮在2018百度AI开发者大会上展示了多款AI计算产品  SR-AI是最大的线下训练解决方案。本产品符合最新天蝎2.5标准,适用于超大规模云数据中心部署,最大支持64个GPU,可满足千亿级超大规模模型训练需求样本和万亿级参数,非常适合AI解决方案开发者、服务商等AI专业用户。  更重要的是,这也是全球首款将PCIeFabric引入AI应用的产品,打破了GPU和CPU的物理耦合,实现池化。与传统GPU服务器相比,这是一种颠覆性的创新,具有高密度、低延迟、易扩展等优势。该产品在百度实际业务中的测试表明,SR-AI的性能是传统AI解决方案的5-10倍。  浪潮AI服务器GX4  另一款GX4为专用GPU扩展模块,高度为2U,可扩展4个GPU,通过PCI-EX16接口连接服务器。单台服务器最多可连接4台GX4,组成16块GPU的AI训练平台。该方案不仅可以将GPU之间的通信延迟降低50%以上,还可以节省交换机等辅助设备,有效降低整体采购成本。与传统方案相比,16卡方案可节省硬件采购成本10万以上。  最强AI服务器AGX-2,运算性能提升高达40%  AGX-2是目前性能密度比最高的AI计算平台,2U高度可扩展至8个GPU,可以搭建AI训练集群,或者作为中小型AI的单机训练平台,通用性非常好。目前已广泛应用于移动咪咕、今日头条等互联网、金融、交通等行业。  浪潮AI服务器AGX-2  引用了浪潮的实测数据,搭载8颗配备32GHBM2缓存的TeslaV100GPU,AGX-2进一步提升了AI训练的计算性能。新品在模型训练的Batch_Size(批量大小)设置上有更灵活的空间,有效解决深度学习离线训练中的内存限制问题,更好应对大数据集或高清图片文件的处理瓶颈,以及有助于计算性能的提升可高达40%以上。同时,AGX-2具有拓扑的灵活性,可以支持NVIDIANVLink和PCIe两种GPU互联方案。当使用NVIDIANVLink时,它可以提供GPU之间的高带宽和低延迟互连,以及高达300GB/s的吞吐量。Geforce1080基于PCIE3的带宽只有16GB/s。在某客户的人脸识别离线训练场景中,浪潮提供的AGX-2+V100平台通过性能优化,训练速度比Geforce1080Ti提升了近四倍。  人工智能商业化的黄金搭档浪潮与百度??全球人工智能产业面临的最大问题是如何将人工智能与具体应用相结合,即人工智能的商业化。IDC认为,人类正开始全面进入人工智能时代,无论是高科技产品还是传统产品都将嵌入人工智能技术。“人工智能+”将带动“互联网+”之后的新一轮经济发展。  但人工智能的门槛非常高,对数据量、算法优化和计算能力都有极高的要求。因此,传统行业的客户希望以集成解决方案的形式快速搭建高效的AI系统,避免技术和团队成为制约AI应用落地的瓶颈。为此,百度与浪潮联合打造了一套AI交钥匙解决方案——ABC一体机,涵盖人脸识别、智能安防、入侵检测等一系列企业AI应用场景,加速传统产业智能化升级。  ABC一体机为加速行业AI转型提供交钥匙解决方案  智能计算,战略发展AI  浪潮是中国最大的AI计算平台提供商。份额高达57%。此外,浪潮还掌握了完整的软硬件AI平台技术,包括GPU服务器系列、管理系统AIStation、计算框架Caffe-MPI、应用特征分析系统Teye等。  AI是浪潮智能战略的重要组成部分,也是浪潮重点关注的战略业务。目前,浪潮的服务器出货量已经是中国第一、全球第三。浪潮希望通过发展AI、云计算等智能计算业务,在五年内成为全球最大的服务器供应商。  因此,浪潮一直在加大对AI的投入。2018年初,浪潮推出全新AI品牌——TensorServer,并启动代号T的全新AI生态发展计划,从创新、合作伙伴、人才三个维度出发,释放AI计算的核心价值和能力力量,赋能企业在人工智能时代拥有坚实可靠的基础设施支撑。