当前,数字化转型已成为所有企业的主旋律。随着人工智能、云计算、大数据、物联网等新兴技术的应用,企业对算力的需求越来越高。传统数据中心使用CPU进行通用计算和基础设施操作,使用GPU进行加速计算。会导致CPU处理网络、安全等很多基础设施任务,不能完全运行应用,造成资源的大量浪费,不能满足当前企业的需求。为此,英伟达发布了云原生超算架构,将需要CPU运算的传统基础设施工作负载卸载到DPU上,利用CPU、DPU、GPU等加速器与网络协同工作,优化应用计算资源和提高整体系统性能。NVIDIANetwork亚太区高级总监宋庆春近日在接受媒体采访时表示,NVIDIA云原生超算架构提供的最优性能,不仅可以以更低的成本或更少的硬件构建更高性能的系统,还可以将其实现在云端。具有与运行单一业务的独立系统同等性能,通过减少硬件降低数据中心整体能耗,使系统更环保、更安全、更可靠。NVIDIA网络亚太区高级总监宋庆春数据中心新架构:云原生超算架构在人工智能、云计算、大数据等新技术的推动下,企业对数据中心算力的要求越来越高。对于数据中心运营商和管理者来说,一方面需要不断提升数据中心的计算能力以满足用户的基本需求;另一方面,在碳中和和碳达峰战略下,需要不断降低能源消耗,以实现“双碳”目标。在此背景下,企业需要不断优化数据中心的结构,充分利用新技术、新产品来提高数据中心的计算能力,降低能耗。DPU作为一种新型处理器,能够与CPU、GPU协同工作,充分释放CPU资源,提升网络性能,受到了数据中心用户的广泛关注。据宋青春介绍,BlueField-2DPU已经在多个市场得到广泛应用,BlueField-3DPU也即将进入市场。据了解,BlueField-3DPU在处理RDMA消息时可以达到每秒3.7亿条消息,因此在处理小包业务或微服务业务时,效率会变得更高,计算能力也会进一步提升。除了网络加速,云原生超算还可以使用DOCA来加速应用性能。据了解,使用NVIDIADPU和DOCA可以直接运行各种加速库,比如用于集体运算的UCC,用于点对点的UCX,以及面向存储、性能隔离、网络编排的加速库。通过标准的FileSystem、Schedulers或存储框架,直接为应用提供标准接口,实现用户无感知的应用加速,满足各种计算业务需求。宋青春表示,使用DPU来加速计算或者卸载通信,在一些业务中可以取得非常好的性能提升。例如,在分子动力学的应用上,实现了20%的性能提升;此外,数据建模应用场景实现了26%的性能提升,天气预报模型实现了24%的性能提升。云原生超算的核心之一是交换计算技术。宋青春告诉记者,交换机计算技术(SHARP)是英伟达独有的技术,可以在交换机上进行数据聚合和缩减,突破了网络物理带宽的限制。例如,数据使用通信模型进行数据聚合、归约或广播,通过交换机完成,不需要发送到特定的Host或特定的Agent进行操作,消除了网络拥塞,解决了Burst压力在网络上由多个呼叫引起。在Allreduce等通信中,可以突破网络物理带宽的上限,在200G网络上实现230G甚至更高的带宽。为了保证大型业务上云后的性能,云原生超算还提供了性能隔离技术,使企业在多任务并行环境下,可以达到单机运行任务的性能。云端。据了解,该技术已在微软公有云Azure中得到验证,确保在云端运行关键业务时同样的性能保障。宋青春强调,借助云原生超算技术,云端上性能与超算中心一致,帮助业务尽快上云,发挥云上最佳性能。同时,通过对数据中心各种网络资源和计算资源的充分优化,数据中心可以提供最佳性能,减少服务之间的相互干扰,同时让每个服务都获得最优性能,提高效率。并减少硬件数量,降低数据中心功耗,打造绿色数据中心。2022秋季DPU中国黑客马拉松大赛:赋能开发者,推动行业创新在本次媒体交流会上,NVIDIA网络技术专家崔岩除了介绍云原生超算架构外,还详细介绍了2022秋季DPU中国资讯关于黑客马拉松比赛。据介绍,本次黑客马拉松的筹备工作从8月份开始,共有27支队伍报名参加黑客马拉松。10月19日的黑客马拉松训练营共吸引了3500名参与者和数万名观众。10月22日,共有13支队伍、51名开发者参加了总决赛,既有企业开发者,也有高校开发者。项目现场论证结束后,国内外评委对参赛项目进行评审打分。最终,四支队伍脱颖而出,获得了本次黑客马拉松的相应奖项。NVIDIA网络技术专家崔妍崔妍告诉记者,云原生超算架构也将是本次比赛的重点。例如,获得一等奖的国投团队参与了基于BlueFieldDPU数据中心的RDMA虚拟化研究,通过Virtio加速,将以太网和块存储设备解耦,解决了云管理扩展的问题。本项目的主要目标是在NVIDIABlueFieldDPU上搭建设备模拟平台,虚拟化RDMA硬件设备,在主机端运行vHostRDMA程序并在NVIDIABlueFieldDPU上运行InverseLayer,在InfiniBand网络上实现RDMA功能,并使用Virtiosemi虚拟化方案,为不同的hypervisor提供了兼容、通用的VirtioRDMA通信框架和编程接口,从而减少主机性能的一些开销,实现更高效的虚拟化过程,方便云管理、云运维、以及云迁移。“通过黑客马拉松比赛,我们可以为整个行业培养更多的DPU和DOCA开发人才。”崔岩表示,我们希望通过举办此次活动,让更多的开发者参与进来,一方面为行业培养更多的优秀人才。另一方面,通过赛事探索DPU和DOCA的更多场景和创新应用,更好地服务各行各业,推动万千行业数字化转型。
