当前位置: 首页 > 科技观察

NVIDIA 以端到端的网络平台,助力现代化数据中心建设

时间:2023-03-16 13:57:08 科技观察

NVIDIA以端到端的网络平台助力打造现代数据中心企业数据中心提出了更高的要求,这也是数据中心建设呈指数级增长的主要因素。  众所周知,建设高性能、高可用、高安全的新型数据中心离不开网络的支持。在今年的NVIDIAGTC上,NVIDIA发布了多款高性能数据中心产品和解决方案,其中包括多款全新的网络产品。在近日由NVIDIA组织的媒体交流会上,NVIDIA网络专家崔妍和NVIDIA网络营销总监孟庆向媒体详细分享了NVIDIA近期发布的新品,并详细回答了媒体的提问。NVIDIA网络专家崔彦  Spectrum-4以太网平台:加速大规模云原生应用  在GTC上,NVIDIA正式发布了Spectrum-4以太网平台。  该平台由NVIDIASpectrum-4交换机系列、ConnectX-7智能网卡、NVIDIABlueField-3DPU和DOCA数据中心基础设施软件组成,可大幅加速大规模云原生应用。  据介绍,NVIDIASpectrum-4基于台积电4N工艺,包含超过1000亿个晶体管,具有领先的能效和总体拥有成本。凭借支持128个400GbE端口的51.2Tbps聚合ASIC带宽,以及自适应路由选择和增强的拥塞控制机制,Spectrum-4优化了基于融合以太网的RoCE(RDMAoverConvergedEthernet)网络架构,显着提升数据中心应用速度。  根据NVIDIA公布的数据,作为全球首款400Gbps端到端网络平台,NVIDIASpectrum-4的交换吞吐量较前几代提升4倍,达到51.2Tbps,实现纳秒级计时精度,比普通的毫秒级数据中心高出五到六个数量级。此外,NVIDIASpectrum-4可加速、简化和保护网络架构,与上一代产品相比,每个端口的带宽增加2倍,交换机减少1/4,功耗降低40%。  崔岩告诉记者,NVIDIASpectrum-4拥有自适应路由加速以太网,其基于拥塞的端口选择可以有效实现负载均衡,从而减少尾部延迟;而RoCE的乱序数据放置可以达到最高的效率,可以为超级计算带来更好的网络创新。  据介绍,在Omniverse在高效网络上的大规模加速方面,使用一台Spectrum-4可以替代12台传统交换机,简化128节点OVXSuperPOD连接,更易管理,节省空间,并且更加环保。  Spectrum-4以太网平台,ConnectX-7智能网卡作为重要组成部分,也带来了全新的性能提升。据崔岩介绍,ConnectXSmartNIC内置的NVIDIAASAP2技术可以在不影响CPU性能的情况下加速软件定义网络;其新增的NVMExpress(NVMe)和传输控制协议(TCP)加速功能可以提升存储空间,同时,ConnectXSmartNIC提供了创新的硬件引擎,可以利用嵌入式加密/解密技术来卸载和加速安全性。  该平台还加入了DOCA软件框架,结合API、驱动程序、库、示例代码、文档、服务和预打包容器,简化和加速BlueFieldDPU上各个数据中心节点的应用开发和部署。据了解,DOCA和BlueField共同为网络、安全、存储和基础设施管理打造了一个独立且安全的服务域,非常适合实施零信任策略。  崔岩表示,在高性能数据中心的建设中,对网络的性能要求越来越高。针对人工智能和大数据分析等应用,由Spectrum交换机、BlueFieldDPU和ConnectX系列智能网卡组成的Spectrum平台,可以提高AI应用、数字孪生和云基础设施的性能和可扩展性,为现代数据中心带来极高的效率和可用性。他强调,凭借51.2Tbps的吞吐量和12.8Tbps的加密带宽,Spectrum-4将成为市场上优秀、高性能、安全的端到端以太网网络平台。  NVIDIAOVX计算系统:为大规模数字孪生模拟加速  作为元宇宙领域的大佬,NVIDIA在今年的GTC开发者大会上推出了全新的工业数字孪生计算系统——OVX。  据了解,OVX的设计初衷是通过物理上精确的工业数字孪生模拟,为数据中心规模提供实时响应和支持,提供虚拟城市、数字城市,或甚至数字化工厂未来的虚拟世界和虚拟地球。复杂的模拟,或者实时数字孪生所需要的一系列软硬件、存储、网络、带宽、计算、算力性能。据NVIDIA网络营销总监孟庆介绍,OVX服务器是NVIDIAOVX计算系统的重要组成部分。它由8个NVIDIAA40GPU、3个NVIDIAConnectX-6Dx200Gbps网卡、1TB系统内存和16TBNVMe存储组成,专为满足Omniverse数字孪生的需求而设计。  为了为大规模数字孪生模拟提供更高的性能,OVX计算系统还支持从一个由八台OVX服务器组成的集群扩展到一个或多个通过NVIDIASpectrum-3交换结构连接的OVXSuperPOD(由32OVX服务器)。  为了充分发挥多块GPU的性能,NVIDIA推出了NVLink技术,实现GPU之间的直接互联,扩展服务器中多块GPU的输入/输出。在本次GTC上,第四代NVIDIA?NVLink?技术正式发布,提供多GPU系统配置,带宽比以往提升1.5倍,扩展性增强。单个NVIDIAH100TensorCoreGPU支持多达18个NVLink连接,总带宽为900GB/s,是PCIe5.0带宽的七倍。  另外,NVIDIA宣布推出NVIDIANVLinkSwitch系统,借助NVLinkSwitch系统,可以扩展成一个拥有32个节点和256个GPU的巨大DGXPOD,这一切都得益于4口光口收发器连接到NVLink开关。  在交流会上,孟青还介绍了NVIDIA最新发布的NVIDIAQuantum-2和NVIDIAH100CNX融合加速器。据了解,NVIDIAQuantum-2是一个400GbpsInfiniBand网络平台,由NVIDIAQuantum-2交换机、ConnectX-7网络适配器、BlueField-3数据处理器(DPU)以及支持新架构的所有软件组成。在云原生技术的支持下,NVIDIAQuantum-2提供每秒400GB的高性能和先进的多租户功能,以容纳更多用户。  孟庆表示,凭借400Gbps,NVIDIAQuantum-2InfiniBand将网络速度提高一倍,将网络端口数量增加三倍。它将性能提高了3倍,将对数据中心光纤交换机的需求减少了6倍,同时降低了数据中心功耗并将数据中心空间减少了7%。  NVIDIAH100CNX融合加速器为GPU驱动的I/O密集型工作负载提供出色的性能,将NVIDIAH100TensorCoreGPU的强大功能与NVIDIA?ConnectX?-7SmartNIC的高级网络功能相结合,加速GPU驱动的输入/输出(I/O)密集型工作负载,例如企业数据中心的分布式AI训练和边缘5G处理。  “NVIDIA发布的新系统、产品和解决方案旨在加速企业的AI计算,创造逼真的数字孪生所需的性能,助力构建高性能数据中心,加速企业创新和数字化转型。”面试。终于,孟清这么说了。