【.com原创文章】AI时代,企业对高性能计算的需求越来越迫切,尤其是随着深度学习和计算的不断演进AI应用、图形计算成为企业不可或缺的算力。NVIDIAProviz亚太区业务总监沉伟认为,对于深度学习企业用户来说,在数据中心使用GPU已经成为一种常态配置。因此,英伟达开始从vGPU图形计算向纯数据中心发展。这是因为NVIDIA硬件首先是从工作站向数据中心发展的,所以从虚拟化的角度来看,它也会从工作站向数据中心发展。 两年前,vGPU5.0引入了vGPU计算的概念。vGPU不仅可以用于图形应用,还可以用于计算应用。通过软件,GPU被重新定义。如今,vGPU7.1可以虚拟出多个物理GPU,分配给某个用户,实现两个功能:一个是针对性能要求不高的场景,比如图形场景、教学场景、开发测试场景。第二种是针对对计算能力要求非常高的用户。这时候就可以使用multi-vGPU功能,为这些用户分配给各个虚拟机。NVIDIAGPU虚拟化高级解决方案架构师张杰表示,因此,vGPU7.X解决方案比之前的版本更加灵活,符合vGPU解决方案的发展趋势。 据张杰介绍,vGPU7.X具有以下特点:首先,支持多GPU。对于算力要求高的用户,需要多块GPU。虚拟化的方法是给虚拟机多块物理GPU。虚拟机需要高算力就给它高算力,需要低算力就给它低算力。例如,大学有时需要低计算能力,有时需要高计算能力。对算力要求不高的场景一般是教学场景,学生需要用到算力不高的GPU进行教学实践和训练。而教师需要具有高计算能力的GPU来进行科学研究。 虚拟化可以将两者合二为一。比如学生在上培训班的时候,可以把整个GPU资源池中的GPU裁掉,给他们提供低算力。学习后可以完全释放GPU,物理GPU可以给某位老师或教授做科研相关的工作。因此,虚拟化可以使其更加灵活。 第二种是vMotion动态迁移。一些不适合用硬件实现的功能可以用软件来实现。比如数据中心有热迁移,现在可以支持VMware和Citrix的服务器虚拟化平台在数据中心挂载vGPU虚拟机,在数据中心不间断的进行业务迁移。数据中心用户可以将大量的GPU服务放在虚拟化平台上,在GPU资源池中实现。 第三是图形虚拟化已经比较成熟,现在需要在vGPU上加入大量关于虚拟化的计算特性。NVIDIA的目标是让vGPU的特性与物理GPU的特性完全一致,让传统的物理GPU用户可以通过虚拟GPU解决方案平滑无缝地迁移到数据中心。 在物理GPU上,NVIDIA发布了整机方案DGX-1。DGX-1与NVIDIAGPUCloud(NGC)合作,将NVIDIA优化的人工智能神经网络框架下载到DGX-1,这是一个8卡或16卡的训练环境。您也可以将NGC与NVIDIAvGPU软件搭配使用,将NGC上优化后的Docker镜像直接下载到vGPU环境中进行推理和训练。因此,将传统物理环境中的特性移植到虚拟化环境中进行验证,以保证性能和兼容性。 第四是支持TeslaT4,这是一款基于图灵架构的全新GPU。它有人工智能加速的TensorCore,实时光线追踪加速的RTCore,以及图形和计算的CUDACore。 对于vGPU7.X版本的应用场景扩展,NVIDIA官方也给出了建议。首先是Windows10,2020年1月,微软将正式停止支持Win7,越来越多的用户将迁移到Win10,因此越来越多的虚拟桌面用户将迁移到Windows10。 Window10要求比较高在GPU上。因此,在虚拟桌面场景下,有和没有GPU的用户体验是完全不同的——如果有GPU,用户体验会大大提升,可以帮助客户的终端用户接受桌面虚拟化的改造和迁移,并能帮助客户更好地推广桌面虚拟化,更好地管理桌面、终端和数据。 通过GPU虚拟化,在虚拟桌面服务器上插入一块GPU进行切割,切割后给它一个vGPU。当虚拟桌面上有vGPU时,性能会得到提升,用户体验也会变得更好。更好的是,它将接近物理机的体验。 第二是5.0版本,GPU支持计算。一些对GPU算力要求非常高的离线渲染场景,用GPU就可以完成。因此,支持多GPU分配的7.X版本可以提高渲染效率。 第三,在AI场景下,深度学习推理会用GPU来实现。【原创稿件,合作网站转载请注明原作者和出处为.com】
