当前位置: 首页 > 科技赋能

揭开 DGX-Station 的秘密!英伟达45万元超级计算机

时间:2024-05-22 16:47:43 科技赋能

正文 |丽娜智熙10月23日讯,上周,全国高性能计算学术年会(HPC China)在合肥召开。

本次大会是HPC China举办的第13届大会,大会主题为“应用驱动生态共建”。

中国科学院院士陈国梁、中国工程院院士廖祥科、NVIDIA中国区企业业务总经理沉巍、联想HPC/AI执行董事Scott Tease等产学界人士与会人员围绕HPC软硬件应用、科研政策等进行了讨论和论证。

1、HPC产业崛起与软件生态薄弱 HPC(高性能计算)又称超级计算,是指在性能和功能上远远优于普通PC和低端服务器的计算系统和环境。

HPC计算系统种类繁多,从高度专业化的个人硬件超级计算机(单价至少10万元)到大型标准计算机集群,可应用于人工智能、高精度视觉渲染、CAD设计、CAE仿真等领域、科学计算等领域。

目前,中国对HPC行业的预算投资每年保持在15%以上,可以说增长非常迅速。

中国自主研发的“神威·太湖之光”、“天河二号”等超级计算机也在各类国际高性能计算会议上亮相。

屡创佳绩。

然而,国内HPC基础设施(如各种高性能国产计算芯片)不断增长的同时,也暴露出欧美成熟HPC产业的短板:缺乏上层应用软件和系统开发工具,成熟的商业软件无法便捷操作,生态环境不完善。

这也是为什么今年HPC China的主题是“应用驱动生态共建”。

2、GPU和HPC 说到AI和高性能计算,自然少不了NVIDIA。

NVIDIA中国区企业业务总经理沉巍表示,NVIDIA从2016年开始发明了CUDA,使得各类学者、研究人员、开发者能够轻松地进行基于GPU的计算研发。

此后,NVIDIA也进军高性能计算领域。

场地。

到了这一年,全球最大的超级计算中心都开始使用GPU进行计算。

除了进军超级计算中心之外,NVIDIA还推出了超级计算机DGX-1和DGX-Station。

前者配备8张Tesla P显卡(今年5月在GTC上升级为8张Tesla V显卡)。

该系统的双精度计算峰值可以达到TFlops,售价为149,000美元。

同样是在今年5月的GTC上,英伟达还推出了一款更加个人化的超级计算机DGX-Station,它是专门为小型AI初创公司,或者对算力要求不高的科研团体或个人而设计的。

配备4块Tesla V显卡,售价6.9万美元(折合人民币约45万元),这款超级计算机前不久在GTC中国正式首发。

3. 45万超级计算机:DGX-Station 智能工具在HPC China的NVIDIA展位上也看到了这款DGX-Station。

其尺寸与普通台式电脑主机机箱相似,配备4块Tesla V显卡,系统双精度计算峰值可达TFlops,支持NVLink,功耗为W。

最值得关注的是这款DGX- Station是目前业界唯一采用工作站液冷设计的产品。

与传统的风扇冷却设计相比,DGX-Station 非常安静。

整机噪音仅为35分贝。

它可用于安静的办公室。

据英伟达称,DGX-Station的开发花费了近一年的时间。

当NVIDIA刚开始投资高性能计算领域时,它发现很多科研教授非常需要这样的机器来开展研究工作。

DGX-Station对用户的吸引力很大程度上归功于其集成的解决方案。

用户购买的计算机已经预装了高性能计算系统和软件。

打开电脑后,只需简单设置即可使用Caffe。

、TensorFlow等深度学习训练(如图像和语音识别),或传统HPC应用如高精度图像渲染和科学计算。

无需自行安装驱动、配置环境,非常适合高校和科研院所。

以及IT能力相对薄弱的企业。

4、DeepStream:30路高清视频实时处理(Discovery Live实时CAE工程仿真软件演示) 另外,智东西还在NVIDIA展位上看到了几个HPC和AI相关的软件应用演示:比如Ansys以及历经4年开发的NVIDIA Discovery Live实时CAE工程仿真软件;基于星际争霸等训练的GAN网络超级视频分辨率软件。

特别值得一提的是一个叫DeepStream的软件。

它可以实时处理30路高清视频的编解码,由Nvidia创始人兼CEO黄仁勋亲自命名,被粉丝昵称为“老黄”。

目前人工智能广泛应用于安防、人脸识别、车辆识别等领域。

开发人员可以使用自己训练的深度神经网络算法来识别视频中感兴趣的行人或物体。

然而,视频数据通常以不同的编码格式存储,在输入到AI网络之前必须进行解码;而且,不同网络在GPU上的性能优化也需要用户进一步调整,最终应用(Inference)阶段的AI网络也需要用户在线部署……高级技术赖俊杰博士NVIDIA经理向智西西介绍,使用这个DeepStream SDK,用户可以快速将他的AI模型产品化。

使用时,用户只需连接训练好的模型,然后输入源视频,然后DeepStream将负责解决剩下的所有解码、性能优化、部署等方面的问题。

该软件主要由Nvidia中国团队集中开发,研发时间约为4-5个月。

NVIDIA透露,未来,NVIDIA将根据不同合作伙伴的不同需求,在当前DeepStream的基础上不断添加新的功能。