当前位置: 首页 > 科技赋能

AI芯片行业巨大震动! NVIDIA 与 ARM 联手打造数十亿颗 AI 芯片 - GTC 2018

时间:2024-05-22 14:39:16 科技赋能

文章 |莉娜智东西3月27日自美国圣何塞报道,今天上午,NVIDIA GTC年会最重要的部分——创始人&CEO黄仁勋的主题演讲——正式开始。

智东西在圣何塞McEnery会议中心前排报道~每年的GTC大会上,这位被粉丝亲切地称为“老黄”的黑皮爱好者CEO都会发表重大主题演讲,通常会来到据称,不仅会发布新的GPU和超级计算机,还将公布AI/VR/自动驾??驶等领域的一些重大合作。

不过,今年的GTC却相当神奇。

最重要的消息是在新闻稿中而不是在 GTC Keynote 上发布的——英伟达宣布将联手芯片巨头 ARM,打造用于物联网设备的 AI 芯片专用 IP。

该机器学习IP集成到Arm的Project Trillium平台中以实现机器学习,其技术源自Nvidia的Xavier芯片和去年开源的DLA深度学习加速器项目。

ARM是全球最大的智能设备主流芯片架构提供商。

全球90%以上的智能设备均采用ARM的芯片架构,包括手机、平板电脑、手表、电视、无人机等。

此次ARM携手英伟达推出物联网设备专用人工智能IP,将助力物联网设备的发展。

人工智能在终端设备中的广泛普及,使得数亿甚至数十亿的物联网设备能够使用低功耗、低成本的AI芯片,使物联网芯片企业能够轻松地将AI融入到自己的设计中,帮助他们将智能、实惠的产品带入人们的生活。

全球数十亿消费者。

NVIDIA 副总裁兼自主机器事业部总经理 Deepu Talla 表示:“推理将成为每个物联网设备的核心能力。

我们将与 ARM 一起推动这一趋势,帮助数百家芯片公司轻松采用深度学习技术。

”此外,在今天的 GTC 上,黄仁勋还公布了 NVIDIA 的以下进展: 1、推出光线追踪 RTX 技术(ray-tracing),可提供电影品质的实时渲染,渲染逼真的反射、折射和阴影画面。

NVIDIA 在最近的 GDC 全球游戏开发者大会上展示了这项技术; 2.推出首款采用Volta架构的Quadro GVGPU,由两个GV连接而成; 3.推出第一台医疗器械专用图像处理超级计算机Clara; 4、新款特斯拉V内存升级至32G,可与老版本无缝互换,支持更多人工智能工作负载; 5. DGX-2超级计算机已推出,使用最新的NVSwitch链路。

最多可同时连接16个Tesla VGPU,其速度可达DGX-1的10倍。

经计算,每秒可下载0部电影,售价39.9万美元; 6.推出新版本机器学习应用平台TensorRT 4,支持INT8和FP16精度,并与Google合作将其集成到AI开源框架Google TensorFlow 1.7中; 7、宣布打造下一代自动驾驶芯片,名为DRIVE Orin,但除了名称外没有透露更多信息; 8、正式推出NVIDIA在CES上展示的3D模拟自动驾驶测试平台DRIVE Con??stellation,可以帮助自动驾驶系统提升“姿势水平”; 9、推出ISAAC机器人仿真训练平台SDK,打通训练机器人技术;值得一提的是,智东西去年5月也对GTC进行了深度报道。

去年CEO主题演讲开场前,英伟达股价飙升至1亿美元,总市值达到1亿美元。

今年开年的前一天晚上,英伟达的股价就已经达到了1美元,总市值超过1亿美元。

在这10个月里,NVIDIA的股价和市值再次翻倍。

1、光线追踪技术开场 今天一早,智熙熙就抵达了GTC大会,准备参加一年一度的GTC最重要的环节——CEO黄仁勋的主题演讲。

当时是早上8点,距离9点开门整整一个小时,但门口已经排起了长龙。

如今,老黄依然穿着千百年不变的黑色皮衣和黑色裤子开场。

他一开始介绍的第一个项目就是NVIDIA不久前在GDC上发布的NVIDIA RTX光线追踪技术(ray-tracing)。

这项技术花了 NVIDIA 10 年时间打造,可以提供电影品质图像的实时渲染。

渲染与现实世界的照片或视频几乎无法区分的真实反射、折射和阴影。

现场展示的视频片段是利用光线追踪技术实时渲染的,不需要超强的超级计算机,只需要一台DGX-Station。

在现实世界中,我们看到的 3D 物体由光源照亮,光子在到达观看者的眼睛之前可以从一个物体反射到另一个物体。

反过来,光线追踪技术通过追踪从我们的眼睛(观看摄像机)返回的光线、追踪光线到 2D 观看表面上每个像素的路径并将其应用到场景的 3D 模型来捕获这些效果。

可以想象,这项技术的计算量非常大,渲染复杂的特效可能需要数天甚至数周的时间,因此这项技术此前仅限于高成本的电影制作。

不过目前,随着GPU性能越来越强大,越来越多的电脑可以支持光线追踪。

通过Volta架构GPU和NVIDIA的RTX技术,产品设计师、游戏设计师和建筑师可以生成逼真的产品模型。

此外,Nvidia还宣布GameWorks SDK将添加光线追踪降噪模块。

GameWorks SDK 的更新版本即将推出,包括光线追踪区域阴影和光线追踪光泽反射。

2、新版Quadro GV首次采用Volta架构。

同时,NVIDIA还在现场推出了Quadro GV GPU。

它也是同系列中首款采用Volta架构的产品,因此可以搭载RTX技术。

Quadro GV 由两个 GV 连接而成,共有 0 个 CUDA 核心,最多 TFLOPS Tensor Cores。

与此同时,老黄再次打出了“买GPU省钱”的梗——“买的越多,省的越多。

”,这个梗再次贯穿了整个现场。

3.推出医疗专用超级计算机Clara,每日diss摩尔定律。

然后,话锋一转,老黄开始谈论计算能力。

我们还进入了GTC的一个重要部分——diss摩尔定律。

在GTC的10年里,黄每年都会提到同一个话题——摩尔定律。

过去30年,我们受益于摩尔定律,芯片提供的计算能力每年都在快速增长。

然而,近年来,摩尔定律开始失效,芯片发展的速度跟不上我们所需计算能力的增长。

因此,我们需要新的法律。

随着数据量和计算量的爆发式增长,人工智能、GPU、CUDA正在以极快的速度崛起。

GPU驱动的人工智能计算随处可见,已经渗透到包括教育在内的各行各业。

、娱乐、工业、制造业……这也引出了我们的下一个话题——医疗。

老黄推出了第一台专用于医学图像处理的超级计算机Clara,可以支持CUDA、CUDNN、TensorRT、OGL以及刚才提到的RTX技术。

现场,黄老师展示了一段医学图像实时处理的片段。

这张图像是使用已有十多年历史的超声波设备拍摄的。

最初只能看到二维黑白图像。

然而,当数据传输到 Clara 时,并通过人工智能软件,可以从 2D 图像中分析 3D 腔体形状(图中红色部分)。

因此,医院可以将这台计算机直接插入现有的医疗设备中。

目前,NVIDIA正在与多家医疗厂商合作。

除了GE通用电气、三星电子等大厂外,还有Tuma Deep Dimension、Infer Technology等AI医疗初创公司。

4、新产品升级:新版Tesla V、DGX-2超级计算机、TensorRT 4、去年的GTC上,老黄发布了新版GPU,名为Tesla V,采用Volta架构,台积电12nm Finfet工艺。

它拥有CUDA处理核心和16GB内存,可为训练和推理应用提供张量TFLOPS计算能力。

今天,老黄宣布,新版特斯拉V将内存翻倍,达到32GB。

近年来,CNN、RNN、GAN、Deep Q-Learning等算法不断变得更加复杂,对深度学习计算硬件提出了新的挑战。

因此,新版本的 Tesla V 拥有更大的内存,使其能够运行更大、更复杂的神经网络,并且在一些 HPC 应用中可以提供比之前 16GB 版本高 50% 的性能。

微软宣布采用新版本的 Tesla V,可以更快地训练更强大的深度神经网络。

此外,NVIDIA此次还推出了NVSwitch高速互联技术。

NVIDIA此前推出了NVLink,支持最多8个GPU的高速互连;现在NVSwitch技术可以将这个数字加倍,支持多达16个GPU的同时互连。

每个 GPU 都可以以超低延迟与另一个 GPU 通信。

在去年的 GTC 上,Nvidia 推出了搭载 8 个 Tesla V 的超级计算机 DGX-1。

今天在 GTC 上,黄仁勋宣布推出超级计算机 DGX-2,可搭载 16 台新特斯拉 V,速度比 DGX-1 更快。

10倍。

DGX-2 可以执行 2 PFLOPS 的计算,可以计算出每秒下载 0 部电影。

它具有GB HBM2,功耗为10kw,lbs。

它可以支持更大的数据集和更复杂的神经网络的计算。

售价为 00 美元,将于今年第三季度上市。

它配备了老黄所说的“世界上最大的GPU”,共有0个CUDA核心,高达TFLOPS Tensor Cores,GB HBM2。

另外,在去年的GTC上,NVIDIA推出了“NVIDIA GPU Cloud”,但它并不是云计算的“云”,而是一个可以让人们轻松从头开始构建深度学习项目的项目。

今天老黄宣布AWS、阿里云、DGX、GCP、Oracle云已经开始支持NVIDIA GPU云。

而且,从CNN到LSTM再到GAN,当前的深度学习神经网络框架变得越来越复杂、更加多样化、日新月异。

训练环节变得复杂,应用(Inference)环节就自然了。

它也变得非常复杂。

因此,老黄还推出了TensorRT的最新版本——TensorRT 4,它是一个可编程应用平台(Programmable Inference Platform)。

训练完神经网络后,您可以使用 TensorRT 可编程平台。

快速轻松地将经过训练的神经网络部署到 NVIDIA GPU。

新版本的TensorRT 4可支持INT8和FP16精度运算,可降低数据中心功耗70%。

而且,NVIDIA还与谷歌进行了深度合作,将TensorRT集成到当今应用最广泛的AI开源框架Google TensorFlow 1.7中。

现在它还可以加速图像、视频、语言、NLP 等 AI 应用。

与此同时,老黄还现场宣布KUBERNETES现在可以支持GPU了。

KUBERNETES可以在主机集群之间提供一个可自动部署、可扩展、可运行应用程序容器的平台。

它通常与docker容器工具配合使用,集成多个运行docker容器的主机集群,不仅可以提供更大的计算能力,还可以拥有更大的容错空间。

5、打造下一代DRIVE Orin自动驾驶芯片。

老黄还在现场演示了NVIDIA感知基础设施项目。

这是一个大规模的深度学习模型,可以收集和分析不同传感器(如摄像头、雷达等)的结果,可以输出不同的数据,如距离、天气、雷达感知、高精度地图等。

未来2-3年内,NVIDIA还将开发这项技术,直到可以安装在所有新车上。

老黄说,这是我们迄今为止遇到的最复杂的问题之一。

现场,老黄还演示了NVIDIA DRIVE的发展路径。

它们都基于相同的框架,满足ADSL-D的安全标准,并且具有非常高的性能/功耗比:从DRIVE PX Parker,到DRIVE PX 2,再到DRIVE Xavier,再到DRIVE Pegasus。

..黄表示,虽然DRIVE Pegasus已经很强大了,Nvidia也会打造下一代芯片,名为DRIVE Orin,但现场没有透露更多信息。

6、推出自动驾驶仿真测试平台DRIVE Con??stellation。

在今年1月的CES上,老黄展示了全新的3D自动驾驶模拟测试平台。

今天,老黄正式推出了这款名为DRIVE SIM和Constellation的3D自动驾驶模拟测试平台。

该平台由两部分组成。

第一部分在云端模拟照片级真实感图像并生成传感器数据(包括摄像头、雷达等)。

第二部分包括将这些数据传输到 NVIDIA DRIVE Pegasus 并运行全套自动驾驶软件。

帮助训练自动驾驶系统,提高其“姿势水平”。

在实际演示中,NVIDIA的新模拟平台显得非常强大。

它不仅提供传统的实时车辆线规划和其他车辆识别,而且还相当逼真地还原环境,还可以模拟复杂的光照条件。

测试人员还可以操纵和更改平台内车辆传感器的检测范围。

此外,该平台还支持开发者在虚拟环境中“真人驾驶”汽车,执行各种危险动作来测试测试车,测试测试车的算法。

会上,老黄还宣布,英伟达自动驾驶合作伙伴数量现已达到2万家,其中包括整车厂、一级供应商、+3初创企业。

与自动驾驶模拟测试平台类似,NVIDIA去年也推出了专门针对机器人的模拟测试平台——ISAAC机器人训练模拟世界。

你可以利用这个虚拟世界来训练机器人前进、后退、转弯、躲避行人等。

今天,老黄宣布将开放ISAAC平台的技术,推出ISAAC SDK。

此外,英伟达此前还推出了VR多人交互平台Holodeck。

在今天的GTC上,NVIDIA还展示了一个非常有趣且非常“黑科技”的DEMO:在Holodeck虚拟世界中远程控制现实世界中的一辆汽车。

(看过《黑豹》的同学大概能看懂) 7、携手ARM打造物联网芯片机器学习IP。

如上所述,今年的GTC相当神奇。

最重要的消息是在新闻稿中发布的,而不是在 GTC Keynote 现场——NVIDIA 宣布将联手芯片巨头 ARM,打造 AI 芯片专用 IP。

该 IP 是 ARM 在 2 月份宣布的 Trillium 项目的一部分。

其技术源自NVIDIA的Xavier芯片和去年开源的DLA深度学习加速器项目。

NVIDIA此次宣布将与AEM合作,在数十亿物联网设备上实现深度学习。

NVIDIA深度学习加速器IP将集成到Arm的Project Trillium平台中,以促进深度学习物联网芯片的构建。

去年,NVIDIA还正式免费开源完整版DLA(深度学习加速器),允许制造商免费下载并使用它来创建自己的低功耗AI芯片(例如物联网芯片)。

今年2月,芯片巨头ARM宣布了其人工智能项目Trillium,同时还推出了两个专用IP,分别是物体检测OD处理器和机器学习ML处理器。

ARM是全球最大的智能设备主流芯片架构提供商。

全球90%以上的智能设备均采用ARM的芯片架构,包括手机、平板电脑、手表、电视、无人机等。

英伟达作为全球AI浪潮的引领者,能为人工智能提供强大的算力,两人一拍即合。

此次ARM携手NVIDIA推出物联网设备专用人工智能IP,将有助于人工智能在终端设备中的广泛普及,使数亿甚至数十亿的物联网设备能够使用低功耗、低成本人工智能芯片使物联网芯片公司能够轻松地将人工智能集成到其设计中,并帮助他们为全球数十亿消费者带来智能且价格实惠的产品。

NVIDIA 副总裁兼自主机器事业部总经理 Deepu Talla 表示:“推理将成为每个物联网设备的核心能力。

我们将与 ARM 一起推动这一趋势,帮助数百家芯片公司轻松采用深度学习技术。

”结论:更多精彩敬请期待。

今年,GTC展位吸引了超过100人。

值得一提的是,NVIDIA也在推动女性在科技行业的力量。

今年,女性占 GTC 开发者总数的 8%、参与者总数的 10%、演讲者的 11%。

一年一度的GTC上,除了NVIDIA主要业务负责人之间的沟通会议以及各种规模的开发者或技术专家的主题演讲之外,NVIDIA的合作伙伴公司还为开发者设置了展位。

走访并与媒体交流。