当前位置: 首页 > 科技赋能

对话英特尔AI事业部副总裁!携手百度,推动AI在三大领域落地

时间:2024-05-22 13:33:22 科技赋能

Zhidxcom(公众号:zhidxcom) 正文 |芯源智滴讯7月17日讯,在近日举行的百度AI开发者大会(Baidu Create)上,英特尔人工智能业务部副总裁、人工智能架构总经理Gadi Singer发表演讲,并披露了一系列深入的内容。

与百度的合作,包括对PaddlePaddle深度学习框架的至强处理器优化、FPGA赋能百度工作负载加速即服务,以及Movidius视觉处理器(VPU)支持百度Xeye智能摄像头。

会后,加迪·辛格接受了国内多家媒体的专访,就英特尔与百度的合作细节、英特尔在人工智能领域的前瞻性战略布局、人工智能发展面临的挑战等进行了深入交流。

,以及如何把AI芯片做好。

加迪·辛格表示,英特尔将围绕硬件、软件和生态系统,对AI展开全面布局。

▲英特尔人工智能事业部副总裁兼人工智能架构总经理Gadi Singer。

1、与百度长期合作,推动人工智能在三个领域的落地。

百度与英特尔的合作已有十多年的历史。

加迪·辛格表示,五年前,他们的合作迈出了一大步。

两家公司建立移动互联网战略联盟,共同打造智能云手机生态系统。

两年前,双方在人工智能领域合作更加紧密。

Gadi Singer 重点介绍了与百度合作的三个项目:优化 PaddlePaddle 深度学习框架的 Xeon 处理器、FPGA 加速工作负载以及为 Xeye 智能相机提供支持的 Movidius 处理器。

最后,Gadi Singer特别介绍了Intel针对神经网络模型的开源nGragh编译器。

1、至强处理器优化 百度PaddlePaddle平台深度学习平台 PaddlePaddle是百度今年8月底开源的并行分布式全功能深度学习框架,可以让开发者和企业安全高效地满足图像识别、图像分类、机器翻译等需求而自动驾驶等多个领域的AI技术需求。

百度AI开发者大会发布PaddlePaddle 3.0版本。

PaddlePaddle在英特尔至强可扩展处理器上的性能优化进一步提升了AI应用的运行效率。

开发者和数据科学家可以利用支持全球数据中心和云计算的硬件来不断改进人工智能算法。

Intel对PaddlePaddle的优化涵盖了计算、内存、架构、通信等不同层面,比如通过AVX Intrinsics函数、BLAS库(如MKL、OpenBLAS)或定制的CPU函数来优化数字运算的效率,并优化效率通过 MKL-DNN(用于深度神经网络)进行数字操作。

用于网络的英特尔数学核心函数库)优化了卷积神经网络 (CNN)。

Gadi Singer表示,优化AI框架有两个非常重要的方法:第一,为框架选择合适的库和函数;第二,为框架选择合适的库和函数。

其次,分析每个AI工作负载,对其进行适当的训练,以达到更好的效果。

良好的结果。

2、FPGA加速百度工作负载 FPGA是指现场可编程门阵列。

2016年,英特尔以1亿美元收购FPGA巨头Altera,为未来算力发展趋势奠定了基础。

百度目前在其开发的异构计算平台上部署了最新的FPGA技术。

该技术的应用在定制和配置方面更加灵活,能够为要求苛刻的工作负载提供更高的性能和能源效率,并开发低延迟应用程序。

据Gadi Singer介绍,FPGA已经经过多家公司的验证,可以提供更高的带宽和更低的延迟,同时支持大数据传输工作负载。

对于人工智能应用来说,这是一个非常强大的选择。

FPGA在百度云上实现工作负载加速即服务,可以为百度的异构计算环境提供更多样化的选择。

3. Movidius VPU为百度的Xeye智能相机提供支持。

2017年,英特尔收购了视觉处理初创公司Movidius。

今年7月,英特尔推出了被誉为“PC鸡血神器”的Movidius神经计算棒U盘产品,为机器深度学习提供了大“血包”。

▲使用Movidius神经计算棒进行车辆识别。

Movidius处理器广泛应用于安防监控摄像头和无人机。

它有专用的计算机视觉引擎和一般推理和演绎的引擎。

当两者结合时,可以更好地实现计算机视觉和设备端演绎推理,为计算与AI融合的终端设备提供非常有吸引力的解决方案。

Movidius开发的视觉处理单元(VPU)有两大优点:一是直接在本地相机上运行神经网络,缩短延迟时间,节省带宽和成本;二是直接在本地相机上运行神经网络,缩短延迟时间,节省带宽和成本;其次,它采用前端算法来降低能耗,实现长时间的电池寿命。

百度Xeye摄像头采用英特尔Movidius Myriad 2视觉处理单元(Movidius Myriad 2 VPU),为机器学习算法提供较低功耗的推理引擎,让摄像头能够分析物体和手势并识别人体,从而为零售行业用户提供具有个性化的购物体验。

▲基于运行 GoogleNet V1 网络的 Movidius? Myriad X VPU 进行推理 ▲Movidius 芯片组和 Movidius Myriad 优化运算,为零售行业提供高性能、低功耗的视觉智能。

4. nGraph编译器连接到PaddlePaddle平台。

最后,Gadi Singer特别介绍了nGragh。

nGraph是Intel于今年3月开源的一款面向各种设备和框架的深度神经网络(DNN)模型编译器,可以连接多种深度学习框架。

nGraph的所有输出结果最终都可以在CPU、Movidius、FPGA和未来的Neon上运行。

百度和英特尔已将 PaddlePaddle 与英特尔 nGraph 编译器集成。

在它的支持下,数据科学家可以专注于数据科学研究和开发,而不必担心如何将DNN模型部署到各种硬件平台上进行高效的训练和运行。

2、三点战略布局抢占AI市场。

智能手机时代,英特尔遇到了困难。

进入移动芯片行业较晚的英特尔,在智能手机应用处理器领域长期举步维艰。

AI是继移动互联网之后的下一个时代,英特尔也开始在AI领域重磅布局。

根据Gadi Singer的判断,在下一次大技术浪潮之前,将会出现几次小规模的AI技术浪潮。

机器学习改变了整个计算世界,使人们能够在更短的时间内处理更多的数据。

过去六年只是人工智能发展的开始。

现阶段大部分技术突破都发生在深度学习领域,需要不断学习和提升。

学习技术也在迅速发展。

他认为,从宏观层面来看,机器学习正在与新的深度学习技术相结合。

深度学习现在可以执行对象识别、分类和异常检测,例如识别人体细胞的三维图并确定恶性细胞。

这些任务需要复杂的认知能力。

未来随着人工智能的进一步发展,更高认知能力的平台将是了解人类世界并拥有与人类相同的体验。

因此,在智能家居、智能汽车、照顾老人的机器人等方面,机器需要更好地理解人类的对话和请求。

要实现这样的目标,深度学习和机器学习能力都很重要。

面对日益火爆的AI市场,Gadi Singer将英特尔的AI战略发展分为硬件、软件和生态系统三个部分。

1、硬件至强处理器是通用处理器,是AI的基础。

Gadi Singer 表示,大多数 AI 演绎推理都在 Xeon 处理器上运行。

英特尔不断丰富至强指令集,以加速人工智能工作负载并更好地利用软件堆栈。

除了通用芯片之外,英特尔还有一些专用芯片产品。

不仅在功耗方面实现了从几十毫瓦到瓦级的全面覆盖,而且覆盖了从终端设备边缘到数据中心的不同计算环境。

英特尔认为,没有万能的灵丹妙药,不可能说一种产品可以满足不同的使用场景。

因此,英特尔在硬件产品方面提供了多元化的产品线。

2.软件 在软件策略部分,Intel针对不同的硬件提供了优化的堆栈。

无论是数据科学家还是程序员,英特尔都为每个客户提供一致的数据体验。

例如,英特尔今年3月开源的nGraph编译器不仅可以连接所有英特尔硬件产品,还可以连接PaddlePaddle、Tensorflow、caffe、MXnet等其他深度学习框架。

这对用户来说是一种简化且易于使用的体验。

3.生态系统 英特尔在整个AI生态系统中提供支持。

加迪·辛格 (Gadi Singer) 认为,生态系统对于涉及计算的每个领域都很重要。

在他亲眼目睹的技术变革史上,人工智能的发展和变革速度是前所未有的。

新技术的出现和广泛使用可能只需要18-24个月。

因此,英特尔非常重视与AI领域的学术界和思想领袖保持密切联系。

英特尔在拥有自己的研究院和实验室的同时,也与多所顶尖大学合作,与其进行联合研究或提供资源支持。

此外,为了更好地参与开源社区,Intel还将开源包括nGraph在内的一些技术。

Gadi Singer表示,英特尔还积极参与标准化组织。

例如,去年英特尔宣布支持微软和Facebook联合发布的开放神经网络交换(ONNX)格式。

这种格式用于表示深度学习模型的标准,并促进模型在不同框架之间的迁移。

迁移。

这是迈向开放生态的重要一步,将有助于行业共享优秀技术。

Gadi Singer还强调,英特尔重视与行业领导者的合作,完成一些概念验证并共同创建技术解决方案。

▲中间是英特尔人工智能事业部副总裁兼人工智能架构总经理Gadi Singer。

3. AI从技术到落地面临的最大挑战 当被问到从企业角度谈AI落地的最大挑战时,Gadi Singer谈到了一个具体的例子,那就是近年来非常流行的深度学习模型——生成式对抗网络(GAN)。

GAN的概念于2000年提出,到2008年已经得到广泛应用。

2016年,GAN已经发展到第三代,在机器学习研究方面取得了新进展。

他们可以直接合成新的动物图像并从图像创建 3D 图形。

Gadi Singer 表示,采用这项技术有两个主要障碍。

首先,寻找真正可行、有价值的新技术,而不是一劳永逸的新技术。

尽管新的技术想法和实验层出不穷,但真正有价值的技术却并不多。

第二,大量数据。

许多新技术需要大量数据来证明价值和多功能性。

然而,对于某些类型的数据,尤其是涉及隐私的数据,可能需要很长时间才能完成数据收集。

4、做好AI芯片的关键因素 Gadi Singer认为,做好一款AI芯片产品,缺一不可的有两点。

首先,弄清楚该处理器旨在解决什么问题。

今年是加迪·辛格 (Gadi Singer) 在英特尔工作的第 35 个年头。

他曾在多个部门从事不同类型的产品工作。

由于人工智能领域变化如此之快,要解决的问题也在不断变化,解决方案本身也具有挑战性。

假设不久前有人为AlexNet和GoogleNet开发了一个完美的解决方案,但到2020年或2020年这个解决方案可能就不能称为好的解决方案了,因为会出现它无法解决的新问题。

因此,Gadi Singer认为,想要AI芯片解决方案获得成功,做好趋势判断并能够根据这个判断做出适度合理的猜测是非常重要的。

其次,AI芯片本身是由不同的部分组成的,这些不同的功能块之间必须有一个很好的平衡。

如果芯片只在某个功能块(如Tensor Multiplication)上比较完善,但整体功能不均衡,则不足以解决实际场景问题。

比如Movidius VPU和NNP主要是用来加速的,但不可能把它们做成只有加速功能的芯片。

因此,AI处理器解决方案应侧重于针对某些场景添加不同的元素来解决特定问题,但解决问题的范围不宜太窄。

结论:全栈解决方案将赢得AI时代。

万物互联时代,英特尔全面进军AI领域。

目前,英特尔已经打造了一整套全栈AI解决方案,包括Xeon处理器和Nervana神经网络处理器等硬件,FPGA、网络和存储技术等技术,以及用于深度学习和机器学习的MKL和DAAL。

用于学习的数学函数库,以及支持和优化Caffe、Neon等深度学习框架。

在推动AI性能升级和技术普及的过程中,英特尔持续与百度等企业开展深度合作。

在十多年的合作中,英特尔为百度提供了丰富的产品和服务,从智能终端设备到基于至强可扩展处理器的大规模数据中心,到使用FPGA加速工作负载,再到优化PaddlePaddle开发平台。

加速人工智能技术进步和实施的技术专长。

至于英特尔全方位的AI战略布局将如何开花结果,市场将给出最终答案。