文章| Lina介绍:过去六个月,人工智能发展重心逐渐从云端转向终端,伴随着人工智能芯片行业的整体崛起。
时隔数月,智东西首次报道了人工智能芯片全产业链的近百家核心企业,涵盖国内外主要巨头企业、新兴初创企业、场景应用、代工生产等,为您提供全面、全面的人工智能芯片行业资讯。
深度剖析AI芯片行业。
对发展、创新和创业进行跟踪和报告。
这是智能AI芯片行业系列报告之一。
就在上周的今天,苹果在刚刚竣工并投入使用的“宇宙飞船”新总部(Apple Park)举办了秋季新品发布会。
整个发布会基本被iPhone X抢走了(我想采访iPhone 8/ 8p心理阴影区)。
iPhone 8/8p和iPhone X均搭载苹果自研的A11 Bionic芯片。
虽然整个过程中苹果并没有花太多时间介绍这款芯片,但我们还是知道它配备了专门用于机器学习的硬件——“神经引擎”。
大家还记得华为月初发布的麒麟吗?麒麟被称为第一颗手机AI芯片,因为它配备了“神经网络处理单元(NPU)”。
不要小看这款A11。
通过智物仔细研究发现,它不仅是iPhone X诸多“黑科技”的来源,苹果在9年前也开始了技术布局,打造这款芯片。
1、参数揭晓:跑分成绩爆表~在介绍A11专门用于机器学习的“神经网络引擎”之前,我们先来了解一下A11的基本参数。
工艺方面,A11采用台积电10nm FinFET工艺,集成43亿个晶体管(上一代A10 Fusion采用16nm工艺,集成33亿个晶体管,华为麒麟采用10nm工艺,集成55亿个晶体管)。
A11搭载64位ARMv8-A架构6核CPU,包括2个名为“Monsoon”的性能核心和4个名为“Mistral”的高能效核心。
性能核心比上一代A10快25%,能效核心快70%。
而且,与A10不同的是,A11采用苹果自主研发的第二代全新性能控制器,允许同时使用6个CPU核心,整体性能比上一代快70%。
至于为什么分为性能核心和能效核心呢?当手机执行发送短信、浏览网页等轻量任务时,系统会选择调用能耗较低的高效率核心。
当手机需要运行对计算能力要求较高的软件时,就需要使用高效率的核心。
性能核心进行处理,从而有效延长平均电池寿命。
搭载A11的iPhone X在充满电后的待机时间将比iPhone 7长2小时。
A11的另一个亮点是首次搭载苹果自研GPU。
这是一款3核GPU,性能比A10 Fusion高出30%。
它只需要一半的功耗就可以达到A10的性能,并且针对3D和.这是今年4月苹果宣布与英国GPU设计公司Imagination Technologies“分手”后推出的首款自研GPU。
它针对AR、沉浸式3D游戏等方面进行了优化,速度比A10快30%。
A11还集成了苹果自研的ISP、自研的视频编解码器等,从各种强调“自研”的地方不难发现,苹果越来越强调架构的自主性。
在与老朋友Imagination Technologies彻底分手(并导致其股价暴跌70%)后,苹果下一个自研目标可能会转向基带技术,而与高通旷日持久的专利诉讼案可视为前兆。
。
另外,我们还可以一睹A11在Geekbench上的跑分情况:Geekbench中有多个A11的跑分,其中单核性能最高为8分,多核性能最高为8分,而这些跑分的平均值为 最后,单核性能为,多核性能为。
这是什么概念?与上一代A10的“单核性能和多核性能”相比,A11的性能在两个方面都飙升了近30%和50%。
iPad Pro中A10X的单核性能约为平均水平,而多核性能约为平均水平,仍然弱于A11。
Android阵营的种子选手高通骁龙的GeekBench成绩分别是单核和多核。
(麒麟基准分数未知) 2. A11是“人工智能芯片”。
还记得华为月初发布的麒麟吗?这款手机芯片搭载了来自寒武纪的“神经网络处理单元(NPU)”,专门用于机器学习。
麒麟也被称为“手机AI芯片”。
这次,苹果还为自家的 A11 Bionic 芯片配备了专门用于机器学习的硬件——“神经引擎”。
正如我们在《华为麒麟是不是真正的AI芯片?》文章中介绍的那样,现在所谓的手机处理器,比如高通的、苹果的A11、麒麟等,实际上是指封装在一起的一个“处理器封装”。
这个计算包更专业的叫Soc(System-on-a-Chip),是“计算平台”的高级术语;根据分工,增加了许多具有特殊功能的处理单元。
比如我们最熟悉的就是GPU,现在这个封装中独立的单元数量已经越来越多,比如ISP(图像处理)、Modem(通信模块)、DSP(数字信号)当不同的数据进来,经过不同专业的计算模块处理时,会得到更好的结果。
,能效比更高,这个神经引擎(neural engine)和麒麟的NPU一样,是手机处理器平台中新增加的一个擅长神经网络计算的硬件模块。
而这也是为什么从20nm、16nm,到现在的10nm,以及正在开发的7nm,各大芯片设计者和OEM厂商都在努力让芯片技术变得更小,为了不影响芯片的尺寸。
挤入更多独立的处理单元。
A11的神经网络引擎采用双核设计,每秒可执行高达1亿次运算,相当于0.6TFlops(寒武纪NPU为1.9??2TFlops,每秒可执行0次浮点运算),帮助加速人工智能任务,即专门针对 Face ID、Animoji 和 AR 应用的 ASIC(专用集成电路/完全定制的 AI 芯片)。
凭借神经网络引擎,苹果高级副总裁 Phil Schiller 自信地说:A11 Bionic 是智能手机迄今为止最强大、最智能的芯片。
除了实现高精度之外,与基于通用芯片(GPU、FPGA)的解决方案相比,基于 ASIC 的深度学习还可以降低功耗。
不过,苹果尚未进一步透露这款神经网络引擎的功耗和实测性能。
A11还支持Core ML,这是苹果在今年WWDC开发者大会上推出的全新机器学习框架,可以让开发者更轻松地将机器学习技术集成到他们的应用程序中。
Core ML支持所有主流神经网络,如DNN、RNN、CNN等。
开发者可以将训练好的机器学习模型封装到App中。
除了采用NPU、神经网络引擎等专用AI硬件单元外,现在不少手机厂商采用基于CPU+GPU+DSP架构的方法来优化AI功能。
例如,高通今年7月发布了Snapdragon神经处理引擎(NPE,NeuralProcessingEngine)软件开发套件SDK。
3.买买买买AI帝国。
与苹果所有其他正在进行的研究一样,苹果在人工智能方面保持了一贯的“保守秘密、保持沉默”的神秘低调风格。
但人工智能仍是一个处于发展初期的行业,行业领军人物基本都是学术专家。
这种拒绝公开研究成果、不允许发表论文、甚至不允许讨论的严格保密态度,很可能会让无数学术界(并且已经实现财务自由)的AI专家拒绝苹果的并转向更开放和免费的公司,例如谷歌和 Facebook。
因此,外界一直对苹果自主研发的人工智能技术持怀疑态度,而苹果似乎也意识到了这一点。
从去年年底开始,苹果开始允许其人工智能研究人员在苹果博客上公开发布他们的研究成果。
目前,已发表 3 篇 Siri 相关论文和 1 篇计算机视觉相关论文。
不过没人也没关系,我们有钱。
从去年开始,苹果就没有停止收购人工智能初创公司,每次都会给出惯常的说法:“苹果会时不时地收购规模较小的科技公司。
我们一般不会讨论我们的目的或计划。
”非常的意思是“事情完成后,脱掉衣服,隐藏你的功名”。
而且,每一家被苹果收购的公司都会立即关闭对外的产品和服务,然后仿佛突然从世界上消失了。
1)收购芯片厂商以芯片为例,早在2017年,苹果就以2.78亿美元收购了位于加州的高性能低功耗处理器制造商PA Semi。
随后在 2016 年,苹果以 1.21 亿美元收购了 2016 年成立的德克萨斯州半导体逻辑设计公司 Intrinsity,专注于设计晶体管更少、能耗低、性能高的处理器。
年底,苹果以1万美元收购了2010年成立的以色列闪存控制器设计公司Anobit。
2020 年 8 月 1 日,苹果收购了 Passif Semiconductor,这是一家成立于 2008 年的加州半导体公司,专门生产低功耗无线通信芯片(大胆猜测 Apple Watch 的芯片技术是否来自这里)。
次年年底,苹果再次斥资1万美元收购了位于加州圣何塞北部一座占地7万平方英尺(平方米)的芯片制造工厂。
该工厂最初由芯片制造商 Maxim Integrated Products 所有,包括芯片制造工具,位于三星半导体附近。
从以上一系列采购可以看出,苹果的芯片布局早在近十年前就开始了。
除了芯片之外,苹果今年以来还陆续收购了四十、五十家初创公司,包括语音识别、图像/人脸识别、计算机视觉、AR、数据挖掘、机器学习、地图、定位等,其中一些比较有代表性的1)收购面部识别/表情追踪厂商——Animoji和Face ID的技术来源。
2016年,苹果以1万美元收购了瑞典面部识别初创公司Polar Rose。
他们开发的面部识别程序可以自动为用户圈出照片中的面孔。
今年 11 月,苹果收购了《星球大战》背后的动作捕捉技术公司 Faceshift。
这家苏黎世初创公司开发了实时跟踪人类面部表情然后以动画形式表达的技术。
该技术还可以实现面部识别。
今年 1 月,苹果收购了加州人工智能初创公司 Emollient,该公司利用人工智能技术读取图片中的面部表情。
今年2月,苹果以1万美元收购了以色列面部识别初创公司RealFace。
该公司开发了一种独特的面部识别技术,该技术集成了人工智能,并将人类感知带回到数字化过程中。
2)收购AR引擎巨头 今年5月,苹果收购了德国AR引擎巨头Metaio。
当时,Metaio 和 Vuforia 并肩统治了 AR 引擎行业。
Metaio 拥有大约 15 万名开发人员,而 Vuforia 拥有大约 18 万名开发人员。
两家公司的SDK开发者占据了当时整个市场95%以上的份额,在AR行业的地位与Windows一样高。
就像 Mac OS 之于 PC 一样。
——可以看作是ARkit的技术来源。
3)收购一家拥有25年历史的德国眼球追踪公司。
最近的一次收购是今年6月,苹果宣布收购拥有25年历史的德国眼动追踪公司SMI。
SMI的全称是SensoMotoric Instruments。
其历史可以追溯到2016年,SMI从柏林自由大学学术医学研究所分拆出来,成立了自己的眼动追踪技术公司。
已有25年以上的发展历史。
其产品包括面向企业和研发机构的眼动追踪设备/应用以及医疗眼控。
眼控技术支持辅助设备、手机、电脑、VR设备等。
目前iPhone X中已经集成了眼动追踪技术。
使用Face ID解锁时,只要不看屏幕,屏幕就不会解锁。
屏幕。
4.它的用途:既然Face ID背后的结构光学技术是“人工智能芯片”,那当然是用于人工智能啦~人脸识别、图像识别、面部表情跟踪、语音识别、NLP、SLAM、 ETC。
。
A11神经网络引擎的第一个重要应用是iPhone X面部识别的Face ID。
虽然人脸解锁并不是一项突破性的新技术,但苹果的Face ID解锁与普通基于RGB图像的人脸识别解锁不同。
寒武纪架构研发总监刘少力博士表示,“我们对苹果A11这次的AI引擎了解不多,特别是在功耗、实测性能等方面。
苹果基本上发布会上并没有提及,我认为这次iPhone X最大的亮点就是采用了距离传感器,支持3D Face ID,这个功能在业界引起了不小的轰动。
未来为此功能而开发的“基于不同的原理和硬件实现,通过结构光发射器和红外摄像头的结合,可以捕获人脸的深度信息,比以前使用2D图像进行人脸识别要先进得多”。
目前,业界使用的3D机器视觉主要有三种类型:结构光、TOF时间光、双目立体成像。
(三大主流3D视觉解决方案代表产品)双目立体成像方案软件算法复杂,技术尚未成熟;结构光方案技术成熟、功耗低、平面信息分辨率高,但容易受光线影响,无法识别距离。
靠近; TOF方案抗干扰性好、识别距离远,但平面分辨率低、功耗高。
综合来看,结构光方案更适合消费电子产品的前置近距离摄像头,可用于人脸识别、手势识别等。
TOF方案更适合消费类电子产品的后置远距离摄像头。
消费电子产品,可用于AR和体感交互。
(“Notches”,TrueDepth 摄像头系统) iPhone 的 Face ID 红外发射器可发射 30,000 个检测点,并使用 Neural Engine 将反射的数据与 A11 芯片仓中存储的数据进行比较,实现 3D 读取和处理用户的脸。
在神经网络训练的支持下,Face ID的错误率仅为百万分之一,远低于Touch ID的五万分之一。
同时,iPhone X还具有眼球追踪功能。
当你面向屏幕但眼睛没有看屏幕时,它不会解锁。
所以,这样的人脸解锁是不能被照片欺骗的。
而且,苹果软件工程高级副总裁Craig Federighi曾表示,“当用户注册Face ID时,我们不会收集数据。
它会保留在你的设备上,不会发送到云端进行训练。
”符合苹果一贯政策“用户隐私第一”的理念。
最神奇的是,用户面部适应过程中所需的深度学习训练(化妆、戴眼镜、长胡须、随年龄变化的外貌变化等)也是在本地完成的。
深度学习分为两部分:训练和推理/应用。
训练阶段所需的计算量远大于应用阶段。
另一方面,计算和训练的本地化也有助于让Siri变得更聪明。
毕竟,很多人认为,由于苹果过于重视用户隐私,Siri 发展缓慢,竞争对手已经迎头赶上。
此外,随着A11的加入,iPhone正面“刘海”实现的面部追踪技术新的交互方式有望增加用户参与度和粘性,增加AR社交平台的经济价值。
3D视觉提供的景深信息和建模能力是现有普通相机无法比拟的。
iPhone X还配备了新的陀螺仪和加速计,刷新率为60 fps,可以实现精确的运动跟踪和良好的渲染效果。
在发布会上,苹果全球营销高级副总裁菲尔·席勒 (Phil Schiller) 表示:这是第一款真正为 AR 打造的智能手机。
发布会上,苹果还展示了几款 AR 应用示例:即时战略游戏《战争机器》(The Machines)、即时战略游戏《战锤40K:自由之刃》(战锤 40k:Free Blade)、职业棒球直播《At Bat》 ,星空注释《Skyguid》。
5、AI芯片行业火热。
目前,人工智能芯片主要分为GPU、ASIC和FPGA。
代表是NVIDIA Tesla系列GPU、Google的TPU、Xilinx的FPGA。
此外,英特尔还推出了融合核心芯片Xeon Phi,适用于包括深度学习在内的高性能计算。
但据公开资料显示,业界很少将其用于深度学习。
(AI芯片概述)其中,苹果的A11、寒武纪的A1、谷歌的TPU等都是ASIC,即专用集成电路(ASIC)。
顾名思义,ASIC是根据特定需求专门设计制造的芯片。
它可以优化芯片架构并提出有针对性的神经网络计算处理指令集。
因此,在处理特定任务时,其性能、功耗等优于CPU、GPU和FPGA;但ASIC算法框架尚未统一,因此尚未成为当前主流方案。
(寒武纪1号神经网络处理器架构)(谷歌ASIC产品探索)现有ASIC包括谷歌的TPU、中科院计算技术研究所的寒武纪,应用于大疆无人机、海康威视智能相机针对特定场景全定制AI芯片算法和特定框架,例如 Movidius Myriad 芯片和 Mobileye 芯片,已用于特斯拉汽车的自动驾驶和 ADAS 中。
此外,最近的AI芯片前景可能是类脑芯片(BPU),例如IBM的TrueNorth。
类脑芯片的目的是开发一种新的类脑计算机架构,该架构将使用忆阻器和ReRAM等新器件来提高存储密度。
目前的技术还远未成熟。
(不同的芯片在人工智能计算方面各有所长)结论:我们离手机AI芯片还有多远?随着苹果和华为的进步,专用AI处理单元可能日益成为智能手机芯片的发展趋势。
毕竟,在生物特征识别、图形图像识别、用户习惯学习等方面,对机器学习技术的依赖越来越大。
然而,不稳定的网络带宽(你还记得Prisma早期需要等待很长时间才能生成图像)、个人隐私、功耗比等问题也在推动集成专用AI处理单元的手机芯片的发展。
不过,iPhone华为Mate 10要到10月16日才会在慕尼黑发布。
使用“神经网络引擎”或“神经网络计算单元”的手机芯片能有多有效?会给手机体验带来哪些改变?是不是“天然不相容”?这些问题直到你拿到真正的手机后才会清楚。
但总的来说,A11和麒麟都是AI开始从软到硬在手机上落地的体现,是人工智能进一步产业化的典型代表。