文字|莫颖介绍:过去六个月,人工智能发展重心逐渐从云端转向终端,伴随着人工智能芯片产业的整体崛起。
时隔数月,智东西首次报道了人工智能芯片全产业链的近百家核心企业,涵盖国内外主要巨头企业、新兴初创企业、场景应用、代工生产等,为您提供全面、全面的人工智能芯片行业资讯。
深度剖析AI芯片行业。
对发展、创新和创业进行跟踪和报告。
这是智能AI芯片行业系列报告之一。
华为这个周末做了大大小小的事情——发布了“全球首款手机AI芯片”麒麟——科技媒体的编辑们辛苦了。
周六晚上,他们要么飞往德国跑步,要么玩电脑。
前蹲直播,连日期都要改期,气死了。
咳咳,咱们言归正传吧。
(华为官方推特介绍,“全球首款搭载NPU的AI芯片”)为了抢到这个“全球第一”,华为确实花了很大功夫。
作为一家以“自研”为荣的公司,这次麒麟不仅使用了另一家公司(寒武纪)的神经网络处理单元(NPU),智喜喜还独家了解到,麒麟针对物体识别的整套嵌入式AI解决方案(来自算法+Camera Tuning)来自中科创达。
此外,据业内人士透露,麒麟上实现的寒武纪AI架构并不全部是华为海思自研技术。
建造这个芯片花了几个月的时间?仅仅增加一个NPU模块就能称为“AI芯片”吗?华为为何如此急于求“第一”?联发科、深科技等业内人士如何看待麒麟? ……以上问题都将由智动智一一解答。
1、参数轰炸 麒麟的参数想必大家都看了一遍又一遍,但为了文章的完整性,这里必须列出一栏数据。
看过的读者可以直接跳过这一段:众所周知,目前90%的手机芯片都采用ARM架构,麒麟也不例外。
麒麟采用ARM Cortex-A73四核+Cortex-A53四核架构,采用台积电10nm制造工艺,配备12核高效GPU、8核高性能CPU、4.5G高速LTE Modem,支持LTE CAT.18,具有最高的下载速度。
速度可达1.2Gbps,相当于高通目前发布的最强X20 LTE基带。
特别值得一提的是,麒麟的GPU采用了ARM最新的Mali-G72 MP12架构——这是Mali-G72 MP12 GPU的首次商用。
这个架构非常强大。
与上一代Mali-G71相比,性能提升40%,能效提升25%。
但如果抛开数据,一个小细节可以帮助你更直观地理解:智动智和一位手机红人聊天时,他只是对着NPU和10nm点头微笑。
只是当看到MP12 GPU的时候小迪才感到惊讶。
同时,麒麟拥有两颗处理图像信息的ISP,可以更快速地响应图像处理,并优化弱光环境下的降噪。
Thunderstar提供的智能相机技术将自动识别镜头中的物体(例如静止的花朵或奔跑的人),系统将根据物体的属性调整相机参数或主动消除模糊。
麒麟将搭载于10月16日在慕尼黑发布的华为Mate 10手机上。
2.寒武纪?这是何方神圣?既然我们一直在说“寒武纪”NPU,那么这个寒武纪到底是谁呢?寒武纪是中国科学院计算技术研究所孵化的人工智能芯片初创公司。
中科院计算技术研究所不仅为寒武纪提供了天使轮融资,还提供了长期的支持和投资。
8月底,寒武纪宣布完成1亿美元A轮融资,投资方包括国投创投、阿里巴巴、联想等,成为国内AI芯片领域当之无愧的独角兽。
不仅如此,寒武纪的两位创始人也非常神奇——一对来自中科院的兄弟。
哥哥陈云吉目前仍在中科院计算技术研究所担任研究员,从事基础技术研发,弟弟陈天石则担任公司CEO。
(陈天石兄、陈云吉兄)然而,长期以来,寒武纪公司一直被业界称为“研究型”企业。
说白了,就是没有产品。
直到去年4月的世界互联网大会上,其才宣布旗下首款AI芯片产品寒武纪1A流片。
这一点不断得到认可,新闻联播、人民日报都提到过;但之后它的产品怎么样了呢?是否已商用或量产,官方尚未表态。
据寒武纪CEO陈天石年底表示,“芯片从研发、量产到商用的过程是一个年循环,所以明年大家就能够看到采用寒武纪技术的芯片产品”市场上,比如在手机、安防监控等智能终端和云服务器方面。
”(寒武纪主板)不过,据中科院计算技术研究所发来的贺信,麒麟。
芯片上的NPU集成寒武纪1A处理器作为其核心人工智能处理单元,实现手机本地、实时、高效的智能处理。
这也是寒武纪1A的一次真实的产品应用。
不过话虽如此,恐怕也只有华为这样级别的公司才能真正将寒武纪1A商业化。
从这一点来看,寒武纪是有好处的。
3.“AI芯片”到底是什么?如上所述,麒麟敢于称自己为“AI芯片”,主要原因是它集成了寒武纪的NPU(Neural-NetworkProcessingUnit,神经网络处理器)。
现在所谓的手机处理器,比如高通的、苹果的A11、麒麟等,实际上是指封装在一起的一个“处理器包”。
这种计算包在技术上称为Soc(System-on-a-Chip),更复杂的术语是“计算平台”;根据分工的不同,增加了许多具有特殊功能的处理单元。
比如说我们最熟悉的就是GPU。
现在这个封装中的独立单元数量越来越多,比如ISP(图像处理)、Modem(通信模块)、DSP(数字信号处理)等,不同的数据进来并由计算模块进行处理不同的专业。
这款NPU是手机处理器平台新增的擅长神经网络计算的单元。
那么哪些应用会用到神经网络计算呢? ?就是一些最能代表人工智能计算的应用,比如模式识别中的语音和图像(人脸)识别,比如其他使用深度学习的AI应用,为了让这个深度神经元网络连接的速度更快。
“寒武纪1A”还设计了与通用处理器完全不同的专门存储结构和指令集。
“它每秒可以处理1亿个神经元和超过2万亿个突触,而且功能非常强大,功耗仅为原来的1/10。
有时,有些计算单元是分离出来的,没有封装在SoC中。
对于例如,如果你看苹果iPhone的主板结构,它的Modem模块一直是独立于其A系列处理器模块的,之前无极的NPU单元也是独立的处理器单元,但这次被集成封装到了汉中。
Kirin的SoC(华为海思麒麟架构)(高通架构和华为海思架构)虽然可以使用CPU、GPU、DSP进行计算,但是NPU是专门用于神经网络架构计算的,据说速度快了25倍。
比CPU效率会提升50倍,有点类似你要剪东西我就给你一把剪刀,至于为什么要用寒武纪的NPU呢?国内能生产AI芯片的公司屈指可数,而寒武纪又是中科院出身,自然与华为合作。
他表示,计算技术研究所今年以来与华为合作,成立了“中国科学院计算技术研究所-华为联合实验室”。
不过,并没有说目前其他芯片的CPU+GPU+DSP架构在人工智能应用中效果并不那么好。
相反,现在很多手机厂商都在这个架构上优化AI功能。
从高通Snapdragon到联发科Helio,都针对人工智能芯片应用进行了大力优化。
例如,高通在Snapdragon及系列芯片上构建了软件神经处理引擎,并且高通还承诺未来将发布专门为神经网络运算设计的核心——例如NPU。
所以,这个NPU很重要,但也没有那么重要。
以深度学习为例。
深度学习分为两部分:训练和推理/应用。
训练阶段确实需要非常高的计算能力,但在应用层面实际上并不需要大量的计算——我相信不需要。
哪个无辜的用户用手机来做训练?另一方面,是否AI,最终还是取决于应用……整个移动AI应用生态都需要发展起来,才能体现硬件的优势。
作为手机芯片厂商,联发科一位产品技术总监也认为,在芯片上集成硬件相对容易,关键在于上层应用。
用户不会关心这是否是AI,而只关心体验。
虽然华为展示了三个常见的应用方向(AR、计算机视觉和自然语言处理),但也通过开发者网页、开发者工具包和应用商店来招募开发者。
华为消费者业务CEO余承东也出席了发布会。
现场承诺,华为将打造开放的AI环境,开发者可以直接接入华为NPU功能,也可以通过第三方AI框架(目前支持TensorFlow和Caffe)接入。
但目前,移动AI应用开发仍然很少。
华为现场展示的AI功能也集中在降噪、照片美化等方面,速度快,速度快,没??有鸡蛋。
在没有应用的情况下,麒麟、骁龙,甚至性能较弱的芯片都会让用户感觉差不多。
4、我们为这个“世界第一”付出了努力。
不知道你是否还记得。
去年12月16日,华为手机品牌荣耀推出了今年最后一款旗舰手机——荣耀Magic。
荣耀总裁赵明在谈到这款荣耀三周年特别新品时,并未提及硬件配置。
他只谈到了这款手机的八曲面造型设计以及华为实验室历时4年研发的人工智能引擎Magic。
居住。
除了实验室外,华为还拥有诺亚方舟实验室、高斯实验室、香农实验室。
华为并未透露麒麟此次使用的人工智能技术是否来自这些实验室,但从目前来看,主要来自于这些实验室。
该部门正在进行研究和开发。
不过,仅就深度学习而言,华为的技术并不算领先。
这也是为什么华为海思虽然很想研发自己的“AI芯片”,但为了及时抢到“全球第一”的称号,最终还是选择了与寒武纪、雷星合作。
一位业内人士对此评价道:“从仓促决定签订IP核合同,到与Mate 10分离,又赶在苹果之前发布这款芯片,感觉上架有点仓促。
”那么华为“真的有必要这么着急抢全球第一的位置吗?真的。
据传闻,麒麟项目历时约4-5个月,包括寒武纪和创达的技术整合,以及从流片速度来说,确实很快,一方面体现了华为的干脆果断的行为,另一方面也证明了这个“世界第一”确实是着急。
据了解,台积电下半年的生产线上有超过30个“AI芯片”代工时间表,虽然不是全部采用手机芯片,但可以看出,这确实是一个趋势,这个趋势也已经出现。
智东西与业内人士交流中深有感触 5、行业声音:AI芯片是趋势 作为手机芯片厂商,联发科的产品技术总监告诉智东西,“AI芯片”确实是当前的行业趋势之一。
随着手机的差异化越来越小,假以时日,NPU将成为“人人必备”的东西。
从此前智东西与荣耀负责人赵明的对话中也可以感受到,互联网手机的竞争正在从之前的线上营销、线上销售转向更多的技术竞争。
后互联网手机时代,人工智能正在成为核心竞争点之一。
从深度学习芯片的角度来看,与寒武纪类似,国内还有另一家主打“AI芯片”的明星初创公司——深鉴科技——尽管说他们做“AI芯片”并不严格正确。
是一款用于深度学习推理应用(Inference)的FPGA板(详情可参考之前智动西深度访谈《成立一年估值超10亿 与谷歌飙技术 这位90后CEO如何做到?》)。
深鉴科技创始人兼CEO姚松认为,不仅是手机芯片,整个半导体行业都会受到AI的冲击。
随着深度学习的兴起,不同的公司有不同的性能优先级。
一家语音公司使用与另一家安全摄像头公司不同的芯片。
例如,对于语音识别用户来说,他们更关注延迟而不是简单地提高吞吐量。
未来处理器的架构分类将面向应用。
结语:我们距离AI芯片还有多远?目前,华为通过将NPU与麒麟手机芯片架构集成,抢占了“AI芯片”的高位,无论是噱头还是美名;但仍有很多问题值得我们关注: 1、采用NPU神经网络计算单元的麒麟能有多有效?会给手机体验带来哪些改变?这是“随机的事情”吗?华为Mate 10发布后,我们还要拭目以待。
2、麒麟的玩法是真正的“AI芯片”套路吗?高通、三星或苹果的处理器SoC是否也会采用这种方式,在手机芯片SoC中添加类似NPU的计算模块? 3、麒麟能否代表华为在人工智能方面的积累?如果是的话,NPU 等处理单元也应该处理吗?苹果、三星和高通会自己做这一切还是采用专门从事该领域的第三代处理器IP解决方案?这是AI芯片产业未来发展模式的明确路径。
但总的来说,麒麟的出现让AI开始从软到硬在手机上落地,是人工智能进一步产业化的典型代表。