当前位置: 首页 > 科技赋能

解密特斯拉自动驾驶芯片及其背后第一人

时间:2024-05-22 17:51:25 科技赋能

车东溪(公众号:车东溪)文|起源介绍:过去六个月,人工智能发展重心逐渐从云端转向终端,随之而来的是人工智能芯片行业的整体崛起。

时隔数月,智东西首次报道了人工智能芯片全产业链的近百家核心企业,涵盖国内外主要巨头企业、新兴初创企业、场景应用、代工生产等,为您提供全面、全面的人工智能芯片行业资讯。

深度剖析AI芯片行业。

对发展、创新和创业进行跟踪和报告。

这是智能AI芯片行业系列报告之一。

上周,智东西写了一篇文章介绍英特尔的AI芯片Nevarna;随后不久,国内地平线发布了AI芯片旭日和征途。

“AI芯片”,这个一年前还不为人知的名词,如今已经成为一片红海。

在自动驾驶领域,AI芯片其实并不新鲜。

Mobileye的EyeQ系列芯片是最早应用于自动驾驶的AI芯片之一。

本月早些时候,硅谷钢铁侠马斯克也宣布特斯拉正在开发用于自动驾驶的AI芯片。

回顾马斯克在自动驾驶芯片上的种种动作,我们发现近段时间出现了各种延误。

“不靠谱”,他其实比他看上去更了解科技发展的趋势。

马斯克让特斯拉开发自己的自动驾驶芯片的计划始于两年前。

一、从Mobileye到英伟达特斯拉的自动驾驶焦虑2016年,特斯拉转向Mobileye,利用其新一代辅助驾驶芯片EyeQ3武装自己的绝活——自动驾驶系统Autopilot。

此时此刻,EyeQ3无疑是最佳选择。

其运算性能达到Gflops(每秒千兆浮点运算),内部封装了先进的ADAS算法,广泛应用于各车厂的ADAS系统中。

(图中圆圈为EyeQ3)但对于特斯拉来说,这就是Mobileye的EyeQ3成功和失败的地方。

去年特斯拉 Model S 撞上卡车后,特斯拉和 Mobileye 开始分道扬镳。

当时普遍认为,这起事故导致了双方信任的破裂——对于特斯拉来说,Mobileye 并没有保证自动驾驶足够安全,而且 Mobileye 也很委屈,因为当时它只针对 ADAS而特斯拉车主的非法操作不仅导致了自己的死亡,还损害了 Mobileye 的声誉。

不过,虽然这起事件看似是特斯拉与Mobileye蜜月结束的导火索,但其背后的原因依然是特斯拉的算力焦虑。

马斯克曾多次声称,他将在短期内为特斯拉的 Model 系列带来完全自动驾驶,但这从未实现。

一个重要原因是Mobileye的EyeQ3芯片无法满足计算能力要求。

它专为 ADAS 设计。

年初,Nvidia推出了Drive PX 2,理论计算性能高达10Tflops,比EyeQ3的性能要粗糙很多。

而且,希望在自动驾驶领域建立自己的GPU计算生态系统的英伟达也向需求更大的特斯拉提供了优惠的价格。

此时,急于升级自动驾驶功能的特斯拉选择重回英伟达的怀抱,似乎也在情理之中。

以 Model 3 为例。

它配备了8个摄像头、12个超声波雷达和一个毫米波雷达,用于自动驾驶功能和环视功能。

大量的视频图像数据处理以及在其上运行图像识别算法会消耗大量的数据。

大量的计算资源,这显然是只有G计算能力的EyeQ3所无法企及的。

与EyeQ3只是一个ADAS芯片相比,Drive PX 2本质上是一个车载计算机,是一个更完整的解决方案。

上图为 Drive PX 2 AutoCruise,下图为 Autochauffeur。

配置Drive PX 2后,特斯拉在车祸后低调了一段时间后,确实更新了自动驾驶功能。

前不久体验了特斯拉的新款AutoPilot,发现开启后留在车道上放手是没有问题的。

然而,特斯拉仍然施加限制。

如果时间过长,系统会发出警报。

但Drive PX 2能解决马斯克的焦虑吗?很明显不是。

因为Drive PX 2其实有多个版本,算力较高的是Autochauffeur,算力较低的是Drive PX 2 AutoCruise,它只配备了一颗Nvidia Parker Soc。

国外有车主拆解了特斯拉 Model S 上配置的 Drive PX 2,样子是这样的:(NVIDIA 为特斯拉定制的 Drive PX 2 车载电脑)可以看出,特斯拉使用的 Drive PX 2 确实不像Autochauffeur版本,使用了两个Soc+两个额外的GPU,而Parker只有一个Soc+一个独立GPU。

因此,特斯拉使用的更像是NVIDIA定制的AutoCruise版本。

关于Drive PX 2,英伟达自己也明确表示,需要多个区块(多个Autochauffeurs)的叠加,才能满足L4级自动驾驶的算力需求。

那么对于特斯拉的Drive PX 2,我们也可以明确其算力支持不会超过L3级别。

而且,基于GPU的计算架构一直存在功耗高的问题。

为了给 Drive PX 2 散热,特斯拉使用了两个风扇,这也说明 Drive PX 2 的热设计功耗至少在 50-W 范围内(Nvidia 硬件工程师曾告诉车西西,双 Soc +双独立Pascal显卡的Autochauffeur功耗以W为单位。

成本高、功耗高、计算能力不能完全满足需求。

即使是号称超级车载电脑的Drive PX 2也依然存在这三个问题。

而这些对于自动驾驶量产汽车来说都是致命的。

所以Nvidia也做出了回应,推出了下一代Xavier。

功耗/性能比大幅提升,但量产安装要到明年。

马斯克已经等不及了。

2、引进大明星,让他蛰伏两年?正因为他忍住了自己的大动作,马斯克是个聪明人,不会在一棵树上吊死。

这一点从特斯拉的计算芯片先使用Mobileye EyeQ3,然后改用Drive PX 2就可以看出。

别人的树不结果子,自己种一棵也不是没有可能。

2019年1月,特斯拉硬件工程部门迎来了一位新副总裁,一位名叫吉姆·凯勒(Jim Keller)的负责芯片架构设计的工程师。

和他一起来到特斯拉的,还有那些曾经为他工作过的数十位芯片行业人才,曾在AMD、P.A Semi、苹果等公司工作过。

(吉姆·凯勒) 和马斯克一样,吉姆·凯勒也是一个不甘孤独的人。

Jim Keller早年在AMD工作,深度参与x86-64架构的定制,将曾经只支持32位的X86升级到64位。

这也是 Jim Keller 可能做出的最大贡献——现在所有内置 Intel 和 AMD 处理器的 64 位 PC 都有 Jim Keller 的贡献。

Jim Keller还帮助AMD提出了K7和K8架构,这使得AMD能够在与Intel的CPU竞争中使用Athlon压制Pentium(尽管维持时间不长)。

随后,Jim Keller离开AMD,随后加入半导体设计公司P. Asemi担任副总裁,专门从事低功耗处理器的设计。

2016 年,苹果收购了 P.A.于是Jim Keller成为了苹果A4和A5处理器的设计负责人。

主导两家知名公司的芯片项目,最终产品造福亿万人,吉姆·凯勒可以说是名声大噪,但他的故事还将继续。

2016年,Jim Keller重返AMD担任首席芯片架构师。

此时,AMD在CPU市场上已经被英特尔打得落花流水,“i3默默秒完成”早已成为业界的笑柄。

Jim 在 AMD 工作了三年,并于今年 9 月离开。

他做了什么?帮助AMD创建了新的处理器架构“Zen”。

今年,当基于Zen架构的AMD Ryzen处理器诞生时,AMD Athlon vs Intel的荣耀再次上演。

升级缓慢的英特尔作为应对,大幅提升了下一代处理器的性能。

所以,吉姆·凯勒实际上充当了AMD的“救星”,两年前他就拯救了它,而他却不留一丝云彩。

(AMD锐龙处理器)2016年加入特斯拉的消息显示,吉姆·凯勒在拯救AMD之后,又去拯救陷入“自动驾驶谎言”的特斯拉。

事实上,马斯克觉得特斯拉可能会在2016年面临自动驾驶,当年他就主动发推文,先是大力招募自动驾驶的软件人才,然后又从AMD、英特尔、苹果等公司挖走硬件人才。

从未停止过。

收购吉姆·凯勒后,特斯拉开始与芯片制造商/承包商进行更多接触。

去年9月,曾有消息传出三星将帮助特斯拉打造车载芯片,但后来该消息便沉寂了。

今年早些时候,CNBC 报道称 AMD 将与特斯拉合作打造芯片,这听起来非常可信——吉姆·凯勒来自 AMD,而特斯拉也表示他们在自动驾驶芯片方面的工作选择是灵活的。

今年9月,AMD分拆子公司、芯片代工厂Global Foundry在对外演示时意外泄露消息,称其正在与特斯拉合作。

随后格罗方德辟谣,并表示并未与特斯拉直接合作(相当于间接指出特斯拉与AMD合作)。

一时间,特斯拉自研芯片的消息再次传得沸沸扬扬,AMD股价也因这一利好消息小幅上涨。

车西西也对此事进行了深入分析(详情见文章:自动驾驶芯片大战爆发)。

直到12月,面临股价下行压力,马斯克才将这一消息视为一件好事。

如果从吉姆·凯勒加入算起,特斯拉的自研芯片计划此时实际上已经蛰伏了近两年。

两年了,对外还没有任何成果,这完全不符合特斯拉的风格。

为什么一向追求速度的特斯拉如今稳定了?因为特斯拉想要开发的是自动驾驶的ASIC。

(马斯克的原话是“开发专门的人工智能硬件”)ASIC,即专用集成电路,是指为专门计算目的而构建的芯片。

其特点是在特定的计算领域能够以更低的功耗获得更高的性能。

另一个特点是研发周期长,通常在一年以上。

对于特斯拉来说,在应用大功率Drive PX 2后仍无法实现先进的自动驾驶,值得等待2-3年来开发自己的技术。

尤其是当芯片项目由吉姆·凯勒(Jim Keller)领导时。

在AMD和苹果的过渡期间,Jim Keller开发了基于MIPS架构的网络芯片,也开发了基于ARM V8架构的服务器芯片(MIPS和ARM V8都是RSIC精简指令集架构。

总的来说,在功耗上有优势)凭借丰富的低功耗芯片设计经验,结合他之前在高性能芯片上的设计能力,他将为特斯拉带来的将是优越的功耗/性能和高适应性的自动驾驶软件算法专用芯片。

当马斯克发布特斯拉将开发自己的芯片的消息时,他描述了这款芯片的优势——“这可以以十分之一的成本提供10倍的功率”。

什么意思?它可以以十分之一的功耗实现十倍的性能。

Jim Keller还表示,功耗是当前AI技术应用时经常被忽视的一个因素。

从特斯拉大家的话语中可以看出,他们研发的自动驾驶芯片会在功耗/性能比上投入更多的精力。

Global Foundry 是特斯拉芯片最大的 OEM,也拥有专门为低功耗设计的芯片技术——FD-SOI。

近年来,格罗方德刚刚完成FD-SOI的22nm工艺升级,声称功耗比28nm低70%。

与更熟悉的FinFET相比,该工艺更适合需要低功耗芯片的移动计算。

等待现场。

当然,低功耗并不意味着低性能。

以特斯拉老爱的Mobileye为例。

其EyeQ4系列芯片将于明年量产,采用MIPS架构打造,可实现2.5Tflops的计算性能,功耗为3W。

而同时玩过X86、MIPS、ARM v8架构的Jim Keller,在优化时可以实现良好的芯片性能并降低功耗。

3、特斯拉自研自动驾驶芯片正在转向特斯拉自研自动驾驶芯片。

这实际上反映出,随着自动驾驶行业的发展和需求的更加明确,其计算需求从通用转向专业,运营从训练转向(Inference,推理),随着自动驾驶迈向量产,所需的芯片自动驾驶系统已经从最初不计成本追求绝对算力、不怕高功耗的GPU转向低成本(前提是大规模量产稀释成本)、低功耗、高性能ASIC。

一位来自汽车厂商的自动驾驶创业者曾向车东抱怨,行业内很多创业者根本没有考虑过自动驾驶的量产。

其中一个明显的表现就是在车辆的后备箱里堆积了大量的高功率计算核心,“几块GPU拼在一起”。

现在,自动驾驶汽车要量产,计算核心必须是嵌入式的,既要满足计算性能,又要满足低功耗要求,而且成本还要可以接受。

这时候ASIC似乎是最可行的。

计划。

虽然ASIC开发周期不短,所需资金惊人(当工艺更加先进时,光是一次流片就可能需要数百万美元),但一旦投入量产并形成规模,边际效益将非常可观。

芯片产业的效用将立即使用它来降低单芯片的成本。

对于特斯拉来说,尽管开发自己的自动驾驶芯片风险巨大、初始成本高昂,但一旦投入使用,各种好处将是显着的。

除了降低成本和功耗之外,还有一点就是经常提到的自主性:世界各地的科技公司从苹果的成功中学到了一件事——软硬件集成的力量。

自研芯片的特斯拉不仅可以为Autopilot提供定制化硬件支持,还可以将大量自动驾驶算法直接封装到芯片中。

打造这样的能力将成为特斯拉在自动驾驶竞争中的核心优势。

除了特斯拉之外,还有其他公司也走上了这条道路。

上周,国内自动驾驶芯片初创公司地平线推出了两款AI芯片,其中一款就是针对自动驾驶的ASIC“征途”。

参数方面,正诚能够以1.5W的功耗实现1Tflops的算力,每秒处理30帧4K视频,识别图像中100多个物体。

性能功耗比可以直接体现ASIC在自动驾驶领域面对GPU时的优势——正诚实现每瓦功耗0.T算力,而英伟达此前推出的Drive PX 2功耗高达W实现小于24T的算力。

如果这样算的话,“正剑”的性能和功耗是Drive PX 2的3倍以上。

而且,由于ASIC不是GPU类型的通用计算,所以算法直接封装在里面,数据Exchange只是底层I/O,所以它的计算延迟会比GPU低。

也正是因为这个原因,虽然“正城”ASIC的绝对算力远低于Drive PX 2 Autochauffeur,但Horizo??n也声称可以满足L3级的计算需求。

特斯拉在 Jim Keller 掌舵、财力更强大的情况下,在自动驾驶 ASIC 方面必然会做得更好。

当然,与特斯拉分手的英伟达也非常清楚GPU路径的优缺点。

在其下一代计算核心Xaiver中,将采用CPU+GPU+ASIC的异构计算解决方案。

Xiaver正在将其提供给不同的合作伙伴。

可提供定制解决方案。

Nvidia之所以没有选择ASIC这条路,是因为它毕竟还需要构建生态系统,没有GPU就没法玩。

不过,生态也是NVIDIA最好的武器。

除了底层的cuDNN和Tensor RT之外,NVIDIA还提供了强大的云端训练能力,以及大量自动驾驶的通用算法,包括车辆、行人、红绿灯识别能力和可行驶区域检测等。

DriveWorks 的功能。

这大大降低了自动驾驶开发的入门难度。

对于像特斯拉那样不追求极致的后来者来说,拥有完整生态系统的NVIDIA仍然是一个不错的选择。

结论:自动驾驶芯片或将成为特斯拉的下一个救世主。

尽管马斯克声称特斯拉正在打造的人工智能专用芯片“将是世界上最好的人工智能芯片”,但他没有透露该芯片何时诞生。

不过,马斯克却再次“吹嘘”自己将在2020年实现完全自动驾驶。

在吉姆·凯勒这样的大师帮助下,马斯克这次承诺推迟的可能性似乎要小一些。

不过,从人们对特斯拉的期待来看,只要它能实现高水平的自动驾驶,即使晚几年也没关系。

唯一的问题是,像 Horizo??n 这样的初创公司和像 Mobileye 这样的老牌公司都在自动驾驶 ASIC 的道路上越走越远。

在短暂领先自动驾驶(本质上还是辅助驾驶)之后,特斯拉的优势不再明显。

但马斯克常常把不可能变为可能,无论是制造续航里程超过100公里的电动汽车,还是实现运载火箭的回收。

此次在芯片大师吉姆·凯勒的执掌下,特斯拉在自动驾驶芯片方面可能取得的成就不容小觑。

它一旦问世,或许会成为“不进取”的AutoPilot的救世主。

在特斯拉不断的拖延和救援中,自动驾驶正在悄然走向量产。