当前位置: 首页 > 科技观察

历数中国AI芯“觉醒”的五年

时间:2023-03-20 12:27:37 科技观察

中国AI芯片“觉醒”的这5年时间里,已经有十余款芯片问世,并购重组也不少。这是过去500天中国AI芯片的火爆程度。突发事件再次点燃了学术界和整个舆论场。在人工智能技术跻身世界前列的大背景下,我们开始期待它成为中国芯片的“嫁衣”。人工智能的概念开始随着每一款新品的出现而投入大众视野。AI芯片是指专用于AI算法的专用集成电路。它不同于传统的CPU和GPU。后者虽然可以用来进行AI计算,但其速度和性能已经影响了商业结果。有芯片工程师举了个例子,自动驾驶需要识别路上的行人、红绿灯等情况,但是如果用现在的CPU来计算,估计车翻到沟里了,还没发现前面有一条河。而如果是GPU的话,速度当然要快很多,但是其巨大的功耗和高昂的成本对于AI场景来说仍然不是很理想。不仅如此,AI芯片在场景侧也分为云端和终端。人工神经网络训练大数据量的场景在云端完成,追求低成本、低功耗的推理在终端完成。需求真实、场景不缺、资金充足,接二连三的AI芯片企业在路上,但做芯片并不着急。设计、制造、封装、测试全链条的难度让无数人望而却步。而这是一份坐了十年冷板凳的体力活。跌宕起伏与精彩纷呈,荆棘丛生、荆天奋起成英雄,这一切都汇聚成这些AI芯片创业者的“芯片”故事。寻找最佳解决方案2013年秋天,张军是云知声在深圳的唯一销售人员,负责白色家电客户的开发。他经常和出差在外的联合创始人李晓涵商量,如何帮助传统家电企业提升竞争力?起初,他们在云端提供SaaS服务,为客户提供语音识别能力,但很快意识到这还不够。他们发现物联网设备不同于手机。手机上的语音识别可能不是刚需,但在家庭生活和独立办公场合,最自然的人机交互方式将占有一席之地。当时,深圳办公室只有12平米,两张桌子三把椅子。大家集思广益,想做一个类似“U盘”的东西,有标准接口,可以插在家电上进行语音交互。2015年8月,这款后来被命名为智能语音模块(IVM)的产品获得了巨大的成功。可以标准化一个硬件版本来连接不同的客户。模型A和模型B都可以很容易地适应。格力空调、华帝抽油烟机顺利出货。深圳团队开始搬进大办公室,团队正在招人。然而,仅仅几个月后,他们就发现了新的问题。板子上有芯片,各种东西串在一起。每一种其实都不贵,只是成本太高了。客户问李晓涵:这东西卖100块钱,只能放在高端产品上,低端产品卖几百块钱,我用不了。该怎么办?有人提出自己做芯片,把东西集成到芯片里来解决问题,但是经过计算发现,如果不能一块一块地稀释,整体计算起来还是很费钱的。这件事闹得沸沸扬扬,甚至有投资人找上门来抱怨,“我们没钱投,你拿来做芯片,谁都知道,芯片高投入,时间长。”时间。你为什么要这么做?”投资者也不能受到指责。被誉为“独角兽捕手”的金沙江创投董事总经理朱啸虎表示,“中国的VC并不是不投资芯片。我们之前投资了好几次,都输光了。”届时,所有投资者都会提到投入成本高、门槛高、周期长、回报率低。2015年下半年,团队还是做出了决定,因为他们发现这里有一个尖锐的矛盾,长期无法调和。只有足够的计算能力和功能才能支持人工智能应用,但成本是主要的限制因素。一个AI产品,有很好的底层支持,需要多花一两百,但要量产,就必须卖低价。这样一来,如果不想降低算力,就只能使用芯片本身了。其他解决方案。他们判断这是整个IoT方向的问题。云知声CEO黄伟说,“不做芯片就死”。对抗短期“情绪”较快的是时任百度深度学习研究院副院长的余凯。他于2015年6月1日离开百度,一周后开始为新公司造势。他之所以毅然离开并迅速创业,正是因为他确定AI??的变量不是软件,而是处理器架构,如果不解决底层的计算效率和功耗,应用层会做很多无用的工作。因为随着嵌入式处理器功能的不断扩展,已经发生了质的变化。北航教授何利民曾表示,自从人工智能进入机器深度学习时代以来,原有MCU的硬件加速已经无法满足高速海量数值计算的要求,以及大数据的云间交互需求,因此在嵌入式领域,出现了两个截然不同的芯片组,MCU和AI芯片。前者擅长控制,后者擅长计算。找准方向后,余凯遇到一个好消息和一个坏消息。顺利的是创业团队的组建。基本上就是找老朋友老手下,吃几顿饭,挖几圈,组成30到50人的战斗力。团队发展到几百人之后遇到的管理问题,那是后话了。坏消息是,在有豪华团队背书的情况下轻松完成首轮融资后,接下来的钱去哪里找。2015年的秋天,在“人机大战”还没有到来之前,普通人,尤其是投资者,都看不懂这家伙到底要干什么?余凯一连说了六七十家投资机构,但没有一家出手。当时的风口是共享单车和P2P。以至于当影响全球人工智能发展的“人机大战”来临时,于凯积极参与并现身网易直播间,以技术嘉宾的身份讲解AlphaGo,并借此机会为自己正名他在做。2016年3月9日至15日在韩国首尔举行的围棋比赛中,AlphaGo以总比分4-1击败李世石。余凯的信心大增,这意味着大部分人都开始了解人工智能和AI芯片了。余凯的芯片“军”从创业之初就说,要坚持战略判断,不受大环境影响。在中国被放大了,这也是很多外资来中国赚不到钱的原因。他们往往低估了“局部”的力量。幸运的是,在过去几个月的“人机大战”中,地平线先后获得了尤里·米尔纳、双虎投资、青云创投和祥峰投资的资金支持,并在第二年获得了英特尔领投的超级投资。1亿美元的A+轮融资。过冬的粮草终于备齐了。于凯表示,地平线所做的是“反共识”。百度是唯一一家走不同路线的自动驾驶创业公司。志同道合的人。巨种遭遇变局2015年前后,地平线和云知声开始大量投入兵力。寒武纪虽然成立时间最晚,但原始积累早在中科院计算所就已经完成。陈云骥、陈天石兄弟2014年,中国科学院计算技术研究所陈云骥、陈天石课题组提出深度学习处理器指令集点脑语,并被国际顶级会议ISCA2016接收计算机体系结构领域,其分数在近300份投稿中均排名第一。当时的仿真实验表明,采用点脑语指令集的寒武纪深度学习处理器相比采用x86指令集的CPU有两个数量级的性能提升。陈云霁、陈天石兄弟开始崭露头角。陈云霁9岁上中学,14岁进入中国科学技术大学大三班,19岁获得中科院计算技术研究所博士学位。24岁,29岁晋升研究员,33岁获得中国青年科技奖和中科院青年科学家奖。两兄弟稳步攀登,循着同样的台阶,直到再次“穿越”。2008年,陈云霁和兄弟们开始联合打造AI芯片,利用各自的科研优势攻关。此前,陈云际跟随中国“龙芯之父”胡伟武十余年。胡伟武团队2016年研制成功的龙芯3A3000处理器已经应用于二代北斗卫星。同年,成立寒武纪科技有限公司,推出首款商用深度学习处理器寒武纪1A,速度领先业界。陈天石曾经说过,寒武纪只有几百人的小团队,却做了很多事情。全球首款终端AI处理器问世,全球首款多核终端AI处理器问世,中国首款云端人工智能芯片第三代终端IP产品落地发布。他表示,很难想象AI芯片领域不会诞生新的巨头,可见寒武纪的雄心壮志。但很快他们又要面对华为自产芯片的质疑,外界指的是“放弃”寒武纪。陈天石回应称,华为发布的16T峰值性能的升腾310与寒武纪发布的MLU100不存在竞争。不同场景下的峰值性能不同。作为一家开放独立的芯片公司,一定要有广阔的视野。不知道这是不是他的想法,但至少在通往巨人的道路上多了一些变数。AI芯片是时代的机遇,也是技术的需要。在这波上涨趋势中,海思率先投入研发,却被华为“躲”了过去。早在2004年,华为全资子公司海思就逐渐走上了历史舞台。他们最初专注于自己手机的基带芯片、视频编码芯片和麒麟芯片。与AI芯片的缘分始于2017年,2017年9月上旬,华为在柏林发布了麒麟970,号称是“全球首款手机AI芯片”,集成了寒武纪1A处理器的IP作为核心AI处理单元。次年8月,麒麟980也搭载了优化版的寒武纪1A。然而,从2018年10月开始,寒武纪就迎来了噩耗。“客户”华为推出了全栈全场景AI解决方案和升腾910、升腾310两款AI芯片,这在情理之中,海思成为增速最高的芯片设计公司。在绝地求生之前,华为创始人任正非计划在芯片上投入4亿美元和2万人。23年来,海思掌舵人何庭波从工程师到总裁。到纳米,再到现在的5纳米技术。这些积累和努力,成为海思在AI芯片时代的强大储备,正在开花结果。下一代升腾910、升腾310、麒麟980正在加速。创造力和秩序是有道理的。寒武纪有中科院背景。海思背靠华为这艘巨轮。千余名资深半导体专家的参与,本身就是一个超级壁垒。然而,对于云知声、地平线这样的初创企业来说,团队建设和磨合并不是那么容易。从2015年决定做AI芯片开始,直到2016年年中才正式走上正轨,云知声的芯片团队经历了漫长而艰难的适应期。直到2015年11月“关键先生”谢冠超加盟,负责整个IoT事业部,最重要的KPI还是芯片制造。从深圳到北京,云知声的解决方案迎来了一场彻底的革命。有带头打仗的人,但是作战部队还在慢慢招兵买马打磨。当时管理层最头疼的问题是算法团队和芯片团队的“互掐”。这是软硬件结合的AI芯片必须经历的阵痛。双方在底线边缘疯狂试探对方。如果是通用芯片,成本高,有比较大的内存和存储空间,但是一旦到了AI芯片,尤其是边缘端,多一点就是成本痛,所以希望算法组配合剪裁。这下,算法团队气炸了。算法组在办公室拍桌子发呆是家常便饭,说我在这件事情上做到了极致,忙死了。双方争论不休,只能等老大做决定。在老板眼里,就是倒推。如果建立这个芯片,它必须满足资源限制的需要;算法就是你给我的资源越多,我给你的性能就越好。现在剩下要做的就是确认性能水平,然后挤出每一点空间并达成和解。在AI芯片的研发过程中,这是团队在每一个引擎、每一个模块都会遇到的事情。余凯将这个问题归结为观念冲突。他在招聘的时候,有人问他,做软件就做软件。什么是软件和硬件的结合?他认为,这就是初战必经的“风阻”。地平线芯片团队在早期也长期不和谐。软件开发强调快速迭代,而硬件强调系统的程序思维。一快一慢,一个讲创意,一个讲秩序。这两类人有着天然的对抗。2015年10月,地平线第一位芯片工程师入职,第一行芯片代码打出来,开始做前端开发。他经历了写代码、测试代码、逐层绘制物理实现图、然后制造的过程。demo终于在2017年8月16日被点亮,同年12月20日,第一代芯片连同基于该芯片开发的几款典型应用一起发布。其实一开始,芯片团队自己也怀疑,“能不能做?什么都没有!”。但在项目真正开始运行后,团队的信心开始变得更加坚定。在某个关键节点,为了保证芯片研发进度,据说地平线算法负责人黄畅把自己关在一个小会议室里,写了两周的代码,挂了一个门口标语:“封闭开发,请勿打扰”。两周后,拿着最终版的算法架构,黑眼圈、头发凌乱的黄畅从小会议室里走了出来,“搞定了!”周期缩短为22个月。不同于互联网行业的快速试错和迭代,芯片一定不能错。余凯表示,一颗AI芯片的研发成本超过5000万美元,这对初创公司来说风险极大,压力也很大。2018年5月,云知声交出了第一代芯片“Swift”,面向智能家居和智能音箱,以更低的成本和功耗提供更高的算力。.该芯片采用ARM的架构和自主算法,并选择联电和中国台湾公司完成封装测试。没想到,天亮前是最黑暗的时候。一度,云知生决定取消5月16日的芯片发布会,因为准备点亮的芯片突然出现故障,所有人都惊出一身冷汗。李笑寒赶紧组织排查,发现是开发板图有问题,立马修改了一个版本重新验证。用了一个星期,没有危险。芯片发布后的语音功能测试也让团队煞费苦心。大多数顾客来自南方。有一次,经过几天几夜的测试和调整,他们终于通过了测试,但是最后一批人却被打得灰头土脸,因为客户老板的口音是外国的。较小的地方。黄炜庆祝芯片首次点亮。李晓涵将构建AI芯片的挑战归结为三个原因。首先是如何在整个系统架构中做到最好的能耗比,如何突破冯诺依曼记忆墙,其次是做好软硬件的整合,最后是了解应用场景.云知声是物联网专用芯片,地平线是围绕车辆智能驾驶的计算和AIoT场景专用芯片。巧合的是,他们的商业模式都是克制的,就像英特尔不会成为联想和戴尔一样。当别人都在垂直做应用的时候,余凯希望做的是底层,向上做,也就是互相竞争。一是全产业链赚钱,二是平台赚钱。他们选择后者。大家都知道,芯片只有装上才能生存。尽量避免参与战争。只有作为运送弹药的角色,才是他们的生存之道。方式。这就是为什么余凯常说只造武器不打仗的原因。云知生亦然。2018年下半年他们开始交付芯片的时候,他们最想的就是交付给客户什么?虽然他们不会同时安排芯片和应用,但是因为物联网领域不同,他们还是会为客户准备很多现成的功能应用。团队研究发现,物联网市场需要的不是AI芯片,而是应用于物联网的AI功能。比如你想出一个智能灯泡方案,里面有芯片,但客户看重的是功能。有一次,李晓涵带着AI芯片去了一家卖灯具的厂家。老板面无表情的看着他,你给我这个干嘛?不过他也说了这个芯片还有什么功能,芯片和软件配合后台服务,可以实现这样那样的功能,老板就把他请进房间坐下来详细讨论。比UniSound早半年,2017年底,地平线发布了征途1.0处理器和面向智能相机的旭日1.0处理器。余凯将芯片架构比作人的??左右脑。ARM架构仍然用于理性计算。负责感知计算的部分称为BPU(BrainProcessingUnit)——这是一种自主设计的设备,主要用于人工智能。智能计算的一部分。Journey1.0和RisingSun1.0芯片采用芯片视界第一代BPU架构“高斯”,提出算法定义芯片。他们认同计算机先驱和图灵奖获得者“真正认真对待软件的人应该自己制造硬件”的理念。他创业已经四年多了。大家对软件算法的热情和投入,依然让余凯感到困惑。他一直认为,算法的门槛会越来越低。其实我们也可以看到,很多纯人工智能算法的公司都在调整航向。嗡嗡声是他们掀起的人工智能芯片热潮。做智能语音的公司最热闹,做计算机视觉的公司最低调。我怎么说呢?高级分析师吴磊的观点是,无论是机器人语音控制模块还是空调,都是一个新事物。这是语音领域的机会,所以他们更愿意尝试AI芯片。商汤科技、云从科技等计算机视觉公司的业务并没有创造出新的设备。网络摄像机或专业摄像机已经存在。他们目前正在努力解决数据流向服务器后没有得到有效利用的问题。云从科技是一家专注于计算机视觉的人工智能公司。2017年底,负责工程技术的唐立斌团队遇到了难题。他们之前把算法放在了PC端。怕弄湿弄脏,只得有人伺候。他们急于找到一种将算法插入相机的方法。第一步是芯片选择,大约持续三个月。产品部和算法部协调,把市面上所有符合场景需求的芯片都拿来一一测试。如果你喜欢的不合适,你也会和芯片供应商商量定制。比如有些芯片不是专门为终端设备做的,PC端设计时不会综合考虑紧凑环境。而且,除非选择通用芯片,否则产品的设计和芯片的选型都是针对通用芯片同步进行的,稍微滞后于芯片。以防万一芯片最后固定不了,这个产品就不用设计了。大家会同时卡在产品设计的定型上。唐立斌还发现,国内外的芯片公司都很好,只是支持速度会略有不同。国际大厂配套速度是国内同类型企业的三分之一。原因之一是国际大厂会反馈他们的技术需求。去国外总部,整体决策过程比较长,而国内企业可以根据客户需求快速定制芯片。2018年3月,云从科技第一代AI智能相机“火炬之眼”上市,采用英特尔芯片。双方专门设立了一个项目,对算法和硬件的功耗进行优化,功耗降至15瓦。运输。几个月后,第二代AI智能相机被提上日程,华为海思的芯片成为主要选择。虽然成熟度还有待打磨,但让唐立斌放心的是,成绩有了明显提升。他们可以在产品上市前花更多的精力在算法打磨和场景功能研究上。2019年以来,唐立斌马不停蹄地拜访客户。多家银行多次向他提及网点投诉率。有时客户觉得业务流程复杂,等待时间长,容易上火。这个时候,绥靖是第一要务。的。他们在广东农业银行试点了一个应用程序。在后台可以看到网店里有多少人,每个人的头顶都会显示一个状态。一般等待时间最长为15分钟。如果到时候还没有打到电话,就需要去打招呼或者倒杯水把客户踢下去。这些直达客户的东西,都是不做芯片的人工智能厂商的作品,算法“只是”做芯片。因此,前期选择一款优秀的AI芯片非常重要。我对十岁的马布说不。不过,同样属于计算机视觉阵营的依图,还是坐不住了。他几乎同时发现了问题。一个家庭选择了求助,一个家庭选择了实践。今年5月,趁着新闻联播的预热,创始人朱龙在上海发布了“Quest”芯片。这是一款兼顾云端和边缘场景的SoC级芯片。指着英伟达。依图展示了“求”芯片的性能。他们计划在2017年2月打造芯片,随后投资了AI芯片初创团队ThinkForce。依图提供视觉算法,ThinkForce承担硬件开发。这体现了朱龙“算法就是芯片”的理念。这是一个完整的故事。终端侧有了海思,依图可能就没那么容易了,但他们对云端的算力有很强的需求。但在芯片行业从业多年的专家张兵怀疑依图的需求是否能够支撑足够的体量。如果不是,依图在业务和芯片上还处在有点尴尬的境地。相比完全第三方独立底层的寒武纪,在芯片上的机会更多。离职依图工程师、网易智能《洞见》说,早期朱龙经常强调自己要努力十年,为什么现在依图这么着急?因为我们2017年去融资的时候,最先不同意扎马布的是投资人。而现在依图的营收压力也在急剧增加。这可能是最好的选择。无论如何,条条大路通罗马。这是他们关于芯片的故事,也是中国芯片崛起的证据。不管前方是雷区还是万丈深渊,大家似乎都精神抖擞。通用芯片终于走到了尽头。(应受访者要求,吴磊、张兵、胡晓军为化名。)