当前位置: 首页 > 科技观察

为什么至今没有出现AI芯片的“爆款”?

时间:2023-03-15 08:53:51 科技观察

在刚刚过去的2019年,国内外产业大咖共同推动AI芯片的车轮前进。7nm芯片还没有全面铺开,5nm冲锋的号角已经吹响。在AI强势入侵和颠覆各个传统领域的同时,AI芯片的架构创新也在持续发酵。“AI芯片”这个新鲜的概念,在过去的一年里逐渐走过了普及阶段,越来越为大众所熟知。随着行业经历野蛮生长并开始加速落地整合,更多的AI芯片企业也开始走出自己的差异化路线。如今,AI芯片正在云计算、手机、安防监控、智能家居、自动驾驶五大场景上演新的争霸战。包括华为、阿里、百度在内的巨头公司都拿出了自己的“杀手锏”。这些“杀手锏”在不同程度上提升了行业影响力,也给行业带来了巨大的变化,让业界看到了中国半导体产业的希望。然而经历了一次又一次的疯狂召唤,每次都觉得少了点什么——那种感觉就像整晚看一个网红带货,却在主播喊“买!”的时候。没人点单的尴尬。可以说,去年各大厂商虽然推出了多款产品,但依然没有一款产品堪称“现象级爆款”。为什么会出现这种叫好不买的情况呢?我不禁深感不解。原因不难发现,覆盖细分区域,偏离主战场是一个重要问题。据相关研究公司数据显示,到2022年,AI芯片整体市场规模将达到596.2亿美元,其中云训练+云推理芯片将达到244亿美元,占市场规模的40%以上。毫无疑问,云服务器市场是AI芯片的主战场。目前的现状是,具有通用性优势的GPGPU在云端人工智能市场占据主导地位。以TPU为代表的ASIC目前只应用于巨头的闭环生态,FPGA在数据中心业务中还处于试验阶段。目前,谷歌、微软、亚马逊、阿里巴巴等全球各大公司的云计算中心等主流企业都使用GPU进行AI计算。英伟达在这里赚了很多钱。目前全球主流硬件平台都在使用Nvidia的GPU进行加速,AMD也在积极参与。AmazonWebServicesAWSEC2、谷歌云引擎(GCE)、IBMSoftlayer、Hetzner、Paperspace、LeaderGPU、阿里云、平安云等计算平台均采用NVIDIAGPU产品提供深度学习算法训练服务。相比之下,其他专注的AI芯片厂商在其专注的细分领域表现不俗,但其配角作用难以洗白。赛迪顾问预测数据显示,2019年,中国对AI芯片需求最大的市场为安防、零售、医疗、教育、金融、制造、交通、物流等行业。其中,最大的安防市场仅占20%。很多专注于安防领域的AI芯片厂商,在出货量上都难以取得好成绩。而当我们深入研究时,专注于单一领域又引发了另一个问题:成本问题。随着芯片制造技术的日益先进,芯片制造的成本也随之上升。如今,设计和制造一颗10nm芯片的成本高达数千万美元,综合成本高达数亿美元。因此,如果不能保证某个单一应用场景可以大批量出货,专用芯片需要保持一定的通用性和灵活性。近两年,业界兴起了神经网络计算芯片(AI芯片)。寒武纪、深鉴科技、中星微等玩家的AI芯片产品均采用28nm芯片工艺。一部影片的成本超过400万美元,如果单个品类的出货量达不到百万级别,就很难收回成本。除了成本,还需要考虑AI算法的演进。由于目前的人工智能算法还处在不断变化和进化的过程中,人工智能用了60多年的发展才迎来深度学习的大规模爆发。但是,深度学习算法还有很多方面需要优化。比如稀疏化、低功耗、小数据训练等,算法还没有定型。此外,语音/文本/图像/视频等不同的应用目前无法使用统一的算法,但许多现实生活中的人工智能应用(识别图像中的物体或理解人类语言)需要不同类型、不同层数的神经网络。组合。因此,在保证AI应用性能的前提下,AI芯片需要尽可能保持芯片通用性。那么问题来了:既然GPGPU这么强大,可以“通吃”,为什么厂商反而要谈它呢?其实真正的难点在于GPGPU的技术难点。从硬件的角度来说,核心就是指令集。指令集的覆盖范围、粒度和效率,决定了一款芯片能否覆盖足够广泛的应用市场,对软件开发和产品迭代是否足够友好。无论是Nvidia还是AMD的GPGPU,指令集都在千量级,而目前国产AI芯片的指令集大多在一百以内。类型和数量的差异映射到硬件高效实现的复杂性。差距很大。在这方面,国内球队还是有一定的差距。另一个重要的方面是基于硬件层的任务管理和智能调度,可以让芯片从硬件层提高算力的利用率,也就是常说的实际算力。大多数AI芯片的做法是完全依赖软件层的调度实现,但这种方式一是增加了软件开发的复杂度,二是降低了硬件算力的利用率,三是减缓了软件的迭代更新堆。速度,在AI领域算法模型、开发环境、应用场景加速更新的背景下,无疑大大增加了产品落地和工程化的难度。在软件方面,毫无疑问,最重要的是开发生态。GPGPU经过英伟达十余年的努力,已经建立了一个庞大而成熟的生态——CUDA,拥有超过160万的开发用户。AI芯片需要构建新的生态系统,这会带来两个维度的显着问题。第一个维度是客户。客户需要一个漫长的适应期才能从原有的开发环境切换到新的软件生态。不仅带来了资源投入,延误了业务部署的时间窗口,增加了业务的不确定性,更严重的是,不利于现有软件投资的保护。软件的许多部分都必须重写和改编。对于企业用户来说,恰恰是一件非常敏感和慎重的事情。另一个维度是产品开发方面。从底层芯片和系统软件来说,跳过CUDA层直接支持开发框架必然会带来巨大的软件投入,并且不断追赶现有框架的新版本和生态巨头的新框架,这在底层软件人才匮乏的背景下尤为突出。文章开头提出了一个看似针对产品的问题,但实际上还是针对市场的问题。能否一炮而红,一方面取决于产品,另一方面取决于市场需求。数据显示,2018年中国AI芯片市场持续增长,整体市场规模达到80.8亿元,同比增长50.2%。而且目前还是基于云端训练芯片。2018年中国云训练芯片市场份额达到51.3%。巨大的市场前景也引来各路王子争相抢夺。除了一骑绝尘的英伟达,其他老牌芯片巨头也没有闲着,尤其是英特尔也在加紧布局通用GPU。众所周知,英特尔贪图GPU,背后还有一段辛酸的历史——从一开始对GPU的不屑,到开发基于自家x86架构的独立显卡,英特尔折腾了十年仍然没有做出像样的GPU。近两年传出英特尔将在今年推出首款独立GPU,这或许是因为英特尔重金挖角——AMDRTG图形部门前负责人Raja、AMD的功勋领袖JimKellerZen架构、图形技术市场总监DamienTriolet这几位大神,都是2018年被英特尔招进来的。在中国,一家名为“天数智芯”的公司也宣布将在今年发布GPGPU芯片。目前,公司围绕GPGPU的系统研发聚集了100多人的技术团队,其中包括AMD在美国和上海从事GPU的核心团队成员,以及拥有20多年经验的世界级技术专家。的行业经验。从行业发展来看,近两年AI芯片会持续火爆,大家会齐头并进;但在2020年左右,将会出现一批跳脱的玩家,行业开始重新洗牌。由于目前的AI算法还处于演进和总结过程中,最终的成功将取决于各个技术路径的选择和产品落地的速度。让我们静待2020年第一款“爆款”的到来吧。