当前位置: 首页 > 科技赋能

号称“国芯”,希望寒武纪真能挑战英伟达?

时间:2024-05-22 11:19:48 科技赋能

文字|思贝今日,市场研究咨询公司康帕斯智能公布了全球顶尖AI芯片企业排名。

其中,第22位恰好是来自中国的中科寒武纪。

前三名分别是英伟达、英特尔和恩智浦。

近一年来,随着AI芯片话题的逐渐兴起、寒武纪AI芯片IP在华为海思麒麟芯片上的应用,以及近期“中国芯片”的热议,这家成立仅2年的初创公司,已变得越来越流行。

该公司获得了“国家芯片的希望”的光环,受到各种赞誉,融资和估值也水涨船高。

就在昨天,寒武纪在上海发布了三款端到云芯片产品,包括7nm处理器IP 1M、云智能芯片MLU以及搭载MLU的云服务器主板。

它毫不掩饰挑战英伟达的野心。

那么,目前市场对寒武纪芯片的反应如何呢?这家成立仅2年的初创公司是如何获得大批投资者的青睐的?在这个日益激烈的市场竞争中,寒武纪想要成为“中国芯”逆袭力量的代表,还需要克服多少关卡?本文将为您一一解答。

1、搭载寒武纪NPU的麒麟:目前单颗出货量最大的AI芯片。

在接受媒体采访时,寒武纪执行董事罗涛曾介绍,寒武纪已经建立了三大产品线:1、智能终端处理设备IP授权,比如昨天推出的1A、1H、1M,可以集成到手机等终端芯片中。

、安全、汽车和可穿戴设备。

2、智能云服务器芯片,比如昨天发布的MLU,作为PCIE加速卡插在云服务器上; 3、家庭智能服务机器人芯片,该产品线暂无产品发布。

我们先来说说昨天发布的处理器IP Cambricon 1M。

这是寒武纪第一条产品线中的第三代IP产品,将采用台积电7nm工艺打造。

业内人士表示,制造这种芯片的代工成本很高。

寒武纪1M流片需要投资数亿美元,据传已经签约建造。

在去年底的发布会上,寒武纪预览了这款名为“1M”的IP产品,声称其性能较1A提升了10倍以上。

不过,当时公布的1M处理器IP主要专注于智能驾驶领域。

昨天推出的1M将应用领域拓展至智能手机、智能音箱、摄像头、自动驾驶等。

此外,根据寒武纪官方数据,1M int 8(8位运算)的性能比高达5Tops/watt (每瓦 5 万亿次运算),提供 2Tops、4Tops 和 8Tops 三种尺寸的处理器内核。

,满足不同的需求。

1M还将支持CNN、RNN、SVM、k-NN等多种深度学习模型和机器学习算法的加速,可以完成视觉、语音、自然语言处理等任务。

寒武纪第一代处理器IP:寒武纪1A可以说是最早量产、出货量最多的AI芯片IP。

去年,华为海思首款人工智能手机芯片麒麟集成了寒武纪的1A处理器IP,成为SoC上的NPU神经网络处理单元。

目前,麒麟已搭载华为Mate 10、P20、荣耀V10三大系列手机产品,累计出货量达千万台。

不过,相关人士向智喜喜透露,华为海思下半年发布的下一代产品(可能是7nm麒麟)可能不会使用寒武纪的IP。

目前尚不清楚该公司是否会自行开发或选择另一家公司。

原因是寒武纪IP的工具链和配套运营商还不够成熟,导致上层应用的AI开发困难。

一些AI功能(例如直播/短视频应用中的背景分割)需要几个月的时间。

只有这样才能完成应用程序中的部署。

2、云芯片MLU:现场挑战NVIDIA。

不过,1M并不是昨天寒武纪发布会的主角。

寒武纪首款云端智能芯片Cambricon MLU是焦点。

同样在去年年底的发布会上,寒武纪也预览了这款名为MLU的产品。

与此同时,还有另一个名为 MLU 的云服务器处理芯片。

前者侧重于推理。

后者侧重于培训。

不过,寒武纪在昨天的发布会上并没有推出MLU。

▲寒武纪MLU参数▲左:2017年NVIDIA发布的Tesla P4参数,右:2017年NVIDIA发布的Tesla V参数。

MLU给出的参数比较详细,但可能是因为它不注重训练,而寒武纪不提供它们。

32 位浮点运算的参数。

发布会上,寒武纪公布了MLU与NVIDIA Tesla V、NVIDIA Tesla P4在R-CNN算法下的计算延迟对比。

不过,如果只看参数的话,这款芯片主要是对标特斯拉P4的。

Tesla P4是Nvidia于2016年推出的一款GPU,专为企业级高性能计算而设计,主攻机器学习和云服务市场; Tesla V 是 Nvidia 去年推出的同系列 GPU。

一般来说,MLU在功耗和纯计算峰值性能方面表现都比较好,但内存接口带宽稍低(MLU为0.4GB/s,Tesla P4为GB/s。

如果内存带宽太小,会影响运行时计算性能),是一款完成度比较高的云端智能芯片。

一位芯片技术资深高管表示,“虽然不能称为‘击败英伟达’,但它与英伟达当前的产品处于同一个时代。

在推出三款产品后,寒武纪CEO陈天石昨日在公开信中表示:“我们期待与全球客户一起,将智能传播到每一个终端,让整个地球成为智慧之地。

”聪明的。

” 3、经过两年的经营,寒武纪为何能够挑战英伟达?如上所述,寒武纪已经建立了智能终端处理器IP授权、智能云服务器芯片、家庭智能服务机器人芯片三大产品线。

据现场媒体报道报道称,陈天石在发布会上表示,“MLU的功耗仅为NVIDIA同类产品的一小部分,将树立新的行业标杆。

”那么,成立两年的寒武纪为何能称得上是Nvidia呢?名字不好?这要从寒武纪的起源说起。

寒武纪全称中科寒武纪科技有限公司,是由中国科学院计算技术研究所孵化的企业。

寒武纪的CEO兼联合创始人是陈天石,另一位联合创始人是陈天石的弟弟陈云霁。

他们两人都是年轻的天才。

他们自幼考入中国科学技术大学少年班,二十出头就获得博士学位。

中国科学院计算技术研究所研究员。

陈博士的导师是龙芯公司总裁、被誉为“龙芯之父”的胡伟武教授。

陈云霁与胡伟武在龙芯CPU上合作了12年。

有趣的。

有趣的是,寒武纪“三年入侵10亿终端”的口号与龙芯当年的口号非常相似。

胡伟武教授表示,龙芯CPU是中国第一代国产CPU,其意义可以上升到国家战略层面。

目前有很多客户使用龙芯CPU芯片。

随后在2016年,法国国家信息与自动化研究所(Inria)的Olivier Temam教授首先提出了AI加速器的概念,随后开启了Olivier Temam教授与两位陈博士的合作。

合作项目DianNao也是寒武纪的技术来源。

在陈天石昨天的公开信中,他还特别提到了与Inria教授和Olivier Temam教授的合作。

年内,点脑项目共发表了四篇AI加速器相关论文,包括:深度学习处理器、多芯片版深度学习处理器、摄像头智能识别处理器、通用机器学习处理器。

这四篇论文都采用了专用逻辑加速的方向,可以理解为针对特定的AI算法逻辑。

对于加速计算来说,一旦机器学习的算法逻辑发生变化,加速器可能就无法支持了。

为了弥补这一点,在接下来的几年里,两位陈博士推出了同样由寒武纪自主研发的神经网络通用指令集DianNaoYu。

神经网络专用指令集Cambricon ISA的前身。

我们先来了解一下指令集。

指令集是代码的集合,是指用一些代码来表达读写等操作,指示计算机进行各种操作的一组命令标准。

神经网络专用指令集可以为AI算法提取更细粒度、更底层的编码集。

例如,可以直接为神经网络计算任务中某些高频操作提供硬件指令集编码;同时,它减少了对人工智能算法的需求。

对性能影响不大的缓存系统,提高芯片的性能/功耗比等。

简单来说,就是将AI计算中的高层功能块(如卷积)分解为低层功能块(如点乘),使加速器能够更灵活地支持不同类型的神经网络。

2018年3月,北京中科寒武纪科技有限公司注册成立。

陈天石为本公司法人。

中科院注资1万元作为天使轮启动资金。

基于DianNao项目的技术框架,寒武纪相继推出了“寒武纪1号”芯片、寒武纪1A处理器IP等产品。

但请注意,这些芯片是专用指令集处理器(ASIP),更适合人工智能算法的加速计算。

它们不能取代CPU作为中央控制芯片,需要与CPU和其他硬件配合。

目前,除了寒武纪,还有一大批国内初创公司涌入AI芯片领域,包括神剑科技、地平线、异质智能等。

他们有的做专用逻辑加速器(ASIC),有的做专用指令集处理器 (ASIP)。

前者功耗较低,性能较强,但通用性不够灵活;后者更加灵活,可以支持多种不同的神经网络,但在性能和功耗方面会受到一定的限制。

4、芯片行业的竞争与困境 目前,寒武纪在AI芯片市场的对手不再只是与其处于同一起跑线上的国内外AI芯片初创公司。

各家芯片巨头也纷纷入局。

比如,Intel主导服务器市场多年,NVIDIA主导AI时代,高通、Xilinx崛起,ARM推出人工智能项目Trillium(NVIDIA开源DLA深度学习加速器项目将在集成到 Trillium 框架中,允许制造商构建自己的 AI 芯片)。

一款芯片产品光看参数可能很漂亮,但围绕它构建生态系统却不是一朝一夕就能完成的。

需要大量的技术、人力、财力的投入,以及时间的积累。

总之,芯片设计只是开始,但从芯片设计到实现的产业链却充满了“坑”。

至少有以下几个关键环节: 1、从PPT到流片。

从寒武纪此次发布的几款芯片来看,云芯片MLU选择了台积电的16nm工艺技术,工艺技术相对成熟,量产应该不成问题。

从展示的板卡产品来看,这个过程应该已经完成??了。

不过,1M处理器IP需要7nm工艺技术,目前市场上还没有终端SoC芯片。

目前,全球主流先进移动终端SoC先进工艺处于10nm水平,下一代有望迈向7nm,但真正有能力做到这一点的企业只有苹果、三星、华为海思。

如果1M不能继续与华为进行IP授权合作,应用落地将是一个大问题。

2、掌控芯片全产业链。

对于寒武纪这样的初创公司来说,相比芯片巨头来说,弱的往往不是AI技术或者AI芯片产品设计,而是源于芯片的一系列软硬件的开发和维护,包括指令集定义、芯片微架构设计、整体设计等。

芯片设计、相应软件和工具链的开发和维护、芯片上运行的操作系统、丰富的函数库、应用水平等。

3、时间和市场的验证。

这款芯片还需要得到大量用户的认可,才能真正在市场上站稳脚跟。

一旦大多数人认可了某种芯片架构和某种指令集,用户迁移的成本就会非常高。

这也是为什么曾有过多次“x86革命”想要取代x86架构,但最终都失败了,因为缺乏广泛的支持。

英特尔得以称霸PC和服务器市场多年。

5、有传言称新一轮融资已经完成,最后说一下融资和估值,寒武纪公司CEO、联合创始人、实际控制人陈天石是“寒武纪”相关五家公司的法人,其中包括:北京中科。

寒武纪、上海寒武纪半导体、雄安寒武纪科技、上海寒武纪信息科技北京分公司、上海汉武信息科技(2017年成立,已注销);此外,陈天石也是苏州寒武纪信息科技的股东(天眼查显示出资比例) 0.1%)和上海汉武信息技术季信息技术经理这些公司基本上都是北京中科寒武纪的全资子公司。

近日,有媒体报道寒武纪即将完成新一轮融资,融资后估值达20亿美元。

业内人士向智喜喜透露,寒武纪本轮融资已接近完成,融资总额为25亿元人民币,融资后估值为24亿美元。

国家队背景基金投资于该公司。

公开资料显示,年中,寒武纪完成1亿美元A轮融资,估值10亿美元,由国投创投、阿里巴巴、联想创投、国科投资、中国图灵、元和本源、永华领投。

投资也参与了投资。

以下为北京中科寒武纪目前持股名单,其中于2019年1月15日新增“国投(上海)科技成果转化创业投资基金企业”和“北京国科瑞华战略新兴产业投资基金”。

结语:“中国芯”的逆袭威力真的可能吗?中科寒武纪的学术背景、两位陈博士的师徒背景以及其背后的一系列政策和资本关系,都决定了我们不能仅从市场经济的单一角度来解读这家公司。

寒武纪的合作伙伴,包括华为、科大讯飞、中科曙光、联想等,都或多或少有着与寒武纪相同的基因。

在中美贸易关系和中兴案件再次刺痛“芯荒”软肋之际,中科寒武纪已成为我国AI芯片领域不可多得的强大力量。

与此同时,这股力量还在快速增长。

开发中。

不过,在成为“中国芯”的逆袭代表之前,必须逐步克服本文提到的这些“坎”,才能稳步发展。