当前位置: 首页 > 科技赋能

AI芯片的终极难题被清华IC男神解决了!

时间:2024-05-22 18:14:44 科技赋能

文章 |李娜介绍:过去六个月,人工智能的发展重点逐渐从“软”转向“硬”,随之而来的是新一代AI芯片产业的全面崛起。

时隔数月,智东西首次报道了AI芯片全产业链的近百家核心企业,涵盖国内外主要巨头企业、新兴初创企业、场景应用、代工生产等,提供全面、深入的行业资讯。

深度剖析芯片产业的发展与发展。

对创新创业进行跟踪报道。

这是智能AI芯片行业系列报告之一。

随着机器学习算法的不断变革和人工智能应用的不断增加,神经网络计算芯片(AI芯片)的设计者开始思考的一个关键问题是如何保证优异的AI芯片性能/功耗。

同时,它应该适用于尽可能多的人工智能算法。

目前市场上涌现的AI芯片中,不少采用重新设计芯片底层架构的方法来平衡AI芯片的性能与AI算法的通用性之间的矛盾。

这凸显了参与者包括寒武纪、谷歌TPU项目等。

行业如此蓬勃的发展离不开学术界的长期积累。

近十年来,清华微电子研究院可重构计算团队一直在研究一项核心技术——“软件定义芯片”。

前年,他们推出了一款代号为 Thinker 1 的 AI 芯片,该芯片不仅可以支持人脸识别、语音识别等 AI 算法,而且芯片的功耗非常小——只需要 AA 电池即可运行整整一年。

今年春节前夕,智熙熙来到清华大学校园,会见了GTIC的重要嘉宾之一、清华大学微电子研究所所长、中国半导体行业集成电路设计分会理事长。

协会,也是我国半导体行业的“男神”。

资深人士魏少军教授围绕AI芯片话题进行了独家对话。

魏少军教授拥有数十年的半导体行业经验,对我国半导体行业有着深入的了解,他的观点往往很犀利。

他认为,当前芯片架构创新已引起全球各院校/企业的广泛关注,特别是“软件定义芯片”相关研究,是提升AI芯片应用范围、适应变化的重要研究方向。

人工智能算法。

今明两年AI芯片仍将持续火热,但大约在这个时候,行业将会重新洗牌,第一批玩家将会出现。

1. 性能与灵活性:鱼与熊掌不可兼得。

芯片的性能和多功能性通常是“两全其美”的选择。

传统架构下,芯片在某些特定领域的性能越强、功耗越低,往往灵活性和通用性就越差。

例如,华为Mate 10中的麒麟芯片对于手机来说功能非常强大,但不适用于安防摄像头、可穿戴手环等场景;同样,一个CPU可以灵活地处理许多不同的任务,但它的性能对于某些特定任务来说往往不够强大。

例如,深度神经网络训练的性能不如GPU。

ASIC等专用芯片的地位介于手机SoC等标准芯片和CPU等通用芯片之间——这是一个非常尴尬的地位。

虽然单个标准芯片的开发成本较高,但单个类别的开发出货量非常大,这大大降低了芯片的单个价格;相反,通用芯片,虽然整体出货量不高,但单个品类的价格很高,研发成本也可以分担。

随着芯片制造工艺越来越先进(目前已接近7nm),芯片制造成本也随之增加。

如今,设计和制造一颗10nm芯片的成本就高达数千万美元,综合成本高达数亿美元。

因此,如果不能保证某种产品能够在单一应用场景下大批量出货,专用芯片就需要保持一定的通用性和灵活性。

近两年,神经网络计算专用芯片(AI芯片)开始在业界崭露头角。

寒武纪、深鉴科技、中星微电子等玩家的AI芯片产品均采用28nm芯片技术。

一部影片的成本超过1万美元,如果单一品类的出货量不在百万级,就很难收回成本。

除了成本之外,还需要考虑AI算法的演进。

由于人工智能算法仍处于不断变化和进化的过程中,人工智能经历了六十多年的发展才迎来深度学习的大规模爆发。

然而深度学习算法还有很多方面需要优化。

比如稀疏化、低功耗、小数据训练等,算法还没有最终确定。

另外,目前语音/文本/图像/视频等不同应用无法使用统一的算法。

然而,许多现实生活中的人工智能应用(识别图像中的对象或理解人类语言)需要具有不同层数的不同类型的神经网络。

组合。

因此,在保证AI应用性能的前提下,AI芯片需要尽可能保持芯片的通用性。

目前,AI芯片公司采用不同的技术方案。

如果以芯片通用性作为评价轴,最左边、最激进的公司会采用算法固化的解决方案。

这种方式成本低、芯片实现时间短、算法单一。

性能与功耗比可以做到极致,但却大大降低了芯片的通用性和灵活性;最右边的团队(如寒武纪、谷歌TPU等)将设计新的芯片架构。

这种方式成本较高,芯片开发周期较长,但可以在性能和芯片通用性之间取得极佳的平衡。

▲清华大学微电子研究所所长魏少军教授。

清华微电子研究所的可重构计算团队属于坐标轴右侧的类别。

今年以来,清华微电子研究所所长魏少军教授带领团队继续对此进行深入研究。

重要技术——“软件定义芯片”,又称“可重构计算技术”。

顾名思义,“软件定义芯片”让芯片根据软件进行适配和调整。

这是专用芯片架构设计上的创新,与传统的冯诺依曼架构有很大不同。

简单来说,就是将软件通过不同的流水线输送到硬件来执行功能,使芯片可以根据软件/产品的需要实时改变其功能,实现更加灵活的芯片设计。

也就是说,采用这种架构设计的专用芯片可以让芯片的计算能力适应软件的需求,而不是采用传统芯片设计的死板架构让应用程序去适应架构。

对于尚未定型/统一的各种AI算法,可重构计算已成为AI芯片设计的重要研究方向。

2. Thinker AI芯片:语音和图像双重识别,一是续航。

年前(年),根据可重构计算芯片的框架,魏少军教授团队尹守义副教授主导设计开发了一款代号为Thinker 1的可重构混合神经网络计算芯片。

该芯片不仅可以动态调整计算和内存需求,使该芯片能够支持人脸识别和语音识别的神经网络应用,而且该芯片的功耗非常小——只需要八节 AA 电池即可运行。

一整年。

Thinker 1不仅在AI性能和算法通用性方面取得了突破性进展,还获得了学术界的重要认可。

在ACM/IEEE ISLPED低功耗电子与设计国际会议上,Thinker 1荣获设计竞赛奖。

这是中国大陆单位首次以第一完整单位的身份获此殊荣。

魏少军教授告诉智洞智,Thinker 1是一款实验验证芯片。

为了证明“软件定义芯片”架构在AI芯片设计中的可行性——效果出奇的好。

随后,可重构计算团队又打造了两款Thinker系列芯片,即Thinker 2人脸识别芯片,可实现6ms人脸识别(iPhone X为10ms),准确率超过98%;而Thinker S语音识别芯片不仅功耗仅为几微瓦,只需要一节AA电池就可以运行一整年,而且还可以进行声纹识别。

▲清华大学微电子提供的Thinker芯片微照 Thinker可以嵌入到很多小型设备中,包括智能手机、手表、家庭机器人,或者远程控制的仪器设备。

目前,研究团队正在与厂商沟通Thinker芯片的产业化计划。

此前有消息称,我们最快将于今年3月看到首款搭载Thinker芯片的终端智能产品。

不过,清华微电子研究院会将这项技术授权给企业使用,学校本身不会将其产业化。

魏少军教授表示,清华微电子在可重构计算方面的研发投入已有十多年。

此前它一直专注于其他芯片的研究。

该架构已经应用于AI芯片的设计中,并取得了如此好的效果。

效果完全“出乎意料”。

下一步,可重构计算团队将加大基础研究(特别是编译器等相关软件)的投入,并进一步推动产业应用和企业合作的进程。

除人工智能(AI)外,该技术已在信息安全芯片、可编程逻辑器件、可穿戴计算芯片等领域批量应用。

魏少军教授领衔的可重构计算团队还获得国家两期计划支持、国家技术发明奖二等奖、教育部技术发明奖一等奖等国家级荣誉。

去年12月,清华微电子研究院、澜起科技、英特尔联合推出了基于该技术开发的津逮服务器CPU,不仅可以大幅提升云服务器的计算能效,还可以实现实时监控、筛查、控制,大大增强CPU芯片的硬件安全性。

3. AI芯片在安防监控领域的应用是否广泛? “也许我们走错路了。

”目前,人工智能应用仍处于早期阶段。

它们主要针对互联网应用,需要在云端进行处理。

端到端的智能还没有广泛普及。

在这股不断兴起的人工智能浪潮中,最热门、最常被提及的行业是安防,或者更准确地说,是基于安防监控摄像头的面部识别应用。

这不仅是众多AI芯片和AI平台应用厂商瞄准的行业,也是各个传统安全巨头都渴望瞄准的AI+安全。

不过,在谈话中,魏少军教授向智动智提到,目前AI芯片在视频监控上的应用很可能走错了路。

由于目前安防监控的智能化仍以人脸识别为主,在广场、车站等远距离、大范围的监控场景中,无法看清人脸。

虽然这些场景下的人脸识别项目看似纯粹从技术角度来说却是一个可行的项目。

然而,一旦设计好照明、遮挡、摄像头清晰度、芯片可承载的算力和网络带宽等工程问题,情况就变得非常复杂。

▲ 2018年北京奥运会门票。

一位既有传统芯片厂商又有安防厂商背景、参与过2018年奥运会“刷脸票”、天安门广场安防管控等项目的AI芯片初创公司CEO也告诉我类似的结果。

国内大型广场的人脸识别项目——比如天安门广场人脸识别项目——根据天安门分局去年的调查结果,这个项目实施难度仍然很大,是一个美丽的“理论幻想”。

如果按照智能摄像头车牌识别的技术类比,经过十几年的技术演进和形态变化,目前北京有65万个交通摄像头,其中只有3个在公安道路上,3个在停车场。

执行智能车牌识别。

上千条道路,而且只有解决了光照、图像对齐等问题后才能在特定路口、特定场景实现——而人脸识别远比车牌识别复杂。

因此,AI安防虽然可以在局部场景(如中短距离、室内监控、门禁人脸识别、车辆识别等)实现,但距离真正安防的广泛应用还很远。

魏少军教授表示,人工智能只是方法,人工智能芯片也只是手段,但最重要的是人工智能应用的落地。

结论:2020年AI芯片或将进入洗牌期。

魏少军教授认为,与发达国家相比,我国芯片工艺技术仍存在两三代工艺技术的差距;我们原本希望,在今年之前,与国际最先进制造技术水平的差距,不超过两代,现在看来实现起来比较困难。

另外,从芯片行业的人才、产能、研发、设计等几个重要因素来看,我们的行业差距还比较明显。

我国芯片产业目前在高端芯片研发方面遇到诸多挑战。

如果我们仍然遵循传统架构,以同样的速度发展,我们将永远落后于别人——因此,芯片设计底层架构的创新就显得尤为重要。

目前,我们在传统芯片行业的软件定义芯片、AI芯片等“破冰者”方面已经取得了不错的研究成果,值得加大投入。

魏少军教授认为,从行业发展规律来看,今明两年AI芯片将会持续火爆,大家都会加入进来。

不过,在这个时候,会出现一批玩家,行业将会重新洗牌。

由于AI算法仍处于不断进化和聚合的过程中,最终的成败将取决于每条技术路径的选择和产品推出的速度。