当前位置: 首页 > 科技观察

人工智能正在推动芯片复兴

时间:2023-03-13 21:51:43 科技观察

半导体是数字时代的基础技术。美国硅谷的名字就是由此而来。半导体技术是计算革命的核心,在过去半个世纪里改变了社会的方方面面。自英特尔于1971年推出世界上第一个微处理器以来,计算能力以惊人的速度发展。根据摩尔定律,当前的计算机芯片比50年前的芯片强大数百万倍。尽管数十年来处理能力飞速增长,但计算机芯片的基本架构至今基本保持不变。很大程度上,芯片创新需要进一步缩小晶体管的尺寸,让集成电路容纳更多的晶体管。几十年来,英特尔和AMD等制造商通过提高CPU性能取得了长足进步,克莱顿·克里斯滕森(ClaytonChristensen)将其视为“持续创新”。今天,这种情况正在发生巨大的变化。人工智能(AI)引发了半导体创新的“新黄金时代”——机器学习带来独特的市场需求和无限机遇,并首次激发企业家重新思考芯片架构的基本原则。他们的目标是设计一种专为AI设计的新型芯片,为下一代计算提供动力,这是目前所有硬件中最大的市场机会之一。新计算范式在计算技术发展史上,主流的芯片架构一直是CPU。如今,CPU无处不在,为笔记本电脑、移动设备和大多数数据中心提供动力。1945年,传奇人物约翰·冯·诺依曼构想出了CPU的基本架构。值得注意的是,自那以后,他的设计基本保持不变,直到今天,大多数计算机仍然是基于冯·诺依曼的机器。CPU的灵活性使其能够以多种方式使用:CPU是通用的,能够有效地执行软件所需的任何计算。但是,虽然CPU的主要优势是多功能性,但当今领先的人工智能技术需要一种非常具体和密集的计算。深度学习需要迭代执行数百万甚至数十亿个相对简单的乘法和加法步骤。深度学习基于线性代数,并从根本上基于反复试验:调整参数,乘以矩阵,随着模型本身的优化,在整个神经网络中重复对数字求和。这种重复和计算密集型工作流对硬件架构有重要要求。“并行化”指的是处理器同时执行多项计算而不是一个接一个地执行多项计算的能力,这已变得至关重要。与之密切相关的是,深度学习涉及大量数据的连续转换,因此将芯片的内存和计算核心尽可能靠近数据所在的位置放置,可以减少数据移动,从而大大提高速度和效率。CPU的功能还不足以支持机器学习的独特需求。CPU顺序处理计算任务,而不是并行处理。CPU的计算核心和内存通常位于不同的模块上,通过带宽有限的通信系统(总线)连接。这造成了数据移动的瓶颈,称为“冯·诺依曼瓶颈”,因此,在CPU上训练神经网络效率非常低。随着机器学习越来越受欢迎,越来越明显的是传统芯片无法满足现代人工智能算法的需求。正如AI专家YannLeCun最近所说:“如果你能穿越到未来五年或十年,看看计算机大部分时间都在做什么,我认为它可能类似于机器学习。”现在,需要GPU来推动AI的蓬勃发展。GPU架构是Nvidia在1990年代后期为游戏应用程序开发的。当时,GPU致力于持续处理大量数据,以高帧率渲染计算机游戏。与CPU不同,GPU可以并行运行数千个计算任务。2010年代初期,AI社区开始意识到Nvidia的游戏芯片实际上非常擅长处理机器学习算法所需的工作负载,而GPU幸运地找到了新的目标市场。Nvidia抓住了这个机会,将自己定位为“市场领先的AI硬件提供商”,并收获了惊人的收益——从2013年到2018年,Nvidia的市值增长了20倍。然而,正如Gartner分析师MarkHung所说,“众所周知,GPU并未针对AI工作负载进行优化。”虽然GPU已在AI中得到广泛采用,但它们并非为AI而生。近年来,一波企业家和技术专家开始重新构想计算机芯片,从头开始对其进行优化,以释放AI的无限潜力。AlanKay的话至今难忘:“真正认真对待软件的人应该自己做硬件。”近两年涌现出五家芯片独角兽,众多初创公司的估值令人瞠目结舌。为了避免被颠覆,传统的CPU巨头英特尔进行了两次重大收购:2016年4月以4.08亿美元收购了NervanaSystems,2019年12月以20亿美元收购了HabanaLabs。未来数年,对价值数百的市场的争夺还将持续数十亿美元。谁会是下一个英特尔?巨大的市场机遇,加上巨大的技术挑战,激发出大量令人惊叹的创意,意在打造理想的AI芯片。新一代AI芯片中最著名的初创公司之一是CerebrasSystems。简而言之,大胆的Cerebras开发了有史以来最大的芯片。Cerebras最近达到了17亿美元的市值,并从Benchmark和红杉资本等顶级投资者那里筹集了2亿美元。Cerebras芯片的尺寸令人难以置信,比典型的微处理器大60倍,并且是有史以来第一个包含超过1万亿个晶体管(准确地说是1.2万亿)的芯片。它还具有18GB的片上内存,这是有史以来最高的。将所有计算能力封装在一个芯片上的好处非常诱人:数据传输效率大大提高,内存和处理并置,可以进行大规模并行处理;然而,工程挑战也很大。多年来,制造晶圆级芯片一直是半导体行业的梦想,但从未实现。CerebrasCEOAndrewFeldman说:“每一条规则、每一个工具和每一个制造设备都是为巧克力曲奇大小的正常大小的芯片而设计的,而我们制造的芯片大小只有饼干盘的大小。所以我们必须做的每一件事每一步都是新设计。”Cerebras的AI芯片已经商用:上周,阿贡国家实验室宣布将使用Cerebras的芯片来对抗新型冠状病毒,另一家采用新方法进行芯片设计的公司是位于美国湾区的Groq。与Cerebras相比,Groq的芯片侧重于推理而非模型训练。Groq的创始团队拥有世界级的领域专业知识:作为迄今为止最早和最成功的AI芯片之一,谷歌TPU的十名原始成员中有八名项目加入了Groq团队,Groq颠覆了行业的传统观念,正在打造批量为“1”的芯片,即一次处理1个样本。根据Groq的说法,这种架构可以在不牺牲性能的情况下实现近乎即时的推理,这对于时间敏感的应用程序(例如自动驾驶汽车)至关重要。Groq的芯片主要是软件定义的,具有独特的灵活性,并且面向未来。Groq最近宣布,其芯片实现了每秒1万亿次运算的速度。如果属实,这将是有史以来最快的单芯片芯片。还有另一家公司,没有比这更好的技术愿景,那就是Lightmatter。Lightmatter由几位光子学专家创立,总部位于美国波士顿。Lightmatter正在构建一个人工智能微处理器,但它不是由电信号供电,而是由光束供电。目前,Lightmatter已从包括GV、SparkCapital和MatrixPartners在内的投资者那里筹集了3300万美元,以实现这一愿景。据Lightmatter称,这种独特的光技术使芯片的性能比现有解决方案好10倍。这个领域还有其他公司值得关注。地平线和寒武纪科技这两家中国公司分别获得了更多的资金和更高的市值。位于帕洛阿尔托的SambaNovaSystems也资金雄厚,技术先进,虽然关于SambaNova的细节仍然很少,但它的技术似乎特别适合自然语言处理。其他著名的初创公司包括:Graphcore、WaveComputing、Blaize、Mythic和Kneron。不仅如此,不少科技巨头也开始自主研发专用AI芯片,比如上文提到的谷歌TPU。谷歌从2015年开始研发TPU,走在了技术曲线的发展方向;去年12月,亚马逊大张旗鼓地宣布了InferentiaAI;自主研发AI芯片。总结目前,一场为即将到来的AI时代开发所需硬件的竞赛正在进行中。今天,半导体行业的创新比硅谷成立以来的任何时候都多,巨额资金不断涌入。未来几年,下一代芯片将塑造人工智能领域的形态和轨迹。用YannLeCun的话来说:“硬件能力……激发但限制了AI研究人员可以想象和追求的想法。我们不得不承认,我们可以使用的各种工具不断刷新我们的想法。”