2019年2月,两位图灵奖得主JohnL.Hennessy和DavidA.建筑学“新黄金十年”。今年,架构创新和小芯片获得了更多关注。从初创公司到巨头公司,从终端到云端,AI芯片相继推出。AI芯片市场竞争愈发激烈,但大多面临落地难。回顾2019年AI芯片的发展历程,六个关键词贯穿其中。展望2020年AI芯片市场,四大趋势不容忽视。六大关键词关键词一:架构创新JohnL.Hennessy和DavidA.Patterson两位图灵奖获得者在报告中表示,“计算机架构领域将迎来另一个黄金十年,就像1980年代的时候一样。我们正在做研究,新的架构设计将带来更低的成本、更好的能耗、安全性和性能。”雷锋网在2019年采访了英特尔高级副总裁、首席架构师兼架构、图形部门软件事业部总经理RajaM.Koduri,是否认同这两位图灵奖获得者的说法。他说:“我100%认同未来十年是计算架构新的黄金十年。未来10年,我们将看到比过去50年更多的架构优化和改进。”他还表示:“通过软件和硬件的结合,我们可以将摩尔定律提高十倍。”对于AI芯片,一个架构创新的重要价值在于解决了内存墙的挑战,AI芯片公司并没有让我们等太久,2019年5月,耐能发布了面向物联网的创新架构AISoC耐能称其为可重构架构,让芯片像搭积木一样组合,既能满足语音的要求,也能满足视觉的需求。一个月后,又推出了两款创新架构的AI语音芯片。探索科技CEO陆勇表示,其创新的SFA是一种以存储调度为核心的计算架构,计算是在数据在存储间移动的过程中完成的,计算只是一个数据的进化。这种架构不仅可以实现更高的能效,还支持任意神经网络,也适用于云端和终端芯片。探索科技的另一个SFA架构来自清微智能。它采用软硬件均可编程、混合粒度的可重构架构,芯片的硬件功能随着软件的变化而变化。应用改变软件,软件改变硬件特性。(CGRA)。清微智能创始人兼CEO王波表示,CGRA最大的优势体现在两个方面。一是没有传统指令驱动计算架构的取指和译码操作的延迟和能耗。以接近“专用电路”的方式执行。与CPU、GPU相比,性能提升十倍到千倍不等。GraphcoreIPU11月,英国AI芯片独角兽Graphcore联合创始人兼CEONigelToon在接受雷锋网采访时表示,Graphcore打造了一款全新的处理器类型IPU。IPU是专门为机器智能设计的处理器,可以满足人们对高效易用处理器的需求。IPU表面有1216个核心,我们称之为Tile,每个Tile都有计算单元和内存。数千个处理器工作,单个IPU的存储带宽可达45TB,比目前性能最快的HBM高出50多倍。同等算力下,功耗降低一半。同月,智存科技发布内存计算芯片。他们的芯片利用了FLASH可以存储和计算的特性。通过修改存储阵列和重新设计外围电路,电路可以容纳更多数据以满足AI算法的需求。同时,利用NOR-FLASH更成熟、易商用的特点,推出集存储和计算为一体的AI语音芯片。在AI芯片的架构创新中,可重构架构和存储计算一体化目前受到更多关注。关键词二:专用芯片AI芯片架构创新的目标是保持芯片的高能效,同时适应AI算法的不断演进。不过,2019年新推出的AI芯片,大部分都是专用加速器。ArmML业务组业务和营销副总裁DennisLaudick在2018年接受采访时认为,最终GPU和FPGA将消失,留下最通用的CPU和最专用的NPU。2019年,他坚持这个观点,认为未来市场需要通用加专用芯片,应用范围更广。对于这个问题,雷锋网向不同的受访者寻求答案。他们站在自己的立场上。他们有不同的看法,但大多数人认为,随着AI的成熟,AI芯片将会普及。这种判断也很好理解。对于产业来说,推出一款芯片最重要的价值就是获得商业价值。AI算法在快速迭代的时候,只有一定的编程能力,只针对一些算法,和现有的解决方案。与提升十倍以上的AI芯片相比,更容易被用户采用。这个逻辑用手机的NPU也可以很好的解释。最早将NPU加入手机SoC的公司是华为和苹果。其他手机的AI功能,并以此为卖点。与此不同的是,高通和联发科作为手机SoC的两大供应商,在AI算法不成熟、面向客户较多的情况下,往往会采用更通用的处理器,而在需要时再集成NPU。算法和应用都比较清楚,但仍然需要保持更高的AI性能和更好的灵活性。关键词三:ChipletChiple可以翻译为小芯片,也可以翻译为芯片。2019年,Chiplet概念的火热推动力包括DARPA的CHIPS项目、Intel的Foveros、AMD的新一代EPYC处理器。简单来说,Chiplet技术就像搭积木。通过先进的集成技术(如3D集成)将一些具有特定功能的预制芯片(Die)封装在一起,形成系统芯片。基本芯片是Chiplet。.这意味着Chiplet是一种新的IP复用模式。过去,芯片设计公司都是从IP供应商那里购买一些IP(软核(代码)或硬核(版图)),结合自研模块集成一个SoC,然后采用一定的半导体工艺来完成整个流程芯片设计与生产。未来,有了chiplet模式,你只需要购买别人设计的硅芯片,通过先进封装技术集成的芯片将是一个“超级”异构系统,可以为AI带来更多的灵活性和新的能力计算。机会。从某种程度上说,Chiplet是异构计算的更进一步,这在2018年被讨论得很多。SoC是一个异构系统。异构性之所以被广泛讨论,是因为AI对芯片提出了更高的要求。通过通用和专用异构系统可以更好地满足人工智能的需求。Chiplet的提出带来了工艺选择、架构设计和商业模式的灵活性,使得AI芯片更容易实现异构。挑战也很明显。除了先进的封装技术,标准和质量还不明确,编程的复杂性大大增加。关键词四:软硬件一体化为了降低异构系统的编程复杂度,软件平台的重要性就更加凸显了。这时候,可能就需要一个新的软件平台,甚至是一种新的编程语言。英特尔使用oneAPI来解决编程复杂性的挑战,同时也采用了基于标准的跨架构语言DataParallelC++++(DPC++)。oneAPI的意义在于提供统一的编程模型来简化跨不同计算架构的应用程序开发,这些架构通常简称为SVMS,包括标量处理器(CPU)、向量处理器(GPU)、矩阵处理器(AI加速器)和空间处理器。处理器(FPGA)。DPC++基于C++并融合了KronosGroup的SYCL编程语言,支持数据并行和异构编程,并包含在开放社区进程中开发的语言扩展。用于自定义调整特定加速器的跨行业开放解决方案,以及一种专用语言而不是单一架构。英特尔的解决方案是一种更上层的方法。Arm和许多IP提供商采用更底层的方法,不需要新的编程语言。它通过其软件平台直接与CPU、GPU或NPU通信,根据任务进行最佳匹配,解决异构性带来的编程挑战。但无论哪种方式,实现最佳匹配都非常具有挑战性。在更加重视异构性的AI时代,软硬件更好的融合是必然的,业界也更加意识到软硬件融合对于AI的价值。在由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,深圳市计算机科学研究院协办的2019第四届全球人工智能与机器人峰会(CCF-GAIR2019)上人工智能与机器人研究所、AI芯片大咖在专场中提到了软硬融合。英特尔数据中心技术销售部总工程师、人工智能首席技术架构师夏雷提出,AI计算必然需要软硬件结合。深从智能CTO朱成宇表示,软硬件融合让边缘计算成为可能。触景科技联合创始人兼CEO肖洪波表示,解决智慧城市的挑战需要一款简单易用的软硬件一体化传感芯片。天书智信创始人、董事长兼CEO李云鹏认为,在海量数据时代,软硬件充分融合显得尤为重要。中科院计算技术研究所研究员、先进计算机系统研究中心主任、中国开放指令生态系统联盟秘书长鲍云刚表示,软件与计算机之间存在巨大的性能差异。硬件。同一个算法或者程序,一个普通的程序员可以写出来,也可以由一个普通的程序员写出来。如果是懂架构的人写,性能能差63000倍。如果按照摩尔定律换算,相当于将摩尔定律延长了20多年。事实上,摩尔定律已经赋予了很大的能力,只是没有被挖掘出来。关键词五:有效算力软硬件一体化也意味着AI芯片的有效算力更高。有效算力之所以成为人们关注的焦点,是因为随着AI芯片的落地,用户发现即使AI芯片有很高的峰值速率,但有效算力可能会很低,无法带来预期的性能。推动。天书智信CEO李云鹏很早就意识到了这一点,所以他们的做法是不仅要提高平均算力,还要通过软件和硬件来提高峰值算力。云天励飞CEO陈宁在去年11月的发布会上也强调,我们更关注场景的有效算力,因为人工智能还处于非常早期的阶段,还没有进入通用人工智能时代。没有通用的AI芯片。有效算力=算力X效率XAI性能,对应芯片、工具链、算法应用。地平线还提出:单位成本下的峰值算力X编译器、架构和运行时优化X算法优化和演化以适应场景=全面优化AI芯片的真实性能。地平线副总裁、智能物联网芯片解决方案产品线总经理张永谦在雷锋网主办的全球AIoT行业智能制造峰会上发表演讲时表示,传统芯片基本都是讲PPA(Powerconsumption,Performance性能,Area芯片面积(成本))),当涉及到AI边缘侧计算时,这个评估就变得非常复杂。光有算力是不够的,算力的有效利用有赖于此。场景处理输出结果的有效性指标是衡量整个AI芯片(包括算法)最重要的指标。除了终端,专注于云端AI芯片的初创公司燧原科技,同样强调有效算力。随缘科技CEO赵立东表示:“在一个垄断的市场,所有的客户都希望有新的选择,让自己有一点议价能力,所以市场就有这样的痛点。另外,他们也希望有更高的性价比和能效比,尤其是在落地场景下能够达到的有效性能。”关键词六:开源2019年的另一个关键词是开源,其背后最大的推动力是RISC-V,RISC-V只是一个开源的指令集,基于这个指令集的IP、芯片、产品都会2020年推向市场。当然,还有很多RISC-VAI内核,不仅给AI芯片市场带来新的竞争力量,也有可能打破x86和Arm独霸芯片市场的现有格局OURS和GreenWaves都推出了基于RISC-V的边缘端AI芯片,华米首款自研AI芯片黄山一号也是基于RSCI-V指令集,并在其智能手表中得到应用。2019年之后,在RISC-V快速发展之际,Arm推出了一项新功能——ArmCustominstructions,允许客户为特定的CPU内核添加自定义指令功能,以加速特定用例、嵌入式和物联网应用。开源和AI也让诞生于Arm几年后的MIPS也宣布开源。WaveComputingCEOArtSwift认为,在AI和IoT的新时代,MIPS迎来了新的机遇。面对这个新机遇,大家站在同一起跑线上。而且MIPS的技术优势非常适合AI的结合。遗憾的是,2019年11月拥有MIPS的WaveComputing表示,从2019年11月14日起,Wave将不再提供包括MIPS开放日组件在内的免费下载,包括架构、内核、工具、IDE、模拟器和FPGA包和/或与之相关的任何软件代码或计算机硬件。开源领域也出现了新的力量。平头哥宣布开源MCU芯片设计平台。目标群体包括芯片开发商、IP供应商、高校和科研院所等,开发者可以基于该平台为细分领域设计定制化芯片。、IP供应商可以开发平台原生的核心IP,高校和科研院所可以开展芯片相关的教学和科研活动。四大趋势趋势一:AI语音芯片竞争加剧。人工智能应用的两个方向是视觉和语音。与视觉相比,语音不仅技术难度小,而且智能音箱产品的出货量非常大。在更加激烈的AI竞争中,为了保持优势,比算法强的公司纷纷推出自研AI芯片,比如Spiech。除了算法公司,拥有创新架构AI芯片的探景科技、智存科技、清微智能等都在2019年发布了语音芯片。其中,探景科技已经拥有30家合作伙伴,AI语音解决方案出货量达到100个万级,清微智能的AI语音芯片也已经量产,并产生了营收,智存科技也有不少感兴趣的客户。再加上为AI智能音箱提供芯片的传统芯片企业,AI语音芯片的竞争将更加激烈。当然,这种竞争伴随着市场需求的增加。未来几年,智能家居市场对AI语音芯片的需求有望快速增长。趋势二:云芯片市场迎来竞争。英伟达和英特尔率先享受到AI云端芯片市场的红利。其中,英伟达在云端AI训练市场的地位无人能敌。不过,随着英特尔推出NervanaNNP-T和NervanaNNP-I以及20亿美元收购HabanaLabs,以及即将在今年年中推出的独立GPUXe,英伟达与英特尔在芯片领域的竞争愈演愈烈。云端AI芯片市场将变得更加激烈。与此同时,国内的寒武纪、比特大陆、随缘科技都在2019年推出云端AI芯片,从细分市场切入云端AI芯片市场,目标是获得一定的市场份额。2020年,巨头和初创企业产品的陆续推出,将逐渐加剧云端AI芯片市场的竞争,并可能在一定程度上削弱Nvidia的话语权。趋势三:端云融合生态战正式打响无论是传统芯片还是AI芯片,芯片的成功本质就是生态的成功。因此,无论是芯片巨头还是初创公司,都有端云融合的战略。他们希望通过端云融合战略打造强大的生态系统,打造宽阔的护城河,保持公司业绩的持续增长。区别在于实现的难易程度。不同的。2019年,在云端AI芯片市场非常成功的英伟达和谷歌相继推出了面向边缘的AI芯片,或增强了边缘端AI芯片的实力。英特尔构建了全面的AI芯片类型来面对AI。由此看来,随着实力企业端云一体化AI芯片战略的落地实施,2020年边缘AI芯片初创企业将面临更大的生存压力。趋势四:易用性更重要。从语音到图像,从边缘到云端,落地的速度是在日益激烈的竞争中赢得一席之地的关键。事实上,2019年已经有很多商业化的AI芯片,但无论是大公司还是初创公司,很多都面临着芯片难以落地的问题。有各种各样的原因。比如芯片本身带来的性能提升就不够吸引人。芯片不满足应用需求,易用性不高,所选行业难以突破等等。因此,2020年芯片的易用性将变得更加重要,从技术上降低客户试用成本,加快产品上市时间,也可以弥补硬件迭代速度慢无法解决的痛点很好地满足应用要求。.
