盘点AI芯片2021:打破“两堵墙”,存储与计算融合成为趋势应用,落地场景趋向细分化和垂直化。当人工智能进一步发展,深度学习模型的复杂度不断增加,硬件和内存逼近临界点,CPU等通用芯片无法满足人工智能任务的要求,AI芯片应运而生。同时,随着智能物联网时代的拉开序幕,越来越多的数据开始在云、边、端流动。快速增长的数据量对人工智能芯片的计算能力和功耗提出了更高的要求。AI芯片是人工智能应用中专门处理大量计算任务的模块,主要分为GPU、FPGA、ASIC。其中GPU主要处理图像领域的计算加速。是最早引入深度学习的类型,技术相对成熟;FPGA是一种可以重新配置电路的芯片。用户可根据需要进行重复编程,适用于多指令、多数据流。据分析,性能突出但技术壁垒高;ASIC是一种专用集成电路。除了无法扩展外,它在功耗和可靠性方面也有优势。定制化和低成本是其显着特点。国内外AI芯片市场发展现状2021年,全球“芯片荒”趋势仍未消退。在中美贸易战中,芯片是较量的重头戏。当中国致力于在2030年前成为人工智能产业的全球领导者时,美国自然不会甘心自己的技术头把交椅被撼动。在AI芯片战场上,国内外呈现出截然不同的局面。在“缺芯缺魂”的危机意识压力下,我国加大自主研发力度寻求突破。BAT互联网巨头自研AI芯片相继公布。百度发布自主研发的第二代昆仑AI芯片“昆仑芯2”并宣布量产。2代采用7nm工艺,通用性显着增强,可应用于互联网、智慧城市、智慧工业等领域;阿里平头哥自研AI芯片含光800成为双十一期间搜索、推荐等场景的主力算力。支持淘宝搜索、推荐等服务,其中淘宝主搜AI算力100%由该芯片提供;腾讯也在其数字生态大会上公布了自研芯片的进展,AI推理芯片紫霄的性能已经顺利流片并顺利点亮。在投融资领域,国产AI芯片赛道也颇为热闹。2021年将有超过40家AI芯片企业获得新融资。地平线、黑芝麻智能、随缘科技、比人科技、昆仑芯、摩尔线程等企业估值均超百亿。相比国内的百花齐放,国外AI芯片的格局要清晰得多。英伟达和英特尔在人工智能算力领域仍占据主导地位,仅有6家欧美AI芯片企业率先闯入独角兽阵营。晶圆级芯片卖给了阿联酋的云计算公司CerebrasSystems,英国的Graphcore,Groq,其创始团队是谷歌TPU的核心研发成员,Tenstorrent,行业龙头的新东家JimKeller,以及一家专注于边缘AI芯片的以色列初创公司Hailo,总体而言,受益于存量需求的替代和增量需求的释放,芯片行业将迎来新一轮的增长机会。不过,产能不足仍是困扰全球芯片产业的主要问题,在芯片应用领域,中国目前是全球最大的芯片应用市场,但芯片自给自足仍是一大挑战。纵观整个芯片市场,中国仍处于追赶阶段,尚未掌握话语权,国内芯片厂商虽多,但制程技术与国内仍有较大差距e国际领先水平。此外,芯片制造的短板也不容忽视。但“危机”二字已经包含了“转危为机”的可能。国务院印发的《新时期促进集成电路产业和软件产业高质量发展的若干政策》表明,集成电路产业的发展已经上升到国家战略的高度。未来,相信会有更多的资本和企业加入芯片设计制造的行列。值得关注的发展趋势:存算一体回顾2021年,值得注意的是,在AI芯片进入发展快车道的同时,基于下游应用的强劲带动,AI芯片的技术创新进程已晋升。其中,最引人注目的是长期处于理论阶段的“存储-计算一体化架构”芯片取得了不俗的进展,已有少数公司生产出成品。目前,集成存储和计算的AI芯片将成为未来的主流发展方向。为什么要开发内存计算集成芯片在传统的冯诺依曼架构下,计算和存储是分离的,两者之间通过数据总线传输数据。计算单元从内存中读取数据,计算完成后存回内存。但随着AI芯片的发展,这种架构已经成为制约计算系统性能提升的主要瓶颈之一。一方面,存储与计算性能不匹配的问题长期存在。内存的数据访问速度跟不上计算单元的数据处理速度,内存带宽在很大程度上限制了处理器的性能。“存储墙”另一方面,AI计算往往面临海量数据,有限的数据总线带宽严重制约了处理器的性能和效率,大量的数据传输导致高功耗,”“功耗墙”的挑战正在上升。由于“存储墙”和“功耗墙”两大拦路虎的存在,冯·诺依曼计算架构的局限性日益凸显,因此一种新型的计算架构正在应对未来应用场景挑战的迫切需要,在这样的背景下,存储计算一体化的概念重新进入了业界的视野,“存储计算一体化”并不是一个新鲜事物,它的概念最早可以追溯到1960年代,但由于生产成本、生产工艺和需求驱动等问题,并没有掀起太大的波澜,直到人工智能的发展igence这几年逐渐走上正轨,存储和计算一体化有了机会出现。由于计算是在存储单元中完成的,这直接解决了长期以来困扰业界的“存储墙”问题,并降低了数据传输过程中高达90%的功耗。同时,这种架构也减少了等待数据读取时的算力浪费,实际性能更好。这一优势被认为是解决AI特定场景需求的关键。“存储-计算一体化”赛道的布局在国内外尚处于起步阶段。因此,无论是行业龙头还是初创企业都在积极积蓄力量,希望在这条赛道上保持领先,或者实现弯道超车。在国外巨头中,三星的动向值得持续关注。2021年2月,三星宣布推出HBM-PIM内存计算技术,将内存处理(PIM)集成到高带宽内存(HBM)配置中。这也是业界首款HBM集成AI处理芯片。根据官方资料,三星的PIM通过一个可编程计算单元(PCU),与现有的内存方案相比,理论上可以提升4倍的性能。此外,美国AI芯片初创公司Myhtic也是该领域的重要玩家。Mythic在其2021年的C轮融资中筹集了7000万美元,使Mythic自成立以来的总资金达到1.652亿美元。2020年底,Mythic推出了第一代AI芯片M1108AMP。与很多AI芯片不同,M1108基于更成熟的模拟计算技术,在芯片上封装了足够的存储和大量的并行计算单元,最大限度地提高内存带宽,降低数据移动能力。在国内企业中,看准这一趋势的阿里巴巴可谓是相当果断。2021年12月,达摩院宣布成功研发出全新的内存计算一体化架构芯片,这是全球首款基于DRAM的3D键合堆叠内存计算一体化AI芯片。除了阿里之外,不少初创公司也开始在这条赛道上发力,智存科技、猴魔智能、九天瑞信都是领跑者。智存科技成立于2017年,推出了全球首款集成存储计算加速器WTM1001和首款集成存储计算SoC芯片WTM2101。截至2021年,智存科技已完成近3亿元的A轮融资。作为国内第一家利用存储计算一体化技术打造大算力芯片的公司,厚墨智能有着非常清晰的愿景:打造“十倍效能”的AI芯片,满足现实世界对超强算力的需求。人工智能时代。九天锐芯成立于2018年,专注于神经形态记忆计算集成芯片的研发。2021年,九天锐芯设计了一款基于SRAM的传感-存储-计算一体化架构芯片ADA20X,可广泛应用于各种视觉场景。目前,内存计算集成芯片主打低时延、低功耗、高算力要求的边缘计算,主要应用于音频、健康、低功耗视觉等端侧应用场景。随着AI应用的日益丰富,终端厂商在推广大规模应用阶段必然会关注成本问题,而成本与功耗直接相关。低功耗的AI芯片往往意味着它可以实现整机的低成本。这无疑是存储计算一体机的一片蓝海。荆棘与花同在,任何技术都不是“万能药”,存储与计算的融合亦是如此。它只针对某一类计算,尤其是基于数据的AI计算,不适用于CPU等基于控制的计算。而且,这种架构正处于从学术界向工业界迁移的关键时期。要想真正实现成功转型,一方面需要对存储与计算融合技术有深刻的洞察,另一方面也需要对AI应用的落地有透彻的理解。两者结合才能产生质的变化,实现实质性的突破。此外,存储计算一体化作为新的芯片方向,在电路设计、架构、软件等诸多层面仍面临挑战。由于内存计算集成芯片与常规芯片设计方案的差异,目前市场上还没有成熟的专用EDA工具来辅助设计和仿真验证;与之兼容的软件。如何完善重要技术的生态链,是行业上下游厂商应该共同思考的问题。“时代造就英雄”。计算架构的每一次重大变革都会产生新的王者。从大型机时代的IBM,到PC时代的英特尔,再到移动时代的高通,现在我们正在进入智能物联网时代。问芯片界,谁主沉浮?我们拭目以待。
