文章|半导体行业概况近期,台积电第一季度来自HPC的营收贡献达到41%,首次超越手机,成为第一大营收来源。
供应链方面也传来消息。
Nvidia内部预测,数据中心HPC芯片性能的年增长率将达到200~250%左右。
如果进展顺利,采用5纳米增强版的新产品预计最早将于2022年第三季度初左右上市。
出来。
长期以来,追求更高的算力一直是行业的主要创新方向。
此前,国家发改委高技术司相关负责人预测,国内每年算力需求将保持20%以上的增速。
随着对算力的要求越来越高,超级计算中心的诞生正在成为承载AI工作负载的主流趋势。
HPC芯片时代即将到来。
对 HPC 芯片的需求强劲。
未来,科技的发展将对算力产生巨大的需求。
英特尔预计到2025年将增长1000倍(千倍),四年内增长1000倍相当于摩尔定律的5次方。
从 COVID-19 检测到气候变化、金融风险分析和产品开发,世界有许多重大且具有挑战性的问题需要解决。
HPC系统快速、准确的数据处理能力,以及人工智能和机器学习算法,通过分析、建模和仿真将海量数据转化为可操作的见解。
HPC 使用户能够比标准计算机更快地处理大量数据,更快地获得见解,并使组织能够在竞争中保持领先地位。
HPC 解决方案的运行速度比最快的笔记本电脑快一百万倍。
从Hyperion Research 2021 HPC市场跟踪报告来看,2020年和2021年全球线下服务器市场规模分别为13.7美元和140亿美元,预计2022年将达到160亿美元;从HPC集群规模细分来看,超级计算、分支机构、部门和工作组分别为59亿美元、29亿美元、38亿美元和14亿美元。
HPC诞生于内部数据中心,但2010年下半年,云计算开始改变HPC。
这一优势最近作为新的 HPC 部署平台而出现。
随着高性能解决方案领域的扩展,供应商已开始提供混合选项。
混合 HPC 解决方案通常涉及补充现有本地数据中心的云功能。
英特尔一度错失手机SoC,被ARM超越;在人工智能计算时代,它被Nvidia的GPU超越。
不过,英特尔此次推出的GPU的目标是在人工智能训练领域取得成功。
Ponte Vecchio,基于英特尔的 Ponte Vecchio 处理器为 Aurora 超级计算机提供动力,该计算机将成为美国第一批突破 exaflop 障碍的高性能计算机之一。
虽然目前GPU市场主要由AMD和NVIDIA主导,但英特尔在GPU方面拥有大量的技术积累。
此外,未来计算架构的发展趋势是CPU和GPU融合,形成互联、互补、互操作的集成模式,降低计算和存储单元的通信成本。
作为CPU领域多年的领导者,英特尔在这一趋势上也有着得天独厚的优势。
英特尔GPU的愿景逐渐清晰:在计算多元化、算力需求爆发式增长的大趋势下,英特尔GPU将成为驱动新兴产业发展的算力基石,也将成为新兴产业发展的突破点。
英特尔自身业务的增长。
NVIDIA方面,得益于AI和图形的增长、X86 CPU的衰落以及数据中心计算规模的增长,全球各大云计算提供商都在使用NVIDIA的产品。
TOP10中的8台超级计算机和TOP500中的342台超级计算机均为NVIDIA产品。
2022年,该板块营收为106.1亿美元,五年复合增长率为66%。
在数据中心市场,Nvidia推出了针对大规模HPC和云计算的高性能CPU Grace。
此前有媒体报道称,英伟达下一代Ada Lovelace架构RTX 40系列GPU将采用台积电5nm工艺。
今年,英伟达也再次加大投资,收购了BrightComg。
以BrightComg为例,它销售用于HPC设备的大规模集群管理软件。
其平台支持x86和基于Arm的芯片以及NVIDIA GPU,可以灵活部署在数据中心、跨公共云或网络边缘。
英伟达还表示,此次收购将生产用于管理 HPC 系统的软件。
AMD今年将推进5nm Zen 4架构处理器的研发,预计2023年至2024年推出3nm Zen 5架构处理器。
先进制程方面,英伟达和AMD率先发起攻势抢订单,争夺榜首点。
HPC 分析公司 Hyperion Research 首席执行官 Earl Joseph 表示,他预计未来几年基于 Arm 处理器的 HPC 服务器将出现高速增长。
Arm 已经在 HPC 行业占据了一席之地。
日本RIKEN实验室的“富岳”超级计算机,富士通A64FX处理器以152,064个48核处理器排名全球第一,基于Arm架构。
Joseph 表示:“我们预计五年增长率将超过 31%,而基础市场的增长率约为 7% 至 8%。
”他补充说,这相当于到 2025 年基于 Arm 的系统将占据 HPC 市场的 10% 左右。
HPC 芯片推动先进封装 随着 HPC 需求的增加,台积电 HPC 客户的需求也在增加。
HPC在台积电收入中所占的份额正在迅速增加。
AMD 和 Nvidia 等供应商已在其 HPC 处理器中采用了它。
台积电的 CoWoS 封装。
事实上,台积电自2017年起也开始将InFO_oS技术应用于HPC芯片,并进入量产。
台积电推出的InFO_SoW先进封装技术将HPC芯片与散热模块直接集成在单个封装中,无需基板或PCB。
用于人工智能推理芯片的InFO_MS技术已于2019年下半年获得认证,可支持1x掩模尺寸内插器并集成HBM2内存。
苹果的A系列处理器是InFO_PoP封装的最大客户。
在封装HPC芯片的过程中,台积电还推出了支持超高计算性能HPC芯片的SoW封装技术。
SoW封装技术的最大特点是集成了芯片阵列、电源、散热模块等,采用多达6层的布线再分配(RDL)工艺技术将多个芯片和配电功能连接起来,然后直接贴合它们在散热模块中不需要使用基板和PCB。
在HPC芯片封装方面,国际封装测试领导者日月光也不甘落后。
据悉,日月光的Silicon Products有能力为HPC解决方案提供使用硅桥的封装技术,其扇出嵌入式桥(FO-EB)已经与英特尔和台积电的硅桥产品具有竞争力。
凭借先进的封装能力,日月光已进入美国顶级服务器芯片公司的供应链。
成为小芯片背后的力量 高性能计算应用程序需要更强大的处理器来处理大量工作负载来解决这些复杂问题,但不会消耗太多能源。
这就要求芯片设计能够同时实现高性能和低功耗。
挑战在于设备及其多核架构如何将高带宽密度与低延迟和高能效结合起来。
超大型芯片,例如 Cerebras 晶圆级引擎,为超大规模生产商提供了选择。
但从产量角度来看,大型先进节点单片芯片价格昂贵且生产具有挑战性。
从架构角度来看,所有超级计算机都是相似的。
该系统由大量机架组成,每个机架包含许多计算节点。
每个计算节点都有多个CPU和GPU。
传统上,许多此类芯片都是大型且复杂的片上系统 (SoC) 设备,所有功能都集成在单个芯片上。
但事实上,作为一种先进的封装技术,chiplet 为满足 HPC 芯片快速发展的性能要求提供了潜在的答案。
小芯片是小芯片,当集成到单个封装中时,可形成更大的多芯片设计。
通过将较大的设计划分为小芯片,设计人员可以获得产品模块化和灵活性的优势。
即使是在不同工艺节点上开发的单独芯片也可以组装成单个封装,以满足不同的细分市场或需求。
与大型单片芯片相比,它们也更容易制造并且产量更高。
至于小芯片封装,有多种选择可以支持更高的晶体管密度,包括多芯片模块 (MCM)、2.5D 和 3D 技术。
作为最早的系统级封装 (SiP) 类型,MCM 已经存在了数十年。
MCM 通过引线键合在单个封装中连接至少两个 IC。
2.5D 设计包括在单个封装中并排组装在中介层上的 GPU 和高带宽内存 (HBM)。
尽管逻辑不是堆叠的,但在某些 2.5D 设计中,HBM 由 3D 堆叠存储器组成,将 3D 内容带入 2.5D 设计中。
在 3D 封装中,异构芯片垂直堆叠并通过硅通孔 (TSV) 连接,这种架构为非常快的内存访问带宽铺平了道路。
HPC 设计经常使用各种封装类型的小芯片。
MCM 非常适合小型、低功耗设计。
2.5D 设计适合人工智能 (AI) 工作负载,因为 GPU 与 HBM 紧密耦合,提供了计算能力和内存容量的强大组合。
3DIC 具有垂直堆叠的 CPU 和快速内存访问功能,使其成为一般 HPC 工作负载的理想选择。
Hyperion Research 研究高级副总裁 Bob Sorensen 表示:“因此,从理论上讲,小芯片只是单个封装中多个芯片的最新体现。
” “但是小芯片允许 HPC 设计人员构建最适合 HPC 预期工作负载的精度的计算。
” 、内存和 I/O 功能。
”进入百亿亿次时代现在,不同国家正在相互竞争,积极部署基于小型芯片的百亿亿次超级计算机,其速度比当今的超级计算机快1000倍。
时代新系统。
中国、欧洲、日本和美国一直在开发每秒可执行10亿次计算的百亿亿次超级计算机。
美国还在开发另外两台百亿亿次超级计算机,其中包括在阿贡国家实验室建造的 Aurora。
Aurora 是围绕英特尔服务器处理器和 GPU 构建的。
对于百亿亿级超级计算机,Frontier、El Capitan 和 Aurora 系统已开始采用基于小芯片的解决方案。
进入百亿亿次时代,HPC芯片的战场再次吹响号角。