当前位置: 首页 > 科技观察

全球首款3D晶圆级封装处理器IPU发布,突破7nm制程极限

时间:2023-03-22 10:19:36 科技观察

英国AI芯片公司Graphcore发布新一代IPU产品Bow,这是其第三代IPU系统,并且会在发布后第一时间发货给客户。与上一代IPU相比,BowIPU性能提升40%,能耗比提升16%,电源效率也提升16%。值得注意的是,此次BowIPU的性能提升并不主要依赖于采用更先进的制造工艺。BowIPU采用与上一代IPU相同的台积电7nm工艺。-on-Wafer)以提高性能和能耗比。作为全球首款3DWoW处理器,Bow证明了将芯片性能提升范式从先进制造工艺转移到先进封装的可行性。新一代IPU性能提升40%,价格不变。2016年Graphcore成立,开创了新型处理器架构IPU。由于其架构上的创新,英国半导体之父赫尔曼·豪瑟称其为计算机史上的一次突破。第三次革命。经过六年的发展,Graphcore旗下IPU在金融、医疗、电信、机器人、云、互联网等领域逐渐取得成果。本周四,Graphcore推出了第三代产品BowIPU。据Graphcore称,与上一代M2000相比,第三代IPU的性能提升了40%,每瓦性能提升了16%,意味着能耗比提升了16%。不过,AI芯片的真正性能还需要在不同的应用领域进行探讨。为此,Graphcore还给出了Bow在不同垂直领域的表现。在图像方面,无论是典型的CNN网络、最近流行的VisionTransformer网络,还是深度文本转图片网络,与上一代产品相比,BowIPU都有30%到40%的性能提升。在EfficientNet-B4项中,接近理论上限。BERT训练模型是自然语言中的经典模型。基于BERT,OpenAI提出了垂直扩展或水平扩展,如GPT-1、GPT-2、GPT-3。通过更深的网络层数和更宽的网络宽度,可以提高模型的性能。并且精度进一步提高。“我们可以看到这些模型在我们最新的硬件形式上大大提高了性能。”Graphcore中国区工程副总裁、AI算法科学家陈瑾介绍。不仅如此,转化为实际模型的吞吐量,与IPUPOD64相比,在计算机视觉的ResNet50和EfficientNet-B4训练模型中,BowPod64的吞吐量可以达到34%和39%的性能提升。自然语言方面,BERT-LargePh1预训练模型和语音识别ConformerLarge训练模型,后者在吞吐量上有36%的提升。作为Nvidia的竞争对手,Graphcore自然不忘将BowPod16与DGX-A100进行对比。实验数据表明,EfficientNet-B4backbone的训练在DGX-A100上需要70小时的训练时间,而在BowPod16上只需要14小时左右。GraphcoreBowIPU如何实现接近理论极限的性能提升?5nm不再是首选,先进封装更具性价比。从芯片规格来看,BowIPU是全球首款基于台积电的3DWafer-On-Wafer处理器,单个封装内拥有超过600亿个晶体管。350TeraFLOPS的人工智能运算性能是上一代MK2IPU的1.4倍。片上存储与上一代相比没有变化,依然保持0.9GB的容量,但吞吐量从47.5TB提升到了65TB。Graphcore大中华区总裁兼全球首席营收官陆涛表示:“变化主要体现在它是晶体管尺寸增大、计算能力和吞吐量增加的3D封装处理器。”在大家关心的工艺方面,BowIPU延续了上一代台积电的7nm工艺,没有任何变化。理论上,芯片的性能提升很大程度上取决于工艺的进步,但随着工艺越来越接近物理极限,摩尔定律逐渐失效,业界不得不寻找新的技术方向来延续摩尔定律。其中,3D封装是广受业界青睐的技术方向。中国工程院院士、浙江大学微纳电子学院院长吴汉明曾在一次演讲中提到,如果将芯片制造和芯片封装结合起来,40nm工艺的性能和功耗要求可以也可以通过65nm工艺实现。BowIPU正好验证了吴院士的观点。陆涛表示,BowIPU产品的性能提升主要来自3DWoW和新Die。至于为什么选择改变封装方式,而不是采用更先进的工艺,陆涛表示,MK2IPU拥有594亿个晶体管,约823平方毫米,这已经是单个7nmDie所能生产的最精密的芯片了.“当我们评估7nm、5nm、到3nm不同工艺节点的收益时,我们发现7nm到5nm的生产工艺改进带来的收益并不像之前的28nm到14nm,能带来数十的百分比。收入下降到20%。这时候,我们可以通过其他途径和方法获得同样的收入。”通过3D堆叠,BowIPU的两个Die增加了晶体管的数量,其中一个Die(ColossusDie)和上一代一样,AnotherDie主要用于改善跨ColossusDie的功率传输,优化了工作节点ColossusDie,转化为有效的时钟加速。在与台积电的合作方面,陆涛告诉雷锋网,Graphcore在一年前就与台积电合作了一款测试芯片,与台积电的关系非常密切。此外,AI处理器本身规模大,需要一些新技术的支持落地,而从台积电的角度来看,新技术也需要有需求的产品共同推动,值得一提的是,虽然封装方式有所改变,BowIPU开箱即与上一代产品100%软件兼容,无需任何代码修改,老用户无需任何软件适配工作即可获得性能提升。即时的。目前美国国家实验室PacificNorthwest尝试做了一些基于BowIPU的Transformer模型和图神经网络,面向计算化学和网络安全方面的应用,并给予了比较积极的反馈.继续3D封装,开发超越人脑的超级智能机器BowIPU使用3D封装只是一个起点。面向未来,Graphcore正在开发一种超级智能机器,可以用来超越人脑的处理能力。Graphcore将正在开发的产品命名为GoodComputer。一方面是希望计算机能够对世界产生积极的影响,另一方面是向著名计算机科学家古德致敬。GoodComputer基于3DWoW,预计未来GoodComputer将包含8192个IPU,提供超过10Exa-Flops的AI计算能力,实现4PB存储,可助力开发具有规模的人工智能模型超过500万亿个参数。根据配置的不同,GoodComputer的成本在100万到1.5亿美元之间。陆涛表示,GoodComputer的开发还是会使用IPU的架构。IPU的存储在处理器内部。接近脑计算的工作原理,只是将计算和存储结合起来。此外,Graphcore还将从软件端更有效地支持稀疏化,实现类脑计算。