当前位置: 首页 > 科技观察

GraphcoreBowIPU正式发布:性能提升40%,能效提升16%,无需改代码

时间:2023-03-20 19:10:49 科技观察

性能提升40%,能效提升16%,上一代平台任何应用均可无需任何代码更改即可运行,价格保持不变。以上就是Graphcore新发布的第三代IPU相比上一代的优势。第三代IPU名为BowIPU,也是全球首款基于台积电的3DWafer-on-Wafer处理器。Graphcore大中华区总裁兼全球首席营收官陆涛  在近日Graphcore举办的线下媒体交流会上,Graphcore大中华区总裁兼全球首席营收官陆涛详细介绍了新一代产品。各种优点。他表示,与上一代产品相比,BowIPU不仅有非常明显的性能提升,还为用户带来了更好的产品选择,而且产品发布后即刻上线,合作伙伴已经可以买到新品,并且将其应用于企业的各种计算场景。  全球首款基于TSMC3DWafer-on-Wafer的处理器  作为全球首款基于TSMC3DWafer-on-Wafer的处理器,BowIPU采用TSMCSoIC-WoW技术,7nm制程,堆叠两个die一起。这种3D封装的设计使得单个封装芯片的晶体管数量超过600亿个,具有350TeraFLOPS的人工智能计算性能。  据陆涛介绍,与上一代MK2IPU250TeraFLOPS相比,BowIPU的性能提升了40%,并且通过优化供电系统,每瓦性能也更加出色。片上存储方面,与上一代MK2IPU相比,没有变化。它仍然有0.9GB的容量,但吞吐量从47.5TB/s增加到65TB/s。此外,处理器核心数、独立线程数、接口等与上一代处理器相比也没有变化。  以Bow-2000为例,IPU-Machine与上一代IPUMachine:M2000(IPU-M2000)一致,采用4个BowIPU。不同的是,上一代产品可以在1U刀片中提供1PetaFLOPS的计算能力,而Bow-2000可以提供1.4PetaFLOPS的计算能力。除此之外,Bow-20001U刀片具有3.6GB的处理器内存储、260TB/s的吞吐量、高达256GB的IPU流存储和2.8TbpsIPU-Fabric。  陆涛表示,BowIPU是Graphcore与台积电的联合创新产品。与上一代产品相比,它可以提供更好的每瓦性能,具有更高的性能比。是AI计算的首选。  丰富的软件栈生态是性能提升的关键  除了硬件创新,丰富的软件栈生态也是BowIPU性能提升的关键因素。Graphcore中国工程副总裁兼AI算法科学家金晨  据Graphcore中国工程副总裁兼AI算法科学家金晨介绍,在PoplarSDK中,不仅有Graphcore开发的图形编译器和驱动,还有上层XLA后端。这些软件的支持使得BowIPU在不同应用的性能上得到了广泛的提升。  在此之上,Graphcore还提供了相对丰富的生态。比如在AI软件框架上,可以支持PyTorch、TensorFlow、HALO、PaddlePaddle、以及高层APIKeras等。在用户方面,可以支持JupyterNotebook、InferenceDeploymentToolkit等,帮助客户实现推理集成的部署。  此外,Graphcore也在加速开发者社区建设,提供丰富的代码用例,以及各种文档和视频演示。  金晨表示,Graphcore在机器学习应用中提供了大量的模型实例,涵盖了不同的AI垂直领域,包括大模型、语音模型、语言模型等在内的模型库也在不断迭代和增加。此外,在云端,Graphcore还提供了广泛的部署、监控和管理软件集成。  金晨也用一些数据展示了BowIPU的性能优势。例如在ASR模型和TextToSpeech(文本转语音)模型上,性能提升了约39%。  除了保证高性能的提升,大部分机型都能实现接近96%的电源效率,更加环保节能。  新一代BowIPU性能大幅提升,功耗更佳,但相应的价格没有变化。在沟通会上,陆涛对这个问题进行了回应。他说,“我们为下单了IPU-M2000的老用户准备了一些优惠方案,保证这些老客户每块钱也能得到差不多的性能。”  官宣:好电脑(GoodComputer)  在媒体沟通会上,Graphcore还正式公布了下一代超级计算机:好电脑。  陆涛表示,人脑中大约有860亿个神经元和100万亿个突触。这个突触相当于人工智能中模型中的参数个数。他强调,与真正的人脑相比,最大的人工智能模型的参数可能还有100倍左右的差距。因此,Graphcore目前正在研发一种超级智能机器,可以用来超越人脑的处理能力。  据介绍,这台名为GoodComputer的电脑有两层含义。一个是好电脑,希望电脑能带来积极的影响;另外就是致敬前辈,Good是一位非常知名的计算机科学家。  》GoodComputer未来大概可以达到8192GraphcoreIPU,可以提供超过10Exa-Flops的AI算力,并且可能继续演进到3DWafer-on-Wafer,可以达到4PB的存储,可以帮助500多个GraphcorePoplarSDK全面支持万亿参数规模的人工智能模型开发。”陆涛表示,根据不同的配置,大概价格在100万美元到1.5亿美元之间。