【.com原稿】9月25日,达摩院院长张建峰在大会现场展示含光800AI推理芯片流片。杭州云栖大会。在业界标准的Res??Net-50测试中,含光800的推理性能达到了78563IPS,比目前业界领先的AI芯片性能提升了4倍;能效比为500IPS/W,是第二名的3.3倍。“含光800是阿里巴巴在芯片领域长征的第一步。”平头哥自去年在云栖大会上宣布后,在过去的一年里先后发布了玄铁910和无间SoC平台,今天又发布了含光800芯片;这一系列新品的推出,意味着阿里平头哥公司的产品线全面升级含光800是什么?含光800是一款主打推理的AI芯片。人工智能芯片主要体现在硬件架构和软件算法上,两者需要高度适配才能发挥芯片的最大价值。从目前来看,传统的CPU和GPU在深度学习方面并没有充分发挥其硬件能力推理任务,比如GPU架构主要是为图像处理设计的,其硬件结构和软件生态都差不多化。因此,很难对AI任务进行深度优化。表现如何?含光800在芯片架构方面,采用了创新架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩和量化处理的基础上,通过独特设计的数据访问和流水线处理技术,大大降低了I/O要求和数据移动。同时,NPU对卷积、矩阵乘法、向量计算和各种激活函数进行了深度优化。通过高效的硬件资源调度和完全并行的数据流处理,将AI计算的性能和能效都推向巅峰;含光800性能的突破,得益于软硬件的协同创新。在算法方面,阿里达摩院机器智能实验室近两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等,取得了多项高水平成果;硬件方面,阿里巴巴在服务器、FPGA、存储等领域拥有多年的研发经验。此外,平头哥的技术团队在架构、编译技术等方面有着深厚的技术储备。1个含光800芯片=10个GPU含光800的数据性能非常出众。现场主旨数据显示,1颗含光800的性能约为GPU的十倍,能效比达到500IPS/W;生产工艺同样采用12nm,晶体管数量高达170亿个;在对比了同类型的AI芯片后,小编得出结论,平头哥的含光800芯片也处于行业领先地位。含光800理论性能数据图实际性能含光800已经应用于阿里巴巴的核心业务。据云栖大会现场演示,城市大脑实时处理杭州主城区交通视频需要40块传统GPU,时延300ms,而使用含光800只需要4块GPU,延迟减少到150ms。另外,为什么大家经常使用的拍立淘产品速度这么快,也是得益于含光800的性能;派力淘产品库每天新增10亿张产品图片,使用传统GPU算力识别需要1小时,而使用含光800轻800后可缩短至5分钟。小编总结:目前含光800的价格尚未公布,但相信这款高性能芯片会是一款高性价比的产品;而平头哥系列芯片的发布,也意味着国产芯片的重大突破;在不久的将来,小编期待更多国产高性价比芯片的出现。【原创稿件,转载请注明原作者及出处为.com】【责任编辑:张斌TEL:(010)68476606】
