当前位置: 首页 > 数码发展

寒武纪发布第三代云端AI芯片思元370

时间:2024-02-24 17:22:25 数码发展

昨天,寒武纪发布了第三代云端AI芯片思元370,以及基于思元370 MLU370-S4和MLU370-X4的两款加速卡,以及全新升级的Cambricon Neuware软件堆栈。

基于7nm工艺技术的思源370是寒武纪首款采用chiplet技术的AI芯片。

它集成了390亿个晶体管,最大计算能力高达256TOPS(INT8)。

它是寒武纪第二代产品思源。

是元270算力的2倍。

依托寒武纪最新智能芯片架构MLUarch03,相比峰值算力的提升,思元370的实测性能更加出色:以ResNet-50为例,实测性能MLU370-S4加速卡(半高半长)是同尺寸主流GPU的2倍; MLU370-X4加速卡实测性能(全高、全长)与同尺寸主流GPU相当,能效显着领先。

思源370也是国内首款支持LPDDR5内存的云端AI芯片。

显存带宽是上一代产品的三倍,显存访问能效是GDDR6的1.5倍。

同时,寒武纪全新升级Cambricon Neuware软件栈,新增推理加速引擎MagicMind,集训练和推送于一体,显着提升开发和部署效率,降低用户的学习成本、开发成本和运营成本。

新一代智能处理器架构MLUarch03 寒武纪智能处理器架构MLUarch03拥有新一代张量计算单元,内置Supercharger模块,大幅提升各种卷积的效率;它采用新型多运营商硬件融合技术,以软件融合为基础。

算子执行时间显着减少;片上通信带宽是上一代MLUarch02的2倍,片上共享缓存容量高达MLUarch02的2.75倍;全新MLUv03指令集推出,更完整、更高效、前向兼容。

在7nm先进工艺和全新MLUarch03架构的加持下,思源370芯片的算力最高可达256TOPS(INT8),是上一代产品思源270算力的两倍。

相比峰值的提升计算能力方面,思源370在实测性能和能效方面表现更出色:以ResNet-50为例,MLU370-S4加速卡(半高半长)的实测性能与同尺寸主流GPU相当。

2次; MLU370-X4加速卡实测性能(全高、全长)与同尺寸主流GPU相当,能效显着领先。