在《自然》杂志最近发表的一篇论文中,IBM 研究 AI 团队使用大规模模拟内存阵列来训练深度神经网络( DNN),达到与 GPU 相当的精度。
研究人员声称,这款“芯片”可以实现两倍于GPU的能源效率,并在相同面积内实现两倍的计算能力。
这是开发下一个人工智能突破所需的硬件加速器的重要一步。
IBM 研究人员 Stefano Ambrogio 此前担心:我们可以在比 GPU 更快的系统上进行训练,但如果训练操作不够精确,那就毫无用处。
到目前为止,没有证据表明使用这些新设备与使用 GPU 一样准确。
但在上周发表在《自然》(使用模拟存储器的等效精度加速神经网络训练)杂志上的一篇论文中,Ambrogio 和他的同事描述了如何利用新的模拟存储器和更传统的电子设备。
组件组合在一起可创建出与 GPU 精度相匹配的芯片,同时运行速度更快且能耗更少。
使用新的记忆技术训练深度神经网络变得困难,因为这个过程需要每个神经元的处理。
安布罗吉奥说,元素的权重被上下刺激数千次,直到网络完全对齐。
改变这些设备的电阻需要重新配置它们的原子结构,并且刺激的强度并不总是相同。
同样,这会导致神经元权重的调节不精确,因此研究人员通过创建“突触单元”解决了这个问题,每个突触单元对应于网络中的单个神经元,并且具有长期和短期记忆。
该单元由一对相变存储器(PCM)单元组成,它们在电阻器中存储重量数据,以及三个晶体管和一个电容器的组合,这是一个“非 PCM”单元。
“易失性存储器”意味着即使没有外部电源,它也能保留存储的信息,而电容器是“易失性的”,因此只能保留几毫秒的电荷。
但电容器不具有 PCM 器件的可变性,因此可以快速准确的编程。
当神经网络在图像上进行分类任务时,仅更新电容器权重,然后将权重传输到 PCM 单元以进行长期存储。
与GPU结合处理全连接层的计算,同时执行其他任务。
他还认为,处理全连接层的有效方法可以扩展到其他更广泛的领域。
安布罗吉奥表示,主要有两个应用:将人工智能引入个人设备和提高数据中心的运行效率。
但显然它更有吸引力的优势在于创造个性化的人工智能。
IBM市场策略:截至今年3月31日,IBM第一季度营收1亿美元,同比增长5%。
继上季度之后,再次结束了连续22个季度的下滑,实现了营收的第二次增长。
IBM预计到今年年底将达到1亿美元的战略需求。
来自IBM所谓的“战略必需品”——云、认知计算、Watson、分析、移动和安全等未来增长产品和服务——的收入在过去12个月为1亿美元,增长12%,占IBM营收的47%收入。
6月6日,通过IBM社交协作峰会,IBM发布了一系列基于Watson技术的社交协作解决方案,并向业界展示了许多渗透到各行业企业业务流程的成功案例。
无论是医药、金融、制造等传统行业,还是独角兽级别的初创企业,IBM企业社交协作已全面渗透到企业业务的深水领域,成为其数字化转型不可或缺的助推器。
合作方面另一个值得期待的动作是即将推出的Domino V10版本。
据悉,轻码/无码应用将是其主要特色。
相信在轻量级、无代码的趋势下,越来越多的企业用户可以摆脱软件开发人员和漫长的开发周期,更方便、更快捷地应用IBM多年积累的企业协作技术。
过去几年:IBM在人工智能领域签订了0份合同,0份区块链合同!在量子计算领域,我们还与摩根大通、戴姆勒等合作伙伴合作实施多个项目。