当前位置: 首页 > 科技观察

浪潮科大讯飞Altera采用OpenCL实现FPGA深度学习语音识别加速解决方案

时间:2023-03-17 00:07:23 科技观察

11月17日,在正在进行的2015全球超级计算大会(SC15)上,浪潮携手全球可编程逻辑芯片巨头Altera,与中国最大的智能语音技术提供商科大讯飞联合发布了基于AlteraArria10FPGA平台,采用OpenCL开发语言进行并行设计和优化的深度学习DNN语音识别解决方案。同时,此次发布也标志着浪潮凭借GPU、MIC、FPGA三大HPC异构计算应用能力,成为全球领先的HPC系统厂商。深度学习需要HPC“提速”让计算机拥有接近人类的智能水平是IT行业最伟大也是最难实现的梦想,而深度学习是人工智能漫漫征途上的一项重要技术。深度学习的出发点是通过构建深度神经网络,模拟人脑中神经元和突触的信息数据传输和计算,逐步让机器在抽象规则的约束下,像人一样理解现实世界。然而,由于人脑每天可以接触到数以万计的信息,并在短短几秒钟内做出判断和反应,要实现机器真正像人一样思考,不仅仅依赖于算法模型的准确性,还需要媲美人类的高性能计算技术来提高大脑的计算效率。可以说深度学习对计算资源的需求就像一个“黑洞”一样无穷无尽,这使得近年来异构加速技术在该领域的应用越来越广泛,协处理器计算速度的快速提升使得深度学习该技术在硬件层面有强大的支持。FPGA,介于通用和专用FPGA(Field-ProgrammableGateArray,现场可编程门阵列)之间的半定制芯片,介于专用芯片和通用芯片之间。具有一定的可编程性,可以??同时进行数据并行和任务并行。计算在处理特定应用时具有更明显的效率。更重要的是,FPGA具有明显的性能功耗比优势,其能耗比是CPU的10倍以上,GPU的3倍以上。此外,定制化也是FPGA的一个重要特性。正是由于其强大的性能功耗比优势和定制化特性,FPGA在逻辑控制、信号处理、图像处理等诸多领域得到了应用,近期开始在线上试水深度学习中的识别系统。使用。但传统的FPGA开发采用Verilog、VHDL等硬件描述语言,对开发人员要求高,开发周期长,因此高性能计算的应用受到限制。采用OpenCL、软件高级语言和模型编程,可以大大缩短开发周期,部分应用可以在几个人月内完成,为FPGA应用的开发提供了更广阔的平台。利用OpenCL实现基于FPGA平台的语音识别系统科大讯飞拥有国内最大的语音识别系统,常见场景准确率达到98%,行业领先。.为进一步提升DNN算法的效率和性能,科大讯飞计划在语音识别业务中使用FPGA平台,如果性能达到要求,将搭建一个规模为几十的FPGA语音识别系统。未来成千上万。科大讯飞技术总监余振华表示,深度学习模型的软件算法需要不断微调和优化。随着时间的推移,固定功能的服务器加速器的效率会越来越低,浪费空间和电力。相比之下,FPGA可以更灵活地定制并且功耗更低。这也是科大讯飞决定将DNN算法移植到FPGA平台的重要原因。于是浪潮、科大讯飞和Altera共同发起的合作诞生了——Altera提供AlteraArria10FPGA平台,科大讯飞提供DNN识别算法,浪潮负责完成基于FPGA平台的DNN,使用OpenCL并发设计、迁移和优化。经过努力,三方最终完成了基于OpenCL的FPGA在线深度学习语音识别加速方案。本方案硬件平台采用CPU+AlteraArria10FPGA异构架构,软件完全采用先进的OpenCL编程模式,实现CPU到FPGA的移植。具有四大特点:高性能:处理100个绑定数据,基于IntelXeonE5-2650V2双通道CPU(启动16线程),DNN运行时间为242.027s,基于AlteraARRIA10FPGA,DNN运行时间为84.312s,性能加速2.871倍;低功耗:AlteraArria10FPGA功耗30W,IntelXeonE5-2650V2双通道CPU功耗190W,FPGA功耗仅为CPU的15.7%。在DNN的实际运行测试中,FPGA可以实现30GFlops/W的高性能功耗比,可以大大节省应用功耗成本;编程方便:采用OpenCL编程模型,基于FPGA的DNN并行程序开发完全由软件工程师完成,仅需4人月。如果使用Verilog、VHDL等传统低级语言,同样的开发工作至少需要12个人月,并且需要软件工程师和硬件工程师的合作才能完成。高适用性:FPGA可以使用DNRange模式实现数据并行,也可以使用Pipeline模式实现任务并行,从而满足更多的应用场景,为更多的应用软件带来性能提升。Altera服务器与存储事业部总经理DavidGamba表示,三方成功完成了基于AlteraARRIA10FPGA平台的OpenCL并行设计开发,创造了极高的功耗性能比,进一步验证了其优势。AlteraFPGA平台。该程序的成功开发将成为FPGA在深度学习领域应用的重要参考。通过此次合作,三方实现了基于FPGA的HPC新型异构加速模式和技术的可行性研究。在实际深度学习DNN应用的验证中,该方案提升了性能并节省了功耗。程序化验证。谈及下一步合作,浪潮集团副总裁胡雷军表示,浪潮始终致力于为用户提供最适合其需求的计算系统解决方案。FPGA具有非常高的性能功耗比优势。浪潮将与科大讯飞、Altera进一步合作基于FPGA的在线语音深度学习应用。同时,浪潮还将开发基于FPGA的通用系统解决方案,包括机柜计算、网络、存储FPGA解决方案,并推广到其他应用领域和客户。谈及下一步合作,浪潮集团副总裁胡雷军表示,浪潮始终致力于为用户提供最适合其需求的计算系统解决方案。FPGA具有非常高的性能功耗比优势。浪潮将与科大讯飞、Altera进一步合作基于FPGA的在线语音深度学习应用,bing将开发基于FPGA的通用系统解决方案,包括机柜计算、网络、StoreFPGA解决方案,并推广到其他应用领域和客户。未来,CPU+FPGA可能作为HPC的一种新的异构模型,被越来越多的应用领域所采用,如大型HPC应用、数据中心、互联网深度学习等。浪潮、科大讯飞、Altera简介浪潮依托高效服务器与存储技术国家重点实验室、国家信息存储技术工程中心、浪潮-英特尔中国并行计算联合实验室、浪潮-NIVDIA云超算创新中心。研发创新体系,浪潮拥有从teraflops到petaflops的超级计算机产品研发、系统建设、运维服务能力,以及完整的HPC软硬件产品线。为遗传学、航空航天、制造设计、动画渲染、环境监测等众多行业用户提供了领先、优质的超级计算系统和应用服务,实现了国产高性能计算机系统的海外出口产业化。作为国内最大的智能语音技术提供商,科大讯飞在智能语音技术领域积累了长期的研究积累,在语音合成、语音识别、口语评价、自然语言处理等多项技术上拥有国际领先的成果.科大讯飞的语音识别技术在常见场景下的准确率高达98%,处于行业领先地位。Altera公司站在技术创新的前沿,30多年来一直为业界提供最新的可编程逻辑、工艺技术、IP核和开发工具。该公司的FPGA、SoC和嵌入式处理器系统、CPLD、ASIC以及电源解决方案等互补技术被全球各种终端市场的12,000多家客户使用。谈及下一步合作,浪潮集团副总裁胡雷军表示,浪潮始终致力于为用户提供最适合其需求的计算系统解决方案。FPGA具有非常高的性能功耗比优势。浪潮将与科大讯飞、Altera在基于FPGA的在线语音深度学习应用方面进一步合作,开发基于FPGA的通用系统解决方案,包括机柜计算、网络、StoreFPGA解决方案,并推广到其他应用领域和客户。