当前位置: 首页 > 科技观察

打破AI算力瓶颈的是基于FPGA的异构计算加速平台解决方案

时间:2023-03-19 18:48:15 科技观察

【.com原稿】无人超市的落地、人形机器人的面试、无人车的量产……目前,AI融入到每一个细节子领域正在悄然改变着我们的生活。但要达到科幻电影中的人机交互效果,计算能力是主要瓶颈之一。硬件算力是人工智能发展不可或缺的条件之一。GPU/ASIC/FPGA都是加速引擎来解决巨大的计算量。加速云创始人兼CEO吴刚近日,加速云信息技术有限公司(简称:加速云)创始人兼CEO吴刚在新品发布会上表示:“未来存在瓶颈“人工智能的发展,需要硬件技术和算法的突破。异构计算是未来计算架构的趋势,而FPGA是实现异构计算的最佳选择。”基于FPGA的深度学习解决方案助力深度学习模型高效运行在大数据时代,深度学习是人工智能的主要驱动力,近年来大数据和计算能力的快速增长,让深度学习有了质的飞跃技术,使计算机视觉、语音识别、自然语言处理等领域取得重大突破,但深度学习需要大量并行计算,对硬件平台要求极高,传统计算机无法满足。现有解决方案是使用GPU完成深度学习训练,但GPU功耗过高,性能功耗比差,处理延迟大,不太适合大规模推理部署和一些延迟敏感的场景。适合。由于FPGA的高性能功耗比,并且基于门级电路设计,FPGA是一种超低延迟和确定性延迟解决方案。FPGA的可编程性和动态可重构性可以适应未来深度学习算法的变化,IO可编程性可以满足更多的业务需求(网络加速、边缘计算),因此基于FPGA的深度学习解决方案成为未来的技术发展方向。在本次发布会上,加速云推出了一整套基于FPGA的深度学习加速解决方案,包括SC-OPM/SC-OPF/SC-OPS加速卡和FDNN加速库,快速满足市场需求。SC-OPS加速卡SC-OPS基于英特尔最新14nm工艺Stratix10FPGA,可提供2800KLE和9.2TFLOPS计算性能,支持8个DDR4控制器,提供最高150GB/S内存访问带宽,提供PCIe*16Lane接口支持最高128Gbps的访问速度,致力于满足数据中心的高性能深度学习加速。SC-OPM/SC-OPF加速卡SC-OPM/SC-OPF基于英特尔最新20nm工艺ARRIA10FPGA,可提供1150K~2*1150KLE和1.5~2TFLOPS计算性能,致力于满足深度学习数据中心和边缘计算网关的学习加速。FDNN加速库FDNN加速库是一套基于RTL的深度神经网络加速库FDNN,可以实现参数可配置的CNN/DNN/LSTM,同时也提供高性能的通用网络模型加速库(包括Lenet、VGG16、Darknet19,YOLOV2,RestNet,DNN,LSTM),致力于满足客户对深度学习性能、灵活性和加速性的需求。完整的基于FPGA的OpenCL异构开发环境为了方便客户使用高级语言开发,加速云提供了完整的基于FPGA的OpenCL异构开发环境,快速实现用户自定义的深度学习加速方案。同时,还为快速深度神经网络提供定制化加速服务。方案特点:A.高性能集成IP,方便使用和二次开发B.丰富的IO接口,扩展方便灵活C.模块化设计,支持多种应用场景D.高性能功耗比,降低运营成本E.超强低延迟和确定性延迟,支持时间敏感的应用场景具体性能指标:深度学习加速解决方案应用——图片OCR电商平台每天面临大量的客户开店和业务应用需求,需要大量的业务license等。文件审核传统上采用人工审核,但是随着业务的增长,人工审核已经不可能了。使用深度学习的图像OCR是一个很好的解决方案。基于深度学习的图片OCR解决方案包括文字定位和文字识别两部分。文本定位使用4层CNN网络,文本识别使用4层双向LSTM。由于CNN部分计算量较小,主要计算量在LSTM中,所以LSTM部分加速。原方案采用GPU来完成,但存在两个问题:处理延迟很大,不能满足要求。图片中的一些文字很长。同超长的文字时间,让业务无法满足在线条件。具体LSTM规格如下:AccelerationCloud采用FPGA方案实现双向LSTM加速,满足客户需求。方案具体特点如下:采用SC-OPM加速卡(半高半长:56*167mm)AlteraArria10GX660器件,集成660kLE和1.5TFLOPS单精度浮点处理能力四层LSTM+1层全连接,各层网络参数可软件配置下载,实现40000T/S流量,超低延迟,数据长度可混长单卡仅33W除以上内容外,加速云也在本次大会上推出了FBLASIP库、高性能计算和数字信号处理解决方案、边缘计算解决方案。采访中,吴刚表示:“加速云是一家科技衍生的公司,其解决方案可广泛应用于深度学习、人工智能、金融、机器视觉等领域。目前已与阿里、腾讯合作,科大与飞飞等公司深入合作。”写在***:最初FPGA只是用于胶合逻辑(GlueLogic),从胶合逻辑到算法逻辑再到数字信号处理,高速串行收发器和嵌入式处理FPGA真正从配角变成主导角色。高性能计算和数字信号处理、边缘计算、人工智能等新应用需求的出现,给FPGA带来了历史性的发展机遇。目前国内厂商的主导市场仍然在应用终端和中低端后端服务器市场。自己的生态。【原创稿件,合作网站转载请注明原作者和出处为.com】