自动驾驶是边缘计算的重要应用。自动驾驶需要100-1000TOPS的边缘AI算力。高性能低功耗的边缘人工智能(EdgeAI)成为行业壁垒。人工智能计算需要一个域来优化算法和数据流架构。摩尔定律正在接近极限。如果没有正确的算法和架构,单靠处理技术的驱动性能将无法达到预期的效果。整个边缘计算市场正在快速增长。图片来源:IDC未来计算平台类别一:冯·诺依曼人工智能架构哈佛大学推出了参数化深度学习基准套件ParaDNN,它是一个系统的、科学的跨平台基准测试工具,不仅可以比较运行各种平台的能力深度学习模型还可以支持跨模型属性交互的深度分析、硬件设计和软件支持。TPU(TensorProcessingUnit,即TPU张量处理单元)是谷歌打造的处理器,专为机器学习量身打造。它需要更少的晶体管来执行每个操作并且效率更高。TPU针对CNN和DNN的大批量数据进行了高度优化,具有最高的训练吞吐量。GPU表现出与TPU相似的性能,但对于不规则计算(例如小批量和非MatMul计算)具有更好的灵活性和可编程性。CPU实现了RNN的最高FLOPS利用率,并且由于其大内存容量支持最大的模型。第二类:非冯诺依曼人工智能架构内存计算(CIM):基于SRAM、NAND闪存和新兴内存(如ReRAM、CeRAM、MRAM)的CIM阵列被认为是神经网络的可重构、可配置和可扩展的网络计算。重新编程加速器。CIM优势:高性能、高密度、低功耗、低延迟。当前的挑战:用于读取位线模拟信号感测和专用RAM处理技术的ADC。神经形态计算:神经形态计算将人工智能扩展到与人类认知相对应的领域,例如解释和自主适应。下一代人工智能必须能够处理新情况和抽象概念,以自动化常见的人类活动。量子计算:在量子计算中,最小的数据单位是基于磁场自旋的量子比特。基于量子纠缠,量子计算允许2态以上,纠缠速度非常快(例如:GoogleSycamore,QuantumSupremay,53Qbits,快1.5万亿倍,经典计算机需要1万年才能完成一个任务在200秒内完成。任务已完成)。当前的挑战:嘈杂的中等规模量子(NISQ)计算机中的错误率和退相干。量子神经形态计算:量子神经形态计算在类脑量子硬件中物理地实现神经网络以加速计算。边缘人工智能和垂直应用边缘人工智能将主导未来的计算,人工智能是一种使能未来水平和垂直应用的技术。横向AI应用解决了许多不同行业的广泛问题(例如计算机视觉和语音识别);垂直方向的人工智能应用是针对特定领域(如高清地图、自动驾驶定位和导航)的行业特定和高度优化的。凭借深厚的领域知识,高效的AI模型和算法可以将计算速度提高10-100000倍。这是未来人工智能最核心、最重要的自动驾驶技术。所有垂直应用程序解决方案都需要针对多个任务的多级AI模型。AI模型和算法DNN是人工智能的基础,今天的DNN使用一种称为反向传播的学习形式。现在的DNN训练速度慢,训练后静态,在实际应用中有时不灵活。迁移学习是一种“回收”先前开发的DNN作为DNN学习第二个任务的起点的方法。通过迁移学习,DNN可以用更少的数据训练DNN模型。持续(终身)学习是指在保留以前的学习经验的同时,通过适应新知识不断学习的能力。例如,与环境交互的自动驾驶从自身经验中学习,并且必须能够在很长一段时间内以增量方式获取、微调和转移知识。强化持续学习(RCL)通过精心设计的强化学习策略为每个新任务找到最佳神经架构。RCL方法不仅在防止灾难性遗忘方面有很好的表现,而且对新任务也有很好的适应性。自动驾驶系统(ADS)–功能框图。图片来源:ARM自动驾驶技术亟待突破:边缘精准定位导航——轻量化、基于指纹的精准定位导航。关键实时响应——20-30毫秒,类似人脑消除盲点——V2X、V2I、DSRC、5G可升级——低功耗、低成本图片来源:ARM自动驾驶需要处理大量高清地图、定位和环境感知中的数据,所有在边缘处理的数据都需要在关键的几毫秒内完成。感知、定位、导航和增强交互(驾驶策略)方面的智能和精确数据缩减将使自动驾驶系统能够减少延迟并快速响应不断变化的交通状况。强大、高性能的边缘人工智能(EdgeAI)是自动驾驶汽车领域的主要障碍之一。5G连接支持可靠的MIMO连接、低延迟和高带宽。在5G的加持下,强大的边缘AI,再加上高清地图、定位、感知等方面的创新,将使真正的自动驾驶成为现实。
