1.引言智能驾驶泛指对车辆(尤其是汽车)的智能化改造,应用自动驾驶(autonomousdriving)和车联网(IoV)等技术这些都使得传统上完全由人控制的机动车具备了智能处理能力,包括但不限于智能数据采集、智能分析、智能决策等。这一系列智能技术的实现,离不开车辆本身,对外部环境、交互控制等多维海量数据的高效处理和分析。智能驾驶大数据之所以能够同时被传统汽车行业、新兴互联网企业、先进制造等机构寄予厚望,包括但不限于以下原因:规则的认知能力不是相同的;另一方面,在不同的情况下,人的反应时间和决策的准确性会受到很多因素不同程度的影响。这使得人们对机动车的驾驶行为具有很强的主观性和决定性,难以充分保障道路交通安全。就智能驾驶技术而言,无论是低级辅助驾驶(如定速巡航、自动跟车、车道保持、自动泊车),还是高级自动驾驶(几乎完全由驾驶系统控制),它可以在不同程度上代替人的主观判断和控制,同时减轻情绪、疾病等因素对驾驶员的影响,提高行车可靠性。同时,由于数据处理系统的超低延迟性能,智能驾驶技术能够以低于常人反应时间的速度做出决策,在遇到紧急情况时能够立即采取最佳策略(例如即将发生的碰撞)以避免发生事故。或减弱事故造成的危害,进一步提高行车的安全性。2、高效车联网技术的典型应用是精准导航。对于传统司机而言,规划出行路线通常依赖于自身的位置记忆、判断车流的经验以及通用定位导航技术(如GPS或北斗),而车联网与边缘计算平台的结合则带来了区域性精准导航的能力,包括但不限于:高精度地图。不同于传统的卫星遥感地图,通过边缘节点,可以在局域网上进行多维度的数据采集,如基于录像系统的视频采集、基于雷达和声纳系统的空间距离感知等,在小范围内获取准确的空间信息和实时图像,为驾驶系统提供准确的地理位置信息支持。地图实时更新。基于边缘平台的计算能力,可实时更新一定范围内的高精度地图,记录道路养护、车道调整、交通规则调整等一系列高时效性数据,并分发到可能实时经过该区域的驾驶系统,为其提供更准确的决策,而极高的更新频率带来的及时性是传统地图信息系统难以达到的。动态信息监控:通过基站、车载计算、路侧单元等边缘节点,可以监控采集车流、突发事件等动态信息,汇总处理后上报车联网,使交通状况由传统的现场发现、人工广播逐渐转变为实时采集、网络化发布,大大提高了车辆通行效率。3.便捷性无论是作为交通系统用户的自动驾驶汽车,还是作为服务提供者的车联网系统,由于智能处理系统接管了原有的人类工作,可以具备7天x24小时不间断运行的能力,有效弥补了公共交通有限的运行时间和驾驶者的疲劳驾驶。这样,需要出行的用户可以随时使用高度智能化、自动化程度高的车辆,降低司机成本,提高交通便利性。2.问题与挑战自动驾驶技术能否最终落地,对于数据处理系统,主要取决于以下三个方面:1.根据计算性能研究,人的反应时间通常为100-150ms,而应尽可能保证安全自动驾驶技术的响应时间应小于100ms[68],自动驾驶系统面临的连续输入数据量非常大——根据NVIDIA的研究,车身高分辨率摄像头每秒产生2GB像素,输入深度神经网络进行决策推理,产生250万亿次运算,用于实现物体、行人等智能场景跟踪、交通信号检测和识别以及车道检测。同时,对于如此大规模的计算,数据处理系统也应严格控制硬件发热问题,避免因过度计算导致性能损失、电池寿命降低、能源浪费甚至车身自燃等严重问题。温度。因此,如何在极短时间内实现高能效的大规模计算,将是对行车数据处理系统的重大考验。2.存储性能研究表明,遍布车身的传感器数据传输带宽可达3-40Gbit/s[69]。Nvidia的自动驾驶技术测试还表明,车辆学习数据收集系统可以在数小时内填满TB级内存。固态存储驱动器(SSD)。自动驾驶技术在短时间内产生如此大量的数据,车载存储系统的性能需要不断提升。一方面,由于网络通信条件的限制,车辆无法将传感器采集到的实时原始数据直接上传到计算平台;另一方面,减少传感器的数量或数据采集的质量会直接影响数据的价值,导致识别错误和决策准确性下降等问题。3.网络通信性能对于自动驾驶、车联网等智能驾驶技术,网络通信为几乎所有功能提供了底层支持:驾驶。可实现智能通信,开展事故报警、碰撞预测、协同巡航等应用。车辆与计算平台的互联互通:由于车辆处理系统的计算资源有限,人们无法直接将所有复杂的任务分配给它进行计算,必须基于更高层次的计算平台进行特定的任务卸载才能得到完毕。通过V2I(Vehicle-to-Infrastructure)技术,智能汽车可以连接路侧单元、基站等计算服务设施,进而实现数据交互、计算卸载等过程。车辆与用户设备的互联互通:驾驶员和乘客都需要不同程度地了解机动车的状态,以评估行车安全等问题。但在不考虑数据处理时间开销的情况下,由于传统网络通信技术中无线信道条件、通信带宽限制、网络流量拥塞等问题,数据传输开销通常远高于100ms的限制标准,这将导致流量数据处理系统中严重的性能瓶颈。但现有的基于云的远程网络传输技术难以满足响应时限,需要尝试局域内的短距离网络通信来实现。例如,通过边缘平台将复杂的计算密集型任务卸载到路边单元等边缘节点的方案具有很大的潜力,但也面临一些问题:智能车内的计算系统和路边的边缘计算节点需要沟通与协作;汽车在不断移动的同时,需要依次访问不同的边缘节点,相邻节点需要基于服务迁移技术进行“中继”;不同节点的负载情况和计算能力差异较大,对时延敏感,如何高效处理车联网任务;在这样一个动态的场景中,合理的计费与安全同样重要。因此,这也对上层数据处理系统提出了挑战:1)具有环境感知和场景感知的数据采集对于基站、路边单元等具有固定地理位置的边缘节点,以及具有高机动性和不稳定性的车辆,它们都无法照搬传统的数据采集方式,而应该探索具有感知周围环境和实时场景信息能力的新型数据采集技术,如高精度地理位置等空间信息采集、真实世界图像采集等.基于这样的高维数据,智能驾驶系统可以实现性能的进一步提升。2)数据聚合与处理在输入源数量多、异构性强、性能不均匀的复杂情况下,对多样化数据进行有效的聚合与处理是下一步工作。利用这些数据,车联网应该能够对其进行高效的分析和挖掘,以支撑局部区域的高精度地图、定位、导航等功能。3)智能决策与传统交通相比,新型交通最大的变化在于机器的智能化发展。驾驶员可以直观地收集环境信息,用大脑进行分析,并决定下一步该怎么做。要实现智能驾驶,驾驶控制系统也需要实现这一过程。为了让机器具备“分析”和“推理”的能力,机器学习和深度学习技术得到了快速发展。目前,相关研究人员利用强化学习、深度神经网络等技术在驾驶智能控制方面取得初步成果,达到level-1、level-2甚至level-3自动驾驶能力,有望实现level-4未来十年和五级高度自动化驾驶水平。3.前沿研究面对上述问题,云-边-端协同处理模型展现出了巨大的潜力。研究人员试图提出一种云平台、边缘平台和车辆平台之间的协同处理解决方案:Vehicle-in-Platform:由于它直接嵌入到车身中,因此可以执行对延迟高度敏感的任务,例如关键决策推理、对用于卸载的数据进行预处理,减少数据量,从而减少带宽占用和传输时间开销。边缘平台:适用于计算密集型、中等时延敏感任务,如精确定位、局域高精度导航、多数据源的信息聚合与存储等,可为车载提供一定的计算能力资源、存储和其他服务极其有限的平台。同时,以路侧单元为代表的边缘节点,由于靠近车辆但(通常)不具备移动性的特点,可以为固定区域内的过往车辆提供实时丰富的信息,从而弥补单一车辆平台的有限视野。云平台:由于处于网络中心,服务范围覆盖全球,拥有几乎无限的计算、存储等资源,可以承担复杂、大规模的计算任务(如DNN模型的训练等)实时推理),非实时广域信息聚合处理任务(如预设路线规划),处理和存储有价值的大规模交通数据,以供日后统计、分析和预测任务使用。下面介绍一些相关技术的具体研究:1.资源管理和任务卸载由于边缘节点可以同时为一定范围内的多个用户(车辆)提供服务,资源分配和用户任务竞争问题主要影响性能因素。文献[70]将车辆任务卸载过程中的竞争冲突问题转化为多用户博弈问题,证明了该问题纳什均衡的存在性,实现了分布式计算卸载算法。参考文献[71]更进一步,对任务卸载过程中的通信速率、可靠性、时延进行了优化分析,提出了支持服务质量感知的无线网络资源管理框架,将资源分配问题分解为车辆集群分割、集群间资源块池分配、集群内资源分配三个子问题,实现了基于图论的优化方法:首先将车辆划分转化为集群划分问题,使得协同控制可以避免隐藏终端的问题,同时避免半双工带来的通信限制;基于加权资源冲突图,将资源块池分配问题转化为最大和最小公平问题,解决了(通过高效的簇间通信资源重用和限制资源重用引起的频谱利用率提升之间的权衡)集群间的竞争冲突。针对车辆高机动性导致边缘节点频繁切换的问题,参考文献[72]认为车辆与节点之间的连接会在短时间后丢失,这将导致增加在处理时间和能量消耗方面。算法根据计算出的接管时间,将处理任务从原节点卸载到下一个可行的目标节点,继续任务的运行。同时,研究者不受限制到单个完整的任务卸载,但对一系列任务实施部分卸载策略。对于整个卸载g过程中,需要重视车辆端的性能和边缘服务节点端的性能。DDORV算法[73]可以根据当前系统条件(如信道质量和流量负载)同时考虑耦合在车辆端和节点端之间的两个包含大量状态信息和控制变量的随机优化问题.具体来说,该算法基于李亚普诺夫算法将双边随机优化问题解耦为两个独立的帧优化问题:对于车辆,通过比较本地处理成本和任务卸载成本来选择卸载策略,CPU调整频率由建议的目标函数计算;针对边缘节点侧,首先提出了一种轻量级的资源供给算法,然后提出了基于迭代算法的无线资源和能量消耗的联合优化,提出了连续松弛法和拉格朗日双解耦算法。同时,研究人员选择电视空白频段进行车辆与边缘节点之间的无线数据传输,弥补了传统蜂窝和Wi-Fi技术的不足,提高了通信效率。同时,对于某个区域内的多个用户,通常会有多个节点提供选择。JSCO算法[74]将多节点、多用户环境下的负载均衡和任务卸载决策问题转化为混合整数非线性规划问题,可以解决节点选择、计算资源优化三个问题,以及低复杂度的卸载方案决策。执行计算以最大化系统利用率,同时保持延迟范围。2.依赖智能汽车的典型应用应用场景非常丰富,例如:1)交通流评估参考文献[75]发现,传统的交通流评估方法通常是大规模、粗粒度的,依赖于固定位置的交通摄像头,而对于没有摄像头系统的路段,需要借助卫星定位系统的连接状态来判断,结果的准确性不好。本研究将车辆视为边缘计算节点,通过车载摄像头(如行车记录仪)的实时视频流进行交通评估:基于YOLO模型的物体检测模块生成实时获取目标车身范围帧,目标跟踪模块提取范围帧,在连续帧之间比较车身的SIFT特征描述符。交通评价模块提取同向和对向车道线,并基于霍夫和虚拟车道进行车道分离,进而分析车辆交通状况。2)安全分析基于OpenVDAP框架实现的AutoVAPS[76]框架包括数据层(负责数据的收集和管理)、模型层(负责为图像的智能分析提供模型)和接入层(提供隐私保护的数据共享和访问),可以通过车载摄像头视频流进行实时安全分析。对于新型大数据应用的开发,一方面需要面向云边协同的分层架构,充分发挥云、边、端的优势,解决传统单一云模式面临的问题;另一方面,需要针对具体应用,不断优化云边协同下数据处理系统的实现方案,使系统更能适应不同的具体场景,发挥具体优势。场景。作者简介:韩锐,北京理工大学特约研究员、博士生导师。2010年毕业于清华大学,获优秀硕士学位。2014年毕业于伦敦帝国理工学院,获博士学位。2014年3月至2018年6月在中国科学院计算技术研究所工作。专注于针对典型负载(机器学习、深度学习、互联网服务)的云计算系统优化研究,在TPDS、TC、TKDE、TSC等领域顶级(重要)期刊及会议等发表百余篇INFOCOM、ICDCS、ICPP、RTSS等40篇论文,谷歌学术引用1000余次。刘驰,北京理工大学计算机学院副院长,教授,博士生导师。智能信息技术北京市重点实验室主任,国家杰出青年科学基金获得者,国家重点研发计划首席科学家,中国电子学会会士,英国工程技术学会会士,英国工程技术学会会士英国计算机协会。分别在清华大学和伦敦帝国理工学院获得学士和博士学位,后在德国电信研究所从事博士后研究工作,并在IBMT.J.担任研究主任。美国沃森研究中心和IBM中国研究院。主要研究方向为智能物联网技术。本文节选自《云边协同大数据技术与应用》(ISBN:978-7-111-70100-2),经出版社授权发布。
