当前位置: 首页 > 科技观察

四大自动驾驶策略综合解析

时间:2023-03-17 15:27:58 科技观察

引言目前关于自动驾驶的策略研究还停留在特定场景下具体策略的实施。清华大学研究人员在交通领域顶级会议上发表综合综述,从更高级的角度分析自动驾驶策略。自动驾驶遇到路过的车,是先让,还是先让?自动驾驶的策略一直是该领域的核心问题,即如何在交通冲突区域与其他交通参与者进行合理、高效的交互。过于激进或过于保守的策略都会影响交通效率,甚至对乘客安全构成威胁。以往对自动驾驶策略的研究主要集中在低层次的详??细驾驶行为或特定交通状况,即“具体问题具体分析”,导致工程代码中有上千个if-else,目前缺乏研究关于高级驾驶策略。尽管研究人员对驾驶策略表现出越来越大的兴趣,但对于如何主动实施安全驾驶仍没有全面的答案。近日,清华大学、中国科学院自动化研究所、英特尔中国研究院联合研究成果在交通安全领域国际顶级期刊《事故分析与预防》举办的2021年年会上亮相(交通运输领域SSCI期刊排名第一,JCRQ1)做了公开报告和口头报告,并获得该杂志年度最佳论文奖。论文链接:https://www.sciencedirect.com/science/article/abs/pii/S0001457520317577#!在分析了几种具有代表性的驾驶策略后,作者提出了衡量驾驶策略的三个重要特征维度:偏好目标、风险偏好和协作方式。根据这三个特征维度,研究人员将现有自动驾驶汽车的驾驶策略分为防御性驾驶策略、竞争性驾驶策略、协商驾驶策略和合作驾驶策略四种类型,并进行比较,找出可能的改进方向。设计先进的驾驶策略。笔者认为,面对长期混合的交通流(自动驾驶车辆与传统车辆混合),应积极引入路权协商机制,以调和个体意图之间的矛盾。该论文的通讯作者为清华大学深圳研究生院副教授、博士生导师李志恒博士。2009年获清华大学自动化系控制科学与工程专业工学博士学位。主要研究方向为:智能交通系统、交通信号控制系统、交通管理规划、智能公交系统、智能交通大数据研究等。主持和参与国家级项目10余项。自动驾驶的未来近年来,自动驾驶技术被寄予厚望,人们普遍认为其有潜力重塑整个道路交通领域,解决道路可达性、交通拥堵等诸多实际交通问题。效率、便利性,尤其是安全性。然而,越来越多的研究人员逐渐发现,教会自动驾驶汽车“安全驾驶”并非易事。以左转为例,美国交通部2010年的一项研究发现,在调查了超过200万起事故后,左转发生事故的可能性是右转的20倍;软件工程师NathanielFairfield认为,无保护左转是自动驾驶中最困难的事情之一;麻省理工学院机械工程系教授约翰伦纳德也坦言:自动驾驶每天都有很多挑战,左转弯几乎位居难题榜首。该工作的研究团队认为,左转碰撞等安全问题的本质原因在于不同车辆在交互时所采取的宏观策略的差异。与关注特定场景或特定驾驶行为的微观策略不同,宏观策略是对决策过程典型要素的抽象,由自动驾驶策略的硬件基础和决策共同决定-制作机制。因此,本工作主要探讨自动驾驶汽车在与其他交通参与者交互过程中应遵循什么样的宏观策略,避免因误判而产生的碰撞风险,从而有序通过交通冲突区域。在这项工作中,在回顾现有研究后,研究团队提出了衡量宏观驾驶策略的两个主要维度:合作意愿,即驾驶主体是否愿意放弃一部分个体利益来换取整体利益;风险偏好,即驾驶主体对驾驶策略带来的潜在风险的态度。根据整体利益(环境交通效率等)与个体利益(自行车通行速度)的不同侧重点,现有的典型驾驶策略可分为“对抗驾驶”和“合作驾驶”两类。其中,根据风险偏好的不同,对抗性驾驶策略进一步分为偏好安全指标的风险规避“防御性驾驶策略”和偏好速度指标的风险中性“竞争性驾驶策略”。协同驾驶策略可分为不依赖主动通信设备的“协商驾驶策略”和依赖主动通信设备(车联网、V2V等)的“协同驾驶策略”(图1)。图1:四种典型的宏观驱动策略在这项工作中,研究团队对上述四种典型驱动策略的运行机制、核心任务、交互逻辑、决策机制和硬件基础进行了全面分析。具体来说,防御性驾驶策略被定义为一种驾驶策略,对其他车辆采取非理性假设(即认为非理性行为的概率很高),规定自动驾驶车辆以确保自身安全为核心目的进行独立决策。安全。竞争性驾驶策略被定义为对其他车辆采取理性假设(即认为非理性行为的概率较低)的驾驶策略,规定自动驾驶汽车以提高自身效率为核心目的进行自主决策.Deliberativedrivingstrategy定义为:自动驾驶汽车基于对传统驾驶行为的理解,与其他车辆进行合理的协商和联合决策,以换取兼顾效率和安全的驾驶策略。协同驾驶策略定义为:在车联网技术的支持下,自动驾驶汽车与其他车辆协同合作,接受统一调度指令,实现全局最优驾驶策略。然后,团队进一步讨论了这四种策略的优缺点和特点。随着本世纪自动驾驶技术的发展,防御性驾驶策略被首次提出,因为这种驾驶策略与人类驾驶规则有很多相似之处,其核心目标是消除或减少交通不确定性。潜在风险。然而,防御性驾驶的最大缺点是自动驾驶汽车可能会为了防止小概率交通事故而过度冗余和保守,降低交通效率。例如,在英特尔Mobileye团队提出的原始版本的责任敏感安全(RSS)驾驶模型[2]中,要求自动驾驶汽车保持足够远的安全距离,以应对可能出现的突然刹车行为。随时了解前方车辆(图2)。团队进一步研究发现,当决策考虑前车意图时,自动驾驶汽车可以在保证安全要求的情况下,将跟车距离缩短三倍以上。这说明引入交互后,改进后的防御性驾驶也能保证一定的通行效率。相关研究成果也已发表并被Mobileye采用[3]。图2:Mobileye发布的RSS原版中关于安全距离的规定[2]随着研究的深入,防御性驾驶策略的各种弊端逐渐显现,如缺乏长远规划、影响通行效率等。为了解决这些问题,“学习”的概念逐渐被引入到自动驾驶领域。人们试图教机器根据经验在预期收益和潜在风险之间做出决定,就像人类一样。基于这一思想,以MIT强化学习模型DeepTraffic(图3)为代表的竞争性驾驶策略应运而生[4]。在这种策略的指导下,自动驾驶汽车将道路交通视为一个“非合作动态博弈”过程,并一直在寻找提高驾驶效率的可能性。然而,这类驾驶策略往往难以避免两个问题:1、模拟带来的真实感问题,即“现实差距”。这类驾驶决策算法往往需要在仿真系统中进行,算法的训练过程非常依赖环境反馈,因此如何保证仿真系统中的交互过程足够逼真是一个难题。研究人员必须回答的问题;2、理性假设增加潜在风险。研究发现,随着训练的进行,由于模拟环境中的理性个体远多于非理性个体,自动驾驶汽车可能会一次次从冒险行为中“尝到甜头”,并倾向于采取更具攻击性的行为。驾驶行为[5]。这种合理的假设可能会导致实际道路上的交通拥堵后果。图3:MIT的DeepTraffic驾驶决策模型[4](来源:https://selfdrivingcars.mit.edu/deeptraffic)因此,协商驾驶的概念被提出,主张引入路权协商机制来调和个人用心之间的矛盾。研究团队将自动驾驶车辆与其他车辆协商通行权时应遵循的原则归纳为三点(图4)[6]:感知的局限性应保守处理;将车辆之间的交互(包括隐式通信和主动通信)纳入决策考虑;平衡行车安全和行车效率,即考虑策略的敏捷性。基于此,研究团队相继发表了多篇关于如何在各种典型交通场景下基于路权协商做出有效驾驶决策的论文[7]。图4:安全驾驶强调的三大核心原则[6]然而,协商驾驶受通信信息量的限制,尚未达到道路通行能力的最大利用。近年来,随着主动通信技术的成熟和分布式协同决策模型的发展,基于车联网的全球协同驾驶成为可能。协同驾驶的基本假设是所有道路车辆向中央控制系统报告自身的状态信息,完全服从系统统一分配的机动方案进行运动控制。在此假设下,自动驾驶汽车不再需要进行复杂的轨迹预测和风险评估,可以使用优化或搜索的方法以最小的计算成本最大化地利用道路资源(图5)[8,9]。图5:20辆车在不同策略下通过同一路口的时延对比[9]Enumeration——基于枚举的协同驾驶全局最优解(时延315.06s);MCTS——基于搜索的协同驾驶近似最优解(时间延迟316.18s);FIFO——基于规则协商驱动的通用解决方案(延迟382.54s)。实现上述协同驾驶需要三个先决条件:在车辆端,必须完成自动驾驶的替代,并配备有源通信设备;在路侧,必须部署密集的智能基础设施作为传感和通信节点;在云端,需要搭建一个低延迟、高并发的通信网络和控制中心。而这也意味着,协同驾驶在短期内注定无法落地。我们必须认真考虑如何在未来很长一段时间内面对自动驾驶汽车和人类驾驶汽车混合驾驶的现实。一个担忧是不同的自动驾驶汽车制造商有自己的驾驶策略。这可能会导致一些自动驾驶汽车根据自己的策略误判其他车辆的策略,从而导致事故发生。因此,研究人员呼吁就驾驶策略达成共识,以更好地实现和谐驾驶,提高驾驶安全性。随着机器智能水平逐渐接近人类,机器如何在更大范围内与人类和谐相处,将成为本世纪最重要的科学问题之一。在我国发布的《新一代人工智能发展规划》中,提出了我国2030年新一代人工智能发展的指导思想、战略目标和重点任务。其中,人机协同人工智能是一个主要的研究方向。自动驾驶是人工智能发展的一个代表性领域。在Level2-Level5人机协同驾驶和Level-4-Level5多车协同中,涉及人机协同人工智能研究问题。这些问题的解决涉及到行为建模、人机交互、心理学等交叉学科,需要得到更多的关注和重视。