arXiv于2022年2月10日上传论文??“TransferableandAdaptableDrivingBehaviorPrediction”,在伯克利工作。虽然自动驾驶汽车仍在努力解决道路驾驶的挑战性问题,但人类早已掌握了高效、可转移和适应性驾驶的本质。通过模仿人类在驾驶过程中的认知模型和语义理解,分层框架HATN为多代理密集交通环境中的驾驶行为生成高质量、可迁移和适应性强的预测。这种分层方法由高级意图识别策略和低级轨迹生成策略组成。其中,定义了一个新的语义子任务,并给出了每个子任务的一般状态表示。通过这些技术,层次结构可以在不同的驾驶场景中转移。此外,该模型通过在线适应模块捕获个人和场景之间驾驶行为的变化。在开源的INTERACTION数据集中,通过交叉路口和环岛的轨迹预测任务展示了算法的性能。所提出的HATN(分层自适应和可迁移网络)框架由四个部分组成:1)在左侧,从车辆中提取交互式车辆,并构建语义图(SG)。在SG中,动态插入区域(DynamicInsertionAreas,DIA)定义为图的节点,自车可以插入其中。2)高层语义图网络(SGN)以SG为输入,负责推断车辆之间的关系和预测单个车辆的意图,例如插入哪个区域和对应的目标状态。3)低级编码器解码器网络(EDN)接收每辆车的历史动态和意图信号并预测其未来轨迹。4)在线适应(OA)模块根据历史预测误差在线适应EDN的参数,捕捉个体和特定场景的行为。下图是HATN的框图:下表正式阐明了HATN各模块的输入输出:各模型说明如下:HATNSG(场景图表示)SGNEDNMEKF(改进的扩展卡尔曼滤波器)提取的DIA为一个动态区域,可以通过自我智能确定插入或进入途中。每个DIA由一个由前sonota形成的前边界、一个由后sonota形成的后边界和两个由参考线形成的横向边界组成。图为DIA提取和SG构建过程:当其他车辆的车道参考线(通过DynamicTimeWarping算法确定)与本车车道参考线交叉时,基于冲突点,提取DIA并视为作为构建SG的节点。为了推断任意两个节点之间的关系,受图注意力网络(GAN)的启发设计了一个基于注意力的关系推理层。一旦高级策略决定去哪里,低级策略负责通过以更细粒度处理信息来实现这一目标,这得益于分层设计:1)简化学习,因为车辆只需要关心关于其自身的动力学,而交互、避免碰撞和道路几何形状的考虑留给高级策略(信息隐藏);可以更好地验证措施的效果;3)学习到的策略可以在不同的场景中转移和重用。在实践中,来自高级策略的预测意图信号本身可能携带来自高级策略或数据分布的误差方差。根据经验,发现最好的性能是:1)在Frenet坐标中;2)包括速度和偏航等输入特征;3)应用增量预测和位置对齐等表示技术;4)添加目标状态和解码意图信号等步骤。不同的驾驶场景也不可避免地会产生额外的行为变化。因此,使用在线自适应(基于卡尔曼滤波器)将定制的个人和场景模式注入到模型中。在线自适应的关键在于,由于驾驶员无法直接沟通,历史行为可能是驾驶员驾驶模式的重要线索,在此基础上调整模型参数以更好地适应个体或场景。在线适应背后的直觉是,尽管给定相同的目标状态,但驾驶员可以通过不同的方式实现它。捕获此类定制模式可以改善生成的行为人类相似性。整个算法的伪代码如下图所示:3个实验场景如下:1)自车如何与其他车辆交互,通过一个共同的冲突点(一次交互);2)self-vehicle如何与其他车辆交互通过一系列Conflictpoints(一系列交互);3)当自车在没有重新训练的情况下转移到环岛场景时,自车如何与其他车辆交互(场景可转移交互)。Scenario:oneinteraction场景:一系列交互场景:transferableinteraction下面两张表是HATN和其他6种方法在十字路口和环岛场景下的对比:1.Notimedomain:该方法不考虑历史信息,即仅考虑当前时间步t的信息。2.GAT:这种方法使用绝对特征来计算节点之间的关系,而不是使用相对特征。这种方法对应于原始的图注意力网络(GAN)。3.singleagent:该方法只考虑本车意图预测的损失,不考虑其他车辆的意图预测。4.Two-layergraph:这种方法有一个two-layergraph做informationembedding,也就是用两个图做aggregation。5.多头:该方法利用多头注意机制来稳定学习。该方法在第二节中进行关系推理。4.2.2独立并行多次,将所有聚合特征连接起来作为最终的聚合特征。6.SeqGraph:该方法在每个时间步首先对图进行关系推理,然后将聚合图的序列馈入RNN进行时间处理。作为比较,我们的方法首先将每个节点的历史特征序列嵌入到RNN中,然后使用每个节点在当前时间步的隐藏状态从RNN进行关系推理。一些观察结果:1)HATN在十字路口和环形交叉路口实现了最低的误差;2)由于缺乏时间信息,无时域方法在十字路口和环形交叉口场景中都是最差的;3)GAT方法产生的错误比HATN要高很多,尤其是在roundabout场景中(58%),这表明在关系推理中使用相关特征的必要性;4)HATN优于单代理方法,这意味着所有车辆生成的目标状态都被纳入损失函数,可以增加数据并鼓励交互式推理;5)两层图方法是最接近HATN的方法,尽管根据训练记录它存在严重的过度拟合;6)multi-head方法在十字路口场景中的准确率第二高,但在roundabout场景中的表现要差很多,可以通过仔细调整或搜索合适数量的heads来提高;7)在十字路口和环形交叉路口的情况下,SeqGraph方法倒数第二,这可能意味着,过去的交互很难帮助预测,但它确实让学习变得更加困难。下表是intentsignal的影响:下表是rule-based和learning-based方法与HATN的比较:
