arXiv于2021年9月28日从丰田Level5上传了论文“SafetyNet:Safeplanningforreal-worldautomotivevehiclesusingmachine-learnedpolicies”收购Lyft自动驾驶团队。本文介绍了通过专家演示培训实现安全的自动驾驶控制系统。由于机器学习(ML)方法存在安全问题且风险不可预测,因此添加了一个基于规则的回退层来对ML决策执行完整性检查,这可以将ML规划器中的冲突减少95%。整个实验使用300小时的驾驶数据进行模仿学习(IL),并在三繁市进行测试。更多信息参见Autonomy2.0-2022-SafetyNetcodeGitHub-lyft/l5kit:L5Kit-level5.lyft.com图中展示了SafeNet的基本框架:MLplanning给出轨迹预测,由回退层验证。下图是SafeNet在三番城的自动驾驶示例:图中展示了模型的架构:VectorNet类似于谷歌的WayMo,一种分层图网络;PointNet网络用于输入信息(车辆姿态和尺寸,其他智能体的姿态、尺寸和目标类型,高精地图的静态信息和动态信息,以及路线规划路由的本地编码),以及基于Transformer的全局嵌入推理代理与地图特征的交互。这种结构将基于自行车模型通过运动解码器来做控制信号。网络训练以模仿学习为基础,加入扰动,扩大分布,减少协方差偏移的影响。损失函数考虑了曲率kt和jitterjt的因素来提高舒适度,即这里对motiondecoder的模型做一个补充如下:在fallbacklayer中,考虑了几个维度进行轨迹评估:动态可行性:包括约束纵向加加速度、纵向加速度、曲率、曲率、横向加速度和转向加加速度(曲率X速度);legality:交通规则,如停车标志、红灯、离开道路或让路等。collisionprobability:碰撞检测标记轨迹[Feasible,Infeasible],最终产生最接近ML预测轨迹的Feasible结果.训练规模如下:fallbacklayer的影响:实验性能对比:MLplanning和MLplanning+fallbacklayerSafetyNet结合了MLplanner和rule-basedsystem的fallbacklayer,与纯机器对比基于学习的系统,安全性和舒适度指标得到改进,并在旧金山充满挑战的街道上进行了测试。将来,回退层可以细化为不那么保守并且不增加被动性。或者,可以从基于模型的强化学习(RL)、离线RL或数据驱动模拟的闭环训练中获得改进。
