当前位置: 首页 > 科技观察

Waymo与谷歌提出TNT模型实现自动驾驶多轨迹行为预测

时间:2023-03-13 18:35:21 科技观察

介绍:Waymo近日宣布在凤凰城地区开通无安全员无人驾驶出租车,实现了首次商用的真正意义上的无人驾驶。与此同时,Waymo还公开分享了一系列新的研究论文。本文将阐述Waymo在行为预测方面的研究成果。接下来的几秒钟,周围的车辆和行人会做什么?要实现安全的自动驾驶,这是必须回答的关键问题,也是自动驾驶领域的行为预测问题。行为预测的难点在于周围行人、车辆和各种规则之外的行为的不确定性。这些情况很难用规则来概括,因此研究人员最近开始使用基于数据驱动的深度学习的方法来获得更合理的预测结果。对此,来自Waymo和谷歌的团队提出了一系列用于自动驾驶行为预测的模型,让无人车能够理解抽象的道路环境,实现对车辆和行人的多可能性预测。在今年6月的一篇CVPR论文中,该团队首先提出了一个新模型VectorNet。在这个模型中,团队首次提出了一种抽象周围环境信息的方法:用向量来简化地图信息和移动物体的表达。这种方法摒弃了传统的渲染图像的方式,达到了减少数据量和计算量的效果。Waymo在其博文中也明确表示,该技术提高了其行为预测的准确性。最近,该团队宣布了进一步的工作并提出了TNT(Target-driveNTrajectoryPredictio)。TNT是一种目的地引导的轨迹预测方法。它使用监督学习对车辆和行人进行多轨迹回归。最终模型可以输出多个未来轨迹预测,并清楚地表明每个轨迹的可能性。论文称,TNT在公开数据集Argoverse的测试成绩堪比冠军,在INTERACTION、StanfordDrone、Waymo的内部数据集上都取得了非常好的成绩。目前,该论文已被国际机器人学习会议CoRL(ConferenceonRobotLearning)录用。预测未来多种可能情况Waymo在博客中指出,VectorNet在以矢量方式抽象表达世界方面取得了突破,从而感知和理解周围环境。了解环境后,下一步就是实现更好的行为预测。自动驾驶行为预测与其他问题的不同之处在于,周围的车辆和行人在接下来的几秒内有多种可能行驶。这些可能性本身也会影响自动驾驶汽车的决策规划。例如,如果机器可以计算出前方车辆有80%的概率左转,20%的概率右转,自动驾驶车辆就可以根据这个结果做出更好的决策方案。同时,对于机器来说,即使其他车辆右转的概率只有1%,这种可能性也不容忽视。然而,这种针对多种可能性的多轨迹预测具有很大的技术难度。目前的神经网络难以应对多轨迹预测的任务。据业内人士介绍,神经网络擅长一对一和多对一的拟合问题,而不是一对多的问题。多对一就像一个常见的分类问题,输入车辆的多张照片,神经网络可以准确地将这些照片识别为“汽车”的类别。一对一就像一个常见的回归问题,输入一张车辆的照片,神经网络可以估计出它的长宽高等维度。但是如果你输入一个样本,想让神经网络返回三个结果,这是神经网络不擅长的事情。据介绍,目前市场上基本的解决方案是根据交通规则获取周边车辆和行人的出行可能性。如果交通规则允许这条路直行,左转右转,那么就有三种可能。但是,这种方法的预测结果并不完全可靠,因为没有考虑到规则之外的情况,例如借路和非法掉头。事实上,要保证自动驾驶长时间的安全,需要处理情境的能力非常重要。从近两年的论文内容来看,很多团队都在尝试使用生成模型进行多轨迹预测。即利用GAN、VAE等模型在潜在空间中进行采样,以获得特定场景下周围目标的多个潜在选项。但是依赖生成模型的问题是样本采集存在很大的随机性,这对于一个要求可靠性的系统来说是不能接受的。假设前面来车左转的可能性是90%,右转的可能性是10%,采用采样的方式,采样3次后我们很可能会左转,而忽略右转的可能性.在自动驾驶领域,基于该方法的行为预测难以实际应用。SupervisedPredictionwithSupervisedLearning团队首次提出的TNT采用监督学习的方法预测车辆和行人的多条轨迹。它是一种目的地引导的轨迹预测方法。其模型最大的贡献是可以在不依赖采样的情况下,纯粹通过监督学习来预测多轨迹行为。具体来说,模型的行为预测依次分为三个步骤,每个步骤都有一个特定的目标:1.利用地图的先验信息对目的地进行离散化预测;2、根据预测的目的地,进一步预测目标的运行轨迹;3.在预测的多条跑步轨迹中,对每条轨迹进行筛选打分,预测每一种选择的可能性,同时选出最有可能的跑步轨迹。在技??术层面,使用监督学习的好处在于,最终的模型可以给出多个未来轨迹的预测,同时清楚地表明每个轨迹的可能性。比如在输出三个轨迹的情况下,模型可以明确表示左转的可能性为30%,右转的可能性为30%,直行的可能性为40%。这样的预测结果其实是可以被决策系统所利用的。在最终性能方面,单个TNT模型的行为预测准确率堪比公开数据集Argoverse测试性能中的冠军成绩,并在INTERACTION、StanfordDrone等测试中取得了非常好的成绩。图|论文作者团队,从左到右分别是赵星、高继阳、孙辰。该论文的核心作者来自Waymo和谷歌。其中,赵星是Waymo研究科学家,本科毕业于浙江大学,获得麻省理工学院博士学位;高继洋现任Waymo高级工程师,本科毕业于清华大学,后获南加州大学博士学位;何孙晨本科毕业于清华大学,毕业于南加州大学博士后。他目前在谷歌担任研究科学家。