大多数机器人的导航方式与大多数人类的导航方式完全不同。当机器人对环境有全面的了解,对周围的一切进行完整的几何重建,并且对自己的位置和方向有准确的了解时,它们的表现最佳。激光雷达、既有地图、强大的计算机,甚至动作捕捉系统,对于自主机器人的“需求”可以说是永无止境的。但很明显,这些东西不能很好地扩展,当然研究也可能负担不起。考虑到这一点,在最近的一篇论文《ViKiNG: Vision-Based Kilometer-Scale Navigation with Geographic Hints》中,加州大学伯克利分校的人工智能博士生DhruvShah和他的导师SergeyLevine探索了一种不同的机器人导航方法。他们主张消除机器人导航中的高端耗电组件,只需要一个单目摄像头、一些神经网络、一个基本的GPU系统,以及一些以非常基本的人类可读自上而下视图形式出现的简单提示。这些提示听起来可能没有那么有影响力,但它们使一个非常简单的机器人能够高效、智能地穿越陌生环境,到达遥远的目的地。论文地址:https://arxiv.org/pdf/2202.11271.pdf项目主页:https://sites.google.com/view/viking-release具体来说,该研究提出了一种基于学习的方法,将学习和规划综合和辅助信息,如示意性道路图、卫星地图和GPS坐标可以用作规划启发式。ViKiNG结合了一个局部遍历性模型,该模型查看机器人当前基于相机的观察结果和一个潜在的子目标,以推断达到该子目标的难易程度。此外,ViKiNG包括一个启发式模型,该模型查看顶视图并尝试为各种子目标估计到目的地的距离。ViKiNG不执行显式几何重建,仅利用环境的拓扑表示。尽管在ViKiNG训练数据集中从未见过超过80米的轨迹,但它可以利用基于图像的学习控制器和目标导向的启发式算法,在3公里以外的以前看不见的环境目标中导航最远,并表现出复杂的行为。ViKiNG对不可靠的地图和GPS也很稳健,因为底层控制器最终根据自己的图像观察做出决策,而地图仅??用作规划启发式。ViKiNG机器人的导航如下:ViKiNG简介如果那个小机器人看起来很眼熟,那是因为几年前我们通过Levine的学生GregKhan认识了他。当时,这个机器人被命名为BADGR,它的特殊技能是根据简单的图像和生活经验学习在新环境中导航——或者任何具有与生活经验相当的机器人。BADGR,ViKiNG的前身。BADGR现在已经演变成ViKiNG,它代表具有地理线索的基于视觉的公里级导航。虽然BADGR可以在小范围内自由行走,但它的继任者ViKiNG旨在远距离寻找物体,这是迈向实际应用的重要一步。导航,从广义上讲,包括知道你在哪里,你想去哪里,以及你想如何到达那里。对于机器人来说,这相当于一个长期目标。一些遥远的GPS坐标可以通过实现一系列短期目标来实现,例如在接下来的几米内保持在特定路径上。达到足够多的短期目标,您就达到了长期目标。但也有一种中期目标,这特别棘手,因为它涉及就最佳路径可能是什么做出更复杂和抽象的决策。或者,换句话说,哪种短期目标组合最适合实现长期目标的使命。方法概述。这就是ViKiNG技巧的用武之地。使用卫星地图或路线图,机器人可以对短期目标做出更明智的选择,从而大大增加实现这些目标的可能性。即使有路线图,ViKiNG也不局限于道路;它可能对道路有好处,因为这就是它所拥有的信息。包括道路和其他地形在内的卫星图像为机器人提供了更多信息。这些地图是提示,而不是说明,这意味着ViKiNG可以适应它没有预料到的障碍。当然,地图无法在较小的范围内告诉机器人确切的去向(无论这些短期目标是否可穿越),但ViKiNG可以通过其单目摄像头自行处理。ViKiNG的性能是惊人的,正如你在图片中看到的,蓝线是ViKiNG导航路径,这是通向目标的最佳路径。值得一提的是,研究人员并没有向ViKiNG提供周围环境的地图,它通过基本的GPS完成这项任务,此外,还需要提供照片、目标GPS坐标、单目相机和地图。上图显示了机器人穿越一条ViKiNG可以自主导航的短路径。论文通讯作者、加州大学伯克利分校助理教授、强化学习大师SergeyLevine表示:这项研究令人兴奋,因为整个过程非常简单。与使用大量软件堆栈和交互组件的自动驾驶系统不同,该系统使用两个神经网络(一个处理第一人称图像和一个处理地图图像)和一个规划算法来确定机器人的行走路径。这项研究可以说意义重大,因为当今的机器人导航系统过于复杂,无法大规模部署。如果简单的基于学习的系统可以匹配或超过复杂的手工设计方法,这可能为未来的机器导航应用指明方向。
