本文转载自雷锋网,如有疑问请私讯2022年5月23日,一年一度的机器人领域国际顶级会议ICRA2022(IEEE机器人与自动化国际会议)如期在美国费城召开。今年是ICRA举办的第39个年头。ICRA是IEEE机器人与自动化学会的旗舰会议,也是机器人研究人员展示和讨论其工作的主要国际论坛。在今年的ICRA上,亚马逊的三位首席机器人专家SiddSrinivasa、TyeBrady和PhilippMichel简要讨论了在现实世界中构建人机交互机器人系统的挑战。图说:从左至右依次为亚马逊机器人人工智能总监SiddSrinivasa、亚马逊机器人(全球)首席技术专家TyeBrady、亚马逊Scout应用科学高级经理PhilippMichel,全球知名机器人专家,IEEEFellow,目前在华盛顿波音大学特聘教授和亚马逊机器人人工智能项目主任,负责管理协助亚马逊物流中心员工的自主机器人算法,研究可以拾取和包装产品以及推车的机器人——类型的机器人可以自主卸载和运输货物。TyeBrady是AmazonRobotics(全球)的首席技术专家,拥有麻省理工学院航空航天工程硕士学位。PhilippMichel和SiddSrinivasa都是CMU机器人学院的博士校友,也是AmazonScout机器人项目的高级管理人员。他们就解决机器人着陆挑战的问题提出了自己的看法。AI科技评论在不改变初衷的情况下做了重组,如下:Q:你在机器人领域的研究分别解决了不同的问题。这些问题之间有什么相似之处?SiddSrinivasa:机器人研究的一个重要困难是我们生活在一个开放的世界中。我们甚至不知道我们即将面对的“输入”是什么。在我们的运营中心,我需要处理超过2000万件物品,而且这些物品的数量每天都在以数百件的速度增加。大多数时候,我们的机器人并不知道自己在拣取什么物品,但它们需要小心翼翼地拣取物品并快速打包,不要损坏物品。PhilippMichel:对于Scout来说,困难在于在人行道上遇到的物体,以及它所处的运输环境。我们在美国四个州部署了私人交付设备。天气条件、光照条件……我们从一开始就知道我们必须处理很多变量才能让机器人适应复杂的环境。TyeBrady:在开发执行机器人的过程中,我们在半结构化环境中运行具有显着优势。我们可以为机器人制定自己的交通规则,了解环境确实有助于我们的科学家和工程师深入了解我们想要移动、操纵、分类和识别以及执行命令的物体。也就是说,我们可以在现实世界中实现对技术的追求。PhilippMichel:另一个共同点是我们严重依赖从数据中学习来解决问题。Scout在执行任务时接收真实世界的数据,然后迭代开发用于感知、定位和导航的机器学习解决方案。SiddSrinivasa:我完全同意(学习从数据中解决问题)。我认为机器学习和自适应控制是超线性缩放的关键。如果我们部署几万台机器人,我们不可能有几千名科学家和工程师来研究它们,我们需要依靠现实世界的数据来实现超线性增长。另外,我认为开放的世界会迫使我们思考如何“不断学习”。我们的机器学习模型往往是根据一些输入数据分布来训练的,但是由于这是一个开放的世界,我们会遇到“covariateshift”的问题,即我们看到的数据与分布不匹配,这会导致机器学习模型过于自信,通常是没有理由的。因此,我们所做的很多工作都是创建“看门狗”(一种监督设备)来识别输入数据分布何时偏离其训练的分布。然后,我们进行“重要性采样”,以便我们可以挑选出发生变化的数据并重新训练机器学习模型。PhilippMichel:这也是为什么我们要在不同的地方训练机器人的原因之一,这样我们可以及早知道机器人可能遇到的现实数据,这反过来又迫使我们开发可以解决新数据的解决方案。SiddSrinivasa:这真是个好主意。拥有多个机器人的优势之一是系统能够识别发生了什么变化,重新训练,然后与其他机器人分享这些知识。想想分拣机器人的故事:在世界的某个地方,机器人遇到了一种新型包装。起初,它很困扰,因为它从未见过这种情况,无法识别。然后一个新的解决方案出现了:这个机器人可以将新的包装类型传递给世界上所有的机器人。这样,当这种新的包装类型出现在别处时,其余的机器人就知道如何处理它。相当于有了一个“备份”。当一个点出现新数据时,其他点就会知道,因为系统已经能够自我重新训练并共享信息。PhilippMichel:我们的机器人正在做类似的事情。如果我们的机器人遇到了以前没有遇到过的新障碍,我们会尝试调整模型来识别和处理这些障碍,然后将新模型部署到所有机器人上。让我夜不能寐的一件事是我们的机器人会在人行道上遇到新物体,但这些物体在接下来的3年内不会再遇到,例如:人们用它来装饰万圣节石像鬼的草坪,或者人们把雨伞放在野餐桌上,这样它看起来就不像一张“野餐桌”。在这种情况下,没有任何机器学习算法能够识别出这是一张野餐桌。所以我们的一部分研究也是关于如何平衡一般的东西,不需要和具体类别的东西纠缠在一起。如果这是一个敞开的井盖,那么机器人一定要善于识别,否则就会掉下去。但是如果它只是一个随机的盒子,我们可能不需要知道盒子的层次结构,只需要知道这是我们要绕过的对象。SiddSrinivasa:另一个挑战是,当您更改模型时,可能会产生意想不到的后果。更改后的模型可能不会影响机器人的感知,但可能会改变机器人“刹车”的方式,并导致滚珠轴承在两个月后磨损。在端到端系统中,许多有趣的未来研究都是关于“了解系统部分变化对整个系统性能的影响”。PhilippMichel:我们花了很多时间思考是否应该划分机器人堆栈的不同部分。它们之间的整合可以带来很多好处,但也是有限的。一个极端的例子是相机到电机到扭矩的学习,这在任何现实世界的机器人应用中都非常具有挑战性。然后是传统的机器人堆栈,它很好地分为定位、感知、规划和控制等部分。我们还花了很多时间思考堆栈应该如何随着时间的推移而演变,当我们将这些部分更紧密地结合在一起时,我们会获得哪些性能提升?同时,我们希望拥有一个尽可能保持可解释性的系统。我们尝试利用整个堆栈最大限度地集成学习组件,同时保留可解释性和安全性功能的数量。SiddSrinivasa:这是一个很好的观点,我完全同意Philipp的观点,即一种模式不一定会统治所有模式。但通常,我们最终构建的机器学习模型共享一个具有多个应用头的主干。什么是对象,分割对象是什么意思?可能类似于拣选、堆叠或包装,但每个都需要专门的头脑,搭载在特定任务的骨干上。PhilippMichel:我们考虑的一些因素是电池、范围、温度、空间和计算限制。因此,我们需要有效地使用我们的模型,优化模型,并尝试尽可能多地利用共享主干,正如Sidd提到的,不同的负责人负责不同的任务。图例:AmazonScout是一款可以在公共人行道上以步行速度移动的自主送货机器人,目前正在美国四个州进行实地测试。问:当我问起你们项目之间的共性时,我想到的一件事是你们的机器人在与人类相同的环境中工作。为什么这会使事情复杂化?SiddSrinivasa:机器人正在接近人类生活,我们必须尊重人类世界中发生的所有复杂互动。除了步行、驾驶和执行任务外,还有复杂的社交互动。对于机器人来说,首先要有意识,其次要参与。真的很难,当你在开车的时候,有时候很难知道别人在想什么,并根据他们的想法来决定如何行动。只是推理问题很难,然后关闭循环就更难了。如果机器人正在下国际象棋或与人类对抗,则更容易预测他们将要做什么,因为规则已经制定好了。如果你假设你的对手是最优的,那么即使他们不是最优的,你也会做得很好。这在一些双人游戏中是有保证的。但实际情况并非如此。我们发现,在玩这种保证双赢的合作游戏时,在游戏过程中其实很难准确预测,即使合作伙伴是出于好意。PhilippMichel:人类世界的行为千差万别。有些宠物完全不理会机器人,有些宠物会走向机器人。行人也是如此,一些人对机器人视而不见,而另一些人则径直走向它。尤其是孩子们,他们超级好奇,互动非常亲密,我们需要能够安心应对所有的互动场景,这些变数是非常令人兴奋的。
