当前位置: 首页 > 科技观察

感动哭了,机器人终于学会自己叠衣服了

时间:2023-03-17 12:05:49 科技观察

如果我们要锻炼人类孩子最基本的运动智能,比如抓东西、提东西,或者叠被子、叠衣服这样的家务活,几乎没有需要指导。很多时候,只要将宝宝置于日常生活情境中,让宝宝与周围的环境和物体进行互动,大部分宝宝在玩耍中就能自动掌握判断空间、重力和协调能力。相比之下,机器人更“娇生惯养”。目前,绝大多数机器人无法从复杂环境中自适应和学习一般运动能力。这就带来了一个问题:机器人只能“笨拙地”完成程序员先编好的一些动作,用单一的物体完成单一的技能。这个特定的任务和道具就是它的整个世界。比如能传杯,就不能传被子。这意味着我们可能不得不设计成千上万的机器人,仅仅为了处理一个特定的任务。这简直太愚蠢了。但是,让机器学会自主感知世界,并根据环境的变化做出相应的动作,是一项浩大的工程。最近,伯克利大学开发了一种基于视觉模型强化学习的新算法,使全能型机器人成为可能。也就是说,原本专属于人类的“元运动智能”也有望在机器中得到释放。当机器人具备掌握通用技能并将其内化为“经验”的能力,无需每次都重新学习或编程,就可以灵活地完成各种类似的任务时,前景显然值得惊喜。那么,这么神奇的东西是如何工作的呢?新算法如何引导机器?简而言之,该算法可以使用未标记的感官数据集让机器学习大量多样的图像,从而在完成任务时更灵活地进行预测和判断。这样,它可以对各种不同的对象执行许多不同的任务,而不必为每个对象或每个任务重新学习。在伯克利研究人员看来,能够以单一模式实现这种通用运动是智能的根本体现。那么,这种方法究竟是如何引导机器人完成工作的呢?首先,研究人员为机器人制作了大量丰富多彩的数据集,不局限于某个物体或某项技能;感知图像像素(视觉)、手臂位置(自我感知)和发送运动命令(运动)的各种传感器。完成这些准备工作后,让两个机器人同时在资源库中进行数据采集和自主学习,并实时共享。由于两个机器人可以共享彼此的感受和数据,因此具有预测下一步手臂运动路线的能力,从而使动作的运动范围具有更大的灵活性,以完成操纵不同类型物体的各种任务。例如,他们让机器完成苹果等刚性物体和折叠衣服等柔性物体的运动,机器人表现不错。而且,即使面对从未见过的目标,做出的预测虽然不如人类完美,但依然能够有效完成分配的任务。比如下图,研究人员给的任务是把苹果放在盘子里,中间是机器人制定的计划,然后是执行。这个算法模型在思想上绝对是独一无二的。根据预期结果规划行动方案,并根据不同步骤和观察实时迭代和改进计划,长期以来一直是人类在复杂世界中处理意外情况的独特技能。如今,机器人也有望学习这样的“高智能”游戏,所带来的适用性变化着实令人期待。重构机器效率坐标系:新机型的真实环境复杂多样。提高了机器人的环境适应能力,使任务执行更加灵活。这种新算法确实给机器人应用带来了极大的想象空间。亮点是机器的功能假设更符合实际。通用能力可以很容易地转移到不同的任务中,大大减少了为完成特定任务而需要开发和部署的算法数量。到目前为止,新模型似乎至少会在以下领域彻底改变机器人的性能:客户服务机器人。大多数客服机器人不适应环境,需要程序员综合考虑各种情况,有的甚至直接在后台与人进行交互。但是通过通用模型算法,机器人可以在与人类用户的交互中自主学习,学会解决一些开放性问题,变得更加自主和灵活。医疗机械。目前,医疗机器人只能作为医生双手的延伸,辅助完成手术任务。为了自主完成高精度手术,减轻医生的劳动强度,医疗机器人必须能够感知手术部位的空间位置,处理更精细、更复杂的手术。新模型显然提供了更多的可能性。工业机械。工业机器人已经具备了一定的通用性和适应性,但它??们往往需要重新编程以满足工作环境不断变化的需求,或者更换不同的机械手来执行不同的任务,这会带来一定的成本。如果真正应用新算法,工业生产的成本和效率将变得更低。个性化视频生成。除了现实世界中的运动感知和理解预测外,该算法在视频生成领域也具有巨大潜力。例如,系统可以通过大量未标注的视频资源进行自主学习,并根据视频中的人物进行形体识别和模仿,让AI裁剪高度拟人化的视频成为可能。掌握通用技能的机器应用还有很多,背后的商业前景也十分广阔。毕竟效率是人类发明机器的初衷。在品尝水果之前,我们需要面对哪些挑战?说了这么多,感觉新算法的实现难度不大,应用端也有足够的支持。它会很快成为现实吗?目前,在“摘桃子”之前,该算法还有一些特殊的局限性,可能会阻碍其实际应用。一是需要大量的训练数据。做出切合实际且可执行的操作预测的机器完全依赖于庞大且多样化的数据集。为了让机器根据先前帧的预测运动分布来想象和模拟下一个像素运动,研究人员引入了一个包含59,000个机器人交互的数据集,用于大规模自监督学习。如何在成本可控的情况下获取海量优质的数据资源,或许会成为算法落地的第一道门槛。二是无监督学习带来的一系列问题。例如,由于训练数据根本没有标签和奖励机制,如何保证机器人能够理解并接受指定的任务,然后以结果为导向的方式行动,在实践层面有很多未知数。Berkeley的解决方案是设置一个自我监督算法,让机器对目标保持兴趣,跟踪它,并不断重试,直到成功。但能否稳定产量还需要更多的补充研究。再比如,无人监督的机器做出的预测,是无法由具有自主经验的人类来解释的。它们不一定是最好的传输方案,也可能因为“黑匣子”带来不可预知的风险。当我们不了解自己的“元智能”是如何工作的时候,如何保证机器的“元智能”能够得到很好的控制呢?总而言之,这个算法虽然令人惊讶,但并不完美。*。想象很美好,实用性也不错,但从实验室到商业场景还有很长的路要走。