当前位置: 首页 > 科技观察

Meta研究人员做出AI新尝试:教机器人无需地图或训练实现物理导航

时间:2023-03-15 23:27:41 科技观察

Meta研究人员在AI上做出新尝试:教机器人在没有地图或训练的情况下导航少量的训练数据。取得了快速进展。该研究可以显着缩短人工智能模型获得视觉导航能力所需的时间。以前,实现这些目标需要对大型数据集进行重复的“强化学习”。MetaAI研究人员表示,这种对AI视觉导航的探索可能会对虚拟世界产生重大影响。项目的基本思路并不复杂:帮助AI像人类一样,简单地通过观察和探索,在物理空间中导航。MetaAI部门解释说,“比如我们想要AR眼镜引导我们找到钥匙,我们必须想办法帮助AI理解陌生且不断变化的环境布局。毕竟这是一个非常详细的小需求,不可能永远依赖高精度预设地图,占用大量计算资源,人类不需要知道茶几的确切位置或长度,就可以轻松绕过桌子的角落没有任何碰撞。”为此,Meta决定专注于“embodiedAI”,即通过3D模拟中的交互机制来训练AI系统。在这方面,Meta表示已经构建了一个很有前途的“point-to-object”导航模型”,用于在没有任何地图或GPS传感器的情况下导航新环境。该模型使用一种称为视觉测量的技术,允许AI根据视觉输入跟踪其当前位置。据Meta称,这种数据增强技术可以快速有效地训练Meta还提到,他们已经在他们的Habitat2.0EmbeddedAI训练平台上完成了测试(使用RealisticPointNav基准测试任务来运行虚拟空间模拟),成功率为94%。Meta解释说,“虽然我们的方法并没有完全解决数据集中的所有场景,这项研究初步证明了真实环境的导航能力并不一定需要显式映射来实现。”为了进一步改进AI导航训练,Meta构建了一个名为Habitat-Web的训练数据集,其中包含超过100,000种不同的人类演示的目标-目标导航方法。运行在网络浏览器上的Habitat模拟器可以流畅地访问Amazon.com的MechanicalTurk服务,让用户可以安全地远程操作虚拟机器人。由此产生的数据将作为训练材料,帮助AI代理实现“最先进的结果”,Meta说。扫描房间了解整体空间特征、查看角落是否有障碍物等,都是值得AI向人类学习的高效物件搜索行为。此外,MetaAI团队还开发了所谓的“即插即用”模块化方式,可以通过独特的“零样本体验学习框架”帮助机器人在多种语义导航任务和目标模式下实现泛化”。通过这种方式,AI代理无需额外调整即可获得基本的导航技能,从而在3D环境中执行不同的任务,而无需资源密集型地图和培训。Meta解释说,这些代理经过训练可以持续搜索图像对象。他们收到在环境中随机位置拍摄的照片,并自主导航以尝试找到位置。Meta研究人员表示,“我们的方法将训练数据减少到1/12.5,成功率比最新的迁移学习技术高出14%。”ConstellationResearch分析师HolgerMueller在接受采访时表示,Meta的这一最新进展有望在其Metaverse开发计划中发挥关键作用。他认为,如果未来虚拟世界能够成为常态,那么AI一定能够理解这个新的空间,而且理解的成本应该不会太高。Mueller补充说:“AI理解物理世界的能力需要通过基于软件的方法来扩展。Meta目前正在走这条路,并且在体现AI方面取得了进展,开发了无需训练即可理解周围环境的自主系统。”软件。我期待看到这一结果早日应用于实践。”这些真实世界的用例可能并不遥远。Meta说,下一步是将这些努力从导航转移到移动操作,开发可以执行特定任务(例如识别钱包并将其归还给所有者)的AI代理。