当前位置: 首页 > 科技观察

大国为何争抢陆战机器人?

时间:2023-03-22 13:15:37 科技观察

本文转载自雷锋网。如需转载,请在雷锋网官网申请授权。方法几乎一样,只能得到其中的一个。机器如人,路漫漫其修远兮。在军备竞赛中,只要一个国家迈出了第一步,就会出现第二个国家,紧接着又会出现第三个国家……最终形成一个紧张而微妙的霸权关系网络。身陷人类历史上最大的卷入,各国军队研发作战机器人的用意何在?站在军事革命的长河中,作战机器人的技术到底进步到哪里去了?人工智能会成为军备竞赛的重要组成部分吗?我们是专注于军备竞赛的恐怖,还是专注于边疆激发机器人的意识潜力?从科技发展的角度来看,很多高科技的发展都是基于军事的机会。1968年,阿帕网(ARPAnet)诞生。有一种广为流传的说法,ARPAnet是美国国防部为了抵御前苏联的核攻击而建设的通信网络。即使一些指挥点被摧毁,其他的指挥点仍然可以正常通信。这个局域网最初被美国国防高级研究计划局用于军事研究目的,被认为是当今互联网的前身。从此,互联网技术开始了从局域互联到广域互联、从军用到民用的发展历程。不过,着眼于全球范围内成效显着的AI落地项目,人工智能技术在医疗健康领域大显身手。原因不仅在于医疗领域有大量数据可供机器学习使用,更重要的是,医疗问题往往边界清晰,AI操作极为隐秘和规律。在这个数据密集型、知识密集型、脑力劳动密集型领域,机器学习更像是设定一个盈亏目标,通过无限的疲惫,依靠拥有强大计算能力的超级计算机,但它远非如此。人们认为知识的“智能”还有很大差距。在现实世界中,边界清晰的问题非常少。军事行动地形复杂,作战环境取决于双方的机动战术。在软规则和硬规则约束下成长起来的机器人,能否根据军事行动的特殊约束,提升自主决策能力,成长为与士兵协同作战的钢铁智能?一、世界军事强国对机器人军队的愿景英国计划在2030年打造一支机器人军队,部署12万台“终结者”机器人用于下一代战争。根据英国国防参谋长尼克卡特将军的说法,在未来十年或2030年代,大约四分之一的英国军队可能是机器人。与此同时,美国正在研发机器人战车,以增强陆军的作战能力。到2030年代,这些快速、强大的车辆将在战场上巡逻并与军队并肩作战。大多数人对发达国家率先使用机器人作为其军备的一部分并不感到惊讶。机器人可以填补新兵的缺口,减少对人类士兵的依赖,并以多种方式扩大国家的军事力量。以美国为首的许多国家已经在增加对机器人技术的军事投资,机器人很可能成为未来任何国家军事武库的重要组成部分。从历史的角度来看,当社会形态开始向智能化演化时,战争形态也必然向智能化演化。从冷兵器时代强调士兵肉搏的刀枪剑戟,到强调战略战术的热兵器时代枪林弹雨,我们是否要迎来信息时代?战争、信号战和无人战?目前,美国陆军研究实验室(ARL)正在训练机器人在崎岖地形(上图、中图)上测试自主导航技术,目标是与人类队友合作。ARL还在开发具有操纵能力的机器人,这些机器人可以与物体互动并取代战斗中多余的人类动作。然而,机器人的底层技术是否变得令人生畏?带着这些问题,IEEESpectrum高级编辑EvenAckerman近日参观了位于马里兰州的阿德尔菲实验室中心(AdelphiLaboratoryCenter)),以第一人称视角撰写了这篇文章。AI科技评论整理,与大家一起探索军用和野战机器人的真实能力。2.美国陆军研究实验室的陆战机器人(1)在混乱的环境中,机器人表现不佳“我可能不应该站得这么近,”我说,机器人慢慢靠近前面地板上的一根大树枝我。对自己说。让我紧张的不是树枝的大小,而是这个自主操作的机器人。虽然我知道它应该做什么,但我一点也不确定它接下来会做什么。如果一切都像ARL的机器人专家预期的那样,机器人接下来会识别出树枝的存在,抓住它,并将其拖到路边。机器人很清楚他们在做什么,但我站在他们面前还是很害怕,所以我向后退了一小步。这款机器人名为“RoMan”(机器人操纵),意思是“机器操作”,大约有大型割草机那么大,并且有一个履带式底座,可以应对大多数不同的路况。它的前部有一个小躯干,配备摄像头和深度传感器;以及一对手臂,其原型来自救灾机器人RoboSimian,最初由美国宇航局喷气推进实验室(JPL)为美国DARPA研发。机器人竞赛开发以执行与灾难相关的任务。RoboSimian如今,Roman的任务是扫清道路。这是一个多步骤的任务,ARL希望机器人尽可能自主地完成它。操作员不会指示机器人如何抓取物体或将其移动到特定位置,而是告诉RoMan“清理一条干净的路径”,然后机器人决定如何完成任务。“自主决策能力”是机器人可以被称为“人”的原因。我们重视机器人,因为它们能够感知周围发生的事情,根据感知到的信息做出决定,然后在没有人为干预的情况下采取有效行动。过去,机器人根据高度结构化的规则做出决策。在工厂这样的结构化环境中,机器人工作得很好,但在混乱、陌生或定义不明确的环境中,比如战场,那么对规则的依赖会使机器人变得“笨拙”,因为机器人无法准确预测和计划先。(2)深度学习:“绊脚石”与许多机器人(包括家用吸尘器、无人机和自动驾驶汽车等)一样,RoMan使用人工神经网络来应对在半结构化环境中遇到的挑战。大约十年前,人工神经网络开始广泛应用于各种半结构化数据。以前,这种半结构化数据一直是运行基于规则的编程(也称为“符号推理”)的计算机的问题。人工神经网络不是识别特定的数据结构,而是识别数据中的模式,寻找与网络之前遇到的数据相似但不完全相同的新数据。人工神经网络的部分吸引力在于它们是根据示例进行训练的,允许神经网络从标记数据中学习以形成自己的识别模式。具有多层抽象的神经网络被称为“深度学习”。尽管人类参与了训练过程,并且人工神经网络受到了人脑神经网络的启发,但深度学习系统识别的模式与人类看待世界的方式根本不同。我们往往无法理解深度学习系统的输入数据和输出数据之间的关系,因此深度学习系统常被称为“黑盒”模型。深度学习的这种“黑匣子”不透明决策性质给RoMan和ARL实验室等机器人带来了问题。这种不透明性也意味着必须谨慎使用依赖深度学习系统的机器人。深度学习系统擅长识别模式,但缺乏人类对世界的理解,无法像人类一样做出明智的决定。这就是为什么深度学习在一些定义明确的小规模应用程序中效果最好的原因。“当你同时拥有结构良好的输入和输出,并且你可以在这些输入和输出中充分表达你的问题时,那么深度学习就非常有用了。”美国罗切斯特大学机器人与人工智能实验室主任汤姆·霍华德发言。此前,TomHoward为RoMan和其他地面机器人开发了许多自然语言交互算法。“问题是,在对智能机器人进行编程时,这些依赖深度学习系统的机器人究竟有多大?”霍华德解释说,当你将深度学习应用于更高层次的问题时,输入数据的数量可能会非常大。处理大规模数据非常困难。特别是当研究对象是重达170公斤的双臂军用机器人时,其在执行任务时不可预测或无法解释的行为就变得极为关键。几分钟后,罗曼没有动——它仍然坐在那儿,在树枝上沉思,手臂像螳螂一样挥舞着。在过去的10年里,ARL的机器人协作技术联盟(RCTA)一直与来自卡内基梅隆大学、佛罗里达州立大学、通用动力陆地系统、喷气推进实验室、麻省理工学院、QinetiQ北美、中国佛罗里达大学、宾夕法尼亚州和其他顶级研究机构正在合作开发用于未来地面作战的机器人自主性。RoMan就是这个大项目的代表。RoMan正在考虑的“清理道路”任务对于机器人来说很难,因为该任务非常抽象。在这项任务中,罗曼需要识别可能挡路的物体,推断这些物体的物理特性,弄清楚如何抓住它们,以及最好使用哪种操纵技术(推、拉、举等),然后移动这些Behavior被完全执行。对于一个对世界了解有限的机器人来说,这个任务步骤太多,充满了未知数。(3)“模块化”认识世界ARL操纵和运动项目人工智能首席科学家EthanStump说:“让机器人逐渐认识世界,这是ARL开发的机器人与其他机器人的不同之处这依赖于深度学习。“军队可能在世界任何地方执行任务,但我们不可能收集适用于机器人的所有地形的详细数据。我们可能会被派往世界另一端未开发的森林,但我们的表现也和你自己的后院一样好,”他说,但大多数深度学习系统只能在它们接受训练的领域和环境中可靠地工作。此外,如果军用战斗机器人的深度学习系统表现不佳,它们无法通过简单地收集更多数据来解决问题,这是有限的。ARL的机器人还需要知道它们在做什么。“在标准执行中Stump解释说,“对于任务的顺序,你有目标、约束和表达指挥官意图的词语。”换句话说,RoMan可能需要快速清理一条路径,也可能需要安静地清理一条路径。关于任务的具体要求。即使对于当今最先进的机器人来说,这也是一项艰巨的任务。正如我所看到的,RoMan再次移动了树枝。ARL的自主方法是模块化的,其中深度学习与其他技术相结合,使RoMan能够elpARL确定哪些任务适合哪些技术。目前,RoMan正在测试两种不同的方法来从3D传感器数据中识别物体:Penn方法基于深度学习,而CarnegieMellon使用perception-by-search方法,它依赖于更传统的3D模型数据库。搜索感知方法只有在预先确定要寻找的对象时才有效,但训练起来要快得多,因为每个对象只需要一个模型。和。搜索感知方法即使在难以感知的情况下也能准确识别对象,例如当对象的一部分被遮挡或倒置时。ARL同时测试这两种方法,并行运行它们并相互竞争以选择最通用和最有效的方法。感知是深度学习擅长的事情之一。ARL的计算机科学家MaggieWigness说:“得益于深度学习,计算机视觉领域取得了长足的进步,我们已经成功地将一些仅在一种环境中训练的深度学习模型推广到新的环境中。”ARL的模块化方法结合了多种技术的优势。例如,基于深度学习视觉对地形进行分类的感知系统可以与基于逆向强化学习的自动驾驶系统协同工作。在反向RL方法中,可以根据人类士兵的观察快速创建或优化模型,而传统RL会根据给定的奖励函数优化解决方案,通常仅在您不确定最佳行为是什么时才使用。这与战斗思维相吻合,战斗思维通常认为让训练有素的人在场边指导机器人是做事的正确方法。“所以我们想要一种允许士兵进行干预的技术,并结合一些战场示例。如果我们需要新的行为,我们可以更新系统。深度学习技术需要更多的数据和时间,”Wigness说。(4)如何安全运行深度学习,不仅要面对数据稀疏性和快速适配的问题,还要面对鲁棒性、可解释性和安全性的问题。“这些问题并不是战斗机器人所独有的,但在军队作战时它们尤其重要,因为后果可能是致命的,”Stump说。需要明确的是,ARL目前并不是在研究致命的自主武器系统,而是在为美国军方的自主系统奠定基础。未来,战斗机器人可能会像RoMan一样行动。Stump还表示,安全永远是重中之重,但目前还没有明确的方法来确保深度学习系统的安全。“安全约束下的深度学习是一项重要的研究工作,但将那些约束添加到系统中确实很困难,因为你不知道系统中已有的约束来自何处。所以当任务发生变化时,或者环境发生变化时变化,约束很难处理。这甚至不是数据问题,而是架构问题。”ARL的模块化架构无论是对感知模块使用深度学习,还是对自动驾驶模块使用逆向强化学习,都可以构成更广泛的自主系统的一部分,满足军事对安全性和适应性的要求。集成的深度学习系统能不能打?NicholasRoy是麻省理工学院机器人小组的主任。他将自己描述为“挑衅者”,因为他认为深度学习不应该被神话化,他同意ARL机器人专家的观点,即深度学习方法往往无法应对军方面临的挑战。“陆军不断潜入新环境,而敌军总是试图不断改变环境,因此机器人所经历的训练过程根本不符合陆军的需要。“因此,在很大程度上,深度网络的需求与陆军正在做的事情之间存在不匹配,”罗伊说。”在RCTA(RearCrossTrafficAlert,后方交叉路口警报系统)任务中,Roy强调了地面机器人的抽象推理。他认为,当深度学习用于具有明确功能关系的问题时,它是一种有用的技术,但是当你开始研究抽象概念时,深度学习是否可行并不清楚。”Roy说:“我对如何以支持更高层次推理的方式组装神经网络和深度学习非常感兴趣。归根结底,这是一个如何将多个低层次神经网络组合起来以表达更高层次的概念,但我们还不知道该怎么做。”Roy举了使用两个独立的神经网络的例子,一个用来检测汽车,另一个用来检测红色物体。将这两个网络组合成一个更大的网络来检测红色汽车比使用基于逻辑关系和结构化规则的符号推理系统要困难得多。“很多人都在研究这个问题,但我还没有看到成功推动这种抽象推理的研究。”在可预见的未来,ARL将通过让人类参与高级推理和偶尔的低级建议来实现自治系统。安全性和稳健性。人类可能并不总是参与机器人系统的研究,但当人类和机器人作为一个团队一起工作时,他们会更有效。当机器人协作技术联盟计划的最新阶段于2009年开始时,ARL已经在伊拉克和阿富汗度过了多年,机器人经常被用作工具。我们一直在思考我们要做什么,让机器人从工具变成团队中的队友。“当人类弄清楚树的哪个区域最适合抓取时,RoMan确实得到了一点帮助。机器人对树枝没有认知,这种对世界知识(或通常所说的“常识”)的无知)是所有自主决策系统的东西但如果有人能利用我们作为人类的丰富经验来给RoMan一点帮助,这会容易得多。这一次,RoMan成功地抓住了树枝并把它拖走了。机器人很难成为一个好的队友,因为给机器人自主的程度是非常棘手的。机器人的自主性太小,需要大量的人力来管理。这适用于处理爆炸物等特殊情况,但在其他方面效率低下。但如果赋予机器人过多的自主权,就会在信任、安全和可解释性等方面存在隐患。Stump解释说:“我认为我们正在寻找的是机器人可以在工作犬的水平上运行。他们确切地知道我们需要他们在有限的环境中做什么;如果他们去一个新的环境,就会有一些灵活性和创造力,但我们不期望他们以创新的方式解决问题。如果他们需要帮助,他们可以求助于我们。”(5)即使作为人类团队的一部分,对自治系统的探索也必须继续,RoMan也不太可能立即在野外独立执行任务。RoMan更像是一个研究平台。有了这个研究机会,一系列复杂的问题可以探索深度学习。然而,ARL正在为RoMan和其他机器人开发软件,称为自适应规划参数学习(APPL),它可能首先用于自动驾驶,然后用于更复杂的机器人系统,包括像RoMan这样的机器人。算子。APPL在经典的自主导航系统下分层不同的机器学习技术(包括逆向强化学习和深度学习),可以将高层目标和约束应用于低层编程。人类可以使用遥操作演示、纠正干预和评估反馈帮助机器人适应新环境,同时机器人可以使用无监督强化学习来调整自己的行为行为参数。其结果是一个自治系统,它可以结合机器学习的优势,同时还提供军方所需的安全性和可解释性。有了APPL,像RoMan这样的基于学习的系统即使在不确定的条件下也能以可预测的方式运行。如果是在与训练环境相差很大的环境中,就需要依靠人为调优或人为示范。自动驾驶汽车等商业和工业自动驾驶系统的快速发展不可避免地引发了一个问题:为什么军队在先进技术的洪流中落后了?Stump的看法是,自治系统中存在许多难题,而军事问题与工业问题不同。例如,军队没有拥有大量数据的结构化环境来操作机器人。未来,人类可能仍将是ARL正在开发的自治框架中的关键参与者。3.结语:在发明大棒之前,不要陷入对暴力的恐惧之中。从以上分析可以看出,全球军用机器人研究并没有停滞不前,而是在积极向前发展。更希望军用机器人开发者能够在作战与智能自动化之间找到平衡点。我们这个时代的轨迹是真正实现人机融合。从机器人的角度来看,人与机器的关系逐渐变成辅助、协作、替代、扩展。实现了辅助协调,人的主体地位将更加突出。