朱松纯团队最新研究：机器人可以与人类“互相倾诉”！他还表示下一步要打造“AI大白”

时间：2023-03-16 23:34:32 科技观察

本文经AI新媒体量子位（公众号ID：QbitAI）授权转载，转载请联系出处。机器人能否像《超能陆战队》中的“大白”一样理解人类的情感和价值观，并以统一的目标协同解决问题？现在，这个问题有了答案：北京大学人工智能研究院朱松纯团队的最新研究提出了可解释的人工智能（XAI）系统，证明机器人和人类真的可以“互相倾诉”并像人类合作伙伴一样像UnifyOKR一样工作。即朱松春团提出的实时双向人机价值对齐。目前，朱松纯团队的研究成果已经发表在顶级学术期刊《科学》及其附属期刊《科学机器人》上，并且都是头条新闻。人类和机器人如何调整他们的价值观？为了验证人类和机器人的价值观能否对齐，朱松纯的团队设计了一款小游戏，需要人类和机器人合作完成任务。人类作为指挥官，带领三个机器人伙伴进行游戏。具体任务是在未知的20×20网格地图中寻找从基地（位于地图右下角）到目的地（位于地图左上角）的安全路径。需要注意的是，在这张地图的不同格子里，放置了不同的装置，比如炸药，或者物资等等，只有在机器人靠近的时候才能显示出来。除了寻找安全路径外，在游戏开始前，人类指挥官还将额外获得4个任务目标。指挥官需要4选1，任务包括：尽快到达目的地；调查地图上的可疑设备；探索更大的区域；收集资源。这四个任务目标代表了人类指挥官的价值取向，而机器人需要人类指挥官的持续任务反馈，才能理解指挥官的价值取向并自主行动。具体过程是人类和机器人一轮又一轮对价值目标进行反馈和解释，最终趋于一致：整个游戏分为3组。实验结果发现，当机器人单方面接受人类指令时，即当它们只是简单的倾听者时，通过在25%的游戏进度中正确排列至少60%的目标重要性来快速与用户价值对齐。作为表达者，当机器人对人类进行反馈，对遇到的情况进行完整的解释，当游戏进度达到50%时，就实现了人类指挥官与机器人价值的统一。如果机器人只是简单说明遇到的情况，则需要在游戏进度达到75%时将两者的值统一。上述实验结果说明了人机协作过程中双向价值对齐的过程：首先，机器人通过接受人类的反馈，逐渐更新自身的价值函数，使其与人类的价值观保持一致。其次，在与机器人的不断交互中，人类逐渐形成对机器人能力和意图的感知。虽然在上半场比赛中两者的价值没有达到统一，但从下半场的情况来看，人类对机器人价值能力的感知还是可以提升的。最后，当机器人的价值选择趋于稳定时，用户对机器人的评价也趋于稳定，从机器人对人类价值的评价到人类价值的真实价值，从人类对机器人价值的评价到机器人当前价值收敛配对，形成了基于人类真正价值取向的双向价值取向。结果如上，证明人与机器人价值双向对齐需要一个理论，也是所有研究结果背后的原理：ExplainableArtificialIntelligence*(XAI)*，一种基于静态机器的通信方式-dynamichumans，解释人工智能每一次决策背后逻辑的理论，此前学术界已有很多研究。朱松纯团队在实验赛中的机器人系统也是基于XAI，但不同的是人与机器人的交流方式发生了变化。为了使人和机器能够合作实现目标，需要一个以人的价值为主导、动态的机器-动态用户通信模型。在这个模型中，机器人除了向人类展示自己的决策过程，还会根据用户的价值目标实时调整自己的行为。同时，为了实时掌握用户信息，研究团队使用通信学习替代传统的数据驱动的机器学习方法，机器会根据用户推断的价值目标做出合理的解释。这种以合作为导向的人机协作要求机器具有心智理论（ToM），即理解他人心理状态（包括情绪、信念、意图、欲望、伪装和知识等）的能力。这在多智能体和人机交互环境中尤为重要，因为机器只有理解了人的状态和意图才能更好地执行任务，其决策行为会影响人的判断，从而形成以人为中心的环境。一个中央的、人机兼容的协作过程。简单来说，利用上述方法进行人与机器人的协同工作，可以同时赋予双方两个身份，listener&expresser。这也意味着机器人，至少在理论上，可以像人类队友一样理解你的心思和价值取向，并为统一的目标高效协调。论文作者介绍，朱松纯的团队由加州大学洛杉矶分校的袁璐瑶和高晓峰，北京通用人工智能研究院的郑子龙，以及北京大学人工智能研究院的朱一新组成。该团队长期以来一直致力于可解释的人工智能。本文是团队在ScienceRobotics上发表的第二篇关于可解释人工智能的论文。该研究涵盖认知推理、自然语言处理、机器学习、机器人学等多学科领域，是朱松纯教授团队跨学科研究成果的集中体现。朱松纯教授本人就是人工智能领域享誉世界的学者。曾任加州大学洛杉矶分校统计与计算机科学系教授，加州大学洛杉矶分校计算机视觉、认知、学习和自主机器人中心主任。目前，朱松纯同时兼任清华大学和北京大学讲座教授并担任管理职务。他主持的北京通用人工智能研究院（BIGAI）也得到了清华大学、北京大学等单位的支持。最后，OneMoreThing回到开头的问题，《超能陆战队》中的“大白”在现实中真的存在吗？事实上，朱松纯的团队已经在做研究了。据悉，目前，朱松纯团队所在的北京通用人工智能研究院、北京大学人工智能研究院等单位正在开展人工智能统一理论和认知架构的研究。未来的方向是打造具有自主感知、认知、决策、学习、执行和社会协作能力，符合人类情感、伦理道德观念的通用智能体。怎么样，开心的时候陪你开心，难过的时候陪你擦眼泪。你想拥有这样的机器人吗？

上一篇：5G、区块链加上物联网设备将引发哪些奇妙的化学反应_0

下一篇：报告：5G时代企业更关注数据安全威胁

朱松纯团队最新研究：机器人可以与人类“互相倾诉”！他还表示下一步要打造“AI大白”相关文章