击败90%人类，Meta首款“AI外交模型”登上Science！网友：请把小扎告上法庭

时间：2023-03-13 17:20:29 科技观察

几十年来，外交一直被认为是“AI永远接不上的工作”。因为它需要玩家掌握和理解他人的观点和背后的动机，制定复杂的计划并及时调整，然后用语言与他人进行合作，最终说服他人结成伙伴关系和联盟。对沟通、信任和背叛的关注使外交与围棋和国际象棋等更多基于规则的“游戏”截然不同。不过，Meta的最新研究表明，AI很可能可以胜任外交官的工作！CICERO在2022年8月至2022年10月举行的在线外交游戏比赛中名列所有“选手”前10%。其平均25.8%的成绩是其82名对手平均成绩12.4%的两倍多。更值得一提的是，在实际游戏过程中，没有玩家发现这是人工智能在玩游戏！今天，这一最新成果也以论文的形式发表在了《科学》杂志上。CICERO的推出必将成为自然语言处理领域的一大成就。因为这预示着人工智能有可能“更好、更自然地与人类合作”，代表着人类向AGI迈进了一大步。打败90%的人类，无人发现AI参与其中孩之宝）是1950年代开发的。通过20世纪初欧洲七大国的“角色扮演”，玩家需要与其他玩家建立信任、协商合作，尽可能多地占领领土。为了避免被对手的反击所阻碍，玩家私下交流，讨论可能的协调行动，然后将他们的行动写在纸上，兑现或违背对其他参与者的承诺。这种充满欺骗和诡计的游戏也被一些玩家视为失去朋友的理想方式，堪称“好友匹配”！如上所述，与象棋、围棋等游戏不同，外交是一种重“人”而非“规”的游戏。如果模型无法识别出有人可能在虚张声势，或者无法准确识别出另一位玩家的走法是否具有侵略性，那么它显然很快就会输掉比赛。同样，如果它不像真人那样说话、表现出同理心、建立关系和谈论游戏，它就不会找到其他愿意与之合作的玩家。在过去的几十年里，研究人员一直在打造能够用自然语言进行交流的“人工智能外交官”。然而，由于这一巨大挑战远远超出了现有AI的能力，因此没有研究人员取得成功。直到最近CICERO的出现，才彻底推翻了这个事实。CICERO本质上是一个“聊天机器人”，可以与其他外交玩家交流，在游戏中采取有效行动。西塞罗是古罗马著名的政治家、哲学家和演说家。他出生于公元前106年1月3日。他以口才好而闻名于罗马政坛。Meta将在此命名这个AI模型，其含义不言而喻。2022年8月至2022年10月，CICERO参加了webDiplomacy组织的线上《外交》比赛共计40场比赛，名列所有参赛者前10%；在打了五场以上的19人中，西塞罗排名第二。在40场比赛中，CICERO的平均得分为25.8%，是其他82名对手平均得分（12.4%）的两倍多，充分展示了其战略对话和游戏能力。会思考会表达，谁能不爱AI呢？CICERO基于一个27亿参数的类BART语言模型，该模型根据来自互联网的文本进行预训练，并使用webDiplomacy.net上在线玩的超过40,000个外交游戏的数据集进行了扩充。这些数据还包括玩家相互交流时产生的超过1200万条消息。CICERO的模型主要由两部分组成，分别是“策略推理”和“自然语言处理”。两种技术的融合使得CICERO能够推理玩家的动机并制定策略，然后使用自然语言进行交流，达成一致以实现共同目标，形成联盟并协调计划，主要体现在“合作”、“谈判”和“协调”三个方面。例如，CICERO可以推断在游戏的后期它需要特定玩家的青睐，然后制定策略来赢得该人的青睐——甚至识别该玩家的风险和机会。对话感知策略模块可以帮助CICERO预测其他玩家可能采取的行动，以及其他玩家认为CICERO可能采取的行动，给定他们过去的对话和游戏板的状态。由此，CICERO将根据这些预测为自己和其他参与者制定互惠互利的计划。这些计划不仅让CICERO找到了互利合作的机会，也帮助它在不能合作的时候找到了有效的措施。CICERO中有一个可控的对话模型，它结合了一个控制对话生成的策略推理算法。可控的对话模型让CICERO可以在一套精心挑选的计划中进行对话，通常是对CICERO和其他参与者都有利的计划。CICERO的对话深深植根于正在进行的游戏内生成的自由形式对话。例如，CICERO可能会与另一位玩家协商战术计划，向盟友保证其意图，讨论游戏中更广泛的战略动态，甚至只是进行随意的闲聊——包括人类玩家可能讨论的任何事情。“西塞罗在使用自然语言与外交官进行谈判时非常有效，以至于他们通常更愿意与西塞罗一起工作，而不是其他人类参与者，”梅塔在他自己的推特上说。MetaAI副总裁兼首席人工智能科学家严乐存认为，“能够在外交这样的战略复杂游戏中上演人类水平的表现，预示着人机合作的巨大潜力。”CICERO虽然只能玩外交，但这一成果背后的技术与很多现实世界的应用密切相关，比如通过规划和强化学习来控制自然语言的生成，可以缓解人类与人工智能模型之间的沟通障碍。比如现在的AI助手只能做简单的问答，比如告诉你今天的天气等等，但是如果通过长时间的对话，教给你一项新技能呢？或者想象一个视频游戏，其中非玩家角色(NPC)可以像人一样自由计划和交谈——了解您的动机并相应地调整对话以帮助您征服土地。当然，就连梅塔自己也承认“CICERO不够完美”——在比赛的一些重要时刻，CICERO经常会出现非常离谱的失误。因此，Meta选择将CICERO的代码开源，希望借助AI开发者社区进一步完善。网友：请把小扎送上法庭！全球首位与人类同级别的“人工智能外交官”的发布，也引发了网友的热议。不少网友表示：“非常期待这项研究接下来的发展。”“打败人类可以说是最人性化的游戏，这简直太迷人了……”虽然CICERO初出茅庐，但有人对这种“AI黑科技”在现实生活中的前景很感兴趣：“它能不能建立一个帮助应对集体行动挑战的版本，比如#COP28？”网友所说的“COP28”应该指的是第28届联合国气候大会。在刚刚结束的第27届气候大会上，经过几天的紧张谈判中，各国代表最终同意建立基金机制，以补偿气候变化造成的损失和损害。此外，CICERO的推出也引起了众多网友的关注，“这将直接激励研究人员建立擅长欺骗的模型。”“通过模仿人类行为的方式欺骗??并赢得外交游戏，既可爱又有趣。”“我不知道它还能用来做什么？我们需要警惕此类工具的发展。”“人工智能非常擅长创造艺术等等。而现在，它的说服能力被“激活”了。”“如果你能说服一个人，你就可以控制他们的选择，从而控制他们的生活。”“所以最终的结果将是——AI通过说服来奴役人类！”最后，也有很多搞笑的网友表示：“是这东西靠谱吗？西塞罗最后被砍头了！”“请把小扎送到海牙（国际法庭）！”就在前两天，因为把谎言当成事实，AI推出的大型语言模型MetaGalactica，上线仅仅3天就被下架，如今CICERO的上线可以说是再次在AI科技圈掀起波澜。

上一篇：2022年第一天，微软Exchange无法发送邮件

下一篇：人工智能人脸识别：如何开发智能监控

击败90%人类，Meta首款“AI外交模型”登上Science！网友：请把小扎告上法庭相关文章