几十年来,外交一直被认为是“AI永远接不上的工作”。因为它需要玩家掌握和理解他人的观点和背后的动机,制定复杂的计划并及时调整,然后用语言与他人进行合作,最终说服他人结成伙伴关系和联盟。对沟通、信任和背叛的关注使外交与围棋和国际象棋等更多基于规则的“游戏”截然不同。不过,Meta的最新研究表明,AI很可能可以胜任外交官的工作!CICERO在2022年8月至2022年10月举行的在线外交游戏比赛中名列所有“选手”前10%。其平均25.8%的成绩是其82名对手平均成绩12.4%的两倍多。更值得一提的是,在实际游戏过程中,没有玩家发现这是人工智能在玩游戏!今天,这一最新成果也以论文的形式发表在了《科学》杂志上。CICERO的推出必将成为自然语言处理领域的一大成就。因为这预示着人工智能有可能“更好、更自然地与人类合作”,代表着人类向AGI迈进了一大步。打败90%的人类,无人发现AI参与其中孩之宝)是1950年代开发的。通过20世纪初欧洲七大国的“角色扮演”,玩家需要与其他玩家建立信任、协商合作,尽可能多地占领领土。为了避免被对手的反击所阻碍,玩家私下交流,讨论可能的协调行动,然后将他们的行动写在纸上,兑现或违背对其他参与者的承诺。这种充满欺骗和诡计的游戏也被一些玩家视为失去朋友的理想方式,堪称“好友匹配”!如上所述,与象棋、围棋等游戏不同,外交是一种重“人”而非“规”的游戏。如果模型无法识别出有人可能在虚张声势,或者无法准确识别出另一位玩家的走法是否具有侵略性,那么它显然很快就会输掉比赛。同样,如果它不像真人那样说话、表现出同理心、建立关系和谈论游戏,它就不会找到其他愿意与之合作的玩家。在过去的几十年里,研究人员一直在打造能够用自然语言进行交流的“人工智能外交官”。然而,由于这一巨大挑战远远超出了现有AI的能力,因此没有研究人员取得成功。直到最近CICERO的出现,才彻底推翻了这个事实。CICERO本质上是一个“聊天机器人”,可以与其他外交玩家交流,在游戏中采取有效行动。西塞罗是古罗马著名的政治家、哲学家和演说家。他出生于公元前106年1月3日。他以口才好而闻名于罗马政坛。Meta将在此命名这个AI模型,其含义不言而喻。2022年8月至2022年10月,CICERO参加了webDiplomacy组织的线上《外交》比赛共计40场比赛,名列所有参赛者前10%;在打了五场以上的19人中,西塞罗排名第二。在40场比赛中,CICERO的平均得分为25.8%,是其他82名对手平均得分(12.4%)的两倍多,充分展示了其战略对话和游戏能力。会思考会表达,谁能不爱AI呢?CICERO基于一个27亿参数的类BART语言模型,该模型根据来自互联网的文本进行预训练,并使用webDiplomacy.net上在线玩的超过40,000个外交游戏的数据集进行了扩充。这些数据还包括玩家相互交流时产生的超过1200万条消息。CICERO的模型主要由两部分组成,分别是“策略推理”和“自然语言处理”。两种技术的融合使得CICERO能够推理玩家的动机并制定策略,然后使用自然语言进行交流,达成一致以实现共同目标,形成联盟并协调计划,主要体现在“合作”、“谈判”和“协调”三个方面。例如,CICERO可以推断在游戏的后期它需要特定玩家的青睐,然后制定策略来赢得该人的青睐——甚至识别该玩家的风险和机会。对话感知策略模块可以帮助CICERO预测其他玩家可能采取的行动,以及其他玩家认为CICERO可能采取的行动,给定他们过去的对话和游戏板的状态。由此,CICERO将根据这些预测为自己和其他参与者制定互惠互利的计划。这些计划不仅让CICERO找到了互利合作的机会,也帮助它在不能合作的时候找到了有效的措施。CICERO中有一个可控的对话模型,它结合了一个控制对话生成的策略推理算法。可控的对话模型让CICERO可以在一套精心挑选的计划中进行对话,通常是对CICERO和其他参与者都有利的计划。CICERO的对话深深植根于正在进行的游戏内生成的自由形式对话。例如,CICERO可能会与另一位玩家协商战术计划,向盟友保证其意图,讨论游戏中更广泛的战略动态,甚至只是进行随意的闲聊——包括人类玩家可能讨论的任何事情。“西塞罗在使用自然语言与外交官进行谈判时非常有效,以至于他们通常更愿意与西塞罗一起工作,而不是其他人类参与者,”梅塔在他自己的推特上说。MetaAI副总裁兼首席人工智能科学家严乐存认为,“能够在外交这样的战略复杂游戏中上演人类水平的表现,预示着人机合作的巨大潜力。”CICERO虽然只能玩外交,但这一成果背后的技术与很多现实世界的应用密切相关,比如通过规划和强化学习来控制自然语言的生成,可以缓解人类与人工智能模型之间的沟通障碍。比如现在的AI助手只能做简单的问答,比如告诉你今天的天气等等,但是如果通过长时间的对话,教给你一项新技能呢?或者想象一个视频游戏,其中非玩家角色(NPC)可以像人一样自由计划和交谈——了解您的动机并相应地调整对话以帮助您征服土地。当然,就连梅塔自己也承认“CICERO不够完美”——在比赛的一些重要时刻,CICERO经常会出现非常离谱的失误。因此,Meta选择将CICERO的代码开源,希望借助AI开发者社区进一步完善。网友:请把小扎送上法庭!全球首位与人类同级别的“人工智能外交官”的发布,也引发了网友的热议。不少网友表示:“非常期待这项研究接下来的发展。”“打败人类可以说是最人性化的游戏,这简直太迷人了……”虽然CICERO初出茅庐,但有人对这种“AI黑科技”在现实生活中的前景很感兴趣:“它能不能建立一个帮助应对集体行动挑战的版本,比如#COP28?”网友所说的“COP28”应该指的是第28届联合国气候大会。在刚刚结束的第27届气候大会上,经过几天的紧张谈判中,各国代表最终同意建立基金机制,以补偿气候变化造成的损失和损害。此外,CICERO的推出也引起了众多网友的关注,“这将直接激励研究人员建立擅长欺骗的模型。”“通过模仿人类行为的方式欺骗??并赢得外交游戏,既可爱又有趣。”“我不知道它还能用来做什么?我们需要警惕此类工具的发展。”“人工智能非常擅长创造艺术等等。而现在,它的说服能力被“激活”了。”“如果你能说服一个人,你就可以控制他们的选择,从而控制他们的生活。”“所以最终的结果将是——AI通过说服来奴役人类!”最后,也有很多搞笑的网友表示:“是这东西靠谱吗?西塞罗最后被砍头了!”“请把小扎送到海牙(国际法庭)!”就在前两天,因为把谎言当成事实,AI推出的大型语言模型MetaGalactica,上线仅仅3天就被下架,如今CICERO的上线可以说是再次在AI科技圈掀起波澜。
