当前位置: 首页 > 科技赋能

人与机器的辩论赛! IBM 的新 AI 击败了人类冠军!

时间:2024-05-22 13:30:58 科技赋能

知东溪(公众号:zhidxcom)编辑|芯源简介:6月18日,IBM人工智能系统Project Debater首次与人类进行现场公开辩论。

Project Debater能够理解对手的观点,并提出清晰、有针对性的反驳,最终成功击败人类辩手。

智东西6月19日报道,美国时间6月18日,IBM研究院推出了人工智能系统Project Debater,这是一个实验性对话式AI系统,充满幽默感、小机智,偶尔也会有有力的论据。

那天,Project Debater 进行了首次与人类的现场公开辩论。

辩论赛在旧金山的 IBM Watson West 站点举行。

Project Debater 是 IBM Research(超级计算机 Watson 背后的团队)开发的最新人工智能系统。

它也是第一个可以辩论复杂话题的人工智能系统,旨在通过公平辩论来拓展人们的思维。

Project Debater 拥有一个包含数亿篇论文、报告和新闻文章的庞大数据库。

通过消化这些数据,Project Debater 可以针对特定主题生成逻辑结构清晰的演讲,提出清晰简洁的论点,并对对手的论点进行反驳。

虽然有些叙述不太自然,无法完全与人类相比,但Project Debater的思考和回应仍然令人印象深刻。

IBM Research 首席研究员、Project Debater 创始人 Noam Slonim 表示,该 AI 系统的训练从六年前就开始了,直到两年前它才具备了与人参与辩论的能力。

IBM 研究人员正在通过教导计算机创建引人入胜且信息更丰富的视角来探索人工智能的边界。

他们的目标是建立一个智能系统,帮助人们在答案模棱两可时做出基于证据的决策。

自2007年以来,Project Debater是IBM在人工智能领域的下一个重要里程碑,也是继深蓝和沃森之后的又一突破。

根据IBM的计划,Project Debater将能够通过提供令人信服的、基于证据的论据并限制情绪、偏见或模糊性的影响,帮助人们在未来做出理性判断。

1、首战成功,击败人类顶级辩手Project Debater和2016年以色列全国辩论冠军Noa Ovadia,与以色列国际辩论协会主席Dan Zafrir分别举行辩论比赛。

▲左图为Noa Ovadia,右图为Dan Zafrir。

比赛期间,项目辩手参与了两个辩论话题,分别是“政府是否应该资助太空探索”和“远程医疗是否应该在医疗保健领域发挥更大的作用”。

IBM 希望确保 AI 系统可以在不知道自己要研究什么的情况下进行辩论,因此 Project Debater 在辩论之前并不知道主题。

在“政府是否应该资助太空探索”这个话题上,Project Debater 持积极的一面,而Noa Ovadia 则持消极的一面。

随后双方发表了四分钟的开场陈述、四分钟的反驳和两分钟的论点总结。

在每个部分之间,Project Debater 都会听取人类对手四分钟的开场陈述,解析数据,并创建一个论点,强调并试图反驳人类对手提出的信息。

这令人难以置信,因为这不仅涉及理解单词,还涉及理解这些单词的上下文。

模仿维基百科条目很容易做到,但是获取数据并创建不仅基于原始数据而且还要考虑到您刚刚听到的叙述的内容却很困难。

项目辩手提出开放式观点,认为太空探索对人类有益,因为太空探索不仅有助于推动科学发现,还能激励年轻人突破思维障碍。

诺亚·奥瓦迪亚认为,地球科学研究等项目更值得政府补贴。

在听到诺亚的论点后,Project Debater 提出了反驳,认为太空探索的潜在技术和经济效益超过了其他政府支出。

双方结案陈词后,一项快速民意调查显示,大多数观众认为“辩手计划”比人类话语更能丰富他们的知识。

在辩论中,人工智能系统确实犯了错误,并做出了一些疯狂的断言,比如它认为太空探索“比更好的道路、更好的学校或更好的医疗保健更重要”。

,或者在辩论中随意说出“斯科特·佩利画外音”,这似乎是指哥伦比亚广播公司新闻和60分钟记者。

Chris Reed 是争论技术中心的主任,该中心是一个探索对话式人工智能的学术团队,并未参与 Project Debater。

里德周一应 IBM 邀请观看了 Project Debater 的首场表演,他表示,这就像看到“许多难题聚集在一起”,包括坚持自己的论点的能力、没有语法错误以及缺乏语法问题。

错误。

例如在做出决定之前能够预见并反驳对手的论点等问题。

“争论和辩论本质上是推动科学进程的引擎,描述了大多数政治论坛中发生的事情,甚至描述了现代宗教的大多数概念,”里德说。

“争论是人类的一个决定性特征,如果我们的机器能够传达其中的一些特征,那么我认为这意味着一些非常重要的事情正在发生变化。

“从文化上来说,辩论的起源不是冲突和竞争,而是民主和讨论。

辩论丰富了决策过程,帮助人们权衡新思想和新概念的利弊。

它是文明社会的核心。

我们辩论不仅要让别人相信我们自己的观点,还要理解和学习彼此的观点。

想象一下,一个人工智能系统与一位专业的人类辩手进行交流,聆听他的观点,并以一种无脚本的方式提出自己的推理。

令人信服的方式,说服观众思考自己在一个有争议的话题上的立场,这说明人工智能系统可以像人类一样理解观点,并相应地给出自己的观点。

在未来,我相信机器将能够帮助人类做出很多事情。

后来,Project Debater 和另一位以色列辩手 Dan Zafrir 之间进行了第二次辩论,Dan Zafrir 反对应该增加远程医疗使用的论点。

四十名委员参加了本次辩论的投票。

Project Debater比Dan Zafrir多获得9票,成功赢得比赛。

在辩论过程中,Project Debater 能够引用来自阿联酋的一系列信息以及德国经济部长的一份报告,获取太空探索能够提供的就业数量的有效数据。

不过,为了避免在引文和语言逻辑上出现错误,Project Debater并没有直接引用对手的论点。

2.“公正的”辩论机IBM 研究人员 Noam Slonim 和 Ranit Aharonov 表示,虽然人类辩论机是这项技术的有趣展示,但 Project Debater 的真正力量在于它能够提出公正的论点。

▲左图为Ranit Aharonov,右图为Noam Slonim。

我们生活在一个充满情感和偏见的世界,看待问题的视角难免不真实、客观。

IBM表示,世界上充满了错误信息和肤浅的想法,片面和被篡改的叙事的兴起正在挑战社会和互联网平台。

人工智能在语言和推理方面的新发展有助于提供多样化、消息灵通的观点,而 Project Debater 则推动人工智能的前沿发展,促进智能辩论,帮助人们建立充分知情的论点并做出更好的决策。

Project Debater 帮助公司和政府从我们生活经历的噪音中提取一些重要的东西,并得出最公正的结论。

当然,它提供的数据集是基于人类写作的,这些数据仍然会包含作者的情感和偏见。

尽管 Project Debater 的目标是成为一台无偏见的机器,但它在辩论过程中似乎存在偏见。

在反驳人类辩手 Dan Zafrir 关于远程医疗扩张的论文时,系统声称 Zafrir 在开场陈词中没有说出有关远程医疗使用增加的真相。

换句话说,它认为 Zafrir 是个骗子。

当被问及 Project Debater 的性能时,IBM 研究员 Noam Slonim 表示,该系统在反驳过程中有一个置信阈值。

如果它感觉非常自信,它会创建一个更复杂的陈述;如果感觉不那么自信,那么这个声明就不那么令人印象深刻。

结果,Project Debater对反驳的信心不是很大,所以基本上将Zafir斥为骗子。

有趣的是,这可能是系统一整晚所做的最人性化的事情了。

3. 构建新的人工智能系统很困难。

此前,人工智能可以回答简单的问题或关键字搜索请求,例如“一升有多少盎司?”或“打电话给妈妈”。

这为人们的日常生活提供了极大的便利。

Project Debater 开始探索新领域:吸收大量不同的信息和观点,帮助人们建立有说服力的论据并做出明智的决定。

构建系统是一项非常困难且复杂的挑战。

斯洛尼姆说,为了使 Project Debater 成为可能,研究人员开发了数十篇研究论文中记录的许多创新技术。

虽然准备辩论以及反驳或理解对手的论点可能需要相当多的技巧,但辩论者的大部分对话仍然可以直接从文章中借鉴。

▲图为研究员Noam Slonim 与Project Debater 机器。

六年来,IBM以色列海法实验室领导的全球IBM研究团队赋予了Project Debater三个功能,每一个功能都开辟了AI的新视野:一是数据驱动的语音创作和交付能力;第二,听力理解,识别隐藏在连续冗长的自然人类言语中的关键主张,并构建有意义的反驳;第三,系统模拟人类困境,基于独特的知识图谱提取原则性论据。

辩论形式为测试这些核心能力提供了理想的基础。

辩论规则源于人类讨论文化,争论的核心往往本质上是主观的。

项目辩手必须适应人类的理性和思维逻辑,提出人们能够理解和接受的论点。

在辩论中,人工智能必须学会导航和检索混乱、非结构化的人类世界,而不是像棋盘游戏那样使用预定义的规则。

与蓝色巨人在国际象棋中击败国际象棋大师加里·卡斯帕罗夫或 DeepMind 的 AlphaGo 击败世界顶级围棋选手不同,这场辩论比其他比赛更加详细。

参与者投票决定比赛中最好的辩手,人工智能通常有能力比人类更好地丰富观众的知识,拉尼特·阿哈拉诺夫说。

结论:Project Debater 帮助人们做出明智的决定。

Project Debater 让我们更接近人工智能的一个巨大边界:掌握语言。

这是IBM一系列重大人工智能创新中的最新成果,其他创新还包括2016年赢得国际象棋世界冠军加里·卡斯帕罗夫的IBM深海“深蓝”,以及2016年在危险边缘击败人类冠军的超级智能系统沃森)。

虽然 Project Debater 的工作还远未完成,但它有时也会犯错误,就像人类一样。

但在不久的将来,它可能会帮助解决数千个复杂的人类决策。

例如,帮助收集和组织有关财务事实的相关材料,或提出支持和反对公共政策的论点。

Project Debater 提出的观点可能更接近事实,因为它们并不总是受到人类主观性和偏见的影响。

Project Debater 将扩展 Watson 的功能,目前已有数十家公司使用 Watson 来挖掘大量内部数据集以获取新的业务见解。

该系统已使用 Watson Speech to Text API,将有助于增强 Watson 的高级语言和对话功能。

未来,其基础技术也将在IBM Cloud Platform和IBM Watson中实现商业化。

这对于人工智能来说是一个非常积极的发展。

我们使这项变革性技术越透明、越可解释,我们就越能信任它;我们越信任它,它就越能帮助我们在日益复杂的世界中做出最好、最明智的决策。

Slonim 在接受采访时告诉 VentureBeat,在这场辩论之后,Project Debrater 将在今年晚些时候参加一场旷日持久的辩论,随后可能会举办一个研讨会,学者们可以在研讨会上对 Project Debrater 发表意见和评论。