IBM最强AI辩手ProjectDebater代表了当前“计算辩论”研究的巅峰之作。在当今这个充斥着海量信息和误导文化的世界,我们期待实现完全自主辩论的人工智能系统能够推动智能辩论的发展,帮助建立更合理的论点,做出更明智的决策。辩论的研究可以追溯到古希腊,当时苏格拉底等古希腊哲学家在市井中与人讨论政治、辩论真理,辩论的内容包罗万象。苏格拉底之死当前人工智能研究的一大挑战是“如何让机器理解自然语言辩论中的争论”。人工智能专家NoamSlonim近日,IBM研究院研究员、希伯来大学人工智能专家NoamSlonim及其团队公布了相关研究ProjectDebater的进展,该项目扫描并存储了4亿条新闻报道和维基百科页面档案,自组织的开场白和反驳论点。虽然最后还是输给了人类辩手,但这次人工智能辩手的表现提供了一种可能性:未来人工智能可以帮助人类制定和理解复杂的论点。自然语言处理(NLP)算法NLP是计算机对人类语言(例如语音和文本)的自动理解、解释和处理。NLP是人机交互的关键要素,IBMProjectDebater团队积极开展NLP研究是有道理的。2018年,IBM研究院首次在美国旧金山WatsonWest展示了人类与智能机器之间的公开现场辩论。双方辩手分别是IBM历时六年多研发的首个能够与人类进行复杂辩论的AI系统ProjectDebater(以下简称Debater)和以色列国际辩论协会主席DanZafrir。在辩论中识别、生成和反驳论点的过程中,结合不同组件的稳健工程的重要性,每个组件都解决特定任务。大约10年前,分析人类话语以确定引用证据支持结论的方法——这一过程现在被称为“论证分析”——显然超出了最先进的人工智能的能力。此后,人工智能技术的进步和示范技术工程的日益复杂,加上强烈的商业需求,迅速扩大了该领域。全世界有50多个实验室在研究这个问题,其中包括所有主要软件公司的团队。这方面的研究之所以激增,是因为直接应用了人工智能系统,能够识别大量文本中语言使用的统计规律,这在人工智能的许多应用中已经具有变革性,但还没有达到人工智能的水平。论证挖掘。这样的进步。因为论证结构过于多样、复杂、微妙和神秘,以至于无法像句子结构那样容易识别。因此,Slonim等人。决定发起一项宏大的挑战:开发一个可以“充分”与人类进行现场辩论的自治系统。ProjectDebater代表了这项工作的高潮。ProjectDebater关键技术点立场分类和情绪分析自动辩论系统必须能够确定一个论点是否可以支持或反驳给定的主题。这对人类来说很容易,但对机器来说却相当困难,因为机器需要能够辨别自然语言中丰富的细微差别。深度神经网络(DNN)和弱监督DNN在提高自动语言理解方面具有巨大潜力,但众所周知,训练DNN需要大量人工标记的高质量数据。该团队开发了多种工具和方法来训练弱监督的DNN,以缓解这一瓶颈问题。他们还使用DNN来培养ProjectDebater的听力和口语技能。文字转语音(TTS)系统与个人助理或导航员不同,辩论系统需要能够就以前未知的话题雄辩地演讲几分钟,同时保持与听众的互动。科研团队研发了全新的TTS算法和方法,为ProjectDebater提供清晰、流畅、有说服力的语言表达能力。ProjectDebater很难达到人类辩手的连贯性和流畅性。ProjectDebater是论证技术发展和将论证视为局部现象的过程中的关键一步。它的成功让人们重新审视人工智能系统如何使用人类可以轻松提出的论证网络进行工作。几乎所有的人工智能研究都设定了很高的目标,但瓶颈在于能否获得足够的数据来计算出有效的解决方案来应对给定的挑战。ProjectDebater通过双管齐下的方法克服了这一障碍:将重点缩小到100多个辩论主题;它从海量数据集中收集主要材料。在2018年和2019年的一系列比赛中,ProjectDebater挑战了多位才华横溢、知名度高的人类辩手,例如2016年获得以色列全国辩论赛冠军的以色列高年级女生NoaOvadia,现场观众对她的表现进行了评价。非正式评估。在其辩论技术和处理过的数据集的支持下,该系统创建了一个4分钟的演讲,就其曲目中的一个主题展开辩论,人类对手对此做出回应。然后它进行了第二次4分钟的演讲来反驳对手的论点。对方用了4分钟时间进行反驳和回答,辩论结束时,双方进行了2分钟的结语。ProjectDebater的最弱点是它难以模仿人类辩论者的连贯性和流畅性——这是一个与其处理能力最高水平相关的问题,在该水平上它可以选择、抽象和编排论点。但是,此限制并非ProjectDebater所独有。尽管经过两千多年的研究,“论证结构”仍然知之甚少。根据论证研究的重点是语言使用、认识论、认知过程还是逻辑有效性,所提出的连贯论证和推理模型的关键特征会有所不同。所有有争议的技术系统面临的最后一个挑战是,是将争论视为受一系列孤立因素影响的局部话语片段,还是将它们编织成更大的、全社会范围的辩论。在大多数情况下,这是一个设计问题而不是设计解决方案。通过对论证施加先验界限,理论简化变得可行,提供了主要的计算优势。例如,识别“主要需求”成为一项明确的任务,机器几乎可以像人类一样可靠地执行。问题是人类根本不擅长这项任务,因为它是人为设计的。在公开讨论中,给定的陈述在一种情况下可能是主张,而在另一种情况下可能是前提。此外,在现实世界中,没有明确的界限来划定一个论点:在辩论室外发生的话语不是离散的,而是与交叉引用、类比、例证和概括的网络联系在一起的。人工智能如何处理此类争论网络的想法已经被理论化并使用软件实现,例如,一个名为DebateGraph的系统,一个提供计算工具的互联网平台,用于可视化和共享复杂的网络,一个相互关联的想法网络。然而,与这些实施相关的理论挑战和社会技术问题令人生畏:设计令人信服的方式来吸引大量观众使用此类系统与设计使他们能够与这些复杂的辩论网络互动的直接机制一样困难。ProjectDebater是论证技术发展和将论证视为局部现象的过程中的关键一步。它的成功提供了一个诱人的机会来学习人工智能系统如何与人类可以轻松解释的参数网络一起工作。假新闻的泛滥、舆论的两极分化以及推理的普遍存在都掩盖了人类创造、处理、导航和分享复杂论点的迫切需求,而人工智能可能能够支持这些论点。因此,虽然ProjectDebater解决了一个巨大的挑战,并代表了人工智能的进步,可以促进人类推理,而且,正如Slonim等人。辩称,ProjectDebater拓宽了当前AI技术的舒适区,未来将能够从事更复杂的人类活动。
