人类语言是出了名的复杂,语言学家长期以来一直认为教机器如何像人类一样分析语音和单词结构是不可能的。但麦吉尔大学、麻省理工学院和康奈尔大学的研究人员已经朝这个方向迈出了一步。他们开发了一种人工智能(AI)系统,可以自行学习人类语言的规则和模式。该模型自动学习可以应用于不同语言的高级语言模式,使其能够取得更好的效果。当给定单词以及这些单词如何变化以表达语言中不同语法功能(例如时态、大小写或性别)的示例时,机器学习模型会提出规则来解释这些单词的形式为何会发生变化。研究人员开发了一种人工智能系统,可以自行学习人类语言的规则和模式。图片来源:麻省理工学院Jose-LuisOlivares例如,它可能知道必须将字母“a”添加到单词的末尾才能使塞尔维亚-克罗地亚语中的阳性形式阴性。研究人员表示,该系统可用于测试语言理论并研究不同语言转换单词方式的细微相似之处。“我们想看看我们是否可以模仿人类为这项任务带来的知识和推理,”共同作者、麻省理工学院语言学教授亚当奥尔布赖特说。“这项工作令人兴奋的是,它展示了我们如何构建可以从非常小的语言数据样本中进行概括的算法,更像是人类科学家和儿童,”资深作者TimothyO'Donnell博士说。麦吉尔大学语言学学士,Mila–魁北克人工智能研究所加拿大CIFARAI主席。人类语言理论与贝叶斯程序的归纳综合自动化、数据驱动的科学模型和理论的构建和评估是人工智能领域的长期挑战。我们提出了一个框架,用于通过算法合成人类语言基本部分的模型:形态语音学,一种从声音构建单词形式的系统。我们将贝叶斯推理与受语言理论和学习与发现认知模型启发的程序综合和表示相结合。在来自58种不同语言的70个数据集中,我们的系统综合了每种语言形态语音学核心方面的人类可解释模型,有时接近人类语言学家提出的模型。跨所有70个数据集的联合推理自动合成编码可解释的跨语言类型趋势的元模型。最后,相同的算法捕获少量学习动态,仅从一个或几个示例中获取新的形态语音规则。这些结果为语言学和其他科学领域中可解释模型的更强大的机器支持发现提供了途径。
