7月19日消息,全球最大语义评测大赛SemEval-2022日前宣布,今年唯一的“最佳系统论文奖”将颁给阿里佛法研究所等机构的研究人员。他们设计了一个命名实体识别(NER)系统,融合了中英文等11种语言的知识,能够准确识别人名、地名、机构、作品等关键实体信息,大大提高了AI对人类语言能力。SemEval(SemanticEvaluation语义评估)是自然语言处理领域的权威国际竞赛。它已有20多年的历史。暗含的意思。SemEval有两个最佳论文奖:最佳任务论文奖和最佳系统论文奖。通俗的理解,一是提出问题,二是解决问题。阿里巴巴达摩院、上海科技大学、浙江大学、新加坡科技设计大学的联合研究团队荣获本年度最佳系统论文奖。从221篇候选论文中脱颖而出的文章被命名为《DAMO-NLP at SemEval-2022 Task 11: A Knowledge-based System for Multilingual Named Entity Recognition》。SemEval-2022最佳系统论文获奖团队参与了SemEval-2022的12个任务之一:多语言复杂命名实时识别(MultilingualComplexNamedEntityRecognition)。命名实体识别(NER)是自然语言处理领域的一项基础性工作。它是指识别文本中具有特定含义的实体词(Entity),主要包括人名、地名、机构名和专有名词。该任务要求研究人员设计一个系统,可以识别包括中文和英文在内的11种语言的实体,包括混合多种语言、带有“梗”、缩写词和俗语的句型。例如例句:“2016年,她客串出演了HBO电视剧权力的游戏”,AI需要识别理解“HBO”这个机构的简称,以及作品名称“游戏”的权力”。达摩院系统获得总分第一名。论文提出了一种全新的集成知识的多语言命名实体识别系统。在竞赛任务的13个分项中获得10个第一名,总分排名第一,进步很大。行业水平。一般来说,由于单词的多义性,我们只有结合上下文才能准确理解单词,AI也是如此。新系统的强大之处在于,即使在没有上下文的情况下,它也能让AI理解复杂的实体词。据研究人员介绍,该系统额外引入外部知识,构建多语言通用知识库,通过交互式检索扩展文本的上下文信息,从而消除歧义;加上多阶段微调,可以准确识别实体信息。据介绍,获奖研究成果在翻译、搜索、人机对话等领域具有广阔的应用前景。目前,达摩院的机器翻译系统可以提供214种语言的互译服务,每天为中国200万家中小企业翻译数亿字,助力国货走出去。根据国际权威研究机构Gartner的最新报告《云AI开发者服务关键能力报告》,阿里语言AI位列全球第二,创中国企业历史最好成绩。
