当前位置: 首页 > 科技观察

精度首次超越人类!阿里巴巴机器阅读理解破世界纪录

时间:2023-03-19 00:09:00 科技观察

2018年伊始,人工智能取得重大突破!1月11日,由斯坦福大学发起的机器阅读理解领域顶级竞赛SQuAD刷新了排名。令业界兴奋的是,人工智能的阅读能力历史上首次超越人类。阿里巴巴以82.440的准确率打破了世界纪录,并超越了人类的82.304分。  SQuAD负责人PranavRajpurkar无法掩饰他的兴奋。他在社交媒体上表示,2018年开局良好,第一个模型(阿里巴巴iDST团队提交的SLQA+)在准确率匹配上超越了人类!下一个挑战:模糊匹配,人类仍然领先2.5分!  SQuAD竞赛从500多篇维基百科文章中构建了一个大规模的机器阅读理解数据集(包含100,000个问题)。  人工智能在阅读完数据集中的一篇短文后,需要根据文章内容回答几个问题,然后与标准答案进行比较,得到精确匹配(ExactMatch)和模糊匹配(F1-分数)。结果。  SQuAD是业界公认的顶级机器阅读理解竞赛,吸引了包括谷歌、卡内基梅隆大学、斯坦福大学、微软亚洲研究院、艾伦研究院、IBM、Facebook等知名公司的研究人员参加。机构和大学的参与。  这项技术的重大突破源于阿里巴巴研究团队提出的基于“分层融合注意力机制”的深度神经网络模型。该模型可以模拟人类在做阅读理解题时的一些行为,包括结合章节内容复习题目,带题反复阅读文章,并做相关注释避免阅读时遗忘。  模型可以捕捉文章中问题与特定区域之间的关系,并利用分层策略逐渐聚焦答案,使答案边界清晰;强制机构,进行适当的修正,确保焦点正确。  阿里巴巴自然语言处理资深科学家罗思表示,该机器在解决类似wiki的客观知识问答方面取得了非常好的效果,我们将继续完善“理解与思考”的通用内容“***目标前进。  未来的研发重点将是把这项技术真正应用到广泛的实际场景中,让机器智能造福每个人的生活。  其实这个技术在阿里巴巴内部已经被广泛使用。例如,每年双11期间,都会有大量客户查询活动规则。阿里小米团队使用思洛团队的技术,让机器直接读取规则,为用户提供规则解读服务,这是最自然的交互方式。  又比如,顾客也会问很多关于单品的基本问题,而这些问题其实在商品详情页都有解答。现在,通过机器阅读理解技术,机器可以更智能地阅读和回答详情页的产品描述文字,降低服务成本,提高购买转化率。  由斯洛带领的自然语言处理团队支撑着整个阿里巴巴生态的技术需求。他们开发的AliNLP自然语言技术平台日调用量1200亿+次,Alitranx翻译系统提供20种语言的在线服务,日调用量超过7亿+次。  此前曾在2016年ACMCIKM个性化电商搜索、2017年IJCNLP中文语法检测CGED评测、2017年美国标准与计量局TAC评测英语实体分类等比赛中取得世界领先的成绩。