当前位置: 首页 > 科技观察

腾讯AI创下新纪录:ACL2020入选27篇论文

时间:2023-03-18 19:53:45 科技观察

近日,国际计算语言学协会(ACL,TheAssociationforComputationalLinguistics)官网公布了ACL2020的录用论文名单,共有收录了779篇论文。据不完全统计,此次腾讯共有27篇论文入选,入选论文总数打破国内记录,领跑国内AI研究第一梯队。今年腾讯ACL入选论文中,20篇论文来自腾讯AILab团队,7篇论文来自微信AI团队。研究方向涵盖对话与文本生成、机器翻译与文本理解、信息抽取、无监督文本等NLP重点领域。过去一年,腾讯通过开源协作,梳理各事业群底层共性技术能力,加强基础研发投入,进一步提升研发效率和技术资源利用效率,提供AI技术研发创新。更有活力的土壤。ACL是自然语言处理领域国际顶级学术会议,也是自然语言处理领域最具影响力和活力的国际学术组织之一。一篇论文被接受意味着该研究成果得到了国际学术界的认可。ACL2020的审稿周期相比过去几乎翻了一番。根据最新数据,本次会议最终收到论文投稿3088篇,投稿数量再创新高。技术实力雄厚,人工智能基础研究优势突出近年来,腾讯持续投入人工智能基础研究,致力于打造面向未来的技术引擎。腾讯AI团队入选ACL2019中国第一长论文,超过285篇论文入选ICML、CVPR、NeurIPS、ACL等顶级学术会议或期刊,并在多项竞赛中获得冠军,如DSTC8,展示了其卓越的性能行业领先的研究能力和技术实力。自然语言处理是腾讯AILab的重要研究方向之一,研究内容涵盖自然语言从理解到生成的全链条。2019年,腾讯AILab在人机对话和文本生成方面提出了多种新的对话生成框架,发布了多个对话数据集,完善了开放域对话体系。在机器翻译研究方面,腾讯AILab探索了主流翻译模型中的self-attention模型改进和文本翻译,并试图打开神经网络翻译模型的黑匣子来解释核心问题的运行机制。微信AI团队也长期深耕于自然语言处理领域的人工智能技术研发。拥有微信智眼、微信智灵等领先的NLP技术产品。入选ACL20207篇论文,涉及机器翻译、对话系统、信息技术等。抽取、无监督文本生成等领域。2019年,微信AI团队凭借NumNet+模型超越谷歌,夺得DROP阅读理解榜单第一名。应用场景丰富,面向行业的产品,技术能力一流,离不开一流的技术。腾讯丰富的业务场景和庞大的用户基础,为人工智能前沿研究成果提供了最好的“练兵场”。在此基础上,腾讯还将充分打磨的技术能力通过腾讯云以产品和服务的形式向金融、政务、医疗、交通、教育等各行业开放,为众多客户和合作伙伴提供底层技术支持,助力行业互联网进入快车道。目前,微信AI团队推出了“微信智领”和“微信智言”两个技术能力品牌,分别专注于语音和语义。微信智领每天处理超过4亿条语音,识别准确率达97%,服务于腾讯内外100多家业务。微信智言专注于智能对话和自然语言处理,目前支持家庭硬件、PaaS、行业云和AIBot等应用领域。微信AI团队也针对产品功能不断完善技术,开发了语音输入文字、扫码/封面翻译、聊天机器人、摇一摇/电视、语音锁等功能,为用户提供技术支持王者荣耀、QQ音乐等产品。在2020年初的微信公开课PRO版中,微信AI宣布开放以硬件协同为核心的腾讯小微硬件开放平台、以对话开放为核心的微信对话开放平台、NLP基础技术平台,全面开放各级NLP能力,面向行业用户和开发者,开放微信最前沿的NLP研究成果。腾讯AILab于2018年11月推出了TranSmart产品,采用业界领先的人机交互机器翻译技术,帮助用户更好更快地完成翻译任务。今年4月,腾讯AILab研发的自然语言理解系统TexSmart也对外开放,提供细粒度命名实体识别、语义关联、深度语义表达等功能。TexSmart是腾讯企业级文本处理工具的增强版,广泛支持腾讯自然语言处理相关业务和产品,日调用量上千亿。除了产品和技术能力的开放,腾讯还致力于通过开源与开发者共享代码。目前,开源项目总数已超过100个。仅在AI领域,腾讯就开源了Angel、NCNN等数十个优质项目。针对业界现有中文词向量公开数据的稀缺和不足,腾讯AILab开源了大规模、高质量的中文词向量数据,包含超过800万个中文词。与现有公开数据相比,覆盖率、新鲜度、准确率均有大幅提升,为对话响应质量预测、医疗实体识别等自然语言处理方向的业务应用带来显着的性能提升。