当前位置: 首页 > 科技赋能

滴滴AI语音团队荣获国际顶级智能对话系统大赛全球第一

时间:2024-05-20 02:21:03 科技赋能

近日,在国际顶级人工智能大赛第九届对话系统技术挑战赛(DSTC9)中,滴滴语音和NLP技术团队参赛端到端的多领域任务型对话系统排名全球第一,充分展现了滴滴在自然语言对话领域的创新能力。

对话系统技术挑战赛(DSTC)旨在解决最前沿、最具挑战性的对话系统技术问题。

它在对话领域极具权威性,迄今已举办九届。

今年的DSTC9由微软、谷歌、IBM研究院、亚马逊、卡内基梅隆大学、清华大学等联合举办,吸引了工业界和学术界的顶尖团队参与。

滴滴参与的端到端多领域任务完成对话赛道吸引了来自全球的60余支团队参赛。

面向多领域任务的对话系统是指通过人机对话帮助用户完成实际、特定任务的目的,例如在连续对话中完成预订酒店、机票、餐厅等多项任务。

本次比赛使用的MultiWoz公共数据集跨越7个领域,平均每次对话13轮。

比赛要求系统不仅能够从复杂多变的人类表情中快速理解意图,而且能够在多个领域之间切换,给出准确贴切的答案,最终完成任务。

这也对现有的基于任务的对话系统提出了更高的要求。

比赛中,滴滴使用HybridDTA模型,采用领域自适应(Domain Adaptive)和任务自适应学习(Task Adaptive)混合技术,通过大规模领域数据预训练、任务阶段式多目标学习和领域自适应学习。

词汇化预处理和后处理使模型能够学习跨领域的基于任务的对话系统的推理过程。

滴滴HybridDTA模型框架图 为了让系统的回答更加智能、更贴近人类,滴滴模型在端到端GPT2模型的基础上,增加了基于对话领域的数据预训练,并采用了一系列故障-宽容的后处理和校正机制以改善最终结果。

最终,其手动评估任务平均成功率位居全球第一,比 DSTC8 高出近 9 个百分点。

其中,人工评估系统的适当答案得分相比DSTC8提高了3.8%,这意味着对人机对话的理解更好。

和弹性能力在多领域任务中达到新的高度。

目前,这套语音对话系统已在滴滴得到广泛应用,例如智能客服对话、车机系统语音交互、驾驶员侧语音交互等。

除了积极探索技术前沿,滴滴还持续推动对话交互能力的开放。

加上去年8月开源基于深度学习的自然语言平台DELTA,进一步降低了开发者创建和部署自然语言处理系统和语音模型的难度。

上周,滴滴还联合天津大学、杜克大学开放了一个大型数据库,提供了近一个小时的由100多名说话人专门录制的语音数据和注音。