AI正在向更深层次演进,语言与知识技术的重要性越来越凸显。8月25日,以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会拉开帷幕。百度CTO王海峰发表主题演讲,阐述了百度语言与知识技术的发展历程和最新成果。为与产学研各界分享技术与产业发展趋势与前景,百度集团副总裁吴天、百度技术委员会主席吴华分别发布了百度语言与知识技术系列产品与数据集共建计划,推出5款新产品,全面加快人工智能技术规模化应用。王海峰在致辞中表示,“在百度语言和知识科技的布局和发展中,我们始终注重把握两个趋势,即技术发展趋势和产业发展趋势,力争引领趋势。”语言和知识技术是人工智能认知能力的核心,以语言和知识为研究对象,让机器像人类一样掌握知识和理解语言的自然语言处理技术对人工智能的发展至关重要。十年来,百度大脑语言与知识技术取得了丰硕的成果。先后获得国家科技进步奖等20余项,国际竞赛冠军30余项,发表学术论文300余篇,申请专利2000余项。在技??术不断突破创新的同时,也在不断创新探索产品,同时向开发者和合作伙伴输出领先技术,提升各行业的智能化水平。百度引领语言和知识技术的创新,形成完整的技术布局半个多世纪前,老一辈自然语言处理学者,在一本名为《机器翻译浅说》的书中,畅想了跨语言无障碍交流的未来和文化场景。如今,机器同声传译、翻译机、跨模态翻译等工具已经融入人们的工作和生活,沟通无国界的梦想正在逐步??实现。这一切都是人工智能技术,尤其是语言和知识技术进步的结果。经过近十年的发展,百度已经构建了完整的语言和知识技术布局,包括知识图谱、语言理解和生成技术,上述技术支撑的技术包括智能搜索、机器翻译、对话系统、智能写作、-应用系统中的深度问答等。其中,知识图谱是机器认识世界的基础。机器认知的突破越来越依赖于知识和大规模知识图谱的使用。百度构建了全球最大的多源异构知识图谱,拥有超过50亿个实体和5500亿个事实,并且还在不断演进和更新。已应用于各行各业,日调用量超过400亿。不仅如此,针对不同的应用场景和知识形态,百度还建立了多种知识图谱类型,包括基础实体知识图谱、行业知识图谱、事件图谱、焦点图谱等,以及综合语音、视频、和图像图表。多模态知识图谱。这背后是百度独创的一套知识图谱构建方法,包括无标签大数据开放知识挖掘技术、自扩展知识体系的知识图谱自学习技术、融合多源异构数据的知识补全与集成技术。.在知识的加持下,语言理解相关技术的能力不断增强,机器可以逐渐像人类一样学习和提高。百度提出ERNIE,一种知识增强的语义理解框架,在深度学习的基础上整合知识,具有与人类相同的持续学习能力。曾一举登顶全球权威数据集GLUE榜单,首次突破90分大关,超越人类得分。.通过融入知识、语义理解、增强小样本学习能力,机器的阅读理解和对话能力也在快速提升。当然,与人类感知世界的方式类似,机器在识别世界时,不仅仅使用自然语言,往往还需要语音、视觉、语音等多模态信息的综合应用。为此,百度开发了知识增强的跨模态深度语义理解方法,将跨模态信息与知识相关联,用语言描述不同模态信息的语义。从“听得清楚”到“听得懂”,即图像与语言、声音与语言的综合理解。融合场景图知识的跨模态语义理解预训练技术,极大提升了跨模态推理能力。除了机器对自然语言的理解,语言生成的任务对于与人类交互也是必不可少的。百度基于多流机制的语言生成预训练技术,在语言生成过程中,兼顾了词、短语等不同粒度的语义信息,提高了生成效果。多文档摘要的生成,通过图结构的语义表示,引入章节结构的知识,增强长文本的语义表示能力,解决跨文档域关系建模问题。结合语言生成技术和其他语言、知识技术,百度打造的智能创作平台,已被20多家媒体采用,日调用量超过35万次。领先技术不断落地应用,提高智能化水平。语言和知识技术的全面突破,突出体现在搜索、翻译、对话系统等各类产品和应用中。王海峰介绍,智能搜索通过知识图谱、语言理解、跨模态语义理解等技术,帮助用户更高效、准确、便捷地获取知识和信息。随着智能搜索的进一步发展,搜索将无处不在。百度提出了知识图谱驱动的对话控制技术、首个基于潜在空间的大规模开放域对话模型PLATO等,并推出了智能对话定制和服务平台UNIT,可以帮助开发者高效构建智能对话系统并实现规模化应用。百度翻译支持200多种语言,每天响应超过1000亿字符的翻译请求,支持超过40万个第三方应用。技术上,提出了多智能体联合学习、基于语义单元的同声传译模型、稀有语言分组混合训练算法等。此外,百度语言和知识技术的成果也通过开源开放平台不断输出,在互联网、金融、医疗、教育等诸多领域发挥作用,在提升产业智能化水平的同时,也得到了各方的认可。这是十年来百度语言和知识技术不断进步的最好证明。演讲最后,王海峰对语言和知识技术的进一步发展充满期待。他表示,复杂知识表示与快速构建技术、知识与深度学习的进一步融合、感知与认知深度融合的跨模态语义理解技术、模型可解释性和鲁棒性等,还有很多技术问题需要继续深化.研究解决。但对于未来,百度充满信心,愿意始终坚持探索机器“掌握知识、理解语言、拥有智能”,携手学术界和产业界,推动语言、知识技术的不断进步,以及人工智能技术,从而不断升级行业和社会。为经济高质量发展作出更大贡献。
