当前位置: 首页 > 科技赋能

重的!百度CTO王海峰详细解读NLP技术的完整布局

时间:2024-05-20 02:13:05 科技赋能

AI正在向更深层次演进,语言和知识技术的重要性日益凸显。

8月25日,以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会启动。

百度CTO王海峰发表主题演讲,解读百度语言和知识技术的发展历程和最新成果。

为与产学研各界分享技术和产业发展趋势和前景,百度集团副总裁吴甜和百度技术委员会主席吴华分别发布了百度语言和知识技术系列产品和数据集共建计划,并启动了百度语言和知识技术系列产品和数据集共建计划。

新发布5款产品。

,全面加速人工智能技术规模化应用。

王海峰在致辞中表示,“在百度语言和知识技术的布局和发展中,我们始终注重把握两个趋势,即技术发展趋势和产业发展趋势,力争引领潮流。

”语言和知识技术是人工智能认知能力的核心,以语言和知识为研究对象。

让机器像人类一样掌握知识、理解语言的自然语言处理技术对于人工智能的发展至关重要。

十年来,百度在大脑语言和知识技术方面取得了丰硕成果。

荣获国家科技进步奖等奖项20余项,国际竞赛冠军30余项,发表学术论文100余篇,申请多项专利。

在技??术不断突破和创新的同时,也对产品进行创新和探索,同时向开发者和合作伙伴输出领先技术,提升各行业的智能化水平。

百度引领语言和知识技术的创新,形成完整的技术布局。

半个多世纪前,老一辈自然语言处理学者在一本名为《场景》的书中畅想了跨语言、跨文化无障碍交流的未来。

如今,机器同声传译、翻译机、跨模态翻译等工具已经融入人们的工作和生活,无国界沟通的梦想正在逐步??实现。

这一切都是人工智能技术特别是语言和知识技术进步的结果。

经过近十年的发展,百度已经构建了完整的语言和知识技术布局,包括知识图谱、语言理解和生成技术,以及智能搜索、机器翻译、对话系统、智能写作、深度问答、等由上述技术支持。

包括应用系统。

其中,知识图谱是机器理解世界的基础。

机器认知能力的突破越来越依赖于知识和大规模知识图谱的使用。

百度创建了全球最大的多源异构知识图谱,拥有超过50亿个实体和1亿个事实。

它不断发展和更新,并已应用于各行各业,每天的调用量超过1亿次。

不仅如此,百度还针对不同的应用场景和知识形态建立了多元化的知识图谱类型,包括基础实体知识图谱、行业知识图谱、事件图谱、焦点图谱等,以及集成语音、视频、图片的多模态知识图。

这背后是百度打造的一整套知识图谱构建方法,包括无标签大数据开放知识挖掘技术、自我扩展知识体系的知识图谱自学习技术、融合多源异构的知识补全与整合技术等。

数据。

在知识的加持下,语言理解相关技术的能力不断增强,机器也能逐渐像人一样学习和进步。

百度提出了知识增强语义理解框架ERNIE,在深度学习的基础上整合知识,具有与人类一样的持续学习能力。

曾登顶全球权威数据集GLUE排行榜,首次突破90分大关,超越人类分数。

通过融入知识、语义理解、增强小样本学习能力,机器的阅读理解和会话能力也在快速提升。

当然,与人类感知世界的方式类似,机器识别世界时,不仅仅使用自然语言,往往会综合应用语音、视觉、语音等多模态信息。

为此,百度开发了知识增强的跨模态深度语义理解方法。

它将跨模态信息与知识关联起来,用语言描述不同模态信息的语义,从而让机器从“看得清楚”走向“理解”。

从“听清楚”到“理解”,即图像与语言、言语与语言的综合理解。

融合场景图知识的跨模态语义理解预训练技术,极大提升了跨模态推理能力。

除了机器理解自然语言之外,语言生成的任务对于与人交互也至关重要。

百度基于多流机制的语言生成预训练技术在语言生成过程中考虑了词、短语等不同粒度的语义信息,提高了生成效果。

多文档摘要生成,通过图结构语义表示,引入章节结构知识,增强长文本语义表示能力,解决跨文档关系建模问题。

将语言生成技术与其他语言和知识技术相结合,百度打造了智能创作平台,已被20多家媒体采用,日调用量超过35万次。

领先技术不断落地应用,提升智能化水平。

语言和知识技术的全面突破突出体现在搜索、翻译、对话系统等各类产品和应用中。

王海峰介绍,智能搜索通过知识图谱、语言理解、跨模态语义理解等技术,帮助用户更加高效、准确、便捷地获取知识和信息。

如果智能搜索进一步发展,搜索将无处不在。

百度提出知识图谱驱动的对话控制技术,以及首个基于潜在空间的大规模开放域对话模型PLATO等,并推出智能对话定制与服务平台UNIT,帮助开发者高效构建智能对话系统并实现规模化。

应用。

百度翻译支持多种语言,每天响应超过1000亿字符的翻译请求,支持超过40万个第三方应用。

在技??术上,它提出了多智能体联合学习、基于语义单元的同声传译模型以及罕见语言分组和混合。

此外,百度的语言和知识技术成果也通过开源、开放平台不断输出,在互联网、金融、医疗、教育等多个领域发挥作用,同时提高水平工业智能化的发展,也得到了各方的认可。

这是百度近十年来在语言和知识技术上不断进步的最好证明。

演讲最后,王海峰对语言和知识技术的进一步发展表示期待。

他表示,在复杂知识表示与快速构建技术、知识与深度学习的进一步融合、感知与认知深度融合的跨模态语义理解技术、模型可解释性与鲁棒性等方面还有很多技术问题需要继续攻克。

等研究解决。

但对于未来,百度充满信心,愿意始终坚持探索机器“掌握知识、理解语言、拥有智能”,与学术界和工业界共同推动语言、知识技术和人工智能的不断进步。

人工智能技术,不断推动产业和社会升级。

为经济高质量发展作出更大贡献。