自然语言理解(NLP)被誉为“人工智能皇冠上的明珠”,这也意味着在认知等方面的技术突破语言和知识。
将进一步推动人工智能的深入发展。
8月25日,以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会举行。
百度CTO王海峰发表主题演讲,解读百度语言与知识技术、产品的发展历程和最新成果。
学术界和研究界分享技术和行业发展趋势和前景。
百度集团副总裁吴甜和百度技术委员会主席吴华分别发布百度语言和知识技术系列产品及数据集共建计划,推出5款新产品,全面加速AI技术规模化应用。
这是一次凝聚了百度在语言和知识领域十年技术积累和产业实践的盛会,必将产生深远影响。
百度CTO王海峰十年:开拓者、深耕者、领导者 语言和知识技术是人工智能认知能力的核心。
2017年,百度成立自然语言处理部门,在前瞻技术和产业格局上持续引领和创新。
近十年来,已成为中国NLP发展的一面旗帜。
峰会上,王海峰回忆道,“在百度语言和知识技术的布局和发展中,我们一直注重把握两个趋势,即技术发展趋势和产业发展趋势,力争引领潮流。
”百度语言与知识技术发展概况 过程,从研究方法、研究对象、研究方向、行业应用等各个方面都有完整的布局,并不断打磨成熟。
始终符合应用的发展趋势和需求,与行业保持一致。
十年来,百度在大脑语言和知识技术方面取得了丰硕成果。
荣获国家科技进步奖等奖项20余项,国际竞赛冠军30余项,发表学术论文100余篇,申请多项专利。
在技??术不断突破和创新的同时,也对产品进行创新和探索,同时向开发者和合作伙伴输出领先技术,提升各行业的智能化水平。
全面分享语言、知识和技术成果王海峰全面分享了百度在语言和知识技术方面的完整布局和最新成果。
首先,知识图谱是机器理解世界的重要基础。
百度创建了全球最大的知识图谱,拥有超过50亿个实体和1亿个事实,并且在不断演进和更新。
百度知识图谱应用于各行各业,日调用量超过1亿次。
其次,在整合知识的基础上,语言理解能力不断增强。
2020年3月,百度提出知识增强语义理解框架ERNIE,在深度学习的基础上整合知识,具备持续学习能力。
曾登顶全球权威数据集GLUE排行榜,首次突破90分大关,刷新榜单。
单身历史。
基于知识图谱和语义表示,在阅读理解、对话理解、跨模态深度语义理解等技术上取得突破。
第三,语言生成是语言和知识技术的重要组成部分。
基于预训练技术的成功经验,百度提出了基于多流机制的语言生成预训练技术,兼顾了词、短语等不同粒度的语义信息,显着提升了生成效果。
百度还探索了多文档摘要生成,通过图结构语义表示引入章节知识,提高单文档和多文档摘要生成的效果。
在应用系统层面,在对话系统、机器翻译方面取得了突出的成就。
百度提出知识图谱驱动的对话控制技术,以及首个基于潜在空间的大规模开放域对话模型PLATO等,并推出智能对话定制与服务平台UNIT,帮助开发者高效构建智能对话系统并实现大规模应用。
。
百度翻译支持多种语言,每天响应超过1000亿字符的翻译请求,支持超过40万个第三方应用。
在技??术上,它提出了多智能体联合学习、基于语义单元的同声传译模型以及罕见语言分组和混合。
百度在大脑语言和知识技术方面的不断探索和创新,在业界取得了令人瞩目的成果。
同时,这些技术以平台化的方式输出,赋能千行百业,不断提升工业智能化水平。
推出5款新品和2大计划,王海峰首次发布百度大脑语言和知识产品全景图。
百度集团副总裁吴甜先后发布了三款新产品:语义理解技术及平台文信、智能文档分析平台TextMind和人工智能同声传译会议解决方案。
同时发布了6大升级,其中包括智能创作平台的3大场景解决方案、智能对话定制与服务平台UNIT的3大全新升级。
百度集团副总裁吴甜表示:“我们一直致力于将语言和知识技术凝结成一系列技术平台和产品,在应用中产生大量价值,为开发者和行业从业者提供语言和知识技术核心驱动力。
系列产品。
百度推出的语义理解技术及平台“问心”基于深度学习平台飞票,依托领先的语义理解核心技术,集成了优秀的预训练模型、全面的NLP算法集、端到端的开发套件平台提供一站式NLP开发和服务,让开发者更简单、高效地定制企业级NLP模型。
文信经过大量真实应用场景的锤炼,拥有优秀的工业级实施能力。
TextMind是新发布的智能文档分析平台,基于OCR和NLP技术。
以文档分析为核心能力,支持文档对比、文档审核。
具有“更快、更省”的核心优势,推动企业办公智能化升级。
百度大脑智能创作平台针对媒体应用场景进行升级,推出智能策划、智能剪辑、智能审核三大新媒体场景解决方案,进一步帮助媒体人更快更好地创作,可谓击中“痛点”的媒体人。
智能对话定制与服务平台UNIT进行了升级,拥有三大特色:更加智能的任务型对话理解、极其便捷的形式问答、全新的通用对话引擎。
UNIT全新升级的三项能力将进一步降低任务对话和智能问答的定制成本,并融合通用对话能力,提升交互体验。
最新发布的AI同声传译会议解决方案覆盖所有会议场景和流程,旨在为用户打造“会议同声传译专家”。
吴甜现场演示了如何只用电脑和手机快速搭建一套同声传译服务。
只需点击几下鼠标,几句话,您就可以快速获得专业的同声传译服务。
数据缺乏和计算能力不足一直是语言和知识技术研发的瓶颈。
为了突破瓶颈,百度联合中国计算机学会、中国中文信息学会启动了中文自然语言处理数据共建项目——千言,解决数据稀缺问题。
前研一期由国内11所高校和企业的数据资源开发商联合打造。
已覆盖开放领域对话、阅读理解等7大任务,20多个中文开源数据集。
百度技术委员会主席·吴华表示,“未来,我们希望更多的数据集作者能够参与千言万语的建设,共同推动中文信息处理技术的进步,打造全球中文信息处理影响力。
我们计划在3年内我们已经为20多项任务收集并构建了不少于20个中文自然语言处理数据集,涵盖了语言和知识技术的各个领域。
”吴华还通过百度AI STUDIO推出了百度语言和知识技术算力共享计划。
平台提供算力支持,让开发者摆脱算力的束缚,专注于技术创新。
十年历程中,百度培养和吸引了一大批全球语言和知识技术开发领域的顶尖人才。
会上,百度推出了以王海峰为代表的百度NLP“十年十人”。
他们十年坚持,不忘初心,秉持“科技信仰”,勇攀科技高峰,坚定不移地致力于让机器更好地理解世界。
,更好地为人民服务。
正如王海峰所说,“我们致力于更好地携手学术界和工业界,推动语言和知识技术的发展,从而推动人工智能技术不断进步,为产业智能化升级和社会经济高质量发展做出贡献。
”我们对未来充满信心,坚持研发让机器掌握知识、理解语言、拥有智能。
我们将不断突破创新,为科技进步和社会进步做出更大贡献。