人工智能的本质是让机器像人一样感知和认识世界。以语言和知识为研究对象的自然语言处理(NLP)技术是人工智能的核心问题之一。5月26日,百度、中国计算机学会中文信息技术委员会、中国中文信息学会青年工作委员会联合举办“2019自然语言处理前沿论坛”。百度高级副总裁、ACLFellow王海峰博士为论坛致开幕词。他说,“语言是人类思维和交流的载体,也是人类知识凝聚和传承的载体。自然语言处理技术不仅需要算法、计算能力和数据,更需要知识的不断凝聚。因此,有仍有很大的创新和突破空间。”他希望通过本次论坛,青年学者加强交流,碰撞出新的火花,共同推动自然语言处理的发展和产业化进程,助力人工智能时代我们的生活变得更美好。本次论坛的主题是“机器的‘读、写、说、译’——探索NLP的未来”。特色嘉宾对话环节。本次论坛汇集了来自学术界和产业界的青年专家学者,共同探讨NLP领域的最新技术进展、产业应用和发展趋势。NLP领域,旨在促进产学研深度融合,推动自然语言处理技术进步。“语义计算”研究如何利用计算机对自然语言的语义进行表示、分析和计算,从而使机器具有理解语义的能力。哈尔滨工业大学车万祥教授hnology引入了动态词向量的技术进步,可以更好地根据上下文处理多义现象,大大提高自然语言处理中多任务的准确率;复旦大学邱锡鹏副教授介绍了表示学习的发展***进展,分析比较了当前主流模型的基本原理和优缺点,讨论了如何更好地融合局部和非局部语义关系,如何更好地添加先验知识,对当前复杂的网络模型进行简化和提速。北京大学孙旭研究员开展稀疏深度学习研究,提出了一种简单有效的算法来简化神经网络,只使用全梯度的一个子集来更新模型参数,大大降低了训练的复杂度和解码。百度首席架构师孙宇介绍了百度最近提出的知识增强语义表示模型ERNIE,该模型基于实体和短语等知识,在语言推理、语义相似度等多项任务上取得了显着提升。“自动问答”功能探索机器的“阅读”能力,让机器阅读文本,然后回答与阅读内容相关的问题。机器阅读理解可以使机器从文本数据中获取和应用知识,是问答领域的关键技术之一。中国科学院自动化研究所副研究员刘康介绍了文本阅读理解的基本框架和方法。他表示,构建合理的数据集对于阅读理解任务非常重要,如何更好地整合知识是未来重要的研究方向。百度高级研发工程师刘静介绍了深度融合文本表示和知识表示的模型KT-NET,以及百度发布的面向实际应用的中文阅读理解数据集DuReader2.0。基于该数据集,百度、中国计算机学会、中国信息学会连续两年举办机器阅读理解测评,共同推动中文阅读理解技术进步。“语言生成”的主题围绕如何让计算机像人类一样使用自然语言进行表达和创造。北京大学万晓军教授介绍了自然语言生成(NLG)技术和应用的最新进展,指出自然语言生成目前面临两大挑战,第一是生成文本的质量评估,第二是缺乏并行数据。如果这些问题得到解决,将极大地促进自然语言生成的发展。他还表示,目前的文字生成与人类还有很大差距,尤其是在知识的综合利用方面。百度首席架构师肖心炎介绍了百度在语言生成技术方面的创新和应用,并提出了基于规划、信息选择、端到端等方面的各种模型,效果良好。此外,百度还推出了智能写作平台,通过提供自动写作和辅助写作能力,提升内容创作的效率和质量,为智能创作领域提供更多可能。“人机对话”的话题讨论了如何让计算机和人类相互交流。清华大学副教授黄敏烈回顾了人机对话的发展历程。大多数经典对话系统使用强语义方法,而现代神经网络方法发展了基于数据驱动和概率统计的弱语义方法。语义理解一直是人机对话中的难题。如何更好地将数据和知识结合起来,是这个领域需要共同努力的方向。百度首席研发架构师孙科介绍了百度最新发布的智能对话系统培训与服务平台UNIT3.0。专注于构建技能、构建知识、整合技能和知识,发布多项核心技术和工具,极大降低了对话系统的定制成本。“机器翻译”是指利用计算机在不同语言之间进行转换和生成,是自然语言处理领域弥合语言鸿沟的一项重要技术。清华大学副教授刘洋首先介绍了神经网络机器翻译的基本原理,并指出该方法虽然取得了长足的进步,但仍面临诸多挑战。刘洋介绍了他们在知识驱动、可解释、鲁棒的神经网络机器翻译方面的最新进展。百度人工智能技术委员会主席何忠军介绍了机器同传面临的主要挑战和最新进展,指出机器同传目前面临技术、数据、评估三个方面的挑战。结合百度的研究成果,现场使用了新开发的百度翻译AI同声传译。现场观众可以用手机扫描会议二维码,实时收听翻译。在五大主题的讨论之后,车万祥、邱锡鹏、黄敏烈、刘洋、百度资深科学家吕雅娟、百度飞桨首席架构师于殿海就“NLP的未来”进行了高层对话。就“近5年NLP突破性进展”、“未来5-10年NLP发展趋势与突破方向”进行了精彩分享。他们认为,过去五年NLP在数据、模型、算法等方面都取得了突破。中国学术界的NLP研究和产业应用走在世界前列。近年来,该领域国际顶级会议入选论文数量急剧增加,论文质量也不断攀升。同时,还要进一步加强前瞻性和原创性工作。中国NLP的发展潜力不容小觑。谈到未来的发展趋势,嘉宾们表示,未来知识的进一步融合、多模态、探索更像人类的学习机制,将带来NLP领域的进一步提升。自然语言处理被誉为人工智能皇冠上的明珠。随着自然语言处理能力的不断发展,人工智能也在不断完善。自然语言处理技术广泛应用于智能搜索、深度问答、对话系统、智能写作、机器翻译等领域,为用户提供更智能的体验,满足用户对信息和服务的需求。应用于金融、服务、零售、制造等行业,推动工业智能化发展。NLP的未来是什么?或许没有标准答案。但我们始终相信技术的力量。探索未来创新的可能性,正如王海峰所说,随着科技的发展,人们将越来越深入地理解自然语言,掌握知识,推动人工智能发挥更大的价值,为人类社会的发展提供更大的助力。.
