当前位置: 首页 > 科技观察

科学盘点认知图谱:世界第三代人工智能的“大”机会

时间:2023-03-20 19:19:16 科技观察

近年来,人工智能(AI),依托深度学习、计算机视觉、自然语言等技术突破与应用加工,不断颠覆着人类。Cognition-AlphaGo通过自我强化学习打败人类围棋高手;而最近Alphafold解决了近50年来生物学领域的一个重大挑战——蛋白质分子折叠问题。自1956年首次提出人工智能的概念以来,人工智能已有60多年的发展历史。今天,随着相关理论和技术的不断创新,人工智能在数据、算力和算法“三要素”的支持下越来越多地进入我们的日常生活,比如我们常见的语音识别、人脸识别和机器学习。翻译等已经在手机、电脑等智能设备上得到应用。然而,这一系列惊喜的背后,是大多数AI在语言理解、视觉场景理解、决策分析等方面的难点:这些技术仍主要集中在感知层面,即用AI模拟人的听觉,视觉等感知能力,但不能解决推理、计划、联想、创造等复杂的认知智能任务。现在的人工智能缺乏信息进入“大脑”后的处理、理解和思考。它只是做比较简单的比较和识别,只停留在“感知”阶段而不是“认知”阶段。它主要基于感知智能技术,人工智能离人类智能还有很远的距离。究其原因,人工智能面临着制约其发展的瓶颈:大规模的常识性知识库和基于认知的逻辑推理。基于知识图谱、认知推理、逻辑表达的认知图谱被越来越多的国内外学者和行业领袖认为是“目前能够突破这一技术瓶颈的可行方案之一”。目前,人工智能的发展经历了从表示、计算到感知两个阶段,下一阶段的核心是认知。早在2016年,中国科学院院士、清华大学人工智能研究院院长张博就提出了第三代人工智能系统的雏形,并正式公开了第三代人工智能的理论框架系统于2018年底完成。其核心思想是:建立可解释且稳健的AI理论和方法;开发安全、可靠、可信和可扩展的人工智能技术;推动人工智能创新应用。2019年,图灵奖得主约书亚·本吉奥(YoshuaBengio)也在NeurIPS大会上指出,深度学习应该以感知为中心,向基于认知的逻辑推理和知识表达的方向发展。张博院士提出的第三代人工智能的思路不谋而合。图|人工智能的发展阶段如今,第三代人工智能的概念已经在国内外产生了广泛的影响。业内普遍认为,认知智能将是进一步释放人工智能产能的关键,而认知图谱是实现认知智能技术突破的关键,不仅可以让机器理解数据的本质,但也允许机器解释现象的本质。认知图谱:实现认知智能的关键机器认知智能的发展过程本质上是人类脑力不断解放的过程,是人工智能的最高阶段。但是,让机器具备认知智能,核心是让机器具备理解和解释的能力。这种能力的实现离不开大规模、结构化的背景知识。目前的智能系统虽然在感知方面已经达到甚至超越了人类水平,但在鲁棒性、可解释性、安全性和可靠性等方面还存在诸多不足。例如,模型的鲁棒性差,与精度难以共存;模型的可解释性较差,难以胜任可靠性要求高的任务;它缺乏积累知识的能力,不能与人类现有的知识体系很好地关联起来,缺乏可靠的推理方法。认知图谱旨在结合认知心理学、脑科学和人类知识等,开发集知识图谱、认知推理、逻辑表达于一体的新一代认知引擎,支撑大规模知识表示、获取、推理与计算理论与方法,实现人工智能从感知智能向认知智能的演进,建立可解释、鲁棒的认知智能作为实现机器认知智能的底层支撑方法。城市、司法行业、金融行业、安防行业,大数据精准精细分析、智能搜索、智能推荐、智能解读、自然人机交互等方面发挥着极其重要的作用。认知地图的发展可以追溯到语义网络。1968年,M.RossQuillian在研究人类长期记忆模型时,描述了人类长期记忆的一般结构模型。他认为记忆是通过概念之间的联系实现的,存储在一个复杂的网络中,并基于此提出了语义网络的概念。同年,专家系统之父、图灵奖获得者EdwardFeigenbaum开发了世界上第一个专家系统DENDRAL。专家系统是早期人工智能的一个重要分支。它可以看作是一种具有专门知识和经验的计算机智能程序系统。它通常使用人工智能中的知识表示和知识推理技术来模拟通常由领域专家解决的复杂问题。.1998年,万维网之父、ACM图灵奖获得者TimBerners-Lee爵士也提出了语义网的概念。文档,XML文档)加入计算机可以理解的语义“元数据”(MetaData),使整个互联网成为通用的信息交换媒介,即用知识代表互联网,建立常识性知识库。2006年,TimBerners-Lee提出了关联数据(LinkedData)的概念,意思是数据不仅在语义网上发布,而且在数据之间建立链接,从而形成一个巨大的关联数据网络,其目的是构建计算机可以理解的语义数据网络,而不仅仅是人类可以理解的文档网络,从而在其之上构建更智能的应用程序。2012年,Google的AmitSinghal等人提出了KnowledgeGraph的概念。知识图谱以语义网络的结构化方式描述客观世界中的概念、实体、事件以及它们之间的关系。与传统的本体语义网络相比,实体覆盖率更高,语义关系更加复杂全面。图|认知地图的演化(来源:报道《人工智能之认知图谱》)然而,要让机器具备认知智能,核心是让机器具备理解和解释的能力。这种能力的实现与大规模的、结构化的背景知识密不可分。2020年,清华大学计算机系教授、副主任唐杰在《人工智能的下一个十年》报告中,结合认知科学和计算机理论,提出了实现认知智能的可行思路,即“认知地图”。=KnowledgeMap+CognitiveReasoning+LogicalExpression”,希望利用知识表示、推理和决策,以及人类的认知来解决复杂问题。这个思路的基本思路是结合双通道理论认知科学:人脑的认知系统有两个系统,即系统1和系统2。系统1是直觉系统,可以通过人对相关信息的直觉匹配找到答案,非常快速和简单;而系统2是一个分析系统,通过一定的推理和逻辑找到答案。比如回答一个具体的问题:2003年在洛杉矶QualityCafé拍这部电影的导演是谁?要回答这个问题,系统1首先需要找到相关的电影,然后系统2做出决定。如果是标准答案,则整个推理过程结束;如果不是,而对应的信息有用,就作为有用的信息提供给系统1,系统1继续扩充知识,系统2再做决策,直到找到最终答案。可见,认知图谱的核心是以实现知识驱动和数据驱动相结合的知识表示和推理为目标的认知引擎,研究支持鲁棒性的大规模知识的表示、获取和推理。和可解释的人工智能。计算与计算的基本理论与方法;构建包含语言知识、常识知识、世界知识、认知知识的大规模知识图谱和典型行业知识库,构建知识计算服务平台。机遇与挑战并存近年来,虽然人工智能取得了快速发展,但如何将深度学习与大规模常识性知识相结合,实现认知推理和逻辑表达,仍然面临着巨大的挑战。研发融合常识知识图谱、认知推理、逻辑表达等核心技术的认知图谱,将成为实现下一代人工智能技术突破的关键。以认知图谱作为底层数据支撑,具备推理、解释和识别能力。已知的新一代人工智能是未来10年人工智能领域的一个重要发展方向,也是一个机遇与挑战并存的发展方向。众所周知,技术的突破和发展离不开人才的不断创新,科技的竞争归根结底也是人才的竞争。那么,放眼中国乃至世界,认知图谱领域的人才在哪里?近日,清华大学人工智能研究院、北京致远人工智能研究院、清华-中国工程院知识智能联合研究中心、阿里集团-新零售智能引擎事业群联合发布《人工智能之认知图谱》(认知智能研究报告)图)报告。报告依托AMiner平台,对认知图谱相关领域的技术领先国家、机构和学者,以及技术发展趋势和技术创新热点进行了详细分析。数据显示,与世界相关的认知地图领域的学者主要集中在北美、欧洲和亚洲。美国的高层次学者数量位居世界第一,其次是中国,第三是英国。图|全球认知地图相关领域学者分布图(来源:报告《人工智能之认知图谱》)。其中,中美两国高水平学者数量远高于其他国家,在认知图谱相关领域具有较强的发展潜力。中国虽然仅次于美国,但高水平学者的数量却只有美国的一半左右,相差甚远。图|h-indexTOP5000全国统计前10名全球学者及国内认知地图相关领域学者主要分布在中国经济政治发达地区,包括京津冀、长三角、珠三角、香港香港、台湾等地区,中西部和东北地区学者相对较少。图|中国认知图谱领域学者分布图(来源:报道《人工智能之认知图谱》)具体来看,北京、上海、江苏认知图谱领域学者数量排名前三,分别为129人、45人和45人。分别为36个。(参考h-index作为筛选条件,选取TOP5000全球学者,以地图的形式展示分析学者的区域分布,颜色越红,圆圈越大,人才越集中。)图|h-indexTOP5000中国学者省市统计前10名。而且,美国在认知图谱相关领域的论文发表数量、被引用总次数、高水平学者数量等方面均位居世界前列。中国虽然在发表论文数和高水平学者数量上仅次于美国,但与美国差距较大,论文总被引频次略低于美国英国和德国并列世界第四。图|论文总被引频次前10位的国家。此外,报告还基于AMiner平台以学者流入流出之和作为筛选条件,统计了2009-2020年全球学者在认知图谱相关领域的流量排名。10个国家。数据显示,美国、加拿大、法国学者流入大于流出,而中国、英国、德国、意大利、印度、日本、西班牙学者流出大于流入.图|全球认知地图领域的学者流动(来源:报道《人工智能之认知图谱》)由此可以看出,近10年来中国的学者流动比较频繁,这与中国的相关研究不无关系出国培训、人才引进关系等人才政策。随着经济全球化深入发展,科技人才跨境流动更加频繁,各国对科技人才的竞争更加激烈。那么,国内认知图谱领域的学者分布情况如何?数据显示,北京是一个学者流入流出多的城市,远高于其他城市,这可能与北京的大学和科研机构数量多有关。此外,北京、香港、上海、哈尔滨学者流出高于流入,而武汉、南京、西安、杭州、广州、合肥学者流入高于流出。北京、香港、上海学者流失,与这三个城市高校数量多、供需失衡、人才竞争激烈、生活压力大不无关系。哈尔滨的地理环境造成了一定的文人流失。针对这些学者净流入为正的城市,我们通过研究相关数据可以发现,这些地方都在积极推动人才引进政策,包括在户籍、住房补贴、工资等方面制定相应的优惠措施。图|我国认知图谱领域学者流动情况(来源:报道《人工智能之认知图谱》)以上分析表明,在下一代人工智能的机遇与挑战下,我国相关部门需要重视并采取相关措施,我国学者在更加注重论文数量的同时,要提高论文质量,同时要加快高层次科技人才队伍建设。机构优秀学者,完善人才结构,加快认知图谱领域技术发展。未来10年,具有推理、解释、认知能力的新一代人工智能将是人工智能领域下一个重要的发展方向,研发融合常识知识图谱等核心技术的认知图谱、认知推理和逻辑表达将是下一代人工智能技术实现突破的关键,但归根结底还是要靠相关人才不懈努力的创新。