1.1知识图谱的发展历程在第一阶段,引文网络分析开始成为研究当代科学发展的常用方法;?第二阶段(1977-2012)是知识图谱的发展阶段,语义网络迅速发展,“知识本体”的研究开始成为计算机科学的一个重要领域。知识图谱在知识组织和表达上吸收了语义网和本体的概念,使得知识在计算机之间、计算机与人之间更容易交换、流通和处理;?第三阶段(2012-至今)是知识图谱的繁荣阶段。2012年,谷歌提出GoogleKnowledgeGraph,知识图谱正式命名。谷歌通过知识图谱技术提升了搜索引擎的性能。随着人工智能的蓬勃发展,知识图谱所涉及的知识抽取、表示、融合、推理、问答等关键问题得到了一定程度的解决和突破。知识图谱已经成为知识服务领域的新热点。业内广泛关注。知识图谱的具体开发过程如下图所示。案例讲解材料近年来,随着语义网的兴起,本体技术受到了广泛的关注。许多大型跨国公司已经开始研究本体技术。谷歌在2012年提出了知识图谱项目,旨在利用本体技术提高搜索的准确性和更智能的知识浏览。国内的互联网公司,如百度、搜狗等,也纷纷在这方面开展项目。微软提出了Probase项目,旨在通过爬取网页中的信息来构建大规模本体。IBM使用语义网技术来处理异构医疗数据的集成和更准确的查询回答。本体技术在IBM著名的问答系统Watson中发挥了重要作用。Oracle实现了强大的语义数据推理和索引系统。本体技术也得到了欧美政府的支持。英国政府推出了http://Data.gov.uk项目,将众多政府网站的信息以本体的形式发布。美国政府也有类似的计划。学术界对本体的研究取得了很多成果,特别是在计算机科学领域,已经开发出很多实用技术。近五年来,欧盟投入了大量科研经费(累计超过数亿欧元)用于本体相关研究。1.2知识图谱的重要性哲学家柏拉图将知识定义为“JustifiedTrueBelief”,即知识需要满足三个核心要素:Justified,True,andBelieved。简单地说,知识就是人类通过观察、学习和思考客观世界的各种现象而获得和总结的一切事实(Facts)、概念(Concepts)、规则或原则(Rules&Principles)的集合。人类发明了各种描述、表达和传承知识的手段,如自然语言、绘画、音乐、数学语言、物理模型、化学公式等,可见客观世界规律的智能化描述对人类社会的重要性。人类社会的发展。获取、表示和处理知识的能力是人类思维区别于其他物种思维的重要特征。知识图谱已经成为促进机器获得基于人类知识的认知能力的重要途径,也将逐渐成为未来智能社会的重要生产资料。n知识图谱是人工智能的重要基石。n知识图谱促进智能化发展。n知识图谱是强人工智能发展的核心驱动力之一。知识图谱由谷歌于2012年5月17日提出,其初衷是为了提高搜索引擎的能力,提高用户的搜索质量和搜索体验。事实上,目前的人工智能技术可以简单分为感知智能(主要是图像、视频、语音、文本等识别)和认知智能(涉及知识推理、因果分析等),知识图谱技术是核心认知智能领域。主要技术是人工智能技术的组成部分。其强大的语义处理和互联组织能力为智能信息应用提供了基础。知识图旨在描述现实世界中存在的实体以及实体之间的关系。随着人工智能技术的发展和应用,知识图谱作为关键技术之一,已经广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。从使用范围来看,知识图谱分为通用知识图谱和领域知识图谱。通用知识图谱强调广度,大部分数据来自互联网,而领域知识图谱应用在垂直领域,成为基础数据服务。1.3知识图谱的定义知识图谱(KnowledgeGraph)以结构化的形式描述客观世界中的概念、实体及其关系,以更接近人类认知世界的形式表达互联网信息,提供更好的组织、管理能力并了解互联网上的海量信息。知识图谱为互联网的语义搜索带来了生机,同时在智能问答中展现出强大的力量,成为互联网知识驱动的智能应用的基础设施。知识图谱与大数据、深度学习一起成为互联网和人工智能发展的核心驱动力之一。技术标准化研究所的知识图谱并不是一种新的知识表示方法,而是知识表示在行业内的大规模知识应用。它将互联网上可以识别的客观对象联系起来,形成客观世界中实体和实体关系的知识。库本质上是一个语义网络,节点代表实体或概念,边代表实体/概念之间的各种语义关系。知识图谱的架构包括知识图谱本身的逻辑结构和用于构建知识图谱的技术(系统)架构。知识图谱的逻辑结构可以分为模式层和数据层。模式层在数据层之上,是知识图谱的核心。模式层存储细化的知识。本体库通常用于管理知识图谱的模式层。借助本体库支持公理、规则和约束的能力,可以标准化实体之间的关系、关系以及实体类型和属性。数据层主要由一系列事实组成,知识将以事实为单位进行存储。在知识图谱的数据层,知识以事实为单位存储在图数据库中。如果以“实体-关系-实体”或“实体-属性-值”三元组作为事实的基本表达,图数据库中存储的所有数据将形成一个巨大的实体-关系网络,形成一个“知识图谱”..知识图谱旨在描述现实世界中存在的各种实体或概念及其关系。它构成了一个巨大的语义网络图。节点代表实体或概念,边由属性或关系组成。目前的知识图谱已经被用来指代各种大规模的知识库。如上图所示,知识图谱中存在三种节点,其基本形式为(实体1-关系-实体2),(实体-属性-属性值)。实体:指可区分的、独立存在的事物。如某国:中国、英国等;某城市:北京、伦敦等。语义类:国家、城市、民族等具有一定特征的实体的集合。属性值:实体指向的属性值。例如,中国(实体)的面积(属性)为960万平方公里(属性值)。关系:在知识图谱上,关系是将kk个图节点(实体、语义类、属性值)映射到布尔值的函数。基于上面的语义图谱概念,我们可以构建一个国家的知识图谱为例,如下图所示:
