12张图6个故事,终于有人把图数据库的原理说清楚了。人类是如何思考的?显然,这是一个没有标准答案的问题。但是如果把这个问题提炼成一个数学问题,用数学的语言来描述,人类本质上是用图形来思考的。我们生活的世界是高维的、相互关联的,并且不断扩大。从我们来到这个世界的那一刻到我们离开它的那一刻,我们一直在与这个世界互动——我们每时每刻接触到的所有实体(一个人,一个事件,一条新闻或旧闻,一个知识点、一本书,甚至是一缕情感),这些实体都存储在我们的大脑(记忆)中。【注:在图数据库术语中,实体(Entity),也称为点(node)或顶点(Vertex)】人脑很像一台设计精良的计算机,它也有一种思考能力,什么是“无边”?就是说,没有一处是心所不能触及的。这其实就是超深的图检索和图遍历能力。早在20世纪40年代,在社交网络概念被发明之前,研究人员就曾尝试使用图网络模型来描述和解释大脑的工作机制。▲图:用网络图模型解释大脑的工作机制我们想象一下,一个带有属性的图可以用来表达世界上所有的事物,无论它们是相关的还是离散的。当事物相关时,它们就形成了网络;当它们分开时,更像是关系型数据库表中的一行行数据(我这里想表达的重点是:图是高维的,但是高维可以向下兼容,表达低维的内容维空间,反之亦然。或者用低维关系数据库表达高维图极其困难,通常事倍功半甚至一事无成。)因此,图的表达方式和人脑的神经元网络有很大的相似之处——如何存储和识别事物!▲图:相对于传统的关系数据库和图数据库,我们总是在连接、发散,然后是Correlation、发散,而当我们需要定位和搜索某个人或事物时,我们直接通过哈希定位找到那个实体方法。这个搜索过程在关系数据库搜索加速中并不常见。基于树索引的技术。【注:哈希是一种数据结构,也叫邻接哈希(AdjacencyHashorAdjacencyHash<*>)】而当我们进行发散思维推理时,相当于在图或网络上进行某种实时的运算过滤或动态遍历搜索。当我们说一个人懂天文、懂地理的时候,当我们“广为引用”的时候,似乎让我们的思绪从一张图片跳到另一张,我们的大脑储存了很多图片。这些地图可能会根据我们的需要随时链接或交互以提供服务。如果图数据库可以达到人脑的工作方式,那为什么不相信图数据库就是最终的数据库呢?当然,前提是我们必须认同以下一点:人脑是最终的数据库。甚至可以说,在强人工智能实现之前,图数据库成为最终的人工数据库可能是必由之路。比如,你最喜欢的一道菜——红烧肉,你是怎么想出来的?按照现代网络搜索引擎技术,输入“红”字,推荐“烧”字,再输入“烧”字,推荐含有“红烧肉”字样的列表——可能人脑并没有严格使用这个倒排索引搜索技术并不重要,因为定位“红烧肉”对我们来说只是一个起点。在图的思维模式中,如何扩展到很多后续节点是关键。说起红烧肉,你可能会想到湖南红烧肉、东坡肉、苏东坡、宋慈、李清照、岳飞、文天祥、牙山海战、忽必烈、成吉思汗、蒙古西征……等等-所谓的从一个例子中推论和从其他例子中引用可能就是这种情况。▲图:红烧肉引起的思维联想当我们的思维定位到某个知识点上时,只要想到,就能一步步关联起来——从红烧肉到湖南红烧肉是一个详细的分类1-stepassociated操作,从湖南红烧肉到苏东坡都是一样的。以此类推,上例中的一系列“引用”,实际上是图数据库(或知识图谱)中不断关联(过滤或剪枝)的过程。下图就是一个例子。从坦博拉火山的爆发到滑铁卢战役,从自行车的发明到印象派的诞生,这些跨越时空的“蝴蝶效应”揭示了万物互联的本质。对于大脑如何思考这样的问题,最直接的答案就是——我们天生就是用图来思考的!▲图:从火山喷发延伸出的蝴蝶效应,我们学到的每一条知识都不是孤立的。这些不断增加的知识点构建了一个庞大的知识网络,让我们可以随时从中提取、归纳、整理、编织、演绎、联想。人类历史上所有的智者、文学家、天才、小贩、路人甲乙,他(她)们每一次灵光一闪或循规蹈矩的时候,他(她)们都在修行图片的思考。灵光乍现,只因图画思维之路延伸得更深、更宽、更快;遵守规则只是在图片中思考时太肤浅了。为了更好的说明问题,我们以《三字经》为例,以图片的形式来分析人们是如何阅读和思考的。▲图:传统启蒙书里“孟母三迁”的故事《三字经》当我们读到“西孟母,择邻而居”这句话时,短短的6个字在我们的脑海中形成了一个简单的网络(图),其中包括了孟母和孟子的形象,从他们的母子关系发散,推导出更多的相关实体,最终形成一个“明显”的多步关联图,如下图所示。(对于刚接触《三字经》或孟母故事的读者来说,理解每个知识点的过程就是构建关联知识图谱的过程,一旦形成图谱,就可以像调用图一样随时存储数据库查询分析图)▲图:孟母三千推导的“择邻(教育环境)地”的决策路径类似于“荣四岁,会做梨”,历史背后反映的名人故事也以简单的画面形式存在于我们的脑海中。我们无时无刻不在联想、发散、重新连接每一个词、每一个词组……从孟母选择邻居的故事中,我们的大脑推导出很多文字无法直接表达的内容,从孟母的故事中选择了邻居住宅分为:好邻居与坏邻居。上进的孩子VS厌学的孩子……这个推演让我们从逻辑层面清晰地理解了萌木“择邻而居”的决定。孔融给梨的故事是对图上行为模式的对比分析:4岁的孔融vs.4岁的普通孩子,这可能引出了中国那句老话:三岁看小七岁的样子老了。▲图:传统启蒙书《孔融送梨》的故事《三字经》▲图:孔融4岁VS。一个普通的孩子4岁,我们来看《三字经》的一个例子:“中国古篆书,李草从大篆到小篆,再到隶书草书,其演变和脉络中国书法的历史清晰可见。▲图:《三字经》汉字的演变每个书法的时代特征(开始、鼎盛、衰落、复兴、延续)及其各自的来龙去脉,各自的代表人物和作品,这是一张可以无限扩展的网络,但是当我们聚焦并将扩展范围限制在一个非常小的范围内时,我们可以得到如下的小地图。▲图片:说明书法的演变从本质上讲,每个网络都是一张图片。每个人的脑子里都是图片,都善于用图片来思考、发散、归纳、整合。如果一张图片不能解决问题,请添加另一张!通过本文的背景介绍,希望读者做好充分的准备,更好地进入图数据库的世界。本文节选自《图数据库原理、架构与应用》,经出版社授权发布。(ISBN:9787111708100)转载请保留文章出处。
