https://www.zhuanzhi.ai/paper/a904f0aa0762e65e1dd0b8b464df7168图是描述对象及其关系的重要数据表示,它们出现在各种各样的现实世界场景中.图生成是该领域的关键问题之一,它考虑学习给定图的分布以生成更多新图。然而,具有丰富历史的图生成模型由于其广泛的应用传统上是手工制作的,并且只能对图的某些统计特性进行建模。用于图生成的深度生成模型的最新进展是提高生成图的保真度并为新型应用铺平道路的重要一步。本文广泛概述了用于图形生成的深度生成模型领域的文献。首先,给出了图生成的深度生成模型的正式定义和初步知识;其次,分别提出了无条件和条件图生成的深度生成模型分类;对各自现有的作品进行了比较和分析。在此之后,将概述该特定领域的评估指标。最后,总结了深度图生成的应用,并指出了五个有前途的研究方向。介绍性图在现实世界中无处不在,表示对象及其关系,例如社交网络、引文网络、生物网络、交通网络等。众所周知,图也具有包含丰富底层价值的复杂结构[1].在这个方向上已经做出了重大努力,产生了丰富的文献和各种图问题的方法。这些工作可以分为两类:1)预测和分析给定图形的模式。2)学习给定图的分布以生成更多新颖的图。第一类涵盖了很多研究领域,包括节点分类、图分类和链路预测。在过去的几十年里,在这个领域做了大量的工作。与第一类问题相比,第二类问题涉及到图的生成问题,这也是本文的重点。图生成包括建模和生成真实世界图的过程,这些图在多个领域都有应用,例如理解社交网络中的交互动态[2]、[3]、[4]、异常检测[5]、蛋白质结构建模[6]、[7]、源代码生成和翻译[8]、[9]、语义解析[10]。由于其广泛的应用,图的生成模型的发展历史悠久,产生了众所周知的模型,例如随机图、小世界模型、随机块模型和基于先验结构假设的贝叶斯网络模型[11]生成图形。这些图生成模型[12]、[13]、[14]旨在对预先选择的图族进行建模,例如随机图[15]、小世界网络[16]和无标度图[12]。然而,由于它们的简单性和手工制作的性质,这些随机图模型通常对复杂依赖性建模的能力有限,并且只能对图的某些统计属性进行建模。这些方法通常非常适用于为预定义原则量身定制的属性,但通常不适用于其他属性。例如,联系网络模型可以适应流感流行,但不能适应动态功能连接。然而,网络的性质和生成原理在许多领域基本上是未知的,例如那些解释大脑网络中精神疾病、网络攻击和恶意软件传播机制的领域。再举一个例子,Erdos-Renyi的图不具有许多现实世界网络典型的重尾度分布。此外,先验假设的使用限制了这些传统技术在更大的领域探索更多的应用,在这些领域中,图的先验知识总是不可用。鉴于传统图生成技术的局限性,一个关键的开放挑战是开发可以直接从观察到的图集合中学习生成模型的方法,这是提高生成图保真度的重要一步。它为新型应用铺平了道路,例如发现新药[17]、[18]和蛋白质结构建模[19]、[20]、[21]。深度生成模型的最新进展,例如变分自动编码器(VAE)[22]和生成对抗网络(GAN)[23],已被提议用于生成图。许多深度学习模型形式化了生成图形的深度生成模型的一个有前途的领域,这是本次调查的重点。在深度地图生成方面已经进行了各种先进的工作,从一次性地图生成到顺序地图生成过程,适应各种深度生成学习策略。这些方法旨在通过不同领域的工作解决上述一个或多个挑战,包括机器学习、生物信息学、人工智能、人类健康和社交网络挖掘。然而,在不同研究领域开发的方法通常使用不同的词汇并从不同的角度处理问题。此外,缺乏标准和全面的评估程序来验证已开发的图深度生成模型。为此,本文对图生成的深度生成模型进行了系统的调查。目的是帮助跨学科研究人员选择合适的技术来解决其应用领域中的问题,更重要的是,帮助图生成研究人员了解图生成的基本原理,并确定深度图生成领域的开放研究机会。据我们所知,这是对图生成的深度生成模型的第一次全面调查。下面,我们总结了本次调查的主要贡献:本文提出了用于图形生成的深度生成模型的分类法,按问题设置和方法分类。介绍了不同子类别之间的优缺点和关系。详细描述、分析和比较了用于图生成的深度生成模型和底层深度生成模型。我们总结和分类了现有的评估程序和指标、基准数据集上的结果以及用于图生成任务的相应深度生成模型。我们介绍了图上深度生成模型的现有应用领域,以及它们给这些应用带来的潜在好处和机会。我们在图生成的深度生成模型领域提出了几个开放性问题和有前途的未来研究方向。用于图形生成的无条件深度生成模型无条件深度生成模型生成的目标是从一组观察到的真实图形中学习分布pmodel(G),这些真实图形是通过深度生成模型从真实分布p(G)中采样的。根据生成过程的风格,我们可以将这些方法分为两个主要分支:(1)顺序生成:顺序生成节点和边;(2)一次生成:从矩阵表示构建概率图形模型,生成所有节点和边。两种生成图的方法各有优缺点。顺序生成在有效执行上一代的本地决策的同时,难以维持长期依赖性。因此,图的一些全局属性,如无标度属性,很难包含在内。此外,现有的序列生成工作仅限于预定义的序列序列,留下了排列的作用。One-shot生成方法可以通过多次迭代同步生成和细化整个图(即节点和边)来对图的全局属性进行建模,但它们的时间复杂度通常超过O(N2),因此大多数方法难以实现缩放到大图。用于图生成的条件深度生成模型条件深度图生成的目标是从一组观察到的现实图G及其相应的辅助信息(即条件y)中学习条件分布pmodel(G|y)。辅助信息可以是类别标签,语义上下文,来自其他分布空间的地图等。与无条件深度地图生成相比,条件生成除了在生成地图方面存在挑战外,还需要考虑如何从给定条件中提取特征并进行整合进入地图的生成。因此,为了系统地介绍现有的条件深度图生成模型,我们主要描述这些方法如何处理条件。由于条件可以是任何形式的辅助信息,因此分为图、序列和语义上下文三种类型,如图1中分类树黄色部分所示
