当前位置: 首页 > 科技观察

人工智能的下一个拐点:图神经网络迎来快速爆发期

时间:2023-03-13 21:25:08 科技观察

01GNN:尝鲜响应进入快速爆发期。各大学术会议相继推出了GNN相关的workshop。在提交的论文中,以GraphNetwork为关键词的论文数量也呈井喷趋势。下图显示了过去三年。GNN的成长趋势:经过2017年到2018年两年的酝酿期和试用期,GNN从2018年底到现在的一年多时间迎来了快速爆发期。从理论研究到应用实践,可谓百花齐放,令人应接不暇。在理论研究方面,GNN的原理解释、变体模型以及对各种图数据的扩展和适配成为主流。在实践中,GNN表现出了前所未有的渗透力,从视觉推理到开放阅读理解问题,从药物分子的研发到5G芯片的设计,从交通流量预测到3D点云数据的学习,我们看到了极GNN广阔的应用前景。本文将梳理过去一年主要会议(如ICML、NIPS、CVPR、ACL、KDD等)上GNN相关论文,重点从理论研究和应用两个方面解读GNN过去一年的进展实践。限于时间和篇幅,本文没有对各个方向做全面的总结和概括。感兴趣的读者可以根据文中给出的论文链接自行查漏补缺。02GNN的原理、变体和扩展作为一个新兴的技术方向,GNN对其原理的解释以及各种变体和扩展构成了理论研究的热点。这些论文很好地回答了GNN的优点和缺点以及相关的适应性改造问题。一、GNN原理解读当前GNN研究的第一个热点是对其相关能力的理论研究。在“图神经网络有多强大?”和“OntheequivalencebetweengraphisomorphismtestingandfunctionapproximationwithGNNs”,讨论了GNNs在图同构问题上的性能。图同构问题是识别给定的两个图是否一致。图同构如下图所示。这个问题测试了算法对图数据结构的判别能力,两篇论文都证明了GNN模型具有出色的结构学习能力。图自然包含关系,因此很多与GNN相关的工作都是基于对给定系统的推理学习的研究。在这些研究中,“图神经网络可以帮助逻辑推理吗?”和“TheLogicalExpressivenessofGraphNeuralNetworks”展示了GNN在逻辑推理方面的卓越表现。《AllWeHaveisLow-PassFilters》从低通滤波的层面解释了GNN的有效性。这些原则的解释将有助于我们更清楚地了解GNN的特殊性。2.GNN的各种变体GNN模型相关变体的研究是该领域的另一个热点。这些变体在某些方面提高了GNN的性能。我们知道GCN模型是从图信号上进行傅里叶变换推导出来的。《图小波神经网络》在图信号上引入小波变换对GCN模型进行变换,将卷积计算转化为空间的局部邻域。将数据表示从欧几里得空间转换到双曲空间,不仅可以获得更好的层次表示,而且可以大大节省空间维度。《HyperbolicGraphConvolutionalNeuralNetworks》和《HyperbolicAttentionNetworks》也将GNN扩展到了双曲空间上。在《MixHop:Higher-OrderGraphConvolutionalArchitecturesviaSparsifiedNeighborhoodMixing》和《DiffusionImprovesGraphLearning》中,同时将原有GCN中邻居的定义从一阶扩展到高阶,加强了模型低通滤波的特征。3.GNN在各种图数据和任务中的扩展图数据是种类繁多的数据家族。如何使模型适应这些不同类型的数据是GNN发展的另一个重要方向。下表给出了相应的总结:Graphtyperelateddescription对应论文属性图中的各种节点类型,节点包含属性,最具代表性的[1][2]超图的一条边同时连接两个或多个节点time[3]DynamicGraphstructureevolutionovertime[4]隐式图节点之间没有显式边,需要先学习图的结构[5][6][1]:HetGNN:HeterogeneousGraphNeuralNetworkhttps://www.kdd.org/kdd2019/accepted-papers/view/hetgnn-heterogeneous-graph-neural-network[2]:属性多元异构网络的表示学习https://arxiv.org/abs/1905.01669[3]:HyperGCN:训练图卷积网络的新方法>https://arxiv.org/abs/1809.02589[4]:DyRep:学习动态图表示https://openreview.net/pdf?id=HyePrhR5KX[5]:Semi-使用图形学习进行监督学习-卷积网络http://openaccess.thecvf.com/content_CVPR_2019/papers/Jiang_Semi-Supervised_Learning_With_Graph_Learning-Convolutional_Networks_CVPR_2019_paper.pdf[6]:LearningDiscreteStructuresforGraphNeuralNetworkshttps://arxiv.org/abs/1903.11960在图数据不完全相关的任务上,图分类是一个重要但不完整的要很好地解决这个问题,难点在于如何实现对图数据的分层池化操作,以获得图的全局表示。《GraphConvolutionalNetworkswithEigenPooling》中给出了一个新的操作思路。2018年,以深度学习为代表的人工智能技术给行业带来了新的变革。该技术在视觉、语音、文本三大领域取得了巨大的应用成果。这一成功离不开深度学习技术对这三类数据进行定制化的模型设计。从这三类数据中分离出来,图数据是一种更广泛的数据表示。夸张地说,任何场景中的数据都不是孤立存在的,这些数据之间的关系可以用图形来表示。表达形式。下图展示了图数据的一些使用场景:如何将图数据的学习与深度学习技术深度结合,已经成为迫切而紧迫的需求。在此背景下,图神经网络技术的兴起犹如一阵风。我们第一次看到深度学习应用于图形数据的曙光。事实上,在过去的一年里,GNN的应用场景不断拓展,涵盖了计算机视觉、3D视觉、自然语言处理、科学研究、知识图谱、推荐、反欺诈等场景,我们将通过下面一个。1.计算机视觉在过去几年跨过视觉识别的大门后,与推理相关的视觉任务成为各大CV峰会的主要关注点,例如:视觉问答、视觉推理、语义图合成、人物交互等,甚至视觉、目标检测等基本任务也需要推理来提升性能。在这些任务中,出现了大量应用GNN的相关工作。下面我们以最常见的视觉问答任务为例。在《Relation-AwareGraphAttentionNetworkforVisualQuestionAnswering》一文中,给出了GNN与视觉模型结合的示意图:上图中,视觉模型的作用是Extractthesemanticregionsinagivenimage,这些语义区域和问题被用作图中的节点,并发送到GNN模型进行推理学习。这样的建模方法可以更有效地回答视觉问答中的问题。适应性推理。另一个有趣的场景是少样本或零样本学习。由于此类场景下样本的缺乏,如何充分挖掘样本之间潜在的关联信息(如标签语义关联、latentlayer表达关联)成为了一项至关重要的任务。考虑因素,引入GNN已经成为一个非常自然的动作。相关作品包括“RethinkingKnowledgeGraphPropagationforZero-ShotLearning”和“Edge-labelingGraphNeuralNetworkforFew-shotLearning”。2.3D视觉3D视觉是计算机视觉的另一个重要发展方向。世界是3D的。如何让计算机理解3D世界,具有极其重要的实用价值。在3D视觉中,点云数据是一种非常常见的数据表示方式。点云数据通常由一组坐标点(x,y,z)表示。由于该数据映射了现实世界中对象的特征,因此存在一种内在的流行结构来表示对象的语义。这种结构的学习也是GNNs擅长的。需要注意的是,几何学习在3D视觉中很流行。目前,GeometryLearning和GNN正在点云分割、点云识别等一些场景进行深度融合。相关论文包括《GraphAttentionConvolutionforPointCloudSegmentation》《SemanticGraphConvolutionalNetworksfor3DHumanPoseRegression》。3、自然语言处理GNN与NLP结合的关键点在于GNN优秀的推理能力。GNN在阅读理解、实体识别与关系抽取、依存句法分析等场景中都有应用。我们以多跳阅读为例。多跳阅读是指在阅读理解过程中,往往需要在多个文档之间进行多层次的类跳关联和推理,才能找到正确答案。与之前的单文档问答数据集相比,这是一个更开放、更具挑战性的推理任务。下图展示了一个多跳阅读的例子:在《CognitiveGraphforMulti-HopReadingComprehensionatScale》一文中,作者基于BERT和GNN的实现可以有效处理HotPotQA数据集中数百万的多跳阅读问题.文件显示,排行榜上的联合F1成绩为34.9,而第二名的成绩仅为23.6。4.科研场景如果把原子看作图中的节点,把化学键看作边,那么分子就可以表示为一张图。这种用图表示分子的方法可以将GNN结合到很多实际的科研场景中,比如蛋白质相互作用点的预测、化学反应产物的预测等,这些场景有利于将深度学习的快速拟合能力带入到高级药物中研发、材料研发等产业,提高研发效率。在《Circuit-GNN:GraphNeuralNetworksforDistributedCircuitDesign》一文中,作者将GNN结合到高频电路设计(如5G芯片等)场景中,大大提高了电路电磁特性仿真计算的效率。下图为系统示意图:5.知识图谱由于知识图谱本身是一种图数据,知识图谱+GNN的结合自然成为解决各种知识图谱问题的新手段。关系补全或预测是知识图谱的一项主要基础任务。通过关系推理补全可以大大提高知识图谱的应用质量。下图展示了一个关系补全的例子:在论文《LearningAttention-basedEmbeddingsForRelationPredictioninKnowledgeGraphs》中,作者选择使用GNN对知识图谱进行建模。与之前基于单个三元组关系的推理相比,基于GNN的方法可以更好地捕捉复杂隐含的三元组邻域。这个优势对于完成关系补全任务起到了非常重要的作用。实体对齐是知识图中的另一种类型的任务。给定多个知识图谱,首先需要确定各个图中的哪些实体描述了同一对象。只有完成这项工作,才能将它们正确地合成为一个大的知识图谱。论文《Multi-ChannelGraphNeuralNetworkforEntityAlignment》提出了一种基于GNN的实体对齐方案。实验表明,该方案在多个数据集上取得了最好的效果。近年来,知识图谱在业界越来越受欢迎。在这种情况下,我们也称知识图谱为商业图谱。在论文《EstimatingNodeImportanceinKnowledgeGraphsUsingGraphNeuralNetworks》中,作者成功地使用GNN技术对电影商业图进行建模,在预测电影流行度方面非常有效。此外,知识图谱与推荐系统的结合也成为最近比较热门的方向。这部分请参考下一节推荐系统中的解释。6.推荐系统推荐是各大互联网公司非常重要的盈利手段,因此一直备受业界和学术界的关注。这几年,推荐系统从早期的协同过滤算法发展到MF模型,再到Wide&Deep,再到基于NetworkEmbedding的方法。可以清楚地看到,基于神经网络的方法正在逐渐占据主要地位,而GNN的出现,又一次大大加速了这一技术趋势。以电商平台的推荐为例,推荐系统的核心数据在于用户-产品交互的二分图,大多数基于神经网络的方法将二分图中的实体映射到合适的向量空间,这样在图上两个实体越近,向量空间中的距离就越近,如下图所示:GNN本身就是一个深度模型。与推荐系统结合后,多层GNN模型可以更好地捕获用户和产品在论文“NeuralGraphCollaborativeFiltering”中,作者论证了多层GNN带来的“Deep”和“Highorder”的好处可以有效提高推荐质量。除了推荐系统算法模型本身的研究之外,另一种思路是如何有效地将附加信息融入推荐系统,比如用户端社交网络的信息和产品端产品知识的信息图形。这类信息通常也包含很强的关系,因此可以很自然地与用户-产品二部图结合,形成更大的异构图。下图是与电影知识图谱结合的示意图:图片来源https://arxiv.org/pdf/1902.06236.pdf有了这样的图数据抽象,引入GNN进行推荐建模就顺理成章了相关论文包括KGAT:《KnowledgeGraphAttentionNetworkforRecommendation》、《Metapath-guidedHeterogeneousGraphNeuralNetworkforIntentRecommendation》、《Session-basedSocialRecommendationviaDynamicGraphAttentionNetworks》等。另一个非常重要的业务场景也密切相关与推荐系统相关的是广告点击率(CTR)预测。该场景下的样本通常由多域特征数据组成,如用户域、设备域、广告域等,如何对这些数据域之间的特征交互进行建模成为本任务的核心。最近,基于神经网络的方法直接拼接域之间的特征并将它们发送到上层网络模型,以获得这些域之间的高级交互。这种简单的非结构化拼接方式会极大地限制模型的学习能力。在《Fi-GNN:ModelingFeatureInteractionsviaGraphNeuralNetworksforCTRPrediction》一文中,作者将各个域以图的形式连接起来(下图中的Featuregraph),然后使用GNN对各个域之间的关系进行建模特征域。与之前的模型相比,它们之间的高阶复杂交互关系取得了最好的效果。七、反欺诈业务反欺诈是各大公司保证经营和营销正常开展的前提。通常,我们面临的欺诈问题包括:垃圾评论、排名欺诈、交易欺诈、套路、盗号等,这些欺诈现象的背后往往是黑产集团的协同作案,大大增加了反欺诈的打击成本商业。关系数据挖掘是大多数反欺诈业务发展的最重要的技术视角。无论是基于欺诈风险传播的关联分析,还是基于黑业帮派模型的结构化挖掘,图都是反欺诈业务人员的首选工具。在这样的背景下,GNN也变得很有发展空间。例如论文《HeterogeneousGraphNeuralNetworksforMaliciousAccountDetection》使用GNN识别和检测支付宝欺诈用户,《SpamReviewDetectionwithGraphConvolutionalNetworks》使用GNN识别咸鱼欺诈评论。04GNN开源项目总结2019年,图领域出现了很多新的开源项目,一些已有的开源项目也有了很大的改进。1月,阿里妈妈开源了国内首个支持工业级图深度学习的框架Euler,内置了很多实用的图算法。项目地址:https://github.com/alibaba/euler3月,德国多特蒙德理工大学学者提出PytorchGeometric,实现了GNN的多种变体模型。上线后由YannLeCun推荐。项目地址:https://github.com/rusty1s/pytorch_geometric5月,著名图学习框架DGL发布v0.3版本(目前已经更新到0.4.1版本,完成了很多GNN变体模型),0.3该版本的性能得到了显着改善。与0.2版本相比,训练速度提升19倍,支持亿级图神经网络训练。项目地址:https://github.com/dmlc/dgl12月,斯坦福大学JureLeskovec教授在NeurlPS2019大会演讲中宣布开源OpenGraphBenchmark。通过这个数据集,我们可以更好地评估模型性能等方面。指数。项目地址:http://ogb.stanford.edu同月,清华大学知识工程实验室(KEG)推出大规模图表示学习工具包CogDL,让研究人员和开发人员更方便地进行训练和比较用于分类、链接预测和其他图形任务的基线或自定义模型的节点。项目地址:https://github.com/THUDM/cogdl/除了上述项目外,GitHub上与上图相关的两个论文项目也很不错,总结了近几年各大会议的所有相关论文,而且收藏的很及时很全面。推荐大家关注:https://github.com/naganandy/graph-based-deep-learning-literaturehttps://github.com/DeepGraphLearning/LiteratureDL4Graph05展望来年,最确定的是GNN仍将保持快速发展态势。从理论研究的角度来看,不断解构GNN的原理、特点和不足,进而提出相应的改进和扩展,是非常值得我们关注的。此外,对于GNN研究中使用的标准数据集,如Cora和PubMed,这些数据集场景单一,异构性不足,难以准确评估复杂的GNN模型。针对这一问题,近期斯坦福大学等开源了OGB标准数据集,有望极大改善这一状况。在新的评价体系下,哪些作品能够脱颖而出,让我们拭目以待。在应用场景方面,相信GNN能为我们带来更多亮眼的工作。除了广泛应用于视觉推理、点云学习、关系推理、科学研究、知识图谱、推荐、反欺诈等领域外,还可用于其他场景,如交通流预测、医学影像、组合优化等,也出现了一些GNN相关的工作。一般来说,如何准确有效地将图数据与GNN结合到相关场景中,是应用中需要考虑的问题。相信在未来的一年里,会有更多这样的工作来拓展GNN的应用边界。