深度学习是AI领域最热门的方向之一。目前主流的图深度学习框架如PyG、DGL等多为实现图深度学习的基本操作和模型,难以处理复杂的图。深度学习研究任务。近日,德州农工大学季水旺教授团队开发出首个可扩展的图深度学习工具包,用于复杂的研究任务,包括图生成、图自监督学习、图神经网络可解释性和3D图深度学习任务。它旨在帮助研究人员在复杂图深度学习任务的算法开发中轻松使用通用数据集和评估指标与通用基准进行比较。图深度学习已证明其在学习丰富的图结构数据方面的有效性。并在药物发现、社交网络、物理模拟等诸多问题上取得了重大进展。许多图深度学习框架(如PyG、DGL等)主要侧重于实现基本的图深度学习模块和基本任务,例如节点分类和图分类。但对于图生成和图神经网络可解释性等复杂任务,研究人员仍然需要花费大量精力来实现算法并与基线模型进行比较。为了解决这个问题,德州农工大学季水旺教授领导的DIVE(DataIntegration,VisualizationandExploration)实验室开源了第一个用于复杂研究任务的图深度学习工具包DIG(DiveintoGraphs)。该工具包是实验室16人团队(14名博士生、1名本科生和1名导师)历时1年的努力成果。不同于PyG、DGL等图神经网络框架,DIG专注于为当前流行的复杂图深度学习研究任务提供一个更易用、更快速、可扩展的算法开发和对比研究平台。目前,DIG工具包支持4个研究方向:图生成、图自监督学习、图神经网络可解释性和3D图深度学习。针对每个领域,DIG都提供了通用和可扩展的数据接口、通用算法和评估标准实现。总之,DIG极大地促进了研究人员的算法开发和与基准模型的实验比较。论文地址:https://arxiv.org/abs/2103.12608项目地址:https://github.com/divelab/DIG目前,DIG涵盖了4个研究方向的18种算法、33个数据集、7类评价指标。基于通用和可扩展的实现,未来可以将更多的方向和算法集成到DIG中。工具包的整体结构如下图所示:DIG涵盖的四个方向。图生成:图生成算法研究如何根据给定的一组图数据生成新图。图生成任务对于药物和材料开发具有潜在的重要意义。因此,DIG主要考虑可以生成分子图的深度学习算法。同时,在DIG中也实现了评估随机生成、分子性质优化、约束分子性质优化的相关指标。图自监督学习:关于自监督学习的研究最近扩展到图数据,利用特定的自监督任务可以帮助模型获得更有效的图特征表示。目前DIG主要实现基于对比学习的常用图自监督算法,为节点分类和图分类提供数据接口和评价指标。图神经网络可解释性:由于图神经网络越来越多地部署在现实世界的应用中,因此研究图神经网络的可解释性对于更好地理解模型变得至关重要。常见的图神经网络解释算法在DIG中实现。除了常用的基准数据集和评估指标外,DIG的开发者还构建了人类易于从文本数据中理解的图数据集用于可解释性任务,这极大地促进了图神经网络可解释性的后续研究。3D图深度学习:3D图网络是指节点具有三维位置信息的图网络结构。例如,分子中的每个原子都有其相对的3D位置。考虑到图结构中的3D位置信息对提高图网络的表达能力具有重要作用。DIG将三种最新的3D图深度学习算法集成到一个3DGN框架中,提供了一个统一的实现。还实现了通用3D分子数据集的统一接口和评估指标。关键设计原则的共同实现:DIG对每个研究方向都有数据接口和评估方法的共同实现。这使DIG能够充当标准化测试平台。此外,对于可以从一个角度统一的算法,DIG也会提供通用的算法实现。比如3D图深度学习的3DGN框架和图自监督学习的对比模型框架。可扩展性和定制化:通过通用的实现,研究人员可以轻松集成新的数据集、算法和评估标准。此外,用户还可以灵活选择数据接口和评估方式来定制实验。因此,DIG可以作为研究人员实现新算法和与基准算法进行实验比较的平台。
