ACM特聘会员季水旺：量子化学与物理的深度学习

时间：2023-03-12 02:14:51 科技观察

量子技术和人工智能都是目前最前沿的科学技术。前者有望拥有超强算力，后者早已在各行各业“杀四方”。两人相遇会擦出怎样的火花？人工智能可以在哪些方面帮助量子技术？去年12月，德州农工大学计算机科学与工程系教授（有影响力的院长）季水旺在CNCC大会上发表了演讲《量子化学和物理的深度学习》，表达了他对两个学科的思考。“量子打破了我们很多常识性的认识，量子态世界的运行是不确定的，我们只能预测各种结果的概率。”原子层面的物体，但它们也与宏观规律有相似之处。例如，分子间的结构可以看作是一幅图画。季水旺，博士。2010年获得亚利桑那州立大学计算机科学博士学位，师从叶杰平教授。Researchinterestsincludemachinelearning,deeplearning,datamining,andcomputationalbiology,andreceivedaNationalScienceFoundationCareerAwardin2014.ElectedasACM2020DistinguishedMemberin2020.Thefollowingisthefulltextofthespeech,AITechnologyReviewhas在不改变初衷的情况下进行了整理。大家好，今天我将重点介绍如何利用AI和图形计算技术解决量子物理和量子化学问题。首先，一些背景：在经典物理学领域，我们谈论的是宏观世界中的物体或现象。比如踢一个球，如果知道球的具体质量、速度和当前时间，就可以在五秒内预测出球的位置。但在量子领域，由于研究对象是原子层面甚至亚原子层面的对象，比如由原子和化学键组成的分子，无法按照传统逻辑去思考该领域的规律。近年来，我们不断与各个领域的专家合作，希望能够获得量子物理学家、量子化学家、量子材料科学家的研究突破。这些不同领域的学者有一些共同的研究课题，这些课题都与图像、人工智能，尤其是深度学习有关。现在我来汇报一下最新进展。1AI遇上量子化学分子由原子和原子间的化学键组成。例如，在分子中，原子用点表示，分子用线表示。因此可以以二维图形的形式呈现分子。在机器学习和数据挖掘领域，图计算是一个老生常谈的话题。然而，转向分子领域也面临着新的挑战：二维图形的形式无法充分挖掘分子的性质。毕竟，分子实际上不是二维平面，它具有三维属性。它的结构不仅由点和线的性质决定，还由空间坐标、化学键角等决定。因此，在探究分子的功能时，需要关注其三维结构。如何高效利用分子的空间信息进行预测和生成模型？消息传递神经网络（MPNN）是一种常用的图神经网络框架。我们可以发现，这些方法可以概括为两个方程：聚合函数和节点更新函数。聚合函数可以聚合邻居节点的信息。当我们试图计算一个节点的信息时，我们基本上会考虑节点本身在前一个时间点的属性、中间节点的属性以及边界的信息。计算聚合函数后，需要使用节点更新函数。该步骤需要能够使用前面步骤的信息和属性来更新当前节点信息。但此举只是简单地考虑了节点和边界的特性。因此，我们最近的工作是尝试构建一个3D图形计算网络，以便能够获得完整的3D信息。一旦需要包含3D信息，计算网络将变得非常复杂，信息传递将变得低效。因此，我们希望在网络高效的同时，计算也变得等效和稳定。如果有一个分子，当你旋转分子时，它的许多2D属性可能不会改变，但3D信息不一定；因此，我们希望当分子的一个节点在预测和生成模型中发生旋转时，其量子属性也保持稳定。模型的预测功能是指预测给定分子的性质，例如，我们可以预测该分子是否具有作为抗生素的潜力。生成模型是指根据给定的性质生成/合成相应的新分子。目前，许多研究人员已经将3D属性考虑在内。最早的作品之一称为SchNet，它们将距离作为三维属性。也就是说，使用SchNet意味着要考虑边界和边界的长度。.还有一个最近的工作叫DimeNet。DimeNet比SchNet更进一步，因为它考虑了角度。例如，如果你有从j到i的信息，你需要计算mi，j，那么你不仅需要考虑节点信息，还需要考虑两个化学键之间的夹角。但是在化学中，我们发现仅有距离和几何是不够的。如上图，红色部分代表一个并不真正存在的平面，蓝色部分也是。分子具有几何形状，但仅仅知道三个化学键的距离和两个化学键的角度并不能完全确定分子的几何形状。我们想一想，d1、d2所决定的平面与d2、d3所决定的平面之间会有一个夹角φ。正是这个角度成为了上述模型中的不确定因素。因为即使两个键角相同，φ角也在不断变化，导致分子的几何形状发生变化。我们试图构建的是一个可以解决所有情况的完整几何框架，称为球形消息传递。为解决上述问题，需要考虑角度φ，即X与其投影之间的角度。对此的一个考虑是所呈现的分子必须是稳定的。例如，当分子旋转时，它们的属性（例如所有角度）不应改变。.在球形信息传递中，我们构建了一个球形坐标系，包括参考点、距离和扭曲角。但是这个模型并不是100%完美的。因为只考虑一个控件，所以在考虑其他节点时会出现不确定性。所以我们的工作并不完美但非常有效率。最近，有一个系统叫做GemNet。他们的想法是我们的??系统只使用节点A的邻居节点信息，不使用2-hop域信息。GemNet科学家认为，当您使用2-hop域信息时，系统会更加完善。确实，当你使用2-hop域信息时，角度信息会很好的融合，达到近乎完美的效果，但问题是一旦你使用2-hop信息，信息就会被更新包含大量的邻居nodes，整个信息更新步骤会变得异常复杂。相比之下，我们的系统虽然不是100%完美，但是效率更高，可以直观看出复杂度：n代表节点数，K是所有节点的平均自由度。实际上，我们的模型与更复杂的GemNet非常相似。下图清楚地显示了我们的模型可以表示和不能表示的内容。图a和b表示化学中称为手性的现象。事实上，这两个分子就像镜像一样。我们设计的网络可以区分这两种情况，而以前的许多方法不能。因为在我们的方法中，我们使用的是扭转角作为相对角，而在手性的例子中，两个q1的夹角分别为60°和90°。然而，在第二种情况下，q1的扭转角均为90°，因此我们的方法无法区分它们。第二种情况也被社区的同事指出来“望指正”，但是从化学意义上讲，这种情况发生的概率是非常非常低的，因为q2和q3是不同的原子，它们之间的距离和q1扭转角几乎不可能相同。所以我们认为，虽然我们的模型并没有100%覆盖所有的情况，但是不能覆盖的情况在自然界中是很难发生的。2AI遇上量子力学当我们开始关注量子力学时，薛定谔方程为我们提供了答案。如果你知道距离角和扭转角的值，你可以在方程中使用不同的函数，比如球谐函数和球贝塞尔函数，或者你可以使用其他基本函数来收集Θ值，最后得到一个特征向量.这是一个具有物理意义的特征向量，可以用在实际的信息传递中。下图是系统搭建过程。有一个输入模块，一个交互模块，将扭转角度和距离信息作为输入，这个交互模块可能会重新计算很多次，这个重复的次数取决于你有多少数据。最后是输出模块，有了这个模块，可以在一些事件中使用信息传递，比如公开催化剂挑战。OpenCatalystChallenge是由FacebookAI和CMU发起的一项竞赛。比赛的目的是利用新的大规模分子数据来预测热力学数据。在催化剂发现领域，这些目标分子通常比较大，每个分子的平均结构结构为80个原子。于是他们根据训练和测试的关系将数据集分成了四组。评分是根据每个绝对误差的平均值来评估系统可以测量的最佳质量。每行代表一个模型，来自一家使用模型研究分子的公司的CGCNN，以及SchNet、DimeNet和GemNet。可以看到，在所有的系统中，SphereNet都能占据非常有竞争力的位置。上图是另一个数据集QM9的结果。这是一个相对较小的数据集。每列代表一个量子属性，每一行代表一种预测方法。从表中，您可以看到每种方法在不同属性上的平均误差。我们的系统在其他数据集上也取得了成功，例如MD17，这是一个小得多的数据集。正如我们提到的，因为GemNet使用2-hop数据，它需要更多的计算能力，所以它只能用于较小的数据集。从上图中可以看出，即使在较小的数据集中，我们的系统的性能也略好于DimeNet，并且与GemNet的性能相似，但GemNet的计算成本更高。下图计算了消耗的对比。截至目前，我们的计算消耗远小于两代GemNet计算。下图显示了系统的过滤器。可以看出，每一行代表的分子具有不同的扭转角，并且在很多情况下我们的过滤器在不同的扭转角下显示出非常不同的结果，这也证实了扭转角参数对于捕获不同的分子模式非常重要。简单总结一下，我们的想法是尽量完整的展示分子的三维信息，所以我们搭建了SphereNet框架。并且该框架在理论上几乎是完美的并且非常高效。从实际效果来看，我们的框架可能已经100%覆盖了，我们在这个方向上已经取得了很大的进步。目前，相关工作已经开源并设计为“diveintographs”库。特别是，对于分子研究应用，我们有一个名为“分子X”的专用库。如果你关注KDD比赛，你就会知道我们是图神经网络计算领域的领导者之一，我们还参加了针对Covid-19的AICures公开挑战赛。目前我们在AUCROC和AUPRC中都排名第一。因此，我们的工作主要是开发新的图像处理技术，以解决基础科学领域，特别是量子化学、量子物理和材料科学领域的问题。我的团队开发了计算方法、开源软件库，并在会议和期刊上发表了我们的成果。同时，我们也参加了一些公开的挑战赛，比如KDD杯。我们的研究处于人工智能和量子物理学的交叉点，而薛定谔方程正是基于此。相应的研究费用非常昂贵。如果构建粒子系统，求解特征值问题需要庞大的算力支持。但量子物理与人工智能计算的结合将是一个非常热门的领域。目前，该领域仍处于探索阶段。

上一篇：Linux下安装SQLServer2019的方法

下一篇：12个用于日常编程的杀手级Python代码段

ACM特聘会员季水旺：量子化学与物理的深度学习相关文章