粒子物理中的标准模型已经成功描述了所有已知的基本粒子和控制整个宇宙的四大基本力中的三种(引力除外).而电磁力、强力(简称强电业)和弱力(简称弱力)这三种基本力,不仅控制着粒子的形成,还决定着粒子之间如何相互作用以及如何逐渐腐烂。然而,在此框架内研究粒子和核物理仍然非常困难,需要依赖大规模的数值研究。例如,《强力》中的许多问题都需要在十分之一甚至百分之一的质子大小的晶圆上进行动力学数值模拟,从而回答有关质子、中子和原子核基本特性的相关问题。“最终,我们在使用晶格场理论进行质子和核结构研究时遇到了计算限制,”物理学助理教授PialaShanahan说。“有很多有趣的问题,我们只知道如何在原则上解决,但即使是世界上最大的超级计算机也不足以提供必要的容量。”为了克服这些局限性,Shanahan领导了一个将理论物理学与机器学习模型相结合的小组。在最近发表于《物理评论快报》的论文《基于等变流的晶格场论采样》(Equivariantflow-basedsamplingforlatticegagetheory)中,他们展示了如何将将物理理论的对称性纳入机器学习和人工智能的框架,从而提供理论物理学导致更快的算法。Shanahan解释说,“我们使用机器学习不是为了分析大量数据,而是为了加速第一性原理理论,其方式是不会影响方法的严谨性。这项特殊的工作表明,我们可以构建一些对称的机器学习架构,并在当前的采样问题上实现数量级的加速。”Shanahan与麻省理工学院研究生GurtejKanwar和纽约大学的MichaelAlbergo共同发起了该项目。该项目,理论物理中心的博士后研究员DanielHackeet和DenisBoyda,纽约大学教授KyleCranmer,以及GoogleDeepMind团队中精通物理学的机器学习科学家SébastienRacanière和DaniloJimenezRezende也被吸引了。最近发表的论文旨在实现目前在计算上难以处理的理论物理学研究课题。作为一系列文章的一部分,Kanwar在论文中表示,“我们的目标是为理论物理领域的关键数值计算开发新算法。这些计算让我们深入了解粒子物理的标准模型(最基本的物质).Theinnerworkingsofthetheory).计算结果可以与粒子物理实验(如欧洲核子研究中心的大型强子对撞机)进行比较,带来重要的见解,同时更精确地约束模型,从而发现模型中的哪一部分的不能成立,需要扩展到更深层次的基本原理等。”研究未受扰动状态下粒子物理标准模型的唯一已知系统可控方法是基于真空中的量子涨落快照采样。通过测量波的特性,我们可以推断出粒子的特性及其碰撞的倾向。但Kanwar解释说,实施该技术面临许多挑战。“相关采样非常昂贵,我们正在尝试探索如何使用受物理原理启发的机器学习技术来提高样本收集的效率。机器学习在生成图像方面取得了很大进展。例如,Nvidia最近的工作是通过神经网络生成“假想”面孔的图像。如果将这些真空快照视为图像,相信它们也可以用类似的方式帮助我们解决研究问题。”Shanahan还补充说,“根据目前的量子快照采样方法,我们优化了一组模型,可以帮助我们从易采样空间过渡到目标空间:使用这个训练好的模型,我们只需要在空间中独立采样,然后模型转换采样方法,可以大大提高采样效率。具体来说,该小组引入了一个构建机器学习模型的框架,该框架完全尊重“规范对称性”,这是一种对称性原则at是高能物理研究的核心。作为原理验证,Shanahan及其同事使用了自己的框架来训练机器学习模型,在二维空间上模拟理论并将结果与??现有技术进行比较。可以看出其执行效率迎来了一个数量级的提升,同时也可以基于场论做出更准确的结果。预言。所有这些都为大大加快利用物理信息支持的机器学习技术对自然界基本力系统的研究工作铺平了道路。该小组还讨论了如何将机器学习应用于该技术应用简单的格场理论,并开发基于紧凑连通流形的新方法,这些方法可用于描述比标准模型更复杂的场景理论用例。现在,他们正在努力将这项技术扩展到计划中的最新计算。“通过我们过去一年的努力,我们已经证明将物理知识与机器学习技术相结合确实有希望,”Kanwar说。“我们正在积极考虑如何使用这种方法来实现完整模拟,从而解决剩余的障碍。”希望这些方法将在未来几年内首次用于大规??模计算。如果我们能成功克服这最后一道坎,我们在有限资源下的工作能力将大大增强,我热切期待在实际应用中进行探索。那些超出现有最佳物理理解范围的事物,为其建立了前所未有的新颖见解。”团队将这种基于物理信息的机器学习概念概括为“ab-initioAI”。这一概念也成为美国麻省理工学院最近成立的NSF人工智能和基础设施交互研究所(IAIFI)设定的关键主题。而沙纳汉本人在其中担任物理理论研究协调人。
