当前位置: 首页 > 科技观察

有AI学习控制核聚变反应堆,来自DeepMind,发表于今日Nature

时间:2023-03-16 21:25:25 科技观察

本文经AI新媒体量子比特(公众号ID:QbitAI)授权转载,转载请联系出处。在DeepMind在蛋白质折叠问题上取得巨大突破后,目标又转向了核聚变。最近,它开发了世界上第一个深度强化学习人工智能,可以在模拟环境和真实核聚变装置(托卡马克)中实现等离子体的自主控制。不要担心不熟悉的术语,稍后将对其进行解释。这比传统的计算机控制更高效、更精确,结果今天发表在《自然》杂志上。作为强化学习最具挑战性的应用之一,这一成果对于加速可控核聚变也具有重要意义。用强化学习控制聚变反应聚变是未来最有前途的清洁能源:一个原子核就能产生巨大的能量,除了相对少量的放射性废物外,不会产生任何温室气体(可以在一个世纪内分解)。但是在地球上实现这种反应非常困难,需要极端的高温和高压条件才能产生裸原子核的“等离子体”。磁约束聚变装置——托卡马克(tokamak),是最有前途的实现方法之一。它是一个圆形反应堆,可以在超过1亿摄氏度的环境中将氢过热成等离子体状态。△托卡马克内部图片因为等离子体温度太高,任何物质都装不下,必须靠强磁场悬浮在托卡马克内部。操作电磁线圈时必须小心,因为撞到墙上会损坏容器并减慢聚变反应。一个托卡马克装置共有19个磁线圈,线圈及其电压每秒需要调整数千次。在传统安装中,每个线圈都配备一个单独的控制器。每当研究人员想要改变等离子体的结构,尝试不同的形状以产生更高的能量时,都需要大量的工程和设计工作。DeepMind的强化学习系统可以一次控制所有19个线圈,精确操控等离子体自主呈现各种形状,呈现出科学家一直在探索的产生更高能量的新构型:例如第二个“负三角”下图”和第四个“雪花”(一种通过将废能分散到托卡马克壁上的不同接触点来降低冷却成本的形状)。除了第一个“液滴”,这也是第一次在托卡马克装置内同时稳定两种等离子体。该AI系统由DeepMind与位于洛桑的瑞士联邦理工学院等离子中心的物理学家共同开发。瑞士中心的一名成员表示:“这里的一些形状已经接近了设备的极限,这很可能会对系统造成损害。如果不是AI给予的信心,我们可能不会冒这个风险.“人工智能是在模拟器中通过反复试验进行训练的。模拟器在聚变研究中是必不可少的,因为目前正在运行的反应堆一次最多只能维持等离子体几秒钟,之后需要时间来重置。但一个问题是:模拟器并没有准确捕捉到真实托卡马克中存在的所有变量,是否可以迁移到真实托卡马克中?对此,DeepMind研究人员表示,通过使用随机数来表示足以训练一个灵活的另一个问题:为了保持对托卡马克内部等离子体的控制,控制算法必须能够做出极快的决策,在短短几秒钟内对磁场做出调整。但是许多人工智能系统需要很长时间才能做出预测高速。为此,该团队首先训练了一个大型神经网络,该网络可以对磁场变化如何塑造等离子体做出长期预测。然后使用该网络来训练一个小得多的系统来学习执行第一个网络推荐的决策的最佳方法。这个更小的网络可以在不到50微秒的时间内直接与托卡马克控制系统交互(可以在几分之一秒内做出5000万个决定)。最后,作者表示,虽然这一成就意义重大,但这只是人类实现可控核聚变的一小步。例如,要实现一秒钟的实时运行,需要模拟托卡马克几个小时,而且它的条件每天都可能发生变化,算法需要在各个方面进行改进。另外,还要看现在的系统能否转移到更大的托卡马克装置上。FusionEnergy什么时候能商用还很难说,但DeepMind断言人工智能可以加速这个过程。不知道它能否像AlphaFold一样,再次在核聚变领域取得惊人的新成果。我们拭目以待。(也有网友担心万一控制核聚变的AI哪天想不起来……)论文地址:https://www.nature.com/articles/s41586-021-04301-9