众所周知,核聚变比现在普遍使用的核裂变方法更安全、更环保。然而,如何控制核聚变是一个大问题。迄今为止,人们只能在实验室中对核聚变反应进行应用研究。得益于人工智能,核聚变现在似乎比以往任何时候都更接近实际应用。瑞士洛桑联邦理工学院(EPFL)的研究人员将他们在等离子体物理和控制方法方面的丰富经验与谷歌子公司DeepMind的人工智能研究和技术相结合。获得一种新的基于深度强化学习的等离子体配置磁控制方法。该方法的详细信息发表在《自然》杂志上,并应用于瑞士等离子体中心(SPC:SwissPlasmaCenter)研究机构的真实等离子体系统,可变配置托卡马克(TCV:可变配置托卡马克).托卡马克(MagneticConfinementFusion:目前被认为是最有前途的可控聚变形式)是一种甜甜圈形状的聚变研究装置,它利用强磁场将等离子体限制在比太阳核心还小的区域(数亿摄氏度))在更高的温度下。像太阳一样,极端温度会促进氢原子之间的核聚变。SPC的托卡马克装置可实现可变等离子体配置(即托卡马克装置内等离子体的形状和位置),可用于探索新的发电方式。以前这个过程本身就不稳定,会出现一些问题。包括如何让等离子体不脱离允许等离子体形成的一系列线圈,以及如何让等离子体保持原位。TCV的19个独立线圈必须通过独立的控制系统配置进行连续校准。控制器使用一种算法来实时估计等离子体的特性,使电压适应磁铁,从而达到预期的效果。这些等离子控制系统对于防止等离子到达托卡马克装置的外壁至关重要,因为它会阻止反应并损坏设备本身。幸运的是,控制系统配置可以在用于托卡马克之前进行模拟。但即便如此,仍需要进行冗长的计算以确定控制系统中每个变量的正确值。这就是与DeepMind的联合研究项目的用武之地。DeepMind开发了一种人工智能算法,在SPC的模拟器上进行训练,大大减少了对这些模拟进行建模所需的计算时间和能量,同时只用一个控制器就可以操纵等离子体.该控制器是一个单一的神经网络,可同时协调所有19个线圈,同时了解哪些电压会产生特定的等离子体配置。训练这样的算法意味着模拟各种控制策略并收集数据或“经验”。该算法可以创建“以生成所需的等离子体配置”的控制策略,其中涉及运行多个控制设置的算法并分析生成的等离子体配置。然后,通过让算法根据正确的设置生成特定的等离子体构型,到真正的托卡马克装置中进行构型调整。模拟很有希望。根据EPFL发布的消息,DeepMind的人工智能算法“能够创建和维护各种等离子体形状和高级配置,包括同时维护容器中的两个独立等离子体。”然后将该算法用于实际的托卡马克,以测试其在现实世界中的应用,这与验证他们的结果一样有希望。最初的合作始于DeepMind的hackathon(一种黑客马拉松,一种计算机技术的竞赛方式),正好提到了托卡马克磁线圈控制的问题。DeepMind立即对在核聚变等领域测试其AI技术的前景产生了兴趣,尤其是在托卡马克等现实世界系统上。此次合作的成功表明人工智能具有加速融合科学发展的潜力。DeepMind指出,他们的方法可用于设计和扩展新的托卡马克及其控制器。他们还预测,强化学习(RL)将是一种“变革性技术”,可用于控制其他工业和科学应用中的复杂机器。至于人类向核聚变能源的发展,我们可能还没有像《回到未来》那样的“核聚变家用能源反应堆”,但人工智能或许是实现这一目标的有力帮手。
