当前位置: 首页 > 科技观察

三体人有救了!深度学习解决三体问题

时间:2023-03-15 14:19:04 科技观察

本文转载自公众号《读书芯》(ID:AI_Discovery)近十年来,深度学习助推了诸多领域的最新发展。Deepmind在蛋白质折叠预测方面的出色表现以及斯坦福大学学生研究蛋白质复合物结合的项目都是使用深度学习进行细微研究的例子。但不仅如此,深度学习的应用已经扩散到浩瀚的宇宙。还记得连强大的三体人都无法对付的三个太阳吗?没错,人工智能解决了。当然,这不是唯一的应用,对宇宙的研究无所不包。本文将从机器学习和基础科学的角度对项目的描述和影响进行评分,但是,本文将根据主观兴趣而不是引用指标来评判。且看AI如何在更远的天空大显身手!人工智能解决宇宙学中的三体问题1.(Greenetal.,2019)Overview:Summary:Trainingmulti-layerperceptrontopredictsimpleFuturestatesinathree-bodyproblemsimulation.描述:4/3三重浓缩咖啡。简而言之,该项目的范围从可以解决困扰艾萨克·牛顿的复杂三体问题的人工智能,到以十亿倍的速度解决三体问题的神经网络。图片来源:ambrozewicz这种描述源于研究论文中的一种描述性方法,这种方法似乎是专门为吸引专业领域以外的读者而设计的。由于很少有人同时掌握深度学习和n体轨道力学,读者很容易被不熟悉的细节所吸引而漏掉重点。影响(机器学习):3/10密集层。在大型卷积神经网络无处不在的时代,使用深度多层感知器很有趣。影响(物理):3/n大质量物体。模型:具有ReLU激活的10层全连接神经网络。输入:三体之一的起始位置和目标时间t。输出:三个粒子中的两个在时间t的状态。第三个粒子位置由坐标参考系统反映。代码:https://github.com/pgbreen/NVM(只使用预训练好的模型权重进行推理)2.详细解释人工智能如何解决宇宙学中的三体问题在经典轨道力学中,预测两个重力物体组成单个系统的未来状态相对容易。添加一个额外的对象,你就会遇到著名的三体问题。这是一个典型的例子,说明看似简单的系统的动态交互是如何产生混沌的。混沌系统的一个特征是它们对初始条件表现出极度敏感,并且它们的行为似乎是随机的。这些状态很难预测,混沌系统演化的时间越长,就越难预测,因为之前的误差会累积。这就是为什么智能体在实心极点上学习比在连接极点上学习容易得多:像双摆这样的混沌系统很难预测和控制就像强化学习智能体努力控制双摆一样,科学家们也发现很难预测像三体问题这样的混沌系统的未来状态。想通过蛮力进行计算吗?是的,但并不总是很清楚需要多少数值精度,而且它可能是资源密集型的。作者使用10层多层感知器从三体轨道问题预测未来状态。训练数据由名为Brutus的强力数值模拟器计算得出。我喜欢看到“老式的”多层感知器,欣赏用于不同训练超参数和不同架构的代码会很有趣。不幸的是,可用的公共代码不提供任何培训工具。作者同意最近的怀疑,因为该论文的主张得到了非常狭窄和简化的用例的支持,不太可能轻易推广到更复杂的情况。但要补充的是,结果并不像他们宣传的那样引人注目。当模型被训练来预测更远的未来时,它的性能显着下降,平均绝对误差在0.01到0.2之间。当所讨论的无单位数几乎总是在-1和+1之间时,这些错误会很大。训练网络以进一步预测未来也会导致训练集过度拟合,这是讨论中未解决的问题。来源:radiichina最有价值领域:用深度学习发现更多系外行星1.(Dattiloetal.,2019)Overviewofmachinelearninghowhelpdiscovernewplanets摘要:开普勒太空望远镜在2013年发生故障,导致大量嘈杂的数据.研究人员对AstroNet-K2(之前模型AstroNet的修改版)进行了训练,以利用新的嘈杂数据并发现了两颗新的系外行星。这些行星通过后续观测得到证实。描述:1/3份浓缩咖啡。《麻省理工学院技术评论》的文章是有道理的,没有对项目做出夸大或不切实际的评价,但有时却忽略了AstroNet-K2是基于一年前发布的AstroNet项目。影响(机器学习):4/8卷积滤波器。AstroNet和AstroNet-K2之间的差异似乎在于超参数搜索和不同的数据集。影响(系外行星天文学):2/1076已知[超级地球](https://en.wikipedia.org/wiki/File:Size_of_Kepler_Planet_Candidates.jpg)由AstroNet-K2发现并通过其他观测验证。笔者认为,这个从本科开始的研究项目取得了非常有意义的成果。模型:两个独立的卷积臂从输入数据中提取特征。这些卷积层的输出被馈送到输出最终预测的四个完全连接的层。输入:来自开普勒望远镜K2运行的一维光变曲线。输出:给定信号由凌日系外行星引起的概率。代码:https://github.com/aedattilo/models_K22。详细解释机器学习如何发现新行星开普勒是一种天基望远镜,旨在研究太阳系外的行星,即系外行星。1995年,迪迪埃·奎洛兹(DidierQueloz)和米歇尔·马约尔(MichelMayor)发现了第一颗围绕像我们这样的恒星运行的系外行星,他们因此获得了2019年诺贝尔物理学奖。资料来源:unsplash在2009年开普勒发射升空十多年后,已知的系外行星总数还不到400颗。这台现已停产的望远镜于2009年开始运行,发现了1000多颗新的系外行星,直到用于精确指向的反作用轮组件2013年失败。这标志着任务主要阶段的结束。一些巧妙的修改让望远镜开始了它的第二个数据收集阶段,称为K2。来自K2的数据嘈杂且仅限于80天或更短的连续观察。这些限制对于在数千个假设的行星信号中识别有前途的候选行星非常具有挑战性,而卷积神经网络(AstroNet)已经很好地处理了这一任务,该网络处理了来自原始数据收集阶段的开普勒数据。德克萨斯大学奥斯汀分校的研究人员决定尝试相同的方法,并从AstroNet-K2的架构中派生出AstroNet-K2来对K2行星信号进行排序。经过训练,AstroNet-K2在测试集中识别已确认系外行星的准确率为98%,误报率较低。作者认为这种性能足以用作需要人工跟踪但尚未完全自动化的分析工具。该论文指出:虽然我们网络的性能还没有达到生成全自动和统一候选行星列表所需的水平,但它可以作为概念证明。-(Dattilo等人,2019年)本文授予AstroNet-K2令人垂涎的“最佳价值”奖,以表彰其取得重大科学成就。与本文列表中的其他两个项目更多的是概念论证不同,这个项目带来了实际的科学进步,在已知系外行星目录中添加了两个新的确认条目:EPIC246151543b和EPIC246078672b。除了K2数据固有的挑战外,行星信号因火星穿过观测窗口和安全模式事件导致的5天数据缺失而进一步混乱。来源:unsplash这是有效机器学习的一个很好的例子:作者采用了一个有据可查的卷积神经网络并对其进行了修改以在给定数据上表现良好,在没有重新发明的情况下,从困难的观察运行中添加了一些新发现。值得注意的是,这项研究的主要作者安妮·达蒂洛(AnneDattilo)在这项工作完成时还是一名本科生。对于本科生研究项目来说,这是一个相当不错的结果。作者使用开源软件以及以前开发的架构,强调深度学习正处于高级准备阶段。该技术尚未完全成熟到无处不在,但工具已经准备就绪并可以应用。CosmoGAN:AGenerativeAdversarialNetworkMethodforGravitationalLensing1.(Mustafaetal.,2019)概述摘要:宇宙中存在一些缺失的质量,我们称之为暗物质。来自这个缺失质量的引力使光线弯曲,宇宙学家可以根据光线的扭曲方式推断出暗物质的位置。研究人员训练了擅长制作逼真图像的深度卷积生成对抗网络,以制作与暗物质分布相关的数据图像。描述:1/3份浓缩咖啡。基本上所有关于这篇论文的新闻报道都来自劳伦斯伯克利国家实验室,这项工作就是在那里进行的。因此,这些报告并不过分夸大或古怪,尽管对CosmoGAN实际用途的描述是模糊的(并且该论文在这方面也不是很清楚)。我最喜欢的标题是CosmosScientistsSimplyBuildaMapofDarkMatterUsingNeuralNetworks。影响(机器学习):6/64潜在空间随机变量。这是一个普通的DCGAN,在模拟引力弱透镜数据上训练。影响(宇宙学):十分之一的质量不可观测。模型:CosmoGAN是一个DCGAN。每个网络有4层,但由于卷积滤波器较少,生成器的参数(1230万)大约是判别器(440万)的3倍。参数视差是为了稳定训练,防止判别器偏离生成器。输入:64unitlatentvector(generator),由CosmoGAN(numericalphysicssimulator)生成模拟的弱透镜会聚图的二维图像,可以对应暗物质分布(discriminator),与暗物质分布(鉴别器)比较。输出:可能的收敛图(生成器),或给定图像是真实(模拟)收敛图(鉴别器)的概率代码:https://github.com/MustafaMustafa/cosmoGAN2。良好的引力透镜暗物质是一种相对神秘的物质形式,占(普遍认为)宇宙质量的很大一部分(约85%)。“黑暗”指的是这种物质形式在正常观察中是看不见的,只能从引力效应中推断出来,就像维拉鲁宾在1960年代观察到的银河系旋转速度的差异。暗物质研究中的一个基本可观察因素是引力透镜效应,其中大质量物体扭曲来自更远物体的光。当透镜效应是由不可见的暗物质引起时,这就变成了一个需要大量模拟才能解决的困难反演问题。来源:unsplash《如果你想从零开始做一个苹果派,你必须先发明宇宙》(CarlSagan,Cosmos,《Carl Sagan, 宇宙》)。研究暗物质的存在也是如此:基于引力透镜观测构建暗物质地图的标准方法是创建一个(虚拟)宇宙。众所周知,创建宇宙的计算成本很高,与此同时,测试高度模拟的宇宙是否与观测结果一致,极大地限制了可以完成的科学工作量。当数据丰富而缺乏足够的计算时,科学家们会寻找方法来开发替代模型,这些模型可以解释这些数据,而不必每次都建立一个全新的宇宙。CosmoGAN就是这样一种方法,它利用现代深度学习生成网络来估计引力透镜数据的收敛图。由于Goodfellow等人。自2014年提出GAN以来,已经走过了漫长的道路。GAN框架是生成模型的一个(现在相当多样化的)利基市场,它将生成网络与判别或伪造检测网络进行比较。这两个网络相互对抗,产生越来越逼真的合成数据,而鉴别器在检测假货方面变得更好。这种交互提供了纯GAN训练循??环中唯一必要的训练信号(尽管conditionalGANs等变体可能会使用额外的数据),因此在GAN训练中平衡两个网络是一门艺术,众所周知,当这种平衡是不平衡,GAN容易出现不稳定的问题。GAN很难训练和解释,但参与实践的计算宇宙学家数量之多可能让人有点惊讶。然而,CosmoGAN的范围相当有限。生成器学习模拟统计上真实的收敛地图图像,但这些图像独立于潜在空间中的随机输入。在这种情况下,像古老的edges2cats演示背后的pix2pix方案这样的条件GAN更有意义。也就是说,生成一个会聚图很有用,它可以合理地解释给定天文图像中的透镜效应,这可以通过额外的观察来验证。另外,生成器产生的收敛图是二维的,但暗物质实际上会分布在三维中。根据作者的说法,其中一些限制将在未来的工作中得到解决。比如“可控GAN”的想法听起来和上面提到的conditionalGAN很像,他们确实打算针对体积暗物质分布做一个3D版本。如果是这样,该项目的85%目前是不可观察的。毫无疑问,这三个应用让我们看到了机器学习在宇宙学中的无限潜力,带来了令人难以置信的发现和突破。其实并没有那么难,不需要胆大包天去科学家没去过的地方,只要巧妙地实施一种经过验证的技术,将其适应并应用到新的数据集,就可以做出发现,即使只是使用模拟数据的概念探索。但另一个问题是过于夸张,无论是媒体报道还是论文中的描述,这种夸张的描述都困扰着人工智能的发展。过度描述会产生无效的反馈循环,从而导致经济/技术泡沫和研究资源的低效分配。这需要紧急关注。