当前位置: 首页 > 科技观察

AI 正在引领一场新型科学革命

时间:2023-03-14 00:28:03 科技观察

AI正在引领一场新型科学革命自1950年代发现DNA以来,生物学家一直试图将基因序列的长度与一系列细胞成分和蛋白质合成过程联系起来,例如,特定基因的mRNA转录为现在著名的mRNA疫苗提供动力的抗体。尽管自从发现DNA以来,基因组的测序和理解取得了一些进展,但仍然缺少一个重要的环节。生物学家缺乏一种仅使用其DNA或RNA源序列来准确有效地预测未知蛋白质三维形状的方法。在生物学中,结构决定功能。蛋白质在细胞中的作用取决于它的形式。空心圆柱结构有利于形成良好的膜受体,而U形酶则在峡湾状空腔中催化化学反应。能够预测甚至设计蛋白质结构将是对人类疾病理解的飞跃,并为一系列疾病开辟新的治疗方法。但70多年来,科学家们一直在使用缓慢的方法梳理出蛋白质结构,这些方法使计算机不堪重负,并且主要依赖于他们自己的猜测。尽管生物学家知道构成每种蛋白质的每种氨基酸的DNA代码长度,但他们缺乏可重复、可推广的公式来解决所谓的“蛋白质折叠问题”。他们需要系统地了解任何一串氨基酸,一旦连接起来,如何折叠成三维形状,以解开浩瀚的蛋白质宇宙。来源:DeepMind2020年,谷歌人工智能团队DeepMind宣布其算法AlphaFold解决了蛋白质折叠问题。起初,大多数人都对这一惊人的突破感到兴奋,而科学家们准备测试新工具的意愿也激发了一些兴趣。这不就是几年前推出AlphaGo,让它在中国战略游戏围棋上击败世界冠军的同一家公司吗?掌握比国际象棋更复杂的游戏虽然困难,但与蛋白质折叠问题相比感觉微不足道。但AlphaFold通过一年一度的竞赛证明了它的科学勇气,在该竞赛中,生物学家团队仅根据其基因序列猜测蛋白质的结构。该算法远远优于其人类竞争对手,将预测最终形状的分数发布在一埃(单个原子的宽度)以内。不久之后,AlphaFold通过了它的第一次真实世界测试,正确预测了SARS-CoV-2“刺突”蛋白的形状,该病毒显然是疫苗的目标膜受体。资料来源:《Nature》AlphaFold的成功很快变得不容忽视,科学家们开始在实验室中试用该算法。2021年,《科学》杂志将AlphaFold的开源版本评为“年度最佳方法”。“蛋白质折叠的突破是科学成就和未来研究中最伟大的突破之一,”《科学》杂志的生物化学家和主编H.HoldenThorp在一篇社论中写道。如今,AlphaFold的预测相当准确,经过70多年的沉思,蛋白质折叠问题算是解决了。虽然蛋白质折叠问题可能是迄今为止AI在科学领域最引人注目的成就,但AI正在悄悄地在许多科学领域做出新发现。人工智能还通过加速发现过程并为科学家提供新的调查工具来改变科学研究的方法。该技术升级了显微镜和基因组测序仪等研究支柱,为仪器增加了新的技术能力,使它们更加强大。AI驱动的药物设计和引力波探测器为科学家提供了探测和控制自然世界的新工具。在实验室之外,人工智能还可以部署先进的模拟和推理系统来开发现实世界的模型,并使用它们来检验假设。随着科学方法的广泛应用,人工智能正在通过突破性发现、新的和增强的工具以及提高科学过程速度和准确性的自动化方法引发科学革命。资料来源:人工智能辅助超分辨率宇宙学模拟除了蛋白质折叠问题,人工智能在从宇宙学和化学到半导体设计和材料科学的许多领域的发现中都展示了其科学价值。例如,DeepMind的团队设计了另一种计算分子电子密度的算法,击败了科学家们依赖了60年的捷径方法。了解给定分子的电子密度对于了解材料的物理和化学性质大有裨益。但由于电子受量子力学支配,计算特定电子的密度需要复杂的方程式,这很快就变成了一场计算噩梦。相反,科学家们使用材料的平均电子密度作为指导,回避了困难的量子计算。然而,DeepMind的算法直接解决了问题的量子方面,并且已被证明比捷径法更准确。与蛋白质折叠问题类似,AI能够超越科学家们使用了几十年的方法,并开辟了准确预测物理和化学性质的新方法。人工智能对科学的影响在四个关键方面超越了技术的新发现。首先,人工智能可以快速阅读科学文献,从而理解科学的基本规律、事实和方程式,帮助科学家管理充斥各个领域的海量论文和数据。仅在2020年,就发表了100,000到180,000篇关于COVID-19的科学期刊文章。虽然研究人员关注像持续的全球大流行这样紧迫的事情是有道理的,但在最大的生物医学数据库中,关于COVID-19的论文仅占文章总数的4-6%。由此产生的论文和数据浪潮远远超出了任何科学家的阅读能力,使研究人员无法真正跟上其领域的创新步伐。这就是人工智能的用武之地。例如,在药物化学领域,Insilico正在进入一种完全由AI设计的药物的I期临床试验,该药物用于一种称为特发性肺纤维化(IPF)的疾病。Insilico的算法通过阅读医学文献来寻找潜在的蛋白质、细胞或病原体以进行精确定位,从而选择疾病目标。一旦选择了目标,算法就可以设计治疗方法来治愈疾病。Insilico开发了一个用于药物发现的端到端AI平台,该平台自动掌握该领域的最新结果和数据,因此科学家可以随时了解最新情况而不会不知所措。来源:图片由美国阿贡国家实验室领导的计算设施、可视化和数据分析组提供。其次,随着仪器越来越精密,对自然奥秘的探索逐渐深入,科学家们需要面对海量的数据。人工智能也可以在这里发挥重要作用。阿贡国家实验室(ANL)的一组科学家开发了一种可以理解引力波的算法,引力波是爱因斯坦预测但直到2015年才被发现的时空连续体结构中的涟漪。该算法在七分钟内处理了一个月的数据,为引力波探测提供了一种加速、可扩展和可重复的方法。该算法可以在标准图形处理单元(GPU)上运行,无需专门设备来收集和解释引力波数据。ANL数据科学与学习(DSL)主管IanFoster表示:“我对这个项目感到非常兴奋,它展示了如何使用正确的工具将人工智能方法自然地集成到科学家的工作流程中,从而使他们更快更有效率。把工作做好,增强而不是取代人类智能。”有了人工智能,曾经的海量数据现在变成了受控的信息流,加速了科学发展的步伐。第三,人工智能一直在悄悄升级实验室的一些长期支柱:显微镜和DNA测序仪。在ANL,研究人员已经找到了一种方法来增加电子显微镜可以检索的样本信息量,同时提高仪器的分辨率和灵敏度。与许多人在高中或大学生物课上熟悉的显微镜不同,电子显微镜不依赖于在可见光下构建图像。相反,顾名思义,他们使用电子,这使他们能够以比其他显微镜更高的分辨率和更精细的结构拍摄图像。ANL研究人员设计了一种使用AI在电子上记录相位数据的方法可以提供有关样品的物理和化学特性的关键信息的显微镜,增加了功率和上限仪器的能力。同样,在所谓的光场显微镜中发现了另一种AI升级,它可以拍摄运动的高清3D图像。重建视频通常需要科学家几天的时间,但有了人工智能,处理这种高分辨率运动数据所需的时间减少到几秒钟,而不会丢失分辨率或细节。DNA测序仪是基因组时代的主力军,人工智能也对其进行了增强。今年早些时候,一组科学家使用人工智能将DNA测序所需的时间减半,并希望很快再次减半。简而言之,人工智能正在升级科学最基本的工具。资料来源:《Science》最后,AI在实验室中真正大放异彩的地方在于模拟复杂系统,使其成为基础科学研究中越来越标准的工具。去年,研究人员通过在物理学、天文学、地质学和气候科学等十个科学领域建立开创性模拟,展示了人工智能的多学科能力。所有10个模拟器都由同一个称为DENSE的深度神经网络训练,这导致模拟比其他方法快10亿倍,同时保持准确性。至关重要的是,该模拟器可用于解决“逆向问题”,研究人员知道结果但想找出导致输出的变量。AI擅长这种计算,可以很容易地找出通往特定答案的路径。虽然模拟很有用,但研究人员还希望确保他们的模型在现实世界中有效。两家领先的科技公司,谷歌和三星,最近转向人工智能来规划他们的一些芯片的放置。谷歌得出结论,人工智能设计的芯片“在所有关键指标上都优于或可与人工生产的芯片相媲美,包括功耗、性能和芯片面积”。更进一步,该公司正在使用AI来设计其下一代AI加速器(TPU是AI制造的芯片,而不是标准的CPU或GPU)。同样,三星依靠AI芯片设计软件创建了Exynos,这是一种用于可穿戴设备和汽车的芯片。凭借其高保真模拟,人工智能为科学家们提供了一个强大的工具,彻底改变了他们对自然世界进行建模和实验的方式。资料来源:AI支持的COVID-19患者快速诊断没有比COVID-19大流行更好的AI建模能力的真实世界测试。首先,蛋白质折叠算法AlphaFold正确预测了重要的“尖峰”蛋白质,展示了人工智能如何在未来的大流行病中加速疫苗或治疗的开发。但也许更令人印象深刻的是,在2020年夏天,日本科学家使用世界上最强大的超级计算机Fugaku来模拟COVID-19的空气传播。在深度神经网络和数千个GPU的支持下,Fugaku向世界提供了该病毒通过空气传播的确凿证据,并说服WHO相应地改变其控制COVID-19的指南(例如,面罩、通风和与他人在室内接触)).户外活动的风险)。在现实世界中,人工智能通过在危机期间为全球缓解战略提供信息来证明其价值。除了做出新发现并为科学武器库添加新工具外,人工智能还可以发现数据中的模式,做出可测试的预测,并使用它们将新证据纳入其模型,反映科学方法。哲学家卡尔波普尔普及了这样一种观点,即科学通过抛弃可以通过实验检验并证明是错误的可证伪假设来进步,而这种通过理论和实验来消除的过程是科学方法的一面旗帜。正如AI最近的一些突破所证明的那样,该技术还可以生成可以通过实验检验的假设,通过排除过程提供严格且可证伪的答案。DeepMind的电子密度模型通过近似科学过程并在预测和实验之间反复反馈,直到更好地掌握量子计算,从而击败了研究人员。AI解决了蛋白质折叠问题,方法是在数千种实验确定的蛋白质上测试其模型,改进猜测,并通过为更接近解决方案的分支赋予更高权重来修剪神经网络。在研究人员构建了一个开源版本的AlphaFold之后,其他科学家可以使用该模型来解开RNA结构如何折叠以及蛋白质如何组合在一起的谜团。资料来源:IndependentSE(3)EquivariantModelsforEnd-to-EndRigidDocking总的来说,了解蛋白质关联为强大的新药开发打开了大门,因为细胞中的许多反应都是蛋白质协作的结果。这两项进步开创了治疗设计的新时代,利用端到端的AI管道来定位疾病并设计精确的治疗方法。例如,华为人工智能实验室的一个研究团队使用该模型的一个版本自动生成针对目标感染的抗体。从药物设计到蛋白质结合,AI对自然界进行建模、分析和控制的能力只会不断提高。DeepMind的最新突破是将AI应用于控制和维持核聚变反应的问题。人工智能成功地控制了氢和氦的聚变反应,以创纪录的能量为宇宙中的每颗恒星提供动力,并发现了稳定等离子体的新形状。该实验是朝着开发可行的聚变能源迈出的重要一步,这种能源可以提供足够的可再生能源来为世界提供动力。这个案例突出了人工智能在科学中最有前途的应用之一:它看到了我们看不到的模式,并从不同但互补的角度分析了我们的环境。与研究人员合作并以科学方法为基础,人工智能可以使用支撑科学过程的迭代理论和实验来解决相同的探索性问题。科学最好被描述为对未知的探索。AI是这一旅程的合作伙伴,它以与我们不同的方式感知自然世界及其未探索的部分,开辟了理解和利用世界力量的新途径。正如索尼研究总监HiroakiKitano所描述的那样,科学发现是一个“搜索”问题,它基于人工智能可以模拟的假设、实验和数据的自我修正系统。但在搜索过程中,人工智能不仅仅是科学家和合作伙伴手中的强大工具。该技术也在改变科学过程,使人们可以使用它完成的任务自动化并增加。人工智能正在引领一场新的科学革命。在许多领域取得了显着突破,开辟了科学研究新途径,加快了科技创新步伐。作为合作伙伴,AI将与科学家一起探索更多无穷无尽的科学前沿。