当前位置: 首页 > 科技观察

微软研究院刘铁岩:AIforScience:追寻人类智能最光辉的一面

时间:2023-03-16 01:48:02 科技观察

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。在过去的一年里,AIforScience的技术成果密集爆发,在生物医学、材料、物理、化学甚至数学等领域发挥着越来越重要的作用。潜力巨大。AIforScience背后的价值是什么?带着这样的疑问,微软研究院科学情报中心亚洲区负责人、微软亚洲研究院副院长刘铁炎及其团队进行了不懈的追寻。去年,刘铁炎团队发布了Graphormer分子模拟模型。在MEET2023智能未来大会上,刘铁炎全面介绍了他对AI4Science的理解,以及AI4Science作为科学发现的第五范式如何与实证范式、理论范式、计算范式、数据驱动范式相互促进。科研事业快速发展。为充分体现刘铁岩的分享与思考,在不改变原意的基础上,量子比特对演讲内容进行了编辑整理。关于MEET智能未来大会:MEET大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿技术的落地与行业应用。今年,数十家主流媒体和直播平台对MEET2023大会进行了报道和直播,吸引了超过300万行业用户在线参与,全网总曝光量超过2000万。演讲要点人工智能还没有体现出人类智能最辉煌的一面——认识世界、改造世界。AIforScience堪称第五范式。使用AI手段的进一步目的是纠正对现有物理方程的理解,发现新的科学规律,实现科研闭环。AIforScience将对自然科学产生巨大影响,尤其是在解释生命奥秘和确保环境可持续发展方面。(以下为刘铁炎演讲全文)AIforScience:FifthParadigm过去10年,AI发展迅速,在很多任务上已经可以与人类媲美。而近年来以GPT-3、DALLE2为代表的大模型更是让人惊叹。比如现在大家都很关注的ChatGPT,让我们感受到通用人工智能越来越接近日常生活。然而,这些成就主要集中在感知和认知上,并没有体现出人类智慧最辉煌的一面,即认识世界和改造世界。如果放在科学显微镜下,你会发现,我们之所以成为人,成为生物,是数十亿个细胞乃至更多微观粒子相互作用的结果;而如果你戴上科学望远镜,你就会发现,我们人类不过是地球上数百万物种中的一个,而地球在浩瀚的宇宙中也是微不足道的沧海一粟。因此,无论从微观世界还是宏观世界来看,我们人类都是非常渺小的。我们不应该让人工智能一味地模仿人类的语音、视觉、语言等基本技能,而应该让人工智能拥有与人类一样的勇气和能力去认识和改造世界。认识世界,改造世界,是千百年来自然科学研究的终极目标。我在微软的前同事吉姆·格雷(JimGray)曾经写过一本书,深刻总结了科学发现的四种基本范式。第一种范式称为经验范式,它以经验观察为基础,是天才科学家对一切事物和现象的总结。例如,著名天文学家开普勒通过观察总结出天体规律:“所有行星绕太阳运行的轨道都是椭圆形的,太阳在所有椭圆形的共同焦点上”。第二范式是理论范式,数学家对经验进行数学抽象和推导,如描述经典力学的牛顿运动方程、描述电场和磁场关系的麦克斯韦方程等。第三范式是计算范例。随着计算机的发明,人们开始具备了求解复杂物理方程的能力。例如,通过有限元或有限差分法求解流体方程可以帮助人类对天气预报做出准确的预测。第四种范式是数据驱动范式。在这个过程中,ML(机器学习)扮演着非常重要的角色。人们使用ML方法来分析数据、寻找模式并做出预测。近年来,每个人都开始关注一种叫做AIforScience的新范式。它是前四种范式的有机结合,发挥了经验和理论的各自优势,融合了人工智能和计算科学。AIforScience是对科学发现更全面的理解,所以我们称之为科学发现的第五范式。为了更好地理解AIforScience,我们可以从图中所示的公式入手。首先,对于物理世界(绿色的X),我们可以用理论科学对其进行概括描述,我们可以用AI来加速这些理论方程的求解和推导。这对应黄色X(θ)所代表的部分,可以看作是AI版的第三范式。其次,我们需要承认,我们的科学知识还很有限,现有的理论无法完美解释所有的科学现象。换句话说,我们承认物理方程的解X(θ)与实际的物理世界X之间存在一个残差ε。这个残差表达了现有物理方程的边界,可以通过实验观察或由AI确定.使用,对应第四范式。当然,近年来AI领域的新发展,如RL(强化学习)、DL(深度学习)、大模型等,都会为第四范式提供新的加持。第三,通过AI手段从数据出发的目的不仅仅是为了发现一些具体的结果,更进一步帮助我们纠正对现有物理方程的认识,丰富我们的科学知识,让我们有机会发现新的科学规律,从而最终实现科研闭环,对应AI版的第一范式和第二范式。接下来,我们将对这三个方面进行更深入的探讨,并介绍我们团队的最新研究成果。形成科学发现的闭环一、如何用AI解决物理方程?传统数值解求解物理方程的效率是一个瓶颈。近年来,人们开始使用人工智能模型来更高效地求解物理方程。AI模型的训练数据可以来自传统的数值解,一旦训练成功,在求解新方程时可以节省大量时间。此外,近年来出现了物理知识训练,甚至不需要提前生成训练数据。它只需要在训练过程中动态验证AI模型的输出是否满足物理方程,定义损失函数即可。验证方程比求解方程要简单得多。在这个方向上,我们团队有一些最新的研究成果,例如发表在NeurIPS2021上的Graphormer模型,发表在国际期刊《流体物理》上的DeepVortexNet,在分子建模和气象模拟领域取得了国际领先地位分别。的结果。第二,如何利用人工智能从科学数据中发现有效信息?各种实验设备每年都会产生海量数据,但人类显然无法有效处理;每年发表近150万篇论文,但没有一个科学家有精力把它们全部看完。我和我的团队提出用AI的方法自动分析高能粒子碰撞的射流数据,在国际期刊《High-energy Physics》上提出了LorentzNet模型,将Lorentz变体内置到模型中,实现了在新粒子发现领域处于较高水平。与以前的工作相比,显着提高了准确性。我们还使用科学文献来训练SPT模型,以提取、总结和预测科学文献信息的科学知识。该模型最近在PubMed问答任务上首次达到了人类专家的水平。第三,如何从实验数据出发,利用人工智能发现新的物理方程,形成科学发现的闭环。例如物理学的守恒定律,一旦实验数据不满足守恒定律,往往意味着一些新的物理定律的存在。我们团队设计了双通道AI模型,包括基于拉格朗日神经网络的守恒通路和基于标准神经网络的非守恒通路,可以准确自发地从实验数据中学习到许多存在的规律。这项工作发表在PhysicalReview上,受到了广泛关注。我们相信,AIforScience将对自然科学产生巨大影响,尤其是在解释生命奥秘和确保环境可持续发展方面。沿着这两个方面,我们进行了很多探索,发表了一系列很有意思的论文,如果大家有兴趣可以参考一下。为了更好地推动AIforScience领域的快速发展,今年7月,微软研究院在全球范围内成立了一个新的研究机构,我们称之为MicrosoftResearchAI4Science或微软研究院科学情报中心。该研究中心旨在利用人工智能对分子动力学模拟、流体动力学模拟等重要科学计算工具进行颠覆性创新,推动解决人类关注的重大问题。我很荣幸作为该中心的创始成员之一,带领团队推动AIforScience的研究。我们也真诚地希望与