对于AI,有人幻想,有人偏见。人工智能作为一种工具和计算方式,可以有效学习现实世界的内在规律,并快速推理得出结果,兼顾准确性和性能。它已经对当今科学计算领域的研究范式产生了影响,并逐渐形成了AIforScience这一新兴研究领域,正在改变着科学探索的范式。那么,人工智能能帮助数学家吗?或许问这个问题会更好:“AI能辅助数学探索吗?物理学是科学的基础,数学是物理学的基础。物理学中有各种各样的方程,其中有相当一部分是微分方程。从理论上讲,可以计算出物质的宏观性质,如果所有的微分方程都可以求解,基本上整个物理世界都可以模拟出来,比如薛定谔方程就可以求解,这个方程在100年前就有了,但是难度很大求解这个方程。传统方法无法处理高维非线性复杂函数。不,不。它很慢,而且不好。正好,深度学习的神经网络可以提供帮助。它有什么优势?神经网络的能力是探索高维函数非常有效的解,换句话说,神经网络可以拟合高维复杂的函数,并快速推断到计算吃了这个函数的值。神经网络不仅可以快速推断(FastInference),而且推断的准确率“还可以”。注意,这里的“准确”不是“准确”。换句话说,神经网络刚好是“恰到好处(AboveRightAccuracy)”,足以解决要解决的问题。这是神经网络成功的一个核心。在很多情况下,不需要计算很高的精度。有时会识别出图片是猫或狗。给图片加很多噪点,或者丢掉一半的像素,还是能识别出是猫还是狗。因此,准确率应该根据任务来定,而不是单谈“准确率”。总结AI的三大“战力”,也是AI在科学应用上能如此奏效的原因。影响的三个关键点。首先,处理高维函数。第二,做快速推理(FastInference)。第三,准确度刚好够用(AboveRightAccuracy),或者说准确度“足够”。那么AI在Science的发展中,AI最适合的位置是什么?答案是协助创新。AI辅助的数学探索是一个很好的方向。以AI为工具,分析数据,提取潜在规律,但可能会出现很多“伪”规律。这时候,人类“介入”,人类筛选出真正有意义的规律,推动发展科学。你看,人工智能用来预测蛋白质三维结构的Alphafold2模型,往往也会推断出一些容易混淆的结构,或者推断出一些不准确的结果。但是,它可以快速推断并可以为科学家提供许多选择。最终还是要靠科学家们来做决定。再举一个例子,寻找抗生素的神经网络。世界卫生组织(WHO)有一份“通缉名单”,最危险的病原体都在通缉名单上。2019年《细胞》杂志封面报道人类首次利用AI发现“新型抗生素”,从1亿多个分子中鉴定出强大的新型抗生素分子,并在小鼠身上进行验证,发现它们是确实有效。既然如此,何不利用AI的能力,从海量数据中快速提取出一些可能的潜在规律,然后让人类进行筛选。Google的子公司DeepMind帮助数学家猜测函数关系并协助证明定理。这个例子是一个典型的AIforScience。对此,北京大学北京国际数学研究中心董斌教授告诉《亲爱的数据》:数学家的密切参与和与机器学习的积极互动尤为重要,而机器学习只是提供底层支持。这种工作模式在未来的影响可能是巨大的。数学家还应该注意哪三点?1.可能只有一小部分问题可以通过这种方式解决。2.数学家与机器学习(数据采集、建模、归因)之间的密切互动至关重要。3.数学家和机器学习之间的分工可能在很大程度上取决于手头的数学问题和数学家本身。为什么叫“机器学习辅助探索”而不是“机器学习探索”?因为机器学习只能提供辅助,包括协助数学家进行猜想。回顾应用数学的发展,从二战,尤其是曼哈顿计划开始,当时的应用数学,或者说是基于模型(或者求解方程)的科学计算。从2010年算起三十年,出现了基于数据的应用数学,代表性的有小波、压缩感知、图像处理。国际数学联合会(IMU)设有高斯奖,这是国际数学界为应用数学设立的最高荣誉。自创办以来已经获奖四次,其中三项都是基于数据的应用数学。三位高斯奖获得者是:2010年,小波理论的先驱之一、数学家伊夫·迈耶。2014年,数学家StanleyOsher。2018年,压缩感知创始人、数学家DavidDohono。应用数学发展的未来是新范式的未来,即数据+模型的范式,而不是纯数据驱动或纯模型驱动的范式。AIforScience的核心点是利用深度学习的工具分析数据,让AI辅助科学家进行科学探索,为科学带来一种由模型和数据驱动的全新研究范式。即使是人工智能,如果不合理使用机制,不把领域知识嵌入到人工智能算法的设计中,也很难有生命力。
