科学智能(AI for Science)通过学习、模拟、预测和优化自然界与人类社会的各种现象和规律来解决我们目前遇到的各类科研难题,从而推动科学发现和创新,这种模式目前被称为科学研究和发现的第五范式。络绎科学发起「科学智能 50 人」访谈计划,旨在邀请科学智能领域优秀的专家代表,希望通过系列访谈,为广大读者呈现一个更全面、深入的科学智能领域的发展现状和前沿洞察。
近年来,人工智能技术的发展速度惊人,逐渐在单项任务实现与人类相当甚至超越人类的水平。2015 年,DeepMind 第一次通过深度强化学习玩雅达利(Atari)游戏,并超过人类水平。2022 年,DeepMind 通过深度强化学习控制可控核聚变的托卡马克的等离子体,这是深度强化学习首次能够控制复杂的等离子体系统,并显示出不同于传统方法的优势。这两个 AI 领域的“标志性事件”在证明 AI 能力强大的同时,也引起了学术界和工业界的高度关注。
2016 年,吴泰霖正在麻省理工学院物理系攻读博士学位,师从艾萨克庄(Isaac Chuang)教授。在看到 AI 与物理等科学巨大结合的潜力后,基于创造出帮助科学家们更快、更好地从事科研研究的“AI 科学家”的梦想,原本从事量子计算方向研究的他开始尝试研究 AI 与物理领域融合的方向。
他与联合博士导师迈克斯泰格马克(Max Tegmark)教授首次提出 “理论学习”的新学习范式和“AI 物理学家”架构,从观测的数据中找出简单普适的物理规律和方程,让模型模仿物理学家进行物理学发现。
图丨吴泰霖(来源:吴泰霖)
之后,他在斯坦福大学计算机系朱尔莱斯科韦茨(Jure Leskovec)教授课题组进行博士后研究,主要从事 AI 用于物理的仿真研究。他开发的算法被用于物理、能源等领域的科学仿真以及天文、物理等领域的科学发现,例如部署在沙特阿美公司的地下流体仿真,以及在斯坦福国家加速器实验室用于设计新型激光等离子体加速器等。
现在,吴泰霖在西湖大学工学院担任助理教授、研究员、博士生导师,其课题组研究方向是通过设计更高效率、准确的 AI 方法,加速科学仿真、设计、控制和科学发现,并解决其中的核心、普适性问题。
将 AI 用于科学发现和科学仿真
科学发现是在科学领域中最令人兴奋的问题之一。如何开发 AI 方法,帮助科学家从数据中发现新的科学规律,是一个极其复杂而又重要的问题。经过深入的思考和讨论,吴泰霖提出其中核心的问题之一:如何开发 AI 方法发现复杂动力学系统的简单、普适的理论?
图丨AI 物理学家架构(来源:Physical Review E)
为此,吴泰霖与泰格马克教授首次提出 “理论学习”的新学习范式和“AI 物理学家”架构,通过制造比较简化的场景,从观测的数据中找出简单的物理规律和方程,让模型模仿物理学家进行物理学发现。具体来说,结合四种常见策略发现规律的归纳偏置,学习简单、普适的“理论”,分别是:分而治之(divide and conquer)、奥卡姆剃刀(Occam’s Razor)、统一(unification)、终身学习(lifelong learning)。这里的“理论”为吴泰霖和泰格马克教授提出的一种新的模型结构,包含一个预测模型(用于通过过去预测未来)和一个判别模型(判断数据是否能被该理论解释);“理论”中包含的两个模型,可以通过神经网络或符号方程表示。
基于“分而治之”的思想,他们提出算法同时学习多个理论(包括其预测模型和判别模型),每个理论专注于解释数据中的某一方面。基于“奥卡姆剃刀”“统一”和“终身学习”的思想,学习的理论存储在一个“理论中枢”中,被不断地简化并统一。并且,可以在遇到新环境时先尝试通过已有理论尝试解释新的数据,如果新数据无法被解释,则学习新的理论并再加到理论中枢中。通过这一方法,实现“最小化表示长度(minimum description length)”,达到预测精度和模型复杂度的共同优化。
与单独模型预测的科学发现相比,其可解释性、泛化性和样本效率更强。通过“AI 物理学家”架构,研究人员可以一步步地从神经网络表示的理论,简化到通过符号来表示学习到理论,进而从观测数据中提炼出相关物理理论。
实验结果表明,该模型精度比标准神经网络高 7 个数量级,能够简化为符号表示的方程,并发现不同理论的适用区域。相关论文以《向人工智能物理学家进行无监督学习》(Toward an artificial intelligence physicist for unsupervised learning)为题发表在物理学期刊 Physical Review E[2]。
据悉,该论文后被 DeepMind 关于 AI Mathematician 的 Nature 论文引用。后续,吴泰霖在该模型上延伸,参与构建了“AI 费曼 2.0”,进一步重新发现费曼物理学讲义中的最重要的 100 个物理方程[3]。
他表示,未来基于这项研究,将进一步构建更加实际的、更加覆盖数据的可发现系统,能够真正地总结出规律,并应用在不同的科学领域帮助科学家解决问题。
(来源:AI 费曼 2.0,NeurIPS 2020)
与科学发现类似,科学仿真也是科学领域中最重要的问题之一,无论在物理学还是在机械、材料、生命科学等其他学科,都需要对一些复杂的系统进行仿真,使得科学家能够预测系统的未来以及能够基于它进行控制和设计。
当前在科学领域的仿真,主要方式是运用基于第一性原理开发特定领域的求解器,通过数值方法求解离散化的特定系统的偏微分方程或者常微分方程。尽管其比较准确,但是这一方式非常慢(常常需要几小时到几周才能模拟一个实际系统),并且需要极大的计算量(常常用到高性能计算)。
近年来,通过 AI(神经网络)学习物理仿真成为一种新的范式,其最主要的优点是快(往往比传统方法快几十到上千倍),并在观测数据充足的情况下,准确度能超过传统方法,但仍然与实际应用有一定距离。吴泰霖在 AI 学习物理仿真领域,针对其大规模、多尺度和多分辨率和长时预测准确性等核心问题做了一系列工作,并在一些重要领域得到了应用。
压缩和预测的权衡,无论在 AI 还是在物理学中都是非常普适的问题。在物理仿真中,该权衡也是其核心难点之一。具体来说,如何权衡仿真的预测准确度和计算成本,使得在需要精确预测的地方,能够动态地给予其更高的空间网格分辨率。
图丨多分辨率物理系统示意图(来源:ICLR 2023 )
吴泰霖对 AI 学习物理仿真中如预测准确度和压缩的权衡进行研究,提出首个同时学习系统演化和优化计算成本的代理模型。该模型通过强化学习来学习两个基于图神经网络的代理模型,一个用于预测系统演化,另一个用于动态调整每一处网格的分辨率。值得关注的是,该系统是多分辨率的,这意味着,物理系统可以在系统少部分非常动态的区域进行精细的模拟,而其他大部分则只进行比较粗粒化的模拟。
图丨激光-等离子体耦合仿真(来源:吴泰霖)
吴泰霖举例说道:“如果在复杂系统使用相同的空间分辨率,会浪费很多计算资源和成本,我们的模型能够根据实际需要来优化,以及用更精细空间分辨率实现网格模拟。”
基于网格的仿真系统适用于具有多尺度分辨率的应用场景,例如对物理仿真(流体、机械工程、材料、天气预报、可控核聚变等)、计算机图形学进行模拟等。此外,在需要平衡计算成本及计算精确度的场景,例如模拟蛋白质,也可以通过该系统同时按需预测原子的运动。
AI 有望成为科学仿真和科学发现的标准工具
2023 年 6 月,吴泰霖回国加入西湖大学工学院成立独立课题组,名为“人工智能与科学仿真发现实验室”,其研究涉及 AI 与科学的交叉,致力于 AI 核心方法的创新以及在关键科学领域的应用,目前已与国内外多个顶尖团队合作。“我们希望能够在子领域做出开创性的工作。”吴泰霖表示。
用传统的方法进行仿真模拟和设计往往需要较长的周期,而仿真能预测复杂系统未来演化,以及更好设计和控制系统。“将 AI 用于复杂系统的仿真及设计,包括流体力学、飞机和船舶、可控核聚变等领域,可以实现几十倍到上千倍的加速。并且,如果相关系统具备足够的数据,也可实现比传统方法更高的准确率。”他说。
据介绍,吴泰霖开发的地下流体仿真系统[3],目前已在沙特阿美公司的仿真环境中部署,以加速对地下石油的开发和预测。根据相关结果,该系统与传统求解器相比,运行时间减少 18 倍。并且,每个时间步可扩展到千万级别网格。
图丨地下模拟模型(来源:SIGKDD 2022)
吴泰霖认为,未来能通过 AI 有望成为科学仿真、设计、控制和科学发现的标准性、常用工具。因此,未来应致力于解决的问题是,提高 AI 用于科学仿真和设计的可信度,即 AI 模拟系统时,能否减小误差累积,并且让使用者了解在新环境下应用的误差范围,这样才能够让更多的科学家和工业领域的研究者更创新地使用。
另一方面,通过 AI 进行仿真设计需要海量数据训练,由于不同领域所需不同的数据和场景,因此数据是一种壁垒。他指出,未来,如何能够在领域中有一些多样化的、大量的数据,能够让 AI 的研究者能够非常容易地使用也是值得探索的方向,在训练更好的模型的同时,也能够更好地开发各种算法。
参考资料:
1.Wu,T.,Tegmark,M.Toward an artificial intelligence physicist for unsupervised learning. Physical Review E 100, 033311(2019). https://doi.org/10.1103/PhysRevE.100.033311
2.Wu,T.et al. Learning Controllable Adaptive Simulation for Multi-resolution Physics.In International Conference on Learning Representations (ICLR 2023)
3.Udrescu, Silviu-Marian, Andrew Tan, Jiahai Feng, Orisvaldo Neto, Tailin Wu, and Max Tegmark. "AI Feynman 2.0: Pareto-optimal symbolic regression exploiting graph modularity." Advances in Neural Information Processing Systems 33 (2020): 4860-4871.
4.Wu,T.et al. Learning Large-scale Subsurface Simulations with a Hybrid Graph Network Simulator. SIGKDD 2022,11, 6 https://doi.org/10.1145/3534678.3539045
声明:本文仅供科研分享,助力科学传播,不做盈利使用,如有侵权,请联系后台删除。
#In Science We Trust#
小程序/APP:络绎科学
官网:https://www.luoyikexue.com