1.1. 简介

在过去的几十年时间里,因为在凝聚态物理、材料科学、高分子化学和分子生物学等领域的广泛应用,分子动力学模拟方法被越来越多人关注和使用,这种模拟手段让研究人员有能力去观察原子或分子间的运动行为,在一些实验手段极难,甚至无法探索的问题上,分子动力学模拟方法能够极大地拓宽我们的认知边界。

众所周知,分子动力学模拟的结果好坏取决于势函数的准确性,如何能精确地表示势函数是分子动力学模拟中极其重要的问题。经验势模型与量子力学模型是最为常用的两种方法,经验势通常由物理直觉出发,给出关于体系能量的数项组成,因为形式简单而通常有较快的计算速度,但是无法保证精度。与之相反,量子力学模型通过近似求解电子结构来计算原子的受力和能量,具有非常高的精度,但随之而来的是计算速度的限制,无法应用于更大型或更长时间的计算中。总而言之,在如何精确地表示势能面这个问题上,人们需要在精度和速度上做出选择,无法两者兼顾。

但随着AI for Science浪潮的到来,机器学习势函数正在帮助人们跨越精度与速度之间的鸿沟。描述子与机器学习算法是机器学习势函数的两个主要组成部分。描述子用于保证所研究结构的对称性,机器学习算法通过训练量子力学精度下的数据,建立原子结构与体系能量之间的函数关系,训练完成后,机器学习势函数能给出与训练数据相同的量子力学精度,如果训练数据是由密度泛函理论计算得出,那么机器学习势函数也会是密度泛函理论的精度,但与密度泛函理论的计算量随着研究体系扩大而三次方增长不同,机器学习势函数的计算量只与体系大小呈线性关系。

到目前为止,已经有相当多的研究提出了不同形式的机器学习势函数模型,例如Behler-Parrinello neural network potentials(BPNNP)[1], Gaussian approximation potentials(GAP)[2], spectral neighbor analysis potentials(SNAP)[3], ANI-1[4], SchNet[5] and Deep Potential[[6],[7],[8]],虽然已取得了较大成功,但机器学习势函数模型仍有很多极具挑战性的问题等待解决[9],例如忽略截断半径外的相互作用导致的系统性预测误差[10]等问题

本章节将重点介绍DP模型,除了能达到量子力学的精度外,目前的DP模型还具有以下特点:(1)易于保持体系的对称性,尤其是当体系存在多种元素时;(2)计算效率高,比密度泛函理论至少快五个数量级;(3)端到端模型,减少人为干预的可能;(4)支持MPI和GPU,能够在现代异构高性能超级计算机上高效运行。目前,DP模型已经成功地应用在水和含水系统[[11],[12],[13],[14]],金属和合金[[15],[16],[17],[18]],相图[[19],[20],[21]],高熵陶瓷[[22],[23]],化学反应[[24],[25],[26]],固态电解质[27],离子液体[28]等研究领域中。 对于最近DP模型在材料领域方面的研究,我们参考了此篇文献[29].