这篇AI论文介绍了一种开创性的机器学习模型,用于高效预测氢燃烧:利用负设计和反应化学中的元动力学

革命性机器学习模型:利用负设计和元动力学预测氢燃烧的高效方法

势能表面(PES)代表原子或分子位置与与其相关的势能之间的关系。PES在理解分子行为、化学反应和材料性质方面至关重要。它们描述了系统的势能在其组成原子或分子的位置变化时的变化。这些表面通常是高维和复杂的,使得其准确计算具有挑战性,尤其对于大分子或系统。

机器学习(ML)模型的可靠性仍然严重依赖于训练数据的多样性,特别是对于在化学反应中必须访问高能量状态的化学反应系统。ML模型具有从已知训练数据中进行内插的性质。然而,其外推能力有限,当分子或其构型与训练集中的分子或构型不相似时,预测可能是不可靠的。

为给定的反应系统制定一个平衡和多样化的数据集是具有挑战性的。ML模型常常仍然受到过度拟合问题的困扰,这可能导致模型在原始测试集上具有较高的准确率,但在应用于MD模拟时容易出错,特别是对于能量构型高度多样的气相化学反应。

加州大学、劳伦斯伯克利国家实验室和宾夕法尼亚州立大学的研究人员构建了一个积极学习的AL工作流程,通过为首次系统样本准备集体变量(CVs)来扩展最初制定的氢燃烧数据集。他们的工作表明,负设计数据获取策略是创建更完整的PES的ML模型所必需的。

按照这种积极学习策略,他们能够实现一个更多样化和平衡的最终氢燃烧ML模型。ML模型能够恢复准确的力以继续轨迹而无需重新训练。他们能够预测在有限温度和压力下氢燃烧的过渡态和反应机理的变化。

团队以Rxn18作为示例,将势能表面投影到两个反应坐标CN(O2-O5)和CN(O5-H4)。通过分析从AIMD和正常模式计算中得出的原始数据点跟踪ML模型的性能。随着积极学习轮次的进行和错误的减少,他们使用较长的元动力学模拟进行采样。

他们发现元动力学对于不稳定结构是一种高效的采样工具,可以帮助AL工作流通过与此类数据的重新训练来识别PES中的空洞。只使用元动力学作为采样工具,可以避免棘手的CV选择步骤,可以从合理或直观的CV开始。他们的未来工作还包括分析类似于增量学习的替代方法,并致力于更多的物理模型,如C-GeM。