微软AI研究引入了一种称为分布式图形变换器(DiG)的新型深度学习框架,用于预测分子系统的平衡分布

微软AI研究引入了一种新型深度学习框架DiG,用于预测分子系统的平衡分布

分子的结构决定了其性质和功能。这就是为什么结构预测是分子科学中的一个重要问题。分子科学家们对AlphaFold和RoseTTAFold等深度学习方法在从氨基酸序列中识别蛋白质最可能的结构方面的突破准确性赞不绝口。然而,结构预测只能提供蛋白质功能的部分图像,而且这种方法只提供一个快照。

最近微软的研究提供了Distributional Graphormer(DiG),这是一种用于基于平衡分布的蛋白质结构预测的新型深度学习框架。它希望解决这个基本问题并推动分子科学的发展。DiG是对平衡分布建模的结构集合的重要进展,而不仅仅是一个结构。由于它能够预测分布、统计力学和热力学,能够调节分子系统在微观水平上的宏观方面。

DiG改进了他们之前的工作Graphormer,这是一个能够准确描述分子结构的通用图形转换器,以提供一种新的分布预测方法。DiG是Graphormer的改进版本,现在可以通过使用深度神经网络直接预测目标分布,这是一种新而强大的能力。

它基于模拟退火的概念,模拟退火是热力学和优化中已经建立起来的一种技术,近年来它启发了扩散模型的创建,这些模型在人工生成内容(AIGC)领域取得了重大进展。通过模拟一个退火过程,通过允许它探索和落入最可能的状态,逐渐将一个简单的分布精细到构建一个复杂的分布。DiG是模拟这个过程的深度学习框架,扩散模型源于统计力学和热力学,经常被用作AIGC模型的基础。

通过使用Graphormer将简单的分布转化为复杂的分布,DiG基于扩散。用于训练DiG的数据或信息是灵活的。通过最小化能量基概率与DiG预测的概率之间的差异,DiG可以利用分子系统的能量函数来引导转化。通过这种方法,可以利用系统的现有知识来教导DiG。

通过一系列跨越各种分子系统的分子采样任务,包括蛋白质、蛋白质-配体复合物和催化剂-吸附剂系统,团队展示了DiG的有效性和潜力。研究结果表明,DiG不仅能够高效、廉价地产生逼真且多样的分子结构,还能够提供状态密度的估计,这对使用统计力学计算宏观属性至关重要。

团队认为,DiG在定量分析微观分子并预测它们的宏观特征方面代表了一大步,为分子科学中许多有趣的新课题铺平了道路。