最终的DXA国度

Final DXA state

基于纵向图像的健康医学AI模型

AI能看到未来!深度学习从单一和连续身体成分成像预测全因死亡率

DXA成像提供多种类型的身体成分可视化。(图片来自作者)

要点,TLDR:

  • 结合身体成分成像和元数据(例如年龄、性别、握力、步行速度等)可得到最佳的10年死亡率预测
  • 纵向或连续模型的整体表现优于单一记录模型,突显了在健康数据中建模变化和时间依赖性的重要性
  • 纵向模型有潜力提供更全面的健康评估
  • 阅读论文

人工智能(AI)和机器学习(ML)正在改变医疗保健领域,推动我们进入精准医学时代。开发AI健康模型的动机是减少死亡和疾病,并延长高质量的生活。经过良好训练的模型能够更全面地分析所呈现的数据,提供更全面的健康评估。

单一记录 vs 纵向模型

基于图像的医学AI/ML模型现在已经达到了一种成熟状态,它们经常能够与甚至超越人类的表现相媲美,能够敏锐地识别出人眼很容易忽略的模式和异常。然而,这些模型中的大多数仍然是基于单个时间点的数据运行,只提供了一个特定时刻的健康快照。无论是单模态还是多模态模型,它们往往使用在相对相似时间范围内收集的数据,构建预测的基础。然而,在医学应用的更广泛背景下,这些单一时间点模型只是第一步,只是所谓的“低挂果实”。医学AI研究的一个前沿是纵向模型,它们提供了一个更全面的人体健康的视角。

纵向模型旨在整合来自多个时间点的数据,捕捉个体的健康轨迹,而不是独立的瞬时瞬间。这些模型利用了人体健康的动态性,其中生理变化是持续不断的。将这些变化映射到特定的结果或健康问题上,可能会对预测性医疗产生重大影响。纵向数据的概念在临床实践中并不新鲜,它经常用于监测衰老和预测虚弱。一个典型的例子是骨密度(BMD)的跟踪,这是骨质疏松和脆弱性的关键指标。定期评估BMD可以检测到明显的降低,提示潜在的健康风险。

纵向模型开发的挑战

从历史上看,纵向模型的开发面临着几个重大挑战。除了每个个体需要更大的数据量和计算量之外,最关键的障碍在于纵向医学数据本身的策划。与单一时间点的数据不同,纵向数据涉及跟踪患者的健康信息长时间以来,通常跨越多个医疗机构。这需要细致的数据组织和管理,使数据策划过程变得耗时且昂贵。已经资助了多项成功的研究来收集纵向数据。这些研究报告了在较长观察期内患者留存方面的挑战。因此,尽管纵向模型具有潜在的好处,但它们的开发仍然是一项复杂而资源密集型的工作。

目标

身体成分的变化,肌肉和脂肪软组织及骨骼比例的变化与死亡率有关。在我们的研究中,我们旨在使用身体成分信息更好地预测全因死亡率,换句话说,预测个人寿命的可能时间表。我们评估了建立在单一时间点和纵向数据上的模型的性能,分别称为我们的“单一记录”和“连续”模型。单一记录模型使我们能够评估哪种类型的信息对死亡率的预测最具有预测性。连续模型的开发是为了捕捉随时间的变化并评估其对死亡率预测的影响。

数据

本研究的数据来源于一个名为“健康、衰老和身体构成(Health ABC)”的纵向研究,追踪和监测了3000多名年长、多种族的男性和女性成年人长达16年。该研究产生了一个丰富和全面的纵向数据集。作为该研究的一部分,患者接受了全身双能X射线吸收法(TBDXA)成像,并收集了一些元数据(参见表XXX)。为了符合最佳建模实践,避免数据泄露或减少过拟合,数据被分成训练集、验证集和保留测试集,采用70%/10%/20%的比例。

我们使用全身双能X射线吸收法(TBDXA)成像来量化身体构成,这一成像方法长期以来一直被认为是黄金标准。历史上,患者的元数据,包括年龄、体质指数(BMI)、握力、步行速度等变量,被用来评估衰老/死亡风险,并被用作身体构成的替代测量。患者元数据和身体构成的替代测量的广泛应用是由于DXA扫描仪的有限可及性。近年来,随着扫描费用的降低和不再需要医生的转诊/医嘱/处方,扫描的可及性有了很大的改善。

单图像模型

构建了三个单一记录模型,每个模型的数据输入不同,但输出都是10年死亡概率。第一个模型只使用患者元数据,是一个具有单个32个单元、ReLU激活隐藏层和Sigmoid预测层的神经网络。第二个模型仅使用TBDXA图像作为输入,它由一个修改过的Densenet121组成,该模型被修改为处理两个颜色通道,而不是大多数自然图像中的三个颜色通道(RGB)。DXA的双能性导致产生高能和低能的X射线图像,这两个图像通道被完全对齐并叠加在一起。第三个模型将第一个模型的元数据嵌入和第二个模型的TBDXA图像嵌入相结合,然后通过一个512个单元、一个64个单元的全连接ReLU层进行处理,最后通过一个Sigmoid预测层。

单记录模型的数据输入、模型架构和方法的示意图(由作者提供的图片)

纵向/序列模型

构建并评估了三个序列模型。单记录模型的架构作为每个序列模型的基础,但是去掉了Sigmoid预测层,使得输出是表示特征嵌入的向量。在研究过程中,从每个患者收集了多个时间点的数据。每个时间点的数据被输入到相应的模型中,以获取相应的特征向量。每个患者的特征向量被排序并堆叠成一个序列。训练了一个长短期记忆(LSTM)模型,以接受特征向量序列并输出10年死亡预测结果。如前所述,进行长期研究存在多个困难,保留和数据收集是一个常见问题。我们的研究也没有免于这些问题,有些患者的数据点比其他患者多。选择LSTM模型作为序列建模方法是因为它们不受约束地使用相同的输入序列长度进行工作。即LSTM可以处理长度变化的序列,从而无需填充序列,即使患者没有完整的数据点(约10个)。

纵向模型的数据输入、模型架构和方法的示意图(由作者提供的图片)

图像+元数据纵向模型获胜

在保留测试集上的接收器操作特征曲线下面积(AUROC)显示,元数据在单记录模型和序列模型中的表现优于仅使用TBDXA图像。然而,将元数据与TBDXA图像相结合在两种建模范式中都得到了最好的AUROC值,这表明图像包含了不受元数据捕捉到的预测死亡风险的有用信息。从另一个角度来看,元数据并不能完全代表身体构成,从而预测死亡风险。如果元数据是完全的替代测量,将TBDXA图像与元数据相结合将不会导致AUROC的显著增加或变化。组合结果显示,图像提供了超出元数据所捕捉到的正交信息,进一步证明了图像的实用性。

单个记录和顺序模型的AUC性能(作者提供的图像)

总体而言,纵向或顺序模型的表现优于单个记录模型。这对于所有的建模方法和输入数据类型(元数据、仅图像、组合的元数据和图像)都是成立的。这些结果表明了对健康数据的变化建模和时间依赖性的重要性。

我们进行了一项综合辨别提升(IDI)分析,以评估将图像与元数据相结合与仅使用元数据相比的优势。这项分析是在顺序模型上进行的,其表现优于单个记录模型。IDI为5.79,综合敏感性和特异性分别为3.46和2.33。这表明图像和元数据的组合提高了模型正确识别那些在接下来的10年内将不会存活的人的能力3.46%,并提高了正确识别那些在接下来的10年内将会存活的人的能力2.33%。总的来说,这表明模型性能的改进约为5.8%。

综合辨别提升(IDI)分析结果(作者提供的图像)

那么呢?

我们的研究强调了纵向人工智能/机器学习模型在预测医疗保健领域中的潜在潜力,尤其是在全因死亡的背景下。对单个记录模型和纵向模型的比较分析表明,后者具有更好的性能,表明了在健康数据分析中建模时间变化的关键作用。我们的研究结果的临床意义包括通过考虑患者的历史或纵向数据来提供更精确和全面的健康评估的能力。虽然开发纵向健康模型所需的数据已经存在,但适当的基础设施和机构支持还没有完全面向实现高效的数据整理和大规模开发这些模型。尽管如此,许多人正在努力克服这些障碍,发展纵向模型是医学人工智能的许多令人兴奋的前沿之一。

这些发现的临床意义是深远的。纵向模型有潜力通过更精确地预测患者的健康轨迹来改变护理提供方式。这样的模型可以为积极干预提供信息,从而提高护理结果,甚至可能延长生命。此外,同时使用元数据和图像数据为未来的人工智能/机器学习模型树立了新的先例,提出了一种协同的方法来获得最佳结果。它强调了多维、细致的数据的需求,以绘制一个准确和全面的患者健康画像。这些发现代表了医疗中人工智能/机器学习应用的重要进展,突显了我们在追求精准医学方面的令人兴奋的前进道路。

更多资源:

阅读论文

深度学习预测纵向全身DXA成像的全因死亡…

死亡研究已经确认了预测全因死亡风险的生物标志物。其中大多数标志物,例如…

www.nature.com

更多关于IDI和已发表的示例的信息:

曲线下面积及其它

医生和数据科学家,这里是关于IDI和NRI的介绍,附带有用Python编写的示例。AUC可能并不总是足够…

towardsdatascience.com

双能三室乳腺成像用于组成性生物标志物以改善检测…

虽然乳腺成像技术,如全场数字乳腺摄影术和数字乳腺层析成像术,有助于减少…

www.nature.com

GitHub – LambertLeong/AUC_NRI_IDI_python_functions:定制的Python函数,可帮助您进一步…

定制的Python函数,可帮助您进一步分析机器学习模型和诊断测试- GitHub…

github.com

曲线下面积及其他内容:综合区分改进和净重分类

医生和数据科学家,这是关于IDI和NRI的简介,附带一个Python示例。AUC可能不总是足够…

www.lambertleong.com