梅奥诊所的AI研究人员引入了一种基于机器学习的方法,利用扩散模型构建了一种多任务的脑肿瘤修复算法

梅奥诊所的AI研究人员使用机器学习构建了多任务脑肿瘤修复算法

近年来,与医学影像相关的人工智能(AI)和机器学习(ML)出版物数量大幅增加。使用Mesh关键词“人工智能”和“放射学”进行当前的PubMed搜索,在2021年共获得5,369篇论文,比2011年的结果增加了五倍以上。从分类到语义分割、目标检测和图像生成,不断开发机器学习模型以提高医疗效率和结果。例如,许多发表的诊断放射学报告表明,ML模型在特定任务(如异常检测和病理筛查)中能够与甚至优于医学专家一样表现出色。

因此,可以毫无疑问地说,正确使用AI能够协助放射学家并极大地减少他们的工作量。尽管对于医学影像开发ML模型的兴趣日益增长,但仍存在一些重大挑战,可能限制这些模型的实际应用,甚至使其产生重大偏差。数据稀缺和数据不平衡就是其中之一。一方面,与ImageNet等自然照片数据集相比,医学影像数据集往往要小得多,并且由于患者隐私问题,汇总机构数据集或公开它们可能是不可能的。另一方面,即使是数据科学家可以访问的医学影像数据集也可能更加平衡。

换句话说,特定病理患者的医学影像数据量明显低于常见病理或健康人群的数据量。使用不够大或不平衡的数据集来训练或评估机器学习模型可能导致模型性能中的系统性偏差。与公开发布去标识化的医学影像数据集和支持联邦学习等策略(允许在无需共享数据的多机构数据集上进行机器学习模型开发)相比,合成图像生成是应对数据稀缺和数据不平衡的主要策略之一。

生成式机器学习模型可以学习生成逼真的医学影像数据,这些数据不属于实际患者,因此可以在不危及患者隐私的情况下公开共享。自从生成对抗网络(GANs)出现以来,已经引入了各种能够合成高质量合成数据的生成模型。其中大多数模型生成无标签的影像数据,在特定应用中可能有所帮助,例如自监督或半监督的下游模型。此外,一些其他模型能够进行条件生成,允许根据预定的临床、文本或影像变量生成图像。

基于扩散模型的去噪概率模型(DDPMs),也称为扩散模型,是一类新的图像生成模型,其合成图像质量和输出多样性优于GANs。后一类生成模型允许生成带标签的合成数据,这推动了机器学习研究、医学影像质量和患者护理的发展。尽管GAN在生成合成医学影像数据方面取得了巨大成功,但常常因输出多样性不足和训练不稳定而受到批评。自动编码器深度学习模型是GAN的一种更传统的替代方案,因为它们更容易训练并产生更多样化的输出。然而,它们的合成结果在图像质量方面不如GAN。

基于马尔可夫链理论的扩散模型通过逐渐去噪初始图像(带有随机高斯噪声)来学习生成其合成输出。这种迭代去噪过程使得扩散模型的推理运行比其他生成模型要慢得多,但它使它们能够从输入数据中提取更具代表性的特征,从而在性能上胜过其他模型。在这个方法论论文中,他们提出了一个可以用于多任务脑肿瘤修补的扩散模型,在多序列脑磁共振成像(MRI)研究中接收来自脑MRI的二维(2D)轴向切片,并将用户定义的裁剪区域修补为高级别胶质瘤及其对应的组分(例如周围水肿),或无肿瘤(表面正常)的脑组织的逼真和可控图像。

在美国,高级别胶质瘤的发病率为每10万人3.56例,脑肿瘤的公开MRI数据集很少。他们的模型将允许机器学习研究人员在如此有限的数据中编辑(引入或移除)脑MRI切片上具有可配置特征的合成肿瘤或无肿瘤组织。该工具已经在线部署供人们使用。该模型已在GitHub上开源,并附有其文档。

这篇文章是由Marktechpost团队根据研究论文《多任务脑肿瘤修复与扩散模型:一份方法论报告》撰写的研究概述文章。这项研究的所有荣誉归功于参与该项目的研究人员。请查看论文、代码和工具。
请不要忘记加入我们的机器学习Subreddit

Mayo Clinic的AI研究人员介绍了一种基于机器学习的方法,利用扩散模型构建了一种多任务脑肿瘤修复算法。

文章首发于MarkTechPost。