这篇 AI 论文揭示了 X-Raydar:开创性的开源深度神经网络用于胸部 X 射线异常检测

革命性的AI研究:揭秘X-Raydar,开源深度神经网络在胸部X射线异常检测上的突破

来自英国各大学的研究人员开发了一种开源人工智能(AI)系统X-Raydar,用于全面检测胸部X射线异常。该系统在来自英国六家医院的数据集上进行训练,利用神经网络X-Raydar和X-Raydar-NLP从图像和其自由文本报告中对常见胸部X射线发现进行分类。这份数据集覆盖了13年,包括2,513,546项胸部X射线研究和1,940,508项可用的自由文本放射学报告。一个经过定制训练的自然语言处理(NLP)算法X-Raydar-NLP使用从报告中提取的37个发现的分类法来对胸部X射线进行标记。AI算法在三个回顾性数据集上进行了评估,展示了在各种临床重要发现方面与历史临床放射学家报告者的类似性能。

X-Raydar在自动标记的数据集上实现了0.919的平均AUC,共识集上为0.864,在MIMIC-CXR测试中为0.842。值得注意的是X-Raydar在共识集的37项发现中有27项的表现优于历史报告者,九项与之相当,一项较差,平均改进了13.3%。该系统在关键发现,包括气胸、实质性阻塞和实质性肿块或结节方面的性能与经过训练的放射科医师相当。

开发包括一个覆盖八个解剖区域和非解剖结构的放射学分类法,有助于全面标记。自然语言处理算法X-Raydar-NLP经过训练,以提取标签,计算机视觉算法X-Raydar使用InceptionV3进行特征提取,并使用自定义损失函数和类别加权因子获得了最佳结果。

测试时使用了由专家放射科医师注释的共识集(1,427张图像),自动标记集(n=103,328)和独立数据集MIMIC-CXR(n=252,374)。X-Raydar-NLP对自由文本报告中临床相关发现的检测表现良好,平均灵敏度为0.921,特异度为0.994。X-Raydar在共识集上所有发现的平均AUC为0.864,对关键、紧急和非紧急发现表现出良好的性能。

研究人员还开发了基于Web的工具,允许公众访问用于实时胸部X射线解释的AI模型。X-Raydar在线门户网站允许用户上传DICOM图像进行自动预处理和分类。此外,研究人员开源了他们的训练网络架构,为进一步的研究和适应提供了基础模型。研究人员已成功开发和评估了一种AI系统X-Raydar,用于全面检测胸部X射线异常。该系统表现出与历史放射学家报告者相当的性能,并对研究界免费开放,为放射学领域的AI应用的进步做出贡献。