中国的研究人员提出了一种基于联邦学习(FL)的新型μXRD图像筛选方法,旨在在保护数据隐私的同时提高筛选效果

Chinese researches propose a new μXRD image screening method based on Federated Learning (FL) to improve screening effectiveness while protecting data privacy.

联邦学习提供了一种机制,通过在不让任何人看到或访问您的数据的情况下训练AI模型,释放数据以推动新的AI应用。为了确定工业矿物的晶体杂质,工业矿物被用于同步辐射X射线微衍射(XRD)服务。XRD服务产生大量的照片;在进一步处理和存储之前,这些图像必须经过滤波处理。由于服务使用者不愿提供他们的原始实验照片,没有足够高效的标记示例来训练筛选模型。为了增强筛选能力同时保护数据隐私,研究人员在本研究中提出了基于联邦学习(FL)的XRD图像筛选方法。通过先进的客户端采样算法,他们的解决方案解决了服务使用者在使用各种类型和数量的样本时面临的不平衡数据分布问题。他们还建议采用混合训练技术来处理FL客户端和服务器之间的异步数据交换。研究结果表明,他们的技术可以在保护商业敏感信息的同时为商业客户测试工业材料提供高效的筛选。

通过同步辐射X射线微衍射(XRD),工业矿物可以检测晶体缺陷。然而,精确的XRD图像筛选的进展受到两个重要问题的阻碍。一个是标记的工业样本不足,另一个是工业XRD服务使用者对隐私的担忧。

研究人员利用特定领域的物理信息来提高联邦学习的准确性。然后,在考虑到现实世界中不均匀的数据分布后,他们实施了一种具有新客户端采样算法的采样方法。还开发了混合训练架构来处理FL客户端和服务器之间的不稳定通信环境。

广泛的测试表明,共享用户或应用程序之间的数据特征而不损害商业敏感信息,可以将机器学习模型的准确性提高14%至25%。这种创新系统的联邦学习能力将有助于消除数据交换的非技术障碍。