认识Concrete ML:一个开源的基于全同态加密的工具包,有助于保护隐私并实现安全的机器学习
Concrete ML是一个开源的基于全同态加密的工具包,有助于保护隐私并实现安全的机器学习
人工智能和机器学习在过去几年中显示出巨大的生产力提升。机器学习的核心是通过维护各种手段的隐私和保密性来拥有高质量的数据。在解决问题时,弥合隐私和利用机器学习优势之间的差距非常重要。在今天的数据驱动时代,保护个人隐私变得非常困难。随着机器学习在当今变得如此普遍,必须处理其所带来的影响,并确保保护客户信息的安全。 Fully Homomorphic Encryption (FHE) 等新的进展成功保护了用户信息并保持了机密性。
Zama的机器学习研究人员推出了一个名为Concrete-ML的开源库,该库允许将机器学习模型平滑转换为它们的FHE对应物。他们最近在Google Tech Talk中介绍了Concrete ML。每当将用户的某些数据发送到云端时,同态加密方案会保护这些数据。通过考虑数据安全性,所有操作和操作都在加密数据上进行。完全同态加密可以通过一个示例来解释。假设一位医生希望对某个特定城市中患有心脏问题的患者进行描述性分析。该城市的医院内部团队将患者数据安全地存储在其数据库中,但由于隐私问题,可能无法公开数据。这就是FHE加密敏感数据的地方,因此数据是安全的,同时也可以进行计算。
Concrete ML是一个基于The Concrete Framework开发的开源工具包。它可以帮助研究人员和数据科学家将机器学习模型自动转换为它们相同的同态单位。 Concrete ML的关键特点是它能够将机器学习模型转化为它们的FHE等效物,而不需要任何关于密码学的先前知识。通过Concrete ML,用户可以与不同的服务提供商进行零信任的对话,而不会妨碍机器学习模型的部署。它保护了数据和用户的隐私,并在不受信任的服务器上投入了生产中的机器学习模型。
- 多模态语言模型:人工智能(AI)的未来
- 一篇新的人工智能论文解释了大型语言模型作为一般模式机器可以具有的不同专业水平
- 斯坦福大学和Mila研究人员提出了Hyena:一种不需要注意力的替代方案,可以替代许多大规模语言模型的核心构建模块
同态加密(FHE)是一种允许在加密数据上进行直接计算的加密策略,可以用于开发具有独特功能的应用程序。 FHE不需要解密。 Concrete ML使用了Scikit-learn和PyTorch中的一些流行的应用程序用户界面(API)。 Concrete ML模型的设计如下:
- 模型训练-该模型使用Scikit-learn库对一些未加密的数据进行训练。在推理过程中,Concrete ML只使用整数,因为FHE只适用于整数。
- 转换和编译-在此步骤中,将模型转换为Concrete-Numpy程序,然后将量化模型编译为FHE等效物。
- 推理-对加密数据进行推理。在将模型部署到服务器时,客户端对数据进行加密,然后由服务器进行安全处理和客户端进行解密。
Concrete ML在保护隐私和信任的同时,为使用机器学习提供了巨大的发展。目前,Concrete ML的唯一限制是它只能在支持的16位整数精度范围内运行,但对于隐私保护仍然是一个有希望的方向。