谷歌揭示在AI训练中使用公共网络数据

Google公开揭示在AI训练中使用公共网络数据

在最近更新的隐私政策中，谷歌公开承认使用公开可用的网络信息来训练其人工智能模型。Gizmodo注意到了这一披露，其中包括Bard和Cloud AI等服务。谷歌发言人Christa Muldoon向The Verge表示，此次更新仅澄清了像Bard这样的新服务也包含在此实践中，并且谷歌将隐私原则和保护措施纳入其人工智能技术的开发中。

人工智能训练实践的透明度是朝着正确方向迈出的一步，但它也引发了一系列问题。谷歌如何确保在使用公开可用的数据时保护个人隐私？有哪些措施来防止滥用这些数据？

谷歌人工智能训练方法的影响

更新后的隐私政策现在说明谷歌使用信息来改进其服务并开发符合用户和公众利益的新产品、功能和技术。该政策还指出，公司可能使用公开可用的信息来训练谷歌的人工智能模型并构建产品和功能，如谷歌翻译、Bard和Cloud AI能力。

然而，该政策并未阐明谷歌将如何防止版权材料被纳入用于训练的数据池中。许多公开可访问的网站有禁止为训练大型语言模型和其他人工智能工具集而进行数据收集或网络抓取的政策。这种做法可能与全球数据保护条例（如GDPR）相冲突，这些条例保护人们免受未经明确许可的数据滥用。

使用公开可用的数据进行人工智能训练本身并不是问题，但当它侵犯版权法和个人隐私时就会成为问题。谷歌等公司必须小心地权衡这种微妙的平衡。

人工智能训练实践的更广泛影响

使用公开可用的数据进行人工智能训练一直是一个有争议的问题。像OpenAI的GPT-4这样的流行生成型人工智能系统一直对其数据来源保持沉默，包括它们是否包含社交媒体帖子或人类艺术家和作者的受版权保护作品。这种做法目前处于法律灰色地带，引发了各种诉讼，并促使一些国家的立法者制定更严格的法律来规范人工智能公司如何收集和使用其训练数据。

美国最大的报纸出版商Gannett正在起诉谷歌及其母公司Alphabet，声称人工智能技术的进步帮助这家搜索巨头垄断了数字广告市场。与此同时，像Twitter和Reddit这样的社交平台已采取措施防止其他公司自由收集它们的数据，引发了各自社区的强烈反对。

这些发展凸显了人工智能领域对强有力的伦理指南的需求。随着人工智能的不断发展，公司在技术进步与伦理考虑之间取得平衡至关重要。这包括尊重版权法、保护个人隐私，并确保人工智能惠及全社会，而不仅仅是少数人。

谷歌最近更新的隐私政策揭示了该公司的人工智能训练实践。然而，它也引发了关于使用公开可用的数据进行人工智能训练的伦理问题、潜在的侵犯版权法和对用户隐私的影响的问题。在我们继续前进的过程中，我们有必要继续进行这种对话，并努力朝着开发和负责任使用人工智能的未来迈进。

Ethics,google

谷歌揭示在AI训练中使用公共网络数据

Google公开揭示在AI训练中使用公共网络数据

谷歌人工智能训练方法的影响

人工智能训练实践的更广泛影响

使用表达力强的布尔公式解释人工智能

使用先进的图神经网络进行交通预测

2023 年的 MLOps 景观：顶级工具和平台

Acme：一种新的分布式强化学习框架

dm_control：连续控制的软件和任务

申请技术职位

FermiNet：从第一原理出发的量子物理和化学

打破全球壁垒，实现无障碍访问

人工智能