OpenAI因未经授权使用作者的书籍训练ChatGPT而被作者起诉

OpenAI被作者起诉使用其书籍训练ChatGPT

两位作者对OpenAI提起了诉讼,声称该公司使用了他们的作品来帮助训练ChatGPT。争议的焦点在于,他们的书受到版权保护,作者声称OpenAI未经他们同意使用他们的作品来训练LLM。

作者保罗·特伦布雷和莫娜·奥沃德声称,ChatGPT能够根据他们的作品生成“非常准确的摘要”。他们继续声称,只有在ChatGPT训练过他们的作品后,才有可能生成这些摘要,他们认为这是对版权法的侵犯。

OpenAI和提起诉讼的作者的律师都未回应CNBC的提问。像ChatGPT这样的LLM方法是通过训练大量的文本数据来进行训练的,这些数据通常是通过抓取互联网获得的。当然,这包括维基百科和存档图书等网站。

这起诉讼在旧金山提起,声称OpenAI的训练数据中“大部分”材料都基于受版权保护的材料,当然包括这两位作者的书籍。但是这个案件存在一个重大问题,即如何证明ChatGPT获取数据进行训练的方式和来源。

因此,如果没有这些信息,很难证明损害的证据。到目前为止,申诉书引用了ChatGPT能够生成的摘要的展示,还指出LLM的信息有错误。但是这两位作者表示,大部分摘要都是准确的,在他们的声明中,“ChatGPT保留了训练数据集中特定作品的知识。”

申诉书还说:“ChatGPT从未复制原告在其出版作品中包含的任何版权管理信息。”这个申诉与艺术家的情况非常相似。去年,艺术家们曾表示,Stable Diffusion、DALL-E 2和其他人工智能工具在未经他们同意的情况下对他们的艺术作品进行了训练。

这起诉讼还需要一段时间才能得到进展。它在法庭上的判决结果可能会改变未来LLM的训练方式。

编辑注:您准备好了解最新的生成式人工智能技术了吗?加入我们的一天生成式人工智能峰会,深入探讨这一前沿技术,远离炒作,解锁生成式人工智能的威力。现在免费注册吧!