大英百科全书和韦氏词典起诉 OpenAI 侵犯超过 100,000 篇文章的版权

Gwenda

原告指控 ChatGPT 提供的逐字回复与他们的付费内容直接竞争,导致他们缺乏广告和订阅收入。传统搜索引擎将用户引导至出版商网站,而 OpenAI 的聊天机器人吸收了《大英百科全书》精心策划的历史分析和韦氏词典定义,然后在不注明出处的情况下提供精美的答案。

“ChatGPT 导致像原告这样的网络出版商收入匮乏,”在纽约南区提交的诉状中写道。

该法律行动描述了一个反馈循环,其中收入下降导致内容创作质量下降,这进一步减少了收入,出版商称之为““螺旋式下降。”

引用的具体例子包括重现韦氏词典的准确定义“抄袭”当被问及字典如何定义该术语时。据称,人工智能还复制了大英百科全书关于汉密尔顿-伯尔决斗的独特选择和排序,包括编辑策划的具体片段,甚至指出百科全书已经对这篇文章进行了事实核查。

大英百科全书保留大约的版权100,000 篇在线文章据称,这些内容是在未经许可的情况下被删除的,用于训练 OpenAI 的大型语言模型。该文件还声称,当 ChatGPT 产生幻觉内容并将其错误地归因于原告时,该公司违反了商标法。

根据法庭文件,OpenAI 于 2024 年 11 月尝试与大英百科全书和韦氏词典进行许可谈判,但拒绝了他们的提议。原告现在寻求永久禁令,以阻止 OpenAI 使用他们的材料并为其所谓的补偿“非法利润”。

OpenAI 发言人告诉《财富》杂志:“ChatGPT 有助于增强人类创造力,推进科学发现和医学研究,并使数亿人改善日常生活。”

该公司坚称其模型是根据公平使用原则根据公开数据进行训练的。

此案与其他针对人工智能公司的版权诉讼一起,包括来自《纽约时报》的诉讼,Ziff Davis(Mashable 和 CNET 的所有者)以及十几家美国和加拿大报纸。类似的大英百科全书对 Perplexity 的诉讼仍悬而未决。

结果可能取决于使用受版权保护的材料进行人工智能训练是否构成合理使用原则下的侵权,这是本案的核心问题,涉及约 100,000 篇涉嫌复制的文章。