Anthropic在AI版权诉讼中取得部分胜利：训练数据被判“合理使用”但盗版书籍问题仍待解决

霸气犀利2025-06-25

摘要

内部电子邮件显示，这家人工智能公司下载了超过 700 万本盗版书籍来组建其研究图书馆。

币币情报道：

人工智能公司Anthropic在与版权相关的法律纠纷中取得了关键性胜利，但这场围绕AI训练数据的争议远未结束。

美国地区法官威廉·阿尔苏普 (William Alsup) 裁定，Anthropic使用受版权保护的书籍来训练其AI聊天机器人克劳德属于“合理使用”，依据为美国版权法。这项裁决于周一晚些时候发布。

阿尔苏普法官表示：“就像任何渴望成为作家的读者一样，Anthropic的法学硕士课程的培训目的不是为了赶超、复制或取代作品，而是为了突破困境，创造出一些不同的东西。”

然而，法官同时指责这家由亚马逊和谷歌支持的公司建立并维护了一个庞大的盗版书籍“中央图书馆”，认为这一行为明显侵犯了版权。

版权法中“无豁免”

这起案件由作家Andrea Bartz、Charles Graeber和Kirk Wallace Johnson于去年8月提起，指控Anthropic通过从Library Genesis和Pirate Library Mirror等臭名昭著的网站下载数百万本盗版书籍来构建Claude模型。

该诉讼寻求赔偿和永久禁令，指控Anthropic“通过窃取数十万本受版权保护的书籍建立了价值数十亿美元的业务”，以训练其AI模型系列Claude。

阿尔苏普指出，人工智能训练可以“极具变革性”，并强调Claude的成果并不是复制或重新整理作者的作品，而是生成与原文“正交”的新文本。

法庭记录显示，Anthropic下载了至少700万本盗版书籍，包括每位原告的作品副本，用于组建其图书馆。

内部电子邮件显示，Anthropic的联合创始人试图避免授权书籍的“法律/实践/商业障碍”，而员工们则将目标描述为创建一个“世界上所有书籍”的数字收藏，并“永久”保存。

“然而，版权法并没有为人工智能公司提供任何豁免，”阿尔苏普说，并指出，如果允许维护一个永久的被盗作品库——即使只有一部分用于培训——也会“摧毁学术出版市场”。

威廉·阿尔苏普法官的裁决是美国联邦法院首次做出的实质性裁决，直接分析并适用合理使用原则，具体针对利用受版权保护材料训练生成式AI模型的情况。

法院区分了直接用于AI训练的副本（被视为合理使用）和保留的盗版副本，后者将继续面临进一步的法律诉讼，包括潜在的损害赔偿。

尽管已经提起了多起诉讼（包括针对OpenAI、Meta等公司的备受瞩目的案件），但这些案件仍处于早期阶段，驳回动议尚待审理或调查仍在进行中。

OpenAI和Meta两家公司都面临着来自作者团体的诉讼，指控他们的版权作品在未经同意的情况下被利用来训练ChatGPT和LLaMA等大型语言模型。

《纽约时报》于2023年起诉OpenAI和微软，指控他们未经许可使用数百万份《纽约时报》文章来开发AI工具。

Reddit最近还起诉了Anthropic，指控其破坏了Reddit平台。尽管Anthropic声称已停止训练，但仍然进行了超过100,000次克劳德训练。

免责声明：

1.资讯内容不构成投资建议，投资者应独立决策并自行承担风险

2.本文版权归属原作所有，仅代表作者本人观点，不代币币情的观点或立场