Anthropic创始人兼首席执行官达里奥·阿莫迪(Dario Amodei)宣布了一项重要决定。
根据当地时间9月5日提交至法庭的文件,Anthropic公司将支付至少15亿美元来解决一起在美国的集体诉讼。该诉讼指控Anthropic涉嫌使用盗版书籍来训练其聊天机器人Claude。
如果这一和解获得法官批准,它将成为AI公司与创作者之间版权争议的里程碑,并对整个出版业、创作者群体及AI行业的商业策略产生深远影响。根据和解协议,Anthropic将向约50万部纳入和解范围的书籍的作者或出版商支付每部约3000美元的赔偿。原告方律师贾斯汀·尼尔森(Justin Nelson)表示:“据我们所知,这是有史以来金额最高的版权赔偿,也是人工智能时代的首例此类案例。”
尼尔森还补充道,Anthropic同意分四次支付和解金,首笔付款为3亿美元,需在法院批准和解条款后的5个工作日内支付。
旧金山地区法院法官威廉・奥尔苏普(William Alsup)已安排于周一举行听证会,以审查该和解协议的条款。
据专家分析,如果Anthropic未能与原告达成和解,且在原定于今年12月的审判中失利,该公司或将承担更为高昂的损失。威科集团(Wolters Kluwer)法律分析师威廉・朗(William Long)称:“我们判断,Anthropic面临数十亿美元赔偿的可能性极大。天价赔偿不仅会对公司造成严重冲击,甚至可能使其走向破产。”
这一事件标志着创作者在长期控诉AI公司侵犯知识产权的背景下,首次获得可量化的经济回报。然而,这一“胜利”背后,却隐藏着对行业格局和出版生态可能产生的长期冲击。在Anthropic与原告达成和解协议后不久,公司便宣布完成了130亿美元的巨额融资。
书籍作者在该网站提交信息以获取赔偿
2023年,一个名为Books3的数据集悄然流传于技术圈。它的创建者并非大型科技公司,而是一群希望推动学术研究的独立AI研究者。他们试图搭建一个足以匹配OpenAI所使用训练语料规模的数据集,以便学界在语言模型研发上不至于落后太远。Books3汇集了约19万册书籍的数字版本,其中包括大量仍处在版权保护期内的文学与学术作品。研究者们最初的出发点是推进“研究公平”,但他们很快意识到,数据集一旦公开,便难以控制使用范围。
正是在这一语料库的基础上,Anthropic迈出了敏感的一步。根据美国加州北区地方法院法官威廉·阿尔萨普(William Alsup)的裁定,Anthropic在训练旗下Claude模型时,下载了超过700万册数字书籍,其中包括Books3中的作品。法官在裁决书中明确指出,Anthropic“明知这些书籍已被盗版”,仍选择使用。
裁决文件还显示,Anthropic并未止步于Books3。随着模型训练规模的不断扩大,该公司从盗版网站Library Genesis(LibGen)获取了至少500万册书籍,又从Pirate Library Mirror获取了约200万册。这两个网站长期以来都是全球最知名的盗版书库,几乎囊括了从畅销小说到学术专著的各类资源。它们被不少科研人员视作“知识的地下水源”,却也被出版业痛斥为“文化领域的最大盗版黑洞”。
在被曝光的数据中,包括了作家安德烈亚·巴茨(Andrea Bartz)的处女作《失落之夜》(The Lost Night)。这本畅销悬疑小说的出现,使得案件不仅停留在抽象的版权层面,更直击创作者的切身权益。在这一背景下,巴茨和另外两名作者——查尔斯・格雷伯(Charles Graeber)、柯克・华莱士・约翰逊(Kirk Wallace Johnson)——在2024年向加州北区联邦法院提起指控,指控Anthropic存在“大规模版权侵权行为”,通过从涉嫌盗版数据集下载图书并用于商业开发。对于她和其他数千名作家而言,这不仅仅是一场法律诉讼,更是一场捍卫尊严与劳动成果的斗争。
美国作家协会(Authors Guild)随即介入,组织大规模的维权行动。该协会在2024年6月致信数千名会员,直言若法院最终认定Anthropic存在故意侵权,每部作品的赔偿金额将“至少为750美元,甚至可能更高”。这在出版界引起了轩然大波。协会同时强调,大模型训练并非“合理使用”的范畴,因为其直接复制了完整的作品,而非引用片段。
案件的转折出现在和解阶段。经过数月谈判,双方最终达成一致:赔偿金额约为每部作品3000美元。这一数字虽然低于部分作家期望的上限,但远高于美国版权法的最低赔偿线。法律界人士普遍认为,这反映了和解过程中对“有效作品池”的缩减,即剔除了重复数据以及部分不在版权保护范围内的书籍。
美国作家协会首席执行官玛丽·拉森伯格(Mary Rasenberger)在宣布结果时用了“完美的结果”(Excellent Result)这一罕见的积极表述。她强调,这一和解是“对作者、出版商以及所有版权持有人的重大胜利”,同时也是“对AI行业的强烈警告”。她的话点燃了许多作家的情绪:“当他们盗用作家的作品来训练模型时,就必须为此承担严重后果。这种行为实际上是在掠夺那些最无力承担损失的群体。”
案件细节曝光的同时,公众也重新认识到书籍在人工智能训练中的特殊地位。不同于互联网零散的网页片段,书籍以其完整的结构、连贯的逻辑和精致的语言,提供了大模型最稀缺的“深度语料”。
本案原告之一、《失落之夜》作者安德烈亚·巴茨
当Anthropic大规模使用盗版书籍的消息被披露后,美国作家群体的反应迅速而强烈。对许多作家来说,这不仅是一场版权诉讼,更是一种被冒犯的体验——他们的作品、他们的语言、他们的心血,竟然在未经允许的情况下被作为“原料”输入进一台冰冷的机器。
巴茨的小说《失落之夜》出版后便成为畅销书。但在2024年,她却意外发现这本书被包含在Books3数据集中,并被Anthropic用于Claude模型的训练。巴茨在接受媒体采访时表示:“这种感觉就像有人闯进了我的家。”她强调自己并不是反对AI,而是反对这种未经授权的剽窃。
巴茨并非孤例。随着案件细节曝光,越来越多的作家开始检索Books3以及LibGen数据集,发现自己的作品赫然在列。有作家愤怒地在社交媒体上写道:“Claude在回答问题时可能正在使用我书中的句子。”
美国作家协会迅速将分散的愤怒汇聚为集体行动。协会不仅向法院递交诉状,还在内部通信中号召会员关注案件进展。协会在给会员的信中明确指出:AI公司不应把“合理使用”作为幌子。
Anthropic与书籍作者的和解不仅是一个公司内部的法律事件,更成为AI行业和整个创意产业的重要信号。
这次和解为其他AI企业提供了“参考模型”。Meta、OpenAI、Google、Stability AI等公司长期依赖大量文本训练其语言模型和生成式AI系统。Anthropic的案例清楚地表明:使用盗版或未经授权的数据训练AI并非零风险。
行业观察人士指出:Anthropic的和解金额——每部作品约3000美元、总额15亿美元——虽然对作者群体而言具有历史性意义,但对Anthropic这种估值达到1830亿美元的AI公司而言只是“运营成本的一部分”。这种事实让行业内的风险评估发生了变化:未来即便面临类似诉讼,AI公司也可能计算出“合理和解成本”,将版权侵权风险纳入整体商业策略。
Anthopic的版权和解事件之所以引发行业广泛关注不仅在于和解金额创纪录更在于这一进展与其新一轮巨额融资的时间节点高度重合短时间内完成和解与融资显示出企业在法律、金融与战略规划上的精密协调也折射出AI行业独特的商业逻辑。
根据法庭文件和公开报道Anthopic与书籍作者的和解协议在2025年8月底达成原定于9月初提交法院审查同一时期公司完成了F轮融资筹资金额高达130亿美元投资后估值达到1830亿美元换言之和解协议几乎与融资同步完成这种时间上的“巧合”实际上是经过精心规划的战略安排。
法律专家分析这种安排的核心在于降低投资者风险感知版权诉讼若持续未解会增加潜在投资者的法律与财务不确定性Anthopic通过快速和解不仅锁定了赔偿金额上限也消除了未来不利裁决可能带来的巨大不确定性从而向投资者传递出“企业法律风险可控”的信号。
本文由主机测评网于2026-04-27发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260440924.html