合理使用非万能数据授权机制成关键

来源:中国新闻出版广电报时间:2025-08-14

　　在人工智能技术与版权法交汇的关键节点，Meta公司在一场由图书作者发起的盗版诉讼中赢得部分合理使用抗辩。美国加州北区地方法院法官文斯·查布里亚虽支持Meta公司关于合理使用的核心主张，但明确指出该裁决仅适用于本案特定情形，更通过详细法律分析为未来人工智能开发者面临的版权挑战划定关键路径。这场涉及作家理查德·卡德雷、莎拉·西尔弗曼和克里斯托弗·戈登等13位创作者的集体诉讼，因Meta被指控使用盗版书库训练其Llama模型而引发行业高度关注。

　　焦点：AI训练行为是否构成“合理使用”

　　自2023年起，全球范围内掀起针对AI企业的版权诉讼浪潮。该案原告指控Meta通过BitTorrent网络获取数百万本盗版电子书，将其作为训练Llama大型语言模型的核心数据源。Meta虽承认使用非官方渠道获取的文本资料，但坚决否认直接侵权，并以“合理使用”原则作为核心抗辩理由。双方于2025年3月分别提交简易裁决动议，焦点集中于AI训练行为是否构成版权法意义上的“合理使用”。

　　法院法官文斯·查布里亚在裁决中系统分析了美国版权法第107条规定的合理使用四要素：

　　使用目的与性质：认定Meta对书籍的使用具有“转化性”，因其通过算法提取语言模式而非复制内容，最终产物LLM模型属于“创新工具”，功能远超出原始文本的文学表达。

　　作品性质：承认涉案书籍多为虚构类文学创作，但未过度强调该因素对合理使用的影响。

　　使用量：指出Meta虽系统性复制全书内容，但具体使用场景中仅提取统计特征而非实质性文本片段。

　　市场损害：判定原告未能证明实际或潜在市场损害，成为案件转折关键。

　　值得注意的是，该案的原告提出的三项市场损害主张均遭到法院驳回：直接替代风险：通过专家测试证实，即便在“对抗性提示”场景下，Llama模型也无法从单本受保护作品中生成超过50个连续单词，不具备实质性替代能力；许可市场损害：法院明确拒绝将“假设存在的AI训练许可市场”纳入赔偿考量，强调版权法仅保护现实存在的市场，而非潜在商业机会；市场稀释理论：法官虽承认该理论可能构成合理使用挑战，但指出原告仅提出概念而未提供实证数据，例如AI生成内容对图书销量的具体影响统计。

　　意义：为人工智能开发者敲响警钟

　　尽管Meta公司明确胜诉，但法院的裁决对其来说却是一场苦乐参半的胜利。该动议只涵盖了版权主张的一部分，因为Meta公司涉嫌分发盗版书籍的行为并未被纳入审理范围。此外，该裁决只适用于本案中的13位署名作者。

　　此次“胜诉”并不意味着合理使用抗辩在其他人工智能培训版权案件中也能成立。事实上，法院暗示，Meta公司和其他公司可能需要接受为此类用途获取内容授权的理念。

　　Meta公司认为，负面的合理使用裁决可能会阻止人工智能技术的发展，因为人工智能模型需要海量的数据进行训练。然而，法院驳回了这一推论。

　　查布里亚在裁决书中写道：“不利的版权裁决会让这项技术停滞不前的说法是荒谬的。这些产品预计将为其开发公司带来数十亿甚至数万亿美元的收益。如果使用受版权保护的作品来训练模型真像这些公司所说的那样有必要，他们理应设法补偿版权持有人。”

　　法院作出有利于Meta公司的裁决，更多是因为作者们未能充分论证市场稀释的主张，而不是人工智能培训的合理使用明显获胜。

　　查布里亚表示，基于现有庭审记录，法院别无选择，只能作出有利于Meta公司的简易裁决。不过，这当然并不意味着类似的论点在其他案件中也会成立。

　　裁决书明确指出：“现在应当明确，这一裁决并不代表Meta公司使用受版权保护的材料来训练其语言模型的行为是合法的。它只代表这些原告提出了错误的论点，并且未能提供支持正确论点的证据。”

　　随着全球AI监管趋严，该案凸显技术发展与版权保护间的深层矛盾。Meta虽暂时避免直接侵权责任，但法院对授权机制的暗示，预示着行业或将迎来数据使用规范化的转折点。如何在创新需求与权益保障间寻求平衡，仍将是法律与技术领域持续探索的命题。

　　（中国保护知识产权网）

全屏阅读
放大
缩小
默认

Meta公司在人工智能“盗版”案件中取得部分合理使用抗辩胜利——

合理使用非万能数据授权机制成关键

本版列表新闻