生成式人工智能数据训练版权合法化路径研究
来源:中国新闻出版广电报 时间:2025-12-11

本研究聚焦生成式人工智能数据训练中的版权挑战,并提出构建相关路径的建议。研究认为,生成式人工智能数据训练依赖于大规模、高质量的作品数据,可分为数据收集、数据存储、数据处理与数据生成四个阶段,可能涉及侵害复制权、改编权与信息网络传播权。
合理使用制度因其利益平衡与适用弹性,应成为数据训练规制的主要路径。建议明确“非表达+商业”和“表达+非商业”两类训练行为的合理使用适用情形。若“利益差”不断扩大,可补充引入法定许可制度,以解决高强度商业性数据训练中的再分配问题。
规则设计上,应遵循包容审慎、均衡性与确定性三原则构建权利限制体系。立法路径上,建议优先通过修订《著作权法实施条例》细化合理使用与法定许可适用条件、使用者义务与披露机制。