可版权性、数据训练合法性及平台责任边界——

人工智能时代版权保护三大难题如何破解?

作者:本报记者 汤广花 来源:中国新闻出版广电报 时间:2025-07-17

  人工智能与版权治理国际研讨会现场。

  主办方 供图


  “技术不应凌驾于权利之上,也不应被权利所禁锢。”近日,由中国文字著作权协会与国际复制权组织联合会主办的人工智能与版权治理国际研讨会在湖北武汉举行,来自国际版权组织、学术界及产业界的专家学者围绕人工智能技术引发的版权挑战与治理路径展开深度对话,不仅为国际间的合作搭建平台,也为中国参与全球数字版权规则制定提供了理论支撑与实践参考。


  训练数据使用和平台责任存在分歧


  “近年来,人工智能发展进入新阶段,生成式人工智能快速迭代,使用有版权作品训练生成式人工智能并生成新内容的行为的合法性争议较大,理论研究急需加强。”中南财经政法大学知识产权研究中心教授胡开忠说,人工智能生成物涉及的利益主体,根据数据训练、人工智能生成物生成等阶段,包括著作权人、人工智能技术开发者、人工智能平台用户等。

  胡开忠坦言,数据训练中使用作品行为的合法性问题非常复杂,既要依据知识产权侵权行为构成要件,看是否构成侵权行为,也要根据《伯尔尼公约》规定的“三步检验法”或美国《版权法》规定的“四要素法”,看是否构成合理使用。“如果训练生成式人工智能生成的作品与自己的作品构成实质性相似,且用于营利目的,则存在侵权之嫌,权利人可以通过提起诉讼等方式进行维权。”胡开忠说,人工智能生成物是在现有作品或信息的基础上完成的,可以考虑采用法定许可使用方式,要求人工智能企业在数据训练中给予权利人适当的经济补偿,这既保护了著作权人的权益,也促进了人工智能技术的发展。

  “生成式人工智能的著作权争议主要集中在三个方面:人工智能生成内容的可版权性、机器学习使用作品的合法性和生成式人工智能平台的侵权责任。”华中科技大学法学院教授熊琦介绍,当前,全球对人工智能生成内容的著作权规制已形成“人类创作主导”的共识,认为只有人类才能拥有作者身份,人工智能生成内容只有在其生成过程有人类干预,且符合作品其他构成条件的情况下,才能获得《著作权法》保护。著作权制度的规范结构始终秉持自然人创作激励的著作权目标,无意为人工智能提供额外保护。

  但在训练数据使用和平台责任上仍存分歧,各国基于不同的立法传统与政策选择了宽严不一的权利限制方案,使得司法上因缺乏共识而陷入“扩张合理使用”与“优先补偿著作权人”的价值摇摆。人工智能平台究竟属于提供服务还是提供内容,不但有关政策文件内涵和表达存在差异,司法判决的结果也并不统一。

  熊琦建议在现有法律框架内,通过司法细化和柔性解释,平衡版权保护与人工智能产业发展。例如,围绕人类创造贡献建立更为细化的评判标准,仅仅通过提示语提供预期内容的一般概念不应被视为创作者;将非营利性人工智能训练纳入豁免范围;通过对避风港原则“应知-必要措施”和“通知-必要措施”的专门解释来应对平台侵权问题。

  中南财经政法大学文澜资深教授吴汉东在主旨演讲中,从法律价值、政策立场和规范架构,分析了人工智能时代知识产权立法应对问题。他主张“开放的保守主义”或“谨慎的革命主义”,鼓励数据库的许可交易,让权利人得到适当补偿,同时保障AI数据来源合法,同时建立权利人的权利保留制度。合理使用总体上必须符合公平的惯例,合理使用并不是绝对的也不是无偿使用,可以少量地支付报酬。


  著作权集体管理搭建版权方与人工智能产业桥梁


  “支持版权与支持人工智能是可以并存的,但追求技术进步绝不能在摧毁文化和内容产业的代价下进行——必须尊重创作者的权利,人工智能的开发和使用必须负责任。”国际复制权组织联合会(IFRRO)区域政策与公共事务主管萨拉·陈在分享中说,强大而灵活的知识产权框架支撑着健康的创意生态系统,促进公平访问优质作品,并为创作新作品提供适当的激励;数字化转型和人工智能技术可能带来巨大的潜在利益,但必须设立相应的保护措施。“IFRRO倡导使用权威、可信的内容来负责任和公平地训练大型语言模型,并遵守《著作权法》和版权所有者的权益。”

  “复制权组织提供高效且全面的许可解决方案,促进对优质作品的公平和有偿访问。”萨拉·陈从全球视角强调集体管理制度的重要性。在她看来,集体管理具有显著减少行政负担和成本、为创作者和权利人提供公平的报酬等优势。据其介绍,IFRRO目前有161个会员单位、90个成员国、36家创意与出版协会、125个复制权组织以及众多的作家及出版商,文著协是其会员。2024年IFRRO成员组织总计为权利人收取11亿美元版权费。集体管理组织在管理大规模许可方面具有独特的优势。她呼吁建立“尊重版权、设立相应的保护措施,有透明度和问责”的人工智能训练标准,避免滥用“合理使用”例外。

  “人工智能技术的发展既要保护创作者、内容生产者合法权益,又要激发全社会创新创造活力,推动产业高质量发展。”中国文字著作权协会常务副会长兼总干事张洪波系统阐述了文著协在人工智能时代版权治理的核心立场。他指出,当前人工智能语料库建设和大模型训练中未经授权使用版权作品的现象突出,争议焦点在于“文本与数据挖掘(TDM)”是否构成合理使用。这其中有两种倾向需要警惕:一是将TDM视为“非《著作权法》上的复制行为”而试图豁免版权责任;二是以“技术必然性”为由否定对权利人的补偿。

  张洪波坚持以“以人为本、智能向善”为出发点,强调技术发展不能以牺牲创作者权益为代价,呼吁国家在制定有关政策和司法解释时,明确人工智能生成物版权合理使用的边界和适用条件,遵循技术向善或智能向善原则与公平原则,设定法定许可与版权补偿金制度,充分发挥集体管理组织的法定地位、本质功能和社会功能优势,实现“保护”与“发展”的双轮驱动。在他看来,集体管理组织管理权利人自己难以行使和控制的部分版权,让权利人利益最大化;同时,通过“一揽子”授权、“一站式”服务,推动版权费提存、转付,解决使用者的海量作品授权,其根本目的在于降低版权交易和维权的社会成本,促进版权作品有序传播与版权规范流转,推动产业发展。“集体管理组织愿意在相关管理部门指导下,与人工智能生成物开发者、提供者建立对话会商机制,建立版权集体授权、版权费提存转付和版权纠纷统一协调机制,维护权利人合法权益,推动人工智能产业健康规范发展。”张洪波表示。

  “目前,全球75%的创作者正在使用生成式人工智能,人工智能在各行各业广泛应用。”美国版权结算中心(CCC)国际关系高级总监维多利亚诺·科洛德隆认为,版权和人工智能的交集包括诸多方面,例如,在训练过程中会产生受版权保护材料的复制品;大型语言模型会存储训练内容,并能以原始形式调用这些内容;若输出内容与作为输入材料的作品相同或过于相似,可能产生版权责任。目前,全球范围内,涉及人工智能和版权的案件不断涌现,然而,大多数国家没有专门的人工智能相关法律,而是依赖现有的法律。

  维多利亚诺·科洛德隆说,成立于1978年的CCC,以推进版权保护、加速知识传播、赋能创新发展为宗旨,提供面向人工智能领域的集体许可解决方案,包括思想引领与教育、版权倡导和许可等。具体而言,目前,CCC提供两类面向人工智能的集体许可方案:一是仅面向企业内部人工智能应用的集体许可,允许合法获取内容用于训练、文本分析及质量控制;二是面向人工智能系统训练的集体许可,覆盖第三方及公共模型开发,要求内容合法获取并限制输出形式。他提出,市场化许可机制既能保障权利人获酬,又能为人工智能企业提供法律确定性。CCC这样的集体管理组织就是保障人工智能合法获取数据,保障权利人的二次使用获酬权。


  构建人工智能治理的动态平衡机制


  “在知识产权语境下,技术中立对知识产权制度产生了深远的影响,对权利保护与限制、限制与反限制等利益平衡机制发挥了重要的作用。”中南财经政法大学知识产权学院副院长徐小奔基于1984年美国的索尼案分析说,新技术的出现既有可能带来侵权风险,也可能创造新的社会福利,此时应全面分析风险与收益的权重。而著作权合理使用是保障技术中立的重要制度工具。

  “发展人工智能技术有利于《著作权法》立法目的的实现。”徐小奔认为,数字时代,公众对作品的利用从“获取作品有形复制件”转变到“直接欣赏作品内容”。世界各国开始探索赋予著作权人通过技术措施控制作品在互联网上传播方式的权利,技术措施保护规则应运而生。著作权技术措施包括“接触控制措施”与“版权保护措施”两种类型,互联网上数字作品保护的关键在于接触控制措施,即防止他人未经许可阅读、欣赏文学艺术作品或运行计算机软件等“接触”作品内容的技术措施。据此,他提出“技术中立”需与版权责任兼容,建议以自治型注意义务为基础设置注意义务,采用“避风港原则+红旗原则”规定人工智能服务商义务,对专用于模仿特定作者风格的工具施加主动过滤责任。

  “随着人工智能产业的专业化、集群化、规模化,语料库建设越来越受关注,高质量语料供给成为模型性能的决定性因素。”中南财经政法大学知识产权研究中心讲师付丽霞介绍,人工智能语料库是汇集大量来自书籍、学术文章、社交媒体等渠道的文本、图片、音频、视频数据集合,是数据训练的基础。据统计,2023年全球人工智能训练数据语料库市场规模价值达23.9亿美元。人工智能语料库还关系国家文化安全。对此,付丽霞提出,在人工智能语料库建设的版权问题上,对数据获取需分类治理,避免“一刀切”。她警示,过度限制权利人权益可能导致“数据墙”危机,建议探索法定许可与补偿金制度,保障高质量语料供给。

  当天的研讨会上,与会专家还从人工智能标识义务、人本主义立场、出口端治理等方面,对人工智能时代的版权立法与社会治理提出建议。

  湖北大学法学院副教授张颖聚焦人工智能时代版权保护中的标识义务问题,指出其核心是帮助用户识别内容来源,应对人工智能内容质量乱象。她认为,当前标识义务在法规中已有体现,但制度化程度低,责任主体界定存争议,需与《著作权法》相关制度衔接,其构建是成本效益博弈,需进一步探索。

  武汉工程大学法商学院教授代江龙围绕人工智能时代的人本主义立场,以与人工智能设备互动为例,指出人工智能生成与互动发展已超预期。他赞同在现有版权立法和社会治理框架下进行解释,但强调需重视保护灵感这一人类区别于机器的核心要素。

  湖北元申律师事务所律师张家松和湖北维力律师事务所副主任周家奇根据版权实务提出两点看法:一是人工智能治理应“管出不管进”,因为训练阶段侵权因未公开作品而存争议,而生成作品发表传播后可通过比对实质性相似才能认定侵权;二是人工智能对作品风格的高度模仿,虽不构成传统《著作权法》上的实质性相似,但风格高度模仿是豁免还是保护,需进一步研究。