数智时代,如何破解新业态下的版权新问题

作者:卢海君 王芷若 来源:中国新闻出版广电报 时间:2024-06-27

资料图片


  以人工智能技术为代表的第四次工业革命席卷全球,数智技术已然成为新质生产力的重要驱动力量,我国传统版权产业发展须同数智技术相向而行。然而,数智技术给版权法律带来了许多新问题。如何科学解题不仅是法律适用问题,更要关注政策选择。如何智慧求解,关乎我国相关产业的发展。


  版权数据资源与科技资源的合作面临挑战


  数智技术浪潮的席卷给传统版权产业同时带来机遇和挑战。一方面,数智技术赋能内容生产,催生了数智版权产业,人工智能的崛起更是在一定程度上颠覆了传统的知识生产和传播模式。数智技术亦在不断发展和迭代,从Web1.0(个人电脑时代的互联网)到Web2.0(移动互联网),再到Web3.0(AR、VR、元宇宙),作品传播的路径和应用场景日新月异;从PGC到UGC,再到AIGC,作品创作的形式和传播样态纷繁复杂。

  具体而言,随着生成式人工智能技术的不断发展,利用人工智能进行创作的场景越来越多。目前,人工智能已经广泛应用于影视制作(视频生成视频)、动漫、微短剧、非玩家角色等领域。在人工智能时代,利用人工智能辅助生成内容在一定程度上已经常态化,且至少在特定范围内人工智能生成物已然达到“以假乱真”的程度。

  另一方面,数智技术带来相关版权法律问题。在大模型训练的过程中,数据喂养是关键一环,高质量的数据成为人工智能生成物品质的决定性因素之一。然而,国内的大模型基本已经“学完”来自公有领域的数据,大模型学习对优质数据的强烈需求同数据持有者的权益保护诉求成为一对必须面对且须通过特定手段解决的重大课题。

  由于各种原因,例如,基于平台优势,一些大模型开发者天然具有数据优势,而另一些大模型开发者则存在极度的数据短缺。由此,我国人工智能产业发展中存在不平衡的状况。另外,人工智能产业的竞争可能还面临其他问题。例如,国内模型开发大多基于国外的开源模型,这不仅存在合规风险,在一定意义上也可能存在安全隐患。

  据权威调查,目前用于自然语言处理训练超半数的公开数据集没有许可证,其正当性存疑。另外,值得注意的是,数据公开并不等于权利人放弃版权利益,开源数据集的利用亦受制于开源协议,否则可能存在版权侵权风险、违约风险及其他风险。如何在保证国际竞争力的前提下遵循科学规律来开展人工智能产业的市场竞争是摆在行业发展面前的重要议题。人工智能产业发展参与主体复杂、利益主体多元,这给人工智能产业发展的监管带来不少挑战。如何配置责任、如何追责才能达到利益均衡的状态不仅考验我国的管理部门,也对包括美国、欧盟在内的其他国家和地区提出监管难题。

  以出版业为例,在数智技术出现之前,传统出版业主要是纸质出版和其他有形载体(例如磁带、磁盘、光盘等)出版;在数智技术到来之后,传统出版业发生了重大转型。面对数字技术的冲击,传统出版业正从载体供给、知识提供演进到知识分析、知识优化、知识喂养、知识供养和知识服务的新模式,出版从业者正不断推动从传统出版到智能出版、智慧出版的转型。

  数智技术可创新内容生产,基于读者需求提供定制化服务,赋能智慧内容生产和传播;可创新翻译与编辑校对,给传统翻译和编辑工作带来“指数级”的助力;可创新营销方式,不仅能够打造数字图书馆、VR空间图书馆及AI交互式内容,甚至通过脑机接口进入“意识流”交流的时代,且通过技术加持,可绘制知识图谱,建构销售预测模型,创新出版和服务的呈现形式,亦可通过虚拟数字人以“图书+课程”的方式创新产品形态与服务;可创新管理与赋能发展,可打造诸如速读功能、智能决策等新的产品形态,可推动传统出版业从出版服务到知识服务的转型。

  然而,数智时代的到来也给传统出版业带来极大挑战。一方面,品质不高的书籍以及移动阅读对传统纸质图书市场带来致命打击;另一方面,虽然传统出版业持有大量以数据形式呈现的优质版权内容,但缺乏数据管理、数据治理、数据交易及数据维权的经验,导致无法融入数据产业链条,无法实现出版数据产品提质增效。此外,在“人工智能+出版”的实现过程中,不少出版机构虽进行了垂类开发和应用,但如何实现版权数据资源与科技资源的合作共赢依然面临诸多挑战。


  业界期待版权争议有更明晰的解决思路


  数智时代关于版权的争议不断涌现,其中,作品新的传播和利用形式是否构成版权侵权备受关注。在AR、VR、元宇宙等场景中对作品的利用是否构成版权侵权及侵犯何种权利争议不断。

  又如,通过“讲书”的方式对作品进行利用是版权侵权还是合理使用?大模型需要大量的优质数据,数据是否可被自由利用,机器学习是否构成对复制权、发行权、改编权、信息网络传播权及其他权利的侵犯,机器学习又是否构成合理使用,人工智能生成物是否构成作品、是否具有可版权性、是否可能构成版权侵权等问题正考验我国司法实践,业界期待有更明晰的答案。

  算力、算法和数据是大模型的三大要素,均发挥着重要作用。然而,人工智能生成物的权益归属是否应受上述因素的影响及受到何种程度的影响依然需要探讨。例如,集成大模型付诸应用的民商事主体可能是优质数据持有者,在垂类应用中用上述优质数据进行模型训练是否会惠益基础模型,是否适宜通过用户协议约定用户生成内容的权益归属于服务提供者,垂类应用的服务提供者如何在此种应用场景中最大化自己的利益,都需要进一步研究和探索。

  如何打破算力瓶颈、提升算法质量及补齐数据短板应成为当前我国政策选择中的主要着力点。数智时代所带来的不仅是“变革”,还是“革命”。面对新技术带来的新业态、新领域、新问题,法律滞后、规范存漏是常态。在此种情形之下,行业发展需要规范,并且存在制度供给的需求。笔者认为,在这个阶段应更多地指引和促进,而非更强的监管和约束,应更多地促进产业对话和协同合作,以更好地促进多方发展。

  实践中,我国人工智能产业发展存在一定市场失灵的情形,此种市场失灵可能源于垄断(例如算力垄断、数据垄断)、外部性、不完全信息(例如数据持有者与模型训练者之间的信息不对称)及交易成本问题(例如版权数据的确权及利用中的交易成本)。在市场失灵的情形下,试图通过产权设定达到资源配置的最优化可能存在一定困难。此时,可通过一定程度的政府干预,例如,通过算力促进来打破算力垄断,通过数据供给来打破数据垄断,通过数据公共产品的提供来解决数据短缺问题,通过模型可解释性、可行的训练数据披露来解决信息不对称的问题,通过税收、补贴等手段将外部性问题内部化,通过打造国家级数据交易平台降低交易成本等。


  或可选择审慎包容的柔性管理


  科技创新是新质生产力的核心驱动力,数智技术是新质生产力的核心要素。数智技术不仅能够赋能传统制造业的发展,亦将对版权产业的发展带来革命性影响。以数智技术为重要驱动力的版权产业将成为“未来产业”的重要一环,与数智科技结合、由数智科技赋能和引领的版权产业是新质生产力的重要组成部分。

  管理部门应大力推动“未来版权产业”的产品化、市场化及公益化。这其中,必然遇到以产权设定为基础的市场机制建构问题。在数智时代的“新版权产业”中,诸多问题尚在探索,诸多形势尚不明朗。此时,宜遵守“市场先行、监管托底”的思路,循序渐进“摸着石头过河”。不宜过早立新法,亦不宜过早通过裁判进行指引,而应尽量在现有制度的框架之中寻求过渡性的解决方案。

  例如,对于机器学习是否构成合理使用,一些从业者寄希望于《著作权法实施条例》的修订能够一锤定音。OpenAI官宣与新闻集团日前达成机器学习新闻版权数据的合作协议,这一事件尽管发生在美国,但对我国人工智能产业发展具有一定启示意义:主张机器学习属于合理使用或许在理论上可以证成,同时也有诸如在欧盟、日本等国家和地区的立法中将数据挖掘和非欣赏性使用界定为合理使用的做法,但试图对数据持有者的优质版权数据进行免费使用既不现实,亦可能并不合理。因此,可以预见的是,我国的大模型开发者在穷尽公有领域的数据之后,宜通过授权付费的方式获得更多更优质的数据。

  已有的实践经验值得被关注。例如,在人工智能产业发展中,不纠结算力、算法和数据中的哪种因素起到关键性作用,而是通过“算力伙伴”“算法伙伴”与“数据伙伴”的资源整合和优化配置在“协商”的基础之上将产品做出来,再慢慢探索问题的解决方案。笔者认为,国家应支持建立优质数据库,指引数据合规,大力推动我国数字技术和人工智能产业发展,赋能我国版权产业升级换代,增强核心竞争力。

  数智时代的很多问题具有“未来性”,在“未来”并不明朗的时候,管理部门或可通过审慎包容的柔性管理代替过早的产权设定。

  〔作者单位:对外经济贸易大学法学院、郑州大学法学院(知识产权学院)〕