科技发展与版权保护:

平衡之道何在?

作者:时萧楠 王怀玉 来源:中国新闻出版广电报 时间:2024-11-21

  近期,德国汉堡地区法院对Laion案作出裁决,这是全球首例对AI训练是否构成版权侵权予以明确的裁决。该案中,原告的版权侵权诉讼主张因被告的行为符合德国《版权及邻接权法》(以下简称UrhG)规定的用于科学研究目的的文本和数据挖掘的例外而被法院驳回。

  原告Robert Kneschke是一名摄影师,他将拍摄的涉案照片授权给图片代理商,并通过代理商网站对外展示、许可涉案照片。代理商网页中使用“自然语言”明确涉案照片的权利保留。被告Laion是一个非营利性组织,其创建并免费提供的数据集(以下简称涉案数据集)中包含涉案照片。该案中,法院认为Laion复制涉案照片的行为不构成UrhG第44a条规定的临时复制,但满足UrhG第60d条用于科学研究目的的文本和数据挖掘的适用条件,在法院认定Laion可以援引UrhG第60d条抗辩的前提下,法院未对Laion行为是否可以援引UrhG第44b条的文本和数据挖掘的限制作出最终决定,仅对该部分内容进行了法理分析。即在该案中,UrhG第60d条优先UrhG第44b条的适用。

  UrhG条款下的法律边界

  Robert指控Laion未经许可复制了原告版权图片,Laion独立下载照片的行为不满足UrhG第44a条的适用条件。Laion主张其在短时间内分析图像后立即并不可撤销的删除涉案照片的行为构成临时复制。

  根据UrhG第44a条规定,满足临时复制的要求必须同时具备以下三个要素:临时性/短暂性、附随性(附随于特定的技术过程)、具备作为中介传输或合法使用且不具有独立经济意义的唯一目的。

  法院认为,Laion的复制行为不是短暂的也不是附随的。被告无法明确涉案照片的具体存储时间,涉案照片的删除基于人为编程实现,而非在完成特定功能后自动删除,无法证明Laion的复制行为的短暂性。

  基于上述判断思路,抓取版权材料用于AI训练的过程仍存在适用临时复制的狭小空间,即非永久性下载数据,将数据抓取过程作为AI分析数据的附属过程,抓取的数据以“缓存”的方式存在,待AI分析数据过程完成后,该“缓存”被自动删除。此过程虽然满足临时性和附随性要件,但是唯一目的要件层面仍存在阻碍,AI训练过程对抓取数据的使用难以满足作为中介传输的唯一目的,且在权利保留或禁止数据抓取等条款存在的场景下抓取数据是否构成合法使用也暂不明确。

  Robert主张AI数据抓取的过程使用了“智力创作的内容”并以“创造相同或类似的竞争产品”为目的,损害了受版权保护作品的正常利用。代理商网站上存在机器可读的禁止复制的保留条款,不满足UrhG第44b条(3)的适用条件。Laion则主张代理商网站的权利保留条款机器不可读,并且未明确提及禁止文本和数据挖掘。

  法院认为Laion的复制行为满足UrhG第44b条(1)中的相关性要求,即对涉案图片的下载是为了分析涉案图片与相应文字的相关性,并进一步强调不应根据复制行为的目的而直接排除UrhG第44b条的适用。在对受版权保护作品是否受到损害方面,法院认为创建涉案数据集并不当然损害权利人的合法利益,不能通过未来的损害可能性禁止所有AI训练过程对UrhG第44b条的适用。

  非商业性AI训练的数据抓取合法性

  尽管法院未对未经授权将版权材料用于AI训练是否符合UrhG第44b条的限制作出明确裁定,但可以从法院的分析中看出以下倾向性:抓取数据用于AI训练的行为可能被认定为为收集信息对单个或多个数字化作品进行自动分析的行为,即满足UrhG第44b条(1)的要件;可抓取可公开获得的材料用于AI训练,但在训练完成后,需尽早删除抓取的材料;版权权利人可通过权利保留的方式禁止未经授权的下载、抓取等行为,采用“自然语言”+“机器可读语言”的权利保留方式更容易获得法院支持。

  Robert承认Laion从事的是以科学研究为目的的文本和数据挖掘,但其认为Laion与以商业为目的的AI提供者有密切联系。Laion则主张其接受过商业公司提供的计算资源,但未获得资金支持,也从未向商业公司优先提供其研究结果。

  法院支持Laion援引UrhG第60d条,认为Laion创建涉案数据集作为AI系统训练的基础,该行为本身就属于科学研究的范畴,且涉案数据集免费发布可供相关研究人员使用。科学研究是否具备商业目的取决于科学活动的性质,而与研究机构组织和资金无关,涉案数据集的免费公开可以印证Laion的非商业目的。Robert未充分举证证明其他商业公司对Laion的人员、资金资助对Laion的决定产生重大影响,或使得其他商业公司对Laion的研究成果取得优先访问权,基于此,法院认定Laion的复制行为满足UrhG第60d条的适用条件。

  UrhG第60d条的适用似乎为AI训练的合法性开辟了新路径,即AI 开发者可通过“建立非营利的研究机构——抓取数据构建数据集——免费向公众公开数据集”的方式规避版权侵权。但也需注意,研究机构存在被法院认定为与AI 开发者进行合作进而无法援引UrhG第60d条进行抗辩的风险。

  (作者单位:北京植德律师事务所)