“白泽”数字版权保护平台——

为数字内容优质发展提供可信人工智能技术

作者:本报记者 赵新乐 来源:中国新闻出版广电报 时间:2023-07-20

“白泽”数字版权保护平台。 人民中科 供图


  在日前举办的2023中国新产业(北京)峰会上,人民网、人民中科对外发布“白泽”数字版权保护系统,“白泽”数字版权保护平台正式上线。

  《中国新闻出版广电报》记者了解到,基于跨模态大模型的内容理解能力,“白泽”数字版权保护平台可实现对数字内容的高效理解、识别及分析,提升数字版权的运营效率和保护能力。


  机器生成(AIGC)催生机器发现(AIDC)


  近年来,数字经济和实体经济深度融合,新技术、新产业、新业态、新模式不断涌现,推动经济结构不断优化,经济效益显著提高,也对人民群众的生活产生了深远的影响。

  人民中科首席科学家李兵介绍,随着技术的进步,内容呈现方式日趋视频化、互动化,内容形态已经从传统的文本、图片发展到以音视频为主的多模态内容。自动化工具的普及,让内容的生产变得更加大众化、个人化的同时,使用和传播别人的内容也变得十分容易和方便。尤其是最近几年出现的基于生成式人工智能(AIGC)的全自动方法,使内容的生产效率远超以往的手工编辑或基于编辑软件的半自动方式。

  “当前,海量的多模态数字内容形式翻新快、涉及主体多而散,内容的创作者、使用者、平台方和监管方共同面临的新问题就是发现难,内容涉及的形态多、平台多、主体多,人工无力处理、机器难以理解。数字内容爆发式增长以后,混杂其中的直接聚合、混合剪辑、借鉴文案、素材拼接等多模态内容变得更难追踪、计量和处置。”人民中科负责人告诉记者,特别是生成式人工智能的出现,给数字内容及其版权的运营带来新机会、新模式的同时,也给版权保护带来了全新的挑战。应对内容的智能生成最直接的办法就是以机器对机器的智能发现(AIDC),这也是推出“白泽”数字版权保护平台的背景。

  人民中科主要从事跨模态大模型“白泽”的研发和应用,目标是让机器能够理解数字内容,从而提高数字世界的透明度,拉平数字经济各参与方的信息差。通过对数字内容的理解、发现、处理和生成,以技术手段积极应对数字化给国家安全、社会治理、经济活动带来的机遇和挑战。

  基于“白泽”跨模态大模型,用户可高效率、低成本地智能化扫描、识别和分析互联网上的海量多模态数字内容,判断内容被使用和传播的情况。


  提供数字内容的智能理解和智能发现


  据悉,“白泽”借鉴类脑认知的“拷贝—检索—生成”的过程,使用了先进的跨模态智能理解技术和海量多源异构跨模态数据进行训练,能够对文本、图像、视频等多种模态信息进行统一理解、统一表达、统一度量,从而实现跨模态生成、跨模态搜索、开集视频标签、跨模态对话、细粒度跨模态搜索等功能,可为政府机关和特定单位提供数字发现能力。

  该负责人提到,数字版权运营和保护平台正是基于“白泽”跨模态大模型强大的内容理解与发现能力,能够一站式智能化地对数字内容及其版权进行运营与监测。其主要功能包括版权入库和登记、版权监测和保护、版权交易和资产化、版权运营和传播。

  版权入库和登记主要是为内容生产者和版权拥有方提供数字内容及其版权确权,将优质内容聚集到平台,并进行推广和保护;版权监测和保护主要是发现全网的在用目标内容和涉及账号,对白名单之外的采取劝告、交易、投诉、诉讼等方式进行维权;版权交易和资产化是基于海量素材的聚集,为内容生产者(含机器)提供素材,为版权的交易商、发行渠道、使用平台等提供标的,为内容使用方提供版权清洗和风险控制;版权运营和传播是基于版权内容进行境内外的运营和推广、销售,并为从业者提供运营、合规、评估等服务。

  据了解,数字版权保护平台的核心功能主要是数字内容的智能理解和智能发现,由跨模态大模型“白泽”负责实现,其主要优势表现在:平台实现了从内容监测、版权管理到固证取证、统计分析的一站式服务。只需要使用者上传拟推广或保护的数字内容,平台便可自动对目标内容进行监测,发现有效线索后可自动处理,有效解决了线索发现难、手动取证时间长、人力成本高等问题;覆盖数十家主流平台,实现了跨平台内容扫描,可按实时、3个月、半年、一年及更长时间等频率对目标内容进行跟踪监测;平台除了支持文本、图像、视频单模态内容输入,还支持多种模态、多种线索内容同时输入,并支持多线索逻辑运算操作,充分利用跨模态理解和协同能力,发现数字内容、数字商品中的违规、伪造、雷同等信息;能够实现文件级、片段级、秒级以及帧级的目标内容精准发现,从而实现快速精准取证;平台能够实现在亿级规模上的秒级响应,从而实现对大规模复杂数据的快速监测。

  此外,平台还可以提供版权违规内容、违规账号、违规账号属性以及关系、违规态势等多维度的监测信息,为探索数字内容及其版权的分发、运营提供了新模式和新机制,也为未来相关数字版权标准定制和实施提供了非常重要的支撑。


  促进数字内容的保护和交易


  该负责人提到,“白泽”数字版权保护平台通过对数字内容的智能发现,为数字内容及其版权的运营、管理和交易提供技术抓手。跨模态大模型“白泽”的数字发现能力,让数字内容更容易找到需求方,促进数字内容的保护和交易,提升平台方和使用方的风控能力,并降低监管成本、提升监管效率。

  据了解,“白泽”版权保护平台未来将从三个方面推动新一代人工智能技术与数字版权产业的融合共生,探索数字影音版权保护的新路径、新场景、新未来。第一,建立数字影音版权数据中心,以数字版权运营与保护助力传统文化传承。第二,研发符合版权管理部门、司法机关、版权公司、版权所有人实际需求的“跨模态数字影音版权智能监测平台”,通过内容识别等技术手段对音视频内容进行比对,检测和防止未经授权内容的复制与传播,激活数字影音版权运营与保护能力。第三,举办数字影音知识产权保护研讨会,推动建立和谐共生的数字影音生态。

  李兵说,下一步,“白泽”数字版权保护平台将继续完善版权监测和保护、版权交易和资产化、版权运营和传播等核心模块,为数字内容的版权高质量发展提供可信的人工智能技术。