出版业数据资产宝藏亟须打开

作者:本报记者 章红雨 来源:中国新闻出版广电报 时间:2025-03-31


  出版业数据资源主要分为两大类


  经营数据

  ·出版物主数据

  ·生产运营数据

  ·营销销售数据

  ·财务数据

  ·行政管理数据


  内容数据

  ·图书期刊的图文数据

  ·条目数据

  ·富媒体资源数据

  ·以上数据资源的相关元数据



  数据资产入表五大步骤


  第一步:确定需要进行治理的数据资源的范围和边界。

  第二步:明确数据的存储环境、存储方式、数据结构、数据规模、数据冗余程度及元数据整理。

  第三步:将准备好的数据进行集中采集并进行清洗加工,以完成数据归集、数据脱敏、数据对齐、数据格式与结构标准化统一处理等任务。

  第四步:对清洗加工后的数据进行质量检查与管理,保证数据的一致性、准确性和完整性。

  第五步:将清洗质检后的数据入库存储,对数据进行多维度、多主题的分类、标注、关联和挖掘等更深层次的加工。


  从数据到数据资源,再到数据资产,这些距出版业并不遥远的概念,成为一段时间以来出版人热议的话题。2025新闻出版单位数字出版部门主任联盟会近日在京召开。会上,《中国新闻出版广电报》记者关注到有两个问题引起出版人的热烈讨论。一是数据资产能给出版企业带来哪些经济效益?二是数据资产的商业化运营模式又有哪些?对此,记者采访了中国新闻出版研究院数字出版研究所所长王飚。王飚认为,已有迹象表明,敢用数据、会用数据的出版企业,其“双效”与管理水平显著提升。


  出版业数据有优势


  据2023年新闻出版统计公报显示,2023年,我国图书、期刊、音像制品、电子出版物出版,以及印刷复制、出版物发行营业收入均有所增长。其中,全国出版新版图书21.7万种,较2022年增长5.7%;重印图书32.3万种,增长8.8%。

  由此看来,出版业是高价值内容资源富集的行业。但内容资源丰富并不等于数据资源丰富,这需要数字化和数据治理的过程,即把内容资源转化为高质量数据集的过程。

  王飚认为,出版业的数据资源主要分为经营数据和内容数据两大类。

  其中,经营数据包括出版物主数据,如图书、期刊、电子音像出版物、网络出版物的数据,生产运营数据则是编、印、库存、采购、物流等环节数据,营销销售数据包括营销推广数据、销售发行数据、客户数据、渠道数据等。另外,还有财务数据,如凭证、台账、报表等,行政管理数据含有员工信息、公文通知、组织机构等。这些数据是出版企业内部使用或作为行业统计监管依据使用,在财务报表中按照数据入表要求一般计入无形资产(除销售数据外)。

  内容数据方面,主要来自出版单位拥有版权的出版物的内容,包括图书期刊的图文数据,融入排版文件、印刷文件、电子书文件等,条目数据如XML、JSON等,及富媒体资源数据如音视频、动画、3D模型等,还有以上数据资源的相关元数据,主要用于对外销售交易,在财务报表中按照数据入表要求一般计入无形资产。

  “我国出版业经过多年的数字化转型升级,已积累了丰富的内容数据和经营数据。相比于其他行业,出版业数据具有规模庞大、质量较高、类型丰富,有较好加工基础、产权清晰等特点。”王飚认为,这些特点所具有的优势,使出版业成为一座数据宝藏。但目前这些数据的价值远没有释放出来,大部分还处于“沉睡”状态。究其原因,是这些数据资源只是通过出版产品和版权实现其价值,没有转换成数据资产,并通过数据资产的运营最大化地释放数据资源价值。出版数据资源以产品和资产的形式一起汇入国家文化专网进行展示、流通、共享和交易,非常有利于文化大数据体系建设,从而推动并健全现代公共文化服务体系,创新实施文化惠民工程。


  数据入表需五步骤


  对于守着数据宝藏的出版企业而言,哪些是有价值的,哪些又是无价值的,甄别起来还是有一定困难。

  对此,王飚建议数据管理可考虑这样五个步骤。第一步:确定需要进行治理的(即要进行数据资产化的)数据资源的范围和边界。第二步:明确数据的存储环境、存储方式、数据结构、数据规模、数据冗余程度及元数据整理。第三步:将准备好的数据进行集中采集并进行清洗加工,以完成数据归集、数据脱敏、数据对齐、数据格式与结构标准化统一处理等任务,从而实现消除数据杂质和冗余,提升数据质量,增加数据价值的目标。第四步:对清洗加工后的数据进行质量检查与管理,保证数据的一致性、准确性和完整性。第五步,将清洗质检后的数据入库存储,对数据进行多维度、多主题的分类、标注、关联和挖掘等更深层次的加工,进一步提升数据的可用性、知识性和内在价值。

  上述步骤完成后,出版企业需要明确数据的三种权益。其中,持有权是通过对数据资源持有权进行分级确权登记,给予受限持有、公开持有等确权等级,并进行必要的信息披露。加工使用权包括数据加工权和数据使用权,提供一种灵活的有限产权,为市场主体免除必须持有数据才能加工使用数据的顾虑。经营权则基于特定场景进行数据版权合规高效流通,形成数据准入标准(合规标准、质量标准),促进数据产品接入、信息披露、资本化。

  同时,王飚提醒出版企业还应建设主数据和元数据管理的组织和体系。比如,制定管理的制度和标准;明确管理的职责和分工,对数据进行精确采集、校验、清洗、去重、整合、对齐及补齐等优化操作(例如对加工完成的电子书的内容进行校对、修正);对主数据和元数据进行多元化分析,保障管理系统的稳定运行和数据的妥善存储,加强数据的安全防护等。还有,要对数据资产进行确权固定、分级分类,对重要的数据在存储、传输等环节进行加密,对数据的敏感部分进行删除、遮蔽或替换,对数据采用私有化部署等。


  数据资产如何变现


  数据资产入表是指将企业的内部数据、外部数据进行系统性的整合、梳理、分析后,按照一定的规范和标准,将其记录在数据表或数据库中,以便进行统一管理和有效利用。王飚建议,可参照我国施行的《会计法》《企业会计准则》《企业数据资源相关会计处理暂行规定》《数据资产评估指导意见》《关于加强数据资产管理的指导意见》《公司法》《证券法》等法律法规。

  就出版业而言,主要分为以下类型:资产类、收益类和成本类科目。出版企业在数据资产入表过程中,面临的重点难点问题是出版数据资产价值评估。评估指标体系可分为成本类、收益类、市场类等一级指标。其中成本类指标还可细分为存储、加工、管理、版权等二级指标;收益类指标可通过收益额、剩余收益期、折现率进行估算;市场类指标可在相似出版数据资产的基础上,根据数据质量、价格、供求关系等进行调整。

  相较于以网络用户为主要服务对象的数字出版企业,例如短视频平台(抖音、快手等)、网络阅读平台(阅文集团、掌阅等)、网络视频平台(爱奇艺、优酷、腾讯视频等)、网络社交平台(微信)等,网络出版企业的数据资产主要业务是基于用户的数据资源。目前已有一些评估模型可供参考,例如DEVA模型、曾李青模型、国泰君安模型等。

  数据能给出版业带来哪些经济效益?王飚认为,数据收益除带来科学管理外,还可以作为资产来资本化,资产资本化有这样几种途径:数据资产质押融资、数据资产证券化、数据资产作价入股、数据资产保险、数据资产增信融资、数据资产授权使用、数据资产信托等。

  “总之,在推动数据要素市场化大背景下,推动出版业数据经济发展和数据价值最大化已是当务之急。”王飚说。