出版产业通用数据交换技术重点实验室:
解决产业链数据共享难题
来源:中国新闻出版广电报 时间:2023-09-18
由北京理工大学出版社牵头的出版产业通用数据交换技术重点实验室自2021年成立以来,获评国家新闻出版署“2021年度出版业优秀科技与标准重点实验室”“2022年度出版业优秀科技与标准重点实验室”。实验室致力于解决当前出版业大数据采集、交换过程中的技术难点、痛点问题,经过近3年的建设和运行,取得了丰硕的成果。《中国新闻出版广电报》记者日前对话北京理工大学出版社数字出版中心主任、出版产业通用数据交换技术重点实验室技术委员会主任陈俊武,请他就实验室如何促进出版业科技发展、推动标准应用进行解读。
解决数据交换需求
“有业内专家指出,‘新闻出版大数据包括7类数据,分别是机构数据、人员数据、产品数据、政务数据、商务数据、用户数据和内容数据。出版行业数据分散在不同的主体当中,主体收入数据分散,导致主管部门与出版行业主体之间,产业链上、中、下游主体之间信息不畅,信息系统缺乏互联互通,产业链数据不能真正融合。’这一番话引发出版业信息技术人士共鸣,可以说产业链数据互联互通直接影响出版业未来的发展。”陈俊武说道。
据陈俊武介绍,国内外目前普遍采用“FTP+XML”接口模式进行数据交换。基于此模式开发的接口是“软件代码与业务代码交织在一起”的,任意节点业务规则的变化,都会导致接口需要重新设计。因此,此种数据交换模式,无论是研发费用,还是后续的维护和更新都耗资巨大,往往超出出版单位的承受能力。
面对出版单位在推进融合发展进程中,存在大量数据交换、分析方面的迫切需求,出版产业通用数据交换技术重点实验室针对出版产业现有数据交换接口不通用的核心痛点,研究一种“逻辑分离、应用贴合”的新型通用数据交换架构与关键技术,从理论和实践两个层面解决产业链数据共享难题,这也是实验室建设的核心任务。
构建“四用”新生态
自成立以来,出版产业通用数据交换技术重点实验室提出了“端交换方案+中间标准库”协同运作的耦合数据交换技术解决方案,研发了出版产业通用数据交换云平台,打好解决出版行业数据交换、分析难题的“组合拳”。
出版产业通用数据交换云平台包含数据服务云平台、通用接口云平台、通讯呼叫云平台3个子平台。通过通用接口云平台的耦合数据交换技术将“端交换方案”和“中间标准库”载入,协同完成数据交换。
据陈俊武介绍,“端交换方案”实行不唯一原则,技术厂商或个人仅需按创作规范标准将数据库交换字段及业务逻辑制作成“端交换方案”,用户可以自由试用并选择适用且可靠的“端交换方案”,避免仅靠信息系统原厂商单打独斗开发数据接口或软件的局面,从而构建起数据共享、数据交换新的应用生态,形成数据交换界的“淘宝”商城。
标准作为科技创新成果在实践应用过程中的经验总结,是新一轮科技创新的重要推动力。“中间标准库”整合与出版产业相关的《图书流通信息交换规则》《中国出版物在线信息交换(CNONIX)图书产品信息格式》等60余种出版、发行、信息类标准,将标准中规定的信息交换的内容、类型、格式规范、技术规范等定义在通用接口云平台中,推动现行标准落地,使标准之间无缝兼容。
耦合数据交换技术是确保交换云平台中能够准确地解析“端交换方案”“中间标准库”的关键。该技术能够使得包含业务逻辑的“端交换方案”“中间标准库”在交换云平台中协同运作,从而实现数据、文件安全、可控、准确传递。
“通过实验室研究成果的落地应用,推动构建‘四用’新生态。”陈俊武表示,即任意两个信息系统之间,均可实现信息互联、数据交换的“通用”;降低资金投入,满足数据交换需求的“可用”;采用“云平台+客户端”模式,便于用户使用的“好用”;一改交换接口只能由原厂商开发,让更多单位或个人成为数据交换方案创作者,从而获得收益的“实用”。
打造自有技术队伍
人才是实验室发展的首要资源。2012年,北理工社成立数字出版中心,牵头开展出版社数字化转型工作。近年来,北理工社高度重视出版全流程数字化建设与改造,培养建立起了一支自有技术队伍。2022年,出版产业通用数据交换技术重点实验室在四川成都建立西南分站,在西南地区开展“出版产业通用数据交换技术”方向的项目合作、项目申报、课题研究、成果推广应用等工作。
据陈俊武介绍,实验室实行开放、流动、竞争、联合的运行机制,通过岗位聘任、项目聘用在实验室内形成合理的队伍结构。实验室固定人员以学术带头人和技术骨干为主,并采取积极措施加强与国内外同行的交流,吸引优秀学者到实验室开展研究工作。
与此同时,实验室不断加强通用数据交换技术研究和专业理论研究,完善数据交换从业人员的考核机制,通过制定数据交换人才激励措施,培养数据交换专业技术人才和行业领军人才,完善数据交换人才梯队建设,实行岗位培训和业务轮训制度等,不断提升数据交换从业人员综合素质。
作为实验室共建单位,北京印刷学院和中国新闻出版研究院与实验室联合开展出版融合发展人才培养,新华文轩出版传媒股份有限公司和北京南北天地科技股份有限公司为实验室人才培养创造孵化环境提供实践平台,加大通用数据交换学科技术研发人才、资本运作人才和经营管理人才培养引进力度,形成开放、流动、联合的人才培养模式,打造“学以致用,以用促学”的人才培养机制。
陈俊武表示,经过长期的理论基础和几年来的技术研究,目前,耦合数据交换技术理论可靠和技术可行均得以验证,并获得发明专利一项。“端交换方案创作规范”和“中间标准库入库规范”已经制定,并依据这两项规范设计了《出版ERP流通业务交换方案》“端交换方案”,实现了出版ERP与诸多渠道商的数据交换。“中间标准库”已将多项标准数字化,并在出版单位进行落地应用。出版产业通用数据交换云平台处于试验小样建设完成状态,且各项功能验证均已通过测试,未来将进一步推动部署于云端的云平台落地。