数智融合发展为传统出版赋能

作者:本报记者 张君成 来源:中国新闻出版广电报 时间:2024-05-27

  时下,数字阅读愈渐流行。图为在第三届全民阅读大会“十里书香长廊·春城书市”上观众体验数字阅读。 本报记者 张雪娇 摄


  随着数字出版产业的不断升级和技术的不断迭代,以及数据大模型深度学习的内容需求市场,出版数据资源如何变现,如何为国家文化大数据战略服务成为行业重点关注的焦点。不久前,以“数字技术赋能,助力出版高质量发展”为主题的数字出版论坛在吉林长春举行。与会嘉宾认为,生成式人工智能(AIGC)时代,出版单位迎来巨大的机遇,能否以内容为核心实现技术驱动升级,进入下一轮发展,是每个从业者需要深思的问题。


  优质内容是核心竞争力


  当前AI的广泛应用,为不少单位内容数字化赋能提供路径。目前,中文在线有超过18万小时音频内容由AI录制完成。北京中文在线阅读教育科技有限公司执行董事兼总经理杜嘉向《中国新闻出版广电报》记者介绍,AI主播不仅可以根据文字直接转换成语音,还能结合故事情节的真实语境,用独创的情感控制模块,真实还原角色情感,让人有身临其境之感。

  在杜嘉看来,数字化阅读浪潮袭来时,出版单位需要积极利用和整合先进的技术体系,包括大数据分析、云计算平台、人工智能技术、高速5G网络等,来深度赋能数字阅读领域。“这些技术不仅能够提升数字阅读的便捷性和互动性,还能为读者带来更加沉浸式的阅读体验。”杜嘉说。

  然而再优美的AI声音,最终的落脚点还是内容。杜嘉认为,优质的数字内容资源是出版的核心,也是出版单位在AI时代下的核心竞争力。“在资源泛滥的数字资源时代下,出版单位的优质正版数字资源是其安身立命的根本,也是传承社会文明、弘扬社会文化的关键。”

  此外,杜嘉还强调了数字分发渠道的重要性。“数字时代,我们通过多元终端为读者提供全方位的数字阅读服务,覆盖内容、技术和传播等多个维度。在各种新技术的加持下,图文、音频、视频、直播、社群让我们的用户能够享受到更加丰富、全面、优质的知识服务。”


  挖掘纸书的无限潜力


  中国音像与数字出版协会发布的《2023年度中国数字阅读报告》显示,2023年中国数字阅读市场总体营收规模567.02亿元,用户规模已达5.7亿。对此,武汉理工数字传播工程有限公司总编辑杨志军表示,读者正在用行动倒逼出版业转型发展。“当前出版行业数字产品形式单一、盈利模式单一、服务能力单一的局限还存在,对此,借助数字时代的技术能力,从改变我们的图书本身入手,才是破解难题的答案。”

  杨志军认为,纸质图书是出版行业最基础、最核心的产品。在他看来,纸质图书天生具有互联网的良好基因,图书的内容有着可延展的基础,而每一个购买图书的读者,不仅自带精准画像,并且他们还有着持续不断的服务需求。对于出版业来说,将传统纸书升级为现代纸书,将出版行业的售后服务与现代服务业对标,将是未来转型的重要方向。

  因此杨志军建议,出版单位要以互联网的视角来看纸书的生产,把每本纸书当作一个流量的入口和每一个获取用户的通道。“出版单位要做到,读者在买到书之后,我们还能持续为他们提供服务,那我们就有可能得到更多的机会,逐步积累起属于我们的数据库,产生良性循环。”杨志军表示。

  这需要出版单位有意识地通过纸质图书去触达用户、激活用户,整合资源,将用户引导到与他兴趣点对应关联的其他场景,创造更多的消费机会。对此杨志军表示,数字技术日新月异的时代,“书+”各种新技术的现代纸书可以让书变得更好看、更好玩。“我们用智能二维码作为拓展的高速路入口,图书内容与线上服务产生了有效的关联,形成了奇妙的化学反应,读者秒变用户,纸与墨的世界也迅速延展成为可听、可看、可感受、可互动的立体空间。”

  2023年人工智能时代已经来临,现代纸书的模式又进一步升级。杨志军表示,以往纸书上配置数字化的资源服务是电子化、集群商品货架式售卖的内容,现在则是把这些数字化资源与服务都与人工智能进行关联,变成了售卖服务。“匹配在每一本图书上的数字人可以就本书内容随时给读者答疑解惑,交流互动,即时问答,高效阅读,特别是在教育类和学术类图书上,解析数读等功能深受读者欢迎。现在我们几千个数字人此时此刻正在服务着上百万的读者,纸书的潜力得到进一步挖掘。”


  共建行业大模型


  人工智能大模型在推进新型工业化、培育新质生产力中大有作为。今年的政府工作报告首次提出,要深化大数据、人工智能等研发应用,开展“人工智能+”行动。作为驱动新质生产力的重要引擎,出版业的大模型又该如何发展?有的出版单位已做出自己的尝试。4月26日,同方知网与华为共同发布中华知识大模型(简称华知大模型)2.0及系列解决方案。

  在同方知网数字出版中心总经理谢磊看来,大模型的作用对出版业AI技术应用起到了不可估量的作用。“它为出版业提供了强大的选题策划支持,编辑助手功能使得编辑工作更为高效。智能审校功能已经实现,如知网这样的平台已经能够协助编辑完成审校、找错、排版等工作,为出版社提供高效服务。”

  出版社面临电子书数据的利用问题,虽然数据被视为核心资源,但在大模型时代,数据的共享和利用变得更为关键。谢磊表示,华知大模型刚出来时是“小学生”的水平,经过知网的训练目前达到“本科生”的水平,然而要想应用到出版行业中,则需要达到“研究生”的水平。

  对此,谢磊坦言,华知大模型的发展离不开出版社的支持。“我们希望利用知网的高质量数据和处理能力,以及大模型的算法调整能力,与出版社联手共建行业大模型,以更好地为出版行业提供新兴的知识服务。”

  对于出版社的担忧,谢磊表示,解决方案是通过AI技术,在确保数据安全的前提下,将数据转化为向量库。“这使得出版社能够在安全的环境中对外提供服务。这一过程结合了AI的数据向量库和服务框架,为出版社提供了数据利用的新途径。”谢磊如是说。