以AI高质量数据集建设为抓手

打造“三智化”城市超级客户端

作者:郭全中 来源:中国新闻出版广电报 时间:2025-05-06

  国务院办公厅印发的《关于推动文化高质量发展的若干经济政策》指出,建设文化领域人工智能高质量数据集。这给正在积极推动系统性变革的主流媒体带来巨大的政策红利、数据红利,结合“互联网平台生态”变革目标以及面临的实际困难,主流媒体应跳出传媒业进行系统性变革,以AI高质量数据集建设为抓手打造“三智化”的城市超级客户端。

  挖掘深层次原因

  所谓AI高质量数据集,是指能满足特定业务场景需求,在准确性、完整性、一致性、时效性、安全性等方面达到可量化标准的为AI服务的数据集合。AI高质量数据集是支撑人工智能、大数据分析和智能决策的核心基础资源,可以显著提升算法性能、模型可靠性以及商业变现效果。

  主流媒体建设AI高质量数据集主要基于如下深层次原因:一是唤醒沉睡已久的媒资库。主流媒体长期以来积累了大量的媒资,有的分散存储于记者、编辑个人的电脑里而没有系统归集,有的只是进行了简单的电子化,但未真正数据化,这些沉睡已久的媒资库的价值亟须进行充分挖掘。二是助力本地优秀传统文化“两创”。本地优秀传统文化的创造性转化和创新性发展是主流媒体责无旁贷的义务和责任,一则每个地方都有大量的优秀传统文化资源,而数字化转化是“两创”的有效路径,主流媒体可以通过打造文化AI高质量数据集有效地拓展到该领域;二则文化AI高质量数据集本质上是优秀本地文化的基因库,质量高、数量多、种类丰富的数据集能够从数据来源的角度传播本地优秀文化,提升本地文化的知名度、标识度和美誉度。三是赋能国际传播。在生成式人工智能大行其道的当下,文化AI高质量数据集能从数据底层逻辑上有效缓解生成式人工智能的数据歧视难题,进而从底层上提升主流媒体的国际传播能力和效果。四是构筑面向未来的核心能力。数据、算法、算力是人工智能发展的三大要素,其中,数据起着核燃料的驱动作用。主流媒体可以充分利用体制优势获取政府数据等优质稀缺资源,逐步建设起数据量大、种类丰富、质量高的覆盖本地各行各业的AI高质量数据集,为其长期发展注入核心资源。

  寻找方法与路径

  AI高质量数据集建设知易行难,需要解决数据资源、资金来源、技术和人才等核心难题。具体方法与路径是:由当地政府设立AI高质量数据集建设重大专项,通过发售政府专项债等方式筹集资金,并委托当地主流媒体建设以及作为未来运营主体。

  第一,以当地政府手中的各类数据资源为基础并积极拓展数据源。目前各地政府手中有着数量巨大的沉睡数据资源,这些资源被分割在各个部门和各个区域内,不仅没有充分数据化,更没有资产化,且处于“数据孤岛”状态,难以充分发挥数据资产的乘数效应和助力当地治理能力提升,因此,各地政府亟须唤醒沉睡的政府数据并有效归集、贯通、数据化以及资产化,通过建设覆盖各行各业的垂直AI高质量数据集,为当地数据产业发展和治理能力现代化赋能。主流媒体在对现有政府数据资料数据化的基础上,积极拓展数据源的范围,以建设更多的AI高质量数据集。

  第二,设立政府重大专项并发售政府专项债来筹集资金。AI高质量数据集是一项耗资巨大的系统性工程,动辄会耗资数亿元甚至数十亿元,且短期内没有明晰的商业模式与盈利模式,需要在未来不断探索商业模式与盈利模式。这就要求党委和政府一方面从促进我国生成式人工智能更快更好发展的高度大力推进AI高质量数据集建设,另一方面从公共服务的角度推进AI高质量数据集建设。具体来说,一则政府通过设立重大专项的方式建设AI高质量数据集,来解决AI高质量数据集建设公共服务的紧迫性;二则通过发售专项债的方式来解决资金难题。

  第三,委托主流媒体建设和运营。目前,各地政府在运营城市数据资源时,多采取在大数据局下成立城市数据运营公司的方式,而在当地主流媒体业务不足、生存困难的情况下,本质上是公司和员工队伍的重复建设与资源浪费,完全可以委托给当地的主流媒体建设和运营。一方面,主流媒体尤其是县级融媒体普遍拥有一支远超现有业务规模的员工队伍,亟须拓展新的稀缺资源和业务范围来维持生存,否则就会造成社会不稳定;另一方面,主流媒体已经形成了一定的市场化运营能力,只需要补足技术短板就完全可以运用好相应的数据资源。目前,江苏张家港融媒体中心、浙江瑞安融媒体中心、江苏江阴融媒体中心等在城市数据开发和运营方面已经探索出了不错的经验,可以为其他地区的主流媒体提供经验借鉴。

  第四,主流媒体通过合作等建立起数据建设和运营生态。AI高质量数据集建设是数据建设和运营生态的基础,主流媒体单靠自身能力不可能做好所有事情,可以与互联网巨头、大模型公司、数据开发商、数据运营商等合作伙伴通力合作,打造共建共赢共享的数据生态,进而充分挖掘AI高质量数据集的价值和潜力并基于此显著提升当地政府治理能力,为当地经济和社会的高质量发展夯实数据基座。

  或可商业变现

  建设AI高质量数据集是一项耗时耗力的复杂的系统工程,除了其公共服务的正外部性外,还需要探索出有效的商业模式和盈利模式,而基于当地的AI高质量数据集打造面向当地的综合服务的城市超级客户端是可能的变现路径。

  当前,主流媒体打造的自主可控平台多局限于媒体业务范畴,一则由于新闻非用户刚需;二则由于主流媒体新闻生产能力不足,导致客户端用户少,成为“僵尸客户端”,不仅难以实现商业模式与盈利模式再造,更难以做好舆论引导,亟须基于新资源探索新的模式,而基于AI高质量数据集打造城市超级客户端是实现公共服务和商业变现的可能路径。

  第一,基于AI高质量数据集能够为当地党委和政府的公共服务职能尤其是决策职能提供高质量的数据基础,显著提升公共服务和决策的效率、能力和效果,进而实现当地治理能力的现代化。例如,基于城市交通领域的AI高质量数据集的“城市大脑”能够显著缓解城市的拥堵而造福全体市民;基于文化领域的AI高质量数据集的“传播大脑”能够有效提升本地元素的标识度。尤其是彻底贯通的覆盖各领域的AI高质量数据集能够为当地党委和政府的科学决策提供坚实的数据基础。

  第二,主流媒体基于AI高质量数据集能够打造“三智化”(智慧媒体、智慧政务和智慧城市运营)的城市超级客户端。这种类型的超级客户端汇集了当地的媒体流、信息流、政务流和服务流,在AI高质量数据集的加持下,能够为用户提供更为精准、个性化和高质量的服务,进而拥有一定规模的日活用户,不仅能够实现盈利模式再造,而且能够更好地引导用户和服务用户。具体来说,一是可以向互联网巨头和大模型公司出售高质量的数据资源;二是可以打造面向用户的覆盖各行各业的智能体;三是基于一定规模的用户群体可以拓展广告等各类商业市场。

  需要明确的是,打造具有综合服务功能的超级客户端更适合接地气的县级融媒体中心,核心原因在于其更容易获得当地党委与政府的各类资源支持。当然,其他各类主流媒体也可以根据自身的优势和特点打造面向各产业的AI高质量数据集。

  (作者系中央民族大学新闻与传播学院教授、博士生导师,互联网平台企业发展与治理研究中心主任)