提升数据管理层级之思
来源:中国新闻出版广电报 时间:2023-11-09

国家数据局于今年10月挂牌,此为一件影响深远的事。就大范围看,把数据上升到国家部委的层级进行管理,尚属世界首创,数据地位在我国之重要性可见一斑。
新闻出版业的产品当然是数据内容。一是内容本身数字化之后可以直接转化为数据产品;二是这个产业自身的各种数据,可以列入社会事业和文化产业发展的序列,进行多向解读和成为决策的要件。
各种各样的原始数字信息,不会完全自动转化为数据,它需要人工进行干预、进行数据标注,这个行业可能今后会成为劳动密集型的一个劳动分工领域,所需要的人工是很可观的,这倒是一件扩大就业的好事。
在数据之门越开越大之时,一涌而出的数据会不会带来一些问题?有何需要预作防范之处?
有。研究科学伦理的学者已经指出,数据歧视就是一种,它随数据产生和标注而生,不可能完全杜绝。所谓数据歧视,一是算法本身具有价值负载性。算法并非完全客观,而是往往蕴含某种预设的价值立场。若设计者存在某种价值偏见,并嵌入到信息的收集、标注、处理中,则算法的输出结果也会体现出价值偏见。二是数据输入的局限性和不正确性。若数据收集时,将社会存在的对某地区或人群的歧视行为作为范例,或数据收集范围具有偏见意识。
常用的数据结构有:数组、栈、链表、队列、树、图、堆、散列表等,把各种数据归入什么样的结构中,哪些数据可以予以忽略或者强化,这也是一件不露痕迹却又十分重要的事,它对决策的影响可能具有关键价值。
国家数据局一定会从国家利益的角度,以执法和实施政府规制的强制力,协调推进数据基础制度建设,统筹数据资源整合共享和开发利用。当然,也一定会对包括数据歧视在内的数据领域不当行为,乃至利用数据进行违法的活动进行制裁和打击。
新闻出版业自身产生海量数据,对数据的产生、传输和监管,过去并没有足够的重视。这种状况,在初始型数字化浪潮中尚可谅解。但是随着数据价值的提升,数字中国、数字经济、数字社会规划和建设等事业的推进,新闻出版业的数据管理显然不能滞后,存在的短板需要尽快补足。
由此也延伸思考,在新闻出版的大学教育与科学研究内容当中,是不是也要加大关于数字伦理的分量?当我们面对的数字化新闻出版,已经由“婴儿”成长为“巨人”之时,教学科研是不是要从传统的采写编校、摄录播传内容,向数字化带来的新现象大力拓展?就像数据歧视这种课题,远不是只掌握文科知识或者只掌握理科知识的人所能够应对的。