提升数据管理层级之思

作者:江作苏来源:中国新闻出版广电报时间:2023-11-09

　　国家数据局于今年10月挂牌，此为一件影响深远的事。就大范围看，把数据上升到国家部委的层级进行管理，尚属世界首创，数据地位在我国之重要性可见一斑。

　　新闻出版业的产品当然是数据内容。一是内容本身数字化之后可以直接转化为数据产品；二是这个产业自身的各种数据，可以列入社会事业和文化产业发展的序列，进行多向解读和成为决策的要件。

　　各种各样的原始数字信息，不会完全自动转化为数据，它需要人工进行干预、进行数据标注，这个行业可能今后会成为劳动密集型的一个劳动分工领域，所需要的人工是很可观的，这倒是一件扩大就业的好事。

　　在数据之门越开越大之时，一涌而出的数据会不会带来一些问题？有何需要预作防范之处？

　　有。研究科学伦理的学者已经指出，数据歧视就是一种，它随数据产生和标注而生，不可能完全杜绝。所谓数据歧视，一是算法本身具有价值负载性。算法并非完全客观，而是往往蕴含某种预设的价值立场。若设计者存在某种价值偏见，并嵌入到信息的收集、标注、处理中，则算法的输出结果也会体现出价值偏见。二是数据输入的局限性和不正确性。若数据收集时，将社会存在的对某地区或人群的歧视行为作为范例，或数据收集范围具有偏见意识。

　　常用的数据结构有：数组、栈、链表、队列、树、图、堆、散列表等，把各种数据归入什么样的结构中，哪些数据可以予以忽略或者强化，这也是一件不露痕迹却又十分重要的事，它对决策的影响可能具有关键价值。

　　国家数据局一定会从国家利益的角度，以执法和实施政府规制的强制力，协调推进数据基础制度建设，统筹数据资源整合共享和开发利用。当然，也一定会对包括数据歧视在内的数据领域不当行为，乃至利用数据进行违法的活动进行制裁和打击。

　　新闻出版业自身产生海量数据，对数据的产生、传输和监管，过去并没有足够的重视。这种状况，在初始型数字化浪潮中尚可谅解。但是随着数据价值的提升，数字中国、数字经济、数字社会规划和建设等事业的推进，新闻出版业的数据管理显然不能滞后，存在的短板需要尽快补足。

　　由此也延伸思考，在新闻出版的大学教育与科学研究内容当中，是不是也要加大关于数字伦理的分量？当我们面对的数字化新闻出版，已经由“婴儿”成长为“巨人”之时，教学科研是不是要从传统的采写编校、摄录播传内容，向数字化带来的新现象大力拓展？就像数据歧视这种课题，远不是只掌握文科知识或者只掌握理科知识的人所能够应对的。

全屏阅读
放大
缩小
默认

提升数据管理层级之思

本版列表新闻