4 月 1 日,2024 年全国数据工作会议在北京召开,这是国家数据挂牌成立以来在国家层面首次召开数据工作会议。经过 2024 年一个季度的调研、酝酿和准备,我们看到国家数据管理部门初步明确了数据工作的目标、思路,逐步梳理出来要着力推进的重点工作事项,剩下的三个季度就是如何落实推进的事情了。

我们先来看一下本次会议明确要坚持“一条主线”,统筹“三个建设”,从八个方面提出了 2024 年年度工作重点:健全基础制度、释放要素潜能、加快转型赋能、促进科技创新、完善基础设施、强化安全保障、推进国际合作、抓好试点试验。
梳理研读此次会议以及之前国家数据局主要领导的公开发言表态,我们可以对我国数据要素市场化改革一些突破点和关键点做一些初步的识别分析,把握政策的走势及其背后的增进逻辑。
1
一 收益分配机制和合规流通是当下迫切要解决的首要问题
会议提出“制定促进数据合规高效流通和交易的政策,建立数据要素收益分配机制”。
“数据二十条”对于数据要素收益分配制度做出了原则性的规定,明确了按照市场贡献分配收益的基本原则,在初次分配阶段,遵循“谁投入、谁贡献、谁受益”的原则,数据要素收益向数据价值和使用价值创造者倾斜,在二次、三次分配中提出重点关注公共利益和弱势群体。
收益分配作为市场化配置的基本机制,如何把这些基本的原则要求变成数据要素市场参与各方都能够执行的操作指南,需要在顶层设计上给出指引,才能对数据持有者、数据加工处理者和数据开发者形成足够的激励。
合规流通则是另一个基础性的问题,数据合规的制度规则体系目前已经基本建立,从三法一条例到重要数据识别指南、数据分级分类标准,再到数据合规咨询中介机构都在不断地发展,但是对于数据持有者、数据加工处理者来说,如何把这些复杂的制度规则变成可操作的细则对于大部分机构来说还是很难,缺乏操作手册的结果就是数据被锁到了抽屉里。
2
二 公共数据资源开发利用需为数据要素市场化配置作出示范
会议提出“发挥公共数据资源开发利用的示范效应,持续探索企业数据、个人数据开发利用新路径”。
数据资源开发利用,其实对于企业数据来说并不是多大难题,至少在企业内部,过去二十年,企业内部信息化建设如火如荼大数据技术普遍应用,企业为了自身的利益也会不遗余力地共享各种数据;即使在产业链供应链创新链等多个企业主体的合作上只要有明显的经济效益也不是难题,而且已经做得很好。
数据资源开发利用,陈志刚认为主要的方向是市场主体能够高效合规地利用高质量的公共数据,提高市场主体自身在宏观环境预测、中观产业政策感知、微观企业经营决策上的能力,利用开放的公共数据低成本的获取要素、更加合理地对产业政策形成预期、消除营商环境的刚性成本以及获得市场经营、产品研发、融资担保所需要的更加基础的经济社会运行的数据。
公共数据的开发利用不在于公共数据自身产生多少价值,而在于能够帮助市场主体的经营决策和技术创新。
在这方面,会议提出公共数据资源开发利用的示范效应,就需要贯彻“还数于民”的理念,发挥公共数据的公共价值属性,在公共数据的确权、流通、开放、开发、合规、收益等方面作出示范,通过政府及其平台公司的率先垂范,形成可供各行业参考的样板案例。
交通、教育、气象等领域数据由于基础好、质量高、管理相对规范,被纳入释放范畴,让这些数据“供得出、流得动、用得好”。
3
三 数据基础设施建设继续加速,破局数据流不动的困局
会议提出“优化数据基础设施布局。加快全国一体化算力网和数据流通基础设施建设,发挥好政府投资的放大效应”。
数据基础设施目前看有三个核心:
一是算力网络,国家发改委(国家数据局)发布了算力高质量发展的指导意见,核心是希望打造全国算力一张网,通过算力调度满足不同地区不同场景的各类计算需求,例如智算计算的需求。
二是数据传输网络,即刘烈宏局长所说的对数据的汇聚、处理、流通、应用、运营、安全保障提供支撑的数字设施,关键是这些服务是社会化的服务,就像我们使用通信服务,可以随时随地地接入通信网络享受全程全网的通信服务一样,数据基础设施的数据网络,也可以为数据要素市场的所有参与者提供全程全网满足任何一对一或者一对多的数据传输服务。这方面国家数据局多方信息显示在研究高速数据网技术,值得关注进一步的细节。
三是安全可信能力。目前看数据空间技术、隐私计算技术、区块链技术被作为构建可信安全数据基础设施的主要技术。数据安全服务作为公共的、共性的、基础的、公益的数据要素流通服务非常必要,可以作为国家数据基础设施的一部分,消除各类数据要素市场参与者能力不同、认知不同造成的差异,从而不敢把数据拿出来的问题。
4
四 多层次多维度的试点试验是创新发展数据要素市场的关键
会议提出“发挥试点试验的引领作用。鼓励有条件的地方先行先试,支持更多地方因地制宜加快发展”。
此次会议上明确:探索建设国家级数据标注基地,充分发挥地方配套支撑作用,在数据标注产业的生态构建、能力提升和场景应用等方面先行先试,集聚龙头企业,促进区域人工智能产业生态发展。
所谓数据标注是指对市场上现存的大量原始数据(即非结构化数据,包括语音、图片、文本、视频等)进行分类、画框、标注、注释等处理,标记其数据特征,将非结构数据转化为规范化的计算机可识别的结构化数据,进而应用于人工智能算法的研发与训练。
据 Grand View Research 预测,到 2028 年,全球数据标注市场价值预计将达到 82.2 亿美元。到 2030 年,全球数据标注服务市场预计将以 26.6% 的复合年增长率增长。 到 2030 年,该市场预计价值 53 亿美元。
这说明数据标注是个大产业,也是数据基础产业,国家级数据标注基地建设将大幅度提高数据资源的质量和规模。
当然,我们看到此次会议还透露出开展两区建设,分别是数字经济创新发展试验区、数据要素综合试验区和三类试点,分别是数据基础制度试点、数据资源开发利用试点、数据基础设施建设试点。这些试点我们可以看到是在总结地方典型实践基础上提出的,例如北京就在开展数据基础制度先行区建设,浙江杭州在开展数据要素综合试验区建设。在国家政策鼓励下,各地区将形成两区三试点的建设高潮,带动新一轮数据基础设施投资。
2024 年,数据工作需要一些突破,特别是在公共数据的开发利用上需要加速突破,建立人们对这一高价值数据资源发挥乘数效应的信心,也建立数据要素市场化配置的示范样板。

