在当前的实践中,明明市面上的数据满目琳琅,但往往面临一个尴尬的问题,数据量大、种类很多但感觉“不值钱”,经常出现“数以稀为贵”的情况,致使数据价值未能充分释放。数据的价值由数据本身特性、外部环境、应用场景等多种因素共同决定,打破“数以稀为贵”,需要做好数据开发与价值之间的平衡。
一、困扰数据价值转化的三大原因
一是有效供给不足。当前,虽然数据生产的相对量大,但存储和高价值的数据占比低。《全国数据资源调查报告(2024年)》就显示,2024年,全国年度数据生产总量达41.06泽字节(ZB),同比增长25%,但全国数据存储总量为2.09泽字节(ZB),存储量仅占总量的5.1%。此外,在存储的数据中,仍然有大量“高质量高价值”的数据未被供给出来,如涉及个人征信、学历等方面的数据,由于缺乏完善的安全保障措施和授权机制,这类高价值数据供给不足。
从供给端来看,结构性错配与有效供给不足是导致数据价值转化率低的主要原因。其中结构性错配主要包括数据供给量大但与市场需求的标准化结构性的数据差距大。如电商日志数据虽然数据量爆发式增长,但有效数据占比少,大量冗余的数据不仅不会产生价值,可能还会干扰决策科学性。有效供给不足主要体现在非标性供给导致有效利用率低,高质量数据供给不足,这反映出我们当前数据本身质量高和加工处理后的价值高有较大提升空间。如何供给更多高质量数据,提升数据治理加工的质量,是破解数据供给端造成数据“不值钱”的关键问题。
从需求端来看,应用场景局限与支付意愿薄弱是造成数据价值转化率低的重要原因。场景创新应用是发挥数据价值的重要途径,从当前的发展看,数据要素价值的释放,需要更多场景创新,场景创新不足制约数据价值化。实践中,给数据定价时,要考虑根据数据的应用场景和具体能产生的价值来确定数据的价值,如果应用不足,自然再好的数据价值也难以挖掘出来。支付意愿弱也是重要原因。由于数据价值评估难,加上数据这个富矿的价值不明,需求方往往会选择明细且确认的数据,而不是用摸盲盒的形式给数据估值。需求方以降低自身需求,防止质量与付出的不对等问题,需求端的相对乏力也是影响数据价值转化的原因。
二是价值不确定性。数据常被人比作一个富矿,但这是什么矿、纯度如何、价值几何等均不能从观察和经验中快速评估和掌握。第一,因为缺乏专业工具和方法。在信息爆炸的时代,数据量呈指数级增长,但人们的数据处理能力却相对滞后。缺乏有效的数据分析工具和方法,导致数据无法转化为有用的信息。许多企业积累了大量的用户数据,但由于缺乏专业的数据分析团队,无法从这些数据中挖掘出用户需求和市场趋势。
第二,因为处理速度慢。数据创建、处理和分析的速度持续在加快,但在数据量非常庞大的情况下,如果不能做到数据的实时处理,就会影响数据的价值实现。传统的数据挖掘技术在处理大规模数据时效率低下,无法满足快速决策的需求。
数据实际运用中可能会存在开盲盒现象,遇到不准确、不完整、不一致等问题,影响数据的可信度和可用性。数据的不确定性影响了数据价值转化。
三是数据关联不足。数据之间缺乏有效的关联和整合,难以形成对事物全面、深入的认识。很多企业虽然积累了大量来自不同数据源的数据,但这些数据没有经过有效的整合和分析,无法发挥出数据的协同效应,也就难以挖掘出其潜在价值。
此外,在流动性方面,流通与保障机制待健全是影响数据价值转化的重要原因之一。数据的高价值需要高流通性承载和体现,实践中,数据权属认定、安全机制、估值和利益分配等问题,仍然制约着数据流通,让数据在流通领域的价值并不像预期中那样“值钱”。
二、数据怎样才能量与价“齐飞”
随着数据作为数字经济高质量发展核心引擎作用不断凸显,数据的价值困境亟待探讨。
在供给端需要构建高质量数据生产体系。推动建立数据质量分级认证机制,从完整性、准确性、时效性、稀缺性等维度建立量化指标,建立数据质量星级评定标准。政策工具包对于星级高的数据集加以精准补贴,形成正向激励机制。培育专业数据服务生态。高质量数据供给需要良好的服务生态做支撑,充分发挥数据产业园的作用,对从事数据标注、脱敏、融合等服务的企业给予政策支持,建立数据贡献积分体系,可允许积分兑换云计算资源或优先数据采购权,形成可持续的供给激励循环。
在需求端需要打造场景化价值实现路径,以实际应用场景为切入点,构建可信数据流通体系。通过建立行业级可信数据空间,采用区块链存证、隐私计算等技术手段,确保数据来源可追溯、使用可审计,有效解决数据提供方对安全和隐私的顾虑。同时,引入数据价值标注机制,对数据的时效性、完整性、稀缺性等维度进行量化评估,形成标准化的数据定价模型。
在流通和关联性上需要从保障及效率上协同发力。在基础保障层面,需加快完善数据流通基础设施网络,针对流通环节的堵点难点,建议加快构建全国一体化数据市场制度体系,破除地方保护和行政壁垒,建设良好的数字化治理环境。在提升效率层面,需要重点解决数据权属认定、安全机制、估值和利益分配等问题,真正打通数据流通价值释放的难点堵点。