全国首份数据资源体检报告: 六成算力集中在这三个区域

2024-06-07   第一财经

继2月国家数据局等四部门宣布在全国范围内进行数据 “摸家底”后,日前调查结果正式出炉。

在近日举行的第七届数字中国建设峰会上,全国数据资源调查工作组(国家工业信息安全发展研究中心)编写的《全国数据资源调查报告(2023年)》(下称“报告”)发布。这是我国首次对数据资源进行“全面体检”。

报告显示,2023年,全国数据生产总量达到32.85泽字节(ZB),相当于1000多万个中国国家图书馆的数字资源总量。与2022年相比,我国数据年产量增长22.44%,其中,和智能网联汽车相关的出行数据,同比增幅达到49%;和工业机器人等智能生产设备相关的制造数据,同比增幅为20%。预计今年我国数据生产量增长将超过25%。

首份“体检”显示哪些问题

《数字中国发展报告(2023年)》显示,2023年我国算力总规模达到230EFLOPS,居全球第二位;先进技术、人工智能、5G/6G等关键核心技术不断取得突破,高性能计算持续处于全球第一梯队。

当前,数据资源日益成为衡量数字经济国际竞争力和软实力的关键指标。全国数据资源调查作为一项基础性工作,对摸清数据资源家底、加快数据开发利用、支撑政府精准施策和数字经济高质量发展具有重要意义。

报告显示,我国数据资源管理和利用整体处于起步阶段,数据资源“产—存—算”规模优势基本形成,数据“供—流—用”各环节主体逐渐丰富,海量数据和丰富场景优势潜力亟须释放。

在数据生产方面,数据生产规模大、范围广,增长速度快。在数据存储方面,数据存储空间及布局相对合理,云存储低于终端存储。2023年,全国数据存储总空间为2.93泽字节,存储空间利用率为59%。

目前,数据存储空间基本满足存储需求,但从长远看仍需适度超前布局,以满足未来产业发展对海量数据的需要。从存储位置看,数据云存储占比略低于终端存储,特别是对于行业重点企业,数据终端存储占比超七成,分散存储的现象较普遍,数据互联、复用的难度较大。

在算力方面,呈现算力规模增长快、智算能力需求旺的特点。根据2200多家算力中心的调查数据,2023年我国算力规模同比增长约为30%,其中智能算力占比达到30%。其中,京津冀、长三角、珠三角地区算力规模占全国比重近六成,算力枢纽按需布局趋势明显。这主要是由于东部地区实时计算需求增幅较大,实时数据处理仍依赖于本地存力及算力。随着各行业各领域对智能算力的需求日趋强烈,大模型适配性有待优化。

国家工业信息安全发展研究中心主任蒋艳接受媒体采访时表示,随着5G、AI技术的快速发展,内容制作、影像视听等民生消费领域的新的业态不断涌现,随之带来的非结构性数据对我国数据总规模的贡献是巨大的。

在“供”的方面,去年,我国公共数据开放量同比增长超16%,公共数据开放共享初见成效。在“流”的方面,全国数据总流量同比增长7.6%,在“用”的方面,18.6%的平台企业和51%的中央企业在数据开发利用过程中应用到了政府开放数据。

不过,报告也发现,我国海量数据和丰富场景优势潜力亟须释放。存在海量数据源头即弃、数据存而未用现象较为突出、数据价值外溢效应不足等问题。

2023年,全国新增数据存储量为0.95泽字节,生产总量中仅有2.9%的数据被保存。由于海量数据复用价值较低,大部分过程类数据产生后即被丢弃或覆盖。此外,目前大模型、训练工具等支撑能力不足,海量数据开发利用价值低于存储成本。

报告称,企业一年未使用的数据占比约四成,数据加工能力不足导致大量数据价值被低估、难以挖掘复用。随着各行业各领域对智能算力的需求日趋强烈,大模型与国产软硬件的适配性问题尚需解决。开展数字化转型的大企业中,实现数据复用增值的为8.3%,实现规划管理的企业数据资源较少,数据价值有待释放。

北京交通大学信息管理理论与技术国际研究中心教授张向宏称,数据生产多、存储少,这是全球的普遍规律。数据就像水果一样,容易因腐烂而失去价值。当然从另一方面也说明,我国在数据资源开发利用方面还有待进一步提高。

地方加速布局

政策是引领数据要素发展的重要因素。在一系列利好政策影响下,地方政府围绕数据要素市场发展、公共数据授权运营等进行了一系列探索。

特别是北京、上海、深圳、广州、贵阳等地积极布局数据要素市场,发布了较多相关或专项政策。

例如,北京提出2030年数据要素市场规模达到2000亿元;贵阳市印发了数据要素市场化配置改革等文件,从8个方面提出了27条举措,解决数据资源供给、数据供需对接、数据流通等问题;上海提出,统筹数据开发利用和安全保护,探索建立数据流通交易等制度和标准规范等;山东、安徽提出,要开展数据资产化试点、数据知识产权登记试点,推进公共数据开放和授权运营。

国家数据局局长刘烈宏在5月的国新办发布会上介绍全国各省数据主管机构组建情况时提到,各地因地制宜推进改革,31个省(区、市)和新疆生产建设兵团均已完成机构组建,其中,独立设置机构的有26个,加挂牌子的有6个。

刘烈宏表示,各地数据工作机构职能进一步强化,北京等21个地区还将数字政府建设纳入数据工作范围,机构职能延伸到公共数据的生产和采集环节。大部分省(区、市)配套设立数据发展促进中心,组建数据集团,进一步加强组织保障,理顺数据管理、资源整合和开发利用的关系。

“我们将推进数据要素市场化配置改革。建立健全数据产权制度,制定促进数据合规高效流通和交易的政策,建立数据要素收益分配机制,健全数据流通利用安全治理机制。”刘烈宏说。