前言
数据产业是数字经济时代的新兴产业。全球数据产业的发展,本质上是人类认识世界、改造世界的工具理性从信息处理工具跃升为生产要素与经济治理基石的范式革命。数据产业的兴起,标志着数据处理能力取得质的飞跃,使得海量、异构、高速流动的数据洪流中蕴藏的价值得以系统性释放。数据产业作为一个新兴产业被正式确立,标志着数据完成了从技术工具、商业资源到基础性生产要素与独立经济形态质的跃迁。近年来,我国数据产业呈现快速增长趋势,其中2024年的数据生产总量为41.06泽字节(ZB),同比增长25%,增速较2023年提高2.56个百分点,人均数据生产量约为31.31太字节(TB),同比增长25.17%;全国数据存储总量为2.09泽字节,同比增长20.81%,高质量数据集数量年增速达27.4%。
2024年12月,《国家发展改革委等部门关于促进数据产业高质量发展的指导意见》中首次提出数据产业的概念,数据产业是利用现代信息技术对数据资源进行产品或服务开发,并推动其流通应用所形成的新兴产业,包括数据采集汇聚、计算存储、流通交易、开发利用、安全治理和数据基础设施建设等。该文件明确数据技术和产业重点发展方向,要求到2029年,数据产业规模年均复合增长率超过15%,数据产业结构明显优化,数据技术创新能力跻身世界先进行列,数据产品和服务供给能力大幅提升,催生一批数智应用新产品新服务新业态,涌现一批具有国际竞争力的数据企业,数据产业综合实力显著增强,区域聚集和协同发展格局基本形成。当前,我国数据市场建设还处于起步阶段,国家数据局正在研究制定培育全国一体化数据市场的政策文件,结合数据市场建设和人工智能发展趋势,大力发展数据产业,培育数据市场生态,汇聚各方力量加快数据市场建设。数据产业作为新兴产业,引发了产业界、学界和政府部门的广泛关注和思考,对市场主体、关键技术、产业生态等问题展开了讨论。
一
数据产业是以数据为核心生产要素,通过系统性采集、存储、处理、分析、交易与应用活动创造经济价值的产业部门集合。我们有必要从产业经济学视角来界定数据产业,关键在于识别数据产业独特的生产对象、技术基础、市场结构与经济功能。数据产业的生产对象区别于传统的物质或能源,是以二进制代码形式存在的、可机读的海量数据集合,其非物质性与可无限复制性构成根本差异。一方面,数据产业的技术基础高度依赖现代信息通信技术,特别是云计算、分布式存储、大数据处理框架与人工智能算法,这些技术决定了数据处理的规模、速度与深度。同时,其市场结构呈现显著的双边或多边平台特征,连接数据供给方、处理方与需求方,并常因网络效应与规模经济形成高度集中态势。另一方面,数据产业的经济功能在于通过对原始数据的精炼与知识萃取,显著降低经济决策的不确定性,优化资源配置效率,并催生新产品、新服务与新业态。
数据产业结构呈现为多层级、相互嵌套的复杂生态系统,涵盖基础层、技术层与应用层三大功能模块。基础层聚焦于数据的存与通,构成产业的物理基石,包括数据中心基础设施(提供计算、存储与电力保障)、网络传输服务(确保数据高速流动)及数据采集设备。技术层是数据价值挖掘的引擎,专注于数据的加工与增值,包含数据管理平台、数据处理与分析工具、人工智能/机器学习模型开发与部署平台,以及至关重要的数据治理与安全技术(加密、脱敏、访问控制)。应用层则是价值实现的出口,将数据能力融入具体场景,形成垂直解决方案,如数字金融(风险控制、精准营销)、智能制造业(预测性维护、供应链优化)、智慧城市(交通管理、公共安全)、精准医疗(基因分析、个性化治疗)等。研究表明,数据价值链涉及多个阶段和参与者,从生成到最终使用,每个环节都增加了价值。上述的三个层级紧密耦合,形成基础设施支撑技术、技术赋能应用、应用反哺基础设施投资与技术迭代的正向循环,共同构筑了数据产业的价值创造网络。
数据产业的市场行为体现了数据要素的独特经济属性,包括非竞争性、规模报酬递增与强外部性,并塑造了企业的竞争策略与定价模式。数据要素的非竞争性(一人使用不妨碍他人使用)使得企业倾向于最大化数据的复用范围与频次,催生了一数多用的平台化商业模式。数据的价值随规模扩大而显著提升(规模报酬递增),驱动企业通过各种用户获取策略、并购或开放API(应用程序接口)等方式,尽力扩张其数据生态边界。数据应用的强正外部性(如导航数据优化全社会交通效率)要求有效的市场协调或政策干预,以实现社会福利最大化。在定价机制上,数据产品与服务常采用多元化策略:原始数据或基础API可能低价甚至免费,以吸引用户、构建生态,而深度加工的分析报告、预测模型或定制化解决方案则实行高溢价策略。双边市场定价策略尤为普遍,平台常对数据供给方(用户)支付较低的费用,而向数据需求方收取较高的费用。此外,基于数据使用量、处理复杂度或业务成果的灵活定价模式也日益普及。
数据产业展现出极强的渗透性与融合性,通过前向关联、后向关联与旁侧关联深度嵌入并重塑国民经济体系,成为驱动产业升级与经济增长的关键枢纽。前向关联体现为数据产业作为中间投入品供应商,向几乎所有下游行业输出数据分析与智能决策能力。例如,智慧农业依赖土壤与气象数据分析优化种植,智能制造依托设备运行数据实现预测性维护。后向关联则表现为数据产业对上游硬件、软件与通信产业的强劲拉动,如全球数据中心的建设直接刺激了高端服务器与光模块的需求。旁侧关联更为广泛,数据产业催生了围绕数据确权、评估、交易、安全、合规等环节的新兴服务产业,如数据经纪商、数据合规咨询机构、隐私计算解决方案提供商。同时,关联作用不仅体现为数据产业的经济贡献,更体现在通过提升全要素生产率成为经济增长的新引擎。据有关研究估算,数据驱动型创新对美国经济增长的贡献率已超过传统资本与劳动。
数据产业的兴起对传统产业组织理论与政策规制框架构成挑战,其原因在于数据权属的动态模糊性、市场结构的自然垄断倾向,以及负外部性的复杂治理。数据要素的非排他性、非竞争性及其价值的场景依赖性,导致产权界定异常困难同一组数据可能同时涉及个人隐私、商业秘密,甚至国家安全。数据权属模糊严重阻碍了数据的有效流通与市场化配置。在市场结构方面,数据驱动的网络效应、规模经济与范围经济极易催生赢家通吃局面。大型数据企业依托数据垄断优势可能实施排他性行为,抑制创新与竞争。例如,欧盟《数字市场法案》提出规制看门人平台。数据滥用(如算法歧视、价格欺诈)、隐私泄露、虚假信息传播及系统性安全风险(如大规模数据泄露)构成了显著的负外部性。
数据产业的演化遵循技术驱动、需求拉动与制度适配三者协同作用的动态路径,其边界、形态与结构将持续经历解构与重构。一方面,核心驱动力来自底层技术的指数级跃迁:量子计算将彻底突破现有算力瓶颈,实现超大规模复杂模型的实时训练;下一代通信技术将极大扩展数据采集的时空维度与实时性;生成式人工智能正从根本上变革数据分析与知识创造的模式,自动生成数据分析的结果。另一方面,需求侧从企业效率优化加速向社会治理(智慧城市、应急管理)、民生福祉(个性化医疗、终身学习)、绿色转型(能源数据优化)等更广阔的领域深度拓展。制度环境演进方向(如数据跨境流动规则、人工智能伦理框架、数据资产入表会计准则)将直接塑造产业竞争格局与创新路径。值得注意的是,技术的快速发展必须伴以相应治理机制的同步演进。
二
数据产业是一个在技术可能性、市场需求与制度约束的持续互动中,不断定义自身范畴、创新商业模式、重塑价值链分工的动态复杂适应系统,其未来形态将与通用人工智能的突破性进展深度交织。数据产业不仅是技术革命的产物,更是生产关系在数字空间的映射,其发展依赖于数据产权制度、交易规则与伦理框架等新型制度基础设施之间的协同。
数据产业的发展引擎是平台生态与算法智能的双轮驱动系统。平台化生态网络与算法智能化能力共同解决了数据要素从碎片化到体系化、从低密度到高价值的转化难题。一方面,平台是数据聚合的枢纽,用户规模的增长使平台价值以量级提升。例如,阿里巴巴的消费数据池与特斯拉的车辆运行数据池。平台通过API、数据中间件等技术工具,实现了跨域数据的标准化接入与融合处理,形成数据引力场。另一方面,算法智能构成价值萃取引擎,机器学习与自然语言处理技术,将原始数据提炼为可操作的知识图谱与决策模型。例如,Netflix的推荐算法将用户行为数据转化为内容匹配策略,使其订阅收入增长中的75%归因于算法优化。可以看出,双轮驱动的实质是数据资本化效率的提升:平台降低数据获取与流通的交易成本,算法提升数据转化为生产力的边际效率。值得注意的是,引擎的可持续运转依赖于正反馈循环:更多数据更优算法更精准服务更多用户参与更丰富数据。例如,在医疗、金融、制造等领域已催生出数据飞轮效应,并成为产业竞争力的关键差异点。
数据产业的动力机制是技术创新与制度创新的协同演化系统,二者通过动态适配破解数据孤岛与隐私悖论等发展瓶颈。在技术维度上,算力、算法、带宽的指数级进步大幅降低了数据处理成本。例如,云计算使数据存储成本大幅降低,联邦学习技术实现数据可用不可见,区块链保障数据交易的可信性。在制度维度上,产权界定与激励机制构成内在动力。例如,欧盟《数据治理法案》(2022)首创数据中介机构角色,促进公共数据再利用。我国数据二十条(2022)提出三权分置(数据资源持有权、加工使用权、产品经营权),尝试破解确权难题。同时,协同机制的关键在于降低制度性交易成本:技术提供工具理性,制度则构建价值理性。研究表明,在制度适配度高的区域,数据产业对GDP(国内生产总值)的贡献率可达到传统制造业的三倍以上。
数据产业的价值创造是全链条整合与跨产业融合的双重路径。数据产业的价值创造遵循全链条整合内生价值与跨产业融合外溢价值的双重路径,其经济贡献体现为直接增加值与间接生产力提升的复合形态。在全链条整合维度上,数据价值链可由价值链理论衍生而来,涵盖生成采集存储清洗分析可视化应用七大环节。每个环节均存在专业化服务商,如数据分析、云存储、可视化等,形成垂直分工的产业生态。该路径的价值创造核心在于消除数据摩擦,即通过技术标准化与流程自动化,缩短数据流转周期。在跨产业融合维度上,数据产业通过产业耦合度重构传统行业。在制造业中,工业互联网平台将设备数据转化为预测性维护方案,使故障停机减少;在农业中,气候数据与土壤传感器的融合优化灌溉决策,提升亩产。
数据产业的演进方向是可持续发展与治理框架的再平衡。数据产业的可持续发展要求构建经济效率、社会公平、技术安全三位一体的治理框架,其演进方向本质是市场机制与公权力在数字空间的再平衡过程。在经济效率层面,需破解数据垄断与竞争悖论:大型平台企业凭借数据池优势形成赢家通吃格局,抑制中小企业创新。对此,可携带权与互操作性强制成为关键政策工具。在社会公平维度,需应对数字鸿沟与算法偏见,要求建立普惠性数据基础设施与算法审计制度。在技术安全领域,需平衡数据利用与主权风险。跨境数据流动引发的数据殖民主义促使各国推行数据本地化政策,而零信任架构与同态加密技术成为保障安全的技术基石。可以看出,治理框架的演进方向指向多边协同的全球数据治理。我国提出的《全球数据安全倡议》强调共商共建共享就是尝试在安全与发展间寻求动态平衡点。
三
数据作为继土地、劳动力、资本、技术之后的关键生产要素,其产业化发展正以前所未有的广度和深度重塑全球经济格局与社会运行范式。推动数据产业高质量发展,不仅是抢占新一轮科技革命与产业变革制高点的战略抉择,更是深刻把握并运用数据要素价值创造规律、驱动中国式现代化行稳致远的必然要求。
数据要素具有非竞争性、非消耗性、强外部性及价值实现的强场景依赖性,其价值并非在单一生产环节凝固,而是伴随采集、存储、处理、流通、应用直至退出的全链条动态生成与演化。实际上,数据的价值在极大程度上取决于其潜在用途的挖掘程度,而非初次采集成本。这颠覆了传统商品基于社会必要劳动时间的静态价值决定论。数据价值的指数级跃升常发生在流通、汇聚与融合环节,其价值实现高度依赖于开放共享与有效配置的机制。在当前的实践中,数据确权难、定价难、互信难、监管难等瓶颈,本质上是数据要素社会化大生产要求与既有基于私有产权的市场交换规则之间矛盾的显现,映射出生产关系调整滞后于生产力发展的普遍现象。这要求我们要超越简单的商品化思维,推动数据要素配置从市场自发调节为主,向更强调国家战略引领、公共利益导向下的高效协同的市场化配置转变,使数据要素的价值在协同优化、复用增效、融合创新中得以充分释放,赋能千行百业。
数据产业作为新兴产业,其成长壮大遵循技术创新驱动产业演化的普遍规律,并亟须构建开放协同的产业生态系统支撑其可持续发展。技术经济范式理论指出,每一次重大技术革命都会经历导入期、转折点和展开期的演进过程,其最终繁荣有赖于技术与制度框架的深度磨合。当前,数据产业正处于从技术导入期向大规模应用跨越的关键节点,算力成本下降、算法模型突破、网络设施普及构成了供给侧的强大推力,而经济社会各领域智能化、网络化、服务化转型则形成了巨大的需求拉力。然而,产业内部结构性矛盾日益凸显:基础层(算力、存储、网络)投入巨大但短期回报率偏低,技术层(算法、模型、工具平台)创新活跃但面临标准碎片化与伦理风险,应用层(行业解决方案)潜力无限却受制于场景壁垒与数据孤岛。经济学家卡罗塔·佩雷斯强调,转折点的挑战在于构建使新技术范式潜力得以充分发挥的协同范式,即适配产业生态的制度体系。
数据产业是驱动数字经济实现做强做优做大目标的战略支点,其发展水平直接决定了数字经济的质量、效率和动力。数字经济由数字产业化和产业数字化两个部分构成,而数据产业作为数字产业化的重要组成部分,为产业数字化提供着不可或缺的基础性要素、工具平台和解决方案。数据产业通过提供强大的数据采集、处理、分析能力,正深刻改变着价值创造方式。一方面,数据产业本身作为高附加值产业,直接贡献GDP增长、优化产业结构、创造高质量就业。另一方面,作为通用技术渗透至农业、工业、服务业全链条,驱动研发设计智能化、生产流程柔性化、供应链管理精细化、市场营销精准化、售后服务全程化,大幅提升全要素生产率。研究发现,数据驱动的决策可使企业利润率大幅提升。然而,实现做强(核心技术自主可控、国际竞争力强)、做优(发展模式绿色集约、结构合理、效益突出)、做大(产业规模全球领先、渗透程度深)的有机统一,面临严峻挑战。一是关键核心技术(如高端芯片、工业软件、核心算法)受制于人,二是数据烟囱与低水平重复建设并存影响效能,三是区域间、行业间、大中小企业间数字化鸿沟显著,四是数据安全与隐私保护风险一直存在。
数据产业的高质量发展,是支撑全面推进中国式现代化不可或缺的战略载体,承载着实现中华民族伟大复兴的时代使命。中国式现代化的五个中国特色涵盖人口规模巨大、全体人民共同富裕、物质文明和精神文明相协调、人与自然和谐共生、走和平发展道路,这每一项宏大目标的实现都离不开数据要素的深度赋能和数据产业的有力支撑。数据驱动下的精准治理能有效应对超大规模国家治理的复杂性,提升公共服务均等化、普惠化、便捷化水平,为共同富裕提供数字底座,有助于弥合数字鸿沟;数据赋能产业升级与创新,创造更高质量的就业和更丰富的物质精神产品,协调推动物质与精神产品发展;环境大数据监测与智能调控,是完成双碳目标、实现绿色转型的重要工具。面对全球数字经济规则主导权激烈竞争(如跨境数据流动、数字税、人工智能伦理)和某些国家的遏制打压,我们通过数据产业的自主自强,不仅能突破增长瓶颈、培育新质生产力,更能塑造以我国为主的数字经济国际循环,确保国家数据主权安全,为全人类共享数字文明成果、中华民族伟大复兴提供强劲动力。
汤奇峰
博士,上海数据交易所总经理,正高级工程师,国务院特殊津贴专家,上海市领军人才,大数据流通与交易技术国家工程实验室理事长,中欧数字经济专家组专家。主编《数据要素化的创新实践》《数据资产入表100问》等专著。
欧阳日辉
经济学博士、教授/研究员、博士生导师。
现任中央财经大学中国互联网经济研究院副院长、首都互联网经济发展研究基地副主任、清华大学电子商务交易技术国家工程实验室互联网经济与金融研究中心主任,兼任中国市场学会副会长、国家数据专家咨询委员会委员、数字广东建设专家委员会委员、海南省十五五规划编制专家咨询委员会委员等职。
主要研究领域:数字经济、数字金融、数据要素。主持国家和省部级课题20余项,发表学术论文(著作)200余篇(部),参与国家政策研究和起草10余项。
推荐序
前言
理论篇:数据产业的战略视角与发展格局
第一章 数据产业的定义、边界与内涵
第一节 数据作为独立产业的学理判据
第二节 数据产业与相关产业的边界辨析
第三节 数据产业的核心内涵与构成要素
第二章 数据产业发展的核心驱动机制和关键制约因素
第一节 数据产业发展的核心驱动机制
第二节 数据产业发展的关键制约因素
第三章 数据要素市场化价值化理论与路径
第一节 数据要素市场化的理论内涵
第二节 数据要素价值化的理论内涵
第三节 数据要素市场化与价值化的共生关系
生态篇:产业生态图谱与经营主体
第四章 数据产业的发展历程与格局
第一节 国际数据产业的发展历程与格局
第二节 中国数据产业的发展历程与格局
第五章 数据产业的经营主体与结构
第一节 数据资源企业
第二节 数据技术企业
第三节 数据服务企业
第四节 数据应用企业
第五节 数据安全企业
第六节 数据基础设施企业
第六章 创新型与引领型企业
第一节 重要力量:数据产业中的上市公司
第二节 成长引擎:瞪羚企业
第三节 创新中坚:专精特新小巨人企业
第七章 数据产业发展的支撑体系
第一节 数据产业的制度支撑
第二节 数据产业的人才支撑
第三节 数据产业的金融和财政支撑
第四节 数据产业的技术支撑
价值篇:数据产业链与价值链
第八章 数据产业链条全景与关键环节
第一节 数据产业链上游环节:数据的生成与收集
第二节 数据产业链中游环节:数据的处理与流通
第三节 数据产业链下游环节:数据的应用与服务
第九章 数据产业与数据要素价值化
第一节 数据资源:数据产业的价值原料
第二节 数据产品:数据产业的价值创造
第三节 数据资产:数据产业的价值沉淀
第十章 数据产业与经济社会发展
第一节 数据要素的应用
第二节 数据产业集群与区域发展实践
展望篇:发展趋势与未来路径
第十一章 数据产业的演进趋势与未来图景
第一节 数据产业将成为数字经济的核心产业
第二节 人工智能与数据融合开启产业新范式
第三节 制度顶层设计筑牢产业发展根基
第四节 一体化数据市场强力牵引产业发展
第五节 数据产业链从单点突破到全面协同
第六节 数据应用场景融合发展多点开花
第七节 龙头企业涌现发挥产业带动效应
第八节 产业国际化从规则共建到生态输出
致 谢
后 记
参考文献