数据要素与数据资产行业深度研究

最后更新时间:2026年7月3日

本文档是行业分析案例库的第七篇,定位为"概念期 vs 业绩期"识别训练的典型样本。数据要素行业政策刚刚铺开、商业模式尚未跑通,是训练"概念炒作 vs 真业绩"判断能力的最佳教材。建议与 行业生命周期分析财报防雷红旗清单 配套阅读,并对照本人在软件行业的第一手认知,验证 LLM 是否遗漏了"项目制交付 vs 产品化"这一关键商业模式差异。

一、行业概览

一句话概括:数据要素行业是把数据作为新型生产要素,通过确权、定价、交易、入表等环节,让数据从"资源"变为"资产"再变为"资本"的政策驱动型新兴行业。

三大壁垒

  1. 牌照与合规壁垒:数据交易所需经地方审批、数据安全需符合《数据安全法》《个人信息保护法》,合规成本高且不可复用,先入者有显著优势。
  2. 数据资源壁垒:高质量、可持续的数据源是核心生产资料,政务数据、行业数据掌握在少数主体手中,民营公司难以独立获取。
  3. 技术栈壁垒:数据治理(清洗、脱敏、质量评估)、数据资产估值、隐私计算(可用不可见)等技术需要长期积累,与基础软件、数据库、大数据平台深度交叉。

主要风险:商业化路径不清(数据产品难以标准化定价)、政策落地节奏不及预期、概念炒作与真实业绩严重背离、数据安全合规成本吞噬利润、部分龙头公司持续亏损且被实施风险警示。

生命周期判断:导入期偏早期。政策先行、商业模式待验证,渗透率极低,行业增速波动大,CR3 无法稳定计算。这是本行业区别于 半导体设备 等成长期行业的关键特征。

二、5-10 年产业趋势判断

2.1 生命周期阶段:政策先行、商业模式待验证

数据要素行业当前处于导入期早期,表现为"政策密度高、商业兑现低"。判断依据:

  • 政策密度:从 2022 年 12 月"数据二十条"到 2024 年 1 月数据资产入表实施,再到 2024-2026 年"数据要素×"三年行动计划,政策出台节奏远快于商业化进度。
  • 渗透率:数据资产入表虽已落地,但截至 2026 年 6 月,A 股仅 136 家公司披露数据资产入表,涉及金额 37.86 亿元(数据来源:中国金融信息网,2026 年 6 月 25 日),相对全 A 股体量微乎其微。
  • 集中度:数据交易所全国已超 50 家,但 CR3 难以稳定计算,多数交易所挂牌产品多、真实成交少,行业格局未定。

2.2 五年趋势推演(2026-2030)

阶段时间窗口关键标志投资逻辑
概念期2024-2026政策落地、入表启动、交易所挂牌量增看政策催化,不看业绩;主题基金为主
商业验证期2026-2028头部交易所年交易额破百亿、出现可持续盈利的数据服务商看谁能把"项目制"转成"产品化";龙头开始分化
业绩兑现期2028-2030出现营收稳定增长、毛利率稳定的数据要素龙头看龙头 + 估值,类似当前 软件行业 成熟期逻辑

远期空间:据央视网 2025 年 5 月报道,国家数据局预计 2030 年我国数据产业规模将达 7.5 万亿元;赛迪顾问报告显示 2025 年中国数据要素市场规模已突破 1000 亿元(数据来源:赛迪顾问,2026 年 1 月)。从千亿到万亿量级的跃迁是本行业的长期叙事主线,但兑现路径存在重大不确定性。

2.3 对定投路径的启示

数据要素是典型的"远期空间大、近期业绩空"行业。在趋势定投之路上,它不应作为核心仓位,而应作为概念期的观察仓 + 业绩期的加码仓。这与 战略性新兴产业趋势与启示 中"早期主题小仓位探索"的定投框架一致:概念期分批定投、估值高位谨慎、业绩兑现后再加码。

三、政策支持

政策是数据要素行业当前唯一的"第一性驱动力"。理解政策节奏,就理解了行业的景气脉冲。

3.1 政策时间轴

时间政策/事件核心内容影响
2021.09《数据安全法》实施建立数据分类分级保护制度确立数据安全合规底线
2021.11《个人信息保护法》实施规范个人信息处理提高数据采集合规成本
2022.12"数据二十条"确立数据产权、流通、分配、治理四项制度行业顶层设计文件,标志性起点
2023.10国家数据局挂牌统筹数据基础制度建设体制机制理顺
2023.08《企业数据资源相关会计处理暂行规定》发布数据资源可确认为资产入表打通"数据→资产"的会计通道
2024.01数据资产入表正式实施上述暂行规定施行财务报表层面启动
2024.01"数据要素×"三年行动计划(2024-2026)12 个行业场景试点明确应用方向
2025.06《政务数据共享条例》规范政务数据共享释放公共数据价值
2025.0810 省份部署国家数据要素综合试验区区域先行先试形成 区域示范效应
2026.04《全国数据资源调查报告(2025年)》发布摸清全国数据资源家底为后续政策提供依据
2026.042026 年个人信息保护系列专项行动强化执法合规成本进一步提升
2026.06《中国个人信息保护报告(2025年)》发布总结保护成效监管常态化

数据来源:国家数据局、中国政府网、中央网信办官方公告(2024-2026)。

3.2 政策逻辑链

数据要素政策的底层逻辑是"确权—定价—交易—入表—资本化"五步走

  1. 确权(数据二十条):解决"数据归谁"。
  2. 定价(交易所挂牌):解决"数据值多少钱"。
  3. 交易(数据交易所):解决"数据怎么流通"。
  4. 入表(会计处理暂行规定):解决"数据怎么进财报"。
  5. 资本化(数据资产质押融资、证券化):解决"数据怎么变钱"。

当前进度:第 1-4 步已启动,第 5 步刚试点。投资者需警惕的是,政策落地不等于商业兑现——入表 ≠ 盈利,挂牌 ≠ 成交,成交 ≠ 可持续商业模式。

3.3 与软件行业的交叉

数据要素与基础软件、数据库、大数据平台深度交叉。国家数据局推动的"数据要素×"12 个场景中,工业、金融、医疗等场景的数据治理底座均依赖国产数据库与大数据平台。这与 国产化观念维度趋势与启示 中"国产基础软件替代"趋势形成共振,星环科技、拓尔思等公司同时受益于两条逻辑线。

四、产业链结构与卡脖子环节

4.1 产业链全景

上游:数据采集与存储
  ├─ 数据源(政务、行业、互联网、物联网)
  ├─ 存储基础设施(国资云、数据中心、光磁存储)
  └─ 数据采集与集成(ETL、数据接入)

中游:数据治理与交易
  ├─ 数据治理(清洗、脱敏、质量评估、分级分类)
  ├─ 隐私计算(联邦学习、多方安全计算、可信执行环境)
  ├─ 数据交易所(挂牌、撮合、定价、结算)
  └─ 数据资产评估与入表服务(评估机构、会计师事务所、律所)

下游:数据应用与安全
  ├─ 行业应用(金融风控、医疗科研、工业智造、政务治理)
  ├─ 数据产品(数据 API、数据报告、数据模型)
  └─ 数据安全(加密、访问控制、审计、数据防泄漏)

4.2 卡脖子环节识别

按"集中度、替代性、政策支持、技术壁垒"四维度判断:

环节集中度替代性技术壁垒是否卡脖子说明
数据源(政务数据)极高(政府垄断)高质量政务数据由政府掌握,民营公司只能通过授权获取,议价权极弱
隐私计算中(多家创业公司)"可用不可见"是数据流通的技术前提,国产化与安全要求双重叠加
数据交易所低(全国超 50 家)地方分散建设,同质化严重,议价能力弱
数据治理项目制交付为主,难以标准化,与软件行业"项目制 vs 产品化"困境相同
数据安全中(奇安信等龙头)中高部分合规驱动,但价格战激烈,龙头持续亏损

关键判断:本行业真正的卡脖子环节在上游数据源(政务数据授权)中游隐私计算。前者决定谁能拿到"原料",后者决定数据能否"可用不可见"地流通。数据交易所本身议价能力弱,不是卡脖子环节——这与大众直觉相反,是 LLM 容易遗漏的关键判断。

4.3 与软件行业第一手认知的交叉验证

作为软件行业从业者,可立即识别 LLM 的两处典型幻觉:

  1. 混淆"项目制交付"与"产品化":LLM 常把数据治理公司描述为"高毛利产品公司",实际上多数数据治理业务是项目制交付,毛利率远低于产品化软件。星环科技、拓尔思等公司亏损收窄但仍未盈利,正是项目制难以规模化的体现。
  2. 高估"国资云"的盈利能力:LLM 倾向把国资云描述为"确定性增长资产",但国资云承担了大量非市场化任务(数据安全合规、信创替代),毛利率被压缩,且收入确认周期长。深桑达 A 的云数业务虽快速成长,但盈利质量需打问号。

这两处正是 行业研究学习路标 所强调的"用熟悉行业作对照组,识别 LLM 幻觉"的训练价值所在。

五、竞争格局

数据要素行业竞争格局呈"四类玩家并行、整体分散"特征,CR3 无法稳定计算,符合导入期特征。

5.1 四类玩家

类型代表公司/机构商业模式盈利状态
数据交易所上海数交所、北京国际大数据交易所、深圳数交所、贵阳大数据交易所撮合交易抽佣 + 会费 + 增值服务多数亏损或微利,依赖政府补贴
数据服务商易华录、深桑达 A、拓尔思、星环科技数据治理项目 + 数据产品 + 平台授权多数亏损或微利,星环科技亏损收窄
数据安全商奇安信、安恒信息、绿盟科技安全产品 + 安全服务奇安信 2025 年仍亏 12.85 亿元
国资云中国电子云(深桑达)、云赛智联、各地国资云平台基础设施 + 信创云服务收入增长但利润率受压制

5.2 数据交易所竞争格局

全国已设立数据交易所超 50 家,但真正形成规模成交的集中在头部四家:

数据交易所最新交易额/进展数据时点
上海数据交易所2025 年交易额超 30 亿元,同比增幅超 50%;签约数商超 2000 家2025 年 6 月
北京国际大数据交易所数据交易年均增长超 200%2025 年 6 月
深圳数据交易所累计交易规模持续增长(具体数据未公开披露)2025 年
贵阳大数据交易所全国最早成立,挂牌产品多但真实成交规模有限2025 年

数据来源:和讯网、证券之星、中国青年报相关报道(2025 年 6 月)。

格局判断:上海数交所交易额领先,但绝对规模仍小(30 亿元相对全行业千亿市场是零头);北京数交所增速最快但基数低;多数地方交易所"挂牌热、成交冷"。数据交易所本身不是好的定投标的——它们多为非上市主体,且议价能力弱,真正受益的是上游数据资源方和下游数据应用方。

5.3 上市公司业绩跟踪

以下为 2025 年年报关键数据(数据来源:巨潮资讯网、新浪财经、证券之星,2026 年 3-4 月披露):

公司代码2025 年营收同比净利润关键看点
奇安信68856143.92 亿元+0.97%-12.85 亿元营收微增仍亏损,经营现金流创最佳,毛利率下滑 5.67pct
星环科技688031营收增 20.47%+20.47%亏损收窄AI 数据平台成突围关键,仍处投入期
拓尔思300229见年报非结构化数据治理,大模型数据语料概念
深桑达 A000032见年报中国电子云,云数业务快速成长
易华录300212*ST 易录被实施风险警示,光磁存储数据湖模式受挫

关键发现:行业龙头奇安信 2025 年仍亏损 12.85 亿元,且毛利率下滑 5.67 个百分点,说明数据安全赛道"量增价跌"格局未根本改善;星环科技营收高增但仍亏损,典型"投入期"特征;易华录被 ST,是"概念炒作 vs 真业绩"背离的典型案例——曾经的数据要素概念龙头,最终因业绩无法兑现被风险警示。

六、财报防雷要点

数据要素行业的财报防雷,核心是识别"数据资产入表"这一新会计处理是否被滥用为"美化报表"工具。

6.1 数据资产入表的会计处理逻辑

根据财政部 2023 年 8 月发布的《企业数据资源相关会计处理暂行规定》(2024 年 1 月施行):

  • 企业持有的数据资源,满足无形资产确认条件的,确认为无形资产(数据资源无形资产)。
  • 企业日常活动中持有、最终目的用于出售的数据资源,确认为存货(数据资源存货)。
  • 在资产负债表"存货""无形资产"项目下分别单列"其中:数据资源"。

核心风险点:入表是把"双刃剑"——入表后需摊销,若数据产品无法持续产生收益,将形成资产减值。首批入表案例中,多家上市公司在监管问询后更正数据资产"成绩单",首批"入表"规模一度降至 1.04 亿元(数据来源:36 氪),说明早期入表存在虚高与不规范。

6.2 红旗清单(数据要素行业特化版)

财报防雷红旗清单 通用 10 项基础上,数据要素行业需额外关注:

红旗类型表现严重程度说明
数据资产入表激增但营收不增数据资源无形资产增速远超营收增速⚠️ 高入表可能为美化报表,而非真实商业化
政府补贴占比过高政府补助/净利润 > 50%⚠️ 高剔除补贴后亏损,说明商业模式未跑通
数据交易所挂牌产品多但成交少挂牌量增速远超成交额增速⚠️ 中"挂牌"不等于"成交",概念制造
应收账款激增应收账款增速 > 营收增速 1.5 倍⚠️ 高通用红旗,数据治理项目制下尤为常见
研发资本化比例过高研发资本化率 > 50%⚠️ 中数据平台公司常用手段,需警惕利润虚增
毛利率异常波动毛利率 1 年内变动 > 10pct⚠️ 中数据安全行业价格战导致奇安信毛利率下滑 5.67pct 已需关注
被实施风险警示(ST)公司被 ST 或 *ST❌ 严重易华录案例,概念龙头业绩崩塌

6.3 政府补贴占比的识别

数据要素行业高度依赖政策补贴。防雷要点:

  • 查看利润表"其他收益"科目,其中政府补助需单独披露。
  • 计算政府补助/净利润比值:若 > 50%,说明主业不赚钱。
  • 对比历年补贴趋势:补贴逐年递减而利润仍增,才是健康信号。
  • 警惕:部分公司把数据要素相关政府项目收入计入"数据业务",实质是政府购买服务,非市场化收入,不可持续。

6.4 易华录案例:概念龙头的陨落

易华录曾以"数据湖""光磁存储"概念成为数据要素龙头,股价一度大幅上涨。但 2025 年被实施 ST(ST 易录,代码 300212),原因在于:

  • 数据湖模式重资产、长周期,地方政府付费能力下降导致回款困难。
  • 应收账款长期高企,现金流与利润背离。
  • 概念炒作推高估值后,业绩无法兑现,最终被市场证伪。

这是 行业研究学习路标 中"概念炒作但无业绩支撑的行业应避免选择"原则的鲜活案例,也是"看空清单制度"价值的最佳证明。

七、景气度跟踪指标

行业景气度跟踪指标体系 框架,挑选 3 个领先 + 2 个同步 + 1 个滞后指标。

类型指标数据来源更新频率当前值/状态历史分位
领先数据交易所年度交易额各交易所披露年度上海数交所 2025 年超 30 亿元(+50%)中(绝对值仍小)
领先数据资产入表公司数与金额巨潮资讯网、第三方统计季度136 家、37.86 亿元(2026.6)早期,分位难定
领先地方数据局成立进度国家数据局月度多数省份已成立,10 省综合试验区启动接近完成
同步数据要素概念股营收增速财报季度星环科技 +20.47%,奇安信 +0.97%分化
同步数据安全行业毛利率财报季度奇安信毛利率下滑 5.67pct偏低
滞后数据要素板块 ROE财报年度多数龙头为负极低

景气度综合判断:政策领先指标接近"完成铺开",但同步指标(营收增速分化、毛利率下滑)显示商业兑现尚未到来。当前处于"政策景气高、业绩景气低"的剪刀差阶段,对应定投节奏应为"观察 + 小仓位,等待业绩信号"。

7.1 跟踪节奏建议

  • 月度跟踪:国家数据局、中央网信办政策发布动态(每月初)。
  • 季度跟踪:数据要素概念股财报(营收增速、毛利率、政府补贴占比、入表金额变化)。
  • 年度跟踪:各数据交易所年度交易额、数据资产入表公司总数与金额、数据产业规模统计。

八、估值分位与定投节奏建议

8.1 概念期 vs 业绩期:两套截然不同的估值逻辑

阶段估值方法适用标的风险
概念期(当前)政策催化驱动,PE 失真,看 PS、看政策密度数据要素主题 ETF、宽基指数估值靠情绪,回调剧烈,易被套在高位
业绩期(未来)PE/PEG,看营收增速 + 毛利率 + 现金流龙头个股需验证商业模式可复制性

当前阶段判断:数据要素整体仍处概念期。多数龙头公司亏损或微利,PE 为负或失真,PE 分位参考意义有限。概念期估值由政策催化和情绪驱动,容易出现"估值高位"陷阱。

8.2 估值分位参考(2026 年 7 月)

由于多数数据要素龙头仍亏损,传统 PE 分位不适用。建议改用以下代理指标:

  • PS(市销率)分位:星环科技、拓尔思等可用 PS 与历史对比,判断是否处于高位。
  • 主题 ETF 换手率:数据要素主题 ETF 换手率显著放大时,往往是概念炒作高潮,需警惕。
  • 政策催化密度:每当重大政策发布(如综合试验区名单、入表新规),板块短期上涨,若估值已高位,则为"利好兑现即卖出"窗口。

定投节奏建议

阶段仓位节奏触发条件
概念期(当前)探索仓 5% 以内小额分批,回调加码仅在政策催化后回调时加,不在情绪高点追
商业验证期提升至 10-15%龙头分化后加码头部交易所年交易额破百亿、出现可持续盈利数据服务商
业绩兑现期核心仓 15-20%正常定投龙头营收增速 20%+、毛利率稳定、现金流为正

与战略性新兴产业配置框架的关系:据 战略性新兴产业趋势与启示,数据要素属于"探索仓位(10%)"范畴,当前不建议作为核心仓位。其探索仓位应与脑机接口、量子科技等早期主题合计控制在 10% 以内。

8.3 估值高位谨慎的具体表现

概念期估值高位通常伴随以下信号,出现 2 个以上应减仓或暂停定投:

  1. 数据要素主题 ETF 短期涨幅超 30%,换手率创历史新高。
  2. 龙头公司 PE(若有)或 PS 处于历史 90% 以上分位。
  3. 市场出现"数据要素万亿市场""下一个新能源"等过度乐观叙事。
  4. 大股东减持公告增多(概念炒作高点往往是产业资本减持窗口)。
  5. 政策利好频出但公司业绩持续低于预期。

九、看空清单

行业研究学习路标 "看空清单制度"要求,强制写出 3 条看空理由,对冲 LLM 的乐观偏差。

看空一:商业化路径不清,"数据产品"难以标准化定价

数据与普通商品不同,具有非排他性、可复制性、价值依赖场景等特征,导致:

  • 定价难:同一份数据对不同买家价值差异巨大,缺乏公允定价机制,交易所挂牌价与实际成交价常常背离。
  • 标准化难:数据产品多为非标,难以像商品一样规模化销售,项目制交付为主,毛利率难以提升。
  • 复购难:数据产品多为一次性采购或订阅,复购率低,难以形成 SaaS 式持续收入。

验证信号:若 2-3 年内仍无数据服务商实现稳定盈利,说明商业模式仍未跑通。

看空二:政策落地节奏不及预期,"雷声大雨点小"

政策密度高不等于落地效率高:

  • 综合试验区进度:10 省份综合试验区 2025 年 8 月才部署,实际产出需 2-3 年,期间可能面临地方财政紧张、执行走样。
  • 政务数据开放:政务数据共享条例虽出台,但"不愿共享、不敢共享"问题根深蒂固,实际开放程度可能远低于预期。
  • 入表规范:首批入表案例更正频繁,说明会计处理尚不成熟,监管可能收紧,短期入表规模增速可能放缓。

验证信号:若 2026 年底数据资产入表公司数增速明显放缓、综合试验区无标志性成果,说明政策落地不及预期。

看空三:概念炒作与真业绩严重背离,估值回调风险大

  • 业绩 vs 估值背离:龙头奇安信 2025 年仍亏 12.85 亿元,星环科技亏损收窄但仍未盈利,易华录已被 *ST,但数据要素概念板块在政策催化下反复活跃。
  • 概念制造:部分公司仅因"数据要素"概念被炒作,实际数据业务收入占比极低(< 5%),属"贴标签"行为。
  • 历史教训:易华录从概念龙头到 *ST 的路径,可能在其他"贴标签"公司身上重演。

验证信号:若数据要素概念股大涨但财报数据要素相关收入占比不足 10%,即为典型概念炒作,需回避。

9.4 对冲 LLM 乐观偏差的提示

LLM 在数据要素行业分析中常见的乐观偏差:

  • 高估行业增速(引用券商预测的万亿规模,忽视当前仅千亿且多为政府购买)。
  • 低估商业化难度(把"入表"等同于"盈利",把"挂牌"等同于"成交")。
  • 忽略盈利质量(只看营收增速,不看政府补贴占比和亏损规模)。
  • 淡化估值风险(用"成长股估值法"合理化高估值,忽视概念期估值靠情绪支撑的脆弱性)。

人类必须做的反向思考:即使 LLM 给出"万亿市场""下一个新能源"等 10 条看多理由,也必须独立思考上述 3 条看空理由,并重点验证入表金额、交易额、龙头业绩等关键数字的真实性。

十、与现有文档的衔接

数据要素行业研究在趋势定投之路中的位置与前后文档的递进关系如下:

10.1 上游衔接:政策与产业趋势

10.2 同级衔接:行业分析方法论

10.3 下游衔接:定投实践

  • 本行业估值分位与定投节奏建议,将在 定投策略研究 中作为"概念期 vs 业绩期"行业定投模板,供制定具体定投计划时调用。
  • 本行业龙头公司财报防雷结论,将在 基金标的研究 中作为标的选择依据。
  • 本行业看空清单,将在 决策复盘 中作为定期复盘检查项。

10.4 对照行业:软件行业

作为软件行业从业者,建议将本文档与 软件行业案例 对照阅读,重点对比:

  • "项目制交付 vs 产品化"困境在两个行业的表现。
  • 国产化替代逻辑在基础软件与数据要素中的异同。
  • 政府补贴占比对盈利质量的拖累程度。
  • 用软件行业第一手认知,校验 LLM 在数据要素分析中的幻觉。

十一、配套文档链接

路线与框架

政策与趋势

产业趋势

基础与财报

定投实践

对照案例