专题:数据源使用手册

一、为什么需要这个专题

定投的所有决策——估值分位、财报排雷、宏观跟踪、指数成分、基金筛选——都依赖数据。没有可靠的数据源,再好的方法论也是空中楼阁。很多定投者陷入"看了文章很激动,打开软件不知道查什么"的困境,根本原因就是不熟悉数据源。

本专题解决的核心问题:

  1. 理杏仁 / 集思录 / 天天基金 / 巨潮资讯 / Wind / Choice / iFinD 各是什么,擅长什么?
  2. 每个数据源的关键字段含义是什么,如何解读?
  3. 数据源的用途边界在哪里,免费 vs 付费如何选择?
  4. 使用数据源时有哪些常见坑,如何避免?

掌握本专题后,你将能高效地从数据源获取定投所需的一切信息,把方法论转化为可执行的操作。

二、核心概念与公式

2.1 数据源分类

数据源类型费用核心优势核心短板
理杏仁估值数据付费(年费 ~300 元)PE/PB 历史分位、成分股回溯不含深度基本面
集思录套利数据付费(年费 ~500 元)ETF 折溢价、可转债、套利机会不含财报数据
天天基金基金数据免费基金净值、费率、持仓、排名数据深度有限
巨潮资讯公告原文免费上市公司公告、年报原文无加工数据,需自行提取
Wind终端付费(年费 ~3 万+)全品类、深度、专业价格高昂,学习曲线陡
Choice终端付费(年费 ~5000-1 万)性价比高,东方财富生态深度略逊 Wind
iFinD终端付费(年费 ~1-2 万)同花顺生态,宏观数据全用户界面较复杂

2.2 数据源的层次定位

第一层:原始数据(公告原文、财报 PDF)
  └─ 巨潮资讯、交易所官网

第二层:加工数据(财务指标、估值指标)
  └─ 理杏仁、天天基金、Wind/Choice/iFinD

第三层:衍生数据(历史分位、折溢价、套利信号)
  └─ 理杏仁(分位)、集思录(折溢价)

第四层:决策支持(筛选、对比、回测)
  └─ Wind/Choice/iFinD(专业终端)

定投者的推荐组合理杏仁(估值分位)+ 天天基金(基金信息)+ 巨潮资讯(公告原文),三者免费或低成本,覆盖 90% 的定投数据需求。若预算充足,加一个 Choice 终端可满足深度研究。

三、各数据源详解

3.1 理杏仁

定位:估值数据的专业加工者,定投者的"分位计算器"。

核心功能

功能字段用途
指数估值PE/PB/PS + 历史分位(5/10 年)02-估值分位计算方法.md 的直接数据来源
成分股回溯历史成分股清单与权重回溯计算"等权 PE"
个股估值个股 PE/PB/ROE 历史序列个股深度估值
行业估值申万行业指数估值行业轮动判断
股债收益比盈利收益率 / 十年期国债11-资产配置具体比例方法.md 的配置信号

关键字段含义

  • PE-TTM:滚动市盈率,剔除亏损股后的市值加权值;
  • PE 分位:当前 PE 在历史样本中的百分位(理杏仁默认 10 年);
  • PB 分位:当前 PB 在历史样本中的百分位;
  • 股息率:近 12 个月分红 / 总市值;
  • ROE:近 4 个季度净利润 / 平均净资产。

使用注意事项

  1. 理杏仁的"PE 分位"默认用市值加权 PE,等权 PE 需切换或自行计算;
  2. 分位窗口可选 5/10 年,建议默认 10 年;
  3. 理杏仁的成分股回溯数据可能滞后 1-2 个月,重大调整后需以中证指数官网为准。

适用边界:理杏仁专精估值,不含深度财报数据。排雷(07-财报排雷具体方法)需配合巨潮资讯或 Wind。

3.2 集思录

定位:套利与异常数据的监测器,定投者的"折溢价雷达"。

核心功能

功能字段用途
ETF 折溢价ETF 场内价 vs IOPV(净值参考)避免买贵(见 04-基金产品类型对比.md
可转债数据转股溢价率、到期收益率、回售条件可转债定投与套利
分级基金折溢价、上下折算分级基金(已基本退出)
LOF 套利场内价 vs 净值LOF 套利机会
国债逆回购GC001/GC007 收益率闲置资金现金管理

关键字段含义

  • IOPV:参考净值,ETF 的"理论价值";
  • 溢价率 = (场内价 - IOPV) / IOPV × 100%,正值表示场内贵;
  • 折价率 = (IOPV - 场内价) / IOPV × 100%,正值表示场内便宜;
  • 转股溢价率(可转债):可转债价格相对正股的溢价。

使用注意事项

  1. 跨境 ETF(如纳指100、中概互联)的 IOPV 有滞后(海外市场闭市时估算),折溢价参考性下降;
  2. 溢价 > 2% 时不建议买入,可能买到"虚高"价格;
  3. 集思录的数据实时性较高,适合盘中决策。

适用边界:集思录专注套利与异常,不做估值分位。两者需配合使用。

3.3 天天基金

定位:基金信息的一站式平台,定投者的"基金筛选器"。

核心功能

功能字段用途
基金筛选类型、规模、费率、业绩选基(见 04-基金产品类型对比.md
基金详情净值、持仓、费率、分红基金研究
基金经理管理年限、历史业绩、风格主动基金评估
基金排名同类排名、四分位业绩横向对比
定投计算器定投收益模拟定投规划

关键字段含义

  • 单位净值:每份基金的净值(不含分红);
  • 累计净值:单位净值 + 历史分红(反映真实收益);
  • 复权净值:分红再投入的净值(最准确的收益口径);
  • 七日年化:货币基金的年化收益率(7 日滚动);
  • 最大回撤:历史最大从高点到低点的跌幅(风险指标);
  • 夏普比率:单位风险的超额收益(风险调整后收益)。

使用注意事项

  1. 天天基金的"业绩排名"易误导,短期排名好的基金未必长期优秀;
  2. 费率信息以基金合同为准,天天基金的费率页面可能滞后;
  3. 场内 ETF 的数据在天天基金上不如场外基金完整,建议配合券商软件。

适用边界:天天基金适合基金筛选与基础研究,深度财报与宏观数据需用专业终端。

3.4 巨潮资讯(cninfo.com.cn)

定位:上市公司公告的官方发布平台,定投者的"原始资料库"。

核心功能

功能内容用途
年报/季报上市公司定期报告 PDF06-财报三大表完整解读 的数据来源
临时公告重大事项、重组、分红07-财报排雷具体方法 的风险信号
基金公告基金合同、招募说明书、季报基金研究
指数公告指数编制方案、成分股调整03-指数编制规则详解.md

使用注意事项

  1. 巨潮资讯的公告是原始 PDF,需自行提取数据,工作量大;
  2. 公告发布有时滞,重大事件可能先在其他渠道泄露;
  3. 巨潮资讯是官方指定披露平台,权威性最高,所有"传闻"都应以巨潮公告为准。

适用边界:巨潮资讯提供原始数据,无加工指标。需配合理杏仁或 Wind 计算估值。

3.5 Wind / Choice / iFinD 终端

定位:专业金融数据终端,定投者的"深度研究工具"。

核心功能对比

功能WindChoiceiFinD
股票数据
基金数据全(东财生态强)
宏观数据较全全(宏观强)
期权/期货较全
债券数据较全
API 接口有(付费)
Excel 插件
回测功能
年费~3 万+~5000-1 万~1-2 万

关键字段(以 Wind 为例)

  • WSD 函数:时间序列数据提取(如 PE 历史序列);
  • WSS 函数:截面数据提取(如某日全市场 PE);
  • EDB 函数:宏观经济数据提取(如 GDP、CPI);
  • Wind 量化接口:Python/MATLAB API,用于自动化回测。

使用注意事项

  1. 终端学习曲线陡,建议先学 Excel 插件再学 API;
  2. 数据更新有延迟(如财报数据通常 T+1 更新);
  3. 终端费用高,个人定投者除非资金量大(> 100 万)或研究需求深,否则不必购买。

适用边界:终端是专业工具,对大多数定投者而言"性价比不高"。理杏仁 + 天天基金 + 巨潮资讯已覆盖 90% 需求。若需深度回测或宏观研究,Choice 是性价比较高的选择。

四、实操方法(含步骤与决策规则)

4.1 定投数据需求与数据源匹配

定投任务所需数据推荐数据源替代方案
计算 PE 分位PE 历史序列理杏仁Wind / Choice
基金筛选费率、规模、业绩天天基金Choice
ETF 折溢价检查场内价 vs IOPV集思录券商软件
财报排雷资产负债表、现金流巨潮资讯 + Wind巨潮 PDF + 手动计算
指数编制规则编制方案中证指数官网巨潮资讯
宏观指标跟踪GDP/CPI/PMI国家统计局官网Wind / iFinD
股债性价比盈利收益率 + 十年期国债理杏仁Wind
政策跟踪政策文件发改委/央行/工信部官网巨潮资讯

4.2 免费组合方案(零成本)

对于预算有限的定投者,以下组合可覆盖 80% 需求:

  1. 中证指数官网(csindex.com.cn):指数编制方案、成分股、官方估值(PE/PB);
  2. 巨潮资讯(cninfo.com.cn):年报、公告、基金合同;
  3. 天天基金(fund.eastmoney.com):基金筛选、净值、费率;
  4. 国家统计局(stats.gov.cn):宏观经济数据;
  5. 央行官网(pbc.gov.cn):M2、社融、利率数据。

免费方案的局限

  • 历史分位需自行计算(用 02-估值分位计算方法.md 的 Python 代码);
  • ETF 折溢价需在券商软件查看;
  • 财报数据需从 PDF 手动提取,工作量大。

4.3 付费组合方案(年费 < 1000 元)

加一个理杏仁(年费 ~300 元),即可覆盖"历史分位"这一核心需求,大幅提升效率:

  1. 理杏仁:PE/PB 分位、股债收益比、成分股回溯;
  2. 天天基金:基金筛选与详情;
  3. 巨潮资讯:公告与年报原文;
  4. 国家统计局 + 央行:宏观数据。

进阶:加集思录(年费 ~500 元),覆盖 ETF 折溢价与套利监测,适合场内 ETF 定投者。

4.4 数据使用的三条铁律

铁律 1:交叉验证

单一数据源可能有错。关键数据(如 PE 分位、基金费率)应从至少两个数据源交叉验证。例如:

  • 理杏仁的 PE 分位 vs 中证指数官网的 PE;
  • 天天基金的费率 vs 基金合同(巨潮)原文。

铁律 2:明确口径

同一指标在不同数据源口径可能不同。例如:

  • 理杏仁的 PE 是 TTM 剔除负值,中证指数官网的 PE 可能不剔除;
  • 天天基金的"最大回撤"可能按不同周期计算。

使用前务必查阅数据源的"指标说明",明确口径。

铁律 3:注意滞后

数据更新有滞后:

  • 财报数据:年报 T+1 天更新,季报 T+1 天;
  • 指数成分股:调整公告后 T+1 天生效;
  • 基金持仓:季报滞后 15 天,年报滞后 3 个月。

决策时需考虑数据的"新鲜度",避免用过时数据做判断。

五、常见误区

误区 1:迷信付费终端

Wind/Choice 确实强大,但 90% 的定投决策用免费数据 + 理杏仁即可完成。付费终端的价值在于"深度研究"与"自动化",对普通定投者边际效用低。

误区 2:只用一个数据源

每个数据源都有盲区。理杏仁无财报深度,天天基金无估值分位,巨潮无加工指标。需组合使用。

误区 3:忽视数据口径

PE 是否剔除亏损股、分位窗口是 5 年还是 10 年、等权还是市值加权——口径不同,结果差异巨大。使用前务必明确。

误区 4:把"实时数据"当"决策依据"

盘中实时数据噪音大,定投是长期行为,应以周频或月频数据为决策依据,而非盘中波动。

误区 5:忽视官方公告

网络传闻、券商研报可能有误,所有信息都应以巨潮资讯的官方公告为准。特别是"成分股调整""分红方案""重大事项"等。

误区 6:数据源数据=真相

数据源也可能出错(如财报重述、口径调整)。关键决策需回到原始公告核对。数据是"参考",不是"真相"。

六、与项目其他文档的关联

  • 01-估值指标公式与计算.md / 02-估值分位计算方法.md:理杏仁是估值分位的核心数据源。
  • 03-指数编制规则详解.md:编制方案在中证指数官网、巨潮资讯查询。
  • 04-基金产品类型对比.md:ETF 折溢价用集思录,基金筛选用天天基金。
  • 05-基金费率体系.md:费率数据在天天基金,需与基金合同(巨潮)核对。
  • 06-财报三大表完整解读 / 07-财报排雷具体方法:财报原文在巨潮资讯,加工数据在 Wind/Choice。
  • /03-中间段/01-政策分析/10-政策传导机制案例:政策文件在发改委/央行/工信部官网。
  • /03-中间段/04-经济指标分析/01-宏观经济指标影响:宏观数据在国家统计局、央行官网。
  • 11-资产配置具体比例方法.md:股债收益比在理杏仁,宏观数据在统计局。
  • 12-定投止盈止损具体策略.md:止盈信号基于理杏仁的 PE 分位。
  • /01-路线图/01-路线图:路线图各环节的数据需求,均以本专题为来源指引。

小结:数据源是定投的"基础设施"。免费组合(中证指数官网 + 巨潮资讯 + 天天基金 + 国家统计局)可覆盖 80% 需求;加理杏仁(年费 300 元)覆盖估值分位这一核心需求;集思录覆盖 ETF 折溢价;Wind/Choice/iFinD 适合深度研究。使用的三条铁律是:交叉验证、明确口径、注意滞后。数据是决策的"参考",而非"真相"——所有关键数据都应回到官方公告核对。掌握了数据源,定投方法论才真正落地为可执行的操作。

至此,13 份专题文档全部完成,构成了从估值计算、指数编制、基金产品、费率体系、财报解读、排雷方法、政策传导、宏观指标、行业生命周期、资产配置、止盈止损到数据源的完整知识闭环。每份专题既可独立学习,又通过"与项目其他文档的关联"互相串联,形成一套自包含、可离线学习的定投知识体系。