专题:数据源使用手册
一、为什么需要这个专题
定投的所有决策——估值分位、财报排雷、宏观跟踪、指数成分、基金筛选——都依赖数据。没有可靠的数据源,再好的方法论也是空中楼阁。很多定投者陷入"看了文章很激动,打开软件不知道查什么"的困境,根本原因就是不熟悉数据源。
本专题解决的核心问题:
- 理杏仁 / 集思录 / 天天基金 / 巨潮资讯 / Wind / Choice / iFinD 各是什么,擅长什么?
- 每个数据源的关键字段含义是什么,如何解读?
- 数据源的用途边界在哪里,免费 vs 付费如何选择?
- 使用数据源时有哪些常见坑,如何避免?
掌握本专题后,你将能高效地从数据源获取定投所需的一切信息,把方法论转化为可执行的操作。
二、核心概念与公式
2.1 数据源分类
2.2 数据源的层次定位
定投者的推荐组合:理杏仁(估值分位)+ 天天基金(基金信息)+ 巨潮资讯(公告原文),三者免费或低成本,覆盖 90% 的定投数据需求。若预算充足,加一个 Choice 终端可满足深度研究。
三、各数据源详解
3.1 理杏仁
定位:估值数据的专业加工者,定投者的"分位计算器"。
核心功能:
关键字段含义:
- PE-TTM:滚动市盈率,剔除亏损股后的市值加权值;
- PE 分位:当前 PE 在历史样本中的百分位(理杏仁默认 10 年);
- PB 分位:当前 PB 在历史样本中的百分位;
- 股息率:近 12 个月分红 / 总市值;
- ROE:近 4 个季度净利润 / 平均净资产。
使用注意事项:
- 理杏仁的"PE 分位"默认用市值加权 PE,等权 PE 需切换或自行计算;
- 分位窗口可选 5/10 年,建议默认 10 年;
- 理杏仁的成分股回溯数据可能滞后 1-2 个月,重大调整后需以中证指数官网为准。
适用边界:理杏仁专精估值,不含深度财报数据。排雷(07-财报排雷具体方法)需配合巨潮资讯或 Wind。
3.2 集思录
定位:套利与异常数据的监测器,定投者的"折溢价雷达"。
核心功能:
关键字段含义:
- IOPV:参考净值,ETF 的"理论价值";
- 溢价率 = (场内价 - IOPV) / IOPV × 100%,正值表示场内贵;
- 折价率 = (IOPV - 场内价) / IOPV × 100%,正值表示场内便宜;
- 转股溢价率(可转债):可转债价格相对正股的溢价。
使用注意事项:
- 跨境 ETF(如纳指100、中概互联)的 IOPV 有滞后(海外市场闭市时估算),折溢价参考性下降;
- 溢价 > 2% 时不建议买入,可能买到"虚高"价格;
- 集思录的数据实时性较高,适合盘中决策。
适用边界:集思录专注套利与异常,不做估值分位。两者需配合使用。
3.3 天天基金
定位:基金信息的一站式平台,定投者的"基金筛选器"。
核心功能:
关键字段含义:
- 单位净值:每份基金的净值(不含分红);
- 累计净值:单位净值 + 历史分红(反映真实收益);
- 复权净值:分红再投入的净值(最准确的收益口径);
- 七日年化:货币基金的年化收益率(7 日滚动);
- 最大回撤:历史最大从高点到低点的跌幅(风险指标);
- 夏普比率:单位风险的超额收益(风险调整后收益)。
使用注意事项:
- 天天基金的"业绩排名"易误导,短期排名好的基金未必长期优秀;
- 费率信息以基金合同为准,天天基金的费率页面可能滞后;
- 场内 ETF 的数据在天天基金上不如场外基金完整,建议配合券商软件。
适用边界:天天基金适合基金筛选与基础研究,深度财报与宏观数据需用专业终端。
3.4 巨潮资讯(cninfo.com.cn)
定位:上市公司公告的官方发布平台,定投者的"原始资料库"。
核心功能:
使用注意事项:
- 巨潮资讯的公告是原始 PDF,需自行提取数据,工作量大;
- 公告发布有时滞,重大事件可能先在其他渠道泄露;
- 巨潮资讯是官方指定披露平台,权威性最高,所有"传闻"都应以巨潮公告为准。
适用边界:巨潮资讯提供原始数据,无加工指标。需配合理杏仁或 Wind 计算估值。
3.5 Wind / Choice / iFinD 终端
定位:专业金融数据终端,定投者的"深度研究工具"。
核心功能对比:
关键字段(以 Wind 为例):
- WSD 函数:时间序列数据提取(如 PE 历史序列);
- WSS 函数:截面数据提取(如某日全市场 PE);
- EDB 函数:宏观经济数据提取(如 GDP、CPI);
- Wind 量化接口:Python/MATLAB API,用于自动化回测。
使用注意事项:
- 终端学习曲线陡,建议先学 Excel 插件再学 API;
- 数据更新有延迟(如财报数据通常 T+1 更新);
- 终端费用高,个人定投者除非资金量大(> 100 万)或研究需求深,否则不必购买。
适用边界:终端是专业工具,对大多数定投者而言"性价比不高"。理杏仁 + 天天基金 + 巨潮资讯已覆盖 90% 需求。若需深度回测或宏观研究,Choice 是性价比较高的选择。
四、实操方法(含步骤与决策规则)
4.1 定投数据需求与数据源匹配
4.2 免费组合方案(零成本)
对于预算有限的定投者,以下组合可覆盖 80% 需求:
- 中证指数官网(csindex.com.cn):指数编制方案、成分股、官方估值(PE/PB);
- 巨潮资讯(cninfo.com.cn):年报、公告、基金合同;
- 天天基金(fund.eastmoney.com):基金筛选、净值、费率;
- 国家统计局(stats.gov.cn):宏观经济数据;
- 央行官网(pbc.gov.cn):M2、社融、利率数据。
免费方案的局限:
- 历史分位需自行计算(用
02-估值分位计算方法.md的 Python 代码); - ETF 折溢价需在券商软件查看;
- 财报数据需从 PDF 手动提取,工作量大。
4.3 付费组合方案(年费 < 1000 元)
加一个理杏仁(年费 ~300 元),即可覆盖"历史分位"这一核心需求,大幅提升效率:
- 理杏仁:PE/PB 分位、股债收益比、成分股回溯;
- 天天基金:基金筛选与详情;
- 巨潮资讯:公告与年报原文;
- 国家统计局 + 央行:宏观数据。
进阶:加集思录(年费 ~500 元),覆盖 ETF 折溢价与套利监测,适合场内 ETF 定投者。
4.4 数据使用的三条铁律
铁律 1:交叉验证
单一数据源可能有错。关键数据(如 PE 分位、基金费率)应从至少两个数据源交叉验证。例如:
- 理杏仁的 PE 分位 vs 中证指数官网的 PE;
- 天天基金的费率 vs 基金合同(巨潮)原文。
铁律 2:明确口径
同一指标在不同数据源口径可能不同。例如:
- 理杏仁的 PE 是 TTM 剔除负值,中证指数官网的 PE 可能不剔除;
- 天天基金的"最大回撤"可能按不同周期计算。
使用前务必查阅数据源的"指标说明",明确口径。
铁律 3:注意滞后
数据更新有滞后:
- 财报数据:年报 T+1 天更新,季报 T+1 天;
- 指数成分股:调整公告后 T+1 天生效;
- 基金持仓:季报滞后 15 天,年报滞后 3 个月。
决策时需考虑数据的"新鲜度",避免用过时数据做判断。
五、常见误区
误区 1:迷信付费终端
Wind/Choice 确实强大,但 90% 的定投决策用免费数据 + 理杏仁即可完成。付费终端的价值在于"深度研究"与"自动化",对普通定投者边际效用低。
误区 2:只用一个数据源
每个数据源都有盲区。理杏仁无财报深度,天天基金无估值分位,巨潮无加工指标。需组合使用。
误区 3:忽视数据口径
PE 是否剔除亏损股、分位窗口是 5 年还是 10 年、等权还是市值加权——口径不同,结果差异巨大。使用前务必明确。
误区 4:把"实时数据"当"决策依据"
盘中实时数据噪音大,定投是长期行为,应以周频或月频数据为决策依据,而非盘中波动。
误区 5:忽视官方公告
网络传闻、券商研报可能有误,所有信息都应以巨潮资讯的官方公告为准。特别是"成分股调整""分红方案""重大事项"等。
误区 6:数据源数据=真相
数据源也可能出错(如财报重述、口径调整)。关键决策需回到原始公告核对。数据是"参考",不是"真相"。
六、与项目其他文档的关联
01-估值指标公式与计算.md/02-估值分位计算方法.md:理杏仁是估值分位的核心数据源。03-指数编制规则详解.md:编制方案在中证指数官网、巨潮资讯查询。04-基金产品类型对比.md:ETF 折溢价用集思录,基金筛选用天天基金。05-基金费率体系.md:费率数据在天天基金,需与基金合同(巨潮)核对。06-财报三大表完整解读/07-财报排雷具体方法:财报原文在巨潮资讯,加工数据在 Wind/Choice。/03-中间段/01-政策分析/10-政策传导机制案例:政策文件在发改委/央行/工信部官网。/03-中间段/04-经济指标分析/01-宏观经济指标影响:宏观数据在国家统计局、央行官网。11-资产配置具体比例方法.md:股债收益比在理杏仁,宏观数据在统计局。12-定投止盈止损具体策略.md:止盈信号基于理杏仁的 PE 分位。/01-路线图/01-路线图:路线图各环节的数据需求,均以本专题为来源指引。
小结:数据源是定投的"基础设施"。免费组合(中证指数官网 + 巨潮资讯 + 天天基金 + 国家统计局)可覆盖 80% 需求;加理杏仁(年费 300 元)覆盖估值分位这一核心需求;集思录覆盖 ETF 折溢价;Wind/Choice/iFinD 适合深度研究。使用的三条铁律是:交叉验证、明确口径、注意滞后。数据是决策的"参考",而非"真相"——所有关键数据都应回到官方公告核对。掌握了数据源,定投方法论才真正落地为可执行的操作。
至此,13 份专题文档全部完成,构成了从估值计算、指数编制、基金产品、费率体系、财报解读、排雷方法、政策传导、宏观指标、行业生命周期、资产配置、止盈止损到数据源的完整知识闭环。每份专题既可独立学习,又通过"与项目其他文档的关联"互相串联,形成一套自包含、可离线学习的定投知识体系。