第零阶段:AI 协作能力建设(2-3 周,与第一阶段并行启动)

核心原则:2026 年个人投资者的竞争力,不在于"自己能分析多少",而在于"能否用好 AI、能否识别 AI 的错、能否做最终判断"。没这个能力,不该启动定投。

本阶段目标:建立清晰的人机分工边界、掌握结构化提示词、能识别 LLM 幻觉、保护个人隐私。

建议周投入:4-6 小时 总投入:8-12 小时(2-3 周完成)


学习目标

完成本阶段后,你应该能够:

  1. 用三句话说清楚"哪些事委托给 AI、哪些事保留给自己、哪些事绝不交给 AI"
  2. 建立个人 AI 提示词库,至少 10 条经验证的提示词
  3. 能在 3 分钟内识别出 LLM 回答中的至少 1 处幻觉
  4. 建立个人数据验证 SOP(标准操作流程)
  5. 配置个人 AI 协作工具栈(至少 1 个 LLM + 1 个数据源 + 1 个笔记工具)

模块一:AI 协作心智模型

1.1 人机分工的底层框架

类别内容示例
委托给 AI信息汇总、结构化分析、初稿生成、跨语言跨领域检索政策原文摘要、行业空间测算初稿、海外财报翻译
保留给人类最终判断、仓位决策、价值观取舍、家庭沟通、心态控制是否加仓、止盈点选择、风险承受力评估
不可委托下单权、身份证号/账户号/持仓详情、签字权实际下单操作、隐私数据输入、合同签署

1.2 三条铁律

  1. AI 建议不盲从:任何 LLM 给出的标的判断、估值数字、政策解读都需独立验证
  2. 不让 LLM 直接下单:LLM 可作为分析助手,但交易决策权必须是人类
  3. 不向公共 LLM 泄露隐私:持仓详情、账户信息、身份证号不进公共 LLM

1.3 心智模型自检

能否用三句话说清楚以下问题:

  • 第一句:我把什么工作委托给 AI?(具体到任务类型)
  • 第二句:我把什么决策保留给自己?(具体到决策类型)
  • 第三句:我绝不把什么交给 AI?(具体到红线)

示例答案

我把政策原文摘要、行业研报整理、估值数据汇总委托给 AI。 我把仓位比例、止盈时机、标的选择保留给自己。 我绝不把下单操作、持仓详情、账户密码交给 AI。


模块二:提示词工程基础

2.1 结构化提问模板(政策解读)

角色:你是一位政策分析师
任务:解读以下政策文件
输入:[政策原文/链接]
输出格式:
  1. 方向性 vs 落地性判断
  2. 直接受益方/间接受益方/受损方
  3. 受益行业的当前估值分位(需说明数据时点)
  4. 可量化考核指标
  5. 已存在的可投指数/基金
  6. 历史相似政策兑现节奏
约束:如不确定,明确说"不知道",不要编造

2.2 结构化提问模板(行业分析)

角色:你是一位行业研究员
任务:分析[行业名称]的投资逻辑
输出格式:
  1. 行业生命周期阶段(含判断依据)
  2. 市场规模与渗透率(含数据来源)
  3. 竞争格局(CR3/CR5 + 壁垒)
  4. 产业链上下游
  5. 跟踪指标清单(3-5 个领先指标)
  6. 当前估值分位与历史对比
约束:所有数字标注数据时点与来源

2.3 结构化提问模板(财报拆解)

财报三大表完整解读详见 /04-终点段/01-基金标的研究/06-财报三大表完整解读,财报排雷具体方法详见 /04-终点段/01-基金标的研究/07-财报排雷具体方法

角色:你是一位财报分析师
任务:拆解[公司名称]最近一期财报
输入:[财报链接/原文]
输出格式:
  1. 营收/利润/现金流三年趋势
  2. 毛利率/净利率/ROE 变化
  3. 应收账款/存货异常识别
  4. 关联交易占比
  5. 现金流与利润匹配度
  6. 红旗清单(按严重程度排序)
约束:所有数字标注财报页码;不确定的标"待核验"

2.4 提示词库构建要求

阶段要求:建立自己的"AI 提示词库",至少 10 条经验证的提示词。

每条提示词包含以下要素:

  • 任务类型(政策解读/行业分析/财报拆解/估值对比等)
  • 输入要求(需要提供什么材料)
  • 输出格式(结构化模板)
  • 验证方式(如何核验 LLM 输出)
  • 已知陷阱(该提示词容易出现的幻觉类型)

模块三:幻觉识别与数据验证

3.1 LLM 在投资领域的常见幻觉类型

幻觉类型表现验证方法
政策原文编造引用不存在的政策条款回国务院政策文件库原文检索
估值数字虚构给出看似精确的 PE 分位回理杏仁/集思录核验(数据源使用手册见 /04-终点段/01-基金标的研究/13-数据源使用手册
历史事件错位时间/人物/金额记错交叉验证 2 个以上来源
因果关系强加把无关事件解释为因果检查其论据是否支持论点
概念混淆把相似指数/基金搞混核对指数编制规则

3.2 数据验证的"双源原则"

  • LLM 给出的任何具体数字,必须回原始数据源二次核验
  • 政策类:国务院政策文件库原文
  • 估值类:理杏仁/集思录/天天基金
  • 财报类:巨潮资讯网原始公告
  • 宏观类:国家统计局原始数据

3.3 幻觉识别训练

训练方法:故意让 LLM 回答一个你熟知的问题,识别其幻觉。

示例

  • 问 LLM:"请说明 2015 年大牛市的起止日期、最高点、最低点。"
  • 你已知答案:2015 年 6 月 12 日 5178 点为最高点,6 月 15 日开始暴跌,8 月 26 日跌至 2850 点
  • 检查 LLM 回答的日期、点位是否准确
  • 若有错误,记录错误类型(时间错位/数字虚构/因果强加)

训练目标:能在 3 分钟内识别出 LLM 回答中的至少 1 处幻觉。

3.4 数据验证 SOP

步骤 1:识别 LLM 输出中的"具体数字"(日期、金额、比例、分位数) 步骤 2:对每个数字标注其声称的来源 步骤 3:回原始数据源二次核验 步骤 4:记录差异,标注"✅ 一致 / ⚠️ 有差异 / ❌ 完全错误" 步骤 5:基于验证后的数字重新判断结论是否成立


模块四:人机分工框架

4.1 "三段式"人机协作流程

阶段 1:AI 初稿
├─ LLM 生成结构化分析初稿
├─ 输出包含数据、结论、建议
└─ 注意:所有内容视为"草稿",未经验证

阶段 2:人类验证
├─ 核对关键数字(回原始数据源)
├─ 识别幻觉(政策编造/估值虚构/因果强加)
├─ 补充本地知识(个人能力圈、家庭情况)
└─ 输出:验证后的信息清单

阶段 3:人类决策
├─ 基于验证后的信息做最终判断
├─ 决策维度:仓位比例、止盈时机、标的选择
└─ 决策权 100% 在人类,AI 不参与最终决策

4.2 不该委托 AI 的事

  • 仓位比例决策(涉及个人风险承受力)
  • 止盈/止损时机(涉及个人财务规划)
  • 标的更换(涉及能力圈判断)
  • 家庭沟通内容(涉及情感与关系)

4.3 AI 协作的"五不一必须"

五不

  1. 不让 LLM 直接下单
  2. 不让 LLM 接 API 直连账户
  3. 不向公共 LLM 输入隐私
  4. 不盲从 LLM 的"确定性"判断
  5. 不在回撤时让 LLM 给实时建议

一必须

  1. 必须对 LLM 给出的每个具体数字做二次核验

模块五:隐私与安全

5.1 绝不向公共 LLM 输入的内容

  • 身份证号、银行卡号、账户密码
  • 真实持仓详情与金额
  • 家庭成员信息
  • 工作单位与收入详情

5.2 可用本地 LLM 处理的隐私内容

  • 持仓复盘(用本地模型,如 Ollama+Llama)
  • 个人财务规划
  • 家庭沟通演练

5.3 本地 LLM 配置建议

入门方案:LM Studio + 开源模型(如 Qwen 2.5 7B)

  • 优点:图形界面、安装简单
  • 缺点:性能依赖本地硬件

进阶方案:Ollama + Llama 3.1/Qwen 2.5

  • 优点:命令行灵活、可脚本化
  • 缺点:需要一定技术基础

隐私数据处理流程

  1. 持仓详情、账户信息用本地 LLM 处理
  2. 处理前用脱敏脚本去除身份证号、银行卡号
  3. 处理后清空对话记录
  4. 不将本地处理结果上传至公共 LLM

模块六:时间预算与完成标准

6.1 周度推进计划

  • 第 1 周:建立 AI 协作心智模型 + 配置工具栈(公共 LLM + 本地 LLM + 笔记工具)+ 阅读《投资第1课》相关章节(本地化笔记见 /02-起点段/05-投资书籍参考/01-投资第1课
  • 第 2 周:完成 5 条提示词的编写与验证 + 完成 1 次幻觉识别训练 + 建立数据验证 SOP
  • 第 3 周:补齐提示词库至 10 条 + 完成 3 个 LLM 出错实例的案例集 + 总验收

6.2 月度产出物

  • 1 份个人 AI 提示词库(至少 10 条经验证提示词)
  • 1 份幻觉识别案例集(至少 3 个 LLM 出错的实例)
  • 1 份个人数据验证 SOP

6.3 阶段交付物

  • 能用一条结构化提示词让 LLM 输出符合"政策六问"模板的分析
  • 能识别 LLM 在某个政策细节上的幻觉并改正
  • 建立个人 AI 协作工具栈(至少 1 个 LLM + 1 个数据源 + 1 个笔记工具)

6.4 阶段自检

能否用三句话说清楚"哪些事委托给 AI、哪些事保留给自己、哪些事绝不交给 AI"。


模块七:常见问题与陷阱

Q1:用 Claude 还是 ChatGPT 还是国产模型?

A:建议组合使用:

  • 政策解读/中文场景:Claude、Kimi、DeepSeek、通义
  • 英文资料/海外财报:Claude、ChatGPT
  • 实时搜索:Perplexity、Genspark
  • 隐私内容:本地 LLM(Ollama+Llama/Qwen)

不要只用一个模型,不同模型擅长领域不同,交叉验证能降低幻觉风险。

Q2:LLM 给出的 PE 分位可以直接用吗?

A:不可以。LLM 训练数据有时滞,且容易编造看似精确的数字。所有 PE 分位必须回理杏仁/集思录核验,并标注数据时点(PE/PB 等估值指标定义详见 /04-终点段/01-基金标的研究/01-估值指标公式与计算,分位计算方法详见 /04-终点段/01-基金标的研究/02-估值分位计算方法)。

Q3:可以用 LLM 自动执行定投吗?

A:绝对不行。LLM 可作为分析助手,但下单权必须是人类。让 LLM 接 API 直连交易账户是红线,原因:

  1. LLM 输出有幻觉,可能误下单
  2. 自动化执行绕过了人类的最终判断
  3. 异常市场环境下 LLM 决策可能失控

Q4:本地 LLM 配置需要什么硬件?

A

  • 7B 参数模型:8GB 显存或 16GB 内存可运行
  • 13B 参数模型:建议 16GB 显存或 32GB 内存
  • 若无独立显卡,可用 CPU 推理(速度较慢)

Q5:如何让 LLM 更诚实地说"不知道"?

A:在提示词中加入以下约束:

  • "如不确定,明确说'不知道',不要编造"
  • "对每个具体数字标注数据时点与来源"
  • "不确定的结论标注'待核验'"
  • "对政策原文引用,必须提供原文链接"

本阶段作业

作业 1:AI 协作心智模型自述

用三段话写清楚你的"三件事"分工:委托给 AI 什么、保留给自己什么、绝不交给 AI 什么。每段话至少包含 3 个具体例子。

作业 2:提示词库初稿

编写 5 条结构化提示词,覆盖以下任务类型:

  1. 政策解读(使用"政策六问"模板)
  2. 行业分析(使用生命周期+竞争格局模板)
  3. 财报拆解(含红旗清单)
  4. 估值对比(多只同类基金对比)
  5. 自由命题(你常用的某类分析)

每条提示词需附:①实际使用案例 ②LLM 输出摘录 ③你的验证结果

作业 3:幻觉识别案例集

记录 3 个 LLM 出错的实例,每个案例包含:

  1. 提问内容
  2. LLM 回答(原文摘录)
  3. 错误类型(政策编造/估值虚构/历史错位/因果强加/概念混淆)
  4. 你如何识别出错误
  5. 正确答案与来源

作业 4:数据验证 SOP

编写个人数据验证 SOP,包含:

  1. 哪些数字必须验证(类型清单)
  2. 各类数字的原始数据源(具体网站/工具)
  3. 验证步骤(从 LLM 输出到最终判断的完整流程)
  4. 验证记录模板(表格格式)

下一阶段衔接

完成本阶段后,进入第二阶段:政策解读能力。本阶段建立的提示词库与幻觉识别能力,将直接用于政策六问的拆解工作。

详见 01-政策解读能力.md


配套文档