别人踩过的坑,就是你的护城河

避坑排雷中心

4 大类 12+ 真实踩坑案例 + 自检清单,助你避开 AI 投研最常见的暗礁

数据陷阱
逻辑陷阱
合规陷阱
效率陷阱

真实踩坑案例库

按 4 大陷阱类型整理,每个案例含 场景 / 症状 / 根因 / 应对

1

幻觉数据:看似精准的"编造"数字

风险等级:
典型场景
股票AI 财报场景
现象描述
询问某上市公司 2023Q3 研发费用,智能体给出一位小数点级别的精确数字。
🔍 根因
大模型倾向"补全"未在训练语料中的数字,看似合理的精度往往是虚构的信号。
应对建议
要求"标注数据来源 + 与公告原文交叉验证";若无法给出原始数据,直接判定为不可信。
2

时点穿越:把"未来"当"已知"

风险等级:
典型场景
行业研报 / 估值场景
现象描述
在 2024 年 4 月的研报中,智能体引用 2024Q2 业绩预测,但实际该时点尚未发生。
🔍 根因
训练数据截止时点模糊 + 缺乏"截止时间戳"约束。
应对建议
永远要求"标注数据截止日期";无标注的回答默认按"截至上一公开披露日"理解。
3

单位 / 口径混用:亿元 vs 亿美元

风险等级:
典型场景
跨境/港美股场景
现象描述
同一份研报中,腾讯营收数字突然比上一段小 7 倍,实为货币单位变更未说明。
🔍 根因
大模型对量纲不敏感,缺乏数值级自检。
应对建议
每段数字前明确"亿元/亿美元/万元";不一致时主动追问澄清。

三步自检清单

收到任何 AI 输出后,逐项打勾后再采用

1

数据可信度检查

  • 所有数字是否标注了「截止日期」?
  • 是否能交叉验证 2 个独立数据源?
  • 是否区分了"预测"与"已发生"?
  • 单位 / 货币是否一致?
  • 是否标注了"无法核验"?
2

逻辑严谨性检查

  • 是否区分了"相关"与"因果"?
  • 是否给了反例或稳健性测试?
  • 是否做了样本外验证?
  • 关键假设是否被列出?
3

合规风险检查

  • 是否暗示了具体标的方向性建议?
  • 免责声明是否充分且在显著位置?
  • 是否涉及客户隐私或未公开数据?
  • 输出是否可追溯到具体来源?