幻觉(Hallucination)

理解 AI 幻觉为什么会出现、它和撒谎有什么不同,以及普通人在使用生成式 AI 时该怎么防。

幻觉(Hallucination)

幻觉,指的是模型生成了听起来很像真的、但并不被事实、来源或输入依据支持的内容。它可能是编造引用、捏造数字、误认图片,也可能是把不确定的内容说得非常肯定。

幻觉常见来源示意图

[!info] 一句话先记住:幻觉最危险的地方,不是它胡说,而是它经常胡说得很像真的。

先记住这 3 点

  • 幻觉不是模型“故意撒谎”,而是生成机制会产出不被证据支撑的内容。
  • 说得流畅、格式正确,不等于内容真实。
  • RAG、检索、人工复核能降低幻觉,但不能保证彻底消失。

给普通人的解释

生成式 AI 的工作方式,不是像数据库那样“先查到事实再原样吐出来”。很多时候,它是在根据训练中学到的模式,预测什么样的下一个词最像一个合理回答。

这会带来一个很麻烦的问题:

当模型知道得不够、上下文不完整、提示含糊,或者任务本身要求它把答案补完整时,它仍然可能输出一个结构完整、语气自信、内容却不可靠的回答。

这就是为什么你会看到它:

  • 编造论文和链接
  • 把不存在的功能说成已经上线
  • 给出看似专业、其实错误的医疗或法律建议
  • 在总结材料时偷偷补上原文里没有的细节

幻觉为什么会发生

常见原因大致有四类:

1. 训练知识和当前问题不完全匹配

模型知道很多模式,但不一定掌握你此刻问的那条事实。

2. 输入信息不够

问题太模糊、上下文缺失、材料不完整时,模型会倾向“补全”而不是停下来承认不知道。

3. 生成目标偏向流畅

很多模型更擅长生成像答案的内容,不天然等于更擅长事实核查。

4. 工具链和检索设计不够好

如果检索不到、引用错了、上下文塞错了,RAG 系统照样可能把错误内容包装得很完整。

它和相近概念有什么区别

幻觉 vs 错别字或普通失误

普通失误可能是小错误;幻觉通常是内容本身缺少依据,却被说得像有依据

幻觉 vs 撒谎

撒谎通常意味着有意欺骗;幻觉不一定有“意图”,更像系统在预测式生成里失去了事实约束。

幻觉 vs 偏差(Bias)

偏差强调系统性倾向,例如对某些群体更不公平;幻觉强调内容不真实或不被证据支持。两者可能同时出现,但关注点不同。

幻觉 vs 对齐(Alignment)

对齐关注系统是否朝着正确目标工作;幻觉是模型输出可靠性上的常见失败模式。一个系统即使对齐做得不错,也仍可能出现幻觉。

为什么 RAG 很重要,但也不是银弹

很多团队会用 RAG 来降低幻觉,因为它能让模型在回答前先拿到外部资料。

这确实有帮助,但它不能自动保证事实正确。原因很简单:

  • 检索到的资料可能本身就不对
  • 相关资料可能没有被检索到
  • 模型可能误读资料
  • 模型可能把有依据和没依据的内容混在一起说

所以更靠谱的做法通常不是“上了 RAG 就放心”,而是:

  • 尽量要求引用来源
  • 在高风险场景保留人工复核
  • 把“我不知道”设计成可接受答案
  • 对关键任务做事实校验或结构化约束

常见误解

误解 1:只要模型够大,就不会幻觉

不对。模型变强后有时会更会表达,但不代表事实错误会自动消失。

误解 2:幻觉只会出现在聊天机器人里

不对。摘要、搜索问答、文档生成、代码生成、多模态系统都可能出现幻觉。

误解 3:有引用就一定没问题

也不对。模型可能连引用本身都是编的,或者把无关来源硬套进答案里。

为什么普通读者需要知道它

因为今天很多人第一次把 AI 当成“信息入口”,而不是“写作玩具”。

如果你不知道幻觉是什么,就很容易把下面几件事混为一谈:

  • 语言流畅
  • 结构完整
  • 有专业口吻
  • 内容真实

这四件事根本不是一回事。

知道幻觉之后,你会更自然地做三件对的事:

  • 关键事实去核对来源
  • 高风险任务不把 AI 当唯一依据
  • 看到特别顺滑的回答时,反而多留个心眼

延伸阅读

参考来源

最后审核时间:2026-04-25