幻觉(Hallucination)
理解 AI 幻觉为什么会出现、它和撒谎有什么不同,以及普通人在使用生成式 AI 时该怎么防。
幻觉(Hallucination)
幻觉,指的是模型生成了听起来很像真的、但并不被事实、来源或输入依据支持的内容。它可能是编造引用、捏造数字、误认图片,也可能是把不确定的内容说得非常肯定。
[!info] 一句话先记住:幻觉最危险的地方,不是它胡说,而是它经常胡说得很像真的。
先记住这 3 点
- 幻觉不是模型“故意撒谎”,而是生成机制会产出不被证据支撑的内容。
- 说得流畅、格式正确,不等于内容真实。
- RAG、检索、人工复核能降低幻觉,但不能保证彻底消失。
给普通人的解释
生成式 AI 的工作方式,不是像数据库那样“先查到事实再原样吐出来”。很多时候,它是在根据训练中学到的模式,预测什么样的下一个词最像一个合理回答。
这会带来一个很麻烦的问题:
当模型知道得不够、上下文不完整、提示含糊,或者任务本身要求它把答案补完整时,它仍然可能输出一个结构完整、语气自信、内容却不可靠的回答。
这就是为什么你会看到它:
- 编造论文和链接
- 把不存在的功能说成已经上线
- 给出看似专业、其实错误的医疗或法律建议
- 在总结材料时偷偷补上原文里没有的细节
幻觉为什么会发生
常见原因大致有四类:
1. 训练知识和当前问题不完全匹配
模型知道很多模式,但不一定掌握你此刻问的那条事实。
2. 输入信息不够
问题太模糊、上下文缺失、材料不完整时,模型会倾向“补全”而不是停下来承认不知道。
3. 生成目标偏向流畅
很多模型更擅长生成像答案的内容,不天然等于更擅长事实核查。
4. 工具链和检索设计不够好
如果检索不到、引用错了、上下文塞错了,RAG 系统照样可能把错误内容包装得很完整。
它和相近概念有什么区别
幻觉 vs 错别字或普通失误
普通失误可能是小错误;幻觉通常是内容本身缺少依据,却被说得像有依据。
幻觉 vs 撒谎
撒谎通常意味着有意欺骗;幻觉不一定有“意图”,更像系统在预测式生成里失去了事实约束。
幻觉 vs 偏差(Bias)
偏差强调系统性倾向,例如对某些群体更不公平;幻觉强调内容不真实或不被证据支持。两者可能同时出现,但关注点不同。
幻觉 vs 对齐(Alignment)
对齐关注系统是否朝着正确目标工作;幻觉是模型输出可靠性上的常见失败模式。一个系统即使对齐做得不错,也仍可能出现幻觉。
为什么 RAG 很重要,但也不是银弹
很多团队会用 RAG 来降低幻觉,因为它能让模型在回答前先拿到外部资料。
这确实有帮助,但它不能自动保证事实正确。原因很简单:
- 检索到的资料可能本身就不对
- 相关资料可能没有被检索到
- 模型可能误读资料
- 模型可能把有依据和没依据的内容混在一起说
所以更靠谱的做法通常不是“上了 RAG 就放心”,而是:
- 尽量要求引用来源
- 在高风险场景保留人工复核
- 把“我不知道”设计成可接受答案
- 对关键任务做事实校验或结构化约束
常见误解
误解 1:只要模型够大,就不会幻觉
不对。模型变强后有时会更会表达,但不代表事实错误会自动消失。
误解 2:幻觉只会出现在聊天机器人里
不对。摘要、搜索问答、文档生成、代码生成、多模态系统都可能出现幻觉。
误解 3:有引用就一定没问题
也不对。模型可能连引用本身都是编的,或者把无关来源硬套进答案里。
为什么普通读者需要知道它
因为今天很多人第一次把 AI 当成“信息入口”,而不是“写作玩具”。
如果你不知道幻觉是什么,就很容易把下面几件事混为一谈:
- 语言流畅
- 结构完整
- 有专业口吻
- 内容真实
这四件事根本不是一回事。
知道幻觉之后,你会更自然地做三件对的事:
- 关键事实去核对来源
- 高风险任务不把 AI 当唯一依据
- 看到特别顺滑的回答时,反而多留个心眼
延伸阅读
参考来源
- A Survey on Hallucination in Large Language Models
- NIST, Artificial Intelligence Risk Management Framework: Generative Artificial Intelligence Profile
最后审核时间:2026-04-25