理解 AI 幻觉为什么会出现、它和撒谎有什么不同，以及普通人在使用生成式 AI 时该怎么防。

幻觉（Hallucination）

幻觉，指的是模型生成了听起来很像真的、但并不被事实、来源或输入依据支持的内容。它可能是编造引用、捏造数字、误认图片，也可能是把不确定的内容说得非常肯定。

幻觉常见来源示意图

[!info] 一句话先记住：幻觉最危险的地方，不是它胡说，而是它经常胡说得很像真的。

先记住这 3 点

幻觉不是模型“故意撒谎”，而是生成机制会产出不被证据支撑的内容。
说得流畅、格式正确，不等于内容真实。
RAG、检索、人工复核能降低幻觉，但不能保证彻底消失。

给普通人的解释

生成式 AI 的工作方式，不是像数据库那样“先查到事实再原样吐出来”。很多时候，它是在根据训练中学到的模式，预测什么样的下一个词最像一个合理回答。

这会带来一个很麻烦的问题：

当模型知道得不够、上下文不完整、提示含糊，或者任务本身要求它把答案补完整时，它仍然可能输出一个结构完整、语气自信、内容却不可靠的回答。

这就是为什么你会看到它：

编造论文和链接
把不存在的功能说成已经上线
给出看似专业、其实错误的医疗或法律建议
在总结材料时偷偷补上原文里没有的细节

幻觉为什么会发生

常见原因大致有四类：

1. 训练知识和当前问题不完全匹配

模型知道很多模式，但不一定掌握你此刻问的那条事实。

2. 输入信息不够

问题太模糊、上下文缺失、材料不完整时，模型会倾向“补全”而不是停下来承认不知道。

3. 生成目标偏向流畅

很多模型更擅长生成像答案的内容，不天然等于更擅长事实核查。

4. 工具链和检索设计不够好

如果检索不到、引用错了、上下文塞错了，RAG 系统照样可能把错误内容包装得很完整。

它和相近概念有什么区别

幻觉 vs 错别字或普通失误

普通失误可能是小错误；幻觉通常是内容本身缺少依据，却被说得像有依据。

幻觉 vs 撒谎

撒谎通常意味着有意欺骗；幻觉不一定有“意图”，更像系统在预测式生成里失去了事实约束。

幻觉 vs 偏差（Bias）

偏差强调系统性倾向，例如对某些群体更不公平；幻觉强调内容不真实或不被证据支持。两者可能同时出现，但关注点不同。

幻觉 vs 对齐（Alignment）

对齐关注系统是否朝着正确目标工作；幻觉是模型输出可靠性上的常见失败模式。一个系统即使对齐做得不错，也仍可能出现幻觉。

为什么 RAG 很重要，但也不是银弹

很多团队会用 RAG 来降低幻觉，因为它能让模型在回答前先拿到外部资料。

这确实有帮助，但它不能自动保证事实正确。原因很简单：

检索到的资料可能本身就不对
相关资料可能没有被检索到
模型可能误读资料
模型可能把有依据和没依据的内容混在一起说

所以更靠谱的做法通常不是“上了 RAG 就放心”，而是：

尽量要求引用来源
在高风险场景保留人工复核
把“我不知道”设计成可接受答案
对关键任务做事实校验或结构化约束

常见误解

误解 1：只要模型够大，就不会幻觉

不对。模型变强后有时会更会表达，但不代表事实错误会自动消失。

误解 2：幻觉只会出现在聊天机器人里

不对。摘要、搜索问答、文档生成、代码生成、多模态系统都可能出现幻觉。

误解 3：有引用就一定没问题

也不对。模型可能连引用本身都是编的，或者把无关来源硬套进答案里。

为什么普通读者需要知道它

因为今天很多人第一次把 AI 当成“信息入口”，而不是“写作玩具”。

如果你不知道幻觉是什么，就很容易把下面几件事混为一谈：

语言流畅
结构完整
有专业口吻
内容真实

这四件事根本不是一回事。

知道幻觉之后，你会更自然地做三件对的事：

关键事实去核对来源
高风险任务不把 AI 当唯一依据
看到特别顺滑的回答时，反而多留个心眼

参考来源

最后审核时间：2026-04-25

幻觉（Hallucination）

幻觉（Hallucination）

先记住这 3 点

给普通人的解释

幻觉为什么会发生

1. 训练知识和当前问题不完全匹配

2. 输入信息不够

3. 生成目标偏向流畅

4. 工具链和检索设计不够好

它和相近概念有什么区别

幻觉 vs 错别字或普通失误

幻觉 vs 撒谎

幻觉 vs 偏差（Bias）

幻觉 vs 对齐（Alignment）

为什么 RAG 很重要，但也不是银弹

常见误解

误解 1：只要模型够大，就不会幻觉

误解 2：幻觉只会出现在聊天机器人里

误解 3：有引用就一定没问题

为什么普通读者需要知道它

延伸阅读

参考来源

On this page