Hallucination (幻觉)

核心 · Key Idea

一句话：幻觉就是 LLM 「编」出听起来很像真的、但和事实不符的内容。它不是 bug，而是「下一个词概率最大化」机制下的天然副作用 —— 模型不知道自己不知道。

是什么#

LLM 没有「事实数据库」。它只是根据训练数据预测最像下一个词的东西。所以会出现：

打个比方 · Analogy

LLM 像一个特别能编故事的临时演员：你让他扮演「百科教授」，他不会承认「我也不知道」，而是根据语感把答案凑出来 —— 听起来很像真的，但真假参半。

事实性幻觉Factual

客观信息错误：人物、日期、引文、数据等。

上下文幻觉Context Drift

和你给的资料不符 —— 「文档里没有，模型瞎补的」。

格式幻觉Schema Drift

你要 JSON，它给了多余字段或缺字段。

工具幻觉Tool Drift

Function Calling 时编不存在的工具或参数。

核心矛盾：模型的损失函数只奖励「像训练数据」，不直接奖励「事实正确」。

幻觉

模型**编造**了根本不存在的事实。
通常很「自信」，没有不确定信号。

过期 / 不知

模型「**知识截止**」之后的事不知道。
可以用 RAG / 联网搜索补救。

律师 / 医疗 / 金融场景

关键决策永远不要直接信任 LLM 输出。要么人工复核，要么 RAG + 严格引用 + 拒答机制。