Temperature & Top-P (温度与采样参数)

核心 · Key Idea

一句话：Temperature 决定「多大胆」（高温更随机），Top-P 决定「敢从多大的池子里挑词」（小 P 只挑最稳的几个）。两者都让你在「严谨可控 ↔ 灵活创意」之间滑动。

是什么#

模型每生成一个 Token，都是在词表上算一份概率分布，然后采样：

Token 候选         概率
"清"             0.42
"晴"             0.28
"凉"             0.10
"…"              0.20

Temperature 改变这份分布的「锐度」，Top-P 改变「采样的候选池有多大」。

打个比方 · Analogy

Temperature 0确定性

永远挑概率最高的 Token。同样的输入永远得同样的输出。

Temperature 0.7默认创意

OpenAI / 大多数 chat 默认值。回答自然且有变化。

Temperature 1.5+胡话区

随机性强，容易跳梗、跑题甚至拼错字。

Top-P 0.1保守采样

只在「累计概率前 10%」的候选里挑，几乎确定性。

Top-P 1.0全开

整个词表都可能被采，搭配高温能玩出花。

经验值：

Temperature

改变**整份概率分布的锐度**。
所有候选都可能被选，但弱者机会变化。

Top-P

改变**候选池的大小**。
池子外的 Token 概率被强制归零。

同时调会怎样？

两者都能压随机性。通常只改一个，避免「调一调忘了哪个开了多少」。