大模型 · 智能体 · RAG · 训练与部署 · 当前查看 入门 · 24 个知识点
高频常见概念,理解 AI / 智能体的最短路径。当前共 24 个知识点,分布在 5 个章节。
生成式 AI 的「大脑」—— 一台用海量文本训练出来的「下一个词概率机」。
AI 处理文本的最小颗粒度,也是计费的基本单位。
模型的「短期记忆」上限 —— 一次推理最多能看多少 Token。
7B / 72B 究竟意味着什么 —— 模型规模与能力的最直观度量。
模型一本正经地胡说八道 —— 概率生成机制的天生副作用。
模型的全局设定 —— 身份、行为、输出格式的「出厂说明书」。
控制 AI 输出「随机性、创造力、严谨度」的两个核心旋钮。
给模型看几个例子 —— 它就「有样学样」照做。
一句「请一步一步思考」就能让模型变聪明。
从「聊天机器人」升级为「会自己做事的 AI」的核心概念。
Agent 最核心的运作范式 —— 想一步、做一步、看一步、再想一步。
面对复杂目标,Agent 先列「步骤清单」再动手的能力。
把任务交给多个角色不同的 Agent,让他们「开会」完成复杂工程。
用固定的节点和边约束 AI 行为的「确定性流转」逻辑。
AI 连接外部工具的底层协议 —— 输出 JSON,由本地执行。
标准化的「模型外设接口」 —— 像 USB-C 一样让模型即插即用工具与数据。
把若干 prompt + 工具打包成一个可复用的「能力」 —— Agent 时代的「app」。
模型自主写代码、执行代码、读取结果的安全沙盒。
外挂知识库的标准架构 —— 先检索,后生成,让模型基于真实资料回答。
把文本压缩成「语义坐标」 —— 让计算机能算谁和谁意思接近。
为高维向量做大规模相似度检索的专用基础设施。
把长文档切成可以被检索 / 喂给模型的小片段。
多轮对话里上下文怎么管 —— 滑动窗口 + 摘要的工程取舍。
跨会话持久化的「关键事实库」 —— 让 AI 真的「认识你」。