LM Studio

核心 · Key Idea

一句话：LM Studio 是跨平台桌面 App，把「搜模型 → 下载 → 调 GPU → 聊天 / 起 API」做成图形界面。背后还是 llama.cpp，对不想敲命令的人最友好。

主要能力#

打个比方 · Analogy

Ollama 是装 Linux 的极客喜欢的方式；LM Studio 是装 macOS 的设计师也能直接用 LLM 的方式。功能差不多，面向人群不同。

GGUF 量化Q4_K_M / Q5_K / Q8_0

在模型卡右上角自动给「能不能跑」的颜色提示。

Server本地 API 服务

Developer 标签里一键开启，API key 可填任意值。

Hardware Detection硬件识别

自动用 Metal (mac) / CUDA / Vulkan / ROCm。

Multi-model多模型并存

可同时载入多个模型，根据请求路由。

Prompt Templates对话模板

ChatML / Llama / Qwen 等内置；导入新模型时自动选。

不会调参：默认参数对常见对话场景已经够用；调温度 / Top-P 直接拖滑块。
API 当 OpenAI 用：OPENAI_API_BASE=http://localhost:1234/v1 OPENAI_API_KEY=lm-studio 即可。
macOS Metal 性能很强：M3 Max 跑 70B Q4 也不算慢。
想长期跑后台：开启 Headless 模式 / 用 lms server start CLI；GUI 关了 API 还在。
RAG 局限：内置 RAG 是「轻量级」，企业级场景仍建议接专业向量库 + LangChain / LlamaIndex。
离线场景友好：模型下载完整离线可用 —— 隐私 / 涉密场景的合规之选。

LM Studio

GUI + 一键 API。
桌面用户友好。

Ollama

CLI + 守护进程。
脚本 / 工具集成顺手。