算盘 · LLM Abacus
中文优先的 AI 大模型价格对比。
一张表看清 26 个主流模型,30 秒回答「跑哪个最便宜」。
模型价格表
默认按输入价升序,便宜的在最上面
共 26 / 26 个模型 · 价格单位 ¥/百万 tokens · 点击表头列名可排序 · 绿色高亮 = 最便宜
| 模型 | 厂商 | 输入价 ▲ | 输出价 | 缓存价 | 上下文 | 最大输出 | 模态 | 标签 | 去试用 |
|---|---|---|---|---|---|---|---|---|---|
| Gemini 2.5 Flash-Lite | ¥0.71 | ¥2.84 | ¥0.18 | 1.0M | 64K | 文本视觉 | 极便宜快速 | 使用 → | |
| Doubao 1.5 Pro | 🇨🇳字节豆包 | ¥0.80 | ¥2.00 | ¥0.16 | 256K | 12K | 文本视觉 | 极便宜 | 使用 → |
| GPT-5 mini | 🇺🇸OpenAI | ¥1.78 | ¥14.2 | ¥0.18 | 400K | 128K | 文本视觉 | 性价比 | 使用 → |
| DeepSeek V3.2 | 🇨🇳DeepSeek | ¥2.00 | ¥8.00 | ¥0.50 | 128K | 8K | 文本 | 性价比国产之光 | 使用 → |
| Gemini 2.5 Flash | ¥2.13 | ¥17.8 | ¥0.53 | 1.0M | 64K | 文本视觉音频 | 快速性价比 | 使用 → | |
| DeepSeek R1 | 🇨🇳DeepSeek | ¥4.00 | ¥16.0 | ¥1.00 | 128K | 32K | 文本 | 推理性价比 | 使用 → |
| GLM-4.5 | 🇨🇳智谱 AI | ¥4.00 | ¥16.0 | ¥1.00 | 128K | 16K | 文本视觉 | 性价比 | 使用 → |
| Qwen3 Max | 🇨🇳阿里通义 | ¥4.00 | ¥12.0 | ¥1.00 | 256K | 32K | 文本视觉 | 性价比 | 使用 → |
| Claude Haiku 4.5 | 🇺🇸Anthropic | ¥7.10 | ¥35.5 | ¥0.71 | 200K | 32K | 文本视觉 | 快速 | 使用 → |
| o4-mini | 🇺🇸OpenAI | ¥7.81 | ¥31.2 | ¥1.95 | 200K | 100K | 文本视觉 | 推理 | 使用 → |
| o3-mini | 🇺🇸OpenAI | ¥7.81 | ¥31.2 | ¥3.91 | 200K | 100K | 文本 | 推理 | 使用 → |
| GPT-5 | 🇺🇸OpenAI | ¥8.88 | ¥71.0 | ¥0.89 | 400K | 128K | 文本视觉 | 旗舰推理 | 使用 → |
| Gemini 3 Pro | ¥8.88 | ¥71.0 | ¥2.22 | 2.0M | 64K | 文本视觉音频 | 旗舰长上下文多模态 | 使用 → | |
| Gemini 2.5 Pro | ¥8.88 | ¥71.0 | ¥2.22 | 2.0M | 64K | 文本视觉音频 | 长上下文 | 使用 → | |
| Qwen2.5 Max | 🇨🇳阿里通义 | ¥10.0 | ¥30.0 | — | 131K | 8K | 文本 | 使用 → | |
| Kimi K2 | 🇨🇳Moonshot / Kimi | ¥12.0 | ¥12.0 | — | 200K | 8K | 文本 | 长上下文 | 使用 → |
| GPT-4.1 | 🇺🇸OpenAI | ¥14.2 | ¥56.8 | ¥3.55 | 1.0M | 33K | 文本视觉 | 长上下文 | 使用 → |
| Claude Sonnet 4.6 | 🇺🇸Anthropic | ¥21.3 | ¥107 | ¥2.13 | 1.0M | 64K | 文本视觉 | 性价比长上下文 | 使用 → |
| Claude Sonnet 4.5 | 🇺🇸Anthropic | ¥21.3 | ¥107 | ¥2.13 | 200K | 64K | 文本视觉 | 性价比 | 使用 → |
| Grok-4 | 🇺🇸xAI | ¥21.3 | ¥107 | ¥5.33 | 256K | 64K | 文本视觉 | 推理 | 使用 → |
| Grok-3 | 🇺🇸xAI | ¥21.3 | ¥107 | ¥5.33 | 131K | 16K | 文本视觉 | 使用 → | |
| GLM-4-Plus | 🇨🇳智谱 AI | ¥50.0 | ¥50.0 | — | 128K | 8K | 文本视觉 | 旗舰 | 使用 → |
| Moonshot v1 128k | 🇨🇳Moonshot / Kimi | ¥60.0 | ¥60.0 | — | 128K | 8K | 文本 | 长上下文 | 使用 → |
| Claude Opus 4.7 | 🇺🇸Anthropic | ¥107 | ¥533 | ¥10.7 | 1.0M | 64K | 文本视觉 | 旗舰长上下文 | 使用 → |
| Claude Opus 4.6 | 🇺🇸Anthropic | ¥107 | ¥533 | ¥10.7 | 200K | 32K | 文本视觉 | 旗舰 | 使用 → |
| Claude Opus 4.5 | 🇺🇸Anthropic | ¥107 | ¥533 | ¥10.7 | 200K | 32K | 文本视觉 | 使用 → |
价格单位:人民币 / 百万 tokens。美元厂商按 1 USD ≈ 7.1 CNY 换算。最终以各厂商官方文档为准。
怎么挑一个最划算的大模型?
第一步,分清「输入价」和「输出价」。几乎所有 LLM 厂商都按 token 计费,但输入 token(你发给模型的) 和输出 token(模型生成的)单价不一样,通常输出贵 4–10 倍。所以「短问长答」类任务(写文章、生成代码)成本主要取决于输出价, 而「长问短答」类任务(文档摘要、分类)则看输入价。
第二步,看缓存价。如果你的应用有大量重复的 system prompt 或文档上下文(比如客服机器人、 RAG),缓存命中后输入价能降到 10–20%。DeepSeek、OpenAI、Anthropic、 Google 都支持上下文缓存,但价格差异巨大。
第三步,看任务复杂度。不要默认用旗舰模型。Claude Haiku、Gemini 2.5 Flash、Doubao 1.5 Pro、 DeepSeek V3.2 这些「腰部模型」性价比极高,对话、翻译、简单生成、分类 这些任务完全够用,成本只有旗舰的 5–10%。
第四步,国产 vs 海外。如果用户在中国大陆,访问 DeepSeek、Kimi、通义、豆包延迟低(~50ms vs ~500ms),且不需要科学上网。豆包甚至比 DeepSeek 还便宜,Gemini Flash-Lite 则是海外最便宜的选项。
第五步,用估算器算总账。单价只是 nominal,真实月账单取决于调用次数 × 单次 token 量。 把你典型任务的 prompt 粘到 Token 估算器,瞬间看清各家月成本差距。