共 44 / 44 个模型 · 价格单位 ¥/百万 tokens（海外厂商附 $ 美元原价，按 1 USD = 6.79 换算）· 点击表头列名可排序 · 绿色高亮 = 最便宜 · 性价比↑ = 质量/价格比最高（需有质量评分） · 热度 = OpenRouter 周榜名次（token 用量，反映海外开发者实际用量而非质量；国产模型国内端点用量不经 OR，仅供参考）

模型	厂商	质量	热度	输入价 ▲	输出价	缓存价	上下文	最大输出	知识截止	性价比	模态	标签	去试用
Qwen3.5 Flash	🇨🇳阿里通义核对 2026-07-12	—	—	¥0.20	¥2.00	—	131K	16K	—	—	文本	极便宜快速	使用 →
Gemini 2.5 Flash-Lite	🇺🇸Google 核对 2026-06-01	—	#160.60T	¥0.68$0.10	¥2.72$0.40	¥0.07	1.0M	64K	—	—	文本视觉	极便宜快速	使用 →
Qwen3.5 Plus	🇨🇳阿里通义核对 2026-07-12	—	—	¥0.80	¥4.80	—	131K	32K	—	—	文本视觉	性价比新发布	使用 →
Doubao 1.5 Pro	🇨🇳字节豆包核对 2026-07-03	—	—	¥0.80	¥2.00	¥0.16	256K	12K	—	—	文本视觉	极便宜上代	使用 →
文心 ERNIE 4.5 Turbo	🇨🇳百度文心核对 2026-06-05	—	—	¥0.80	¥3.20	¥0.20	128K	16K	—	—	文本视觉	性价比快速	使用 →
混元 TurboS	🇨🇳腾讯混元核对 2026-06-05	—	—	¥0.80	¥2.00	—	256K	16K	—	—	文本	性价比快速	使用 →
DeepSeek V4 Flash	🇨🇳DeepSeek 核对 2026-07-12	47	#14.34T	¥1.00	¥2.00	¥0.02	1.0M	384K	—	★ 313	文本	国产之光极便宜长上下文	使用 →
文心 ERNIE X1 Turbo	🇨🇳百度文心核对 2026-06-05	—	—	¥1.00	¥4.00	—	128K	16K	—	—	文本	推理深度思考	使用 →
混元 T1	🇨🇳腾讯混元核对 2026-06-05	—	—	¥1.00	¥4.00	—	64K	16K	—	—	文本	推理	使用 →
Gemini 3.1 Flash-Lite	🇺🇸Google 核对 2026-06-01	34	—	¥1.70$0.25	¥10.19$1.50	¥0.17	1.0M	64K	2025-01	★ 57	文本视觉	极便宜快速	使用 →
DeepSeek V3.2	🇨🇳DeepSeek 核对 2026-07-12	—	#101.18T	¥2.00	¥8.00	¥0.50	128K	8K	—	—	文本	即将弃用2026-07-24 下线	使用 →
GLM-4.7	🇨🇳智谱 AI 核对 2026-07-12	—	—	¥2.00	¥8.00	¥0.40	200K	16K	—	—	文本	性价比	使用 →
Spark X2 Flash	🇨🇳讯飞星火核对 2026-06-05	—	—	¥2.00	¥2.00	—	200K	16K	—	—	文本	推理快速性价比	使用 →
Spark Ultra	🇨🇳讯飞星火核对 2026-06-05	—	—	¥2.00	¥2.00	—	128K	16K	—	—	文本	性价比FunctionCall	使用 →
Baichuan M2	🇨🇳百川智能核对 2026-06-05	—	—	¥2.00	¥20.00	—	192K	16K	—	—	文本	性价比	使用 →
Gemini 2.5 Flash	🇺🇸Google 核对 2026-06-01	—	#140.63T	¥2.04$0.30	¥16.98$2.50	¥0.20	1.0M	64K	—	—	文本视觉音频	快速性价比	使用 →
MiniMax M2.7	🇨🇳MiniMax 核对 2026-06-05	50	—	¥2.10	¥8.40	¥0.42	1.0M	64K	—	★ 95	文本	Agent代码性价比	使用 →
Doubao 1.6	🇨🇳字节豆包核对 2026-07-03	—	—	¥2.40	¥24.00	—	256K	16K	—	—	文本视觉音频	多模态上代	使用 →
Qwen3 Max	🇨🇳阿里通义核对 2026-07-12	—	—	¥2.50	¥10.00	—	131K	32K	—	—	文本视觉	性价比	使用 →
DeepSeek V4 Pro	🇨🇳DeepSeek 核对 2026-07-12	52	#52.06T	¥3.00	¥6.00	¥0.03	1.0M	384K	—	★ 116	文本	旗舰推理长上下文	使用 →
Spark X2	🇨🇳讯飞星火核对 2026-06-05	—	—	¥3.00	¥3.00	—	200K	16K	—	—	文本	旗舰推理	使用 →
混元 2.0 Think	🇨🇳腾讯混元核对 2026-06-05	—	—	¥3.98	¥15.90	—	128K	16K	—	—	文本	旗舰推理	使用 →
GLM-5	🇨🇳智谱 AI 核对 2026-07-12	—	—	¥4.00	¥18.00	¥1.00	200K	16K	—	—	文本视觉	旗舰	使用 →
文心 ERNIE 5.1	🇨🇳百度文心核对 2026-06-05	—	—	¥4.00	¥18.00	—	128K	16K	—	—	文本视觉	旗舰	使用 →
MiniMax M3	🇨🇳MiniMax 核对 2026-06-05	55	#33.38T	¥4.20	¥16.80	¥0.84	1.0M	64K	—	★ 52	文本	Agent代码长上下文旗舰	使用 →
Baichuan M3 Plus	🇨🇳百川智能核对 2026-06-05	—	—	¥5.00	¥9.00	—	192K	16K	—	—	文本	医疗旗舰	使用 →
GLM-5.1	🇨🇳智谱 AI 核对 2026-07-12	51	—	¥6.00	¥24.00	¥1.30	200K	16K	—	34	文本	旗舰推理新发布	使用 →
Doubao Seed 2.1 Pro	🇨🇳字节豆包核对 2026-07-03	—	—	¥6.00	¥30.00	¥1.20	256K	32K	—	—	文本视觉	旗舰推理新发布	使用 →
Kimi K2.6	🇨🇳Moonshot / Kimi 核对 2026-07-12	54	—	¥6.50	¥27.00	¥1.10	262K	32K	—	32	文本视觉	旗舰长上下文Agent	使用 →
Claude Haiku 4.5	🇺🇸Anthropic 核对 2026-07-03	37	—	¥6.79$1.00	¥33.95$5.00	¥0.68	200K	32K	—	18	文本视觉	快速	使用 →
Grok Build 0.1	🇺🇸xAI 核对 2026-06-01	—	—	¥6.79$1.00	¥13.58$2.00	¥1.36	256K	64K	—	—	文本	代码快速	使用 →
Spark Pro	🇨🇳讯飞星火核对 2026-06-05	—	—	¥7.00	¥7.00	—	128K	16K	—	—	文本	强性能	使用 →
GPT-5.1	🇺🇸OpenAI 核对 2026-06-01	—	—	¥8.49$1.25	¥67.90$10.00	¥0.85	400K	128K	2024-09	—	文本视觉	快速	使用 →
Gemini 2.5 Pro	🇺🇸Google 核对 2026-06-01	35	—	¥8.49$1.25	¥67.90$10.00	¥0.85	2.0M	64K	—	9	文本视觉音频	长上下文	使用 →
Grok 4.3	🇺🇸xAI 核对 2026-06-01	53	—	¥8.49$1.25	¥16.98$2.50	¥1.36	1.0M	64K	2024-11	42	文本视觉	旗舰推理	使用 →
Gemini 3.5 Flash	🇺🇸Google 核对 2026-06-01	55	#190.45T	¥10.19$1.50	¥61.11$9.00	¥1.02	1.0M	64K	—	15	文本视觉音频	快速多模态	使用 →
Qwen3.7 Max	🇨🇳阿里通义核对 2026-07-12	57	—	¥12.00	¥36.00	—	1.0M	32K	—	24	文本视觉	旗舰Agent长上下文新发布	使用 →
Gemini 3.1 Pro Preview	🇺🇸Google 核对 2026-06-01	57	—	¥13.58$2.00	¥81.48$12.00	¥1.36	2.0M	64K	2025-01	12	文本视觉音频	旗舰长上下文多模态	使用 →
GPT-5.4	🇺🇸OpenAI 核对 2026-06-01	—	—	¥16.98$2.50	¥101.85$15.00	¥1.70	400K	128K	2025-08	—	文本视觉	性价比	使用 →
Claude Sonnet 4.6	🇺🇸Anthropic 核对 2026-07-03	52	#62.03T	¥20.37$3.00	¥101.85$15.00	¥2.04	1.0M	64K	—	9	文本视觉	性价比长上下文代码	使用 →
GPT-5.5	🇺🇸OpenAI 核对 2026-06-01	60	#180.47T	¥33.95$5.00	¥203.70$30.00	¥3.40	400K	128K	2025-12	5	文本视觉	旗舰推理	使用 →
Claude Opus 4.8	🇺🇸Anthropic 核对 2026-07-03	61	#91.32T	¥33.95$5.00	¥169.75$25.00	¥3.40	1.0M	64K	2026-01	6	文本视觉	长上下文代码推理上代旗舰	使用 →
Claude Opus 4.7	🇺🇸Anthropic 核对 2026-07-03	57	#81.71T	¥33.95$5.00	¥169.75$25.00	¥3.40	1.0M	64K	2026-01	6	文本视觉	长上下文代码上代	使用 →
Claude Fable 5	🇺🇸Anthropic 核对 2026-07-03	—	—	¥67.90$10.00	¥339.50$50.00	¥6.79	1.0M	128K	2026-01	—	文本视觉	旗舰推理代码长上下文新发布	使用 →

价格单位：人民币 / 百万 tokens。USD 计费厂商（currency=USD，含 OpenAI/Anthropic/Google/xAI/MiniMax）按官方美元原价存储，加载时乘 usdToCny（每日核对实时汇率、变动即更新，最近校准日期见 usdToCnyUpdated 字段）换算成 CNY；CNY 计费厂商按中国区官方人民币定价存储（不随汇率浮动）。最终以各厂商官方文档为准。2026-07 版：新增 Claude Fable 5（$10/$50，知识截止 2026-01，1M 上下文 / 128K 最大输出，6月9日发布，因美国出口管控临时下架后 6月30日已恢复全球可用）；新增 Doubao Seed 2.1 Pro（¥6/¥30/¥1.2，256K 上下文，6月24日字节火山引擎 FORCE 大会发布，新一代旗舰）；补全 claude-opus-4-8 知识截止日期 2026-01；汇率更新 6.7814（2026-07-03）。注意：DeepSeek V4 将于 2026-07 中旬引入峰谷计费（工作日 9-12 时及 14-18 时北京时间价格翻倍），基础离峰价格不变；deepseek-chat / deepseek-reasoner 旧模型名将于 2026-07-24 23:59（北京时间）正式下线。

省心之选

懒得逐家注册?一个 key 调所有模型

不想各家分别注册、各自充值、各管各的 key?用 AIMLAPI 一个 key 直连数百个模型,按量计费、随时切换。比价完想省事就走它。

了解 AIMLAPI →

含推广 · 通过此链接注册我们可能获得返佣,不影响你的价格

按场景挑模型

选你的任务类型，看 top 3 性价比推荐。

代码生成长文摘要 RAG 检索翻译批量处理多模态日常对话

性价比散点图 →

NEW

X=价格×Y=质量，一眼找到左上角性价比王。

省钱指南 & FAQ →

6 个技巧 + 8 个高频问答，把 LLM 账单砍到 1/10。

全部模型目录 →

44 个模型按 14 家厂商分组，一页看全。

开放定价 API →

JSON

/api/prices 可免费调用，适合内部工具集成。

深度文章

计费机制、省钱实战、避坑与选型，价格全部真实可溯源。

查看全部 16 篇 →

避坑约 5 分钟

别信「永久免费」清单——6 家国产免费大模型 API 的评论区真相

智谱/混元/千帆/讯飞/硅基/火山的「永久免费」到底有几分真？我们扒了 V2EX、知乎、linux.do 的真实用户反馈和免费政策变动史：永久免费多是营销话术、真免费的只有小模型、新人额度全是限时、限速真实触发 429。看文案不如看评论。

避坑约 4 分钟

AI 订阅限额大变局：Copilot 改按量、Claude 拆积分池，订阅党生存指南

2026 年 6 月，AI 订阅的游戏规则集中生变：GitHub Copilot 改按 token 计量、Claude 订阅 6 月 15 日起拆分积分池（不滚存）、ChatGPT 免费档投广告、豆包官宣 68/200/500 元三档。这篇把每家的变化、背后的成本逻辑和订阅用户的应对策略一次讲清。

计费入门约 9 分钟

大模型 API 到底怎么计费？token、输入输出、缓存、Batch 一文说清

写给第一次对接 LLM API 的开发者：输入价和输出价为什么分开收、token 怎么数、缓存命中价为何便宜一个数量级、Batch 批处理怎么省钱。用 Qwen3.5 Flash 和 GPT-5.5 算同一笔账，差距约 113 倍。

怎么挑一个最划算的大模型？

第一步，分清「输入价」和「输出价」。几乎所有 LLM 厂商都按 token 计费，但输入 token（你发给模型的）和输出 token（模型生成的）单价不一样，通常输出贵 4–10 倍。所以「短问长答」类任务（写文章、生成代码）成本主要取决于输出价，而「长问短答」类任务（文档摘要、分类）则看输入价。

第二步，看缓存价。如果你的应用有大量重复的 system prompt 或文档上下文（比如客服机器人、 RAG），缓存命中后输入价能降到 10–20%。DeepSeek、OpenAI、Anthropic、 Google 都支持上下文缓存，但价格差异巨大。

第三步，看任务复杂度。不要默认用旗舰模型。Claude Haiku 4.5、Gemini 2.5 Flash-Lite、Qwen3.5 Flash、 DeepSeek V4 Flash 这些「腰部模型」性价比极高，对话、翻译、简单生成、分类这些任务完全够用，成本只有旗舰的 1–5%。

第四步，国产 vs 海外。如果用户在中国大陆，访问 DeepSeek、Kimi、通义、豆包延迟低（~50ms vs ~500ms），且不需要科学上网。Qwen3.5 Flash（¥0.20/¥2）和 DeepSeek V4 Flash （¥1/¥2）是当前最便宜的两个，Gemini 2.5 Flash-Lite 则是海外最便宜的选项。

第五步，用估算器算总账。单价只是 nominal，真实月账单取决于调用次数 × 单次 token 量。把你典型任务的 prompt 粘到 Token 估算器，瞬间看清各家月成本差距。

常见问题

输入价、输出价、缓存价，一次调用到底按哪个收？

三个一起收，分别算。你发进去的内容按输入价计费（命中缓存的那部分改按更便宜的缓存价），模型生成的内容按输出价计费，最后相加就是这次调用的费用。所以同一个模型对不同任务的实际成本差别很大：长文档摘要主要花在输入，写长文主要花在输出，重复前缀多的应用则靠缓存把输入那块压下来。

为什么输出价普遍比输入价贵好几倍？

因为生成比读取更耗算力。模型读输入是一次性并行处理，而生成输出是一个 token 一个 token 自回归解码出来的，计算量大得多，厂商定价也就随之拉高，常见是输入价的 4 到 10 倍。实际影响是：凡是「让模型多写」的任务，省钱的重点不是换便宜模型，而是先想办法让它少写——限定长度、只要结果不要解释，往往立竿见影。

缓存价那么便宜，是不是我用了缓存就一定省钱？

不一定，要看你的请求结构。缓存通常只对「重复的前缀」生效，且要达到最小 token 门槛、两次请求间隔不能太久，部分厂商首次写入缓存还会单独收一笔。如果你每次 prompt 开头都不一样（比如把用户输入放在最前面），就基本命中不了。想吃到缓存红利，正确做法是把固定不变的内容（system prompt、文档、工具定义）放在最前面，变动的用户输入放最后。

上下文窗口越大越好吗？为什么大窗口反而可能更费钱？

窗口大解决的是「能不能装下」，不解决「该不该装满」。你塞进窗口的每个 token 都按输入价计费，把整本手册一次性丢进去，既增加费用又可能分散模型注意力、降低回答质量。更划算的通常是「精准检索只取相关片段 + 把固定前缀做成缓存」。大窗口的真正价值在于那些确实无法切分的任务，比如通读一份长合同或整个代码库。

推理/思考模型标的输出价看着不贵，为什么账单更高？

因为带「思考」「推理」模式的模型在给出最终答案前，会先生成一大段你通常看不到的思维链，而这些思维 token 一般也按输出价计费。也就是说你为「它在想的过程」也付了钱。所以评估这类模型不能只看挂牌的输出单价，要结合它在你任务上实际产生多少思维 token——同样一道题，思维链越长，隐性成本越高。对不需要复杂推理的任务，直接用非推理模型往往更省。

同一个模型，为什么不同地方报价不一样？算盘列的是哪个价？

因为同一个模型可以通过官方 API、聚合平台（如 OpenRouter）、云厂商托管（如火山方舟、阿里云百炼）等多个渠道调用，各渠道定价、汇率折算、促销策略都不同，价差有时不小。本站价格表默认展示官方定价作为基准，另设了「渠道比价」页专门把同一模型在各渠道的实测价并排列出来，每个价都标了核对日期和来源，方便你找到当下最便宜的调用方式。

算盘上的价格多久更新一次？可靠吗？

国产主力厂商接了每日自动核价，海外（美元计费）厂商按当日实时汇率折算，每个价格都记录了最近核对日期和核对方式。但模型定价变动频繁、各家也常有限时促销，本站只做对比和换算，任何价格最终都以厂商官方文档为准。算盘是独立开发者做的工具站，不隶属也不代表任何厂商；如果你发现某个数字和官方对不上，欢迎指出，会尽快更正。

算盘·LLM Abacus

最近价格变动

全球用量热度榜

最便宜的 5 个模型

模型价格表