算盘LLM Abacus

深度文章

大模型 API 的计费机制、省钱实战和选型方法论。文中价格全部来自厂商官方定价页，与价格表同源、可溯源。

计费入门

计费入门2026-06-10 · 约 9 分钟

大模型 API 到底怎么计费？token、输入输出、缓存、Batch 一文说清

写给第一次对接 LLM API 的开发者：输入价和输出价为什么分开收、token 怎么数、缓存命中价为何便宜一个数量级、Batch 批处理怎么省钱。用 Qwen3.5 Flash 和 GPT-5.5 算同一笔账，差距约 113 倍。

计费入门2026-07-22 · 约 3 分钟

读懂大模型价目表的 5 个术语陷阱：这些坑我替你踩过

百万 token、缓存输入价、Batch、上下文窗口、原始计费货币——大模型价目表上这几个术语，每一个都藏着能让你估错账单的坑。用算盘上的真实数字，把它们逐个讲清楚。

省钱实战

省钱实战2026-06-10 · 约 10 分钟

上下文缓存（Prompt Caching）实战：哪些场景真能省 90%

用真实价格数据拆解 LLM 上下文缓存：DeepSeek V4 Flash 命中价仅为输入价 2%，GPT-5.5 与 Claude 约 10%。讲清哪些 workload 吃得到缓存、前缀怎么排、写入加价和时效的坑，并用客服机器人算例对比月成本。

省钱实战2026-06-10 · 约 11 分钟

Agent 应用为什么烧钱？5 个成本大头与对策

Agent 应用的账单为什么比单轮对话贵一个数量级？拆解上下文滚雪球、工具结果回灌、推理 token、失败重试、长系统提示词五个成本大头，用 50 步任务算例对比三款模型总价，逐项给出省钱对策。

省钱实战2026-07-22 · 约 5 分钟

一个 AI 客服的月账单从 ¥3200 砍到 ¥480：真实的四步降本拆解

用算盘收录的真实模型单价，把一个中型 AI 客服机器人的月度 token 账单一步步拆开：为什么一开始要花 ¥3200，四步优化后怎么落到 ¥480，每一步省在哪、省多少，都用真实价格算给你看。

避坑

避坑2026-06-13 · 约 5 分钟

别信「永久免费」清单——6 家国产免费大模型 API 的评论区真相

智谱/混元/千帆/讯飞/硅基/火山的「永久免费」到底有几分真？我们扒了 V2EX、知乎、linux.do 的真实用户反馈和免费政策变动史：永久免费多是营销话术、真免费的只有小模型、新人额度全是限时、限速真实触发 429。看文案不如看评论。

避坑2026-06-12 · 约 4 分钟

AI 订阅限额大变局：Copilot 改按量、Claude 拆积分池，订阅党生存指南

2026 年 6 月，AI 订阅的游戏规则集中生变：GitHub Copilot 改按 token 计量、Claude 订阅 6 月 15 日起拆分积分池（不滚存）、ChatGPT 免费档投广告、豆包官宣 68/200/500 元三档。这篇把每家的变化、背后的成本逻辑和订阅用户的应对策略一次讲清。

避坑2026-06-10 · 约 10 分钟

1M 长上下文的价格真相：用满一次到底花多少钱

标称 1M、2M 的长上下文不是免费容量：Claude Opus 4.8 用满一次输入就要 ¥33.93，多轮对话还会平方级滚雪球。本文用算式拆解用满成本、整本塞与 RAG 的对照账，以及缓存能救到什么程度。

避坑2026-06-10 · 约 10 分钟

为什么账单总比估算贵？大模型计费的 6 个隐藏开销

账单比估算贵，多半不是厂商乱扣费：中文 token 折算、思考 token、多轮历史重发、工具调用、重试计费、max_tokens 失控，六个隐藏开销逐条给排查与止血动作，附可复算的算例和上线前估算工作流。

选型

选型2026-06-10 · 约 13 分钟

8 个真实场景的大模型选型：别只盯单价

单看「百万 token 多少钱」选模型容易选错：输入输出比例才决定真实成本。本文按输入密集、输出密集拆解客服、代码、RAG、Agent 等 8 个场景，各给省钱、均衡、旗舰三档推荐，所有算式可复核。

选型2026-06-10 · 约 10 分钟

DeepSeek V4 API 成本完全指南：Flash 和 Pro 怎么选

DeepSeek V4 Flash（¥1/¥2）和 V4 Pro（¥3/¥6）怎么选？本文用可复算的算式拆解缓存命中 ¥0.02 的真实省钱幅度、V3.2 迁移账，并横向对比 GPT-5.5、Qwen3.5 Flash 与 GLM-4.7 的价格差距。

选型2026-07-22 · 约 5 分钟

横评全站 44 款大模型 API 价格后，6 个反直觉的结论

把算盘收录的 44 款主流大模型 API 价格拉成一张表，逐列比对输入价、输出价、缓存价与上下文窗口后，浮现出 6 个和直觉相反的结论——它们比单纯的「谁最便宜」更能决定你的账单。

选型2026-07-22 · 约 3 分钟

2026 上半年大模型 API 价格复盘：谁在降、降了多少、你该怎么接

把算盘半年来追踪到的真实价格变动摊开看：Anthropic 罕见把 Opus 输入输出各砍约 67%，DeepSeek 把 V4 Pro 的限时折扣直接转永久。这些变动不是新闻，是你该重算账单的信号。