算盘

Token 是什么?等于几个汉字、值多少钱

所有大模型的账单、限额、上下文,最后都落在同一个词上:token。这篇用说人话的方式一次讲清——它是什么、怎么换算成字数和人民币、以及为什么 AI 聊着聊着会「忘」。

一句话定义

Token 是 AI 的「计费和阅读单位」。模型读你的话、写回答,都是按 token 一颗一颗进行的——就像出租车按公里计价,大模型按 token 计价。你在价格表看到的「¥X / 百万 tokens」、会员页写的「次数限额」、宣传里的「128K 上下文」,本质都是在数 token。

1 个 token 等于几个字?

1 个汉字

≈ 1.2 – 1.3 tokens

主流 tokenizer(GPT 系 o200k 等)实测

1000 字中文

≈ 1300 tokens

最常用的粗算口径

1 个英文单词

≈ 1.3 tokens

OpenAI 官方口径 1 token ≈ 0.75 词

国产模型分词

对中文更省

DeepSeek / Qwen 约 0.6-1.0 token/字

想知道你的一段话到底是多少 token?粘进Token 计算器即时出数,免登录。

为什么大模型按 token 收费?

因为模型每处理一颗 token 都要真实消耗 GPU 算力——token 数就是算力账单的直接代理。所以厂商把价格拆成两部分:输入价(你发给模型的内容)和输出价(模型生成的内容),输出因为要逐颗生成、更费算力,单价通常是输入的 4-5 倍。

这也解释了免费产品为什么开始收费:你每问一句,厂商都在替你烧真金白银的算力。2026 年豆包官宣付费会员、ChatGPT 免费版上广告,根源都是 token 成本。

Token 到底值多少钱?三个真实场景

费用按算盘价格库实时计算(每日自动核价),中文按 1 字 ≈ 1.3 tokens 折算。

场景DeepSeek V4 FlashQwen3.5 FlashGPT-5.5Claude Opus 4.7

问一个日常问题

提问 50 字,回答 500 字

¥0.0014¥0.0013¥0.134¥0.112

翻译一篇文章

原文 2000 字,译文约 2000 字

¥0.0078¥0.0057¥0.617¥0.529

让 AI 读一本 20 万字小说并写摘要

输入 20 万字,输出 1000 字摘要

¥0.263¥0.055¥9.07¥9.03

结论:单次使用便宜到可以忽略,贵的是规模——个人偶尔问问题几乎不花钱,但应用方每天百万次调用、或 AI 编程工具一次任务烧几十万 tokens,账单就完全是另一回事了。这正是「省 token」成为显学的原因。

上下文窗口:为什么 AI 聊着聊着会「忘」?

模型一次能「装进脑子」的 token 总量有上限,叫上下文窗口。128K 就是约 12.8 万 tokens(约 10 万字中文),1M 是约 100 万 tokens。你和 AI 的整段对话历史,每一轮都要重新塞进这个窗口。

所以「聊着聊着忘了前面说的」不是 bug:历史塞满窗口后,最早的内容会被丢弃或压缩,模型是真的「看不到」了。两个实用对策:①重要的背景信息别指望它一直记得,关键时刻重新贴一遍;②长任务拆开新对话,反而又快又省(每轮重算的历史更短,token 费也更少)。

常见问题

Q. Token 到底是什么意思?

Token 是大模型「阅读」和「计费」的最小单位。模型不按字、不按句子处理文字,而是先把文字切成一颗颗 token(一个汉字通常切成 1-2 颗,一个英文单词约 1-1.3 颗),读你的问题按 token 计,写回答也按 token 计。API 的价格表上写的「¥X / 百万 tokens」就是这么来的。

Q. 1 个 token 等于几个汉字?

反过来说更准:1 个汉字 ≈ 1.2-1.3 个 token(主流 tokenizer 实测),即 1 个 token ≈ 0.8 个汉字。粗记:1000 字中文 ≈ 1300 tokens。英文则是 1 个单词 ≈ 1.3 tokens。国产模型(DeepSeek、Qwen 等)的分词器对中文做过优化,同样的中文会切出更少的 token,更省钱。

Q. Token 怎么换算成人民币?

公式:成本 =(输入 token 数 ÷ 100 万 × 输入单价)+(输出 token 数 ÷ 100 万 × 输出单价)。例如输入单价 ¥1/百万 tokens 时,一次 1300 tokens(约 1000 字)的输入只要 0.13 分钱。把你的真实文本粘进算盘的 Token 计算器,会直接帮你算好所有模型的钱数。

Q. 为什么输出比输入贵好几倍?

因为「写」比「读」费算力:模型生成回答时要一颗一颗 token 地自回归计算,而读取输入可以并行处理。所以几乎所有模型的输出单价是输入的 4-5 倍——这也是为什么「让 AI 少废话」是最有效的省钱技巧。

Q. 上下文窗口是什么?128K、1M 是什么意思?

上下文窗口是模型一次能「记住」的 token 上限,包括你说过的所有话和它的所有回答。128K 即约 12.8 万 tokens(约 10 万字中文),1M 约 100 万 tokens。窗口越大,能塞进越长的文档和越久的对话历史,但每轮对话的计费 token 也越多。

Q. AI 为什么聊着聊着会忘记前面说的话?

因为对话历史超出了上下文窗口。每次你发消息,整段历史都要重新塞给模型;塞满后最早的内容会被丢弃或压缩,模型就「忘了」。这不是 bug,是 token 上限的物理约束。对策:重要信息别依赖它记住,长任务开新对话时把关键背景重新贴一遍。

Q. 我用免费的 AI(豆包、DeepSeek)也在消耗 token 吗?

在消耗,只是厂商替你付了钱。免费产品背后同样按 token 烧算力成本,这正是 2026 年各家纷纷推出付费会员、限制免费额度的原因——天下没有免费的 token,只有暂时由别人买单的 token。

Q. 怎么少花 token、省点钱?

三个最有效的:①让模型「直接给结果、别解释过程」(砍输出);②长对话定期开新会话,别拖着几万字历史每轮重算(砍输入);③简单任务用便宜模型,旗舰只留给难题。更完整的省钱手册见算盘的省钱指南。

概念懂了,现在算算你的真实用量值多少钱。