算盘

文心 ERNIE 4.5 Turbo

🇨🇳 百度文心
性价比快速
输入价
¥0.800
每百万 tokens
输出价
¥3.20
每百万 tokens
缓存输入价
¥0.200
每百万 tokens
价格来源:百度文心 官方定价页 ↗最后核对 2026-06-05监控中
上下文窗口
128K
最大输出
16K
模态
文本/视觉
智能指数

💰 成本速算

单次典型问答(输入 2000 + 输出 500 tokens)
¥0.0032
按月 1 万次调用估算
¥32.00
粘你自己的文本精确估算 →
文心 ERNIE 4.5 Turbo 是 百度文心 的腰部主力模型,支持文本、视觉模态。API 输入价 ¥0.800、输出价 ¥3.20(每百万 tokens),在算盘收录的 42 个主流模型里输入价排名第 3 便宜,属于国产阵营的极低价位。缓存命中后输入低至 ¥0.200,有大量重复上下文(RAG、客服、长 system prompt)时能进一步省钱。上下文窗口 128K,单次最大输出 16K。适合高频、低复杂度任务:分类、打标、简单问答、批量处理。

文心 ERNIE 4.5 Turbo 的定位:原生多模态的性价比主力

文心 ERNIE 4.5 Turbo 是百度在文心 4.5 系列里专门往『性价比 + 速度』方向调的那一档。它不是冲榜的旗舰(那个位置是 ERNIE 5.1),也不是先想一大段再答的深度思考模型(那是 ERNIE X1 Turbo),而是定位在『日常高频调用都能用、单价压得很低、响应又快』的主力对话/生成模型。对要把大模型铺到真实业务里、又对成本敏感的团队来说,这一档往往才是跑量的那个模型。

它在本目录登记为文本 + 视觉(vision)模态,是一个原生支持图文输入的多模态模型——这点和 X1 Turbo 很不一样:X1 Turbo 的看图是靠工具实现的,而 4.5 Turbo 是把视觉理解做进了模型本体。如果你的场景需要把图片、截图、表单和文字一起喂进去做理解,4.5 Turbo 能直接吃,不必再单独接一个视觉模型。它的上下文窗口和最大输出等具体规格请以本页上方规格区为准。

值得专门点出的是它和 ERNIE X1 Turbo 的关系:百度的深度思考款 X1 Turbo 正是在 4.5 Turbo 这个基座之上训练出来的。换句话说,4.5 Turbo 是底座、是『快答』的那一面,X1 Turbo 是在它之上加了一层会展开思维链的『慢想』。理解这层血缘,对你做选型很有用——很多场景的正确架构是『默认走便宜快的 4.5 Turbo,只把真正需要推理的难题升档到 X1 Turbo』。

定价结构与性价比:缓存输入是它的隐藏杀招

ERNIE 4.5 Turbo 的计费维度比同厂的 X1 Turbo 多了一档:输入价、输出价,外加一个明显更低的『缓存输入价(cached input)』。具体数字以本页上方价格表为准(价格表每日自动核价,比正文里写死的数字可信)。但结构上有个关键点要抓住——它是文心系列里少数把缓存价单列出来的型号,这一档便宜得多,是真正能砍账单的杠杆。

缓存输入价怎么用?凡是你每次请求都会重复携带的内容——固定的 system prompt、人设/规则说明、工具定义、长文档前缀、few-shot 示例——只要把这些稳定不变的部分放到可缓存的位置,命中缓存后这部分就按远低于全价的缓存价计费。对客服机器人、RAG 问答、Agent 这类『前缀几乎不变、只换用户那一句』的高频场景,缓存命中能把输入侧成本砍掉一大块。很多人只盯着输入/输出单价比价,却漏了这个对高频应用最值钱的维度。

至于整体性价比:4.5 Turbo 在文心梯队里就是奔着低单价 + 快响应去的,适合跑量。但『便宜』不等于『随便用』——正确的算法依然是按你的真实任务画像(输入/输出/缓存 token 的比例)对照价格表算端到端成本,而不是只看每百万 token 的牌价。输出重、需要长篇生成的任务,输出价才是大头;输入重、前缀可复用的任务,缓存价才是关键。先搞清楚你的 token 画像,再判断它到底替你省了多少。

最适合与最不适合的任务场景

最适合 4.5 Turbo 的,是『高频、要快、对单价敏感、但不需要深度推理』的中文活:客服与 FAQ 自动回复、内容生成与改写、摘要与抽取、意图识别与分类、图文混合的轻量理解(读截图、读表单、读商品图配文字)、以及 Agent 里那些不需要长链路思考的普通子步骤。它的强项是『又快又便宜地把常规任务办了』,配合缓存输入,跑量场景的成本能压得很低。

最不适合的,是需要长链路多步推理、要它自己反复验证才能答对的硬任务:复杂逻辑推理、多步数学、需要边想边跑代码核对的问题。这类活强行用 4.5 Turbo,你往往得靠反复改 prompt、多轮纠错去凑答案,综合成本和体验都不如直接上会推理的 X1 Turbo 或旗舰 ERNIE 5.1。简单说:4.5 Turbo 擅长『快答』,不擅长『苦想』。

还有一类要把预期摆正:对答案质量上限要求极高的关键任务(复杂合同审查、高风险决策辅助、需要最强中文写作/推理的场合)。4.5 Turbo 是性价比档,它的能力天花板低于旗舰 ERNIE 5.1。这类场景该升档到 5.1,把 4.5 Turbo 留给量大、容错高的常规流量。把它当『跑量的主力』而不是『压轴的尖子』,定位才不会错。

同梯队怎么选,什么时候升档或降档

先看文心自家梯队,这是最清晰的对照。ERNIE 5.1 是旗舰,能力上限最高、单价也最贵,留给质量要求最苛刻的关键任务;ERNIE 4.5 Turbo 是性价比/快速档,跑量主力;ERNIE X1 Turbo 是在 4.5 Turbo 之上的深度思考款,单价更高,专门干需要多步推理 + 自主调工具的难活。三者的分工很自然:常规高频走 4.5 Turbo,难推理升 X1 Turbo,最关键最讲质量的升 5.1。

和外厂同价位的国产性价比模型(如 DeepSeek、通义、智谱、Kimi 等的对应档)相比,谁更划算高度依赖你的具体任务和 token 画像,不要只看通用跑分榜。务实做法是拿你自己的真实流量各跑一批,比『答对率/可用率 × 单题成本 × 延迟』的综合,再叠加你最看重的维度——比如你是中文母语场景、又需要原生图文理解,4.5 Turbo 的多模态 + 中文底子会更对口;纯文本极致压价,可能别家更便宜。benchmark 高低请以各家官方和第三方实测为准。

升档信号:监控显示 4.5 Turbo 在某类任务上答错率偏高、要靠反复重试才勉强可用——这类任务该上推理的 X1 Turbo 或质量更高的 5.1,用一步到位换回隐性的重试成本。降档/留在本档的信号:你的流量主要是短、简单、高频、容错的请求,4.5 Turbo 完全够用——这时就别为更贵的型号买单,反而要把缓存输入用足、把可复用前缀固定下来,进一步压成本。一切单价请始终以本页上方价格表为准。

常见问题

ERNIE 4.5 Turbo 和 ERNIE X1 Turbo 是什么关系,怎么选?

百度的深度思考款 X1 Turbo 正是在 4.5 Turbo 这个基座之上训练的:4.5 Turbo 是『快答』的底座,X1 Turbo 在它之上加了一层会展开思维链的『慢想』。选型上,常规高频、不需要多步推理的任务走更便宜更快的 4.5 Turbo;遇到需要复杂推理或自主调工具的难题,再升档到 X1 Turbo。最经济的架构是默认走 4.5 Turbo,只把真正难的题路由给 X1 Turbo。

4.5 Turbo 的缓存输入价怎么用才省钱?

它是文心系列里少数把缓存输入价单列出来的型号,这一档明显低于全价。把每次请求都重复携带的稳定内容——固定 system prompt、人设规则、工具定义、长文档前缀、few-shot 示例——放到可缓存的位置,命中后这部分就按缓存价计费。对客服、RAG、Agent 这类前缀几乎不变只换用户一句话的高频场景,缓存命中能把输入侧成本砍掉一大块。具体单价以本页上方价格表为准。

4.5 Turbo 是真多模态吗?能直接看图吗?

它在本目录按文本 + 视觉模态登记,是原生支持图文输入的多模态模型,可以直接吃图片、截图、表单配文字一起做理解,不必额外接一个视觉模型。这点和 X1 Turbo 不同(X1 Turbo 的看图是靠工具实现)。如果你需要大批量、低单价的轻量图文理解,4.5 Turbo 是合适的一档;但具体能力边界请以官方文档和你的实测为准。

什么时候该从 4.5 Turbo 升档到 ERNIE 5.1?

当任务对答案质量上限要求很高、4.5 Turbo 的能力天花板不够用时——比如复杂合同审查、高风险决策辅助、需要最强中文写作或推理的关键场景。4.5 Turbo 是性价比跑量档,5.1 是旗舰,能力更高单价也更贵。原则是让 4.5 Turbo 跑量大、容错高的常规流量,只把最关键、最讲质量的少数任务升到 5.1,避免全量用旗舰把账单拉爆。

🎁 经本站链接注册的新客有首购折扣 · 本站可能因此获得佣金