算盘LLM Abacus

Embedding 向量模型价格对比

做 RAG、语义搜索、推荐就离不开向量模型。Embedding 只按输入计费、没有输出价, 所以单看一个数就能比。10 个主流模型按价格排好了,开源自部署的 BGE 免费排最前。

模型厂商价格(每百万 tokens)维度最大输入标签
BGE-M3 (BAAI)🇨🇳智源 BAAI开源免费8K
开源可自部署多语言
text-embedding-3-small🇺🇸OpenAI¥0.136$0.0215368K
性价比
voyage-3.5-lite🇺🇸Voyage AI¥0.136$0.0232K
极便宜快速
voyage-3.5🇺🇸Voyage AI¥0.407$0.0632K
性价比
通义 text-embedding-v4🇨🇳阿里通义¥0.5008K
国产多语言维度可调
Cohere embed v4.0🇺🇸Cohere¥0.814$0.121536128K
多语言长上下文多模态
text-embedding-3-large🇺🇸OpenAI¥0.881$0.1330728K
高精度
gemini-embedding-001🇺🇸Google¥1.02$0.1530722K
多语言
voyage-3-large🇺🇸Voyage AI¥1.22$0.1832K
高精度Anthropic 推荐
voyage-code-3🇺🇸Voyage AI¥1.22$0.1832K
代码

价格单位 ¥/百万 tokens(海外厂商附 $ 原价,按 1 USD = 6.78 换算)· 绿色 = 最便宜(开源 BGE 可自部署免费)· 数据更新 2026-05-30 · 以各厂商官方为准

怎么挑 Embedding 模型?

先看价格,因为 Embedding 通常调用量巨大。RAG 把整个知识库都向量化、每次检索还要给 query 算向量,量级远超普通对话。所以单价哪怕差几倍,月账单差距也很可观。OpenAI text-embedding-3-small (¥0.136)和 Voyage voyage-3.5-lite 是海外最便宜的可用选项;想完全免费就用开源 BGE-M3 自部署。

再看维度(dimensions)。维度越高,向量表达越细,但存储和检索成本也越高。3072 维(text-embedding-3-large、 gemini-embedding)精度高但占空间;1536 / 1024 维是常见平衡点。OpenAI 和部分模型支持降维(缩短维度),可在精度和成本间权衡。

看最大输入长度。大多数 Embedding 单次最多 8K tokens 左右,超长文档需要先切块(chunking)。Cohere embed v4 的 128K 上下文是个例外,适合整篇长文档直接编码。

中文 / 多语言场景。通义 text-embedding-v4(¥0.500)大陆访问无障碍、对中文优化好;开源 BGE-M3 是中文社区最常用的免费方案,自部署零调用成本。海外的 Cohere、Voyage 多语言能力也很强。

别忘了配套的生成模型。RAG = 检索(Embedding)+ 生成(LLM)。算好向量成本后,到 LLM 价格表 选生成模型,或用 月账单计算器 把两端成本一起算。

向量选好了,去挑生成模型把 RAG 配齐。