Embedding 向量模型价格对比

做 RAG、语义搜索、推荐就离不开向量模型。Embedding 只按输入计费、没有输出价，所以单看一个数就能比。10 个主流模型按价格排好了，开源自部署的 BGE 免费排最前。

模型	厂商	价格（每百万 tokens）	维度	最大输入	标签
BGE-M3 (BAAI)	🇨🇳智源 BAAI	开源免费	—	8K	开源可自部署多语言
text-embedding-3-small	🇺🇸OpenAI	¥0.136$0.02	1536	8K	性价比
voyage-3.5-lite	🇺🇸Voyage AI	¥0.136$0.02	—	32K	极便宜快速
voyage-3.5	🇺🇸Voyage AI	¥0.407$0.06	—	32K	性价比
通义 text-embedding-v4	🇨🇳阿里通义	¥0.500	—	8K	国产多语言维度可调
Cohere embed v4.0	🇺🇸Cohere	¥0.814$0.12	1536	128K	多语言长上下文多模态
text-embedding-3-large	🇺🇸OpenAI	¥0.881$0.13	3072	8K	高精度
gemini-embedding-001	🇺🇸Google	¥1.02$0.15	3072	2K	多语言
voyage-3-large	🇺🇸Voyage AI	¥1.22$0.18	—	32K	高精度Anthropic 推荐
voyage-code-3	🇺🇸Voyage AI	¥1.22$0.18	—	32K	代码

价格单位 ¥/百万 tokens（海外厂商附 $ 原价，按 1 USD = 6.78 换算）· 绿色 = 最便宜（开源 BGE 可自部署免费）· 数据更新 2026-05-30 · 以各厂商官方为准

怎么挑 Embedding 模型？

先看价格，因为 Embedding 通常调用量巨大。RAG 把整个知识库都向量化、每次检索还要给 query 算向量，量级远超普通对话。所以单价哪怕差几倍，月账单差距也很可观。OpenAI text-embedding-3-small （¥0.136）和 Voyage voyage-3.5-lite 是海外最便宜的可用选项；想完全免费就用开源 BGE-M3 自部署。

再看维度（dimensions）。维度越高，向量表达越细，但存储和检索成本也越高。3072 维（text-embedding-3-large、 gemini-embedding）精度高但占空间；1536 / 1024 维是常见平衡点。OpenAI 和部分模型支持降维（缩短维度），可在精度和成本间权衡。

看最大输入长度。大多数 Embedding 单次最多 8K tokens 左右，超长文档需要先切块（chunking）。Cohere embed v4 的 128K 上下文是个例外，适合整篇长文档直接编码。

中文 / 多语言场景。通义 text-embedding-v4（¥0.500）大陆访问无障碍、对中文优化好；开源 BGE-M3 是中文社区最常用的免费方案，自部署零调用成本。海外的 Cohere、Voyage 多语言能力也很强。

别忘了配套的生成模型。RAG = 检索（Embedding）+ 生成（LLM）。算好向量成本后，到 LLM 价格表选生成模型，或用月账单计算器把两端成本一起算。

向量选好了，去挑生成模型把 RAG 配齐。

LLM 价格表 →月账单计算器