Embedding 向量模型价格对比
做 RAG、语义搜索、推荐就离不开向量模型。Embedding 只按输入计费、没有输出价, 所以单看一个数就能比。10 个主流模型按价格排好了,开源自部署的 BGE 免费排最前。
| 模型 | 厂商 | 价格(每百万 tokens) | 维度 | 最大输入 | 标签 |
|---|---|---|---|---|---|
| BGE-M3 (BAAI) | 🇨🇳智源 BAAI | 开源免费 | — | 8K | 开源可自部署多语言 |
| text-embedding-3-small | 🇺🇸OpenAI | ¥0.136$0.02 | 1536 | 8K | 性价比 |
| voyage-3.5-lite | 🇺🇸Voyage AI | ¥0.136$0.02 | — | 32K | 极便宜快速 |
| voyage-3.5 | 🇺🇸Voyage AI | ¥0.407$0.06 | — | 32K | 性价比 |
| 通义 text-embedding-v4 | 🇨🇳阿里通义 | ¥0.500 | — | 8K | 国产多语言维度可调 |
| Cohere embed v4.0 | 🇺🇸Cohere | ¥0.814$0.12 | 1536 | 128K | 多语言长上下文多模态 |
| text-embedding-3-large | 🇺🇸OpenAI | ¥0.881$0.13 | 3072 | 8K | 高精度 |
| gemini-embedding-001 | ¥1.02$0.15 | 3072 | 2K | 多语言 | |
| voyage-3-large | 🇺🇸Voyage AI | ¥1.22$0.18 | — | 32K | 高精度Anthropic 推荐 |
| voyage-code-3 | 🇺🇸Voyage AI | ¥1.22$0.18 | — | 32K | 代码 |
价格单位 ¥/百万 tokens(海外厂商附 $ 原价,按 1 USD = 6.78 换算)· 绿色 = 最便宜(开源 BGE 可自部署免费)· 数据更新 2026-05-30 · 以各厂商官方为准
怎么挑 Embedding 模型?
先看价格,因为 Embedding 通常调用量巨大。RAG 把整个知识库都向量化、每次检索还要给 query 算向量,量级远超普通对话。所以单价哪怕差几倍,月账单差距也很可观。OpenAI text-embedding-3-small (¥0.136)和 Voyage voyage-3.5-lite 是海外最便宜的可用选项;想完全免费就用开源 BGE-M3 自部署。
再看维度(dimensions)。维度越高,向量表达越细,但存储和检索成本也越高。3072 维(text-embedding-3-large、 gemini-embedding)精度高但占空间;1536 / 1024 维是常见平衡点。OpenAI 和部分模型支持降维(缩短维度),可在精度和成本间权衡。
看最大输入长度。大多数 Embedding 单次最多 8K tokens 左右,超长文档需要先切块(chunking)。Cohere embed v4 的 128K 上下文是个例外,适合整篇长文档直接编码。
中文 / 多语言场景。通义 text-embedding-v4(¥0.500)大陆访问无障碍、对中文优化好;开源 BGE-M3 是中文社区最常用的免费方案,自部署零调用成本。海外的 Cohere、Voyage 多语言能力也很强。
别忘了配套的生成模型。RAG = 检索(Embedding)+ 生成(LLM)。算好向量成本后,到 LLM 价格表 选生成模型,或用 月账单计算器 把两端成本一起算。