Embedding 模型選擇完整指南：OpenAI vs Gemini vs 本地

Embedding 模型把文字變成向量，是 RAG 檢索品質的關鍵。OpenAI、Gemini、本地模型該怎麼選？用四個維度幫您決定。

什麼是 Embedding？

把一段文字轉成「向量」（一組數字，例如 768 個浮點數）。語義相近的文字，向量距離近。RAG 用向量距離找最相關的切片。

主流模型對比

模型	維度	中文	價格	備註
OpenAI text-embedding-3-large	3072	★★★★★	$0.13/M	業界標竿
OpenAI text-embedding-3-small	1536	★★★★	$0.02/M	性價比高
Gemini text-embedding-004	768	★★★★	免費（限額）	整合 Google 生態
Cohere embed-v3	1024	★★★★	$0.10/M	多語強
BGE-M3	1024	★★★★	免費（自架）	開源、可微調
jina-embeddings-v3	1024	★★★	$0.05/M	長文支援

四個選擇維度

1. 中文表現

實測中文，OpenAI > Cohere ≥ BGE ≥ Gemini ≥ jina。但差距很小（5–10%）。

2. 價格

每 100 萬字大概 8–15 萬 tokens（中文）。換算：

1MB 文件 ≈ NT$5（OpenAI 3-small）
1MB 文件 ≈ NT$30（OpenAI 3-large）
1MB 文件 ≈ NT$0（Gemini 免費額度內）

3. 速度

本地模型（BGE）：100ms/批
雲端 API：300–800ms/批（含網路）

4. 隱私

本地（BGE、自架）：資料完全不出公司
雲端 API：依各家政策（OpenAI、Gemini 均承諾不用於訓練）

實務推薦

情境	推薦
中小企業 RAG 起步	Gemini text-embedding-004（免費）
中文 SEO / 內容	OpenAI text-embedding-3-large
多語跨國	Cohere embed-v3
資料極度敏感	BGE-M3 自架
長文（> 8K tokens 單段）	jina-embeddings-v3

維度選擇

維度越高 = 表達能力越強，但儲存與計算成本越高。中小企業建議：

< 10 萬筆切片：768–1024 維足夠
10 萬–100 萬：1536 維
100 萬+：3072 維 + 維度壓縮（如 Matryoshka）

Matryoshka Embedding（俄羅斯娃娃）

2024 年的新技術——一個向量同時支援多種維度。例：3072 維的向量，截取前 512 維仍然可用（效能略降）。

好處：快速檢索用低維度、精確比對用高維度，省成本又不失準度。

OpenAI text-embedding-3 系列、Gemini 005 都支援。

實作建議

第一版用 Gemini text-embedding-004 起跳（免費）
準確度不夠時升級 OpenAI 3-large
規模到 100 萬筆考慮自架 BGE-M3
定期 Re-embedding（模型升級時要重做）

常見錯誤

用一個模型 embed 查詢、另一個 embed 文件（必須同一個）
沒對齊 normalize（cosine similarity 需要 unit norm）
切片太長（OpenAI 上限 8,192 tokens、Gemini 2,048）
沒做語言一致性檢查（混合語言效果差）

延伸閱讀。

12 min · 2026-05-28

RAG vs 微調 vs Long Context：你的場景該選哪一個？

三條技術路線的成本、效果、適用場景對比，含決策樹與三個企業案例。

閱讀全文→

14 min · 2026-05-29

RAG 完整架構教學：Retrieval + Generation 全圖

從文件進來到 LLM 回應的完整 RAG 流程，含每個元件的選型與調校。

閱讀全文→

10 min · 2026-05-30

文件切割策略完整指南：Fixed、Semantic、Hierarchical

切得太大召回差、太小失語境——三種策略的取捨與實作 Python 範例。

閱讀全文→

延伸工具

即時試算

AI ROI 試算機

拉五個滑桿，即時算出月節省、年節省、回本期與首年 ROI。

開始試算→

Embedding 模型選擇完整指南：OpenAI vs Gemini vs 本地

什麼是 Embedding？

主流模型對比

四個選擇維度

1. 中文表現

2. 價格

3. 速度

4. 隱私

實務推薦

維度選擇

Matryoshka Embedding（俄羅斯娃娃）

實作建議

常見錯誤

RAG vs 微調 vs Long Context：你的場景該選哪一個？

RAG 完整架構教學：Retrieval + Generation 全圖

文件切割策略完整指南：Fixed、Semantic、Hierarchical

AI ROI 試算機

給我 30 分鐘，告訴我你的業務。

每週一封，南台灣中小企業AI 應用週報。

給我 30 分鐘，
告訴我你的業務。

每週一封，南台灣中小企業
AI 應用週報。