— PILLAR 03 · RAG 與向量資料庫

RAG vs 微調 vs Long Context:你的場景該選哪一個?

三條技術路線的成本、效果、適用場景對比,含決策樹與三個企業案例。

PUBLISHED
2026-05-28
READ TIME
12 min
WORD COUNT
3000 字
CATEGORY
PILLAR 03

想讓 AI 知道你公司的事,有三條技術路線:RAG、微調、Long Context。每條的成本、效果、適用場景不同。這篇用決策樹幫您選對。

三條路線的核心差別

技術原理更新成本準確度
RAG把文件存向量庫,問題來時即時翻書低(直接改文件)高(有引用)
微調用您資料再訓練模型一次高(重新訓練)中(會幻覺)
Long Context把所有文件塞進 prompt無(即時)高但貴

成本對比(實際數字)

假設:5MB 公司知識庫、每天 1,000 次問答

RAG(推薦)
建置:NT$100K(自架)/ 400K(委外)
月成本:API NT$3K + 向量庫 NT$1K = NT$4K

微調
建置:NT$200K(資料整理 + 訓練)
月成本:API NT$5K(用微調後的模型)
資料更新:每次重訓 NT$50K

Long Context(每次塞 5MB)
建置:NT$0
月成本:每次塞 5MB ≈ 1.25M tokens × $1.25 / M × 1,000 次 × 30 = NT$1.4M/月

顯然 RAG 完勝。

何時用 RAG(90% 的情況)

  • 文件量 50+ 份
  • 文件會更新(每月、每季)
  • 需要引用來源(合規、可驗證)
  • 有重複問答場景

何時用微調

  • 需要特定的「風格」或「口吻」(例:模仿某律師的法律意見書文風)
  • 需要學會公司特有的「術語」或「縮寫」
  • 需要極低延遲(微調模型不必查資料庫)
  • 有大量結構化的訓練資料(> 1,000 筆問答對)

何時用 Long Context

  • 一次性分析(不會重複問同一份文件)
  • 文件 < 200K tokens
  • 需要全文跨段落推理(RAG 切片後可能丟失語境)
  • 不在乎成本

混合方案:RAG + 微調

2026 年的最佳實踐其實是「RAG + 輕量微調」:

  • RAG 負責提供「事實」
  • 微調負責教 AI「公司風格」(怎麼說、怎麼寫)
  • 兩者結合,準確度與一致性都有

決策樹

  1. 有需要 AI 知道的公司專屬資訊?沒有 → 用通用 LLM 就好
  2. 資訊量 < 50 份?是 → 用 Long Context
  3. 資訊會更新嗎?會 → 用 RAG(微調更新成本太高)
  4. 需要特殊風格 / 術語?是 → 混合 RAG + 微調
  5. 其他情況 → RAG

三個企業案例

  • 食品代工:選 RAG(法規常更新、文件 240 份) → 案例 →
  • 律師事務所:RAG + 微調(需要法律文書風格)
  • 研究機構:Long Context(每份論文只分析一次)

RELATED ARTICLES

延伸閱讀。

— 最後一步

給我 30 分鐘,
告訴我你的業務。

我直接告訴你:你公司最該先用 AI 的 3 個地方、預算、補助。不收費、不推銷、不簽約。

L