— PILLAR 03 · 10 ARTICLES

RAG 與向量資料庫。

RAG 架構、文件清洗、Embedding、向量庫、Reranking、評估、維運完整技術系列。

12 min · 2026-05-28

RAG vs 微調 vs Long Context:你的場景該選哪一個?

三條技術路線的成本、效果、適用場景對比,含決策樹與三個企業案例。

3000 字

14 min · 2026-05-29

RAG 完整架構教學:Retrieval + Generation 全圖

從文件進來到 LLM 回應的完整 RAG 流程,含每個元件的選型與調校。

3500 字

10 min · 2026-05-30

文件切割策略完整指南:Fixed、Semantic、Hierarchical

切得太大召回差、太小失語境——三種策略的取捨與實作 Python 範例。

2400 字

9 min · 2026-05-31

Embedding 模型選擇完整指南:OpenAI vs Gemini vs 本地

中文表現、價格、速度、隱私四維度比較,幫你選對 Embedding 模型。

2300 字

12 min · 2026-06-01

Pinecone vs Qdrant vs Weaviate vs pgvector:完整比較

四大向量資料庫的價格、效能、易用性、生態系統實測比較。

3000 字

11 min · 2026-06-02

BM25 + Vector Hybrid Search + Reranker:把命中率從 60% 拉到 90%

單純 vector search 不夠——混合檢索與 Reranker 把召回率帶到產線水準。

2800 字

10 min · 2026-06-03

RAG 評估指標完整指南:Faithfulness、Relevance、Recall

沒測就上線是賭運氣——三大 RAG 評估指標的計算與工具。

2500 字

10 min · 2026-06-04

RAG 如何防止 AI 幻覺:7 個技巧

Prompt 設計、Context 注入、Citation、Confidence Threshold——7 個防幻覺技巧。

2400 字

11 min · 2026-06-05

企業知識庫架構設計:權限、審計、版本控管

不是只有「文件 → AI 回答」——企業級 RAG 需要的完整架構。

2700 字

10 min · 2026-06-06

RAG 上線後維運 SOP:文件更新、模型升級、品質監控

RAG 不是建完就結束——上線後的維運才是成敗關鍵。完整 SOP。

2400 字

— 最後一步

給我 30 分鐘,
告訴我你的業務。

我直接告訴你:你公司最該先用 AI 的 3 個地方、預算、補助。不收費、不推銷、不簽約。

L