PILLAR 03 · RAG 與向量資料庫

企業知識庫架構設計：權限、審計、版本控管

不是只有「文件 → AI 回答」——企業級 RAG 需要的完整架構。

PUBLISHED: 2026-06-05
READ TIME: 11 min
CATEGORY: PILLAR 03

企業級 RAG 不是「文件 → AI → 回答」那麼簡單。權限、審計、版本、多模態、多語言——這些是把 RAG 從 Demo 變生產系統的關鍵。

企業級 RAG 的 7 個維度

權限控制（誰能查什麼）
審計日誌（誰問了什麼、AI 回了什麼）
版本管理（文件更新時的 rollback）
多語言（中、英、日的混合處理）
多模態（圖、影、音文件）
來源優先（公司內 > 公開資料）
更新機制（文件變動時的 re-embed）

權限控制設計

三層權限：

文件層：哪些文件能被誰看（部門、角色、個人）
欄位層：同一文件中，敏感欄位（薪資、客戶 ID）只給特定人
查詢層：高敏感問題需主管二次核可

實作：向量庫的 metadata 存 ACL 標籤：

{
  "text": "...",
  "metadata": {
    "doc_id": "policy_001",
    "department": "HR",
    "access_level": ["manager", "hr_specialist"],
    "classification": "internal"
  }
}

# 查詢時加過濾
filter = {"access_level": {"$in": user.roles}}

審計日誌

每次 RAG 對話要記錄：

使用者（user_id）
時間戳記
問題內容
retrieved 的切片 ID
AI 回應
用戶反饋（👍/👎）

儲存 6–24 個月，符合稽核要求。

版本管理

文件更新時的策略：

軟刪除舊版本（不要直接刪 vector）
新版本標記 active=true、舊的 active=false
查詢時預設只查 active
稽核時可指定查特定日期版本

多語言處理

有些企業文件中英混合：

用支援多語的 Embedding（如 BGE-M3、Cohere multilingual）
查詢時同時用原文與翻譯版搜尋
輸出時統一翻成用戶語言

多模態文件

真實企業文件常含表格、圖片、圖表。處理方式：

用 Gemini Vision / Unstructured 抽取結構
表格保留 markdown 格式
圖片用 Vision 生成 alt-text 一起存
圖表數據手動或 AI 抽取為結構化資料

來源優先策略

當問題涉及通用知識（不在公司文件內）：

先檢索公司知識庫（最權威）
命中分數低時，回退到公開資料（Wikipedia、Google Search API）
明確標示來源等級（公司內部 / 公開資料）

更新機制

文件何時 re-embed？

文件新增 / 修改 → 立即（背景任務）
Embedding 模型升級 → 全量 re-embed（每年 1–2 次）
切片策略調整 → 全量 re-embed

建議用 message queue（如 Redis、SQS）非同步處理。

監控指標

每日查詢量
平均 latency（< 3s）
命中率（> 85%）
用戶滿意度（👍 比例 > 80%）
未命中問題 Top 20（找出文件缺口）

架構圖（典型企業 RAG）

使用者
  ↓ (Web / Slack / Line)
API Gateway (含驗證)
  ↓
RAG Orchestrator
├→ User ACL Service (查用戶權限)
├→ Vector DB (Qdrant cluster)
├→ Reranker (Cohere API)
├→ LLM (Gemini)
└→ Audit Logger → BigQuery

RELATED ARTICLES

延伸閱讀。

12 min · 2026-05-28

RAG vs 微調 vs Long Context：你的場景該選哪一個？

三條技術路線的成本、效果、適用場景對比，含決策樹與三個企業案例。

閱讀全文→

14 min · 2026-05-29

RAG 完整架構教學：Retrieval + Generation 全圖

從文件進來到 LLM 回應的完整 RAG 流程，含每個元件的選型與調校。

閱讀全文→

10 min · 2026-05-30

文件切割策略完整指南：Fixed、Semantic、Hierarchical

切得太大召回差、太小失語境——三種策略的取捨與實作 Python 範例。

閱讀全文→

LAST STEP

給我 30 分鐘，
告訴我你的業務。

我直接告訴你：你公司最該先用 AI 的 3 個地方、大概花多少預算、能不能用政府補助降低成本。

立即撥打 0939-301-114 Email 諮詢

📞 立即撥打預約免費診斷