— PILLAR 03 · RAG 與向量資料庫

RAG 上線後維運 SOP:文件更新、模型升級、品質監控

RAG 不是建完就結束——上線後的維運才是成敗關鍵。完整 SOP。

PUBLISHED
2026-06-06
READ TIME
10 min
WORD COUNT
2400 字
CATEGORY
PILLAR 03

RAG 不是建完就結束——上線後的維運才是成敗關鍵。這篇是一份可直接套用的 RAG 維運 SOP。

每日例行(5 分鐘)

  • 檢查監控告警:latency、error rate、API quota
  • 瀏覽昨日「👎」對話 Top 10
  • 檢查向量庫健康(Qdrant dashboard)

每週檢視(30 分鐘)

  • 跑 30 題標準測試集,看分數變化
  • 檢視「未命中問題」清單,找出文件缺口
  • 整理用戶反饋給內容窗口

每月作業(2 小時)

  • 跑完整 Ragas 評估(faithfulness, recall, relevance)
  • 對比 KPI 與目標
  • 更新文件清單(新增、退役)
  • 檢視成本:API、向量庫、儲存

每季作業(半天)

  • 檢討整體效能趨勢
  • 評估是否該升級 Embedding / LLM 模型
  • 用戶滿意度調查(NPS)
  • 內容團隊回報「最常問但 AI 答不好」的問題

每年大檢修(1 週)

  • 全量 re-embedding(如果模型升級)
  • chunking 策略重新評估
  • 權限與安全稽核
  • 歸檔超過 N 年的舊文件

文件更新流程(SOP)

  1. 文件擁有者上傳新版本到指定資料夾
  2. 系統自動觸發 re-embed 任務
  3. 新版本進入「pending」狀態(暫不上線)
  4. 內容窗口跑 5–10 題驗證
  5. 驗證通過後切換到「active」
  6. 舊版本保留但 active=false

事故處理

三類常見事故:

1. AI 回答錯誤(被用戶舉報)

  1. 立即截圖 + 對話 ID
  2. 查 retrieved 切片是否正確
  3. 若是 retrieval 問題 → 調整 chunking / 加文件
  4. 若是 generation 問題 → 加強 Prompt
  5. 標記為「已修復」並驗證

2. 系統當機

  1. 顯示維護頁,預設回覆「請聯絡客服」
  2. 檢查向量庫、API、網路
  3. 找出 root cause
  4. 事後檢討(Postmortem)

3. 資料外洩

  1. 立即關閉系統(避免擴大)
  2. 檢查 audit log 找出範圍
  3. 通知資安主管 / 法務
  4. 72 小時內依個資法規定處理

容量規劃

規模向量庫容量月 API 成本
10 萬切片1GBNT$3–10K
100 萬切片10GBNT$15–50K
1,000 萬切片100GBNT$80–250K

備份策略

  • 原始文件:每日備份到雲端 + 冷儲存
  • 向量庫:每週快照(snapshot)
  • 對話歷史:每日匯出到 BigQuery
  • 還原測試:每季演練一次

KPI 範本

  • Hit Rate:> 85%
  • 用戶滿意度:> 80%
  • 平均 Latency:< 3s
  • 月度未命中問題:< 10%
  • 客服轉接率:依產業設目標

RELATED ARTICLES

延伸閱讀。

— 最後一步

給我 30 分鐘,
告訴我你的業務。

我直接告訴你:你公司最該先用 AI 的 3 個地方、預算、補助。不收費、不推銷、不簽約。

L