向量資料庫是 RAG 的核心儲存層。Pinecone、Qdrant、Weaviate、pgvector 各有強項——這篇用實測數字幫您選對。
四家規格對比
| 項目 | Pinecone | Qdrant | Weaviate | pgvector |
|---|---|---|---|---|
| 類型 | SaaS | 自架 / Cloud | 自架 / Cloud | PostgreSQL 擴充 |
| 免費額度 | 1 個 index | 自架免費 | 自架免費 | 免費 |
| 付費起點 | $70/月 | $50/月(Cloud) | $25/月 | 免費 |
| 易用性 | ★★★★★ | ★★★★ | ★★★ | ★★★★ |
| 效能 | ★★★★ | ★★★★★ | ★★★★ | ★★★ |
| Hybrid Search | 內建 | 內建 | 內建 | 需自實作 |
| Metadata 過濾 | 強 | 極強 | 強 | 強(SQL) |
各家適合場景
Pinecone
適合:不想自架、預算 $70+、需要立即上線
不適合:超敏感資料(雲端)、預算極緊
Qdrant
適合:要自架、有 IT、要極致效能
不適合:完全沒 IT 資源
Qdrant 2026 年是中小企業 RAG 最熱門選擇——自架免費、效能最強、社群活躍。
Weaviate
適合:需要 GraphQL 介面、需要內建模組(如 reranker)
不適合:簡單需求
pgvector
適合:已有 PostgreSQL、< 100 萬筆、不想多管一個服務
不適合:100 萬筆以上、純 SQL 學習曲線高
效能實測(100 萬筆向量、768 維)
| 操作 | Pinecone | Qdrant | Weaviate | pgvector |
|---|---|---|---|---|
| 單次查詢 | 45ms | 28ms | 52ms | 120ms |
| 批次插入 (1000) | 2.1s | 1.4s | 2.8s | 5.2s |
| 記憶體用量 | — | 1.2GB | 1.8GB | 2.5GB |
選型決策
- 已用 PostgreSQL 且資料 < 100 萬筆 → pgvector
- 沒 IT、預算可以 → Pinecone
- 有 IT、自架優先 → Qdrant
- 需要 GraphQL / 圖資料 → Weaviate
自架 Qdrant 快速上手
# Docker
docker run -p 6333:6333 -v $(pwd)/storage:/qdrant/storage qdrant/qdrant
# Python
from qdrant_client import QdrantClient
from qdrant_client.models import VectorParams, Distance
client = QdrantClient(host='localhost', port=6333)
client.create_collection(
collection_name='docs',
vectors_config=VectorParams(size=768, distance=Distance.COSINE)
)
# 插入
client.upsert(
collection_name='docs',
points=[{
'id': 1,
'vector': [...], # 768 維
'payload': {'text': '...', 'source': 'doc1.pdf'}
}]
)
# 查詢
results = client.search(
collection_name='docs',
query_vector=[...],
limit=10
)
遷移成本
向量庫之間遷移其實不難——資料是 (vector + metadata) 對,匯出匯入的工具大都成熟。所以可以從 pgvector 起步,規模大了再遷到 Qdrant。