Gemini 2.5 系列有 Pro、Flash、Flash-Lite、Nano 四種。怎麼選?這篇用 5 個典型場景帶您看。
規格對比
| 模型 | 強項 | 速度 | Input 價格 | Output 價格 |
|---|---|---|---|---|
| Gemini 2.5 Pro | 最強推理 | 慢 | $1.25/M | $10/M |
| Gemini 2.5 Flash | 速度與品質平衡 | 快 | $0.075/M | $0.30/M |
| Gemini 2.5 Flash-Lite | 最便宜 | 極快 | $0.025/M | $0.10/M |
| Gemini Nano | 裝置端執行 | 視裝置 | 免費 | 免費 |
場景 1:客服 FAQ Bot
推薦:Flash 或 Flash-Lite
客服問答模式固定、需要快速回應、量大。Pro 級推理能力過剩。月成本可控在 NT$100 內。
場景 2:法規 RAG 分析
推薦:Pro
需要深度理解、跨文件推理、低錯誤容忍。Pro 的推理能力差 Flash 一個層級。
場景 3:批量內容生成(每月 1,000 篇社群)
推薦:Flash + Batch Mode
內容量大、品質要求中等、可接受 24 小時延遲。Batch 半價 + Flash 便宜 = 月成本可控。
場景 4:寫 SEO 部落格
推薦:Pro 起草 + Flash 修飾
主稿用 Pro 確保深度與邏輯、修飾與 SEO 標記用 Flash 省錢。混搭最划算。
場景 5:行動 App 內建 AI 摘要
推薦:Nano
裝置端執行不需要網路、不算 API 費用、隱私好。適合 App 內輕量摘要功能。
實務組合建議
| 使用情境 | 主力模型 | 備援模型 |
|---|---|---|
| 客服機器人 | Flash | Pro(複雜問題升級) |
| 內容工廠 | Pro + Flash 混搭 | — |
| RAG 知識庫 | Pro | Flash(FAQ 類) |
| 自動化批次 | Flash + Batch | — |
| 行動 App | Nano | Flash(連線時) |
選型決策表
- 需要精準推理 / 跨文件分析 → Pro
- 需要即時回應(< 2 秒) → Flash
- 量極大、品質要求一般 → Flash-Lite
- 離線執行、隱私要求 → Nano
升級的訊號
用 Flash 一段時間後,三個訊號代表您該升級到 Pro:
- 用戶常抱怨「回答不準」
- 複雜問題(跨多文件、多步驟)回答品質差
- 長對話的記憶能力不夠