Gemini API 价格 2026:Gemini 3.5 Flash、3.1 Pro 与 2.5 系列
2026年5月更新。按官方文档整理 Gemini 3.5 Flash、3.1 Pro、3.1 Flash-Lite、2.5 Pro、2.5 Flash、缓存、Batch/Flex,并对比 DeepSeek V4。
Google Gemini API 适合需要长上下文、多模态输入、Google AI Studio 工作流、搜索 grounding、Batch/Flex 折扣和免费开发额度的开发者。这篇文章按 src/data/models.ts 和 Google Gemini API 官方定价、模型文档刷新。
这次最重要的新变化是 Gemini 3.5 Flash。Google 将 gemini-3.5-flash 列为稳定模型,输入上限 1,048,576 token,输出上限 65,536 token,支持多模态输入,标准价格为 输入 $1.50/M、输出 $9.00/M,缓存输入为 $0.15/M。
旧价格里仍然要避免的错误是:标准交互调用下,Gemini 2.5 Flash 不是 $0.15/M 输入、$0.60/M 输出。Google 当前标准定价中,Gemini 2.5 Flash 文本/图片/视频输入是 $0.30/M,输出是 $2.50/M。$0.15/M 输入对应 Batch/Flex,不是标准交互调用。
Gemini 2026 模型价格表
| 模型 | 标准输入 | 缓存输入 | 标准输出 | 上下文 | 最大输出 | 适用场景 |
|---|---|---|---|---|---|---|
| Gemini 3.5 Flash | $1.50/M | $0.15/M | $9.00/M | 1,048,576 | 65,536 | 快速高能力 Agent、代码循环、多模态工作负载 |
| Gemini 3.1 Pro Preview | <=200K $2.00/M,>200K $4.00/M | <=200K $0.20/M,>200K $0.40/M | <=200K $12.00/M,>200K $18.00/M | 2M | 16K | canonical 表中的 Gemini Pro 高端档 |
| Gemini 3.1 Flash-Lite Preview | $0.25/M | $0.025/M | $1.50/M | 1M | 64K | 快速、高吞吐 Agent 和数据任务 |
| Gemini 2.5 Pro | <=200K $1.25/M,>200K $2.50/M | <=200K $0.125/M,>200K $0.25/M | <=200K $10.00/M,>200K $15.00/M | 2M | 64K | 复杂推理、代码、长文档 |
| Gemini 2.5 Flash | 文本/图片/视频 $0.30/M | 文本/图片/视频 $0.03/M | $2.50/M | 1M | 64K | 成本与能力平衡 |
| Gemini 2.5 Flash-Lite | 文本/图片/视频 $0.10/M | 文本/图片/视频 $0.01/M | $0.40/M | 1M | 64K | 当前最低价 Gemini 文本路由 |
| Gemini 2.0 Flash | $0.10/M | n/a | $0.40/M | 1M | 8K | 已废弃的旧应用 |
价格单位均为美元/百万 token,适用于 Google Gemini Developer API 标准付费调用。部分模型还有单独的 Batch、Flex 和 Priority 价格;实际项目速率限制也可能与公开示例不同。
Gemini 3.5 Flash 新在哪里
Gemini 3.5 Flash 不只是价格表新增一行。Google 模型页把它定位为更高速度、更低成本的 frontier-level 模型,重点面向 sub-agent、多步骤工作流、长周期任务和代码循环。
对开发者来说,关键参数是:
| 字段 | Gemini 3.5 Flash |
|---|---|
| API 模型 ID | gemini-3.5-flash |
| 状态 | Stable |
| 输入类型 | 文本、图片、视频、音频、PDF |
| 输出类型 | 文本 |
| 输入 token 上限 | 1,048,576 |
| 输出 token 上限 | 65,536 |
| 支持能力 | Batch API、缓存、代码执行、文件搜索、Flex、函数调用、Google Maps grounding、Priority、搜索 grounding、结构化输出、thinking、URL context |
| 不支持 | 音频生成、Computer use、图片生成、Live API |
放到 DevTk.AI 的路由建议里,Gemini 3.5 Flash 更像高端 Flash 路由,而不是最低价路由。
Batch、Flex、Priority 和 Context Caching
Google 付费层支持 Batch API、Flex inference 和 context caching。官方定价总览写明 Batch API 可降低 50% 成本,详细表也列出很多模型的 Batch/Flex 低价。
| 模型 | 标准输入 | Batch/Flex 输入 | 标准输出 | Batch/Flex 输出 |
|---|---|---|---|---|
| Gemini 3.5 Flash | $1.50/M | $0.75/M | $9.00/M | $4.50/M |
| Gemini 3.1 Pro Preview <=200K | $2.00/M | $1.00/M | $12.00/M | $6.00/M |
| Gemini 3.1 Flash-Lite Preview | $0.25/M | $0.125/M | $1.50/M | $0.75/M |
| Gemini 2.5 Pro <=200K | $1.25/M | $0.625/M | $10.00/M | $5.00/M |
| Gemini 2.5 Flash | $0.30/M | $0.15/M | $2.50/M | $1.25/M |
| Gemini 2.5 Flash-Lite | $0.10/M | $0.05/M | $0.40/M | $0.20/M |
旧文里的 Gemini 2.5 Flash $0.15 正是来自这里:它适用于 Batch/Flex 输入,不是标准交互输入。
Gemini vs GPT-5 vs Claude vs DeepSeek
| 模型 | 厂商 | 输入价格 | 缓存输入 | 输出价格 | 说明 |
|---|---|---|---|---|---|
| Gemini 3.5 Flash | $1.50 | $0.15 | $9.00 | 稳定版 1M 上下文多模态 Flash 路由 | |
| Gemini 3.1 Pro Preview | $2.00 | $0.20 | $12.00 | 超过 200K prompt 后 $4/$18 | |
| Gemini 2.5 Pro | $1.25 | $0.125 | $10.00 | 超过 200K prompt 后 $2.50/$15 | |
| GPT-5 | OpenAI | $1.25 | varies | $10.00 | 与 Gemini 2.5 Pro 基础价相同 |
| Claude Sonnet 4.6 | Anthropic | $3.00 | varies | $15.00 | 价格更高,canonical 上下文 1M |
| Gemini 2.5 Flash | $0.30 | $0.03 | $2.50 | 标准交互价格 | |
| Gemini 2.5 Flash-Lite | $0.10 | $0.01 | $0.40 | 当前最低价 Gemini 路由 | |
| DeepSeek V4 Flash | DeepSeek | $0.14 | $0.0028 | $0.28 | 更便宜的文本替代 |
| DeepSeek V4 Pro | DeepSeek | $0.435 | $0.003625 | $0.87 | 永久降价后正式 1/4 价格 |
关键结论:
- Gemini 3.5 Flash 是高端 Flash 路由,不是预算路由:输入价是 Gemini 2.5 Flash 的 5 倍,输出价是 3.6 倍。
- 纯文本 Agent 任务 DeepSeek V4 Flash 便宜得多,价格为 $0.14/$0.28,缓存命中越高差距越大。
- Gemini 3.5 Flash 更适合多模态和 Google 生态,因为它支持文本、图片、视频、音频、PDF 输入、搜索 grounding、Maps grounding、URL context 和 Google 原生工具链。
- Gemini 2.5 Flash-Lite 仍是当前最低价 Gemini 路由,标准文本/图片/视频输入价格为 $0.10/$0.40。
月费估算
以下示例按标准交互价格计算,不考虑缓存命中。
场景 1:个人开发者
每天 10 万输入 + 5 万输出 token:
| 模型 | 月费 |
|---|---|
| Gemini 2.5 Flash-Lite | $0.90 |
| DeepSeek V4 Flash | $0.84 |
| Gemini 3.1 Flash-Lite Preview | $3.00 |
| Gemini 2.5 Flash | $4.65 |
| Gemini 3.5 Flash | $18.00 |
| Gemini 2.5 Pro | $18.75 |
| Gemini 3.1 Pro Preview | $24.00 |
| Claude Sonnet 4.6 | $31.50 |
场景 2:初创团队
每天 100 万输入 + 50 万输出 token:
| 模型 | 月费 |
|---|---|
| DeepSeek V4 Flash | $8.40 |
| Gemini 2.5 Flash-Lite | $9.00 |
| Gemini 3.1 Flash-Lite Preview | $30.00 |
| Gemini 2.5 Flash | $46.50 |
| Gemini 3.5 Flash | $180.00 |
| Gemini 2.5 Pro | $187.50 |
| Gemini 3.1 Pro Preview | $240.00 |
| Claude Sonnet 4.6 | $315.00 |
场景 3:产品级
每天 1000 万输入 + 500 万输出 token:
| 模型 | 月费 |
|---|---|
| DeepSeek V4 Flash | $84 |
| Gemini 2.5 Flash-Lite | $90 |
| Gemini 3.1 Flash-Lite Preview | $300 |
| Gemini 2.5 Flash | $465 |
| Gemini 3.5 Flash | $1,800 |
| Gemini 2.5 Pro | $1,875 |
| Gemini 3.1 Pro Preview | $2,400 |
| Claude Sonnet 4.6 | $3,150 |
精确计算你的成本: 使用 AI 模型定价计算器。
什么场景选 Gemini
1. 多模态 Agent 工作负载
如果一个模型需要同时吃文本、图片、视频、音频和 PDF,并且还要支持函数调用、结构化输出、URL context、搜索 grounding、Batch/Flex,Gemini 3.5 Flash 更合适。
2. 长文档处理
如果需要在单次请求里处理长文档、大型代码库、长视频或多文件上下文,Gemini 仍然有优势。质量优先时用 Gemini 3.5 Flash 或 Pro,偏提取或可分流任务用 Flash-Lite 或 2.5 Flash。
3. 开发和评测
Gemini 免费层适合原型和测试。做生产规划时,应在 AI Studio 检查活动 quota,因为 Google 官方说明速率限制与项目相关且不保证固定容量。
4. Google Cloud 生态
已经使用 Google Cloud 的团队,可以通过 AI Studio 或 Vertex AI 使用 Gemini,以便统一账单、身份、治理,并与 Cloud Storage、BigQuery 等服务集成。
省钱建议
- 便宜文本任务不要默认 Gemini 3.5 Flash。 质量允许时,优先 Gemini 2.5 Flash-Lite、DeepSeek V4 Flash 或 GPT-4.1 Nano。
- 用到多模态和 grounding 时再上 Gemini 3.5 Flash。 只有实际使用这些能力,高价才有意义。
- 离线任务用 Batch 或 Flex。 很多 Gemini 模型的 Batch/Flex 明显更便宜。
- 重复大上下文用 context caching。 Google 已列出 Gemini 3.5 Flash 和其他当前模型的缓存输入价格。
- 请求前先数 token。 用 AI Token 计算器 估算长 prompt 或媒体转写后的 token 数。
总结
Gemini 3.5 Flash 是 Google 当前新的稳定高端 Flash 路由:输入 $1.50/M,缓存输入 $0.15/M,输出 $9.00/M,输入上限 1,048,576 token,输出上限 65,536 token。它适合多模态 Agent、搜索增强工作流、代码循环和 Google 生态集成。
但对成本敏感的纯文本任务来说,Gemini 3.5 Flash 不是默认预算选择。建议从 Gemini 2.5 Flash-Lite、Gemini 2.5 Flash 或 DeepSeek V4 Flash 开始,再把更难或更依赖多模态的任务路由到 Gemini 3.5 Flash、Gemini 2.5 Pro 或 Gemini 3.1 Pro Preview。
已核对官方来源:Google Gemini API pricing、Gemini 3.5 Flash model docs、Google Gemini API rate limits 和 DeepSeek API pricing。
相关资源:
- AI 模型价格计算器 - 对比模型月费
- AI Token 计算器 - 请求前计算 token
- Gemini 3.5 Flash vs DeepSeek V4 - 成本与 Agent 路由对比
- AI API 价格对比 2026 - 全厂商价格表
- DeepSeek API 价格指南 - 低价文本替代