DevTk.AI
Gemini API 定价Gemini 3.5 FlashGoogle AIGemini 2.5 Flash模型对比

Gemini API 价格 2026:Gemini 3.5 Flash、3.1 Pro 与 2.5 系列

2026年5月更新。按官方文档整理 Gemini 3.5 Flash、3.1 Pro、3.1 Flash-Lite、2.5 Pro、2.5 Flash、缓存、Batch/Flex,并对比 DeepSeek V4。

DevTk.AI 2026-02-24 更新于 2026-05-24 13 分钟阅读

Google Gemini API 适合需要长上下文、多模态输入、Google AI Studio 工作流、搜索 grounding、Batch/Flex 折扣和免费开发额度的开发者。这篇文章按 src/data/models.ts 和 Google Gemini API 官方定价、模型文档刷新。

这次最重要的新变化是 Gemini 3.5 Flash。Google 将 gemini-3.5-flash 列为稳定模型,输入上限 1,048,576 token,输出上限 65,536 token,支持多模态输入,标准价格为 输入 $1.50/M输出 $9.00/M,缓存输入为 $0.15/M

旧价格里仍然要避免的错误是:标准交互调用下,Gemini 2.5 Flash 不是 $0.15/M 输入、$0.60/M 输出。Google 当前标准定价中,Gemini 2.5 Flash 文本/图片/视频输入是 $0.30/M,输出是 $2.50/M。$0.15/M 输入对应 Batch/Flex,不是标准交互调用。

Gemini 2026 模型价格表

模型标准输入缓存输入标准输出上下文最大输出适用场景
Gemini 3.5 Flash$1.50/M$0.15/M$9.00/M1,048,57665,536快速高能力 Agent、代码循环、多模态工作负载
Gemini 3.1 Pro Preview<=200K $2.00/M,>200K $4.00/M<=200K $0.20/M,>200K $0.40/M<=200K $12.00/M,>200K $18.00/M2M16Kcanonical 表中的 Gemini Pro 高端档
Gemini 3.1 Flash-Lite Preview$0.25/M$0.025/M$1.50/M1M64K快速、高吞吐 Agent 和数据任务
Gemini 2.5 Pro<=200K $1.25/M,>200K $2.50/M<=200K $0.125/M,>200K $0.25/M<=200K $10.00/M,>200K $15.00/M2M64K复杂推理、代码、长文档
Gemini 2.5 Flash文本/图片/视频 $0.30/M文本/图片/视频 $0.03/M$2.50/M1M64K成本与能力平衡
Gemini 2.5 Flash-Lite文本/图片/视频 $0.10/M文本/图片/视频 $0.01/M$0.40/M1M64K当前最低价 Gemini 文本路由
Gemini 2.0 Flash$0.10/Mn/a$0.40/M1M8K已废弃的旧应用

价格单位均为美元/百万 token,适用于 Google Gemini Developer API 标准付费调用。部分模型还有单独的 Batch、Flex 和 Priority 价格;实际项目速率限制也可能与公开示例不同。

Gemini 3.5 Flash 新在哪里

Gemini 3.5 Flash 不只是价格表新增一行。Google 模型页把它定位为更高速度、更低成本的 frontier-level 模型,重点面向 sub-agent、多步骤工作流、长周期任务和代码循环。

对开发者来说,关键参数是:

字段Gemini 3.5 Flash
API 模型 IDgemini-3.5-flash
状态Stable
输入类型文本、图片、视频、音频、PDF
输出类型文本
输入 token 上限1,048,576
输出 token 上限65,536
支持能力Batch API、缓存、代码执行、文件搜索、Flex、函数调用、Google Maps grounding、Priority、搜索 grounding、结构化输出、thinking、URL context
不支持音频生成、Computer use、图片生成、Live API

放到 DevTk.AI 的路由建议里,Gemini 3.5 Flash 更像高端 Flash 路由,而不是最低价路由。

Batch、Flex、Priority 和 Context Caching

Google 付费层支持 Batch API、Flex inference 和 context caching。官方定价总览写明 Batch API 可降低 50% 成本,详细表也列出很多模型的 Batch/Flex 低价。

模型标准输入Batch/Flex 输入标准输出Batch/Flex 输出
Gemini 3.5 Flash$1.50/M$0.75/M$9.00/M$4.50/M
Gemini 3.1 Pro Preview <=200K$2.00/M$1.00/M$12.00/M$6.00/M
Gemini 3.1 Flash-Lite Preview$0.25/M$0.125/M$1.50/M$0.75/M
Gemini 2.5 Pro <=200K$1.25/M$0.625/M$10.00/M$5.00/M
Gemini 2.5 Flash$0.30/M$0.15/M$2.50/M$1.25/M
Gemini 2.5 Flash-Lite$0.10/M$0.05/M$0.40/M$0.20/M

旧文里的 Gemini 2.5 Flash $0.15 正是来自这里:它适用于 Batch/Flex 输入,不是标准交互输入。

Gemini vs GPT-5 vs Claude vs DeepSeek

模型厂商输入价格缓存输入输出价格说明
Gemini 3.5 FlashGoogle$1.50$0.15$9.00稳定版 1M 上下文多模态 Flash 路由
Gemini 3.1 Pro PreviewGoogle$2.00$0.20$12.00超过 200K prompt 后 $4/$18
Gemini 2.5 ProGoogle$1.25$0.125$10.00超过 200K prompt 后 $2.50/$15
GPT-5OpenAI$1.25varies$10.00与 Gemini 2.5 Pro 基础价相同
Claude Sonnet 4.6Anthropic$3.00varies$15.00价格更高,canonical 上下文 1M
Gemini 2.5 FlashGoogle$0.30$0.03$2.50标准交互价格
Gemini 2.5 Flash-LiteGoogle$0.10$0.01$0.40当前最低价 Gemini 路由
DeepSeek V4 FlashDeepSeek$0.14$0.0028$0.28更便宜的文本替代
DeepSeek V4 ProDeepSeek$0.435$0.003625$0.87永久降价后正式 1/4 价格

关键结论:

  • Gemini 3.5 Flash 是高端 Flash 路由,不是预算路由:输入价是 Gemini 2.5 Flash 的 5 倍,输出价是 3.6 倍。
  • 纯文本 Agent 任务 DeepSeek V4 Flash 便宜得多,价格为 $0.14/$0.28,缓存命中越高差距越大。
  • Gemini 3.5 Flash 更适合多模态和 Google 生态,因为它支持文本、图片、视频、音频、PDF 输入、搜索 grounding、Maps grounding、URL context 和 Google 原生工具链。
  • Gemini 2.5 Flash-Lite 仍是当前最低价 Gemini 路由,标准文本/图片/视频输入价格为 $0.10/$0.40。

月费估算

以下示例按标准交互价格计算,不考虑缓存命中。

场景 1:个人开发者

每天 10 万输入 + 5 万输出 token:

模型月费
Gemini 2.5 Flash-Lite$0.90
DeepSeek V4 Flash$0.84
Gemini 3.1 Flash-Lite Preview$3.00
Gemini 2.5 Flash$4.65
Gemini 3.5 Flash$18.00
Gemini 2.5 Pro$18.75
Gemini 3.1 Pro Preview$24.00
Claude Sonnet 4.6$31.50

场景 2:初创团队

每天 100 万输入 + 50 万输出 token:

模型月费
DeepSeek V4 Flash$8.40
Gemini 2.5 Flash-Lite$9.00
Gemini 3.1 Flash-Lite Preview$30.00
Gemini 2.5 Flash$46.50
Gemini 3.5 Flash$180.00
Gemini 2.5 Pro$187.50
Gemini 3.1 Pro Preview$240.00
Claude Sonnet 4.6$315.00

场景 3:产品级

每天 1000 万输入 + 500 万输出 token:

模型月费
DeepSeek V4 Flash$84
Gemini 2.5 Flash-Lite$90
Gemini 3.1 Flash-Lite Preview$300
Gemini 2.5 Flash$465
Gemini 3.5 Flash$1,800
Gemini 2.5 Pro$1,875
Gemini 3.1 Pro Preview$2,400
Claude Sonnet 4.6$3,150

精确计算你的成本: 使用 AI 模型定价计算器

什么场景选 Gemini

1. 多模态 Agent 工作负载

如果一个模型需要同时吃文本、图片、视频、音频和 PDF,并且还要支持函数调用、结构化输出、URL context、搜索 grounding、Batch/Flex,Gemini 3.5 Flash 更合适。

2. 长文档处理

如果需要在单次请求里处理长文档、大型代码库、长视频或多文件上下文,Gemini 仍然有优势。质量优先时用 Gemini 3.5 Flash 或 Pro,偏提取或可分流任务用 Flash-Lite 或 2.5 Flash。

3. 开发和评测

Gemini 免费层适合原型和测试。做生产规划时,应在 AI Studio 检查活动 quota,因为 Google 官方说明速率限制与项目相关且不保证固定容量。

4. Google Cloud 生态

已经使用 Google Cloud 的团队,可以通过 AI Studio 或 Vertex AI 使用 Gemini,以便统一账单、身份、治理,并与 Cloud Storage、BigQuery 等服务集成。

省钱建议

  1. 便宜文本任务不要默认 Gemini 3.5 Flash。 质量允许时,优先 Gemini 2.5 Flash-Lite、DeepSeek V4 Flash 或 GPT-4.1 Nano。
  2. 用到多模态和 grounding 时再上 Gemini 3.5 Flash。 只有实际使用这些能力,高价才有意义。
  3. 离线任务用 Batch 或 Flex。 很多 Gemini 模型的 Batch/Flex 明显更便宜。
  4. 重复大上下文用 context caching。 Google 已列出 Gemini 3.5 Flash 和其他当前模型的缓存输入价格。
  5. 请求前先数 token。AI Token 计算器 估算长 prompt 或媒体转写后的 token 数。

总结

Gemini 3.5 Flash 是 Google 当前新的稳定高端 Flash 路由:输入 $1.50/M,缓存输入 $0.15/M,输出 $9.00/M,输入上限 1,048,576 token,输出上限 65,536 token。它适合多模态 Agent、搜索增强工作流、代码循环和 Google 生态集成。

但对成本敏感的纯文本任务来说,Gemini 3.5 Flash 不是默认预算选择。建议从 Gemini 2.5 Flash-LiteGemini 2.5 FlashDeepSeek V4 Flash 开始,再把更难或更依赖多模态的任务路由到 Gemini 3.5 FlashGemini 2.5 ProGemini 3.1 Pro Preview

已核对官方来源:Google Gemini API pricingGemini 3.5 Flash model docsGoogle Gemini API rate limitsDeepSeek API pricing

相关资源:

相关文章