Gemini API 价格 2026：Gemini 3.5 Flash、3.1 Pro 与 2.5 系列

Google Gemini API 适合需要长上下文、多模态输入、Google AI Studio 工作流、搜索 grounding、Batch/Flex 折扣和免费开发额度的开发者。这篇文章按 src/data/models.ts 和 Google Gemini API 官方定价、模型文档刷新。

这次最重要的新变化是 Gemini 3.5 Flash。Google 将 gemini-3.5-flash 列为稳定模型，输入上限 1,048,576 token，输出上限 65,536 token，支持多模态输入，标准价格为 输入 $1.50/M、输出 $9.00/M，缓存输入为 $0.15/M。

旧价格里仍然要避免的错误是：标准交互调用下，Gemini 2.5 Flash 不是 $0.15/M 输入、$0.60/M 输出。Google 当前标准定价中，Gemini 2.5 Flash 文本/图片/视频输入是 $0.30/M，输出是 $2.50/M。$0.15/M 输入对应 Batch/Flex，不是标准交互调用。

Gemini 2026 模型价格表

模型	标准输入	缓存输入	标准输出	上下文	最大输出	适用场景
Gemini 3.5 Flash	$1.50/M	$0.15/M	$9.00/M	1,048,576	65,536	快速高能力 Agent、代码循环、多模态工作负载
Gemini 3.1 Pro Preview	<=200K $2.00/M，>200K $4.00/M	<=200K $0.20/M，>200K $0.40/M	<=200K $12.00/M，>200K $18.00/M	1,048,576	65,536	canonical 表中的 Gemini Pro 高端档
Gemini 3.1 Flash-Lite Preview	$0.25/M	$0.025/M	$1.50/M	1M	64K	快速、高吞吐 Agent 和数据任务
Gemini 2.5 Pro	<=200K $1.25/M，>200K $2.50/M	<=200K $0.125/M，>200K $0.25/M	<=200K $10.00/M，>200K $15.00/M	1,048,576	65,536	复杂推理、代码、长文档
Gemini 2.5 Flash	文本/图片/视频 $0.30/M	文本/图片/视频 $0.03/M	$2.50/M	1M	64K	成本与能力平衡
Gemini 2.5 Flash-Lite	文本/图片/视频 $0.10/M	文本/图片/视频 $0.01/M	$0.40/M	1M	64K	当前最低价 Gemini 文本路由

价格单位均为美元/百万 token，适用于 Google Gemini Developer API 标准付费调用。部分模型还有单独的 Batch、Flex 和 Priority 价格；实际项目速率限制也可能与公开示例不同。

Gemini 3.5 Flash 新在哪里

Gemini 3.5 Flash 不只是价格表新增一行。Google 模型页把它定位为更高速度、更低成本的 frontier-level 模型，重点面向 sub-agent、多步骤工作流、长周期任务和代码循环。

对开发者来说，关键参数是：

字段	Gemini 3.5 Flash
API 模型 ID	`gemini-3.5-flash`
状态	Stable
输入类型	文本、图片、视频、音频、PDF
输出类型	文本
输入 token 上限	1,048,576
输出 token 上限	65,536
支持能力	Batch API、缓存、代码执行、文件搜索、Flex、函数调用、Google Maps grounding、Priority、搜索 grounding、结构化输出、thinking、URL context
不支持	音频生成、Computer use、图片生成、Live API

放到 DevTk.AI 的路由建议里，Gemini 3.5 Flash 更像高端 Flash 路由，而不是最低价路由。

Batch、Flex、Priority 和 Context Caching

Google 付费层支持 Batch API、Flex inference 和 context caching。官方定价总览写明 Batch API 可降低 50% 成本，详细表也列出很多模型的 Batch/Flex 低价。

模型	标准输入	Batch/Flex 输入	标准输出	Batch/Flex 输出
Gemini 3.5 Flash	$1.50/M	$0.75/M	$9.00/M	$4.50/M
Gemini 3.1 Pro Preview <=200K	$2.00/M	$1.00/M	$12.00/M	$6.00/M
Gemini 3.1 Flash-Lite Preview	$0.25/M	$0.125/M	$1.50/M	$0.75/M
Gemini 2.5 Pro <=200K	$1.25/M	$0.625/M	$10.00/M	$5.00/M
Gemini 2.5 Flash	$0.30/M	$0.15/M	$2.50/M	$1.25/M
Gemini 2.5 Flash-Lite	$0.10/M	$0.05/M	$0.40/M	$0.20/M

旧文里的 Gemini 2.5 Flash $0.15 正是来自这里：它适用于 Batch/Flex 输入，不是标准交互输入。

Gemini vs GPT-5 vs Claude vs DeepSeek

模型	厂商	输入价格	缓存输入	输出价格	说明
Gemini 3.5 Flash	Google	$1.50	$0.15	$9.00	稳定版 1M 上下文多模态 Flash 路由
Gemini 3.1 Pro Preview	Google	$2.00	$0.20	$12.00	超过 200K prompt 后 $4/$18
Gemini 2.5 Pro	Google	$1.25	$0.125	$10.00	超过 200K prompt 后 $2.50/$15
GPT-5	OpenAI	$1.25	varies	$10.00	与 Gemini 2.5 Pro 基础价相同
Claude Sonnet 4.6	Anthropic	$3.00	varies	$15.00	价格更高，canonical 上下文 1M
Gemini 2.5 Flash	Google	$0.30	$0.03	$2.50	标准交互价格
Gemini 2.5 Flash-Lite	Google	$0.10	$0.01	$0.40	当前最低价 Gemini 路由
DeepSeek V4 Flash	DeepSeek	$0.14	$0.0028	$0.28	更便宜的文本替代
DeepSeek V4 Pro	DeepSeek	$0.435	$0.003625	$0.87	永久降价后正式 1/4 价格

关键结论：

Gemini 3.5 Flash 是高端 Flash 路由，不是预算路由：输入价是 Gemini 2.5 Flash 的 5 倍，输出价是 3.6 倍。
纯文本 Agent 任务 DeepSeek V4 Flash 便宜得多，价格为 $0.14/$0.28，缓存命中越高差距越大。
Gemini 3.5 Flash 更适合多模态和 Google 生态，因为它支持文本、图片、视频、音频、PDF 输入、搜索 grounding、Maps grounding、URL context 和 Google 原生工具链。
Gemini 2.5 Flash-Lite 仍是当前最低价 Gemini 路由，标准文本/图片/视频输入价格为 $0.10/$0.40。

月费估算

以下示例按标准交互价格计算，不考虑缓存命中。

场景 1：个人开发者

每天 10 万输入 + 5 万输出 token：

模型	月费
Gemini 2.5 Flash-Lite	$0.90
DeepSeek V4 Flash	$0.84
Gemini 3.1 Flash-Lite Preview	$3.00
Gemini 2.5 Flash	$4.65
Gemini 3.5 Flash	$18.00
Gemini 2.5 Pro	$18.75
Gemini 3.1 Pro Preview	$24.00
Claude Sonnet 4.6	$31.50

场景 2：初创团队

每天 100 万输入 + 50 万输出 token：

模型	月费
DeepSeek V4 Flash	$8.40
Gemini 2.5 Flash-Lite	$9.00
Gemini 3.1 Flash-Lite Preview	$30.00
Gemini 2.5 Flash	$46.50
Gemini 3.5 Flash	$180.00
Gemini 2.5 Pro	$187.50
Gemini 3.1 Pro Preview	$240.00
Claude Sonnet 4.6	$315.00

场景 3：产品级

每天 1000 万输入 + 500 万输出 token：

模型	月费
DeepSeek V4 Flash	$84
Gemini 2.5 Flash-Lite	$90
Gemini 3.1 Flash-Lite Preview	$300
Gemini 2.5 Flash	$465
Gemini 3.5 Flash	$1,800
Gemini 2.5 Pro	$1,875
Gemini 3.1 Pro Preview	$2,400
Claude Sonnet 4.6	$3,150

精确计算你的成本： 使用 AI 模型定价计算器。

什么场景选 Gemini

1. 多模态 Agent 工作负载

如果一个模型需要同时吃文本、图片、视频、音频和 PDF，并且还要支持函数调用、结构化输出、URL context、搜索 grounding、Batch/Flex，Gemini 3.5 Flash 更合适。

2. 长文档处理

如果需要在单次请求里处理长文档、大型代码库、长视频或多文件上下文，Gemini 仍然有优势。质量优先时用 Gemini 3.5 Flash 或 Pro，偏提取或可分流任务用 Flash-Lite 或 2.5 Flash。

3. 开发和评测

Gemini 免费层适合原型和测试。做生产规划时，应在 AI Studio 检查活动 quota，因为 Google 官方说明速率限制与项目相关且不保证固定容量。

4. Google Cloud 生态

已经使用 Google Cloud 的团队，可以通过 AI Studio 或 Vertex AI 使用 Gemini，以便统一账单、身份、治理，并与 Cloud Storage、BigQuery 等服务集成。

省钱建议

便宜文本任务不要默认 Gemini 3.5 Flash。 质量允许时，优先 Gemini 2.5 Flash-Lite、DeepSeek V4 Flash 或 GPT-4.1 Nano。
用到多模态和 grounding 时再上 Gemini 3.5 Flash。 只有实际使用这些能力，高价才有意义。
离线任务用 Batch 或 Flex。 很多 Gemini 模型的 Batch/Flex 明显更便宜。
重复大上下文用 context caching。 Google 已列出 Gemini 3.5 Flash 和其他当前模型的缓存输入价格。
请求前先数 token。 用 AI Token 计算器估算长 prompt 或媒体转写后的 token 数。

总结

Gemini 3.5 Flash 是 Google 当前新的稳定高端 Flash 路由：输入 $1.50/M，缓存输入 $0.15/M，输出 $9.00/M，输入上限 1,048,576 token，输出上限 65,536 token。它适合多模态 Agent、搜索增强工作流、代码循环和 Google 生态集成。

但对成本敏感的纯文本任务来说，Gemini 3.5 Flash 不是默认预算选择。建议从 Gemini 2.5 Flash-Lite、Gemini 2.5 Flash 或 DeepSeek V4 Flash 开始，再把更难或更依赖多模态的任务路由到 Gemini 3.5 Flash、Gemini 2.5 Pro 或 Gemini 3.1 Pro Preview。

已核对官方来源：Google Gemini API pricing、Gemini 3.5 Flash model docs、Google Gemini API rate limits 和 DeepSeek API pricing。

相关资源：

AI 模型价格计算器 - 对比模型月费
AI Token 计算器 - 请求前计算 token
Gemini 3.5 Flash vs DeepSeek V4 - 成本与 Agent 路由对比
AI API 价格对比 2026 - 全厂商价格表
DeepSeek API 价格指南 - 低价文本替代