Gemini 3.5 Flash vs DeepSeek V4：API 价格、Agent 场景和选型建议

Gemini 3.5 Flash 和 DeepSeek V4 解决的是不同问题。Gemini 3.5 Flash 是 Google 稳定版高端 Flash 路由，适合多模态 Agent 工作流。DeepSeek V4 Flash 和 V4 Pro 是成本优先的文本与 Agent 模型，缓存输入价格极低。

如果你的工作负载主要是文本，DeepSeek V4 更适合作为默认路由。如果你需要 Google 生态、多模态输入、搜索 grounding、Maps grounding、URL context、Batch/Flex 或 AI Studio 工作流，Gemini 3.5 Flash 的溢价才更有意义。

价格快照

模型	输入 / 1M	缓存输入 / 1M	输出 / 1M	上下文	最大输出
Gemini 3.5 Flash	$1.50	$0.15	$9.00	1,048,576	65,536
DeepSeek V4 Flash	$0.14	$0.0028	$0.28	1M	384K
DeepSeek V4 Pro	$0.435	$0.003625	$0.87	1M	384K

按标准价格算，Gemini 3.5 Flash 的输入价格约为 DeepSeek V4 Flash 的 10.7 倍，输出价格约为 32 倍。相比 DeepSeek V4 Pro，Gemini 3.5 Flash 输入约贵 3.4 倍，输出约贵 10.3 倍。

月费示例

以下按标准交互价格计算，不考虑缓存命中。

日用量	Gemini 3.5 Flash	DeepSeek V4 Flash	DeepSeek V4 Pro
10 万输入 + 5 万输出	$18.00/月	$0.84/月	$2.61/月
100 万输入 + 50 万输出	$180.00/月	$8.40/月	$26.10/月
1000 万输入 + 500 万输出	$1,800/月	$84/月	$261/月

如果系统提示词、仓库上下文、文档或指令块会重复发送，DeepSeek 的缓存输入优势会更明显：V4 Flash 是 $0.0028/M，V4 Pro 是 $0.003625/M，而 Gemini 3.5 Flash 是 $0.15/M。

能力对比

维度	Gemini 3.5 Flash	DeepSeek V4 Flash / Pro
输入类型	文本、图片、视频、音频、PDF	以文本 API 为主
输出	文本	文本
函数调用	支持	支持
结构化输出	支持	支持
上下文	1,048,576 输入 token	1M
最大输出	65,536	384K
搜索 grounding	支持	不是原生优势
Google Maps grounding	支持	不适用
Batch/Flex	支持	取决于 DeepSeek API 侧能力
最佳成本画像	多模态高端 Flash	高吞吐文本与缓存上下文

该选哪个？

选择 Gemini 3.5 Flash，如果：

Agent 需要处理图片、视频、音频或 PDF。
你需要 Google Search grounding、Maps grounding、URL context 或 AI Studio 工作流。
你希望在代码循环、多步骤 Agent 工作流中使用稳定版 Google Flash 模型。
Batch、Flex、Priority inference 或 Google Cloud 集成有运营价值。

选择 DeepSeek V4 Flash，如果：

大部分请求是文本分类、抽取、摘要、格式化或工具调用。
你需要尽可能低的输出价格。
你会重复发送系统提示词、仓库上下文或文档，可以吃到缓存输入折扣。
中文和双语任务比较多。

选择 DeepSeek V4 Pro，如果：

一部分请求 V4 Flash 不够强，但 GPT、Claude、Gemini 高端价格又太贵。
你想使用更强的 DeepSeek V4 路由，同时把输出价格控制在 $1/M 以下。
你能只把困难请求路由到 Pro，简单请求继续用 V4 Flash。

实用路由方案

对于混合文本和多模态流量的产品：

简单文本任务走 DeepSeek V4 Flash。
更难的文本推理走 DeepSeek V4 Pro。
图片、视频、音频、PDF、搜索增强或 Google 生态任务走 Gemini 3.5 Flash。
重复 prompt 块和长共享上下文尽量用缓存输入。
上生产前用 AI 模型价格计算器按你的真实输入/输出比例测算。

总结

文本 Agent 场景里，DeepSeek V4 是明确的价格赢家。需要多模态输入、搜索或 Maps grounding、Google 工具链，或者稳定版 Google 高端 Flash 路由时，Gemini 3.5 Flash 更合适。

最干净的架构不是全局二选一：默认文本路由用 DeepSeek V4 Flash，困难文本请求升到 DeepSeek V4 Pro，只有真正用到多模态和 Google 原生能力时再路由到 Gemini 3.5 Flash。

已核对官方来源：Google Gemini API pricing、Gemini 3.5 Flash model docs 和 DeepSeek API pricing。

相关资源：

Gemini 3.5 Flash vs DeepSeek V4：API 价格、Agent 场景和选型建议

价格快照

月费示例

能力对比

该选哪个？

选择 Gemini 3.5 Flash，如果：

选择 DeepSeek V4 Flash，如果：

选择 DeepSeek V4 Pro，如果：

实用路由方案

总结

相关文章

2026 大模型 API 价格对比（6月更新）：50+ 模型一表看清

DeepSeek V4 接入 OpenCode、Codex、Copilot CLI、Cline、Kilo

DeepSeek V4 配置到 Claude Code 教程