DevTk.AI
Gemini 3.5 FlashDeepSeek V4AI API 定价模型对比AI Agent

Gemini 3.5 Flash vs DeepSeek V4:API 价格、Agent 场景和选型建议

对比 Gemini 3.5 Flash 与 DeepSeek V4 Flash / V4 Pro 的 2026 API 价格、缓存输入、上下文、多模态能力和 Agent 路由建议。

DevTk.AI 2026-05-24 更新于 2026-05-24 6 分钟阅读

Gemini 3.5 Flash 和 DeepSeek V4 解决的是不同问题。Gemini 3.5 Flash 是 Google 稳定版高端 Flash 路由,适合多模态 Agent 工作流。DeepSeek V4 Flash 和 V4 Pro 是成本优先的文本与 Agent 模型,缓存输入价格极低。

如果你的工作负载主要是文本,DeepSeek V4 更适合作为默认路由。如果你需要 Google 生态、多模态输入、搜索 grounding、Maps grounding、URL context、Batch/Flex 或 AI Studio 工作流,Gemini 3.5 Flash 的溢价才更有意义。

价格快照

模型输入 / 1M缓存输入 / 1M输出 / 1M上下文最大输出
Gemini 3.5 Flash$1.50$0.15$9.001,048,57665,536
DeepSeek V4 Flash$0.14$0.0028$0.281M384K
DeepSeek V4 Pro$0.435$0.003625$0.871M384K

按标准价格算,Gemini 3.5 Flash 的输入价格约为 DeepSeek V4 Flash 的 10.7 倍,输出价格约为 32 倍。相比 DeepSeek V4 Pro,Gemini 3.5 Flash 输入约贵 3.4 倍,输出约贵 10.3 倍

月费示例

以下按标准交互价格计算,不考虑缓存命中。

日用量Gemini 3.5 FlashDeepSeek V4 FlashDeepSeek V4 Pro
10 万输入 + 5 万输出$18.00/月$0.84/月$2.61/月
100 万输入 + 50 万输出$180.00/月$8.40/月$26.10/月
1000 万输入 + 500 万输出$1,800/月$84/月$261/月

如果系统提示词、仓库上下文、文档或指令块会重复发送,DeepSeek 的缓存输入优势会更明显:V4 Flash 是 $0.0028/M,V4 Pro 是 $0.003625/M,而 Gemini 3.5 Flash 是 $0.15/M。

能力对比

维度Gemini 3.5 FlashDeepSeek V4 Flash / Pro
输入类型文本、图片、视频、音频、PDF以文本 API 为主
输出文本文本
函数调用支持支持
结构化输出支持支持
上下文1,048,576 输入 token1M
最大输出65,536384K
搜索 grounding支持不是原生优势
Google Maps grounding支持不适用
Batch/Flex支持取决于 DeepSeek API 侧能力
最佳成本画像多模态高端 Flash高吞吐文本与缓存上下文

该选哪个?

选择 Gemini 3.5 Flash,如果:

  • Agent 需要处理图片、视频、音频或 PDF。
  • 你需要 Google Search grounding、Maps grounding、URL context 或 AI Studio 工作流。
  • 你希望在代码循环、多步骤 Agent 工作流中使用稳定版 Google Flash 模型。
  • Batch、Flex、Priority inference 或 Google Cloud 集成有运营价值。

选择 DeepSeek V4 Flash,如果:

  • 大部分请求是文本分类、抽取、摘要、格式化或工具调用。
  • 你需要尽可能低的输出价格。
  • 你会重复发送系统提示词、仓库上下文或文档,可以吃到缓存输入折扣。
  • 中文和双语任务比较多。

选择 DeepSeek V4 Pro,如果:

  • 一部分请求 V4 Flash 不够强,但 GPT、Claude、Gemini 高端价格又太贵。
  • 你想使用更强的 DeepSeek V4 路由,同时把输出价格控制在 $1/M 以下。
  • 你能只把困难请求路由到 Pro,简单请求继续用 V4 Flash。

实用路由方案

对于混合文本和多模态流量的产品:

  1. 简单文本任务走 DeepSeek V4 Flash
  2. 更难的文本推理走 DeepSeek V4 Pro
  3. 图片、视频、音频、PDF、搜索增强或 Google 生态任务走 Gemini 3.5 Flash
  4. 重复 prompt 块和长共享上下文尽量用缓存输入。
  5. 上生产前用 AI 模型价格计算器 按你的真实输入/输出比例测算。

总结

文本 Agent 场景里,DeepSeek V4 是明确的价格赢家。需要多模态输入、搜索或 Maps grounding、Google 工具链,或者稳定版 Google 高端 Flash 路由时,Gemini 3.5 Flash 更合适。

最干净的架构不是全局二选一:默认文本路由用 DeepSeek V4 Flash,困难文本请求升到 DeepSeek V4 Pro,只有真正用到多模态和 Google 原生能力时再路由到 Gemini 3.5 Flash。

已核对官方来源:Google Gemini API pricingGemini 3.5 Flash model docsDeepSeek API pricing

相关资源:

相关文章