DevTk.AI

AI 模型定价计算器

对比 40+ AI 模型费用,支持 DeepSeek V4 缓存命中价格。即时估算你的每月开支。

Workload presets

Cache-hit share is applied only to models with published cached-input pricing.

100,000 tokens/day = 3,000,000 tokens/month

50,000 tokens/day = 1,500,000 tokens/month

0% of input tokens use cached pricing when available

Filter by Provider
Showing 48 of 48 modelsPrices updated: 2026-05-06 · cached input share: 0%
Amazon Nova MicroCheapest
Amazon
$0.3150
/month
Input $/1M
$0.035
Output $/1M
$0.14
Context
128,000
Amazon Nova Lite
Amazon
$0.5400
/month
Input $/1M
$0.06
Output $/1M
$0.24
Context
300,000
Xiaomi MiMo-V2.5-Flash
Xiaomi MiMo
$0.7500
/month
Input $/1M
$0.1
cached $0.01
Output $/1M
$0.3
Context
256,000
GPT-5 Nano
OpenAI
$0.7500
/month
Input $/1M
$0.05
Output $/1M
$0.4
Context
128,000
DeepSeek V4 Flash
DeepSeek
$0.8400
/month
Input $/1M
$0.14
cached $0.0028
Output $/1M
$0.28
Context
1,000,000
Gemini 2.5 Flash-Lite
Google
$0.9000
/month
Input $/1M
$0.1
Output $/1M
$0.4
Context
1,000,000
Gemini 2.0 Flash
Google
$0.9000
/month
Input $/1M
$0.1
Output $/1M
$0.4
Context
1,000,000
Jamba 1.5 Mini
AI21 Labs
$1.20
/month
Input $/1M
$0.2
Output $/1M
$0.4
Context
256,000
GPT-4o mini
OpenAI
$1.35
/month
Input $/1M
$0.15
Output $/1M
$0.6
Context
128,000
Command R
Cohere
$1.35
/month
Input $/1M
$0.15
Output $/1M
$0.6
Context
128,000
Grok 4 Fast
xAI
$1.35
/month
Input $/1M
$0.2
Output $/1M
$0.5
Context
2,000,000
Mistral Small 3.1
Mistral
$1.50
/month
Input $/1M
$0.2
Output $/1M
$0.6
Context
128,000
Qwen 2.5 Coder 32B
Alibaba
$1.50
/month
Input $/1M
$0.2
Output $/1M
$0.6
Context
128,000
Grok 3 Mini
xAI
$1.65
/month
Input $/1M
$0.3
Output $/1M
$0.5
Context
131,072
DeepSeek V3.2 (legacy)
DeepSeek
$2.46
/month
Input $/1M
$0.27
Output $/1M
$1.10
Context
128,000
DeepSeek V4 Pro
DeepSeek
$2.61
/month
Input $/1M
$0.435
cached $0.003625
Output $/1M
$0.87
Context
1,000,000
Gemini 3.1 Flash-Lite
Google
$3.00
/month
Input $/1M
$0.25
Output $/1M
$1.50
Context
1,000,000
Qwen 2.5 72B
Alibaba
$3.00
/month
Input $/1M
$0.4
Output $/1M
$1.20
Context
128,000
GPT-5 Mini
OpenAI
$3.75
/month
Input $/1M
$0.25
Output $/1M
$2.00
Context
400,000
$3.96
/month
Input $/1M
$0.88
Output $/1M
$0.88
Context
128,000
Xiaomi MiMo-V2.5
Xiaomi MiMo
$4.20
/month
Input $/1M
$0.4
cached $0.08
Output $/1M
$2.00
Context
1,000,000
Gemini 2.5 Flash
Google
$4.65
/month
Input $/1M
$0.3
Output $/1M
$2.50
Context
1,000,000
Kimi K2.5
Moonshot AI
$4.80
/month
Input $/1M
$0.6
Output $/1M
$2.00
Context
128,000
DeepSeek R1 (legacy)
DeepSeek
$4.94
/month
Input $/1M
$0.55
Output $/1M
$2.19
Context
128,000
Amazon Nova Pro
Amazon
$7.20
/month
Input $/1M
$0.8
Output $/1M
$3.20
Context
300,000
Mistral Medium 3
Mistral
$7.50
/month
Input $/1M
$1.00
Output $/1M
$3.00
Context
128,000
Xiaomi MiMo-V2.5-Pro
Xiaomi MiMo
$7.50
/month
Input $/1M
$1.00
cached $0.2
Output $/1M
$3.00
Context
1,000,000
o3-mini
OpenAI
$9.90
/month
Input $/1M
$1.10
Output $/1M
$4.40
Context
200,000
Claude Haiku 4.5
Anthropic
$10.50
/month
Input $/1M
$1.00
Output $/1M
$5.00
Context
200,000
Mistral Large 3
Mistral
$15.00
/month
Input $/1M
$2.00
Output $/1M
$6.00
Context
128,000
Llama 3.1 405B
Meta (via providers)
$15.75
/month
Input $/1M
$3.50
Output $/1M
$3.50
Context
128,000
$18.00
/month
Input $/1M
$2.00
Output $/1M
$8.00
Context
200,000
Jamba 1.5 Large
AI21 Labs
$18.00
/month
Input $/1M
$2.00
Output $/1M
$8.00
Context
256,000
GPT-5
OpenAI
$18.75
/month
Input $/1M
$1.25
Output $/1M
$10.00
Context
400,000
Gemini 2.5 Pro
Google
$18.75
/month
Input $/1M
$1.25
Output $/1M
$10.00
Context
2,000,000
GPT-4o
OpenAI
$22.50
/month
Input $/1M
$2.50
Output $/1M
$10.00
Context
128,000
Command R+
Cohere
$22.50
/month
Input $/1M
$2.50
Output $/1M
$10.00
Context
128,000
Gemini 3.1 Pro
Google
$24.00
/month
Input $/1M
$2.00
Output $/1M
$12.00
Context
2,000,000
GPT-5.2-Codex
OpenAI
$26.25
/month
Input $/1M
$1.75
cached $0.175
Output $/1M
$14.00
Context
400,000
GPT-5.4
OpenAI
$30.00
/month
Input $/1M
$2.50
cached $0.25
Output $/1M
$15.00
Context
1,050,000
Claude Sonnet 4.6
Anthropic
$31.50
/month
Input $/1M
$3.00
Output $/1M
$15.00
Context
1,000,000
Grok 3
xAI
$31.50
/month
Input $/1M
$3.00
Output $/1M
$15.00
Context
131,072
Grok 4
xAI
$31.50
/month
Input $/1M
$3.00
Output $/1M
$15.00
Context
256,000
Claude Opus 4.6
Anthropic
$52.50
/month
Input $/1M
$5.00
Output $/1M
$25.00
Context
1,000,000
GPT-5.5
OpenAI
$60.00
/month
Input $/1M
$5.00
cached $0.5
Output $/1M
$30.00
Context
1,050,000
$135.00
/month
Input $/1M
$15.00
Output $/1M
$60.00
Context
200,000
o3-pro
OpenAI
$180.00
/month
Input $/1M
$20.00
Output $/1M
$80.00
Context
200,000
GPT-5.5 Pro
OpenAI
$360.00
/month
Input $/1M
$30.00
Output $/1M
$180.00
Context
1,050,000

如何使用此工具

  1. 输入你预估的每日输入 Token 数(发送给 AI 的文本量)和每日输出 Token 数(AI 回复的文本量)。
  2. 使用供应商筛选器缩小范围,如只看 OpenAI、Anthropic、Google 或其他供应商的模型。
  3. 按月费用、输入价格或输出价格排序,找到最具性价比的模型。
  4. 点击供应商名称可跳转到其官方定价页面,注册并获取 API 访问权限。
  5. 将多个模型进行横向对比,为你的具体业务场景找到最佳的性价比方案。

2026 年 AI API 定价全解析

AI API 按处理的 Token 数量收费,输入 Token(你的提示词)和输出 Token(模型的回复)分开计价,通常以百万 Token 为单位。例如 GPT-4o 输入价 $2.50/百万 Token、输出价 $10.00/百万 Token,Claude Sonnet 4 则分别为 $3.00 和 $15.00。

2026 年的 AI 定价竞争日趋激烈。DeepSeek V4 Flash 对缓存命中率高的 Agent 工作流非常激进;GPT-5、Claude Opus 4 等旗舰模型则以更强推理能力占据高端市场。选择哪个模型取决于任务复杂度、缓存命中率和输出长度。

除了单价,还有几个因素影响总成本:Batch API 折扣、提示词/上下文缓存、以及上下文窗口占用。DeepSeek V4、Anthropic、OpenAI、小米 MiMo 都有不同形式的缓存输入价格,纯按缓存未命中估算会高估很多 Agent 场景的真实账单。

成本优化建议:简单任务(分类、摘要)使用小模型如 GPT-4o-mini 或 Claude Haiku;固定不变的系统提示词启用缓存功能;非紧急请求走 Batch API 节省 50%;用 Helicone 或 Langfuse 等工具监控 Token 消耗,及时发现异常开销。

最后更新:2026 年 4 月

常见问题

月费是如何计算的?

月费 = (每日输入 Token × 输入价格/Token × 30) + (每日输出 Token × 输出价格/Token × 30)。价格基于最新公开的 API 定价。

价格多久更新一次?

我们定期更新定价数据。页面上会显示最近更新日期。AI 模型价格变化频繁,请以提供商官方定价页面为准。

哪个模型最便宜?

取决于你的使用场景。缓存命中率高的 Agent 流量可以优先看 DeepSeek V4 Flash。简单任务推荐 GPT-4o-mini 和 Claude Haiku。复杂推理任务中,GPT-5、Claude Sonnet 或 DeepSeek V4 Pro 虽然单价更高,但可能更划算。

什么是 Batch API?能省多少钱?

Batch API 是多家供应商提供的批量处理接口,适用于不需要实时响应的任务。OpenAI、Anthropic 和 Google 均提供 Batch API,通常可享约 50% 的价格折扣。适合文档批量分析、数据提取、内容生成等场景。如果你的业务允许几小时的处理延迟,Batch API 是最简单的降本手段。

提示词缓存(Prompt Caching)是怎么回事?

提示词缓存或上下文缓存会把重复的 Prompt 前缀放在服务端。DeepSeek V4 Flash 是当前最明显的例子:缓存命中输入 $0.0028/M,缓存未命中输入 $0.14/M。对反复发送仓库规则、系统提示词、稳定上下文的代码 Agent 很有价值。

2026 年哪个模型性价比最高?

取决于使用场景。缓存命中率高的 Agent 工作流优先看 DeepSeek V4 Flash;简单任务可用小模型;复杂推理和代码任务则需要比较 GPT-5、Claude Sonnet 和 DeepSeek V4 Pro 的质量与成本。

相关博客文章

相关工具