AI 模型定价计算器
对比 40+ AI 模型费用,支持 DeepSeek V4 缓存命中价格。即时估算你的每月开支。
Workload presets
Cache-hit share is applied only to models with published cached-input pricing.
100,000 tokens/day = 3,000,000 tokens/month
50,000 tokens/day = 1,500,000 tokens/month
0% of input tokens use cached pricing when available
| Model↑↓ | Provider | Input $/1M↑↓ | Output $/1M↑↓ | Context Window | Monthly Cost↑ |
|---|---|---|---|---|---|
Amazon Nova MicroCheapest | Amazon | $0.035 | $0.14 | 128,000 | $0.3150 |
Amazon Nova Lite | Amazon | $0.06 | $0.24 | 300,000 | $0.5400 |
Xiaomi MiMo-V2.5-Flash | Xiaomi MiMo | $0.1 cached $0.01 | $0.3 | 256,000 | $0.7500 |
GPT-5 Nano | OpenAI | $0.05 | $0.4 | 128,000 | $0.7500 |
DeepSeek V4 Flash | DeepSeek | $0.14 cached $0.0028 | $0.28 | 1,000,000 | $0.8400 |
Gemini 2.5 Flash-Lite | $0.1 | $0.4 | 1,000,000 | $0.9000 | |
Gemini 2.0 Flash | $0.1 | $0.4 | 1,000,000 | $0.9000 | |
Jamba 1.5 Mini | AI21 Labs | $0.2 | $0.4 | 256,000 | $1.20 |
GPT-4o mini | OpenAI | $0.15 | $0.6 | 128,000 | $1.35 |
Command R | Cohere | $0.15 | $0.6 | 128,000 | $1.35 |
Grok 4 Fast | xAI | $0.2 | $0.5 | 2,000,000 | $1.35 |
Mistral Small 3.1 | Mistral | $0.2 | $0.6 | 128,000 | $1.50 |
Qwen 2.5 Coder 32B | Alibaba | $0.2 | $0.6 | 128,000 | $1.50 |
Grok 3 Mini | xAI | $0.3 | $0.5 | 131,072 | $1.65 |
DeepSeek V3.2 (legacy) | DeepSeek | $0.27 | $1.10 | 128,000 | $2.46 |
DeepSeek V4 Pro | DeepSeek | $0.435 cached $0.003625 | $0.87 | 1,000,000 | $2.61 |
Gemini 3.1 Flash-Lite | $0.25 | $1.50 | 1,000,000 | $3.00 | |
Qwen 2.5 72B | Alibaba | $0.4 | $1.20 | 128,000 | $3.00 |
GPT-5 Mini | OpenAI | $0.25 | $2.00 | 400,000 | $3.75 |
Llama 3.3 70B | Meta (via providers) | $0.88 | $0.88 | 128,000 | $3.96 |
Xiaomi MiMo-V2.5 | Xiaomi MiMo | $0.4 cached $0.08 | $2.00 | 1,000,000 | $4.20 |
Gemini 2.5 Flash | $0.3 | $2.50 | 1,000,000 | $4.65 | |
Kimi K2.5 | Moonshot AI | $0.6 | $2.00 | 128,000 | $4.80 |
DeepSeek R1 (legacy) | DeepSeek | $0.55 | $2.19 | 128,000 | $4.94 |
Amazon Nova Pro | Amazon | $0.8 | $3.20 | 300,000 | $7.20 |
Mistral Medium 3 | Mistral | $1.00 | $3.00 | 128,000 | $7.50 |
Xiaomi MiMo-V2.5-Pro | Xiaomi MiMo | $1.00 cached $0.2 | $3.00 | 1,000,000 | $7.50 |
o3-mini | OpenAI | $1.10 | $4.40 | 200,000 | $9.90 |
Claude Haiku 4.5 | Anthropic | $1.00 | $5.00 | 200,000 | $10.50 |
Mistral Large 3 | Mistral | $2.00 | $6.00 | 128,000 | $15.00 |
Llama 3.1 405B | Meta (via providers) | $3.50 | $3.50 | 128,000 | $15.75 |
o3 | OpenAI | $2.00 | $8.00 | 200,000 | $18.00 |
Jamba 1.5 Large | AI21 Labs | $2.00 | $8.00 | 256,000 | $18.00 |
GPT-5 | OpenAI | $1.25 | $10.00 | 400,000 | $18.75 |
Gemini 2.5 Pro | $1.25 | $10.00 | 2,000,000 | $18.75 | |
GPT-4o | OpenAI | $2.50 | $10.00 | 128,000 | $22.50 |
Command R+ | Cohere | $2.50 | $10.00 | 128,000 | $22.50 |
Gemini 3.1 Pro | $2.00 | $12.00 | 2,000,000 | $24.00 | |
GPT-5.2-Codex | OpenAI | $1.75 cached $0.175 | $14.00 | 400,000 | $26.25 |
GPT-5.4 | OpenAI | $2.50 cached $0.25 | $15.00 | 1,050,000 | $30.00 |
Claude Sonnet 4.6 | Anthropic | $3.00 | $15.00 | 1,000,000 | $31.50 |
Grok 3 | xAI | $3.00 | $15.00 | 131,072 | $31.50 |
Grok 4 | xAI | $3.00 | $15.00 | 256,000 | $31.50 |
Claude Opus 4.6 | Anthropic | $5.00 | $25.00 | 1,000,000 | $52.50 |
GPT-5.5 | OpenAI | $5.00 cached $0.5 | $30.00 | 1,050,000 | $60.00 |
o1 | OpenAI | $15.00 | $60.00 | 200,000 | $135.00 |
o3-pro | OpenAI | $20.00 | $80.00 | 200,000 | $180.00 |
GPT-5.5 Pro | OpenAI | $30.00 | $180.00 | 1,050,000 | $360.00 |
如何使用此工具
- 输入你预估的每日输入 Token 数(发送给 AI 的文本量)和每日输出 Token 数(AI 回复的文本量)。
- 使用供应商筛选器缩小范围,如只看 OpenAI、Anthropic、Google 或其他供应商的模型。
- 按月费用、输入价格或输出价格排序,找到最具性价比的模型。
- 点击供应商名称可跳转到其官方定价页面,注册并获取 API 访问权限。
- 将多个模型进行横向对比,为你的具体业务场景找到最佳的性价比方案。
2026 年 AI API 定价全解析
AI API 按处理的 Token 数量收费,输入 Token(你的提示词)和输出 Token(模型的回复)分开计价,通常以百万 Token 为单位。例如 GPT-4o 输入价 $2.50/百万 Token、输出价 $10.00/百万 Token,Claude Sonnet 4 则分别为 $3.00 和 $15.00。
2026 年的 AI 定价竞争日趋激烈。DeepSeek V4 Flash 对缓存命中率高的 Agent 工作流非常激进;GPT-5、Claude Opus 4 等旗舰模型则以更强推理能力占据高端市场。选择哪个模型取决于任务复杂度、缓存命中率和输出长度。
除了单价,还有几个因素影响总成本:Batch API 折扣、提示词/上下文缓存、以及上下文窗口占用。DeepSeek V4、Anthropic、OpenAI、小米 MiMo 都有不同形式的缓存输入价格,纯按缓存未命中估算会高估很多 Agent 场景的真实账单。
成本优化建议:简单任务(分类、摘要)使用小模型如 GPT-4o-mini 或 Claude Haiku;固定不变的系统提示词启用缓存功能;非紧急请求走 Batch API 节省 50%;用 Helicone 或 Langfuse 等工具监控 Token 消耗,及时发现异常开销。
最后更新:2026 年 4 月
常见问题
月费是如何计算的?
月费 = (每日输入 Token × 输入价格/Token × 30) + (每日输出 Token × 输出价格/Token × 30)。价格基于最新公开的 API 定价。
价格多久更新一次?
我们定期更新定价数据。页面上会显示最近更新日期。AI 模型价格变化频繁,请以提供商官方定价页面为准。
哪个模型最便宜?
取决于你的使用场景。缓存命中率高的 Agent 流量可以优先看 DeepSeek V4 Flash。简单任务推荐 GPT-4o-mini 和 Claude Haiku。复杂推理任务中,GPT-5、Claude Sonnet 或 DeepSeek V4 Pro 虽然单价更高,但可能更划算。
什么是 Batch API?能省多少钱?
Batch API 是多家供应商提供的批量处理接口,适用于不需要实时响应的任务。OpenAI、Anthropic 和 Google 均提供 Batch API,通常可享约 50% 的价格折扣。适合文档批量分析、数据提取、内容生成等场景。如果你的业务允许几小时的处理延迟,Batch API 是最简单的降本手段。
提示词缓存(Prompt Caching)是怎么回事?
提示词缓存或上下文缓存会把重复的 Prompt 前缀放在服务端。DeepSeek V4 Flash 是当前最明显的例子:缓存命中输入 $0.0028/M,缓存未命中输入 $0.14/M。对反复发送仓库规则、系统提示词、稳定上下文的代码 Agent 很有价值。
2026 年哪个模型性价比最高?
取决于使用场景。缓存命中率高的 Agent 工作流优先看 DeepSeek V4 Flash;简单任务可用小模型;复杂推理和代码任务则需要比较 GPT-5、Claude Sonnet 和 DeepSeek V4 Pro 的质量与成本。
相关博客文章
DeepSeek V4 Flash / Pro 官方价格、缓存命中成本、免费额度说明和 Agent 成本估算。
Gemini 3.1 Pro 价格:$2.00/M|ARC-AGI-2 77.1%,百万级上下文(2026)Google 最新旗舰,输入 $2.00/M。ARC-AGI-2 77.1%,原生视频理解,百万上下文。
GPT-5.5 在 Codex 中怎么收费:API 价格、模型 ID 与 DeepSeek 路由对比 OpenAI GPT-5.5、GPT-5.2-Codex 与 DeepSeek V4 Flash 的 Agent 工作流成本。
2026 年 40+ 大模型价格对比:DeepSeek V4、GPT-5.5、Gemini 3.1、Claude 4.6所有主流 AI API 供应商的定价横评对比。
AI API 降本 80%:2026 年 8 个实战省钱策略实操技巧,帮你削减 50%-90% 的 AI API 开支。