AI 模型定价计算器
对比 30+ AI 模型的费用。即时估算你的每月开支。
100,000 tokens/day = 3,000,000 tokens/month
50,000 tokens/day = 1,500,000 tokens/month
| Model↑↓ | Provider | Input $/1M↑↓ | Output $/1M↑↓ | Context Window | Monthly Cost↑ |
|---|---|---|---|---|---|
Amazon Nova MicroCheapest | Amazon | $0.04 | $0.14 | 128,000 | $0.3150 |
Amazon Nova Lite | Amazon | $0.06 | $0.24 | 300,000 | $0.5400 |
GPT-5 Nano | OpenAI | $0.05 | $0.40 | 128,000 | $0.7500 |
Gemini 2.5 Flash-Lite | $0.10 | $0.40 | 1,000,000 | $0.9000 | |
Gemini 2.0 Flash | $0.10 | $0.40 | 1,000,000 | $0.9000 | |
Jamba 1.5 Mini | AI21 Labs | $0.20 | $0.40 | 256,000 | $1.20 |
GPT-4o mini | OpenAI | $0.15 | $0.60 | 128,000 | $1.35 |
Command R | Cohere | $0.15 | $0.60 | 128,000 | $1.35 |
Grok 4 Fast | xAI | $0.20 | $0.50 | 2,000,000 | $1.35 |
Mistral Small 3.1 | Mistral | $0.20 | $0.60 | 128,000 | $1.50 |
Qwen 2.5 Coder 32B | Alibaba | $0.20 | $0.60 | 128,000 | $1.50 |
Grok 3 Mini | xAI | $0.30 | $0.50 | 131,072 | $1.65 |
DeepSeek V4 | DeepSeek | $0.30 | $0.50 | 1,000,000 | $1.65 |
DeepSeek V3.2 | DeepSeek | $0.27 | $1.10 | 128,000 | $2.46 |
Gemini 3.1 Flash-Lite | $0.25 | $1.50 | 1,000,000 | $3.00 | |
Qwen 2.5 72B | Alibaba | $0.40 | $1.20 | 128,000 | $3.00 |
GPT-5 Mini | OpenAI | $0.25 | $2.00 | 400,000 | $3.75 |
Llama 3.3 70B | Meta (via providers) | $0.88 | $0.88 | 128,000 | $3.96 |
Gemini 2.5 Flash | $0.30 | $2.50 | 1,000,000 | $4.65 | |
Kimi K2.5 | Moonshot AI | $0.60 | $2.00 | 128,000 | $4.80 |
DeepSeek R1 | DeepSeek | $0.55 | $2.19 | 128,000 | $4.94 |
Amazon Nova Pro | Amazon | $0.80 | $3.20 | 300,000 | $7.20 |
Mistral Medium 3 | Mistral | $1.00 | $3.00 | 128,000 | $7.50 |
o3-mini | OpenAI | $1.10 | $4.40 | 200,000 | $9.90 |
Claude Haiku 4.5 | Anthropic | $1.00 | $5.00 | 200,000 | $10.50 |
Mistral Large 3 | Mistral | $2.00 | $6.00 | 128,000 | $15.00 |
Llama 3.1 405B | Meta (via providers) | $3.50 | $3.50 | 128,000 | $15.75 |
o3 | OpenAI | $2.00 | $8.00 | 200,000 | $18.00 |
Jamba 1.5 Large | AI21 Labs | $2.00 | $8.00 | 256,000 | $18.00 |
GPT-5 | OpenAI | $1.25 | $10.00 | 400,000 | $18.75 |
Gemini 2.5 Pro | $1.25 | $10.00 | 2,000,000 | $18.75 | |
GPT-5.3-Codex | OpenAI | $2.00 | $10.00 | 200,000 | $21.00 |
GPT-4o | OpenAI | $2.50 | $10.00 | 128,000 | $22.50 |
Command R+ | Cohere | $2.50 | $10.00 | 128,000 | $22.50 |
Gemini 3.1 Pro | $2.00 | $12.00 | 2,000,000 | $24.00 | |
GPT-5.4 | OpenAI | $2.50 | $15.00 | 1,100,000 | $30.00 |
Claude Sonnet 4.6 | Anthropic | $3.00 | $15.00 | 1,000,000 | $31.50 |
Grok 3 | xAI | $3.00 | $15.00 | 131,072 | $31.50 |
Grok 4 | xAI | $3.00 | $15.00 | 256,000 | $31.50 |
Claude Opus 4.6 | Anthropic | $5.00 | $25.00 | 1,000,000 | $52.50 |
o1 | OpenAI | $15.00 | $60.00 | 200,000 | $135.00 |
o3-pro | OpenAI | $20.00 | $80.00 | 200,000 | $180.00 |
如何使用此工具
- 输入你预估的每日输入 Token 数(发送给 AI 的文本量)和每日输出 Token 数(AI 回复的文本量)。
- 使用供应商筛选器缩小范围,如只看 OpenAI、Anthropic、Google 或其他供应商的模型。
- 按月费用、输入价格或输出价格排序,找到最具性价比的模型。
- 点击供应商名称可跳转到其官方定价页面,注册并获取 API 访问权限。
- 将多个模型进行横向对比,为你的具体业务场景找到最佳的性价比方案。
2026 年 AI API 定价全解析
AI API 按处理的 Token 数量收费,输入 Token(你的提示词)和输出 Token(模型的回复)分开计价,通常以百万 Token 为单位。例如 GPT-4o 输入价 $2.50/百万 Token、输出价 $10.00/百万 Token,Claude Sonnet 4 则分别为 $3.00 和 $15.00。
2026 年的 AI 定价竞争日趋激烈。DeepSeek V3、Llama 3.3 等开源模型通过 Together.ai、Groq 等推理平台提供极低价格的 API 服务。而 GPT-5、Claude Opus 4 等旗舰模型则以更强的推理能力占据高端市场。选择哪个模型取决于你的任务复杂度和预算。
除了单价,还有几个因素影响总成本:Batch API 折扣(非实时处理通常可享 50% 优惠)、提示词缓存(重复的提示词前缀可获得 75%-90% 的折扣)、以及上下文窗口占用(越长的对话费用越高)。部分供应商对缓存输入和新输入收取不同价格。
成本优化建议:简单任务(分类、摘要)使用小模型如 GPT-4o-mini 或 Claude Haiku;固定不变的系统提示词启用缓存功能;非紧急请求走 Batch API 节省 50%;用 Helicone 或 Langfuse 等工具监控 Token 消耗,及时发现异常开销。
最后更新:2026 年 2 月
常见问题
月费是如何计算的?
月费 = (每日输入 Token × 输入价格/Token × 30) + (每日输出 Token × 输出价格/Token × 30)。价格基于最新公开的 API 定价。
价格多久更新一次?
我们定期更新定价数据。页面上会显示最近更新日期。AI 模型价格变化频繁,请以提供商官方定价页面为准。
哪个模型最便宜?
取决于你的使用场景。简单任务推荐 GPT-4o-mini 和 Claude 3.5 Haiku,性价比极高。复杂推理任务中,GPT-4o 或 Claude 3.5 Sonnet 虽然单价更高,但可能更划算。
什么是 Batch API?能省多少钱?
Batch API 是多家供应商提供的批量处理接口,适用于不需要实时响应的任务。OpenAI、Anthropic 和 Google 均提供 Batch API,通常可享约 50% 的价格折扣。适合文档批量分析、数据提取、内容生成等场景。如果你的业务允许几小时的处理延迟,Batch API 是最简单的降本手段。
提示词缓存(Prompt Caching)是怎么回事?
提示词缓存由 Anthropic 和 OpenAI 提供,将常用的提示词前缀存储在服务器端。当后续请求包含相同前缀时,缓存部分的 Token 仅收取原价的 10%-25%。对于使用长系统提示词或多轮 few-shot 示例的应用特别划算,可以大幅降低重复内容的成本。
2026 年哪个模型性价比最高?
取决于使用场景。简单任务(分类、信息提取)推荐 GPT-4o-mini 或 Claude Haiku 3.5,百万 Token 不到 $1。复杂推理任务推荐 Claude Sonnet 4 或 GPT-4o,能力与成本较为均衡。追求最高质量不计成本,则选 GPT-5 或 Claude Opus 4。国内开发者也可以关注 DeepSeek V3,性价比极高。
相关博客文章
Google 最新旗舰,输入 $2.00/M。ARC-AGI-2 77.1%,原生视频理解,百万上下文。
GPT-5.3 Codex 价格:$2/M|OpenAI Agent 编程专用模型(2026)OpenAI 编程优化模型,$2/$10 每百万 Token。200K 上下文,32K 最大输出。
2026 年 40+ 大模型价格对比:Gemini 3.1 Pro、GPT-5.3 Codex、Claude 4.6所有主流 AI API 供应商的定价横评对比。
AI API 降本 80%:2026 年 8 个实战省钱策略实操技巧,帮你削减 50%-90% 的 AI API 开支。