Claude API 价格 2026:Opus 4.6、Sonnet 4.6、Haiku 4.5 每百万 Token 成本
Claude API 每百万 token 价格:Opus 4.6 $5/$25、Sonnet 4.6 $3/$15、Haiku 4.5 $1/$5,含 Prompt Caching、Batch API、1M 上下文和 Coding Agent 成本示例。
Claude API 2026 年仍然是高端价格,但口径很直接:在 DevTk.AI canonical 模型表中,Opus 4.6 是 $5/$25 每百万输入/输出 token,Sonnet 4.6 是 $3/$15,Haiku 4.5 是 $1/$5。对 Claude Code、代码 Agent 和工具调用工作流来说,真实账单不只取决于模型,还取决于上下文长度、Prompt Caching 命中率、输出长度,以及能不能用 Batch API。
重要时效说明:Anthropic 官方模型文档现在把 Claude Opus 4.7 列为当前最强的通用 Opus 模型。Opus 4.7 的官方基础 API 价格与 Opus 4.6 相同(输入 $5/M、输出 $25/M),但在 src/data/models.ts 更新之前,这篇指南仍与站内 canonical 模型表保持一致。
快速答案:Claude API 每百万 Token 价格
| Claude 模型 | 输入 | 输出 | 缓存命中 | Batch 输入 | Batch 输出 | 适合场景 |
|---|---|---|---|---|---|---|
| Opus 4.6 | $5.00 | $25.00 | $0.50 | $2.50 | $12.50 | 最高能力 Claude 任务 |
| Sonnet 4.6 | $3.00 | $15.00 | $0.30 | $1.50 | $7.50 | 默认生产级代码和 Agent 任务 |
| Haiku 4.5 | $1.00 | $5.00 | $0.10 | $0.50 | $2.50 | 快速、低成本分流 |
如果一个 Coding Agent 每月使用 200 万输入 token + 50 万输出 token,未计算缓存和 Batch 前,粗略成本约为:Opus 4.6 $22.50、Sonnet 4.6 $13.50、Haiku 4.5 $4.50。和 OpenAI、DeepSeek 的对比见 AI Coding Agent 成本对比。
Claude 定价表(2026 年 5 月)
| 模型 | 输入价格 | 输出价格 | 上下文 | 最大输出 | 适用场景 |
|---|---|---|---|---|---|
| Claude Opus 4.6 | $5.00/M | $25.00/M | 1M | 128K | canonical 表中的高能力 Opus 档 |
| Claude Sonnet 4.6 | $3.00/M | $15.00/M | 1M | 64K | Claude 产品级默认选择 |
| Claude Haiku 4.5 | $1.00/M | $5.00/M | 200K | 64K | 快速、低成本 Claude 分流 |
价格单位均为美元/百万 token。Anthropic 当前官方定价文档说明,Opus 4.6 和 Sonnet 4.6 的完整 1M 上下文窗口按标准价格计费;90 万 token 请求和 9000 token 请求使用同一档每 token 单价。这修正了旧版文章里“1M 仍是 beta”或“超过 200K 有长上下文溢价”的说法。
Prompt Caching 价格
Anthropic 的 Prompt Caching 会分别计费缓存写入和缓存读取:
| 模型 | 基础输入 | 5 分钟缓存写入 | 1 小时缓存写入 | 缓存命中 / 刷新 |
|---|---|---|---|---|
| Opus 4.6 | $5.00/M | $6.25/M | $10.00/M | $0.50/M |
| Sonnet 4.6 | $3.00/M | $3.75/M | $6.00/M | $0.30/M |
| Haiku 4.5 | $1.00/M | $1.25/M | $2.00/M | $0.10/M |
缓存命中价格是标准输入价格的 10%。固定系统提示词、工具 schema、长参考文档、稳定对话历史都适合开启缓存。
Batch API 价格
Anthropic Message Batches API 对异步任务提供输入和输出 token 50% 折扣:
| 模型 | 批量输入 | 批量输出 |
|---|---|---|
| Opus 4.6 | $2.50/M | $12.50/M |
| Sonnet 4.6 | $1.50/M | $7.50/M |
| Haiku 4.5 | $0.50/M | $2.50/M |
Batch API 可以和 Prompt Caching 叠加。高吞吐、非实时、重复上下文明显的任务,应优先考虑两者一起用。
Claude vs GPT-5 vs DeepSeek
| 模型 | 输入价格 | 输出价格 | 说明 |
|---|---|---|---|
| Claude Opus 4.6 | $5.00 | $25.00 | canonical 表中的高端 Claude 档 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | Claude 产品默认档 |
| GPT-5 | $1.25 | $10.00 | 输入更便宜,canonical 上下文小于 Opus/Sonnet 4.6 |
| Claude Haiku 4.5 | $1.00 | $5.00 | 快速 Claude 档 |
| DeepSeek V4 Flash | $0.14 | $0.28 | 更低价文本替代 |
| GPT-5 Mini | $0.25 | $2.00 | 更低价 OpenAI 分流档 |
关键结论:
- Opus 4.6 比 GPT-5 贵,只应留给确实需要高端 Claude 能力的任务。
- Sonnet 4.6 是大多数 Claude 产品场景的默认选择,尤其是代码、工具调用和复杂指令。
- Haiku 4.5 是 Claude 成本控制档,canonical 表中的价格为 $1/$5,最大输出 64K。
- DeepSeek 和更小的 OpenAI 模型 对简单文本任务便宜得多,所以模型分流很重要。
月度成本估算
场景 1:个人开发者
每天 10 万输入 + 5 万输出 token:
| Claude 模型 | 月费 |
|---|---|
| Opus 4.6 | $52.50 |
| Sonnet 4.6 | $31.50 |
| Haiku 4.5 | $10.50 |
| GPT-5 参考 | $18.75 |
| DeepSeek V4 Flash 参考 | $0.84 |
场景 2:初创团队
每天 100 万输入 + 50 万输出 token:
| Claude 模型 | 月费 |
|---|---|
| Opus 4.6 | $525 |
| Sonnet 4.6 | $315 |
| Haiku 4.5 | $105 |
| GPT-5 参考 | $187.50 |
| DeepSeek V4 Flash 参考 | $8.40 |
场景 3:产品级
每天 1000 万输入 + 500 万输出 token:
| Claude 模型 | 月费 |
|---|---|
| Opus 4.6 | $5,250 |
| Sonnet 4.6 | $3,150 |
| Haiku 4.5 | $1,050 |
| GPT-5 参考 | $1,875 |
| DeepSeek V4 Flash 参考 | $84 |
精确计算你的成本: 使用 AI 模型定价计算器。
Claude 省钱策略
1. 开启 Prompt Caching
以 Sonnet 4.6、3000 token 固定系统提示、每天 1 万次请求为例:
- 不缓存: 3,000 x 10,000 x 30 x $3/M = $2,700/月
- 缓存命中: 缓存写入之后,重复缓存 token 按 $0.30/M 计费
- 适用场景: 长系统提示词、可复用工具定义、共享文档、Agent 指令
2. 分级模型调用
按任务复杂度分流:
- 简单问答、分类、提取 -> Haiku 4.5
- 通用对话、代码生成、工具调用 -> Sonnet 4.6
- 困难研究、复杂推理、高价值流程 -> Opus 4.6
3. 非实时任务用 Batch API
数据处理、内容生成、离线摘要、评测任务,只要不要求实时返回,就应考虑 Batch API。
4. 控制 Token 用量
- 保持系统提示词简洁并可缓存。
- 需要 JSON 时用结构化输出,避免冗长自然语言。
- 设置合理的
max_tokens,避免输出失控。
5. 把 Extended Thinking 当成预算选择
Claude 推理功能能提升质量,但输出和 thinking token 仍会影响成本。只有在质量提升值得额外 token 支出时再开启。
选哪个 Claude 模型?
| 你的需求 | 推荐模型 | 每天 100 万输入 + 50 万输出月费 |
|---|---|---|
| canonical 表中最高 Claude 能力 | Opus 4.6 | $525 |
| 产品级质量与成本平衡 | Sonnet 4.6 | $315 |
| 高吞吐 Claude 分流 | Haiku 4.5 | $105 |
| 最低价文本替代 | DeepSeek V4 Flash | $8.40 |
总结
Claude 2026 年仍然是高端 API,但当前官方文档比旧版 3 月文章更清楚,也更有利:Opus 4.6 和 Sonnet 4.6 的 1M 上下文按标准每 token 价格计费。多数团队应以 Sonnet 4.6 + Prompt Caching 为默认方案,用 Haiku 4.5 做低成本分流,把 Opus 留给真正值得高价处理的请求。
已核对官方来源:Anthropic pricing 和 Anthropic models overview。
相关工具:
- AI 模型定价计算器 — 多模型成本对比
- AI Token 计算器 — 请求前估算 token
- AI Coding Agent 成本对比 2026 — Codex、Claude Code、Cursor、DeepSeek 和 API 路由成本
- DeepSeek API 价格指南 — Claude 的低价替代方案
- OpenAI API 定价指南 2026 — GPT 定价和批量折扣
- Google Gemini API 定价指南 2026 — Gemini 定价、免费层和长上下文
- AI API 价格对比 2026 — 全部厂商对比