DevTk.AI
Claude API 价格Anthropic 定价Claude Opus 4.6Claude Sonnet 4.6Claude Haiku 4.5AI 成本

Claude API 价格 2026:Opus 4.6、Sonnet 4.6、Haiku 4.5 每百万 Token 成本

Claude API 每百万 token 价格:Opus 4.6 $5/$25、Sonnet 4.6 $3/$15、Haiku 4.5 $1/$5,含 Prompt Caching、Batch API、1M 上下文和 Coding Agent 成本示例。

DevTk.AI 2026-02-23 更新于 2026-05-07 10 分钟阅读

Claude API 2026 年仍然是高端价格,但口径很直接:在 DevTk.AI canonical 模型表中,Opus 4.6 是 $5/$25 每百万输入/输出 tokenSonnet 4.6 是 $3/$15Haiku 4.5 是 $1/$5。对 Claude Code、代码 Agent 和工具调用工作流来说,真实账单不只取决于模型,还取决于上下文长度、Prompt Caching 命中率、输出长度,以及能不能用 Batch API。

重要时效说明:Anthropic 官方模型文档现在把 Claude Opus 4.7 列为当前最强的通用 Opus 模型。Opus 4.7 的官方基础 API 价格与 Opus 4.6 相同(输入 $5/M、输出 $25/M),但在 src/data/models.ts 更新之前,这篇指南仍与站内 canonical 模型表保持一致。

快速答案:Claude API 每百万 Token 价格

Claude 模型输入输出缓存命中Batch 输入Batch 输出适合场景
Opus 4.6$5.00$25.00$0.50$2.50$12.50最高能力 Claude 任务
Sonnet 4.6$3.00$15.00$0.30$1.50$7.50默认生产级代码和 Agent 任务
Haiku 4.5$1.00$5.00$0.10$0.50$2.50快速、低成本分流

如果一个 Coding Agent 每月使用 200 万输入 token + 50 万输出 token,未计算缓存和 Batch 前,粗略成本约为:Opus 4.6 $22.50Sonnet 4.6 $13.50Haiku 4.5 $4.50。和 OpenAI、DeepSeek 的对比见 AI Coding Agent 成本对比

Claude 定价表(2026 年 5 月)

模型输入价格输出价格上下文最大输出适用场景
Claude Opus 4.6$5.00/M$25.00/M1M128Kcanonical 表中的高能力 Opus 档
Claude Sonnet 4.6$3.00/M$15.00/M1M64KClaude 产品级默认选择
Claude Haiku 4.5$1.00/M$5.00/M200K64K快速、低成本 Claude 分流

价格单位均为美元/百万 token。Anthropic 当前官方定价文档说明,Opus 4.6 和 Sonnet 4.6 的完整 1M 上下文窗口按标准价格计费;90 万 token 请求和 9000 token 请求使用同一档每 token 单价。这修正了旧版文章里“1M 仍是 beta”或“超过 200K 有长上下文溢价”的说法。

Prompt Caching 价格

Anthropic 的 Prompt Caching 会分别计费缓存写入和缓存读取:

模型基础输入5 分钟缓存写入1 小时缓存写入缓存命中 / 刷新
Opus 4.6$5.00/M$6.25/M$10.00/M$0.50/M
Sonnet 4.6$3.00/M$3.75/M$6.00/M$0.30/M
Haiku 4.5$1.00/M$1.25/M$2.00/M$0.10/M

缓存命中价格是标准输入价格的 10%。固定系统提示词、工具 schema、长参考文档、稳定对话历史都适合开启缓存。

Batch API 价格

Anthropic Message Batches API 对异步任务提供输入和输出 token 50% 折扣:

模型批量输入批量输出
Opus 4.6$2.50/M$12.50/M
Sonnet 4.6$1.50/M$7.50/M
Haiku 4.5$0.50/M$2.50/M

Batch API 可以和 Prompt Caching 叠加。高吞吐、非实时、重复上下文明显的任务,应优先考虑两者一起用。

Claude vs GPT-5 vs DeepSeek

模型输入价格输出价格说明
Claude Opus 4.6$5.00$25.00canonical 表中的高端 Claude 档
Claude Sonnet 4.6$3.00$15.00Claude 产品默认档
GPT-5$1.25$10.00输入更便宜,canonical 上下文小于 Opus/Sonnet 4.6
Claude Haiku 4.5$1.00$5.00快速 Claude 档
DeepSeek V4 Flash$0.14$0.28更低价文本替代
GPT-5 Mini$0.25$2.00更低价 OpenAI 分流档

关键结论:

  • Opus 4.6 比 GPT-5 贵,只应留给确实需要高端 Claude 能力的任务。
  • Sonnet 4.6 是大多数 Claude 产品场景的默认选择,尤其是代码、工具调用和复杂指令。
  • Haiku 4.5 是 Claude 成本控制档,canonical 表中的价格为 $1/$5,最大输出 64K。
  • DeepSeek 和更小的 OpenAI 模型 对简单文本任务便宜得多,所以模型分流很重要。

月度成本估算

场景 1:个人开发者

每天 10 万输入 + 5 万输出 token:

Claude 模型月费
Opus 4.6$52.50
Sonnet 4.6$31.50
Haiku 4.5$10.50
GPT-5 参考$18.75
DeepSeek V4 Flash 参考$0.84

场景 2:初创团队

每天 100 万输入 + 50 万输出 token:

Claude 模型月费
Opus 4.6$525
Sonnet 4.6$315
Haiku 4.5$105
GPT-5 参考$187.50
DeepSeek V4 Flash 参考$8.40

场景 3:产品级

每天 1000 万输入 + 500 万输出 token:

Claude 模型月费
Opus 4.6$5,250
Sonnet 4.6$3,150
Haiku 4.5$1,050
GPT-5 参考$1,875
DeepSeek V4 Flash 参考$84

精确计算你的成本: 使用 AI 模型定价计算器

Claude 省钱策略

1. 开启 Prompt Caching

以 Sonnet 4.6、3000 token 固定系统提示、每天 1 万次请求为例:

  • 不缓存: 3,000 x 10,000 x 30 x $3/M = $2,700/月
  • 缓存命中: 缓存写入之后,重复缓存 token 按 $0.30/M 计费
  • 适用场景: 长系统提示词、可复用工具定义、共享文档、Agent 指令

2. 分级模型调用

按任务复杂度分流:

  • 简单问答、分类、提取 -> Haiku 4.5
  • 通用对话、代码生成、工具调用 -> Sonnet 4.6
  • 困难研究、复杂推理、高价值流程 -> Opus 4.6

3. 非实时任务用 Batch API

数据处理、内容生成、离线摘要、评测任务,只要不要求实时返回,就应考虑 Batch API。

4. 控制 Token 用量

  • 保持系统提示词简洁并可缓存。
  • 需要 JSON 时用结构化输出,避免冗长自然语言。
  • 设置合理的 max_tokens,避免输出失控。

5. 把 Extended Thinking 当成预算选择

Claude 推理功能能提升质量,但输出和 thinking token 仍会影响成本。只有在质量提升值得额外 token 支出时再开启。

选哪个 Claude 模型?

你的需求推荐模型每天 100 万输入 + 50 万输出月费
canonical 表中最高 Claude 能力Opus 4.6$525
产品级质量与成本平衡Sonnet 4.6$315
高吞吐 Claude 分流Haiku 4.5$105
最低价文本替代DeepSeek V4 Flash$8.40

总结

Claude 2026 年仍然是高端 API,但当前官方文档比旧版 3 月文章更清楚,也更有利:Opus 4.6 和 Sonnet 4.6 的 1M 上下文按标准每 token 价格计费。多数团队应以 Sonnet 4.6 + Prompt Caching 为默认方案,用 Haiku 4.5 做低成本分流,把 Opus 留给真正值得高价处理的请求。

已核对官方来源:Anthropic pricingAnthropic models overview

相关工具:

相关文章