Claude API 价格 2026：Opus 4.8、Sonnet 4.6、Haiku 4.5 每百万 Token 成本

Claude API 2026 年仍然是高端价格，但口径很直接：在 DevTk.AI canonical 模型表中，Opus 4.8 是 $5/$25 每百万输入/输出 token，Sonnet 4.6 是 $3/$15，Haiku 4.5 是 $1/$5。对 Claude Code、代码 Agent 和工具调用工作流来说，真实账单不只取决于模型，还取决于上下文长度、Prompt Caching 命中率、输出长度，以及能不能用 Batch API。

时效说明：Claude Opus 4.8 是当前最新可正常使用的 Opus 模型。Anthropic 于 2026 年 6 月 9 日发布 Fable 5 和 Mythos 5，但在 6 月 12 日暂停了客户访问，因此站内计算器没有把它们作为可用模型收录。

快速答案：Claude API 每百万 Token 价格

Claude 模型	输入	输出	缓存命中	Batch 输入	Batch 输出	适合场景
Opus 4.8	$5.00	$25.00	$0.50	$2.50	$12.50	最高能力 Claude 任务
Sonnet 4.6	$3.00	$15.00	$0.30	$1.50	$7.50	默认生产级代码和 Agent 任务
Haiku 4.5	$1.00	$5.00	$0.10	$0.50	$2.50	快速、低成本分流

如果一个 Coding Agent 每月使用 200 万输入 token + 50 万输出 token，未计算缓存和 Batch 前，粗略成本约为：Opus 4.8 $22.50、Sonnet 4.6 $13.50、Haiku 4.5 $4.50。和 OpenAI、DeepSeek 的对比见 AI Coding Agent 成本对比。

Claude 定价表（2026 年 6 月）

模型	输入价格	输出价格	上下文	最大输出	适用场景
Claude Opus 4.8	$5.00/M	$25.00/M	1M	128K	canonical 表中的高能力 Opus 档
Claude Sonnet 4.6	$3.00/M	$15.00/M	1M	64K	Claude 产品级默认选择
Claude Haiku 4.5	$1.00/M	$5.00/M	200K	64K	快速、低成本 Claude 分流

价格单位均为美元/百万 token。Anthropic 当前官方定价文档说明，Opus 4.8 和 Sonnet 4.6 的完整 1M 上下文窗口按标准价格计费；90 万 token 请求和 9000 token 请求使用同一档每 token 单价。这修正了旧版文章里“1M 仍是 beta”或“超过 200K 有长上下文溢价”的说法。

Prompt Caching 价格

Anthropic 的 Prompt Caching 会分别计费缓存写入和缓存读取：

模型	基础输入	5 分钟缓存写入	1 小时缓存写入	缓存命中 / 刷新
Opus 4.8	$5.00/M	$6.25/M	$10.00/M	$0.50/M
Sonnet 4.6	$3.00/M	$3.75/M	$6.00/M	$0.30/M
Haiku 4.5	$1.00/M	$1.25/M	$2.00/M	$0.10/M

缓存命中价格是标准输入价格的 10%。固定系统提示词、工具 schema、长参考文档、稳定对话历史都适合开启缓存。

Batch API 价格

Anthropic Message Batches API 对异步任务提供输入和输出 token 50% 折扣：

模型	批量输入	批量输出
Opus 4.8	$2.50/M	$12.50/M
Sonnet 4.6	$1.50/M	$7.50/M
Haiku 4.5	$0.50/M	$2.50/M

Batch API 可以和 Prompt Caching 叠加。高吞吐、非实时、重复上下文明显的任务，应优先考虑两者一起用。

Claude vs GPT-5 vs DeepSeek

模型	输入价格	输出价格	说明
Claude Opus 4.8	$5.00	$25.00	canonical 表中的高端 Claude 档
Claude Sonnet 4.6	$3.00	$15.00	Claude 产品默认档
GPT-5	$1.25	$10.00	输入更便宜，canonical 上下文小于 Opus/Sonnet 4.6
Claude Haiku 4.5	$1.00	$5.00	快速 Claude 档
DeepSeek V4 Flash	$0.14	$0.28	更低价文本替代
GPT-5 Mini	$0.25	$2.00	更低价 OpenAI 分流档

关键结论：

Opus 4.8 比 GPT-5 贵，只应留给确实需要高端 Claude 能力的任务。
Sonnet 4.6 是大多数 Claude 产品场景的默认选择，尤其是代码、工具调用和复杂指令。
Haiku 4.5 是 Claude 成本控制档，canonical 表中的价格为 $1/$5，最大输出 64K。
DeepSeek 和更小的 OpenAI 模型 对简单文本任务便宜得多，所以模型分流很重要。

月度成本估算

场景 1：个人开发者

每天 10 万输入 + 5 万输出 token：

Claude 模型	月费
Opus 4.8	$52.50
Sonnet 4.6	$31.50
Haiku 4.5	$10.50
GPT-5 参考	$18.75
DeepSeek V4 Flash 参考	$0.84

场景 2：初创团队

每天 100 万输入 + 50 万输出 token：

Claude 模型	月费
Opus 4.8	$525
Sonnet 4.6	$315
Haiku 4.5	$105
GPT-5 参考	$187.50
DeepSeek V4 Flash 参考	$8.40

场景 3：产品级

每天 1000 万输入 + 500 万输出 token：

Claude 模型	月费
Opus 4.8	$5,250
Sonnet 4.6	$3,150
Haiku 4.5	$1,050
GPT-5 参考	$1,875
DeepSeek V4 Flash 参考	$84

精确计算你的成本： 使用 AI 模型定价计算器。

Claude 省钱策略

1. 开启 Prompt Caching

以 Sonnet 4.6、3000 token 固定系统提示、每天 1 万次请求为例：

不缓存： 3,000 x 10,000 x 30 x $3/M = $2,700/月
缓存命中： 缓存写入之后，重复缓存 token 按 $0.30/M 计费
适用场景： 长系统提示词、可复用工具定义、共享文档、Agent 指令

2. 分级模型调用

按任务复杂度分流：

简单问答、分类、提取 -> Haiku 4.5
通用对话、代码生成、工具调用 -> Sonnet 4.6
困难研究、复杂推理、高价值流程 -> Opus 4.8

3. 非实时任务用 Batch API

数据处理、内容生成、离线摘要、评测任务，只要不要求实时返回，就应考虑 Batch API。

4. 控制 Token 用量

保持系统提示词简洁并可缓存。
需要 JSON 时用结构化输出，避免冗长自然语言。
设置合理的 max_tokens，避免输出失控。

5. 把 Extended Thinking 当成预算选择

Claude 推理功能能提升质量，但输出和 thinking token 仍会影响成本。只有在质量提升值得额外 token 支出时再开启。

选哪个 Claude 模型？

你的需求	推荐模型	每天 100 万输入 + 50 万输出月费
canonical 表中最高 Claude 能力	Opus 4.8	$525
产品级质量与成本平衡	Sonnet 4.6	$315
高吞吐 Claude 分流	Haiku 4.5	$105
最低价文本替代	DeepSeek V4 Flash	$8.40

总结

Claude 2026 年仍然是高端 API，但当前官方文档比旧版 3 月文章更清楚，也更有利：Opus 4.8 和 Sonnet 4.6 的 1M 上下文按标准每 token 价格计费。多数团队应以 Sonnet 4.6 + Prompt Caching 为默认方案，用 Haiku 4.5 做低成本分流，把 Opus 留给真正值得高价处理的请求。

已核对官方来源：Anthropic pricing 和 Anthropic models overview。

相关工具：

AI 模型定价计算器 — 多模型成本对比
AI Token 计算器 — 请求前估算 token
AI Coding Agent 成本对比 2026 — Codex、Claude Code、Cursor、DeepSeek 和 API 路由成本
DeepSeek API 价格指南 — Claude 的低价替代方案
OpenAI API 定价指南 2026 — GPT 定价和批量折扣
Google Gemini API 定价指南 2026 — Gemini 定价、免费层和长上下文
AI API 价格对比 2026 — 全部厂商对比