OpenAI API 价格 2026:GPT-5.5、GPT-5.4、Codex、GPT-5 每百万 Token 成本
OpenAI API 每百万 token 价格:GPT-5.5、GPT-5.4、GPT-5.2-Codex、GPT-5、GPT-4o、o3,含缓存输入、Batch/Flex 折扣、长上下文价格和 Coding Agent 成本示例。
OpenAI API 价格最适合按每 100 万 token 来看。对开发者工作负载来说,当前实用候选是:GPT-5.5 处理最难的代码和 Agent 任务,GPT-5.4 处理更低成本的前沿能力,GPT-5.2-Codex 处理专门的 Coding Agent API 流程,GPT-5/GPT-4o/o3 系列则用于兼容旧集成或专门路由。
这篇文章只更新最容易过期的事实:模型名称、token 价格、上下文窗口、处理模式和速率限制口径。生产迁移前,请以你自己的 OpenAI Dashboard 可见模型和限制为准。
快速答案:OpenAI API 每百万 Token 价格
| 模型 | 输入 | 缓存输入 | 输出 | 适合场景 |
|---|---|---|---|---|
| GPT-5.5 | $5.00 | $0.50 | $30.00 | 高难度代码、Agent、长上下文专业任务 |
| GPT-5.4 | $2.50 | $0.25 | $15.00 | 更低成本的前沿模型 |
| GPT-5.2-Codex | $1.75 | $0.175 | $14.00 | 专门的 Codex API 编码 Agent 任务 |
| GPT-5 | $1.25 | - | $10.00 | 已有 GPT-5 集成 |
| GPT-5 Mini | $0.25 | - | $2.00 | 成本敏感的生产分流 |
| GPT-4o mini | $0.15 | - | $0.60 | 旧版低价多模态任务 |
如果一个 Coding Agent 每月使用 200 万输入 token + 50 万输出 token,未计算缓存、Batch/Flex 前,粗略成本约为:GPT-5.5 $25、GPT-5.4 $12.50、GPT-5.2-Codex $10.50、GPT-5 $7.50。精确成本请用 AI 模型定价计算器。
OpenAI API 价格表(2026 年 5 月)
价格单位:美元 / 百万 token。对最新 GPT-5.5 和 GPT-5.4 模型,OpenAI 官方价格表区分短上下文和长上下文;长上下文大约从 270K 输入 token 以上开始使用更高价格。
| 模型 | 标准输入 | 缓存输入 | 标准输出 | 长上下文输入 | 长上下文输出 | 上下文 | 最大输出 | 适合场景 |
|---|---|---|---|---|---|---|---|---|
| GPT-5.5 | $5.00 | $0.50 | $30.00 | $10.00 | $45.00 | 1M | 128K | 高难度代码、Agent、专业工作 |
| GPT-5.5 Pro | $30.00 | - | $180.00 | $60.00 | $270.00 | 1M | 128K | 最高准确率任务 |
| GPT-5.4 | $2.50 | $0.25 | $15.00 | $5.00 | $22.50 | 1M | 128K | 更低成本的前沿模型 |
| GPT-5.4 mini | $0.75 | $0.075 | $4.50 | - | - | 400K | 128K | 低延迟、低成本生产流量 |
| GPT-5.4 nano | $0.20 | $0.02 | $1.25 | - | - | 见官方文档 | 见官方文档 | 高频简单任务 |
| GPT-5.2-Codex | $1.75 | $0.175 | $14.00 | - | - | 400K | 128K | 专门的 Codex API Agent 任务 |
来源:OpenAI API pricing 和 OpenAI models。
本站模型库中的兼容模型
DevTk.AI 的 canonical 模型表也保留了这些 OpenAI 系列,主要用于旧项目兼容和历史价格对比:
| 模型 | 输入 | 输出 | 上下文 | 最大输出 | 适合场景 |
|---|---|---|---|---|---|
| GPT-5 | $1.25 | $10.00 | 400K | 128K | 已经部署的 GPT-5 基线 |
| GPT-5 Mini | $0.25 | $2.00 | 400K | 16K | 成本敏感的 GPT-5 系列任务 |
| GPT-5 Nano | $0.05 | $0.40 | 128K | 16K | 极高频路由、抽取 |
| GPT-4o | $2.50 | $10.00 | 128K | 16K | 旧版多模态集成 |
| GPT-4o mini | $0.15 | $0.60 | 128K | 16K | 旧版低价多模态集成 |
| o3-pro | $20.00 | $80.00 | 200K | 100K | 最高成本推理任务 |
| o3 | $2.00 | $8.00 | 200K | 100K | 标准推理任务 |
| o3-mini | $1.10 | $4.40 | 200K | 100K | 低成本推理 |
这些条目维护在 src/data/models.ts。如果要写进合同、报价单或客户文档,请再次核对 OpenAI 实时价格页。
Batch、Flex、Priority 和数据驻留
OpenAI 现在按处理模式展示最新 GPT-5.5 / GPT-5.4 系列价格:
| 模式 | 价格口径 | 适合场景 |
|---|---|---|
| Standard | 标准公开 token 价格 | 实时生产请求 |
| Batch | 标准价的 50% | 可异步处理的离线任务 |
| Flex | 标准价的 50% | 可接受可变延迟的低成本任务 |
| Priority | 已列模型按标准价 2.5x | 对延迟敏感的生产高峰 |
| Data residency / regional processing | 已列 GPT-5.5 / GPT-5.4 模型加价 10% | 有区域处理要求的工作负载 |
Batch 和 Flex 会把 GPT-5.5 短上下文标准价从 $5/$30 降到 $2.50/$15;Priority 则会把 GPT-5.5 短上下文价格提高到 $12.50/$75。
速率限制和使用层级
不要把固定 RPM 或 TPM 表写进长期规划。OpenAI 官方文档说明:速率限制按组织和项目设置,不按单个用户设置;限制会随模型变化;某些模型族共享限制;长上下文请求可能有单独限制。
OpenAI 还区分 rate limits 和每月 usage limits。API 消费增加后,账号可能自动升到更高 usage tier,但你组织的具体限制应该从 OpenAI Dashboard 读取。
规划时重点看:
- RPM、RPD、TPM、TPD,以及图像场景下的 IPM。
- 长上下文工作负载单独规划,因为可能使用单独限制。
- 先确认 shared limit 分组,不要假设相关模型 ID 一定有独立额度。
- Batch 队列也有限制;排队中的 token 会计入限制,直到 batch 完成。
来源:OpenAI rate limits and usage tiers。
月度成本估算
下面示例使用当前 GPT-5.5 / GPT-5.4 官方短上下文标准价;标注 Batch/Flex 的项目使用半价。
个人开发者
每月 300 万输入 + 150 万输出 token。
| 模型 | 月费 |
|---|---|
| GPT-5.4 nano | $2.48 |
| GPT-5.4 mini | $9.00 |
| GPT-5.4 | $30.00 |
| GPT-5.5 | $60.00 |
| GPT-5.5 Batch/Flex | $30.00 |
初创团队
每月 3000 万输入 + 1500 万输出 token。
| 模型 | 月费 |
|---|---|
| GPT-5.4 nano | $24.75 |
| GPT-5.4 mini | $90.00 |
| GPT-5.4 | $300.00 |
| GPT-5.5 | $600.00 |
| GPT-5.5 Batch/Flex | $300.00 |
生产规模
每月 3 亿输入 + 1.5 亿输出 token。
| 模型 | 月费 |
|---|---|
| GPT-5.4 nano | $247.50 |
| GPT-5.4 mini | $900.00 |
| GPT-5.4 | $3,000.00 |
| GPT-5.5 | $6,000.00 |
| GPT-5.5 Batch/Flex | $3,000.00 |
GPT-5.5、GPT-5.5 Pro 和 GPT-5.4 在超过长上下文阈值后价格更高。预算大型文档、代码仓库或 RAG 工作流前,先用 token 计算器跑真实 prompt。
精确计算你的成本: 使用 AI 模型定价计算器。
各模型怎么选
GPT-5.5:高难度生产任务
质量比 token 单价更重要时,从 GPT-5.5 开始评估:代码 Agent、工具密集工作流、带证据的助手、长上下文检索、产品需求到执行计划、对输出质感要求高的客户场景。
GPT-5.5 Pro:最高准确率、最高成本
只有当评测证明它的质量提升足以覆盖价格差异时才使用 GPT-5.5 Pro。它适合最难的专业任务,不适合普通流量。
GPT-5.4:更低成本的前沿模型
当 GPT-5.5 太贵,但你仍然需要 1M 上下文和前沿能力时,用 GPT-5.4 做主力候选。
GPT-5.4 Mini / Nano:默认路由目标
普通生产请求优先评估 GPT-5.4 mini。分类、抽取、打标签、路由、格式化等简单任务优先评估 GPT-5.4 nano。
GPT-5、GPT-4o、o3 系列:兼容和专用路由
如果迁移风险高于节省的成本,可以保留现有 GPT-5 或 GPT-4o 集成。数学、逻辑和复杂多步推理只在评测证明 o3 系列更好时再单独路由。
快速上手当前 API
新项目优先使用 Responses API,除非你已有 Chat Completions 集成。
from openai import OpenAI
client = OpenAI()
response = client.responses.create(
model="gpt-5.5",
input="Review this API design and identify the highest-risk edge cases."
)
print(response.output_text)
低成本路由示例:
response = client.responses.create(
model="gpt-5.4-mini",
input="Extract company names, dates, and dollar amounts as JSON."
)
省钱清单
- 简单任务先路由到 mini 或 nano,再考虑 GPT-5.5。
- 可异步的任务用 Batch 或 Flex,把 token 单价降到一半。
- 保持可复用指令和参考材料稳定,提高 prompt caching 命中率。
- 把长上下文价格作为单独预算项。
- 设置输出上限和结构化格式,避免输出 token 失控。
- 从 OpenAI Dashboard 读取实际 rate limit 和 usage limit,不依赖静态博客表格。
总结
2026 年初的旧说法已经过期。到 2026 年 5 月,OpenAI API 定价的主线是:GPT-5.5 负责最高质量工作,GPT-5.4 负责更低成本的前沿能力,GPT-5.4 mini/nano 承担可路由的生产流量。
对大多数团队来说,实用架构是:日常任务走 GPT-5.4 mini 或 nano,高质量长上下文任务走 GPT-5.4,只有结果质量会显著改变业务 outcome 的工作才升级到 GPT-5.5;所有不需要实时响应的任务都走 Batch 或 Flex。
OpenAI 官方参考:
相关资源: