OpenAI API 价格 2026：GPT-5.5、GPT-5.4、Codex、GPT-5 每百万 Token 成本

OpenAI API 价格最适合按每 100 万 token 来看。对开发者工作负载来说，当前实用候选是：GPT-5.5 处理最难的代码和 Agent 任务，GPT-5.4 处理更低成本的前沿能力，GPT-5.3-Codex 处理专门的 Coding Agent API 流程，GPT-5/GPT-4o/o3 系列则用于兼容旧集成或专门路由。

这篇文章只更新最容易过期的事实：模型名称、token 价格、上下文窗口、处理模式和速率限制口径。生产迁移前，请以你自己的 OpenAI Dashboard 可见模型和限制为准。

快速答案：OpenAI API 每百万 Token 价格

模型	输入	缓存输入	输出	适合场景
GPT-5.5	$5.00	$0.50	$30.00	高难度代码、Agent、长上下文专业任务
GPT-5.4	$2.50	$0.25	$15.00	更低成本的前沿模型
GPT-5.3-Codex	$1.75	$0.175	$14.00	专门的 Codex API 编码 Agent 任务
GPT-5	$1.25	-	$10.00	已有 GPT-5 集成
GPT-5 Mini	$0.25	-	$2.00	成本敏感的生产分流
GPT-4o mini	$0.15	-	$0.60	旧版低价多模态任务

如果一个 Coding Agent 每月使用 200 万输入 token + 50 万输出 token，未计算缓存、Batch/Flex 前，粗略成本约为：GPT-5.5 $25、GPT-5.4 $12.50、GPT-5.3-Codex $10.50、GPT-5 $7.50。精确成本请用 AI 模型定价计算器。

OpenAI API 价格表（2026 年 6 月）

价格单位：美元 / 百万 token。对最新 GPT-5.5 和 GPT-5.4 模型，OpenAI 官方价格表区分短上下文和长上下文；长上下文大约从 270K 输入 token 以上开始使用更高价格。

模型	标准输入	缓存输入	标准输出	长上下文输入	长上下文输出	上下文	最大输出	适合场景
GPT-5.5	$5.00	$0.50	$30.00	$10.00	$45.00	1M	128K	高难度代码、Agent、专业工作
GPT-5.5 Pro	$30.00	-	$180.00	$60.00	$270.00	1M	128K	最高准确率任务
GPT-5.4	$2.50	$0.25	$15.00	$5.00	$22.50	1M	128K	更低成本的前沿模型
GPT-5.4 mini	$0.75	$0.075	$4.50	-	-	400K	128K	低延迟、低成本生产流量
GPT-5.4 nano	$0.20	$0.02	$1.25	-	-	见官方文档	见官方文档	高频简单任务
GPT-5.3-Codex	$1.75	$0.175	$14.00	-	-	400K	128K	专门的 Codex API Agent 任务

来源：OpenAI API pricing 和 OpenAI models。

本站模型库中的兼容模型

DevTk.AI 的 canonical 模型表也保留了这些 OpenAI 系列，主要用于旧项目兼容和历史价格对比：

模型	输入	输出	上下文	最大输出	适合场景
GPT-5	$1.25	$10.00	400K	128K	已经部署的 GPT-5 基线
GPT-5 Mini	$0.25	$2.00	400K	128K	成本敏感的 GPT-5 系列任务
GPT-5 Nano	$0.05	$0.40	400K	128K	极高频路由、抽取
GPT-4o	$2.50	$10.00	128K	16K	已弃用的多模态集成
GPT-4o mini	$0.15	$0.60	128K	16K	旧版低价多模态集成
o3-pro	$20.00	$80.00	200K	100K	最高成本推理任务
o3	$2.00	$8.00	200K	100K	标准推理任务
o3-mini	$1.10	$4.40	200K	100K	低成本推理

这些条目维护在 src/data/models.ts。如果要写进合同、报价单或客户文档，请再次核对 OpenAI 实时价格页。

Batch、Flex、Priority 和数据驻留

OpenAI 现在按处理模式展示最新 GPT-5.5 / GPT-5.4 系列价格：

模式	价格口径	适合场景
Standard	标准公开 token 价格	实时生产请求
Batch	标准价的 50%	可异步处理的离线任务
Flex	标准价的 50%	可接受可变延迟的低成本任务
Priority	已列模型按标准价 2.5x	对延迟敏感的生产高峰
Data residency / regional processing	已列 GPT-5.5 / GPT-5.4 模型加价 10%	有区域处理要求的工作负载

Batch 和 Flex 会把 GPT-5.5 短上下文标准价从 $5/$30 降到 $2.50/$15；Priority 则会把 GPT-5.5 短上下文价格提高到 $12.50/$75。

速率限制和使用层级

不要把固定 RPM 或 TPM 表写进长期规划。OpenAI 官方文档说明：速率限制按组织和项目设置，不按单个用户设置；限制会随模型变化；某些模型族共享限制；长上下文请求可能有单独限制。

OpenAI 还区分 rate limits 和每月 usage limits。API 消费增加后，账号可能自动升到更高 usage tier，但你组织的具体限制应该从 OpenAI Dashboard 读取。

规划时重点看：

RPM、RPD、TPM、TPD，以及图像场景下的 IPM。
长上下文工作负载单独规划，因为可能使用单独限制。
先确认 shared limit 分组，不要假设相关模型 ID 一定有独立额度。
Batch 队列也有限制；排队中的 token 会计入限制，直到 batch 完成。

来源：OpenAI rate limits and usage tiers。

月度成本估算

下面示例使用当前 GPT-5.5 / GPT-5.4 官方短上下文标准价；标注 Batch/Flex 的项目使用半价。

个人开发者

每月 300 万输入 + 150 万输出 token。

模型	月费
GPT-5.4 nano	$2.48
GPT-5.4 mini	$9.00
GPT-5.4	$30.00
GPT-5.5	$60.00
GPT-5.5 Batch/Flex	$30.00

初创团队

每月 3000 万输入 + 1500 万输出 token。

模型	月费
GPT-5.4 nano	$24.75
GPT-5.4 mini	$90.00
GPT-5.4	$300.00
GPT-5.5	$600.00
GPT-5.5 Batch/Flex	$300.00

生产规模

每月 3 亿输入 + 1.5 亿输出 token。

模型	月费
GPT-5.4 nano	$247.50
GPT-5.4 mini	$900.00
GPT-5.4	$3,000.00
GPT-5.5	$6,000.00
GPT-5.5 Batch/Flex	$3,000.00

GPT-5.5、GPT-5.5 Pro 和 GPT-5.4 在超过长上下文阈值后价格更高。预算大型文档、代码仓库或 RAG 工作流前，先用 token 计算器跑真实 prompt。

精确计算你的成本： 使用 AI 模型定价计算器。

各模型怎么选

GPT-5.5：高难度生产任务

质量比 token 单价更重要时，从 GPT-5.5 开始评估：代码 Agent、工具密集工作流、带证据的助手、长上下文检索、产品需求到执行计划、对输出质感要求高的客户场景。

GPT-5.5 Pro：最高准确率、最高成本

只有当评测证明它的质量提升足以覆盖价格差异时才使用 GPT-5.5 Pro。它适合最难的专业任务，不适合普通流量。

GPT-5.4：更低成本的前沿模型

当 GPT-5.5 太贵，但你仍然需要 1M 上下文和前沿能力时，用 GPT-5.4 做主力候选。

GPT-5.4 Mini / Nano：默认路由目标

普通生产请求优先评估 GPT-5.4 mini。分类、抽取、打标签、路由、格式化等简单任务优先评估 GPT-5.4 nano。

GPT-5、GPT-4o、o3 系列：兼容和专用路由

如果迁移风险高于节省的成本，可以保留现有 GPT-5 或 GPT-4o 集成。数学、逻辑和复杂多步推理只在评测证明 o3 系列更好时再单独路由。

快速上手当前 API

新项目优先使用 Responses API，除非你已有 Chat Completions 集成。

from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="gpt-5.5",
    input="Review this API design and identify the highest-risk edge cases."
)

print(response.output_text)

低成本路由示例：

response = client.responses.create(
    model="gpt-5.4-mini",
    input="Extract company names, dates, and dollar amounts as JSON."
)

省钱清单

简单任务先路由到 mini 或 nano，再考虑 GPT-5.5。
可异步的任务用 Batch 或 Flex，把 token 单价降到一半。
保持可复用指令和参考材料稳定，提高 prompt caching 命中率。
把长上下文价格作为单独预算项。
设置输出上限和结构化格式，避免输出 token 失控。
从 OpenAI Dashboard 读取实际 rate limit 和 usage limit，不依赖静态博客表格。

总结

2026 年初的旧说法已经过期。到 2026 年 6 月，OpenAI API 定价的主线是：GPT-5.5 负责最高质量工作，GPT-5.4 负责更低成本的前沿能力，GPT-5.4 mini/nano 承担可路由的生产流量。

对大多数团队来说，实用架构是：日常任务走 GPT-5.4 mini 或 nano，高质量长上下文任务走 GPT-5.4，只有结果质量会显著改变业务 outcome 的工作才升级到 GPT-5.5；所有不需要实时响应的任务都走 Batch 或 Flex。

OpenAI 官方参考：

相关资源：