DevTk.AI
OpenAI API 定价GPT-5.5 价格GPT-5.2 Codex 价格ChatGPT APIAPI 成本模型对比

OpenAI API 价格 2026:GPT-5.5、GPT-5.4、Codex、GPT-5 每百万 Token 成本

OpenAI API 每百万 token 价格:GPT-5.5、GPT-5.4、GPT-5.2-Codex、GPT-5、GPT-4o、o3,含缓存输入、Batch/Flex 折扣、长上下文价格和 Coding Agent 成本示例。

DevTk.AI 2026-02-24 更新于 2026-05-07 12 分钟阅读

OpenAI API 价格最适合按每 100 万 token 来看。对开发者工作负载来说,当前实用候选是:GPT-5.5 处理最难的代码和 Agent 任务,GPT-5.4 处理更低成本的前沿能力,GPT-5.2-Codex 处理专门的 Coding Agent API 流程,GPT-5/GPT-4o/o3 系列则用于兼容旧集成或专门路由。

这篇文章只更新最容易过期的事实:模型名称、token 价格、上下文窗口、处理模式和速率限制口径。生产迁移前,请以你自己的 OpenAI Dashboard 可见模型和限制为准。

快速答案:OpenAI API 每百万 Token 价格

模型输入缓存输入输出适合场景
GPT-5.5$5.00$0.50$30.00高难度代码、Agent、长上下文专业任务
GPT-5.4$2.50$0.25$15.00更低成本的前沿模型
GPT-5.2-Codex$1.75$0.175$14.00专门的 Codex API 编码 Agent 任务
GPT-5$1.25-$10.00已有 GPT-5 集成
GPT-5 Mini$0.25-$2.00成本敏感的生产分流
GPT-4o mini$0.15-$0.60旧版低价多模态任务

如果一个 Coding Agent 每月使用 200 万输入 token + 50 万输出 token,未计算缓存、Batch/Flex 前,粗略成本约为:GPT-5.5 $25GPT-5.4 $12.50GPT-5.2-Codex $10.50GPT-5 $7.50。精确成本请用 AI 模型定价计算器

OpenAI API 价格表(2026 年 5 月)

价格单位:美元 / 百万 token。对最新 GPT-5.5 和 GPT-5.4 模型,OpenAI 官方价格表区分短上下文和长上下文;长上下文大约从 270K 输入 token 以上开始使用更高价格。

模型标准输入缓存输入标准输出长上下文输入长上下文输出上下文最大输出适合场景
GPT-5.5$5.00$0.50$30.00$10.00$45.001M128K高难度代码、Agent、专业工作
GPT-5.5 Pro$30.00-$180.00$60.00$270.001M128K最高准确率任务
GPT-5.4$2.50$0.25$15.00$5.00$22.501M128K更低成本的前沿模型
GPT-5.4 mini$0.75$0.075$4.50--400K128K低延迟、低成本生产流量
GPT-5.4 nano$0.20$0.02$1.25--见官方文档见官方文档高频简单任务
GPT-5.2-Codex$1.75$0.175$14.00--400K128K专门的 Codex API Agent 任务

来源:OpenAI API pricingOpenAI models

本站模型库中的兼容模型

DevTk.AI 的 canonical 模型表也保留了这些 OpenAI 系列,主要用于旧项目兼容和历史价格对比:

模型输入输出上下文最大输出适合场景
GPT-5$1.25$10.00400K128K已经部署的 GPT-5 基线
GPT-5 Mini$0.25$2.00400K16K成本敏感的 GPT-5 系列任务
GPT-5 Nano$0.05$0.40128K16K极高频路由、抽取
GPT-4o$2.50$10.00128K16K旧版多模态集成
GPT-4o mini$0.15$0.60128K16K旧版低价多模态集成
o3-pro$20.00$80.00200K100K最高成本推理任务
o3$2.00$8.00200K100K标准推理任务
o3-mini$1.10$4.40200K100K低成本推理

这些条目维护在 src/data/models.ts。如果要写进合同、报价单或客户文档,请再次核对 OpenAI 实时价格页。

Batch、Flex、Priority 和数据驻留

OpenAI 现在按处理模式展示最新 GPT-5.5 / GPT-5.4 系列价格:

模式价格口径适合场景
Standard标准公开 token 价格实时生产请求
Batch标准价的 50%可异步处理的离线任务
Flex标准价的 50%可接受可变延迟的低成本任务
Priority已列模型按标准价 2.5x对延迟敏感的生产高峰
Data residency / regional processing已列 GPT-5.5 / GPT-5.4 模型加价 10%有区域处理要求的工作负载

Batch 和 Flex 会把 GPT-5.5 短上下文标准价从 $5/$30 降到 $2.50/$15;Priority 则会把 GPT-5.5 短上下文价格提高到 $12.50/$75。

速率限制和使用层级

不要把固定 RPM 或 TPM 表写进长期规划。OpenAI 官方文档说明:速率限制按组织和项目设置,不按单个用户设置;限制会随模型变化;某些模型族共享限制;长上下文请求可能有单独限制。

OpenAI 还区分 rate limits 和每月 usage limits。API 消费增加后,账号可能自动升到更高 usage tier,但你组织的具体限制应该从 OpenAI Dashboard 读取。

规划时重点看:

  • RPMRPDTPMTPD,以及图像场景下的 IPM
  • 长上下文工作负载单独规划,因为可能使用单独限制。
  • 先确认 shared limit 分组,不要假设相关模型 ID 一定有独立额度。
  • Batch 队列也有限制;排队中的 token 会计入限制,直到 batch 完成。

来源:OpenAI rate limits and usage tiers

月度成本估算

下面示例使用当前 GPT-5.5 / GPT-5.4 官方短上下文标准价;标注 Batch/Flex 的项目使用半价。

个人开发者

每月 300 万输入 + 150 万输出 token。

模型月费
GPT-5.4 nano$2.48
GPT-5.4 mini$9.00
GPT-5.4$30.00
GPT-5.5$60.00
GPT-5.5 Batch/Flex$30.00

初创团队

每月 3000 万输入 + 1500 万输出 token。

模型月费
GPT-5.4 nano$24.75
GPT-5.4 mini$90.00
GPT-5.4$300.00
GPT-5.5$600.00
GPT-5.5 Batch/Flex$300.00

生产规模

每月 3 亿输入 + 1.5 亿输出 token。

模型月费
GPT-5.4 nano$247.50
GPT-5.4 mini$900.00
GPT-5.4$3,000.00
GPT-5.5$6,000.00
GPT-5.5 Batch/Flex$3,000.00

GPT-5.5、GPT-5.5 Pro 和 GPT-5.4 在超过长上下文阈值后价格更高。预算大型文档、代码仓库或 RAG 工作流前,先用 token 计算器跑真实 prompt。

精确计算你的成本: 使用 AI 模型定价计算器

各模型怎么选

GPT-5.5:高难度生产任务

质量比 token 单价更重要时,从 GPT-5.5 开始评估:代码 Agent、工具密集工作流、带证据的助手、长上下文检索、产品需求到执行计划、对输出质感要求高的客户场景。

GPT-5.5 Pro:最高准确率、最高成本

只有当评测证明它的质量提升足以覆盖价格差异时才使用 GPT-5.5 Pro。它适合最难的专业任务,不适合普通流量。

GPT-5.4:更低成本的前沿模型

当 GPT-5.5 太贵,但你仍然需要 1M 上下文和前沿能力时,用 GPT-5.4 做主力候选。

GPT-5.4 Mini / Nano:默认路由目标

普通生产请求优先评估 GPT-5.4 mini。分类、抽取、打标签、路由、格式化等简单任务优先评估 GPT-5.4 nano。

GPT-5、GPT-4o、o3 系列:兼容和专用路由

如果迁移风险高于节省的成本,可以保留现有 GPT-5 或 GPT-4o 集成。数学、逻辑和复杂多步推理只在评测证明 o3 系列更好时再单独路由。

快速上手当前 API

新项目优先使用 Responses API,除非你已有 Chat Completions 集成。

from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="gpt-5.5",
    input="Review this API design and identify the highest-risk edge cases."
)

print(response.output_text)

低成本路由示例:

response = client.responses.create(
    model="gpt-5.4-mini",
    input="Extract company names, dates, and dollar amounts as JSON."
)

省钱清单

  • 简单任务先路由到 mini 或 nano,再考虑 GPT-5.5。
  • 可异步的任务用 Batch 或 Flex,把 token 单价降到一半。
  • 保持可复用指令和参考材料稳定,提高 prompt caching 命中率。
  • 把长上下文价格作为单独预算项。
  • 设置输出上限和结构化格式,避免输出 token 失控。
  • 从 OpenAI Dashboard 读取实际 rate limit 和 usage limit,不依赖静态博客表格。

总结

2026 年初的旧说法已经过期。到 2026 年 5 月,OpenAI API 定价的主线是:GPT-5.5 负责最高质量工作,GPT-5.4 负责更低成本的前沿能力,GPT-5.4 mini/nano 承担可路由的生产流量。

对大多数团队来说,实用架构是:日常任务走 GPT-5.4 mini 或 nano,高质量长上下文任务走 GPT-5.4,只有结果质量会显著改变业务 outcome 的工作才升级到 GPT-5.5;所有不需要实时响应的任务都走 Batch 或 Flex。

OpenAI 官方参考:

相关资源:

相关文章