OpenAI API

按量计费·1M 上下文

GPT-5.5 / 5.4 旗舰 API，按 token 计费；与 ChatGPT 订阅额度独立，需单独开通 platform.openai.com

Token API

订阅套餐Token API

官网

核心模型

GPT-5.5GPT-5.4GPT-5.4 miniGPT-Image-2GPT-Realtime-2GPT-Realtime-TranslateGPT-Realtime-Whisper

GPT-5.5

API 旗舰（gpt-5.5）：Standard 输入 $5、输出 $30 / 百万 tokens，1M 上下文，支持 xhigh reasoning 与全套 Agent 工具，是复杂编码与专业任务默认首选。

GPT-5.4

更实惠的专业模型（gpt-5.4）：输入 $2.50、输出 $15 / 百万 tokens，1M 上下文，能力与成本平衡，适合作为生产主力。

GPT-5.4 mini

最强 mini（gpt-5.4-mini）：输入 $0.75、输出 $4.50 / 百万 tokens，400K 上下文，低延迟低成本，适合子 Agent 与大量轻量请求。

GPT-Image-2

最新图像生成/编辑 API，按图像与文本 modality 分别 token 计费（图像输出 $30/M 等），用于 images/generations 与 images/edits 端点。

GPT-Realtime-2

openai.com/api/pricing 当前最强实时语音模型，文本/音频/图像多 modality 分别定价，经 v1/realtime 提供低延迟语音对话。

更多模型详情请查看官网

其余核心模型名称仍在上方展示，完整说明以官网最新页面为准。

前往官网

套餐详情

GPT-5.5

旗舰推理推荐

输入价格

输出价格

$30

官网

GPT-5.5

旗舰推理推荐

输入价格

输出价格

$30

官网

用量

model id 为 gpt-5.5，当前 API 旗舰：Standard 输入 $5 / 百万 tokens、输出 $30 / 百万 tokens，1M 上下文、最大 128K 输出，适合复杂推理、专业编码与多步 Agent。

模型

支持 reasoning.effort（none / low / medium / high / xhigh）、Functions、Web search、File search、Computer use、Code interpreter 等工具；可通过 Chat Completions 或 Responses API 调用。

特点

缓存命中输入仅 $0.50 / 百万 tokens；长上下文 >272K 输入时整段会话按更高倍率计费，重复前缀场景务必启用 Prompt caching。
适合把 OpenAI 当核心生产底座的复杂应用、Codex 类编码 Agent、长文档分析与高 stakes 知识工作流。

适合人群

复杂推理与编码任务、生产级 Agent 系统、需要最强 API 能力的开发者

GPT-5.4

高性价比旗舰

输入价格

$2.50

输出价格

$15

官网

GPT-5.4

高性价比旗舰

输入价格

$2.50

输出价格

$15

官网

用量

model id 为 gpt-5.4，定位「更实惠的专业工作模型」：输入 $2.50 / 百万 tokens、输出 $15 / 百万 tokens，1M 上下文，能力与成本介于 5.5 与 mini 之间。

模型

同样支持 Functions、Web search、File search、Computer use 等工具链，适合大量生产请求中需要较强能力但希望控制单价的场景。

特点

缓存命中输入 $0.25 / 百万 tokens，Batch API 可再享约 50% 折扣，适合离线批处理与可延迟任务。
若 GPT-5.5 单价偏高而 mini 能力不够，5.4 通常是 API 侧的主力平衡点。

适合人群

中等复杂度生产调用、需要 1M 上下文但希望比 5.5 更省成本的团队

GPT-5.4 mini

高速低成本

输入价格

$0.75

输出价格

$4.50

官网

GPT-5.4 mini

高速低成本

输入价格

$0.75

输出价格

$4.50

官网

用量

model id 为 gpt-5.4-mini，当前最强 mini 档：输入 $0.75 / 百万 tokens、输出 $4.50 / 百万 tokens，400K 上下文，面向编码、Computer use 与子 Agent。

模型

延迟更低、单价更省，适合高频轻量补全、路由前置分类、批量格式化与成本敏感的大量 API 调用。

特点

缓存命中输入可低至 $0.075 / 百万 tokens；官方文档亦推荐需要更低延迟与成本时优先选 mini 或 nano 变体。
适合子 Agent、工具链中的中间步骤、以及「先跑 mini、难题再升 5.5」的分层架构。

适合人群

高频批量调用、子 Agent、成本敏感的生产补全与轻量推理

GPT-Image-2

图像生成

输入价格

输出价格

$30

官网

GPT-Image-2

图像生成

输入价格

输出价格

$30

官网

用量

GPT-Image-2 是官方最新图像生成与编辑模型，图像 modality 输入 $8 / 百万 tokens、输出 $30 / 百万 tokens，文本输入 $5 / 百万 tokens（均有缓存命中价）。

模型

通过 v1/images/generations 与 v1/images/edits 等端点调用，适合应用内出图、广告素材与多模态工作流，不能简单套用纯 chat 的输入/输出单价。

特点

图像 token 化计费，实际单张成本取决于分辨率与提示复杂度；上线前应用 Playground 或小额测试估算。

适合人群

需要官方图像生成/编辑 API 的产品与创意工作流

GPT-Realtime-2

实时语音

输入价格

输出价格

$24

官网

GPT-Realtime-2

实时语音

输入价格

输出价格

$24

官网

用量

GPT-Realtime-2 面向实时语音交互，文本输入 $4 / 百万 tokens、输出 $24 / 百万 tokens；音频输入 $32 / 百万、输出 $64 / 百万；图像输入 $5 / 百万（均有缓存价）。

模型

通过 v1/realtime 会话接入，适合语音助手、客服与低延迟对话产品；成本需按音频时长与文本比例综合估算。

特点

与纯文本 chat 模型计费口径不同，选型时应单独对比 Realtime 与「Transcribe + chat + TTS」组合方案的总成本。

适合人群

实时语音产品、低延迟对话与多模态语音助手开发者

GPT-Realtime-Translate

同声传译

输入价格

$0.034

输出价格

分钟

官网

GPT-Realtime-Translate

同声传译

输入价格

$0.034

输出价格

分钟

官网

用量

GPT-Realtime-Translate 提供实时语音同声传译，按 $0.034 / 分钟（$0.00057 / 秒）计费，适合会议、直播与跨语言客服场景。

模型

不走传统输入/输出 token 单价，而是按音频时长计费；长时运行场景应提前估算分钟级成本。

适合人群

实时口译、跨语言会议与直播同传产品

GPT-Realtime-Whisper

流式转写

输入价格

$0.017

输出价格

分钟

官网

GPT-Realtime-Whisper

流式转写

输入价格

$0.017

输出价格

分钟

官网

用量

GPT-Realtime-Whisper 提供流式语音转文字，按 $0.017 / 分钟（$0.00028 / 秒）计费，说话内容随讲随出文本。

模型

适合实时字幕、会议记录与语音输入链路；与 GPT-4o Transcribe 等批式转写模型定位不同，按场景选型。

适合人群

实时字幕、会议听写与低延迟语音输入应用

注意事项

下列价格为 Standard 处理、上下文 <270K 的刊例价；Batch API 输入/输出约半价；Data residency 区域处理对 GPT-5.5 加收 10%。GPT-5.5 输入 >272K tokens 时整段会话输入 2x、输出 1.5x。
Prompt 缓存命中价：GPT-5.5 输入 $0.50/M、GPT-5.4 $0.25/M、GPT-5.4 mini $0.075/M；重复 system prompt 与长前缀场景应设计缓存以降本。
Web Search 工具 $10 / 千次调用（搜索内容 tokens 免费）；Containers 按容器规格计费（2026/03/31 起改为按 20 分钟会话计费）。
ChatGPT Plus / Business / Enterprise 订阅不包含标准 API 用量；Playground 与生产 API 共用余额，按 dashboard 用量报表结算。

支持的编程工具

OpenAI APIResponses APIChat CompletionsCodex CLICursorCline

价格与模型数据均来源于厂商官方网站

常见问题

常见问题·7

常见问题

7 条