返回全部对比

OpenAI API

按量计费·1M 上下文

GPT-5.5 / 5.4 旗舰 API,按 token 计费;与 ChatGPT 订阅额度独立,需单独开通 platform.openai.com

Token API
订阅套餐Token API
官网

核心模型

GPT-5.5GPT-5.4GPT-5.4 miniGPT-Image-2GPT-Realtime-2GPT-Realtime-TranslateGPT-Realtime-Whisper
GPT-5.5

API 旗舰(gpt-5.5):Standard 输入 $5、输出 $30 / 百万 tokens,1M 上下文,支持 xhigh reasoning 与全套 Agent 工具,是复杂编码与专业任务默认首选。

GPT-5.4

更实惠的专业模型(gpt-5.4):输入 $2.50、输出 $15 / 百万 tokens,1M 上下文,能力与成本平衡,适合作为生产主力。

GPT-5.4 mini

最强 mini(gpt-5.4-mini):输入 $0.75、输出 $4.50 / 百万 tokens,400K 上下文,低延迟低成本,适合子 Agent 与大量轻量请求。

GPT-Image-2

最新图像生成/编辑 API,按图像与文本 modality 分别 token 计费(图像输出 $30/M 等),用于 images/generations 与 images/edits 端点。

GPT-Realtime-2

openai.com/api/pricing 当前最强实时语音模型,文本/音频/图像多 modality 分别定价,经 v1/realtime 提供低延迟语音对话。

更多模型详情请查看官网

其余核心模型名称仍在上方展示,完整说明以官网最新页面为准。

前往官网

套餐详情

GPT-5.5

旗舰推理推荐
输入价格
$5
输出价格
$30
官网
用量
model id 为 gpt-5.5,当前 API 旗舰:Standard 输入 $5 / 百万 tokens、输出 $30 / 百万 tokens,1M 上下文、最大 128K 输出,适合复杂推理、专业编码与多步 Agent。
模型
支持 reasoning.effort(none / low / medium / high / xhigh)、Functions、Web search、File search、Computer use、Code interpreter 等工具;可通过 Chat Completions 或 Responses API 调用。
特点
缓存命中输入仅 $0.50 / 百万 tokens;长上下文 >272K 输入时整段会话按更高倍率计费,重复前缀场景务必启用 Prompt caching。
适合把 OpenAI 当核心生产底座的复杂应用、Codex 类编码 Agent、长文档分析与高 stakes 知识工作流。
适合人群
复杂推理与编码任务、生产级 Agent 系统、需要最强 API 能力的开发者

GPT-5.4

高性价比旗舰
输入价格
$2.50
输出价格
$15
官网
用量
model id 为 gpt-5.4,定位「更实惠的专业工作模型」:输入 $2.50 / 百万 tokens、输出 $15 / 百万 tokens,1M 上下文,能力与成本介于 5.5 与 mini 之间。
模型
同样支持 Functions、Web search、File search、Computer use 等工具链,适合大量生产请求中需要较强能力但希望控制单价的场景。
特点
缓存命中输入 $0.25 / 百万 tokens,Batch API 可再享约 50% 折扣,适合离线批处理与可延迟任务。
若 GPT-5.5 单价偏高而 mini 能力不够,5.4 通常是 API 侧的主力平衡点。
适合人群
中等复杂度生产调用、需要 1M 上下文但希望比 5.5 更省成本的团队

GPT-5.4 mini

高速低成本
输入价格
$0.75
输出价格
$4.50
官网
用量
model id 为 gpt-5.4-mini,当前最强 mini 档:输入 $0.75 / 百万 tokens、输出 $4.50 / 百万 tokens,400K 上下文,面向编码、Computer use 与子 Agent。
模型
延迟更低、单价更省,适合高频轻量补全、路由前置分类、批量格式化与成本敏感的大量 API 调用。
特点
缓存命中输入可低至 $0.075 / 百万 tokens;官方文档亦推荐需要更低延迟与成本时优先选 mini 或 nano 变体。
适合子 Agent、工具链中的中间步骤、以及「先跑 mini、难题再升 5.5」的分层架构。
适合人群
高频批量调用、子 Agent、成本敏感的生产补全与轻量推理

GPT-Image-2

图像生成
输入价格
$8
输出价格
$30
官网
用量
GPT-Image-2 是官方最新图像生成与编辑模型,图像 modality 输入 $8 / 百万 tokens、输出 $30 / 百万 tokens,文本输入 $5 / 百万 tokens(均有缓存命中价)。
模型
通过 v1/images/generations 与 v1/images/edits 等端点调用,适合应用内出图、广告素材与多模态工作流,不能简单套用纯 chat 的输入/输出单价。
特点
图像 token 化计费,实际单张成本取决于分辨率与提示复杂度;上线前应用 Playground 或小额测试估算。
适合人群
需要官方图像生成/编辑 API 的产品与创意工作流

GPT-Realtime-2

实时语音
输入价格
$4
输出价格
$24
官网
用量
GPT-Realtime-2 面向实时语音交互,文本输入 $4 / 百万 tokens、输出 $24 / 百万 tokens;音频输入 $32 / 百万、输出 $64 / 百万;图像输入 $5 / 百万(均有缓存价)。
模型
通过 v1/realtime 会话接入,适合语音助手、客服与低延迟对话产品;成本需按音频时长与文本比例综合估算。
特点
与纯文本 chat 模型计费口径不同,选型时应单独对比 Realtime 与「Transcribe + chat + TTS」组合方案的总成本。
适合人群
实时语音产品、低延迟对话与多模态语音助手开发者

GPT-Realtime-Translate

同声传译
输入价格
$0.034
输出价格
分钟
官网
用量
GPT-Realtime-Translate 提供实时语音同声传译,按 $0.034 / 分钟($0.00057 / 秒)计费,适合会议、直播与跨语言客服场景。
模型
不走传统输入/输出 token 单价,而是按音频时长计费;长时运行场景应提前估算分钟级成本。
适合人群
实时口译、跨语言会议与直播同传产品

GPT-Realtime-Whisper

流式转写
输入价格
$0.017
输出价格
分钟
官网
用量
GPT-Realtime-Whisper 提供流式语音转文字,按 $0.017 / 分钟($0.00028 / 秒)计费,说话内容随讲随出文本。
模型
适合实时字幕、会议记录与语音输入链路;与 GPT-4o Transcribe 等批式转写模型定位不同,按场景选型。
适合人群
实时字幕、会议听写与低延迟语音输入应用

注意事项

  • 下列价格为 Standard 处理、上下文 <270K 的刊例价;Batch API 输入/输出约半价;Data residency 区域处理对 GPT-5.5 加收 10%。GPT-5.5 输入 >272K tokens 时整段会话输入 2x、输出 1.5x。
  • Prompt 缓存命中价:GPT-5.5 输入 $0.50/M、GPT-5.4 $0.25/M、GPT-5.4 mini $0.075/M;重复 system prompt 与长前缀场景应设计缓存以降本。
  • Web Search 工具 $10 / 千次调用(搜索内容 tokens 免费);Containers 按容器规格计费(2026/03/31 起改为按 20 分钟会话计费)。
  • ChatGPT Plus / Business / Enterprise 订阅不包含标准 API 用量;Playground 与生产 API 共用余额,按 dashboard 用量报表结算。

支持的编程工具

OpenAI APIResponses APIChat CompletionsCodex CLICursorCline

价格与模型数据均来源于厂商官方网站

常见问题

常见问题
7