Gemini API

按量计费·1M 上下文

Gemini 3.5 Flash / 3.1 Pro 官方 API，按 token 计费；与 gemini.google 消费者订阅额度独立

Token API

核心模型

Gemini 3.5 FlashGemini 3.1 ProGemini 3.1 Flash-LiteGemini 2.5 ProGemini 2.5 FlashGemini 3.1 Flash ImageGemini 3.1 Flash Live

Gemini 3.5 Flash

API 高速旗舰（gemini-3.5-flash）：$1.50 输入 / $9 输出 per MTok，frontier 智能 + search grounding，Free tier 可试用。

Gemini 3.1 Pro

API 最强 Pro 预览（gemini-3.1-pro-preview）：$2/$12 per MTok（≤200K），多模态 Agent 与 vibe-coding，Paid only。

Gemini 3.1 Flash-Lite

极致性价比（gemini-3.1-flash-lite）：$0.25/$1.50 per MTok，高 volume Agent 与翻译首选。

Gemini 2.5 Pro

上一代 Pro（gemini-2.5-pro）：$1.25/$10 per MTok（≤200K），编码与复杂推理；新集成优先 3.x 系列。

Gemini 3.1 Flash Image

图像生成 API（gemini-3.1-flash-image）：文本输入 $0.50/M，图像输出按分辨率计价（约 $0.045–$0.151/张），与纯 chat 计费分离。

更多模型详情请查看官网

其余核心模型名称仍在上方展示，完整说明以官网最新页面为准。

前往官网

套餐详情

Gemini 3.5 Flash

旗舰高速推荐

输入价格

$1.50

输出价格

官网

Gemini 3.5 Flash

旗舰高速推荐

输入价格

$1.50

输出价格

官网

用量

model id 为 gemini-3.5-flash，当前 API 主推的高速旗舰：Standard 输入 $1.50 / 百万 tokens、输出 $9 / 百万 tokens，结合前沿智能与 superior search / grounding。

模型

Free tier 在 AI Studio 可免费调用（有速率限制）；Paid tier 解锁更高 RPS、Context caching 与 Grounding with Google Search / Maps。

特点

Batch API 输入 $0.75/M、输出 $4.50/M；Flex 与 Priority 档分别 $0.75/$4.50 与 $2.70/$16.20 per MTok，适合延迟敏感与高峰吞吐场景。
适合需要搜索 grounding、快速 Agent 循环与日常生产 API 的默认选型；复杂多模态 Agent 可升 3.1 Pro。

适合人群

搜索 grounding Agent、高速生产 API、日常智能应用

Gemini 3.1 Pro

旗舰 Pro

输入价格

输出价格

$12

官网

Gemini 3.1 Pro

旗舰 Pro

输入价格

输出价格

$12

官网

用量

model id 为 gemini-3.1-pro-preview（及 customtools 变体），当前最强多模态理解 + Agent / vibe-coding 能力之一。

模型

Standard 计价：prompt ≤200K tokens 时输入 $2 / 输出 $12 per MTok；超过 200K 时输入 $4 / 输出 $18 per MTok。

特点

Paid tier only（Free tier 不可用）；支持 Context caching、Batch 半价与 Grounding；适合复杂代码库分析、长文档 Agent 与高自主性工作流。
与 gemini.google 订阅里的 3.1 Pro 是同一模型族，但 API 按 token 独立计费，不受 Plus / Pro / Ultra 用量倍数约束。

适合人群

复杂 Agent、长上下文多模态、vibe-coding 与 repo 级分析

Gemini 3.1 Flash-Lite

极致性价比

输入价格

$0.25

输出价格

$1.50

官网

Gemini 3.1 Flash-Lite

极致性价比

输入价格

$0.25

输出价格

$1.50

官网

用量

model id 为 gemini-3.1-flash-lite，官方定位最高性价比：Standard 文本/图像/视频输入 $0.25 / 百万 tokens、输出 $1.50 / 百万 tokens。

模型

优化高 volume Agent 任务、翻译与简单数据处理；Free tier 可免费调用，Paid 解锁 caching 与更高 RPS。

特点

Batch API 输入 $0.125/M、输出 $0.75/M；适合路由层、批量分类与成本敏感的大规模调用。
音频输入 Standard $0.50/M、Batch $0.25/M，集成语音场景时需单独估算。

适合人群

高并发轻量任务、翻译、路由与子 Agent

Gemini 2.5 Pro

上一代 Pro

输入价格

$1.25

输出价格

$10

官网

Gemini 2.5 Pro

上一代 Pro

输入价格

$1.25

输出价格

$10

官网

用量

model id 为 gemini-2.5-pro，上一代多用途旗舰，擅长编码与复杂推理；新集成优先 3.5 Flash / 3.1 Pro。

模型

Standard：prompt ≤200K 时 $1.25 输入 / $10 输出 per MTok；超过 200K 时 $2.50 / $15 per MTok。

特点

Free tier 可免费调用（有限制）；Grounding with Google Search 1,500 RPD 免费后 $35 / 千次 grounded prompts。
已有 2.5 Pro 集成的存量系统可继续计费运行，迁移计划应评估 3.1 Pro 的多模态 Agent 收益。

适合人群

存量 2.5 Pro 集成、编码与复杂推理（迁移中）

Gemini 2.5 Flash

混合推理

输入价格

$0.30

输出价格

$2.50

官网

Gemini 2.5 Flash

混合推理

输入价格

$0.30

输出价格

$2.50

官网

用量

model id 为 gemini-2.5-flash，首个支持 thinking budgets 的混合推理 Flash，1M token 上下文窗口。

模型

Standard 文本/图像/视频输入 $0.30 / 百万 tokens、输出 $2.50 / 百万 tokens；Free tier 可免费调用。

特点

Grounding with Google Search 与 Flash-Lite 共享 500 RPD（Free）/ 1,500 RPD（Paid）免费额度。
适合需要可控 thinking 深度、1M 上下文但不必上 3.5 Flash 价位的生产场景。

适合人群

1M 上下文、可控 thinking、中等成本生产 API

Gemini 3.1 Flash Image

图像生成

输入价格

$0.50

输出价格

$0.067

官网

Gemini 3.1 Flash Image

图像生成

输入价格

$0.50

输出价格

$0.067

官网

用量

model id 为 gemini-3.1-flash-image，面向高速交互式图像生成与编辑；Standard 文本/图像输入 $0.50 / 百万 tokens。

模型

图像输出按 token 计价（$60/M image tokens）：0.5K 约 $0.045/张、1K $0.067、2K $0.101、4K $0.151；与纯 chat API 计费口径不同。

特点

Batch API 输入 $0.25/M、图像输出 $30/M（约半价）；Paid tier only，适合高吞吐视觉生成流水线。

适合人群

图像生成、编辑与高吞吐视觉 API

Gemini 3.1 Flash Live

实时对话

输入价格

$0.75

输出价格

$4.50

官网

Gemini 3.1 Flash Live

实时对话

输入价格

$0.75

输出价格

$4.50

官网

用量

model id 为 gemini-3.1-flash-live-preview，低延迟 audio-to-audio 实时对话模型，支持声学细节、数值精度与多模态感知。

模型

Paid tier Standard：文本输入 $0.75 / 输出 $4.50 per MTok；音频输入 $3 或约 $0.005/min、输出 $12 或约 $0.018/min；图像/视频输入 $1 或约 $0.002/min。

特点

Free tier 可免费调用（有速率限制）；适合语音助手、实时翻译与 voice-first Agent，集成前需单独估算音频/视频分钟成本。

适合人群

实时语音对话、Live API 与 voice-first 应用

注意事项

下列价格为 Paid tier Standard 处理、USD / 百万 tokens；Free tier 在 AI Studio 对部分模型提供免费输入/输出额度（内容可能用于改进产品），生产环境应升级 Paid。
Gemini 3.1 Pro / 2.5 Pro 输入输出在 prompt ≤200K 与 >200K tokens 时分档计价（如 3.1 Pro Standard：$2/$12 vs $4/$18 per MTok）。
Batch API 输入/输出约 50% 折扣；Context caching 另计 storage 费用（通常 $0.50–$4.50 / 百万 tokens / 小时，因模型而异）。
图像生成（3.1 Flash Image 等）与 Live API 音频/视频计费口径与纯文本 chat 不同；集成前需按场景单独估算。

支持的编程工具

Gemini APIGoogle AI StudioVertex AIContext CachingBatch APIGroundingLive API

价格与模型数据均来源于厂商官方网站

常见问题

常见问题·7

常见问题

7 条