核心模型
Gemini 3.5 FlashGemini 3.1 ProGemini 3.1 Flash-LiteGemini 2.5 ProGemini 2.5 FlashGemini 3.1 Flash ImageGemini 3.1 Flash Live
Gemini 3.5 Flash
API 高速旗舰(gemini-3.5-flash):$1.50 输入 / $9 输出 per MTok,frontier 智能 + search grounding,Free tier 可试用。
Gemini 3.1 Pro
API 最强 Pro 预览(gemini-3.1-pro-preview):$2/$12 per MTok(≤200K),多模态 Agent 与 vibe-coding,Paid only。
Gemini 3.1 Flash-Lite
极致性价比(gemini-3.1-flash-lite):$0.25/$1.50 per MTok,高 volume Agent 与翻译首选。
Gemini 2.5 Pro
上一代 Pro(gemini-2.5-pro):$1.25/$10 per MTok(≤200K),编码与复杂推理;新集成优先 3.x 系列。
Gemini 3.1 Flash Image
图像生成 API(gemini-3.1-flash-image):文本输入 $0.50/M,图像输出按分辨率计价(约 $0.045–$0.151/张),与纯 chat 计费分离。
更多模型详情请查看官网
其余核心模型名称仍在上方展示,完整说明以官网最新页面为准。
套餐详情
用量
model id 为 gemini-3.5-flash,当前 API 主推的高速旗舰:Standard 输入 $1.50 / 百万 tokens、输出 $9 / 百万 tokens,结合前沿智能与 superior search / grounding。
模型
Free tier 在 AI Studio 可免费调用(有速率限制);Paid tier 解锁更高 RPS、Context caching 与 Grounding with Google Search / Maps。
特点
Batch API 输入 $0.75/M、输出 $4.50/M;Flex 与 Priority 档分别 $0.75/$4.50 与 $2.70/$16.20 per MTok,适合延迟敏感与高峰吞吐场景。
适合需要搜索 grounding、快速 Agent 循环与日常生产 API 的默认选型;复杂多模态 Agent 可升 3.1 Pro。
适合需要搜索 grounding、快速 Agent 循环与日常生产 API 的默认选型;复杂多模态 Agent 可升 3.1 Pro。
适合人群
搜索 grounding Agent、高速生产 API、日常智能应用
用量
model id 为 gemini-3.1-pro-preview(及 customtools 变体),当前最强多模态理解 + Agent / vibe-coding 能力之一。
模型
Standard 计价:prompt ≤200K tokens 时输入 $2 / 输出 $12 per MTok;超过 200K 时输入 $4 / 输出 $18 per MTok。
特点
Paid tier only(Free tier 不可用);支持 Context caching、Batch 半价与 Grounding;适合复杂代码库分析、长文档 Agent 与高自主性工作流。
与 gemini.google 订阅里的 3.1 Pro 是同一模型族,但 API 按 token 独立计费,不受 Plus / Pro / Ultra 用量倍数约束。
与 gemini.google 订阅里的 3.1 Pro 是同一模型族,但 API 按 token 独立计费,不受 Plus / Pro / Ultra 用量倍数约束。
适合人群
复杂 Agent、长上下文多模态、vibe-coding 与 repo 级分析
用量
model id 为 gemini-3.1-flash-lite,官方定位最高性价比:Standard 文本/图像/视频输入 $0.25 / 百万 tokens、输出 $1.50 / 百万 tokens。
模型
优化高 volume Agent 任务、翻译与简单数据处理;Free tier 可免费调用,Paid 解锁 caching 与更高 RPS。
特点
Batch API 输入 $0.125/M、输出 $0.75/M;适合路由层、批量分类与成本敏感的大规模调用。
音频输入 Standard $0.50/M、Batch $0.25/M,集成语音场景时需单独估算。
音频输入 Standard $0.50/M、Batch $0.25/M,集成语音场景时需单独估算。
适合人群
高并发轻量任务、翻译、路由与子 Agent
用量
model id 为 gemini-2.5-pro,上一代多用途旗舰,擅长编码与复杂推理;新集成优先 3.5 Flash / 3.1 Pro。
模型
Standard:prompt ≤200K 时 $1.25 输入 / $10 输出 per MTok;超过 200K 时 $2.50 / $15 per MTok。
特点
Free tier 可免费调用(有限制);Grounding with Google Search 1,500 RPD 免费后 $35 / 千次 grounded prompts。
已有 2.5 Pro 集成的存量系统可继续计费运行,迁移计划应评估 3.1 Pro 的多模态 Agent 收益。
已有 2.5 Pro 集成的存量系统可继续计费运行,迁移计划应评估 3.1 Pro 的多模态 Agent 收益。
适合人群
存量 2.5 Pro 集成、编码与复杂推理(迁移中)
用量
model id 为 gemini-2.5-flash,首个支持 thinking budgets 的混合推理 Flash,1M token 上下文窗口。
模型
Standard 文本/图像/视频输入 $0.30 / 百万 tokens、输出 $2.50 / 百万 tokens;Free tier 可免费调用。
特点
Grounding with Google Search 与 Flash-Lite 共享 500 RPD(Free)/ 1,500 RPD(Paid)免费额度。
适合需要可控 thinking 深度、1M 上下文但不必上 3.5 Flash 价位的生产场景。
适合需要可控 thinking 深度、1M 上下文但不必上 3.5 Flash 价位的生产场景。
适合人群
1M 上下文、可控 thinking、中等成本生产 API
用量
model id 为 gemini-3.1-flash-image,面向高速交互式图像生成与编辑;Standard 文本/图像输入 $0.50 / 百万 tokens。
模型
图像输出按 token 计价($60/M image tokens):0.5K 约 $0.045/张、1K $0.067、2K $0.101、4K $0.151;与纯 chat API 计费口径不同。
特点
Batch API 输入 $0.25/M、图像输出 $30/M(约半价);Paid tier only,适合高吞吐视觉生成流水线。
适合人群
图像生成、编辑与高吞吐视觉 API
用量
model id 为 gemini-3.1-flash-live-preview,低延迟 audio-to-audio 实时对话模型,支持声学细节、数值精度与多模态感知。
模型
Paid tier Standard:文本输入 $0.75 / 输出 $4.50 per MTok;音频输入 $3 或约 $0.005/min、输出 $12 或约 $0.018/min;图像/视频输入 $1 或约 $0.002/min。
特点
Free tier 可免费调用(有速率限制);适合语音助手、实时翻译与 voice-first Agent,集成前需单独估算音频/视频分钟成本。
适合人群
实时语音对话、Live API 与 voice-first 应用
注意事项
- 下列价格为 Paid tier Standard 处理、USD / 百万 tokens;Free tier 在 AI Studio 对部分模型提供免费输入/输出额度(内容可能用于改进产品),生产环境应升级 Paid。
- Gemini 3.1 Pro / 2.5 Pro 输入输出在 prompt ≤200K 与 >200K tokens 时分档计价(如 3.1 Pro Standard:$2/$12 vs $4/$18 per MTok)。
- Batch API 输入/输出约 50% 折扣;Context caching 另计 storage 费用(通常 $0.50–$4.50 / 百万 tokens / 小时,因模型而异)。
- 图像生成(3.1 Flash Image 等)与 Live API 音频/视频计费口径与纯文本 chat 不同;集成前需按场景单独估算。
支持的编程工具
Gemini APIGoogle AI StudioVertex AIContext CachingBatch APIGroundingLive API
价格与模型数据均来源于厂商官方网站
常见问题
常见问题7 条