核心模型
grok-4.3grok-4.20-0309-reasoninggrok-4.20-0309-non-reasoninggrok-4.20-multi-agent-0309grok-build-0.1grok-imagine-imagegrok-imagine-image-qualitygrok-imagine-videogrok-imagine-video-1.5Grok Voice RealtimeGrok TTSGrok STT
grok-4.3
xAI 当前旗舰文本模型,1M token 上下文,$1.25/$2.50 per 1M tokens;支持 Web Search、X Search、代码执行等服务端工具,是构建需要实时信息的生产级 Agent 应用的首选。
grok-4.20-0309-reasoning
Grok 4.20 的推理模式变体,展示逐步思维链,适合需要透明推理过程的数学证明、复杂逻辑分析和高可解释性任务;1M 上下文,$1.25/$2.50 per 1M tokens。
grok-4.20-0309-non-reasoning
Grok 4.20 的标准模式变体,跳过推理链直接输出结果,响应速度更快,适合不需要展示思考过程的日常问答和代码生成任务;1M 上下文,$1.25/$2.50 per 1M tokens。
grok-4.20-multi-agent-0309
专为多智能体工作流设计的 Grok 4.20 变体,适合将复杂问题拆解为并行子任务的 Agent 编排场景;1M 上下文,$1.25/$2.50 per 1M tokens,与标准变体定价一致。
grok-build-0.1
xAI API 文本模型中最低价选项,256K 上下文,输入 $1.00/M,输出 $2.00/M;适合高频批量推理、成本敏感型应用和不需要超长上下文的轻量生产调用场景。
更多模型详情请查看官网
其余核心模型名称仍在上方展示,完整说明以官网最新页面为准。
套餐详情
用量
xAI 当前旗舰,model id 为 grok-4.3;1M token 上下文,输入 $1.25/百万 tokens,输出 $2.50/百万 tokens,在同级别旗舰模型中定价有竞争力,尤其适合复杂推理、代码生成和多步骤 Agent 任务。
模型
支持服务端 Web Search(全网实时搜索)和 X Search(X 平台实时内容)工具,Agent 可在生成时自动调用获取最新信息;工具调用按 $5/千次计费,Token 费用另计。
特点
还支持代码执行沙箱($5/千次)、文件附件搜索($10/千次)、集合搜索(RAG,$2.50/千次)及 Remote MCP 工具,适合构建需要工具调用的生产级 Agent 应用。
优惠
Batch API 可享标准价格 20%–50% 折扣,适合可延迟的离线批量任务;在 Responses API 中支持 code_interpreter、file_search 等工具名,Python xAI SDK 的 gRPC API 不支持这两个别名。
适合人群
复杂推理、Agent 应用和代码生成场景的主力选择
用量
grok-4.20 有两个独立变体:grok-4.20-0309-reasoning(推理模式,展示逐步思维链)和 grok-4.20-0309-non-reasoning(标准模式,更快响应);两者价格相同,均为输入 $1.25/M,输出 $2.50/M,1M 上下文。
模型
另外还有 grok-4.20-multi-agent-0309,专为多智能体工作流设计,同样 1M 上下文,$1.25/$2.50,适合需要分解子任务并行推理的复杂 Agent 编排场景。
特点
注意:grok-4.20 及以上版本不支持 logprobs 和 top_logprobs 参数,设置后会被静默忽略;如需这些字段,应使用更早期的模型版本。
适合人群
需要灵活选择推理深度或运行多智能体工作流的开发者
用量
xAI API 文本模型里价格最低的选项,输入 $1.00/M,输出 $2.00/M,上下文 256K(比旗舰版短但仍足够大多数任务);适合不需要超长上下文但希望控制成本的高频推理和批量处理场景。
模型
同样支持 Batch API 折扣,适合可延迟的离线批量推理任务;对于大规模应用的测试和轻量生产调用是性价比最高的切入点。
适合人群
高频批量推理、成本敏感型应用和轻量生产调用
用量
图像生成提供两个质量档:grok-imagine-image(标准,$0.02/张)和 grok-imagine-image-quality(高质量,$0.05/张);最大图片输入 20MiB,支持 jpg/jpeg 和 png,接受任意图文输入顺序。
模型
视频生成同样提供两个版本:grok-imagine-video($0.050/秒)和 grok-imagine-video-1.5($0.080/秒);视频支持 Batch API 排队处理,但按标准价格计费,不享受折扣。
适合人群
需要在应用中集成图像或视频生成能力的开发者
用量
Grok Voice API 覆盖三种场景:实时对话(Realtime,$0.05/分钟,另加 $0.004/条文字输入消息)、文字转语音(TTS,$15.00/百万字符)和语音转文字(STT,REST $0.10/小时,流式 $0.20/小时)。
模型
实时语音 API 支持亚秒级低延迟对话,适合语音助手和实时交互应用;与文本 API 共享同一 API key,无需额外配置。
适合人群
需要实时语音、TTS 或 STT 能力的应用开发者
注意事项
- 服务端搜索工具调用按次计费(Web Search / X Search / 代码执行各 $5/千次),Token 费用另计;开启工具后 Agent 会自主决定调用次数,复杂查询成本会随工具调用次数线性增加。
- Batch API 支持所有文本/语言模型,标准价格 20%–50% 折扣,通常 24 小时内处理完成;图像/视频生成支持 Batch API 排队但按标准价格计费,不享受折扣。
- grok-4.3 和 grok-4.20 均支持 1M token 上下文;grok-build-0.1 上下文 256K,是最低成本的文本选项($1.00/$2.00),适合不需要超长上下文的批量推理任务。
- Priority Processing 对 Chat Completions / Responses 文本请求提供 2× token 单价与更高调度优先级;docs.x.ai 注明所有价格为 USD。
支持的编程工具
xAI ConsoleREST APIPython xAI SDKResponses APIBatch API
价格与模型数据均来源于厂商官方网站
常见问题
常见问题6 条