返回全部对比

通义千问 API

Qwen3.7-Max

Qwen 系列标准 API,旗舰 Qwen3.7-Max,阶梯按 token 计费,支持 Batch 与上下文缓存

Token API
订阅套餐Token API
官网

核心模型

QVQ-MaxQVQ-PlusQwen-Audio-ChatQwen-Audio-TurboQwen-Coder-PlusQwen-Coder-TurboQwen-Deep-ResearchQwen-Doc-TurboQwen-FlashQwen-LongQwen-Math-PlusQwen-Math-TurboQwen-MaxQwen-MT-FlashQwen-MT-LiteQwen-MT-PlusQwen-MT-TurboQwen-Omni-TurboQwen-Omni-Turbo-RealtimeQwen-PlusQwen-TurboQwen-VL-MaxQwen-VL-OCRQwen-VL-PlusQwen3-Coder-FlashQwen3-Coder-NextQwen3-Coder-PlusQwen3-MaxQwen3-Omni-FlashQwen3-Omni-Flash-RealtimeQwen3-VL-FlashQwen3-VL-PlusQwen3.5-FlashQwen3.5-OCRQwen3.5-Omni-FlashQwen3.5-Omni-Flash-RealtimeQwen3.5-Omni-PlusQwen3.5-Omni-Plus-RealtimeQwen3.5-PlusQwen3.6-FlashQwen3.6-PlusQwen3.7-MaxQwen3.7-PlusQwQ-Plus
Qwen3.7-Max

千问 Max 旗舰(qwen3.7-max),0<Token≤1M 档输入 ¥12、输出 ¥36/百万 tokens;适合复杂 Agent 与长上下文。

Qwen3-Max

qwen3-max 为上一代 Max 系列,仍列定价页;长上下文与推理场景可按价格表选择。

Qwen-Max

qwen-max 经典 Max 线路,适合需要稳定 Max 能力的遗留集成。

Qwen3.7-Plus

qwen3.7-plus 支持推理、视觉与文本;0<Token≤256K 档约 ¥2/¥8 每百万 tokens。

Qwen3.6-Plus

qwen3.6-plus 生产常见默认,0<Token≤256K 档 ¥2/¥12 每百万 tokens。

更多模型详情请查看官网

其余核心模型名称仍在上方展示,完整说明以官网最新页面为准。

前往官网

套餐详情

Qwen-Turbo

高性价比入口
输入价格
¥0.3
输出价格
¥0.6
官网
用量
qwen-turbo 是千问系列中单价最低的通用入口之一,适合客服问答、工具助手、批量脚本与对延迟和成本都敏感的高并发轻量任务。
模型
支持非思考与思考模式,思考模式输出单价更高;若业务以简单补全和短问答为主,应优先走非思考模式控制成本。
特点
适合作为系统默认路由层:大多数轻量流量走 Turbo,复杂任务再升级到 Plus 或 Max。
适合人群
低成本大规模调用、轻量自动化与常规问答服务

Qwen3.6-Plus

生产主力推荐
输入价格
¥2
输出价格
¥12
官网
用量
qwen3.6-plus 在质量、成本与多模态能力之间平衡较好,支持推理、视觉理解与文本生成,适合作为多数生产系统的默认主力模型。
模型
阶梯计价下 256K 以内输入/输出分别为 ¥2/¥12 每百万 tokens(代表性低档);长上下文请求会进入更高单价区间,需要按实际 prompt 长度估算。
特点
当 Turbo 质量不足而 Max 成本过高时,Plus 档往往是最自然的中间路由选择。
适合人群
通用 Agent、应用问答与需要兼顾质量与成本的团队

Qwen3.7-Max

最新旗舰
输入价格
¥12
输出价格
¥36
官网
用量
qwen3.7-max 是百炼当前 API 旗舰,适合复杂推理、长上下文分析、编程与多步 Agent 等高价值任务,不宜承载全部轻量流量。
模型
代表性价格(0<Token≤1M)为输入 ¥12、输出 ¥36 每百万 tokens;更长上下文或不同模式可能有更高档位,请以定价页实时列表为准。
特点
更适合作为关键路径模型:把难、贵、重要的节点交给 Max,整体系统更容易在效果与成本间取得平衡。
适合人群
复杂 Agent、编程工作流与关键高价值业务链路

注意事项

  • `models` 为定价页「文本生成-千问」商用线 44 个 id(含 qwen3-coder-next、qwen3.5-ocr 等);不含「开源版托管」章节、日期快照 alias、`-us` 国际区 id 与第三方模型。
  • 部分模型实行阶梯计费:单次请求的全部 token 按输入总量所在区间单价结算(如 0<Token≤256K 与 256K<Token≤1M 不同价)。页面展示为代表性低档价格,上线前请核对完整价格表。
  • Qwen-Turbo 非思考模式输入 ¥0.3、输出 ¥0.6/百万 tokens;思考模式输出 ¥3/百万 tokens。Qwen3.7-Max(0<Token≤1M)输入 ¥12、输出 ¥36/百万 tokens。
  • 新用户通常有免费额度但带有效期,且不同模型额度不一定共享;正式上线前请在控制台确认余额与免费包明细。

支持的编程工具

OpenAI-compatible APIDashScopeBatchContext Cache

价格与模型数据均来源于厂商官方网站

常见问题

常见问题
7