核心模型
DeepSeek-V4-ProDeepSeek-V4-FlashGLM-5.1GLM4.6VQwen3.5-122B-A10BQwen3.5-35B-A3BQwen3-Next-80B-A3B-InstructQwen3-VL-235B-A22B-InstructKimi-K2.5Minimax-M2.5Qwen3.5-397B-A17B(正式版)GLM-5(正式版)DeepSeek-V3.2(旗舰版)DeepSeek-V3.1DeepSeek-R1-0528DeepSeek-R1DeepSeek-V3DeepSeek-V3-0324DeepSeek-R1-Distill-Llama-70BDeepSeek-R1-Distill-Qwen-32BQwen3-VL-30B-A3B-InstructQwen3-Coder-480B-A35B-InstructQwen3-235B-A22B-Instruct-2507Qwen3-235B-A22BQwen3-30B-A3BQwen3-32BQwen3-14BQwen3-8BQwen3-4BQwen2.5-72B-InstructQwen2.5-VL-72B-InstructQwen-VL-ChatBGE-m3BGE-Reranker-LargeKimi-K2-Instruct
DeepSeek-V4-Pro
旗舰推理,V4 Pro 档标准时段刊例输入 ¥12、输出 ¥24/百万 tokens。
DeepSeek-V4-Flash
V4 Flash 轻量档,输入 ¥1、输出 ¥2/百万 tokens。
GLM-5.1
智谱 GLM-5.1,≤32K 输入 ¥6、输出 ¥24/百万 tokens(长上下文档更高)。
GLM4.6V
智谱多模态 GLM4.6V,≤32K 输入 ¥1、输出 ¥3/百万 tokens。
Qwen3.5-122B-A10B
千问 3.5 122B,≤128K 输入 ¥0.8、输出 ¥6.4/百万 tokens。
更多模型详情请查看官网
其余核心模型名称仍在上方展示,完整说明以官网最新页面为准。
套餐详情
用量
Qwen3-8B 为在线推理语言模型最低刊例档之一,适合轻量对话与成本敏感的后端路由。
模型
首次使用可享 50 万 tokens 免费额度(两周),用尽后需开通付费。
特点
复杂推理应路由到 DeepSeek-R1 或 GLM-5 等更高档。
编程 Token Plan 内不可用此按量路线。
编程 Token Plan 内不可用此按量路线。
适合人群
轻量应用、试用与低成本路由
用量
DeepSeek-V3.2 旗舰版标准时段输入 ¥2、输出 ¥3/百万 tokens,也是编程 Token Plan 支持模型之一。
模型
开启上下文缓存后输入命中 ¥0.2/百万 tokens,全天有效。
特点
00:00–08:00 优惠时段输入 ¥1、输出 ¥1.5/百万 tokens。
适合主力代码生成与日常工程后端。
适合主力代码生成与日常工程后端。
适合人群
主力开发、代码生成与工程后端
用量
GLM-5 正式版 ≤32K 输入 ¥4、输出 ¥18/百万 tokens;32K–200K 长上下文档更高。
模型
编程 Token Plan 五档套餐均支持 GLM-5(正式版)与 DeepSeek-V3.2(旗舰版)切换。
特点
复杂 Agent 与长程任务可优先选 GLM-5.1(刊例输入 ¥6 起)。
优惠
00:00–08:00 优惠时段 ≤32K 输入 ¥2、输出 ¥9。
适合人群
复杂推理、Agent 与长上下文
用量
DeepSeek-V4-Pro 输入 ¥12、输出 ¥24/百万 tokens,面向最高复杂度推理任务。
模型
首次使用 50 万 tokens 免费(两周)。
特点
与 V4-Flash(¥1/¥2)形成高低搭配。
按量 API 与编程 Token Plan 计费体系独立。
按量 API 与编程 Token Plan 计费体系独立。
适合人群
高难度推理与旗舰任务
注意事项
- DeepSeek-V3.2 缓存命中输入 ¥0.2/百万 tokens(全天);标准时段输入 ¥2、输出 ¥3。
- 批量推理 DeepSeek V3/R1 系列约为在线标准时段 40%(如 V3.1 输入 ¥1.6、输出 ¥6.4/百万 tokens)。
- BGE-m3 / BGE-Reranker-Large 走 Embeddings / Reranker API,仅输入侧计费 ¥0.5/百万 tokens。
- 「其他系列模型」免费额度用尽后不支持 tokens 计费模式;RPM/TPM 限制见模型广场详情。
支持的编程工具
OpenAI-compatible APIChat APIEmbeddings APIReranker APIBatch inferenceContext cache
价格与模型数据均来源于厂商官方网站
常见问题
常见问题7 条