返回全部对比

息壤 API

DeepSeek-V3.2

天翼云息壤 Token 服务在线推理,DeepSeek / GLM / Qwen / Kimi 等按 token 后付费

Token API
订阅套餐Token API
官网

核心模型

DeepSeek-V4-ProDeepSeek-V4-FlashGLM-5.1GLM4.6VQwen3.5-122B-A10BQwen3.5-35B-A3BQwen3-Next-80B-A3B-InstructQwen3-VL-235B-A22B-InstructKimi-K2.5Minimax-M2.5Qwen3.5-397B-A17B(正式版)GLM-5(正式版)DeepSeek-V3.2(旗舰版)DeepSeek-V3.1DeepSeek-R1-0528DeepSeek-R1DeepSeek-V3DeepSeek-V3-0324DeepSeek-R1-Distill-Llama-70BDeepSeek-R1-Distill-Qwen-32BQwen3-VL-30B-A3B-InstructQwen3-Coder-480B-A35B-InstructQwen3-235B-A22B-Instruct-2507Qwen3-235B-A22BQwen3-30B-A3BQwen3-32BQwen3-14BQwen3-8BQwen3-4BQwen2.5-72B-InstructQwen2.5-VL-72B-InstructQwen-VL-ChatBGE-m3BGE-Reranker-LargeKimi-K2-Instruct
DeepSeek-V4-Pro

旗舰推理,V4 Pro 档标准时段刊例输入 ¥12、输出 ¥24/百万 tokens。

DeepSeek-V4-Flash

V4 Flash 轻量档,输入 ¥1、输出 ¥2/百万 tokens。

GLM-5.1

智谱 GLM-5.1,≤32K 输入 ¥6、输出 ¥24/百万 tokens(长上下文档更高)。

GLM4.6V

智谱多模态 GLM4.6V,≤32K 输入 ¥1、输出 ¥3/百万 tokens。

Qwen3.5-122B-A10B

千问 3.5 122B,≤128K 输入 ¥0.8、输出 ¥6.4/百万 tokens。

更多模型详情请查看官网

其余核心模型名称仍在上方展示,完整说明以官网最新页面为准。

前往官网

套餐详情

Qwen3-8B

入门
输入价格
¥0.3
输出价格
¥0.6
官网
用量
Qwen3-8B 为在线推理语言模型最低刊例档之一,适合轻量对话与成本敏感的后端路由。
模型
首次使用可享 50 万 tokens 免费额度(两周),用尽后需开通付费。
特点
复杂推理应路由到 DeepSeek-R1 或 GLM-5 等更高档。
编程 Token Plan 内不可用此按量路线。
适合人群
轻量应用、试用与低成本路由

DeepSeek-V3.2(旗舰版)

高性价比推荐
输入价格
¥2
输出价格
¥3
官网
用量
DeepSeek-V3.2 旗舰版标准时段输入 ¥2、输出 ¥3/百万 tokens,也是编程 Token Plan 支持模型之一。
模型
开启上下文缓存后输入命中 ¥0.2/百万 tokens,全天有效。
特点
00:00–08:00 优惠时段输入 ¥1、输出 ¥1.5/百万 tokens。
适合主力代码生成与日常工程后端。
适合人群
主力开发、代码生成与工程后端

GLM-5(正式版)

智谱旗舰
输入价格
¥4
输出价格
¥18
官网
用量
GLM-5 正式版 ≤32K 输入 ¥4、输出 ¥18/百万 tokens;32K–200K 长上下文档更高。
模型
编程 Token Plan 五档套餐均支持 GLM-5(正式版)与 DeepSeek-V3.2(旗舰版)切换。
特点
复杂 Agent 与长程任务可优先选 GLM-5.1(刊例输入 ¥6 起)。
优惠
00:00–08:00 优惠时段 ≤32K 输入 ¥2、输出 ¥9。
适合人群
复杂推理、Agent 与长上下文

DeepSeek-V4-Pro

旗舰推理
输入价格
¥12
输出价格
¥24
官网
用量
DeepSeek-V4-Pro 输入 ¥12、输出 ¥24/百万 tokens,面向最高复杂度推理任务。
模型
首次使用 50 万 tokens 免费(两周)。
特点
与 V4-Flash(¥1/¥2)形成高低搭配。
按量 API 与编程 Token Plan 计费体系独立。
适合人群
高难度推理与旗舰任务

注意事项

  • DeepSeek-V3.2 缓存命中输入 ¥0.2/百万 tokens(全天);标准时段输入 ¥2、输出 ¥3。
  • 批量推理 DeepSeek V3/R1 系列约为在线标准时段 40%(如 V3.1 输入 ¥1.6、输出 ¥6.4/百万 tokens)。
  • BGE-m3 / BGE-Reranker-Large 走 Embeddings / Reranker API,仅输入侧计费 ¥0.5/百万 tokens。
  • 「其他系列模型」免费额度用尽后不支持 tokens 计费模式;RPM/TPM 限制见模型广场详情。

支持的编程工具

OpenAI-compatible APIChat APIEmbeddings APIReranker APIBatch inferenceContext cache

价格与模型数据均来源于厂商官方网站

常见问题

常见问题
7