息壤 API

DeepSeek-V3.2

天翼云息壤 Token 服务在线推理，DeepSeek / GLM / Qwen / Kimi 等按 token 后付费

Token API

核心模型

DeepSeek-V4-ProDeepSeek-V4-FlashGLM-5.1GLM4.6VQwen3.5-122B-A10BQwen3.5-35B-A3BQwen3-Next-80B-A3B-InstructQwen3-VL-235B-A22B-InstructKimi-K2.5Minimax-M2.5Qwen3.5-397B-A17B（正式版）GLM-5（正式版）DeepSeek-V3.2（旗舰版）DeepSeek-V3.1DeepSeek-R1-0528DeepSeek-R1DeepSeek-V3DeepSeek-V3-0324DeepSeek-R1-Distill-Llama-70BDeepSeek-R1-Distill-Qwen-32BQwen3-VL-30B-A3B-InstructQwen3-Coder-480B-A35B-InstructQwen3-235B-A22B-Instruct-2507Qwen3-235B-A22BQwen3-30B-A3BQwen3-32BQwen3-14BQwen3-8BQwen3-4BQwen2.5-72B-InstructQwen2.5-VL-72B-InstructQwen-VL-ChatBGE-m3BGE-Reranker-LargeKimi-K2-Instruct

DeepSeek-V4-Pro

旗舰推理，V4 Pro 档标准时段刊例输入 ¥12、输出 ¥24/百万 tokens。

DeepSeek-V4-Flash

V4 Flash 轻量档，输入 ¥1、输出 ¥2/百万 tokens。

GLM-5.1

智谱 GLM-5.1，≤32K 输入 ¥6、输出 ¥24/百万 tokens（长上下文档更高）。

GLM4.6V

智谱多模态 GLM4.6V，≤32K 输入 ¥1、输出 ¥3/百万 tokens。

Qwen3.5-122B-A10B

千问 3.5 122B，≤128K 输入 ¥0.8、输出 ¥6.4/百万 tokens。

更多模型详情请查看官网

其余核心模型名称仍在上方展示，完整说明以官网最新页面为准。

前往官网

套餐详情

Qwen3-8B

入门

输入价格

¥0.3

输出价格

¥0.6

官网

Qwen3-8B

入门

输入价格

¥0.3

输出价格

¥0.6

官网

用量

Qwen3-8B 为在线推理语言模型最低刊例档之一，适合轻量对话与成本敏感的后端路由。

模型

首次使用可享 50 万 tokens 免费额度（两周），用尽后需开通付费。

特点

复杂推理应路由到 DeepSeek-R1 或 GLM-5 等更高档。
编程 Token Plan 内不可用此按量路线。

适合人群

轻量应用、试用与低成本路由

DeepSeek-V3.2（旗舰版）

高性价比推荐

输入价格

¥2

输出价格

¥3

官网

DeepSeek-V3.2（旗舰版）

高性价比推荐

输入价格

¥2

输出价格

¥3

官网

用量

DeepSeek-V3.2 旗舰版标准时段输入 ¥2、输出 ¥3/百万 tokens，也是编程 Token Plan 支持模型之一。

模型

开启上下文缓存后输入命中 ¥0.2/百万 tokens，全天有效。

特点

00:00–08:00 优惠时段输入 ¥1、输出 ¥1.5/百万 tokens。
适合主力代码生成与日常工程后端。

适合人群

主力开发、代码生成与工程后端

GLM-5（正式版）

智谱旗舰

输入价格

¥4

输出价格

¥18

官网

GLM-5（正式版）

智谱旗舰

输入价格

¥4

输出价格

¥18

官网

用量

GLM-5 正式版 ≤32K 输入 ¥4、输出 ¥18/百万 tokens；32K–200K 长上下文档更高。

模型

编程 Token Plan 五档套餐均支持 GLM-5（正式版）与 DeepSeek-V3.2（旗舰版）切换。

特点

复杂 Agent 与长程任务可优先选 GLM-5.1（刊例输入 ¥6 起）。

优惠

00:00–08:00 优惠时段 ≤32K 输入 ¥2、输出 ¥9。

适合人群

复杂推理、Agent 与长上下文

DeepSeek-V4-Pro

旗舰推理

输入价格

¥12

输出价格

¥24

官网

DeepSeek-V4-Pro

旗舰推理

输入价格

¥12

输出价格

¥24

官网

用量

DeepSeek-V4-Pro 输入 ¥12、输出 ¥24/百万 tokens，面向最高复杂度推理任务。

模型

首次使用 50 万 tokens 免费（两周）。

特点

与 V4-Flash（¥1/¥2）形成高低搭配。
按量 API 与编程 Token Plan 计费体系独立。

适合人群

高难度推理与旗舰任务

注意事项

DeepSeek-V3.2 缓存命中输入 ¥0.2/百万 tokens（全天）；标准时段输入 ¥2、输出 ¥3。
批量推理 DeepSeek V3/R1 系列约为在线标准时段 40%（如 V3.1 输入 ¥1.6、输出 ¥6.4/百万 tokens）。
BGE-m3 / BGE-Reranker-Large 走 Embeddings / Reranker API，仅输入侧计费 ¥0.5/百万 tokens。
「其他系列模型」免费额度用尽后不支持 tokens 计费模式；RPM/TPM 限制见模型广场详情。

支持的编程工具

OpenAI-compatible APIChat APIEmbeddings APIReranker APIBatch inferenceContext cache

价格与模型数据均来源于厂商官方网站

常见问题

常见问题·7

常见问题

7 条