DeepSeek API

按量计费·1M 上下文

自研 DeepSeek-V4，1M 超长上下文与思考/非思考双模式；官方仅 API 按量计费，无包月套餐

Token API

订阅套餐Token API

官网

核心模型

DeepSeek-V4-FlashDeepSeek-V4-Pro

DeepSeek-V4-Flash

官方 API 高速档（deepseek-v4-flash）：缓存未命中输入 ¥1、输出 ¥2 / 百万 tokens，缓存命中输入 ¥0.02；1M 上下文、并发 2500，支持思考/非思考双模式。

DeepSeek-V4-Pro

官方旗舰 API（deepseek-v4-pro）：缓存未命中输入 ¥3、输出 ¥6 / 百万 tokens，缓存命中输入 ¥0.025；1M 上下文、最大 384K 输出、并发 500。

套餐详情

DeepSeek-V4-Flash

高速高性价比

输入价格

¥1

输出价格

¥2

官网

DeepSeek-V4-Flash

高速高性价比

输入价格

¥1

输出价格

¥2

官网

用量

model id 为 deepseek-v4-flash，缓存未命中输入 ¥1 / 百万 tokens、输出 ¥2 / 百万 tokens，适合高频批量、日常补全和大量轻量请求。

模型

1M 超长上下文、最大 384K 输出，并发上限 2500；支持 JSON Output、Tool Calls、对话前缀续写，FIM 补全仅在非思考模式下可用。

特点

支持思考/非思考双模式（默认思考）；缓存命中输入可低至 ¥0.02 / 百万 tokens，重复上下文场景应把缓存设计进架构。
适合自建后端、脚本自动化、Agent 流水线、日志分析与需要严格控制单次调用成本的用户。

适合人群

高频批量调用用户、自建后端开发者和需要极致性价比的日常补全场景

DeepSeek-V4-Pro

旗舰推理推荐

输入价格

¥3

输出价格

¥6

官网

DeepSeek-V4-Pro

旗舰推理推荐

输入价格

¥3

输出价格

¥6

官网

用量

model id 为 deepseek-v4-pro，缓存未命中输入 ¥3 / 百万 tokens、输出 ¥6 / 百万 tokens，价格比 Flash 更高，适合复杂推理、深度代码改造和长链路 Agent。

模型

1M 上下文、最大 384K 输出，并发上限 500；同样支持思考/非思考切换、JSON Output、Tool Calls 与 FIM 补全（非思考模式）。

特点

缓存命中输入约 ¥0.025 / 百万 tokens，仍能在重复上下文场景降低成本，但应把 Pro 留给真正需要更强能力的请求。
适合复杂推理与代码任务、专业开发者和把 DeepSeek 当核心模型底座的生产系统。

适合人群

复杂推理与代码任务用户、专业开发者和生产级 Agent 系统搭建者

注意事项

官方无包月 Coding Plan，费用 = token 消耗量 × 模型单价，从充值余额或赠送余额扣除；两者并存时优先扣减赠送余额。
定价页当前在售模型为 deepseek-v4-flash 与 deepseek-v4-pro；deepseek-chat / deepseek-reasoner 将于北京时间 2026/07/24 23:59 弃用，分别对应 v4-flash 的非思考与思考模式。
并发限制（账号粒度）：v4-flash 2500、v4-pro 500；超出返回 HTTP 429。也可在火山方舟、天翼云、千帆等 Coding Plan 中使用 DeepSeek，但走套餐额度而非官方余额。

支持的编程工具

OpenAI-compatible APIAnthropic-compatible APIClaude CodeCursorClineCodex CLI

价格与模型数据均来源于厂商官方网站

常见问题

常见问题·7

常见问题

7 条