返回全部对比

DeepSeek API

按量计费·1M 上下文

自研 DeepSeek-V4,1M 超长上下文与思考/非思考双模式;官方仅 API 按量计费,无包月套餐

Token API
订阅套餐Token API
官网

核心模型

DeepSeek-V4-FlashDeepSeek-V4-Pro
DeepSeek-V4-Flash

官方 API 高速档(deepseek-v4-flash):缓存未命中输入 ¥1、输出 ¥2 / 百万 tokens,缓存命中输入 ¥0.02;1M 上下文、并发 2500,支持思考/非思考双模式。

DeepSeek-V4-Pro

官方旗舰 API(deepseek-v4-pro):缓存未命中输入 ¥3、输出 ¥6 / 百万 tokens,缓存命中输入 ¥0.025;1M 上下文、最大 384K 输出、并发 500。

套餐详情

DeepSeek-V4-Flash

高速高性价比
输入价格
¥1
输出价格
¥2
官网
用量
model id 为 deepseek-v4-flash,缓存未命中输入 ¥1 / 百万 tokens、输出 ¥2 / 百万 tokens,适合高频批量、日常补全和大量轻量请求。
模型
1M 超长上下文、最大 384K 输出,并发上限 2500;支持 JSON Output、Tool Calls、对话前缀续写,FIM 补全仅在非思考模式下可用。
特点
支持思考/非思考双模式(默认思考);缓存命中输入可低至 ¥0.02 / 百万 tokens,重复上下文场景应把缓存设计进架构。
适合自建后端、脚本自动化、Agent 流水线、日志分析与需要严格控制单次调用成本的用户。
适合人群
高频批量调用用户、自建后端开发者和需要极致性价比的日常补全场景

DeepSeek-V4-Pro

旗舰推理推荐
输入价格
¥3
输出价格
¥6
官网
用量
model id 为 deepseek-v4-pro,缓存未命中输入 ¥3 / 百万 tokens、输出 ¥6 / 百万 tokens,价格比 Flash 更高,适合复杂推理、深度代码改造和长链路 Agent。
模型
1M 上下文、最大 384K 输出,并发上限 500;同样支持思考/非思考切换、JSON Output、Tool Calls 与 FIM 补全(非思考模式)。
特点
缓存命中输入约 ¥0.025 / 百万 tokens,仍能在重复上下文场景降低成本,但应把 Pro 留给真正需要更强能力的请求。
适合复杂推理与代码任务、专业开发者和把 DeepSeek 当核心模型底座的生产系统。
适合人群
复杂推理与代码任务用户、专业开发者和生产级 Agent 系统搭建者

注意事项

  • 官方无包月 Coding Plan,费用 = token 消耗量 × 模型单价,从充值余额或赠送余额扣除;两者并存时优先扣减赠送余额。
  • 定价页当前在售模型为 deepseek-v4-flash 与 deepseek-v4-pro;deepseek-chat / deepseek-reasoner 将于北京时间 2026/07/24 23:59 弃用,分别对应 v4-flash 的非思考与思考模式。
  • 并发限制(账号粒度):v4-flash 2500、v4-pro 500;超出返回 HTTP 429。也可在火山方舟、天翼云、千帆等 Coding Plan 中使用 DeepSeek,但走套餐额度而非官方余额。

支持的编程工具

OpenAI-compatible APIAnthropic-compatible APIClaude CodeCursorClineCodex CLI

价格与模型数据均来源于厂商官方网站

常见问题

常见问题
7