文心 API

ERNIE 5.1

文心与千帆开放 API，ERNIE 5.1 / 5.0 旗舰，Turbo 与 Lite Pro 分层按 token 计费

Token API

核心模型

ERNIE-5.1ERNIE-5.0ERNIE-5.0-Thinking-PreviewERNIE-5.0-Thinking-LatestERNIE-5.0-Thinking-ExpERNIE-4.5-Turbo-128KERNIE-4.5-Turbo-128K-PreviewERNIE-4.5-Turbo-32KERNIE-4.5-Turbo-20260402ERNIE-4.5-Turbo-VLERNIE-4.5-Turbo-VL-32KERNIE-4.5-8KERNIE-4.5-0.3BERNIE-Speed-Pro-128KERNIE-Lite-Pro-128Kernie-char-8kernie-char-fiction-8kERNIE-X1.1-PreviewERNIE-X1.1ERNIE-X1-Turbo-32KERNIE-X1-Turbo-32K-PreviewQianfan-Check-VLQianfan-VL-70BQianfan-VL-8BQianfan-VL-1.5-FlashQianfan-CompositionQianfan-FuncCallerQianfan-ToyTalkQianfan-OCRQianfan-OCR-FastMuseSteamer-Air-ImageMuseSteamer-Air-I2Vernie-image-turboernie-irag-edit

ERNIE-5.1

文心 5.1 旗舰，128K 上下文；输入 ¥4、输出 ¥18/百万 tokens（≤32K 输入档），适合复杂 Agent 与中文场景。

ERNIE-5.0

文心 5.0 原生全模态旗舰；输入 ¥6、输出 ¥24/百万 tokens，支持文本/图像/音频/视频联合建模。

ERNIE-5.0-Thinking-Preview

文心 5.0 思考预览版，输出含思维链；按 token 计费，适合需要可见推理链路的任务。

ERNIE-5.0-Thinking-Latest

文心 5.0 思考最新版，与 Preview 同价档；适合复杂推理与 Agent 决策节点。

ERNIE-5.0-Thinking-Exp

文心 5.0 思考实验版，定价与 5.0 思考系列一致；实验能力以控制台可用性为准。

更多模型详情请查看官网

其余核心模型名称仍在上方展示，完整说明以官网最新页面为准。

前往官网

套餐详情

ERNIE-Lite-Pro-128K

最低刊例

输入价格

¥0.2

输出价格

¥0.4

官网

ERNIE-Lite-Pro-128K

最低刊例

输入价格

¥0.2

输出价格

¥0.4

官网

用量

ERNIE-Lite-Pro-128K 是文心 API 最低刊例价入口，输入 ¥0.2、输出 ¥0.4/百万 tokens，适合客服问答、简单抽取和高并发轻量任务。

模型

128K 上下文与 10K RPM 默认流控，适合作为成本敏感场景的默认承接层，质量要求更高时再路由到 Turbo 或 5.x。

特点

若你的主要目标是控制预算并放大吞吐，Lite Pro 通常比直接上 Turbo 更经济。

适合人群

高并发轻量问答、成本敏感的基础流量

ERNIE-4.5-Turbo

主流主力推荐

输入价格

¥0.8

输出价格

¥3.2

官网

ERNIE-4.5-Turbo

主流主力推荐

输入价格

¥0.8

输出价格

¥3.2

官网

用量

ERNIE-4.5-Turbo 系列（128K/32K/20260402 等版本）输入 ¥0.8、输出 ¥3.2/百万 tokens，缓存命中输入降至 ¥0.2，适合大多数生产流量的默认层。

模型

支持搜索增强（触发时 ¥0.004/次）与 Batch 推理折扣；适合知识助手、流程机器人和标准 Agent 任务。

特点

如果你想在成本与能力间找平衡，Turbo 通常是最自然的生产默认模型。

适合人群

通用生产问答、知识助手与重视性价比的团队

ERNIE-5.1

ERNIE-5.0

全模态旗舰

输入价格

¥6

输出价格

¥24

官网

ERNIE-5.0

全模态旗舰

输入价格

¥6

输出价格

¥24

官网

用量

ERNIE-5.0 及 Thinking 系列 ≤32K 输入档输入 ¥6、输出 ¥24/百万 tokens；原生全模态统一建模，适合复杂推理与高价值任务。

模型

Thinking Preview/Latest/Exp 输出含思维链，适合需要深度推理可见性的 Agent 决策环节。

特点

新部署可优先评估 ERNIE-5.1；5.0 仍适合已有集成或需要特定 Thinking 版本的场景。

适合人群

复杂推理、全模态任务与核心内容生成团队

注意事项

官方定价按千 token 展示，站内统一换算为百万 token 口径便于横向比较；ERNIE 5.0/5.1 长上下文（>32K 输入）有更高单价档。
Turbo 系列支持缓存命中（输入 ¥0.2/百万 tokens）与搜索增强附加费；Batch 推理部分模型有折扣价。
图像生成（ernie-image-turbo、musesteamer-air-image）与 OCR 按张或按 token 计费，与纯文本 API 口径不同，需单独估算。
除按 token 后付费外，千帆还提供预购量包（按量包付费）：百度自研系列含 Lite Pro / Speed Pro / Turbo 32K·128K / Turbo VL 32K / X1-Turbo-32K 等，规格多为 1 亿·5 亿·10 亿·50 亿 tokens，有效期 6–12 个月、有折扣（如 Lite Pro 1 亿折后 ¥22.5/12 个月、Turbo 128K 1 亿折后 ¥126/6 个月）。稳定跑量往往比纯后付费更省；本站 entryPrice 与 tiers 仍按后付费单价展示，量包细节以控制台订单页为准。
联网搜索另售按次量包：10,000 次/6 个月折后 ¥38、50,000 次折后 ¥190；触发搜索增强时优先抵扣量包，耗尽后恢复 ¥0.004/次后付费。账户欠费但量包/Tpm 预付费未用完时，推理仍可调用，搜索按次仍会继续出账。

支持的编程工具

OpenAI-compatible APIAnthropic-compatible APIWeb SearchBatch inferenceContext cache

价格与模型数据均来源于厂商官方网站

常见问题

常见问题·11

常见问题

11 条