核心模型
ERNIE-5.1ERNIE-5.0ERNIE-5.0-Thinking-PreviewERNIE-5.0-Thinking-LatestERNIE-5.0-Thinking-ExpERNIE-4.5-Turbo-128KERNIE-4.5-Turbo-128K-PreviewERNIE-4.5-Turbo-32KERNIE-4.5-Turbo-20260402ERNIE-4.5-Turbo-VLERNIE-4.5-Turbo-VL-32KERNIE-4.5-8KERNIE-4.5-0.3BERNIE-Speed-Pro-128KERNIE-Lite-Pro-128Kernie-char-8kernie-char-fiction-8kERNIE-X1.1-PreviewERNIE-X1.1ERNIE-X1-Turbo-32KERNIE-X1-Turbo-32K-PreviewQianfan-Check-VLQianfan-VL-70BQianfan-VL-8BQianfan-VL-1.5-FlashQianfan-CompositionQianfan-FuncCallerQianfan-ToyTalkQianfan-OCRQianfan-OCR-FastMuseSteamer-Air-ImageMuseSteamer-Air-I2Vernie-image-turboernie-irag-edit
ERNIE-5.1
文心 5.1 旗舰,128K 上下文;输入 ¥4、输出 ¥18/百万 tokens(≤32K 输入档),适合复杂 Agent 与中文场景。
ERNIE-5.0
文心 5.0 原生全模态旗舰;输入 ¥6、输出 ¥24/百万 tokens,支持文本/图像/音频/视频联合建模。
ERNIE-5.0-Thinking-Preview
文心 5.0 思考预览版,输出含思维链;按 token 计费,适合需要可见推理链路的任务。
ERNIE-5.0-Thinking-Latest
文心 5.0 思考最新版,与 Preview 同价档;适合复杂推理与 Agent 决策节点。
ERNIE-5.0-Thinking-Exp
文心 5.0 思考实验版,定价与 5.0 思考系列一致;实验能力以控制台可用性为准。
更多模型详情请查看官网
其余核心模型名称仍在上方展示,完整说明以官网最新页面为准。
套餐详情
用量
ERNIE-Lite-Pro-128K 是文心 API 最低刊例价入口,输入 ¥0.2、输出 ¥0.4/百万 tokens,适合客服问答、简单抽取和高并发轻量任务。
模型
128K 上下文与 10K RPM 默认流控,适合作为成本敏感场景的默认承接层,质量要求更高时再路由到 Turbo 或 5.x。
特点
若你的主要目标是控制预算并放大吞吐,Lite Pro 通常比直接上 Turbo 更经济。
适合人群
高并发轻量问答、成本敏感的基础流量
用量
ERNIE-4.5-Turbo 系列(128K/32K/20260402 等版本)输入 ¥0.8、输出 ¥3.2/百万 tokens,缓存命中输入降至 ¥0.2,适合大多数生产流量的默认层。
模型
支持搜索增强(触发时 ¥0.004/次)与 Batch 推理折扣;适合知识助手、流程机器人和标准 Agent 任务。
特点
如果你想在成本与能力间找平衡,Turbo 通常是最自然的生产默认模型。
适合人群
通用生产问答、知识助手与重视性价比的团队
用量
ERNIE-5.1 是千帆当前最新旗舰,≤32K 输入档输入 ¥4、输出 ¥18/百万 tokens;适合复杂 Agent、长文档理解与关键业务节点。
模型
128K 上下文,原生全模态能力;比 ERNIE 5.0 更新且同档输入更便宜,适合作为新项目的旗舰首选。
特点
更适合关键路径路由,而不是把全部流量都上旗舰。
适合人群
复杂 Agent、关键业务流程与高价值输出场景
用量
ERNIE-5.0 及 Thinking 系列 ≤32K 输入档输入 ¥6、输出 ¥24/百万 tokens;原生全模态统一建模,适合复杂推理与高价值任务。
模型
Thinking Preview/Latest/Exp 输出含思维链,适合需要深度推理可见性的 Agent 决策环节。
特点
新部署可优先评估 ERNIE-5.1;5.0 仍适合已有集成或需要特定 Thinking 版本的场景。
适合人群
复杂推理、全模态任务与核心内容生成团队
注意事项
- 官方定价按千 token 展示,站内统一换算为百万 token 口径便于横向比较;ERNIE 5.0/5.1 长上下文(>32K 输入)有更高单价档。
- Turbo 系列支持缓存命中(输入 ¥0.2/百万 tokens)与搜索增强附加费;Batch 推理部分模型有折扣价。
- 图像生成(ernie-image-turbo、musesteamer-air-image)与 OCR 按张或按 token 计费,与纯文本 API 口径不同,需单独估算。
- 除按 token 后付费外,千帆还提供预购量包(按量包付费):百度自研系列含 Lite Pro / Speed Pro / Turbo 32K·128K / Turbo VL 32K / X1-Turbo-32K 等,规格多为 1 亿·5 亿·10 亿·50 亿 tokens,有效期 6–12 个月、有折扣(如 Lite Pro 1 亿折后 ¥22.5/12 个月、Turbo 128K 1 亿折后 ¥126/6 个月)。稳定跑量往往比纯后付费更省;本站 entryPrice 与 tiers 仍按后付费单价展示,量包细节以控制台订单页为准。
- 联网搜索另售按次量包:10,000 次/6 个月折后 ¥38、50,000 次折后 ¥190;触发搜索增强时优先抵扣量包,耗尽后恢复 ¥0.004/次后付费。账户欠费但量包/Tpm 预付费未用完时,推理仍可调用,搜索按次仍会继续出账。
支持的编程工具
OpenAI-compatible APIAnthropic-compatible APIWeb SearchBatch inferenceContext cache
价格与模型数据均来源于厂商官方网站
常见问题
常见问题11 条