核心模型
Claude Opus 4.8Claude Sonnet 4.6Claude Haiku 4.5
Claude Opus 4.8
API 旗舰(claude-opus-4-8):$5 输入 / $25 输出 per MTok,1M 上下文,Adaptive thinking,适合复杂 Agent 与长程编码。
Claude Sonnet 4.6
生产主力(claude-sonnet-4-6):$3 / $15 per MTok,1M 上下文,日常 API 默认选型。
Claude Haiku 4.5
高速低成本(claude-haiku-4-5):$1 / $5 per MTok,200K 上下文,适合轻量与高并发前置任务。
套餐详情
用量
model id 为 claude-opus-4-8,当前 API 最强模型:输入 $5 / 百万 tokens、输出 $25 / 百万 tokens,1M 上下文、最大 128K 输出,带 Adaptive thinking 与 effort 控制。
模型
官方定位是复杂推理、长程 Agent 编码与高自主性任务;Messages API 同步输出上限 128K,Batch API 配合 beta header 可达 300K 输出。
特点
缓存未命中写入 5 分钟档 $6.25/M、命中读取 $0.50/M;适合长 system prompt、大型代码库上下文与重复 Agent 流水线。
适合把 Claude 当核心推理底座的生产 Agent、复杂代码改造与高 stakes 知识工作流。
适合把 Claude 当核心推理底座的生产 Agent、复杂代码改造与高 stakes 知识工作流。
适合人群
复杂 Agent、长程编码、需要最强推理能力的生产系统
用量
model id 为 claude-sonnet-4-6,速度与能力最均衡的日常主力:输入 $3 / 百万 tokens、输出 $15 / 百万 tokens,1M 上下文、最大 64K 输出。
模型
支持 Extended thinking 与 Adaptive thinking,比 Opus 更省成本,适合持续改代码、写文档、PR 评审与中等复杂度多轮对话。
特点
缓存命中 $0.30 / 百万 tokens;多数开发者应把 Sonnet 4.6 作为默认生产模型,难题再升 Opus 4.8。
适合高频 API 调用、团队共享后端与需要 1M 上下文但不必全程 Opus 的场景。
适合高频 API 调用、团队共享后端与需要 1M 上下文但不必全程 Opus 的场景。
适合人群
日常生产 API、平衡成本与能力的团队后端、1M 上下文工作流
用量
model id 为 claude-haiku-4-5(快照 claude-haiku-4-5-20251001):输入 $1 / 百万 tokens、输出 $5 / 百万 tokens,200K 上下文,延迟最低。
模型
接近前沿智能但成本最低,适合快速问答、分类路由、格式整理、子 Agent 与大量轻量请求的前置步骤。
特点
支持 Extended thinking(无 Adaptive thinking);缓存命中 $0.10 / 百万 tokens,Batch API 可进一步减半。
适合「Haiku 先跑一遍、复杂任务再升 Sonnet/Opus」的分层架构与成本敏感批量场景。
适合「Haiku 先跑一遍、复杂任务再升 Sonnet/Opus」的分层架构与成本敏感批量场景。
适合人群
高频轻量调用、子 Agent、分类路由与成本敏感批量任务
注意事项
- 下列为 Claude API 标准输入/输出刊例价(USD / 百万 tokens);Prompt caching 命中读取约为输入价的 10%(如 Opus 4.8 命中 $0.50/M)。
- Batch API 输入/输出约 50% 折扣,任务异步在 24 小时内完成;Priority Tier 提供更高吞吐,按官方 Priority 倍率计费。
- Opus 4.8 起 inference_geo: "us" 对所有 token 类别加收 1.1x;Bedrock/Vertex 区域与多区域端点亦可能有 10% 溢价。
- 旧版 Opus 4.1 / Sonnet 4 / Opus 4 已弃用并将退役;仍在计费的 4.5–4.7 代模型价格见 docs 定价表,新集成应优先 Opus 4.8 / Sonnet 4.6 / Haiku 4.5。
支持的编程工具
Anthropic APIMessages APIClaude CodeCursorClineAmazon BedrockVertex AI
价格与模型数据均来源于厂商官方网站
常见问题
常见问题7 条