核心模型
Kimi K2.7 CodeKimi K2.7 Code HighSpeedKimi K2.6Kimi K2.5Moonshot V1 128KMoonshot V1 32KMoonshot V1 8KMoonshot V1 128K VisionMoonshot V1 32K VisionMoonshot V1 8K Vision
Kimi K2.7 Code
当前 API 编程旗舰 `kimi-k2.7-code`:长上下文指令遵循更稳、编程成功率更高,仅思考模式;缓存命中 ¥1.30、未命中输入 ¥6.50、输出 ¥27.00 / 百万 tokens,上下文 262,144 tokens。
Kimi K2.7 Code HighSpeed
高速版 `kimi-k2.7-code-highspeed` 与标准版同模型,输出约 180 tokens/s(短上下文可达 260 tokens/s);缓存命中 ¥2.60、未命中输入 ¥13.00、输出 ¥54.00 / 百万 tokens,适合对延迟敏感的开发场景。
Kimi K2.6
当前 API 旗舰模型 `kimi-k2.6`:长程代码与 Agent 连续执行能力更强,支持视觉/视频输入与思考模式,缓存命中 ¥1.10、未命中输入 ¥6.50、输出 ¥27.00 / 百万 tokens,上下文 262,144 tokens。
Kimi K2.5
主流生产模型 `kimi-k2.5`:256k 上下文,覆盖代码、工具调用与 `$web_search`;缓存命中 ¥0.70、未命中输入 ¥4.00、输出 ¥21.00 / 百万 tokens,适合作为长期主力接入。
Moonshot V1 128K
经典长文本模型 `moonshot-v1-128k` 与 `moonshot-v1-128k-vision-preview`:输入 ¥10.00、输出 ¥30.00 / 百万 tokens,上下文 131,072 tokens;Vision 版支持图片理解并按同档计价。
更多模型详情请查看官网
其余核心模型名称仍在上方展示,完整说明以官网最新页面为准。
套餐详情
用量
kimi-k2.7-code 是 Kimi 迄今最智能的 Coding 模型,在长上下文中更可靠地遵循指令,编程任务成功率更高;仅支持思考模式,适合复杂工程、多步 Agent 与长链路代码改造。模型
kimi-k2.7-code-highspeed 与标准版同模型但输出更快(约 180 tokens/s,短上下文可达 260 tokens/s),单价翻倍,适合对响应速度敏感的开发交互场景。特点
支持文本、图片与视频输入,256k 上下文,ToolCalls、JSON Mode、Partial Mode 与自动上下文缓存;编程工具接入可参考 platform.kimi.com/docs/guide/agent-support。
未命中输入 ¥6.50、输出 ¥27.00 / 百万 tokens 与 K2.6 同档,但 K2.7 Code 专注编程场景;日常通用生产流量仍建议优先 K2.5,复杂代码节点再切 K2.7 Code。
未命中输入 ¥6.50、输出 ¥27.00 / 百万 tokens 与 K2.6 同档,但 K2.7 Code 专注编程场景;日常通用生产流量仍建议优先 K2.5,复杂代码节点再切 K2.7 Code。
适合人群
AI 编程工具、复杂代码 Agent、长上下文工程任务与对响应速度有要求的开发团队
用量
kimi-k2.6 是当前最智能的 API 模型,长程代码编写能力更强更稳,指令遵循与自我纠错也有明显提升,适合把复杂工程任务集中交给旗舰处理。模型
支持文本、图片与视频输入,思考与非思考模式,对话与 Agent 任务,并覆盖 ToolCalls、JSON Mode、Partial Mode、自动上下文缓存和联网搜索等能力。
特点
上下文 256k,更适合多步工具调用、长链路计划、复杂代码改造和研究型 Agent 等对持续执行能力要求更高的节点。
单价高于 K2.5,更像关键路径模型而非默认入口:真正复杂、重要、难容错的任务更适合交给它,日常高频流量仍可优先走 K2.5。
单价高于 K2.5,更像关键路径模型而非默认入口:真正复杂、重要、难容错的任务更适合交给它,日常高频流量仍可优先走 K2.5。
适合人群
复杂代码工作流、研究型 Agent、长链路规划和高价值分析任务团队
用量
kimi-k2.5 是主流生产模型,在 Agent、代码、视觉理解与通用智能任务上表现均衡,缓存命中输入价仅 ¥0.70/百万 tokens,更适合长期稳定跑量。模型
支持文本、图片与视频输入,思考与非思考模式,对话与 Agent 任务,并覆盖 ToolCalls、JSON Mode、Partial Mode、自动上下文缓存和联网搜索。
特点
上下文 256k,适合长文档问答、仓库级代码辅助、复杂资料整理和需要较长工具链的 Agent 场景,是多数团队更稳的统一接入入口。
如果你想在成本、长上下文能力和功能完整度之间找生产平衡点,K2.5 通常比直接全量上旗舰更合理,复杂节点再按需切到 K2.6。
如果你想在成本、长上下文能力和功能完整度之间找生产平衡点,K2.5 通常比直接全量上旗舰更合理,复杂节点再按需切到 K2.6。
适合人群
长文本应用、仓库级代码辅助、复杂资料整理和高频 Agent 服务团队
用量
Moonshot V1 是经典生成模型系列,按 8K、32K、128K 三种上下文长度定价,Vision Preview 版本与对应文本版价格相同,区别主要在上下文窗口大小。
模型
moonshot-v1-8k 输入 ¥2.00、输出 ¥10.00 / 百万 tokens,适合短文本、轻量问答和高频低成本调用;moonshot-v1-32k 为 ¥5/¥20,适合中等长度生成。特点
moonshot-v1-128k 输入 ¥10.00、输出 ¥30.00 / 百万 tokens,上下文 131,072 tokens,适合更长文档场景;Vision 系列(8K/32K/128K preview)按同档文本价计费。如果你只需要经典文本或图片理解、且对上下文长度有明确档位需求,V1 系列通常比 K2 多模态旗舰更便宜;复杂 Agent 与长程代码仍建议优先 K2.5 / K2.6。
适合人群
短文本生成、按上下文分档选型、Vision 图片理解与成本敏感的传统 NLP 场景
注意事项
- 官方以每百万 tokens(1M tokens)计价;K2.7 Code 为缓存命中 ¥1.30、未命中输入 ¥6.50、输出 ¥27.00,HighSpeed 版为 ¥2.60 / ¥13.00 / ¥54.00;K2.6 为 ¥1.10 / ¥6.50 / ¥27.00;K2.5 为 ¥0.70 / ¥4.00 / ¥21.00;Moonshot V1 按 8K/32K/128K 与 Vision 系列分别定价。
- 2026-06-12 至 07-02 有限时充值赠券活动:单笔充值满 ¥500 最高赠 30%,详见 platform.kimi.com/docs/pricing/promotion;结束时间以官网为准。
- 联网搜索 `$web_search` 每次成功触发另收 ¥0.03,搜索结果 token 会在下次 `/chat/completions` 调用时计入总消耗;做 Agent 时要把工具成本一起算进去。
- 文件抽取与存储接口限时免费,但抽取后的文档内容作为 Input 传给模型时仍按 token 计费;上传文档本身不产生额外文件接口费用。
支持的编程工具
OpenAI-compatible APIClaude CodeClineRoo Code
价格与模型数据均来源于厂商官方网站
常见问题
常见问题8 条