Kimi K2 Thinking震撼发布：智能思考模型新标杆

Kimi K2 Thinking，现已发布并开源！

主打一个“模型即Agent”，不仅是Kimi“迄今能力最强的开源思考模型”，还掌握边思考，边使用工具的能力——

无需人工干预，即可执行200-300次连续工具调用。

Kimi K2 Thinking震撼发布：智能思考模型新标杆 Thinking 智能思考模型开源 Agentic编程第1张

作为今年最受关注的开源模型系列之一，Kimi K2的Thinking版本一上线，就成为热议对象：再次缩小了开源模型与闭源模型的差距。

Kimi K2 Thinking震撼发布：智能思考模型新标杆 Thinking 智能思考模型开源 Agentic编程第2张

更多技术细节速览在此：

1TB参数，激活参数32B，采用INT4而非FP8。

256K上下文窗口。

更多专家，更少head，更多思考。

Kimi K2 Thinking震撼发布：智能思考模型新标杆 Thinking 智能思考模型开源 Agentic编程第3张

在人类最后的考试（HLE）、测试自主网络浏览能力的BrowseComp，和复杂信息收集推理基准测试SEAL-0等评测基准中，Kimi K2 Thinking都刷新了SOTA，超越GPT-5、Claude Sonnet 4.5（Thinking）等闭源模型。

Kimi K2 Thinking震撼发布：智能思考模型新标杆 Thinking 智能思考模型开源 Agentic编程第4张

Kimi K2 Thinking的代码和权重均遵循最为宽松的MIT协议。新模型也已第一时间上线kimi.com和最新版Kimi手机应用，即刻就能实测体验。API可通过Kimi开放平台访问。

技术细节

官方提到，K2 Thinking是月之暗面在Test-Time Scaling（测试时扩展）领域的最新进展，通过同时扩展思考Token和工具调用轮次，模型实现了更强的Agent和推理性能。

体现在测试上，在人类最后的考试（HLE）中，允许使用工具——搜索、Python、网络浏览工具的同等情况下，Kimi K2 Thinking取得了44.9%的SOTA成绩。

Kimi K2 Thinking震撼发布：智能思考模型新标杆 Thinking 智能思考模型开源 Agentic编程第5张

在复杂搜索和浏览场景中，Kimi K2 Thinking也表现出色。

更多测试实例，可以在官方技术博客中查看，我们也第一时间简单测试了一波（仅开启长思考模式，未联网）。

本文由主机测评网于2026-05-09发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260544080.html