当前位置:首页 > 科技资讯 > 正文

Kimi K2 Thinking震撼发布:智能思考模型新标杆

Kimi K2 Thinking,现已发布并开源

主打一个“模型即Agent”,不仅是Kimi“迄今能力最强的开源思考模型”,还掌握边思考,边使用工具的能力——

无需人工干预,即可执行200-300次连续工具调用

Kimi K2 Thinking震撼发布:智能思考模型新标杆 Thinking 智能思考模型 开源 Agentic编程 第1张

作为今年最受关注的开源模型系列之一,Kimi K2的Thinking版本一上线,就成为热议对象:再次缩小了开源模型与闭源模型的差距。

Kimi K2 Thinking震撼发布:智能思考模型新标杆 Thinking 智能思考模型 开源 Agentic编程 第2张

更多技术细节速览在此:

1TB参数,激活参数32B,采用INT4而非FP8。

256K上下文窗口。

更多专家,更少head,更多思考。

Kimi K2 Thinking震撼发布:智能思考模型新标杆 Thinking 智能思考模型 开源 Agentic编程 第3张

在人类最后的考试(HLE)、测试自主网络浏览能力的BrowseComp,和复杂信息收集推理基准测试SEAL-0等评测基准中,Kimi K2 Thinking都刷新了SOTA,超越GPT-5、Claude Sonnet 4.5(Thinking)等闭源模型。

Kimi K2 Thinking震撼发布:智能思考模型新标杆 Thinking 智能思考模型 开源 Agentic编程 第4张

Kimi K2 Thinking的代码和权重均遵循最为宽松的MIT协议。新模型也已第一时间上线kimi.com和最新版Kimi手机应用,即刻就能实测体验。API可通过Kimi开放平台访问。

技术细节

官方提到,K2 Thinking是月之暗面在Test-Time Scaling(测试时扩展)领域的最新进展,通过同时扩展思考Token和工具调用轮次,模型实现了更强的Agent和推理性能。

智能体、推理能力全面提升

体现在测试上,在人类最后的考试(HLE)中,允许使用工具——搜索、Python、网络浏览工具的同等情况下,Kimi K2 Thinking取得了44.9%的SOTA成绩。

Kimi K2 Thinking震撼发布:智能思考模型新标杆 Thinking 智能思考模型 开源 Agentic编程 第5张

自主搜索与浏览能力全面提升

在复杂搜索和浏览场景中,Kimi K2 Thinking也表现出色。

Agentic编程能力增强

通用基础能力升级

原生INT4量化

上手实测

更多测试实例,可以在官方技术博客中查看,我们也第一时间简单测试了一波(仅开启长思考模式,未联网)。