阿联酋近日宣布了一项重大突破,其高性能推理模型K2-Think正式开源!
据智东西9月10日消息,阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)携手AI创企G42,共同推出了这款全新低成本推理模型K2-Think。相关论文已在arXiv预印本平台发表,而模型本身也在Hugging Face和GitHub上开源。
K2-Think拥有高达320亿个参数,是基于阿里巴巴的开源模型Qwen 2.5构建而成。其性能表现卓越,甚至超越了参数规模是其20倍的OpenAI和DeepSeek旗舰推理模型。
在复杂数学任务基准测试中,K2-Think的平均得分超过了GPT-OSS、DeepSeek V3.1、Qwen3 235B-A22B等一众开源模型。
K2-Think背后的技术创新令人瞩目。研究人员通过监督微调扩展了基础模型的思维链能力,利用可验证奖励强化学习(RLVR)增强推理性能,并引入推理时间技术进行模型优化。此外,K2-Think在部署时还进行了两项速度优化,包括推测解码和Cerebras的晶圆级芯片的使用。
值得一提的是,K2-Think被部署在Cerebras的晶圆级芯片WSE系统上,该系统的性能极为出色,每秒可交付约2000个token,相比在NVIDIA H100/H200 GPU等常规部署环境中的表现,性能提升了10倍。 K2-Think的权重、训练数据、部署代码和测试时优化代码已在Hugging Face和GitHub上开源。 K2-Think的推出不仅展示了阿联酋在AI领域的强大实力,也为全球AI研究者提供了新的思路和工具。该模型的开源地址如下: Hugging Face地址:https://huggingface.co/LLM36... GitHub地址:https://github.com... K2-Think主页:https://www.k... 技术报告:https://arxiv.org... MBZUAI校长兼首席AI研究员Eric Xing在接受外媒采访时透露,K2-Think采用数千个GPU开发,最终的训练过程涉及多达30...
领先性能与技术创新并驱,K2-Think引领AI推理新篇章
本文由主机测评网于2026-04-28发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260441076.html