当前位置:首页 > 科技资讯 > 正文

阿联酋推出高性能K2-Think模型,引领AI推理新纪元

阿联酋推出高性能K2-Think模型,引领AI推理新纪元 K2-Think AI推理 开源模型 数学性能 第1张

阿联酋近日宣布了一项重大突破,其高性能推理模型K2-Think正式开源!

据智东西9月10日消息,阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)携手AI创企G42,共同推出了这款全新低成本推理模型K2-Think。相关论文已在arXiv预印本平台发表,而模型本身也在Hugging Face和GitHub上开源。

K2-Think拥有高达320亿个参数,是基于阿里巴巴的开源模型Qwen 2.5构建而成。其性能表现卓越,甚至超越了参数规模是其20倍的OpenAI和DeepSeek旗舰推理模型。

复杂数学任务基准测试中,K2-Think的平均得分超过了GPT-OSS、DeepSeek V3.1、Qwen3 235B-A22B等一众开源模型。

阿联酋推出高性能K2-Think模型,引领AI推理新纪元 K2-Think AI推理 开源模型 数学性能 第2张

K2-Think背后的技术创新令人瞩目。研究人员通过监督微调扩展了基础模型的思维链能力,利用可验证奖励强化学习(RLVR)增强推理性能,并引入推理时间技术进行模型优化。此外,K2-Think在部署时还进行了两项速度优化,包括推测解码Cerebras的晶圆级芯片的使用。

阿联酋推出高性能K2-Think模型,引领AI推理新纪元 K2-Think AI推理 开源模型 数学性能 第3张

值得一提的是,K2-Think被部署在Cerebras的晶圆级芯片WSE系统上,该系统的性能极为出色,每秒可交付约2000个token,相比在NVIDIA H100/H200 GPU等常规部署环境中的表现,性能提升了10倍。

阿联酋推出高性能K2-Think模型,引领AI推理新纪元 K2-Think AI推理 开源模型 数学性能 第4张

K2-Think的权重、训练数据、部署代码和测试时优化代码已在Hugging Face和GitHub上开源。

阿联酋推出高性能K2-Think模型,引领AI推理新纪元 K2-Think AI推理 开源模型 数学性能 第5张

K2-Think的推出不仅展示了阿联酋在AI领域的强大实力,也为全球AI研究者提供了新的思路和工具。该模型的开源地址如下:

Hugging Face地址:https://huggingface.co/LLM36...

GitHub地址:https://github.com...

https://github.com...

K2-Think主页:https://www.k...

技术报告:https://arxiv.org...

领先性能与技术创新并驱,K2-Think引领AI推理新篇章

MBZUAI校长兼首席AI研究员Eric Xing在接受外媒采访时透露,K2-Think采用数千个GPU开发,最终的训练过程涉及多达30...