全球最快的开源大模型来袭——速度突破每秒2000个tokens!
虽然参数仅为320亿(32B),但其吞吐量却比典型GPU部署高出10倍以上。
这款模型由阿联酋的穆罕默德·本·扎耶德人工智能大学(MBZUAI)与初创公司G42 AI携手推出,名为K2 Think。
名字听起来是不是有些耳熟?
确实,它与最近推出的Kimi K2在命名上略有雷同,但MBZUAI的这款多了个“Think”。
值得一提的是,K2 Think的背后,有着浓厚的“made in China”印记。
从HuggingFace的Model tree来看,K2 Think是基于Qwen 2.5-32B打造的:
除了被誉为“全球最快的开源AI模型”,MBZUAI还宣称K2 Think是“有史以来最先进的开源AI推理系统”。
那么,它的实力究竟如何?让我们继续探索。
目前,K2 Think已开放体验地址(见文末)。
我们先以IMO的试题为例进行尝试:
Let a_n = 6^n + 8^n. Determine the remainder when dividing a_{83} by 49.
可以直观地看到,K2 Think在思考后迅速给出了答案,速度之快几乎达到了“瞬间”的效果。
从底部显示的速度来看,已经达到了2730.4 tokens/秒。
接下来,我们用中文测试一个经典问题:
Strawberry这个单词中有几个字母R?
速度依旧保持在2224.7 tokens/秒,并正确回答了问题:有3个R。
我们再来尝试几道AIME 2025的数学题:
Find the sum of all integer bases $b>9$ for which $17_{b}$ is a divisor of $97_{b}$.
Find the number of ordered pairs $(x,y)$, where both $x$ and $y$ are integers between $-1...
本文由主机测评网于2026-04-28发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260441103.html