当前位置:首页 > 科技资讯 > 正文

开源模型崛起:DeepSeek-R1与Kimi K2 Thinking重塑AI版图

2025年前盛行的闭源+重资本范式,如今正遭受DeepSeek-R1与月之暗面Kimi K2 Thinking的强烈挑战。这两大开源巨作,凭借数百万美元的成本,利用MoE与MuonClip等优化技术,在SWE-Bench与BrowseComp等基准测试中追平甚至超越了GPT-5,并以更低的API价格与本地部署方案,撬动了市场预期,促使行业从砸钱堆料转向架构创新与稳定训练的高效路线。

在2025年以前,AI界普遍相信:唯有闭源、巨额投入和疯狂堆算力,方能打造最强大的模型。然而,这一信念正随着DeepSeek-R1与Kimi K2 Thinking的崛起而动摇。

年初,一家中国初创公司深度求索发布了DeepSeek-R1模型,不仅开源,而且性能堪比OpenAI顶级模型。更令人震惊的是,其训练成本仅为约560万美元,远低于行业普遍认为的“烧钱”级别。此举直接挑战了开发AI必须投入天量资金和算力的传统观念。

信念的第一次动摇,DeepSeek-R1横空出世

DeepSeek-R1发布后一周内,其App下载量迅速攀升,超越ChatGPT,登顶美国苹果App Store免费榜。这一景象令业界震惊,也标志着开源AI应用在美国用户中的受欢迎程度首次超过了闭源巨头的产品。

开源低成本路线的核弹,Kimi K2 Thinking震撼登场

紧接着,月之暗面发布了最新的开源巨模型Kimi K2 Thinking(简称K2 Thinking),以开源身份在多个关键基准上追平甚至超越了OpenAI的旗舰GPT-5。这一成就再次证明了开源模型与顶级闭源模型之间性能鸿沟的实质性塌陷。

K2 Thinking在综合编程挑战「SWE-Bench Verified」上取得了71.3%的通过率,略高于GPT-5的成绩。甚至在复杂网页搜索推理任务BrowseComp上,以60.2%对54.9%的得分大幅领先GPT-5。这些数字宣示了一个历史拐点:开源模型在高端推理和编码能力上与封闭系统平起平坐。

技术路径的胜利,巧用架构胜过砸钱堆料

K2 Thinking的成功并非偶然,而是技术路线差异带来的成本逆袭。它采用混合专家架构,将庞大模型划分为384个专长各异的专家模块。这一架构设计让K2 Thinking在推理时既聪明又节省:“大而不笨重”。

开源风暴的经济学冲击

当技术壁垒被攻克,开源路线在经济层面的优势便愈发凸显。K2 Thinking的模型权重可在相应许可证条款下自由下载部署,而OpenAI等闭源模式则通过昂贵API提供访问。这使得K2 Thinking在成本上更具竞争力,对开发者和企业而言极具诱惑力。

行业叙事的改写与泡沫的冷却

DeepSeek和Kimi K2 Thinking带来的不仅是“追赶”,更是对旧路线的证伪。它们证明“性能领先的最后20%”或许并非大多数用户真正需要的,尤其如果为此要付出十倍乃至百倍的价格。行业叙事正在转向:与其痴迷于砸钱堆出更大模型,不如在架构创新和工程稳定性上下功夫。