当前位置:首页 > 科技资讯 > 正文

DeepSeek面临挑战:更新滞后与同行竞争压力增大

被梁文锋靠DeepSeek抢占风头近180天后,杨植麟正借助Kimi更新试图卷土重来。

近期,Kimi K2新模型发布后,外部试用反响热烈。Perplexity CEO阿拉温德宣布,内部将迅速采用K2进行后训练,以对外提供服务。此前DeepSeek R1上市后,也被第一时间引入Perplexity。

不仅Kimi试图通过模型更新从DeepSeek手中抢回关注,据字母榜(ID:wujicaijing)透露,7月底,“AI六小龙”中的阶跃星辰、智谱AI都将发布自研的新一代基础大模型,科大讯飞也将在月底推出全新模型。

当大模型玩家都在比拼模型更新和产品体验时,DeepSeek因缺乏大动作,流量和产品使用率不升反降。

自1月爆发式增长仅持续两个月后,DeepSeek月活跃用户数开始下滑。QuestMobile数据显示,截至5月,DeepSeek月活跃用户规模为1.69亿,环比下滑5.1%。

随着月活用户规模下降,DeepSeek的下载量排名也急剧下降。曾经在中美两地苹果App Store免费应用下载榜上夺冠的DeepSeek,如今已被挤出前30名。

来自SemiAnalysis半导体研究机构的报告直观展示了DeepSeek在用户使用率上的下降趋势——从年初7.5%的峰值降至5月底的3%,官网访问量也下降了29%。

梁文锋并非毫无准备。早在2月,路透社就爆料称,DeepSeek内部正在加速推出R2模型,原计划在5月初发布,但官方希望尽早推出。

然而直至7月中旬,R2模型仍未面世。The Information曾报道,阻碍R2模型上线的一大原因是英伟达H20芯片的意外禁售,导致DeepSeek在算力储备上出现短缺。梁文锋担心新模型上线后,因短时间内调用量过高而影响体验。

年初R1模型爆火后,梁文锋的低成本大模型训练方法意外带动了H20芯片在国内的需求。

自2023年以来,H20芯片是英伟达可合法出口至中国的最强AI芯片。但在DeepSeek影响下,4月美国实施新的出口管制许可,禁止其销售至中国市场。

如今,上述禁令出现转机。7月15日,在黄仁勋年内第三次访华之际,英伟达公告称正在提交重新销售H20芯片的申请,且美国政府已保证将授予许可证。接下来公司将尽快启动交付程序。

面对被同行抢跑的竞争格局和高端算力受阻的困境,梁文锋意外迎来了黄仁勋的及时雨。

A

R1发布近半年来,DeepSeek动作寥寥,陷入不进则退的现实困境。

在国内其他大模型玩家奋力追平乃至超越DeepSeek模型性能之际,梁文锋仅带领团队进行小范围更新,如DeepSeek V3模型完成小版本升级,上线新版本DeepSeek-V3-0324,随后又更新了基于DeepSeek-V3微调而来的DeepSeek-Prover-V2——一款数学定理证明模型。

最近的一次更新是5月底完成的DeepSeek R1小版本升级。但值得注意的是,DeepSeek-R1-0528仍然使用的是2024年12月发布的DeepSeek V3 Base模型微调而来,并非基于新一代的V4模型。

DeepSeek面临挑战:更新滞后与同行竞争压力增大 DeepSeek 模型更新 同行竞争 H20芯片 第1张

官方介绍称,DeepSeek-R1-0528在后训练过程中投入更多算力,提升模型的思维深度与推理能力。其在数学、编程等方面的表现逼近OpenAI o3与谷歌 Gemini-2.5-Pro等国际顶尖模型。

但缺乏大版本升级,只是在小版本上修修补补的DeepSeek遭遇的直观后果之一便是性价比标签被重新撕下。

一贯以性价比著称的DeepSeek在过去半年内正被阿里、字节、百度等科技大厂夺走性价比标签。科技大厂纷纷推出API价格更低的同类模型。

百度创始人李彦宏甚至直接吐槽DeepSeek除了没有多模态外,使用起来还慢且贵。如今蓄足实力的“AI六小龙”通过新模型更新也在性能和价格上挑战DeepSeek的性价比。

7月新上线的Kimi K2模型同样选择开源,成为国内首个总参数量达1万亿的MoE架构基础模型。在基准性能测试中取得开源模型中的SOTA成绩,在DeepSeek擅长的代码、数学推理任务上实现反超。

B

国产大模型玩家纷纷在性价比上抢跑。对比国外的OpenAI尽管各家推出平替模型但总调用量依然保持稳定秘诀在于其基础模型能力保持行业头部水平领先竞争对手近一代。

相比之下DeepSeek爆火出圈的R1仅达到比肩o1的水平而非彻底超越OpenAI。因此也能部分解释为何短短半年内DeepSeek官方应用和管网流量相继下跌而ChatGPT维持稳定增长。

但值得注意的是尽管DeepSeek自身流量在下滑第三方平台R1和V3模型的总使用量仍在持续快速增长。SemiAnalysis数据显示第三方平台托管的 R1 与 V3 使用量自R1发布以来已增长近 20 倍。

之所以会造成上述反差局面SemiAnalysis认为DeepSeek更多是败在了Token经济学上。

虽然外界一般以每百万 tokens的价格衡量模型性价比但这一方法并不总是有效或合理因为这忽略了具体工作负载和用户需求。

包括延迟(模型生成首个 token 所需时间)、吞吐率(每个token的生成速度)、上下文窗口等因素都会对最终token消耗成本产生直接影响。

典型如 DeepSeek 为了提供便宜模型其上下文窗口严格控制在了64K是一众主要模型提供商中最小的之一。

C

但DeepSeek终究不是慈善机构梁文锋尽管追求模型开源最终也希望通过开源生态实现商业化。

维持开发者群体活跃和自家产品用户使用率不仅必要而且对大模型玩家来说多多益善。

重新激活外界对DeepSeek的兴趣最直接的办法无疑是尽快推出新模型V4和R2。