就在昨晚,DeepSeek官方悄然更新了V3.1版本,将上下文长度拓展至惊人的128k。
此次开源的V3.1模型拥有685B参数,支持BF16到FP8的多种精度格式。
根据公开信息和国内大咖karminski3的实测,V3.1更新亮点包括:
编程能力:表现卓越,据社区使用Aider测试数据,V3.1在开源模型中独占鳌头。
性能突破:在Aider编程基准测试中取得71.6%高分,超越Claude Opus 4,推理和响应速度更快。
原生搜索:新增原生「search token」支持,搜索功能更加出色。
架构创新:线上模型去除「R1」标识,未来有望采用「混合架构」。
成本优势:每次完整编程任务仅需1.01美元,成本仅为专有系统的六十分之一。
值得一提的是,官方强调拓展至128K上下文,此前V3版本已支持。
更新发布后,用户反响热烈。
即便未公布模型卡,DeepSeek V3.1已在Hugging Face的趋势榜上攀升至第四。
DeepSeek粉丝数已突破8万大关。
网友们纷纷期待R2的发布!
最显著的变化是,DeepSeek在官方APP和网页端上去掉了深度思考(R1)中的「R1」标识。
与V3-base相比,DeepSeek V3.1新增了四个特殊Token:
<|search begin|> (id: 128796)
<|search end|> (id: 128797)
<think> (id: 128798)
</think> (id: 128799)
这被推测为推理模型与非推理模型融合的可能迹象。
在编程方面,根据网友分享的结果,DeepSeek V3.1在Aider Polyglot多语言编程测试中取得了71.6%的高分,击败了Claude 4 Opus和DeepSeek R1。
本文由主机测评网于2026-04-23发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439823.html