当前位置:首页 > 科技资讯 > 正文

DeepSeek V3.1震撼发布:编程与推理性能再升级

就在昨晚,DeepSeek官方悄然更新了V3.1版本,将上下文长度拓展至惊人的128k。

DeepSeek V3.1震撼发布:编程与推理性能再升级 V3.1 编程能力 性能突破 第1张

此次开源的V3.1模型拥有685B参数,支持BF16到FP8的多种精度格式。

根据公开信息和国内大咖karminski3的实测,V3.1更新亮点包括:

编程能力:表现卓越,据社区使用Aider测试数据,V3.1在开源模型中独占鳌头。

性能突破:在Aider编程基准测试中取得71.6%高分,超越Claude Opus 4,推理和响应速度更快。

原生搜索:新增原生「search token」支持,搜索功能更加出色。

架构创新:线上模型去除「R1」标识,未来有望采用「混合架构」。

成本优势:每次完整编程任务仅需1.01美元,成本仅为专有系统的六十分之一。

值得一提的是,官方强调拓展至128K上下文,此前V3版本已支持。

DeepSeek V3.1震撼发布:编程与推理性能再升级 V3.1 编程能力 性能突破 第2张

更新发布后,用户反响热烈。

即便未公布模型卡,DeepSeek V3.1已在Hugging Face的趋势榜上攀升至第四。

DeepSeek V3.1震撼发布:编程与推理性能再升级 V3.1 编程能力 性能突破 第3张

DeepSeek V3.1震撼发布:编程与推理性能再升级 V3.1 编程能力 性能突破 第4张

DeepSeek粉丝数已突破8万大关。

网友们纷纷期待R2的发布!

DeepSeek V3.1震撼发布:编程与推理性能再升级 V3.1 编程能力 性能突破 第5张

混合推理,编程力压Claude 4

最显著的变化是,DeepSeek在官方APP和网页端上去掉了深度思考(R1)中的「R1」标识。

DeepSeek V3.1震撼发布:编程与推理性能再升级 V3.1 编程能力 性能突破 第6张

与V3-base相比,DeepSeek V3.1新增了四个特殊Token:

<|search begin|> (id: 128796)

<|search end|> (id: 128797)

<think> (id: 128798)

</think> (id: 128799)

DeepSeek V3.1震撼发布:编程与推理性能再升级 V3.1 编程能力 性能突破 第7张

这被推测为推理模型与非推理模型融合的可能迹象。

DeepSeek V3.1震撼发布:编程与推理性能再升级 V3.1 编程能力 性能突破 第8张

在编程方面,根据网友分享的结果,DeepSeek V3.1在Aider Polyglot多语言编程测试中取得了71.6%的高分,击败了Claude 4 Opus和DeepSeek R1。

免费vps免费服务器服务器教程