当前位置:首页 > 科技资讯 > 正文

DeepSeek V3.2震撼发布:推理更强,成本更低,开源挑战巨头

小雷发现,DeepSeek似乎真的喜欢给大伙儿制造惊喜。

12月1日晚,DeepSeek突然宣布:V3.2版本正式上线,并向所有用户开放。同时,也在各个开源社区上传了V3.2的本地部署模型供所有用户使用。从官方公布的测试结果来看,DeepSeek V3.2的推理能力已经基本与OpenAI的GPT-5相近,但其成本却远低于GPT-5,这一特点足以让不少人为之兴奋。

好了,闲话少说,让我们直接看看DeepSeek这次带来了哪些提升。

推理更强还更便宜

DeepSeek V3.2有两个版本,一个是可以在DeepSeek官方网站上免费使用的DeepSeek V3.2版,另一个则是仅支持API服务访问的DeepSeek V3.2-Speciale。从官方描述来看,Speciale版拥有更强的推理能力,主要用于探索模型能力的上限。

V3.2-Speciale除了会主动进入“长思考加强”模式外,还结合了DeepSeek-Math-V2的定理证明能力,使其拥有更强的指令跟随、数学证明和逻辑验证能力。在官方测试中,V3.2-Speciale的推理基准测试成绩直接媲美最新的Gemini-3.0-Pro。

DeepSeek V3.2震撼发布:推理更强,成本更低,开源挑战巨头 V3.2 开源模型 DSA机制 成本降低 第1张

图源:DeepSeek

同时,DeepSeek用V3.2-Speciale测试了IMO 2025、CMO 2025、ICPC World Finals 2025及 IOI 2025等四项赛事的决赛试题,均获得金牌。

特别是在ICPC和IOI的测试中,直接达到人类选手第二及第十名的水平。由此可以看出,DeepSeek V3.2在编程等领域的进步显然更大。而且在横向对比中,DeepSeek V3.2-Speciale的赛事成绩也全部超越了GPT-5 High,给OpenAI来了个措手不及。

DeepSeek V3.2震撼发布:推理更强,成本更低,开源挑战巨头 V3.2 开源模型 DSA机制 成本降低 第2张

图源:DeepSeek

在官方的技术文档里,他们提到DeepSeek V3.2的主要突破是引入了DeepSeek Sparse Attention (DSA) 稀疏注意力机制,并通过双版本的设计来满足不同场景下的推理需求。

DSA机制的部署从根本上解决了AI大模型在注意力方面的效率问题。具体来说,传统的注意力机制在运行时会计算序列中所有元素之间的关联,而DSA则是“有选择”地计算部分关键元素之间的关联,从而显著降低计算需求。

事实上,类似的技术在年初的论文里DeepSeek就已经预告过。当时小雷还写了一篇文章,对DeepSeek发布的全新注意力机制NSA进行了解读。但在后续的更新中,NSA机制一直没有公开露面。

现在看来并非遇到了困难,而是DeepSeek找到了更好的实现方式。年初论文里的NSA在处理长文本数据时,更像是制作一个索引来快速锁定区域进行信息检索。而DSA则类似于搜索引擎,在处理长文本时会先快速阅读全文,然后建立“闪电索引器”,后续需要检索数据时通过关键词快速确定相关内容。

DeepSeek V3.2震撼发布:推理更强,成本更低,开源挑战巨头 V3.2 开源模型 DSA机制 成本降低 第3张

图源:LLM

DSA不仅更智能和精准,而且消耗的资源还更低。在DSA机制的加持下,128K的序列推理成本可以降低60%以上,并且让推理速度提升约3.5倍速度,内存占用减少70%,同时模型性能没有明显下降。

根据官方数据,在H800集群上进行AI模型测试时,序列长度达到128K时,预填充阶段每百万token的成本从0.7美元降到了0.2美元左右,解码阶段从2.4美元降到了0.8美元。这使得DeepSeek V3.2可能成为同级别AI大模型中长文本推理成本最低的模型。

不仅会思考,还会用“工具”

除了DSA机制外,DeepSeek V3.2的另一个核心升级是允许AI大模型在思考模式下调用工具。官方表示其调用工具及使用工具的过程都无需训练,这使得DeepSeek V3.2拥有更强大的通用性能,并且作为开源模型可更好兼容使用者自制的工具。

为了验证新特性,小雷设计了一些问题来测试其回答效果。首先看看思考模式的表现:

问:A比B大三岁,B比C大两岁。五年后A的年龄刚好是C的两倍。问现在三个人多少岁?

DeepSeek V3.2震撼发布:推理更强,成本更低,开源挑战巨头 V3.2 开源模型 DSA机制 成本降低 第4张

DeepSeek V3.2震撼发布:推理更强,成本更低,开源挑战巨头 V3.2 开源模型 DSA机制 成本降低 第5张

DeepSeek V3.2震撼发布:推理更强,成本更低,开源挑战巨头 V3.2 开源模型 DSA机制 成本降低 第6张

可以看到DeepSeek在计算出结果后反复验证答案的正确性。虽然看起来有点浪费算力,但这种多次验证的思路是确保回答正确率的必要手段。

最强开源?OpenAI和Google又要头疼了

DeepSeek V3.2确实强大。但并未断崖式领先。从测试结果来看与GPT-5 High及Gemini 3.0 Pro有来有回。然而,一个能在多个权威基准中媲美GPT-5、Gemini 3.0 Pro且推理成本仅为行业主流模型三分之一甚至更低的模型以完全开源的方式放出后,将对整个市场造成冲击。这也是DeepSeek一直能颠覆行业的根本逻辑。

“开源模型永远落后闭源模型8个月”这一结论可能站不住脚了。DeepSeek V3.2的发布显然终结了这一争论。坚持全量开源的DeepSeek在引入DSA这种能显著降低成本、提升长文本能力的底层技术后让开源模型从‘追赶者’变成了反向倒逼闭源巨头的‘挑战者’。