当前位置:首页 > 科技资讯 > 正文

开源与闭源模型差距扩大:DeepSeek V3.2报告揭示三大挑战

近日,DeepSeek发布了V3.2技术报告,其中揭示了令人惊讶的事实:开源大模型与闭源模型的性能差距不仅没有缩小,反而在扩大。这一结论基于大量实测数据,是对当前AI领域现状的冷静分析。

差距扩大:不可忽视的事实

2024年,随着DeepSeek、Qwen、GLM等开源模型的相继发布,业界曾普遍乐观地认为“8个月时间差”将促使开源模型迅速追赶闭源。然而,进入2025年后,情况发生了逆转。DeepSeek在论文中直言不讳地指出:“过去几个月,闭源专有模型的性能提升速度显著快于开源模型,导致两者差距不仅没有缩小,反而在扩大。”

数据支持了这一点。在多个基准测试中,DeepSeek V3.2与GPT-5、Gemini 3.0 Pro的表现对比显示,闭源模型在复杂任务上展现出越来越强的优势。

开源与闭源模型差距扩大:DeepSeek V3.2报告揭示三大挑战 DeepSeek 开源模型 闭源模型 性能差距 第1张

在更复杂的HLE测试中,Gemini 3.0 Pro的表现明显优于DeepSeek V3.2和GPT-5,进一步证明了两者间的巨大差距。

挑战与应对:开源模型的三大困境

论文分析了限制开源模型在复杂任务上表现的三个关键缺陷,这些并非表面问题,而是深层次的结构性困境。

首先,架构层面的限制。

开源模型普遍依赖传统的vanilla attention机制,这在处理长序列时效率极低。相比之下,闭源模型已经探索出更高效的注意力机制,这成为开源模型的一大劣势。

其次,资源投入的鸿沟。

后训练是模型从“会说话”到“会思考”的关键环节,但开源模型在后训练阶段的投入远远不足。DeepSeek V3.2的后训练计算预算甚至超过了预训练成本的10%,而大部分开源模型的后训练预算可能连1%都不到。

最后,AI Agent能力的滞后。

在真实场景中,开源模型的泛化能力和指令理解能力明显不足。这直接影响了它们在复杂多轮交互、工具调用、长期规划等场景下的表现。

DeepSeek的应对:技术路线的根本性改变

面对挑战,DeepSeek没有选择简单地堆砌参数或增加数据量,而是在三个核心维度上进行了根本性的技术创新。

在架构层面,DeepSeek引入了DSA(DeepSeek Sparse Attention)机制。

DSA通过“闪电索引器”快速计算每个token的重要性评分,并将复杂度从O(L²)降至O(L×k),从而大幅降低了推理成本。实测数据显示,DSA在降低推理成本的同时,性能几乎没有损失。

开源与闭源模型差距扩大:DeepSeek V3.2报告揭示三大挑战 DeepSeek 开源模型 闭源模型 性能差距 第2张

在资源投入层面,DeepSeek做出了超常规的决定。

DeepSeek为数学、编程、推理等六大领域分别训练了专家模型,并进行了大规模强化学习训练。在持续预训练阶段,模型经历了943.7B tokens的训练。

在Agent能力强化方面,DeepSeek开发了系统化的任务合成流程。

他们合成了超过1800个多样化环境和85,000条复杂提示。这些合成数据通过冷启动和规模化阶段生成高质量训练场景。

DeepSeek V3.2在Agent相关的测试中表现出色,显著缩小了与闭源模型的差距。论文总结道:“DeepSeek V3.2成为Agent场景中极具成本效益的选择。”

总结而言,DeepSeek V3.2报告揭示了开源模型面临的三大挑战以及DeepSeek的应对策略。这不仅是DeepSeek的技术突破,也是开源AI未来发展的启示:通过技术路线的创新,开源模型可以在资源有限的情况下实现与闭源模型相近的效果。

论文链接:https://arxiv.org/html/251...

整理:周华香