当前位置：首页 > 科技资讯 > 正文

开源与闭源模型差距扩大：DeepSeek V3.2报告揭示三大挑战

主机测评网
科技资讯
2026-05-22
521

近日，DeepSeek发布了V3.2技术报告，其中揭示了令人惊讶的事实：开源大模型与闭源模型的性能差距不仅没有缩小，反而在扩大。这一结论基于大量实测数据，是对当前AI领域现状的冷静分析。

差距扩大：不可忽视的事实

2024年，随着DeepSeek、Qwen、GLM等开源模型的相继发布，业界曾普遍乐观地认为“8个月时间差”将促使开源模型迅速追赶闭源。然而，进入2025年后，情况发生了逆转。DeepSeek在论文中直言不讳地指出：“过去几个月，闭源专有模型的性能提升速度显著快于开源模型，导致两者差距不仅没有缩小，反而在扩大。”

数据支持了这一点。在多个基准测试中，DeepSeek V3.2与GPT-5、Gemini 3.0 Pro的表现对比显示，闭源模型在复杂任务上展现出越来越强的优势。

开源与闭源模型差距扩大：DeepSeek V3.2报告揭示三大挑战 DeepSeek 开源模型闭源模型性能差距第1张

在更复杂的HLE测试中，Gemini 3.0 Pro的表现明显优于DeepSeek V3.2和GPT-5，进一步证明了两者间的巨大差距。

挑战与应对：开源模型的三大困境

论文分析了限制开源模型在复杂任务上表现的三个关键缺陷，这些并非表面问题，而是深层次的结构性困境。

首先，架构层面的限制。

开源模型普遍依赖传统的vanilla attention机制，这在处理长序列时效率极低。相比之下，闭源模型已经探索出更高效的注意力机制，这成为开源模型的一大劣势。

其次，资源投入的鸿沟。

后训练是模型从“会说话”到“会思考”的关键环节，但开源模型在后训练阶段的投入远远不足。DeepSeek V3.2的后训练计算预算甚至超过了预训练成本的10%，而大部分开源模型的后训练预算可能连1%都不到。

最后，AI Agent能力的滞后。

在真实场景中，开源模型的泛化能力和指令理解能力明显不足。这直接影响了它们在复杂多轮交互、工具调用、长期规划等场景下的表现。

DeepSeek的应对：技术路线的根本性改变

面对挑战，DeepSeek没有选择简单地堆砌参数或增加数据量，而是在三个核心维度上进行了根本性的技术创新。

在架构层面，DeepSeek引入了DSA（DeepSeek Sparse Attention）机制。

DSA通过“闪电索引器”快速计算每个token的重要性评分，并将复杂度从O(L²)降至O(L×k)，从而大幅降低了推理成本。实测数据显示，DSA在降低推理成本的同时，性能几乎没有损失。

开源与闭源模型差距扩大：DeepSeek V3.2报告揭示三大挑战 DeepSeek 开源模型闭源模型性能差距第2张

在资源投入层面，DeepSeek做出了超常规的决定。

DeepSeek为数学、编程、推理等六大领域分别训练了专家模型，并进行了大规模强化学习训练。在持续预训练阶段，模型经历了943.7B tokens的训练。

在Agent能力强化方面，DeepSeek开发了系统化的任务合成流程。

他们合成了超过1800个多样化环境和85,000条复杂提示。这些合成数据通过冷启动和规模化阶段生成高质量训练场景。

DeepSeek V3.2在Agent相关的测试中表现出色，显著缩小了与闭源模型的差距。论文总结道：“DeepSeek V3.2成为Agent场景中极具成本效益的选择。”

总结而言，DeepSeek V3.2报告揭示了开源模型面临的三大挑战以及DeepSeek的应对策略。这不仅是DeepSeek的技术突破，也是开源AI未来发展的启示：通过技术路线的创新，开源模型可以在资源有限的情况下实现与闭源模型相近的效果。

论文链接：https://arxiv.org/html/251...

整理：周华香

阿里云服务器性价比vps

本文由主机测评网于2026-05-22发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260545788.html

上一篇

AI时代创业新趋势：博士领衔，技术为王

下一篇

OpenAI打造AI版iPhone，硬件野心显露无疑