当前位置:首页 > 科技资讯 > 正文

DeepSeek-V3.2引领开源模型新时代,挑战全球顶尖性能

DeepSeek致力于让开源模型重返巅峰。

智东西12月2日讯,昨晚,DeepSeek推出了两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。这两款模型代表了DeepSeek当前最强的性能,在推理、智能体等多个领域的基准测试中,取得了全球开源模型第一的佳绩。

据DeepSeek介绍,标准版的DeepSeek-V3.2在公开的推理类基准测试中,达到了GPT-5的水平,仅次于Gemini-3.0-Pro;相较于Kimi-K2-Thinking,V3.2的输出长度大幅减少,显著降低了计算开销和用户等待时间。

长思考增强版DeepSeek-V3.2-Speciale结合了DeepSeek-Math-V2的定理证明能力,具备较强的指令跟随、数学证明与逻辑验证能力,在主流推理基准测试上的表现可媲美Gemini-3.0-Pro

DeepSeek-V3.2引领开源模型新时代,挑战全球顶尖性能 DeepSeek-V3.2 开源模型 DSA 智能体 第1张

在开源领域,DeepSeek-V3.2同样占据领先地位。据权威大模型测评平台Artificial Analysis数据显示,未计入DeepSeek-V3.2时,业内智能水平最高的开源模型为Kimi-K2-Thinking。

DeepSeek-V3.2引领开源模型新时代,挑战全球顶尖性能 DeepSeek-V3.2 开源模型 DSA 智能体 第2张

在两款模型均公布结果且测试设置相同的基准测试中,DeepSeek-V3.2均优于Kimi-K2-Thinking。

DeepSeek-V3.2引领开源模型新时代,挑战全球顶尖性能 DeepSeek-V3.2 开源模型 DSA 智能体 第3张

数据来源于官方渠道。此外,DeepSeek-V3.2是首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用。

DeepSeek-V3.2引领开源模型新时代,挑战全球顶尖性能 DeepSeek-V3.2 开源模型 DSA 智能体 第4张

在智能体评测中,DeepSeek-V3.2达到了当前开源模型的最高水平,大幅缩小了开源模型与闭源模型的差距。值得注意的是,V3.2并未针对这些测试集的工具进行特殊训练,这意味着它在真实应用场景中能够展现出较强的泛化性。

DeepSeek-V3.2引领开源模型新时代,挑战全球顶尖性能 DeepSeek-V3.2 开源模型 DSA 智能体 第5张

此外,DeepSeek-V3.2-Speciale模型还在IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025中荣获金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

DeepSeek-V3.2引领开源模型新时代,挑战全球顶尖性能 DeepSeek-V3.2 开源模型 DSA 智能体 第6张

尽管Speciale模型在高度复杂任务上表现优异,但其消耗的Tokens也显著增加,成本更高。目前,DeepSeek-V3.2-Speciale仅供研究使用,不支持工具调用,且未针对日常对话与写作任务进行专项优化。

目前,DeepSeek官方网页端、App和API已更新为正式版DeepSeek-V3.2。Speciale版本则以临时API服务形式开放,供社区评测与研究。同时,技术报告也同步发布。

值得一提的是,技术报告的作者名单中不乏熟悉的面孔,如DeepSeek创始人兼CEO梁文锋、在乌镇世界互联网大会上代表DeepSeek发言的研究员陈德里等。

DeepSeek-V3.2引领开源模型新时代,挑战全球顶尖性能 DeepSeek-V3.2 开源模型 DSA 智能体 第7张