DeepSeek致力于让开源模型重返巅峰。
智东西12月2日讯,昨晚,DeepSeek推出了两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。这两款模型代表了DeepSeek当前最强的性能,在推理、智能体等多个领域的基准测试中,取得了全球开源模型第一的佳绩。
据DeepSeek介绍,标准版的DeepSeek-V3.2在公开的推理类基准测试中,达到了GPT-5的水平,仅次于Gemini-3.0-Pro;相较于Kimi-K2-Thinking,V3.2的输出长度大幅减少,显著降低了计算开销和用户等待时间。
长思考增强版DeepSeek-V3.2-Speciale结合了DeepSeek-Math-V2的定理证明能力,具备较强的指令跟随、数学证明与逻辑验证能力,在主流推理基准测试上的表现可媲美Gemini-3.0-Pro。
在开源领域,DeepSeek-V3.2同样占据领先地位。据权威大模型测评平台Artificial Analysis数据显示,未计入DeepSeek-V3.2时,业内智能水平最高的开源模型为Kimi-K2-Thinking。
在两款模型均公布结果且测试设置相同的基准测试中,DeepSeek-V3.2均优于Kimi-K2-Thinking。
数据来源于官方渠道。此外,DeepSeek-V3.2是首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用。
在智能体评测中,DeepSeek-V3.2达到了当前开源模型的最高水平,大幅缩小了开源模型与闭源模型的差距。值得注意的是,V3.2并未针对这些测试集的工具进行特殊训练,这意味着它在真实应用场景中能够展现出较强的泛化性。
此外,DeepSeek-V3.2-Speciale模型还在IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025中荣获金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。
尽管Speciale模型在高度复杂任务上表现优异,但其消耗的Tokens也显著增加,成本更高。目前,DeepSeek-V3.2-Speciale仅供研究使用,不支持工具调用,且未针对日常对话与写作任务进行专项优化。
目前,DeepSeek官方网页端、App和API已更新为正式版DeepSeek-V3.2。Speciale版本则以临时API服务形式开放,供社区评测与研究。同时,技术报告也同步发布。
值得一提的是,技术报告的作者名单中不乏熟悉的面孔,如DeepSeek创始人兼CEO梁文锋、在乌镇世界互联网大会上代表DeepSeek发言的研究员陈德里等。
本文由主机测评网于2026-05-19发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545416.html