当前位置：首页 > 科技资讯 > 正文

DeepSeek-V3.1：智能体时代的新篇章

DeepSeek-V3.1 震撼发布，作为业界首款「混合推理」模型，它预示着智能体新时代的到来。该模型拥有671B的参数量，在编程和推理能力上全面超越DeepSeek-R1及Claude 4 Opus，登顶编程开源领域的巅峰。

震撼发布！

刚刚，DeepSeek正式推出了DeepSeek-V3.1，这是智能体时代的重要一步。

全新V3.1版本引入了「混合推理」概念，一个模型，两种模式：思考模式与非思考模式（可自主切换）。

DeepSeek-V3.1：智能体时代的新篇章 DeepSeek-V3.1 混合推理智能体编程开源第1张

相较于DeepSeek-R1-0528，DeepSeek-V3.1-Think在推理速度上更快。

最重要的是，V3.1展现了强大的智能体能力，无论是工具使用还是多步骤任务，都能轻松应对。

在软件工程基准测试中，DeepSeek-V3.1全面超越了V3-0324和R1-0528。

DeepSeek-V3.1：智能体时代的新篇章 DeepSeek-V3.1 混合推理智能体编程开源第2张

在人类最后的考试HLE中，V3.1取得了29.8的高分，同时在数学、知识问答、编程等任务中也全面超越了推理模型R1。

DeepSeek-V3.1：智能体时代的新篇章 DeepSeek-V3.1 混合推理智能体编程开源第3张

经过CoT压缩训练后，V3.1-Think在输出token减少了20%-50%，与R1-0528持平。

在Hugging Face上，DeepSeek共开源了两款V3.1版本，Base版本在V3的基础上进行了8400亿token的持续预训练，扩展了上下文支持。

DeepSeek-V3.1：智能体时代的新篇章 DeepSeek-V3.1 混合推理智能体编程开源第4张

总的来说，DeepSeek-V3.1此次更新的亮点包括：

总参数达671B，激活参数为37B，上下文支持为128k。

混合推理模式：一个模型同时支持推理模式和非推理模式。

增强的工具调用能力：工具使用和智能体任务能力显著提升，多步推理能力加强，处理复杂搜索游刃有余。

更高的推理效率：回答质量与DeepSeek-R1-0528相当，思考效率大幅提升，反应迅速。

全面的基准测试：全面超越DeepSeek-R1-0528和DeepSeek-V3-0324。

在API方面，deepseek-chat为非思考模式，deepseek-reasoner为思考模式，均支持128k的上下文支持。

DeepSeek-V3.1：智能体时代的新篇章 DeepSeek-V3.1 混合推理智能体编程开源第5张

自9月5日起，将采用新的API定价。

继OpenAI的gpt-oss之后，DeepSeek终于给出了最强回应。

DeepSeek-V3.1：智能体时代的新篇章 DeepSeek-V3.1 混合推理智能体编程开源第6张

V3.1编程力压Claude 4，训练扩增十倍

HF模型卡中详细介绍了DeepSeek新模型的技术细节。

基于DeepSeek-V3.1-Base，通过后续训练和优化完成了DeepSeek-V3.1。而V3.1-Base又是基于V3模型进行训练的。

本文由主机测评网于2026-04-24发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260439933.html