当前位置:首页 > 科技资讯 > 正文

DeepSeek-V3.1:智能体时代的新篇章

DeepSeek-V3.1 震撼发布,作为业界首款「混合推理」模型,它预示着智能体新时代的到来。该模型拥有671B的参数量,在编程和推理能力上全面超越DeepSeek-R1及Claude 4 Opus,登顶编程开源领域的巅峰。

震撼发布!

刚刚,DeepSeek正式推出了DeepSeek-V3.1,这是智能体时代的重要一步。

全新V3.1版本引入了「混合推理」概念,一个模型,两种模式:思考模式与非思考模式(可自主切换)。

DeepSeek-V3.1:智能体时代的新篇章 DeepSeek-V3.1 混合推理 智能体 编程开源 第1张

相较于DeepSeek-R1-0528,DeepSeek-V3.1-Think在推理速度上更快。

最重要的是,V3.1展现了强大的智能体能力,无论是工具使用还是多步骤任务,都能轻松应对。

在软件工程基准测试中,DeepSeek-V3.1全面超越了V3-0324和R1-0528。

DeepSeek-V3.1:智能体时代的新篇章 DeepSeek-V3.1 混合推理 智能体 编程开源 第2张

在人类最后的考试HLE中,V3.1取得了29.8的高分,同时在数学、知识问答、编程等任务中也全面超越了推理模型R1。

DeepSeek-V3.1:智能体时代的新篇章 DeepSeek-V3.1 混合推理 智能体 编程开源 第3张

经过CoT压缩训练后,V3.1-Think在输出token减少了20%-50%,与R1-0528持平。

在Hugging Face上,DeepSeek共开源了两款V3.1版本,Base版本在V3的基础上进行了8400亿token的持续预训练,扩展了上下文支持。

DeepSeek-V3.1:智能体时代的新篇章 DeepSeek-V3.1 混合推理 智能体 编程开源 第4张

项目地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Basehttps://huggingface.co/deepseek-ai/DeepSeek-V3.1

总的来说,DeepSeek-V3.1此次更新的亮点包括:

总参数达671B,激活参数为37B,上下文支持为128k。

混合推理模式:一个模型同时支持推理模式和非推理模式。

增强的工具调用能力:工具使用和智能体任务能力显著提升,多步推理能力加强,处理复杂搜索游刃有余。

更高的推理效率:回答质量与DeepSeek-R1-0528相当,思考效率大幅提升,反应迅速。

全面的基准测试:全面超越DeepSeek-R1-0528和DeepSeek-V3-0324。

在API方面,deepseek-chat为非思考模式,deepseek-reasoner为思考模式,均支持128k的上下文支持。

DeepSeek-V3.1:智能体时代的新篇章 DeepSeek-V3.1 混合推理 智能体 编程开源 第5张

自9月5日起,将采用新的API定价。

继OpenAI的gpt-oss之后,DeepSeek终于给出了最强回应。

DeepSeek-V3.1:智能体时代的新篇章 DeepSeek-V3.1 混合推理 智能体 编程开源 第6张

V3.1编程力压Claude 4,训练扩增十倍

HF模型卡中详细介绍了DeepSeek新模型的技术细节。

基于DeepSeek-V3.1-Base,通过后续训练和优化完成了DeepSeek-V3.1。而V3.1-Base又是基于V3模型进行训练的。

免费服务器阿里云服务器