DeepSeek-V3.1 震撼发布,作为业界首款「混合推理」模型,它预示着智能体新时代的到来。该模型拥有671B的参数量,在编程和推理能力上全面超越DeepSeek-R1及Claude 4 Opus,登顶编程开源领域的巅峰。
震撼发布!
刚刚,DeepSeek正式推出了DeepSeek-V3.1,这是智能体时代的重要一步。
全新V3.1版本引入了「混合推理」概念,一个模型,两种模式:思考模式与非思考模式(可自主切换)。
相较于DeepSeek-R1-0528,DeepSeek-V3.1-Think在推理速度上更快。
最重要的是,V3.1展现了强大的智能体能力,无论是工具使用还是多步骤任务,都能轻松应对。
在软件工程基准测试中,DeepSeek-V3.1全面超越了V3-0324和R1-0528。
在人类最后的考试HLE中,V3.1取得了29.8的高分,同时在数学、知识问答、编程等任务中也全面超越了推理模型R1。
经过CoT压缩训练后,V3.1-Think在输出token减少了20%-50%,与R1-0528持平。
在Hugging Face上,DeepSeek共开源了两款V3.1版本,Base版本在V3的基础上进行了8400亿token的持续预训练,扩展了上下文支持。
项目地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Basehttps://huggingface.co/deepseek-ai/DeepSeek-V3.1
总的来说,DeepSeek-V3.1此次更新的亮点包括:
总参数达671B,激活参数为37B,上下文支持为128k。
混合推理模式:一个模型同时支持推理模式和非推理模式。
增强的工具调用能力:工具使用和智能体任务能力显著提升,多步推理能力加强,处理复杂搜索游刃有余。
更高的推理效率:回答质量与DeepSeek-R1-0528相当,思考效率大幅提升,反应迅速。
全面的基准测试:全面超越DeepSeek-R1-0528和DeepSeek-V3-0324。
在API方面,deepseek-chat为非思考模式,deepseek-reasoner为思考模式,均支持128k的上下文支持。
自9月5日起,将采用新的API定价。
继OpenAI的gpt-oss之后,DeepSeek终于给出了最强回应。
HF模型卡中详细介绍了DeepSeek新模型的技术细节。
基于DeepSeek-V3.1-Base,通过后续训练和优化完成了DeepSeek-V3.1。而V3.1-Base又是基于V3模型进行训练的。
本文由主机测评网于2026-04-24发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439933.html