当前位置:首页 > 科技资讯 > 正文

DeepSeek V3.1升级:更强上下文理解与开源体验

DeepSeek V3.1升级:更强上下文理解与开源体验 V3.1 上下文窗口 开源 模型升级 第1张

智东西8月20日报道,DeepSeek在官方群宣布其线上版本模型已升级至DeepSeek V3.1,此次升级显著扩展了上下文窗口,从原有的64k增至128k,用户可在网页、App及小程序中体验这一新模型。

DeepSeek V3.1升级:更强上下文理解与开源体验 V3.1 上下文窗口 开源 模型升级 第2张

值得注意的是,DeepSeek将App及网页端的“深度思考(R1)”更名为“深度思考”,市场猜测这可能预示着推理模型与非推理模型的融合,但官方尚未明确此改动。

DeepSeek V3.1升级:更强上下文理解与开源体验 V3.1 上下文窗口 开源 模型升级 第3张

该模型现已在Hugging Face平台开源,目前仅开放了未经指令微调的Base版本,其配置文件、脚本及模型权重均可供下载。与DeepSeek-V3-0324相比,模型参数及张量类型未见明显变化。

DeepSeek V3.1升级:更强上下文理解与开源体验 V3.1 上下文窗口 开源 模型升级 第4张

开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

智东西第一时间在网页端体验了新模型的功能,初步结果显示,该模型在编程(尤其是前端能力)、物理定律理解、创意写作、数学及回答语气等方面均有显著提升和变化。

以下是智东西体验的部分案例: