当前位置:首页 > 科技资讯 > 正文

DeepSeek-V3.1-Base:AI 圈新宠,技术迭代背后的惊喜

自从 GPT-5 发布后,DeepSeek 创始人梁文锋便成为了 AI 圈最忙碌的人物。

网友和媒体们不断催促更新,不是“压力山大”,就是“全网坐等”他的新动作。尽管尚未见到 R2 的身影,但 DeepSeek 今日还是正式推出了新模型 DeepSeek-V3.1-Base。

DeepSeek-V3.1-Base:AI 圈新宠,技术迭代背后的惊喜 DeepSeek-V3.1-Base AI模型 技术迭代 编程基准测试 第1张

相较于其他 AI 仍在画 GPT-6 的大饼,DeepSeek 新模型的到来显得相当低调,连版本号都像是“小打小闹”。然而,实际体验下来,这次更新却给了我诸多惊喜。

这款模型拥有 6850 亿参数,支持 BF16、F8_E4M3、F32 三种张量类型,以 Safetensors 格式发布,在推理效率上做了诸多优化,线上模型版本的上下文窗口也拓展至 128k。

DeepSeek-V3.1-Base:AI 圈新宠,技术迭代背后的惊喜 DeepSeek-V3.1-Base AI模型 技术迭代 编程基准测试 第2张

于是我们直接上线测试。

体验地址: https://chat.deepseek.com/

为了测试 V3.1 的长文本处理水平,我选择了《三体》全文,删减至 10 万字左右,并插入了一句毫不相关的句子“我觉得烟锁池塘柳的下联应该是‘深圳铁板烧’”,看其能否准确检索。

DeepSeek-V3.1-Base:AI 圈新宠,技术迭代背后的惊喜 DeepSeek-V3.1-Base AI模型 技术迭代 编程基准测试 第3张

不出所料,DeepSeek V3.1 先提示文档超出限制,仅读取了前 92% 的内容,但依然成功找到了这句话。更有趣的是,它还贴心地提供了文学角度的经典下联推荐:“焰镕海坝枫”。

DeepSeek-V3.1-Base:AI 圈新宠,技术迭代背后的惊喜 DeepSeek-V3.1-Base AI模型 技术迭代 编程基准测试 第4张

网友已经抢先测试它在编程基准测试 Aider Polyglot 的得分:71.6%,不仅在开源模型中表现最佳,甚至击败了 Claude 4 Opus。

DeepSeek-V3.1-Base:AI 圈新宠,技术迭代背后的惊喜 DeepSeek-V3.1-Base AI模型 技术迭代 编程基准测试 第5张

实测发现,V3.1 在编程方面的表现确实不俗。例如,我们用经典的六边形小球编程题进行测试:

“编写一个 p5.js 程序,演示一个球在旋转的六边形内弹跳的过程。球应受重力和摩擦力的影响,并需逼真地从旋转的墙壁上弹起。”

DeepSeek-V3.1-Base:AI 圈新宠,技术迭代背后的惊喜 DeepSeek-V3.1-Base AI模型 技术迭代 编程基准测试 第6张

V3.1 不仅完成了基础碰撞检测,还自动补充了转速、重力等细节参数,物理特性逼真到小球会在底部略微减速。

接着我加大难度,让它用 Three.js 制作交互式 3D 粒子星系。基础框架搭建得相当稳固,三层设计(内球体、中间圆环、外球体)结构完整。

DeepSeek-V3.1-Base:AI 圈新宠,技术迭代背后的惊喜 DeepSeek-V3.1-Base AI模型 技术迭代 编程基准测试 第7张

UI 审美嘛……有些神鬼莫测的感觉,配色方案略显花哨。