当前位置:首页 > 科技资讯 > 正文

DeepSeek V3.1:代码审美双提升,挑战大模型任务

在万众期待中,DeepSeek悄然推出了V3.1版本,令人惊喜的是,这次升级带来了不小的提升。

DeepSeek V3.1:代码审美双提升,挑战大模型任务 V3.1 代码能力 前端审美 第1张

官方透露的新信息是,上下文长度拓展至128K,与GPT-4这一代模型的处理Token长度一致。起初,我以为这只是一个小的迭代,但体验后发现,它带来的惊喜远超预期。

01

代码能力与前端审美飞跃

从开源社区Huggingface上传的模型版本来看,模型尺寸达685B,支持BF16、F8_E4M3、F32等张量类型,平衡了模型的计算精度和效率。

最值得一提的是,代码能力有了显著提升,前端审美也大幅提升。我们先看看V3.1在代码测试中的表现。

请设计并开发一款结合日历和待办事项(To-Do)的产品,其核心功能应包括:

任务分类与颜色标记:用户能够创建不同类别的任务,并为每个类别分配独特的颜色。当任务被归类后,其在日历视图上应以相应的颜色进行标记,以便快速识别。短期任务管理:*完成标记: 对于计划在特定日期完成的任务,用户应能将其标记为“已完成”。已完成的任务应在界面上以视觉方式(例如,划掉、变灰或显示完成图标)清晰区分。*逾期处理: 如果任务未在计划日期完成,系统应提供明确的视觉提示(例如,颜色变化、闪烁或标记为逾期),并允许用户选择将其延期至第二天或后续日期。长期任务可视化: 对于跨越多天的长期任务,系统应在日历视图上以连续的线条或色块进行标记,清晰展示其持续时间,并支持用户查看和编辑任务的起止日期。

说实话,整个产品的设计已经达到了较高的水准,准确理解了Prompt,且没有明显的交互Bug。与Claude 3.7相比也毫不逊色。

DeepSeek V3.1:代码审美双提升,挑战大模型任务 V3.1 代码能力 前端审美 第2张

当然,与Claude 4.0和4.1的前端和审美相比仍有差距。

PS:我正在利用Claude 4.0做日历+To do的结合体,后续会发布出来,大家可以期待。

天气卡片案例测试

第二个案例更能看出提升。这是一个大家经常测试的天气卡片案例。

创建一个包含CSS和JavaScript的单个HTML文件,以生成一个动画天气卡片。卡片应通过不同的动画直观地表示以下天气条件:风:(例如,移动的云朵、摇曳的树木或风线)雨:(例如,落下的雨滴、形成的水坑)晴:(例如,闪耀的光线、明亮的背景)雪:(例如,落下的雪花、积雪)并排显示所有天气卡片。卡片应具有深色背景。在此单个文件中提供所有HTML、CSS和JavaScript代码。JavaScript应包含一种在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气的动画。

DeepSeek V3.1:代码审美双提升,挑战大模型任务 V3.1 代码能力 前端审美 第3张

注:DeepSeek新版V3模型的生成结果(右侧)与R1的生成结果对比。

这是新版V3.1生成的效果,不仅美观,还有降雨和太阳等动图效果,这不仅仅是可以拿出手那么简单,更是超出了预期。

DeepSeek V3.1:代码审美双提升,挑战大模型任务 V3.1 代码能力 前端审美 第4张

我们看GPT-5的演示效果,其实也还行,但雪花和大风的演示图形有些Bug,且没有展示很多天气信息。

DeepSeek V3.1:代码审美双提升,挑战大模型任务 V3.1 代码能力 前端审美 第5张

流程图与复杂案例测试

接着我们测试一个考验DPSK逻辑和构图的案例,要求V3.1创建一个流程图,展示用户、Agent、LLM和MCP Server之间的交互。

V3.1使用Mermaid流程图来表示这一过程,大体过程展示出来了,但似乎还缺乏一些细节。

DeepSeek V3.1:代码审美双提升,挑战大模型任务 V3.1 代码能力 前端审美 第6张

不过好消息是,有些流程图、逻辑图以后可以教给DeepSeek来做,虽然没有思维脑图产品的细节处理得那么精细,但胜在可以直出基础作品且有一定美观度渲染。

继续来做一个更复杂的Case,这是马斯克点赞的Grok 4案例:“3D线框网络与能量脉冲动画”。

DeepSeek V3.1:代码审美双提升,挑战大模型任务 V3.1 代码能力 前端审美 第7张

DeepSeek V3.1使用了CSS 3D变换来模拟3D效果,纯JavaScript处理交互逻辑,无需任何外部库。

但不得不说,V3.1在做这种更复杂的案例时有些力不从心。没有做出立体状,效果也不太酷炫。

DeepSeek V3.1:代码审美双提升,挑战大模型任务 V3.1 代码能力 前端审美 第8张

感觉还是因为上下文太短了。现在很多大模型都已经达到200K的上下文长度了。V3.1在处理复杂任务时还有一定距离。

GPT-5生成的动画效果还可以,用能量球形式展现,脉冲效果也有一定体现。

DeepSeek V3.1:代码审美双提升,挑战大模型任务 V3.1 代码能力 前端审美 第9张

逻辑推理能力进步

单选题测试