当前位置:首页 > 科技资讯 > 正文

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元

DeepSeek V3.1 正式亮相,官方一则简短公告瞬间引爆人工智能领域,成为行业焦点。

公告中提及的新架构与下一代国产芯片,虽仅寥寥数语,却蕴含巨大信息量,迅速引发广泛讨论与关注。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第1张

通过梳理多方解读,可以清晰看到国产AI正迈入软硬件深度协同的新阶段,未来模型将显著降低对英伟达、AMD等国外算力供应的依赖,实现自主可控。

此次升级更打破了“性能提升必然伴随成本上涨”的传统行业困境,为金融、医疗等需要高算力的应用场景开辟了更广阔的商业化想象空间。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第2张

资本市场对此反应迅速且直接:DeepSeek官宣后,国产芯片相关概念股应声上涨,其中每日互动股价在尾盘直线拉升,收盘大幅上涨13.62%。

有网友幽默评论道:国产芯片板块迎来强劲增长,DeepSeek一句话的威力,仿佛让周五股市大盘直接冲击3800点。

近日,DeepSeek官方如往常一样低调地发布了V3.1版本更新公告,并未进行大规模宣传。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第3张

本次V3.1版本最核心、最具变革性的创新在于其混合推理架构(Hybrid Reasoning Architecture)。

该架构能够同时支持深度思考模式与快速响应模式,用户可根据实际需求灵活切换,既可选择进行逐步深入的分析,也能要求模型即时输出结果。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第4张

此前,DeepSeek的产品线功能区分明确:V3模型侧重于通用对话,而R1模型专精于深度推理。这种分离设计虽能使各模型在特定领域表现出色,但用户在不同任务间切换时体验不够流畅。

如今,V3.1成功打破了这种功能壁垒,将通用对话、复杂逻辑推理、专业编程等多种核心能力融合于单一模型之中,极大地提升了使用的灵活性与整体效率。

不仅如此,V3.1在推理效率方面也实现了显著提升。官方数据显示,在思考模式下,其在不同任务上的平均表现与上一代顶级模型R1-0528持平,但生成的中间推理内容(token数量)减少了20%至50%。在非思考模式下,输出长度同样更为精简,且性能并未衰减。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第5张

这背后的关键技术是“思维链压缩”:模型在训练过程中学会了生成更加简洁、高效的推理路径,同时确保答案的准确性。简而言之,算法的“思维”变得更加精炼和聪明。

推动这一技术发展的根本动力在于降低成本。过去,思维链技术虽然能增强模型推理能力,但冗长的中间步骤会产生高昂的计算成本和API调用费用,阻碍了其大规模商业化应用。

V3.1采用的思维链压缩技术,有效解决了这一难题,将强大的AI推理能力从昂贵的学术工具转变为经济可行、可大规模部署的商业解决方案。

在社区进行的实际测试中,DeepSeek V3.1在Aider多语言编程基准测试中的得分已经超越了Claude 4 Opus,同时保持了更低的运行成本。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第6张

这一成果让开发者社区沸腾,在Hugging Face等平台上的讨论热度急剧攀升。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第7张

值得一提的是,DeepSeek在官宣V3.1时特别指出,该模型采用了UE8M0 FP8 Scale参数精度,并对分词器及聊天模板进行了显著调整,因此与之前的V3系列模型存在明显区别。

关于DeepSeek V3.1所使用的“UE8M0 FP8”技术,简要科普如下:FP8是一种将浮点数压缩存储为8位格式的技术,旨在节省存储空间和计算资源。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第8张

结合MXFP8的“块缩放”思路——将数据分组并为每组分配独立的缩放系数,可以在最小化信息损失的前提下,进一步节约资源。

格式名称中的U、E、M分别代表“无符号”、“指数”和“尾数”。UE8M0格式将所有8位都用于表示指数,省略了尾数和符号位,这使得处理器在恢复数据时异常高效:只需移动指数位即可,无需复杂乘法运算,速度快且路径短。

该格式的另一优势是拥有宽广的动态范围,能够同时精确表示极大和极小的数值,有效避免数据溢出或被归零,从而在保持8位张量精度的同时,将信息损失降至最低。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第9张

这一特性使其特别契合新一代国产芯片。目前多数国产AI加速器仍采用FP16/INT8方案,缺乏完整的FP8运算单元支持。

而新兴的国产芯片,例如摩尔线程的MUSA 3.1 GPU、芯原的VIP9000 NPU等,已开始支持原生FP8运算。DeepSeek V3.1采用的UE8M0格式正好与这些硬件特性完美匹配。

总而言之,UE8M0 FP8技术使得模型能够在新一代国产芯片上运行得更节省空间、更快速、更稳定,同时维持高精度。这也是DeepSeek官方特别强调此项技术的原因,它为国产AI的发展带来了低成本、高性能的新机遇。

关于更新后的使用体验,官方也回应了用户对于官网访问的疑问。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第10张

访问官网即可发现,DeepSeek已将App和网页端的“深度思考(R1)”选项更名为“深度思考”,这证实了网友此前关于模型已更新的猜测。

来看看富有创造力的网友们如何玩转新模型。在推特X上,有AI博主分析指出,新模型生成的小球跳动动画在物理规律上更为逼真,并能调整重力、摩擦力、旋转速度、弹跳系数等多种参数。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第11张

更有用户直接利用DeepSeek V3.1编写了振动编码程序,实时生成视觉特效,瞬间变身VJ。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第12张

还有网友让V3.1为自己绘制了一幅自画像,其独特的画风令人印象深刻。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第13张

当然,社区中也存在一些反馈,部分用户指出在翻译和写作任务中,偶尔会出现中英混杂、用词不当或指令需要现场编写的情况,体验尚有优化空间。

DeepSeek V3.1震撼上线:混合推理架构与国产芯片协同突破AI新纪元 V3.1 混合推理架构 国产AI芯片 AI成本优化 第14张

感兴趣的朋友现在就可以访问官网亲自体验一番。DeepSeek的每一次迭代更新都令人对下一次发布充满期待,它几乎已成为国产AI进步的精神象征。让我们共同期待未来DeepSeek R2带来更多惊喜。