深度求索公司再次推出了其AI模型的重要更新!
在9月22日晚上,DeepSeek通过官方API平台发布了经过最新升级的DeepSeek-V3.1-Terminus模型(Terminus在拉丁语中代表终点或界限),随后迅速宣布将该模型开源。
根据官方文档介绍,DeepSeek-V3.1-Terminus在保持模型原有能力的基础上,显著改善了语言一致性和偶发异常字符等DeepSeek-V3.1上线后出现的Bug,同时还进一步优化了编程和搜索智能体的表现。
DeepSeek官方在微信公众号上公布了新旧DeepSeek-V3.1的基准测试对比数据。可以看到,在非Agent类的基准测试中,DeepSeek-V3.1-Terminus相比DeepSeek-V3.1实现了0.2%至36.5%不等的性能提升,不过也有部分测试成绩出现轻微下滑。
DeepSeek-V3.1-Terminus在HLE(人类终极测试)上的进步最为显著,这一测试主要考察专家级的高难度知识以及模型的多模态、深度推理等能力。
而在Agent测评中,DeepSeek-V3.1-Terminus在网页浏览、简单问答和多项编程测试中的表现获得了小幅提升。
DeepSeek官方App、网页端、小程序以及DeepSeek API模型均已同步更新为DeepSeek-V3.1-Terminus。智东西第一时间调用DeepSeek-V3.1-Terminus的API进行了体验,尝试复现之前的多个Bug,并测试模型的最新性能。
开源地址:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
今年8月,DeepSeek-V3.1上线后,有用户反馈在使用API调用模型时,偶尔会出现一个严重Bug:模型会不受控制地随机输出“极”、“極”、“extreme”等字符,严重影响日常使用,如果未经仔细检查就使用含有此Bug的代码,很可能导致编译失败。
DeepSeek-V3.1的“极”字Bug(图源:知乎@Fun10165)
智东西调用了最新的DeepSeek-V3.1-Terminus API,尝试复现上述问题。网络上流传能触发这一Bug的“高危”提示词包括要求模型编写Go语言、处理版本号相关任务或时间任务等。
然而,DeepSeek-V3.1-Terminus在测试中并未因这些提示词而产生Bug,这表明该问题应该已被修复。
DeepSeek-V3-Terminus未因“高危”提示词而产生Bug
也有海外用户反映,此前的DeepSeek-V3.1存在多语言混合问题,尤其是在翻译小语种时。这位Reddit网友分享,DeepSeek有时会将中文、英文和俄文混合使用,问题文本的比例可能达到5%。
网友分享DeepSeek-V3.1多语言混用问题(图源:Reddit @Kitano_o)
智东西尝试让DeepSeek-V3-Terminus将一句话翻译为7种小语种:“人工智能正在改变我们的世界,它带来了巨大的机遇,也需要我们认真思考其挑战。”
DeepSeek-V3-Terminus的回答没有出现语言混合问题,看来这一Bug也被修复了。
除了Bug修复之外,DeepSeek-V3.1-Terminus还有一大亮点是其编程和搜索智能体能力的提升。
在编程任务中,智东西让DeepSeek-V3.1-Terminus尝试创建小球弹跳效果。模型输出的网页采用了简约风格,但模拟的重力、摩擦力效果非常逼真。要实现这样的效果,模型不仅需要强大的编程能力,还需具备对物理学的深入理解。
该模型创建的动画效果也相当出色,小球的轨迹和碰撞表现自然:
在搜索智能体能力测试中,我们让DeepSeek-V3.1-Terminus推荐几种适合新手阳台盆栽的植物。这一测试考察模型能否找出完全符合“阳台盆栽”、“生长快速”、“可食用”、“对儿童安全”所有条件的植物。此外,模型还需交叉验证信息的可靠性,并进行整合提炼和风险提示。
可以看到,DeepSeek-V3.1-Terminus给出的答案非常周全,经人工核查事实准确,可读性也良好。
DeepSeek-V3.1-Terminus中的“Terminus”,在拉丁语里意为“终点”或“界限”,我们尝试让DeepSeek自身对这一命名进行解读。DeepSeek表示,这一命名可能象征着DeepSeek-V3.1是该系列架构的终极版本,代表了当前技术路径的成熟和完善。
也有网友认为,Terminus可能意味着模型在编程终端中的表现更佳。不过,正如DeepSeek所言,具体的命名寓意最好由官方解释更为准确。
此前,已有外媒报道称,DeepSeek计划在今年年底推出Agent模型。或许,DeepSeek的下一次重大更新,已经指日可待。
本文由主机测评网于2026-01-02发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260114245.html