最近,欧洲的DeepSeek项目Mistral AI再度开源,推出了其最新一代代码模型系列:Devstral 2。
该系列开源模型包含两种尺寸:Devstral 2(123B)和Devstral Small 2(24B)。用户目前可通过官方API免费使用这两个模型。
此外,Mistral AI还发布了自家的原生命令行界面工具:Mistral Vibe。
Mistral AI的进展速度令人瞩目。仅仅一周前,他们才发布了Mistral 3系列模型,被视为欧洲正式加入AI前沿竞争的标志。仅仅7天后,Devstral 2系列与Mistral Vibe便相继问世,这种高频的发布节奏,似乎正在验证人们对欧洲AI崛起的预期。
考虑到Mistral近期在欧洲的大幅扩张,以及图灵奖得主Yann LeCun回归欧洲创业的消息,欧洲大陆这片AI热土的未来,或许值得我们更多期待。
以下是Mistral官方总结的核心亮点:
下面来具体看看Mistral AI今天新发布的模型和工具。
模型地址:https://huggingface.co/collections/mistralai/devstral-2
Devstral 2是一个123B参数的密集Transformer模型,支持256K上下文窗口。它在SWE-bench Verified上取得72.2%的成绩,确立了其作为最佳开放权重模型之一的地位,同时保持了极高的成本效益。
更轻量的Devstral Small 2在SWE-bench Verified上得分为68.0%,能与大其五倍的模型比肩,同时还具备在消费级硬件上本地运行的独特优势。
Mistral官方指出:“Devstral 2(123B)和Devstral Small 2(24B)分别比DeepSeek V3.2小5倍和28倍,比Kimi K2小8倍和41倍。这证明了紧凑型模型可以匹敌甚至超越更大型竞争对手的性能。”
Devstral 2支持探索代码库并在多个文件中编排变更,同时保持架构级的上下文理解。它能追踪框架依赖关系、检测故障并尝试修正重试——从而解决错误修复和遗留系统现代化等挑战。
此外,该模型支持微调,允许企业针对特定编程语言或大型企业代码库进行深度优化。
Mistral通过独立标注提供商的人工评估,对比了Devstral 2与DeepSeek V3.2和Claude Sonnet 4.5,任务通过Cline进行脚手架式编排。
根据发布的结果,Devstral 2相对于DeepSeek V3.2有明显优势,胜率为42.8%,败率为28.6%。然而,Claude Sonnet 4.5仍然更受青睐,表明其与闭源模型之间仍存在差距。
值得注意的是,Devstral 2采用的许可证是一种修改版MIT许可证。
对比标准的MIT许可证,可以看到一个重大差异:新增的“收入限制条款”。
标准版MIT极度宽松。只要你保留版权声明,你可以将代码用于任何目的,包括商业用途、修改、分发、闭源发布,没有任何收入或公司规模的限制。
Mistral许可证则在第2条中增加了一个巨大的限制条件(毒丸条款):
如果你的公司全球合并月收入超过$…………美元………
“即如果你的公司全球合并月收入超过$……美元………
“即如果你的公司全球合并月收入超过$……美元………
本文由主机测评网于2026-05-24发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545984.html