当前位置:首页 > 科技资讯 > 正文

Mistral 3:开源AI新纪元,小型模型与多模态的强力结合

就在昨日,「欧洲版DeepSeek」Mistral一口气宣布了两项重大成果:

一款大型MoE模型:Mistral Large 3

一系列小型模型:Ministral 3(14B/8B/3B)

这些模型全部开源、多模态且可落地。

Mistral 3:开源AI新纪元,小型模型与多模态的强力结合 Large 3 Ministral 多模态 开源模型 第1张

Mistral Large 3

Mistral推出的Mistral Large 3,规格上几乎达到了「开源界的准天花板」:

41B活跃参数/675B总参数MoE架构、原生图像理解、256k上下文、多语言能力在非英语种上表现非凡,LMArena排名直接跃升至开源模型第6。

Mistral 3:开源AI新纪元,小型模型与多模态的强力结合 Large 3 Ministral 多模态 开源模型 第2张

Mistral Large 3的ELO得分在开源大模型中稳居第一梯队,与Kimi K2不分伯仲,仅稍逊于DeepSeek v3.2。

其基础模型表现同样不俗,在多项基础任务上与DeepSeek、Kimi等大体量模型正面交锋。

Mistral 3:开源AI新纪元,小型模型与多模态的强力结合 Large 3 Ministral 多模态 开源模型 第3张

Mistral Large 3(Base)在MMLU、GPOA、SimpleQA、AMC、LiveCodeBench等多项基础任务上与DeepSeek 37B、Kimi K2 127B保持同一水平,属于开源系的第一梯队底模。

在预训练能力方面,它与Qwen、Gemma的基础模型在核心评测上也是正面硬刚。

Mistral 3:开源AI新纪元,小型模型与多模态的强力结合 Large 3 Ministral 多模态 开源模型 第4张

但官方并未过分强调数值,反而着重指出:

我们开源Apache 2.0,全权由你;你想怎么改、怎么部署都行。

为实现这一目标,他们与NVIDIA合作完成了一项简单却关键的工作:

为了让Large 3运行更稳定,Mistral联合NVIDIA重新设计了底层推理链路:

采用NVIDIA的FP4,并重写了Blackwell的注意力与MoE内核,使Large 3在Blackwell NVL72上既快、又稳、又便宜。

这不仅是简单的适配,而是重新设计了Blackwell的注意力机制、MoE内核、预填充/解码分离和投机解码等关键推理路径。

Mistral 3:开源AI新纪元,小型模型与多模态的强力结合 Large 3 Ministral 多模态 开源模型 第5张

Ministral 3系列

真正让Mistral骄傲的,是Ministral 3系列

它们体型小巧但性能卓越。有Base、Instruct、Reasoning三个版本,全部支持图像识别,且在官方基准测试中表现优异。

这意味着:你的笔记本能跑,你的台式机能跑,无人机、机器人、汽车、边缘摄像头都能跑,甚至脱离互联网也能运行。

更重要的是,这些模型不仅「小」,而且「更聪明」。

Ministral 3的Instruct版本在综合智能指数上的得分分别是:31(14B)/ 28(8B)/ 22(3B)──全部超越上一代Mistral Small 3.2,参数量甚至多40%。

这意味着这代小模型不仅便宜且能在更多设备上运行,本身能力也从底层被大幅提升。

Mistral 3:开源AI新纪元,小型模型与多模态的强力结合 Large 3 Ministral 多模态 开源模型 第6张

Mistral的野心

将视线从模型本身移开,你会发现Mistral不仅仅是在卖模型。

它正在悄然将自己变成一种平台型存在,其结构已经清晰到无法忽视。

Mistral Agents API不仅能跑模型,还能直接在API内部接Code Interpreter、执行代码、连接工具、保持长期记忆、做结构化推理。

Mistral 3:开源AI新纪元,小型模型与多模态的强力结合 Large 3 Ministral 多模态 开源模型 第7张

由此可见,Mistral正在走一条不同寻常的AI路线。

它不像美国那套「云端神谕」,而更像是欧洲式的「软件制造业」哲学:

将能力做成标准件,让所有人随取随用。