当前位置:首页 > 科技资讯 > 正文

英伟达Nemotron 3家族亮相:AI战局再掀波澜

随着2025年AI领域的激烈竞争,连一向专注于芯片销售的英伟达也开始亲自下场挖矿了。12月15日,英伟达正式推出Nemotron 3家族,其中包括Nano、Super和Ultra三个系列,其中Nano率先发布,而Super和Ultra则预计在2026年上半年问世。

长久以来,AI领域似乎形成了这样一种分工:英伟达卖铲子,其他公司用铲子

其他公司包括:OpenAI、Meta、谷歌、DeepSeek、xAI等。

这种分工原则很简单:卖铲子和用铲子的。

英伟达Nemotron 3家族亮相:AI战局再掀波澜 英伟达 Nemotron 3 Mamba架构 MoE架构 第1张

尽管最近谷歌的TPU让其在某些方面有能力与英伟达抗衡,但短期内仍难以撼动英伟达的领先地位。

只要金矿还在,无论谁挖到了金子,卖铲子的人永远稳赚不赔。

这种商业模式让英伟达的市值一度飙升,成为全球最赚钱的科技公司之一。

英伟达Nemotron 3家族亮相:AI战局再掀波澜 英伟达 Nemotron 3 Mamba架构 MoE架构 第2张

然而,到2025年底,英伟达似乎不再满足于仅仅卖铲子,它决定亲自下场挖矿。

英伟达正式发布了全新的开源模型家族——Nemotron 3

英伟达Nemotron 3家族亮相:AI战局再掀波澜 英伟达 Nemotron 3 Mamba架构 MoE架构 第3张

英伟达Nemotron 3家族亮相:AI战局再掀波澜 英伟达 Nemotron 3 Mamba架构 MoE架构 第4张

这次发布不仅仅是一次产品更新,更像是一次精心策划的战略突袭。

英伟达不再满足于仅仅提供硬件底座,它亲自下场了,而且一出手就是颠覆性的“王炸”:

Mamba架构、MoE(混合专家模型)、混合架构、100万Context(上下文窗口)

Nemotron 3系列开源模型涵盖Nano、Super和Ultra三种规格。

英伟达Nemotron 3家族亮相:AI战局再掀波澜 英伟达 Nemotron 3 Mamba架构 MoE架构 第5张

那么,Nemotron 3是英伟达对OpenAI或Meta开源的一次简单模仿吗?还是黄仁勋的玩票之举?

剖析Nemotron 3:是缝合怪还是终极进化体?

在AI的竞技场上,架构就是命运。

过去几年,Transformer架构如日中天,它是ChatGPT的灵魂,是Llama的基石,是所有大模型的底层。

但随着模型参数的膨胀和应用场景的深入,Transformer的瓶颈也日益凸显:推理成本高、显存占用大、处理超长文本时效率低下。

英伟达Nemotron 3家族亮相:AI战局再掀波澜 英伟达 Nemotron 3 Mamba架构 MoE架构 第6张

这次推出的Nemotron 3家族,并非单纯的Transformer模型,而是一个集众家之长的“混血王子”。

它极其大胆地融合了Mamba(状态空间模型)Transformer(注意力机制)MoE(混合专家模型)三大顶尖技术。

英伟达Nemotron 3家族亮相:AI战局再掀波澜 英伟达 Nemotron 3 Mamba架构 MoE架构 第7张

其中,Nemotron 3 Nano通过突破性的混合专家架构,吞吐量比Nemotron 2 Nano提升4倍。

Nemotron凭借先进的强化学习技术,通过大规模并发多环境后训练实现了卓越的准确性。

NVIDIA率先发布了一套最先进的开源模型、训练数据集以及强化学习环境和库,用于构建高精度、高效率的专用AI智能体。

家族谱系:不仅仅是“大、中、小”

Nemotron 3并非单指一个模型,而是一个完整的家族矩阵,旨在覆盖从端侧设备到云端超级计算机的全场景需求。

根据英伟达的规划,这个家族主要包含三位成员,每一位都身负不同的战略使命:

Nemotron 3 Nano(现已发布):边缘侧的“特种兵”

参数规模:总参数量30B(30亿),但推理时激活参数仅为3B(约3亿)左右。

核心定位:主打高效推理和边缘计算。在消费级显卡甚至高端笔记本上就能流畅运行。

技术亮点:“小钢炮”,利用混合架构实现了极致的吞吐量,专为需要快速响应的Agent任务设计。

“围剿”GPT-5:Ultra的野心

“围剿”GPT-5:Ultra的野心