随着2025年AI领域的激烈竞争,连一向专注于芯片销售的英伟达也开始亲自下场挖矿了。12月15日,英伟达正式推出Nemotron 3家族,其中包括Nano、Super和Ultra三个系列,其中Nano率先发布,而Super和Ultra则预计在2026年上半年问世。
长久以来,AI领域似乎形成了这样一种分工:英伟达卖铲子,其他公司用铲子。
其他公司包括:OpenAI、Meta、谷歌、DeepSeek、xAI等。
这种分工原则很简单:卖铲子和用铲子的。
尽管最近谷歌的TPU让其在某些方面有能力与英伟达抗衡,但短期内仍难以撼动英伟达的领先地位。
只要金矿还在,无论谁挖到了金子,卖铲子的人永远稳赚不赔。
这种商业模式让英伟达的市值一度飙升,成为全球最赚钱的科技公司之一。
然而,到2025年底,英伟达似乎不再满足于仅仅卖铲子,它决定亲自下场挖矿。
英伟达正式发布了全新的开源模型家族——Nemotron 3。
这次发布不仅仅是一次产品更新,更像是一次精心策划的战略突袭。
英伟达不再满足于仅仅提供硬件底座,它亲自下场了,而且一出手就是颠覆性的“王炸”:
Mamba架构、MoE(混合专家模型)、混合架构、100万Context(上下文窗口)。
Nemotron 3系列开源模型涵盖Nano、Super和Ultra三种规格。
那么,Nemotron 3是英伟达对OpenAI或Meta开源的一次简单模仿吗?还是黄仁勋的玩票之举?
在AI的竞技场上,架构就是命运。
过去几年,Transformer架构如日中天,它是ChatGPT的灵魂,是Llama的基石,是所有大模型的底层。
但随着模型参数的膨胀和应用场景的深入,Transformer的瓶颈也日益凸显:推理成本高、显存占用大、处理超长文本时效率低下。
这次推出的Nemotron 3家族,并非单纯的Transformer模型,而是一个集众家之长的“混血王子”。
它极其大胆地融合了Mamba(状态空间模型)、Transformer(注意力机制)和MoE(混合专家模型)三大顶尖技术。
其中,Nemotron 3 Nano通过突破性的混合专家架构,吞吐量比Nemotron 2 Nano提升4倍。
Nemotron凭借先进的强化学习技术,通过大规模并发多环境后训练实现了卓越的准确性。
NVIDIA率先发布了一套最先进的开源模型、训练数据集以及强化学习环境和库,用于构建高精度、高效率的专用AI智能体。
Nemotron 3并非单指一个模型,而是一个完整的家族矩阵,旨在覆盖从端侧设备到云端超级计算机的全场景需求。
根据英伟达的规划,这个家族主要包含三位成员,每一位都身负不同的战略使命:
Nemotron 3 Nano(现已发布):边缘侧的“特种兵”
参数规模:总参数量30B(30亿),但推理时激活参数仅为3B(约3亿)左右。
核心定位:主打高效推理和边缘计算。在消费级显卡甚至高端笔记本上就能流畅运行。
技术亮点:“小钢炮”,利用混合架构实现了极致的吞吐量,专为需要快速响应的Agent任务设计。
本文由主机测评网于2026-05-28发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546432.html