当前位置:首页 > 科技资讯 > 正文

Nemotron-Nano-9B-v2:引领小型AI模型新纪元

在 AI 领域,小型模型正崭露头角,成为焦点。从 Liquid AI 发布的可穿戴 AI 视觉模型到谷歌智能手机上的模型,高效、小型化趋势显著。而英伟达最新推出的小语言模型(SLM)——Nemotron - Nano - 9B - v2,不仅在基准测试中表现卓越,还赋予用户自由开关 AI “推理” 的功能,为 AI 应用带来无限可能。

“小” 模型从边缘走向核心

近三个月,AI 圈的 “迷你军团” 不断突破,掀起了一场技术革命。Liquid AI 的视觉模型小巧到能装进智能手表,谷歌的 Gemini-Nano 也成功应用于 Pixel 8 手机,极大提升了移动端 AI 能力。而英伟达带着 90 亿参数的 Nemotron-Nano-9B-v2 登场,将其部署在单张 A10 GPU 上,再次刷新了人们对小型模型的认知。

这不仅是 “小而美” 的技术展示,更是对成本、效率与可控性的精准平衡实验。正如英伟达 AI 模型后训练主管 Oleksii Kuchiaev 所言:“从 120 亿参数精简到 90 亿,是为了适配 A10—— 企业部署中最常见的显卡。”

简而言之:参数大小不再是衡量模型优劣的关键指标,投资回报率(ROI)才是硬道理。

思维链作为可计费功能

传统大模型的 “黑盒思维” 一直是企业使用的痛点,长时间推理会导致 token 账单失控。而 Nemotron-Nano-9B-v2 提供了一个简单直接的解决方案:在 prompt 中加入 /think,模型便会启用内部思维链,逐步推导;加入 /no_think,则会直接输出答案,省去中间环节。系统级的 max_think_tokens 功能如同 AWS 的 CPU credit 机制,能设定思维链预算,精准控制成本。

Nemotron-Nano-9B-v2:引领小型AI模型新纪元 小型模型 AI应用 成本控制 商业许可 第1张

Nemotron-Nano-9B-v2:引领小型AI模型新纪元 小型模型 AI应用 成本控制 商业许可 第2张

现场实测(官方报告)数据表明:

Nemotron-Nano-9B-v2:引领小型AI模型新纪元 小型模型 AI应用 成本控制 商业许可 第3张

简而言之:将“推理”从默认能力变成可选项,企业可以按思考深度付费。

Transformer 的“省油”补丁

为何 9B 模型能在长上下文里打平 70B?答案在于Mamba-Transformer 混合架构:用 Mamba 状态空间层替换 70% 的注意力层,显存占用降低 40%;序列长度与显存呈线性关系,而非平方爆炸;128k token 实测吞吐量比同尺寸纯 Transformer 高 2.3×。

一句话:Mamba 不是取代 Transformer,而是将其改造成省油的混动引擎。

商业核弹:宽松许可证 + 零门槛商用

英伟达此次在许可协议上的举措堪称 “商业核弹”,实现了 “三不要”:不要钱、不要谈判、不要法务焦虑。无版税、无收入分成,直接下载即可商用,仅要求遵守可信 AI 护栏和出口合规。

对比 OpenAI 的分级许可、Anthropic 的使用上限,Nemotron-Nano-9B-v2 几乎成了 “开源界的 AWS EC2”—— 拿来就能上线赚钱,极大降低了企业的使用门槛。

场景切片:谁最先受益?

Nemotron-Nano-9B-v2:引领小型AI模型新纪元 小型模型 AI应用 成本控制 商业许可 第4张

一句话:任何边缘/私有化场景,都多了一张“足够聪明又付得起”的牌

AI 的“精算时代”正式开幕

过去四年,我们见证了 scaling law 的魔法:参数 × 算力 = 性能。而今,Nemotron-Nano-9B-v2 用 90 亿参数告诉我们:架构 × 控制 × 许可证 = 可持续的 AI 经济。

当 Liquid AI 把模型塞进手表,当英伟达把推理做成开关,“小” 不再是技术上的妥协,而是经过精打细算后的最优解。

下一次融资路演,创业者们或许不再说 “我们比 GPT-4 更强”,而是会自信地宣称:“我们用 1/10 的算力,做出了 90% 的效果,并且还能赚钱。”这标志着,AI 的“精算时代”已正式拉开帷幕。