DGX Spark,一台配备2000亿参数、3万块人民币投资、128GB内存的“全球最小超算”,它能否让我们在桌面上轻松运行大型AI模型呢?
不久前,黄仁勋将这台超算赠予了马斯克,并亲自到访OpenAI总部,将另一台赠予了奥特曼。从CES亮相到如今的正式发布,这款个人超算终于要走进我们的日常生活。
官网信息显示,DGX Spark售价3999美元,并提供华硕、联想、戴尔等七个电脑品牌的发售版本;链接:[NVIDIA DGX Spark Marketplace](https://marketplace.nvidia.com/en-us/developer/dgx-spark/)
NVIDIA DGX Spark,一台面向科研人员、数据科学家和学生的个人AI超级计算机,旨在为他们提供高性能桌面级AI计算能力,助力AI模型的开发与创新。
听起来很强大,但普通用户能想到的应用场景无非:
部分显卡租赁平台显示A100的售价为7元/时。
实际上,DXG Spark GB10 Grace Blackwell超级芯片的能力或许可以拓展更多应用场景,但具体能做什么,效果又如何?售价3万块,相当于可以租赁4000小时的A100,你真的会把它放在桌上跑大模型吗?
我们收集了目前网络上关于DGX Spark的多个详细评测,试图在实际体验之前,带大家看看这台设备到底值不值3万块。
性能定位:轻量模型表现出色,即使面对1200亿参数的大模型也能稳定运行。总体水平介于RTX 5070和RTX 5070 Ti之间。
最大短板: 273 GB/s的内存带宽是限制。算力足够,但数据传输慢。体验就像是一个脑子转得飞快但说话结巴的人。
创新玩法:用一台Mac Studio M3 Ultra来“辅佐”它。DGX Spark负责快速思考,Mac Studio负责流畅表达,强行解决“结巴”问题。
生态丰富:官方提供了超过20种开箱即用的玩法,从生成视频到搭建多智能体助手,AI全家桶都给你配齐了。
话不多说,先看数据。
每秒处理填充和解码的平均token数量,DGX Spark排在RTX 5080之后。DGX Spark对比Mac Mini M4 Pro还是要强上不少,尤其是在Prefill阶段。但是在Decode阶段,优势就没有这么明显了。Mac Mini M4 Pro在DeepSeek R1开源模型上的平均TPS能做到17.8,而DGX Spark也才33.1
Prefill(预填充/阅读理解阶段)
AI拿到我们的问题后,快速阅读和理解你输入的每一个字(即提示词)。这个阶段处理得越快,我们等待AI吐出第一个字的时间就越短。
Decode(解码/生成答案阶段)
就像AI已经想好了答案,开始逐字逐句地打字输出给我们。决定AI打字的速度,也就是我们常说的TPS(每秒生成词元数)。这个数值越高,我们看到答案完整显示的速度就越快。
TPS是Token Per Second(每秒处理词元数)的简称
Prefill阶段的TPS:代表AI读懂问题的速度。
Decode阶段的TPS:代表AI给我们生成答案的速度。
所以DGX Spark在给我们回答时,第一个字很快能出来,但是后续它的打字速度很慢。要知道,Mac Mini M4 Pro的价格才元,版本。textarea>div>textarea>div>textarea>div>textarea>div>textarea>div所以开头那张显示结果的图其实并不能全面地展示DGX Spark的能力因为它综合来看DGX Spark的优点是:它的短板致命且清晰——带宽Prefill阶段拼的是算力而Decode阶段拼的则是带宽这就是为什么DGX Spark在打字阶段表现平平的根本原因带宽限制?连接一台Mac Studio破解带宽是短板但已经有更极客的团队找到了榨干DGX Spark全部算力的方法那就是找一个带宽更快的桌面设备Mac Studio M3 Ultra利用其GBs的速度把大模型的推理速度愣是整体提升了倍拿到两台DGX Spark早期访问权限的EXO Lab就直接把大模型推理的Prefill和Decode两个阶段分别给了DGX Spark和Mac Studio来承担这叫做PD分离和我们之前介绍的预填充解码两个阶段一样一个依赖算力一个依赖带宽如上图所示黄色代表预填充阶段它决定着首个次元生成时间而蓝色代表解码阶段它决定了每秒生成的词元数EXO Lab的做法就是将Decode交给Mac Studio但PD分离的实现也并不简单EXO团队要解决的还有一个问题如何将DGX Spark设备上预填充阶段生成的内容传输到处理解码的设备上这部分数据量很大如果两台设备之间传输时间太长甚至可能会抵消性能提升的效果EXO的答案是:流水线式分层计算与传输这种分层流水线的方式能让计算和数据传输的时间完全重叠最终当所有层的预填充完成Mac Studio已经拿到完整的KV缓存可以立即开始解码虽然这套方案在某种程度上解决了DGX Spark带宽限制的问题提升了倍的速度但是费用也涨了倍两台DGX Spark和一台Mac Studio M3 Ultra的费用快接近万元人民币如果还是用来跑一个本地大模型未免太过于杀鸡用牛刀性能评测之外还能做些什么??带宽的局限并不是DGX Spark的全部统一内存用在数据中心级别的GB架构显卡支持每秒一千万亿次计算以及桌面级设计都有机会拓展它的应用场景我们在YouTube上找了一些博主的开箱和上手体验视频一起看看这台优缺点明显的设备可以做点什么本地AI视频生成生文模型现在基本上都免费使用但是生视频的模型大多数都需要充值会员或者积分制博主BijianBowen利用ComfyUI框架以及阿里的Wan 文本到视频模型直接根据DXG Spark官方的Playbooks配置了一个视频生成项目在视频生成过程中他提到即使命令后显示GPU的温度已经达到了摄氏度但是听不到一点噪音风扇转动的声音也没有除了用在视频生成和图像生成的ComfyUI提供了在DGX Spark上操作的指南还有在本地运行大模型的桌面工具LM Studio也发布了博客提到支持DGX Spark工具调用搭建多智能体聊天机器人LevelTechs分享了自己用DGX Spark并行运行多个LLMs和VLMs来实现智能体之间的交互得益于GB的大内存他可以选择亿参数的GPTOSS亿DeepSeekCoder以及QwenEmbedding和QwenVL四个模型来处理不同的任务这个项目也是Nvidia官方提供的指南在他们官网提供了超过种玩法并且每一种用法都给出了预计需要的时间以及详细的步骤我们在Reddit上也发现一些拿到了DGX Spark的用户开启了AMA活动博主分享了自己的测试结果同样提到AI能力对标RTX后续应该还会有更多DGX Spark的基准测试结果和更全面的使用指南更新APPSO的DGX Spark正快马加鞭赶来DGX Spark的存在看起来更像是AI狂飙时代下的一个实验一台数据中心级算力的桌面机器试探着我们对本地AI的幻想边界真正的问题除了DGX Spark能不能跑还有当我们每个人都能拥有一台超算时我们可以拿它做什么
本文由主机测评网于2026-05-13发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544908.html