开箱 NVIDIA DGX Spark：iPad mini尺寸实现千万亿次算力-编程阁

作者：毛烁

几天前，一位在行业深耕多年的朋友问我：现在满市场都是AIPC，究竟什么样的机器，才配得上“生产力”引擎，而不只是把“本地端侧智能”当卖点？

这个问题的关键，并不仅在于某一代芯片性能是否足够强，更在于算力的组织方式是否发生了变化。过去二十年，计算资源不断向云端集中，个人设备逐渐退化为算力入口。但在大模型时代，这种结构开始显现出系统性张力——模型规模、数据私有性与推理频率，正在加速算力重新下沉。

AIPC的出现，解决了部分本地推理问题，却仍受限于显存规模、内存割裂和模型生命周期不可持续，难以形成完整的计算闭环。本质上，算力依然是被预设、被封装的。

真正的分水岭，或许不是“PC 能不能跑 AI”，而是——个人是否能够拥有可持续演进的AI计算系统，能在本地完成推理、微调与优化，并长期沉淀数据与模型资产。

从这个意义上看，是否“每个人都应该拥有一台 AI 超算”？

最近，我们正好拿到了一台不久前发布的NVIDIA DGX Spark——一台被压缩到桌面尺度的AI超算。

GB10的CPU部分，搭载了专为数据预处理和AI任务优化的20核心ARM处理器。这颗CPU的核心调度策略采用“10+10组合”——10个Cortex-X925超大核，负责高负载的通用计算任务；10 个 Cortex-A725高能效核，负责处理后台进程和I/O 调度。

与之协同的，是基于 Blackwell架构的GPU核心。其集成了6144个Blackwell Generation CUDA 核心，搭载了第五代Tensor Core和第四代RT Core。

最令人惊艳的在于其张量性能（Tensor Performance）：在 FP4精度下，这1.2kg的“小盒子”能爆发出的峰值算力高达1 PFLOP（此为基于 FP4精度并结合稀疏性加速的理论值）。这意味着其单机的理论性能，已经能够支撑起200B（两千亿）参数级别的AI推理任务，或70B（七百亿）级别的模型微调训练。

为了匹配这样的计算与互联能力，NVIDIADGX Spark在存储I/O配置上标配4TB NVMe M.2 SSD，并支持自加密（Self-Encrypting），用于保护模型权重与数据资产的安全；网络侧除万兆以太网外，还支持Wi-Fi 7，覆盖从本地集群到无线办公的多种使用场景。

在如此激进的性能释放下，GB10芯片的TDP被控制在140W，整机满载功耗约240W。结合仅其紧凑的体积，NVIDIA DGX Spark给出了清晰的答案——桌面级AI计算不再只是靠堆功耗换算力，而是通过系统架构、内存模型和高速互连，把单位能耗下的有效算力密度推到新的高度。

对于LLM开发者而言，NVIDIA DGX Spark最具”爆发力”的能力，在于其配备128GB LPDDR5x统一系统内存。这套内存采用256-bit位宽，总带宽达到273 GB/s，由CPU与GPU 共享同一物理内存池。

与传统“CPU 内存+独立显存”的割裂架构不同，统一的内存从根本上绕开了24GB、48GB显存所形成的硬性上限。系统可以根据实际负载动态分配内存资源，模型参数、KV Cache，以及中间张量无需在 CPU内存与GPU显存之间反复搬运，不仅降低了内存拷贝带来的时延，也显著简化了大模型部署与调优的复杂度。

对开发者来说，这意味着可以在单机环境中承载更大的模型规模，并获得更稳定、可预测的推理性能。

回到最初的问题：什么样的机器，才配得上“生产力引擎”？

前文所拆解的，并不仅是DGX Spark的性能参数，更是整套计算范式的变化。从统一内存打破显存墙，到CPU与GPU在同一物理内存池内协同调度；从单机即可承载数百亿参数模型，到通过高速互连实现近线性的算力扩展。这些设计共同指向一个事实——AI计算正在从“被调用的资源”，转变为“可长期拥有、持续演进的系统”。

当模型可以在本地完成推理、微调与迭代，当数据与权重不再只是临时加载的消耗品，而是可以长期沉淀、不断增值的资产，计算设备本身的角色也随之发生改变——它不再是终端，而是个人级算力基础设施。

从这个意义上看，“每个人都应该拥有一台AI超算”或许是大模型时代对生产力工具提出的现实要求。

英伟达与AI芯片竞争对手Groq达成授权协议并聘用其CEO

英伟达已与AI芯片竞争对手Groq达成非独家授权协议。作为交易的一部分，英伟达将聘用Groq创始人乔纳森罗斯、总裁桑尼马德拉以及其他员工。CNBC报道称，英伟达正以200亿美元收购Groq的资产；英伟达向TechCrunch表示，这并非对该公司的收…

李华

Salesforce集成ChatGPT主要为防止客户数据泄露

Salesforce用户现在可以通过运行Agentforce与ChatGPT Enterprise或Edu版本直接从聊天机器人更新CRM数据。这一举措旨在遏制自制集成方案可能导致数据泄露到公司控制范围之外的风险。虽然这一合作被宣传为减少用户在OpenAI机器人和Salesforce之间切换时间的方式，但分…

李华

基于开源AI智能名片链动2+1模式S2B2C商城小程序源码的实体店私域运营策略研究

摘要：在数字化浪潮下，实体店面临公域流量成本高、获客难等问题，私域流量运营成为关键。本文以实体店私域运营为研究对象，类比实体店吸引顾客进店与线上吸引用户关注的过程，指出私域成交主要在微信群。重点探讨开源AI智…

李华

【大气】多时相 InSAR 中空间变化分层大气延迟校正联合模型研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页：Matlab科研工作室🍊个人信条：格物致知,完整Matlab代码及仿真咨询…

李华

揭秘Android定制：标签如何通过脚本操控系统

深入浅出：揭秘 Android 定制固件中的“魔法开关” 理解 TYPE_ 和 ENABLE_ 标签是如何通过脚本“活”起来的在 Android 系统定制开发中，你是否曾有过这样的疑惑？“为什么我只在一个配置文件里改了一个简单的标签，比如 TYPE_SCREEN_…

李华

机器学习——决策树剪枝

一、引言在机器学习的世界中，决策树因其直观易懂的特性而广受欢迎。然而，就像一棵自然生长的树木需要修剪才能茁壮成长一样，决策树模型也需要"剪枝"来避免过拟合（Overfitting），提高泛化能力。今天…

李华