news 2026/6/13 14:59:33

AI 正在“吃光内存”,NVIDIA与SK海力士把目光投向了 NAND

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI 正在“吃光内存”,NVIDIA与SK海力士把目光投向了 NAND

继大规模蚕食DRAM市场后,英伟达与SK海力士计划推出性能提升近10倍的"AI SSD",引发NAND供应警报。随着AI产业重心从训练转向推理,技术栈需全面升级以构建低延迟、高吞吐环境,行业正聚焦通过NAND芯片打造推理优化的AI存储方案,SK海力士预计在2027年前推出相关解决方案。

AI SSD可以扩展到1亿IOPS,这比传统的企业SSD要大得多。当研究这种解决方案的需求时,很明显,当前的AI工作负载结构需要连续访问大量模型参数,这是HBM或通用DRAM产品无法满足的。AI SSD最终将允许伪内存层,针对AI工作负载进行优化,显著提升模型加载、参数访问以及数据调度效率,为大模型推理带来数量级上的性能改善。

随着传统AI工作负载向推理侧迁移,这一趋势的动因之一在于英伟达已决定在Rubin CPX GPU中集成通用GDDR7内存处理预填充阶段。据有关媒体报道,类似技术路径或将延伸至NAND领域,一系列举措可能彻底重塑NAND产业格局。

近年来,AI 训练和推理对 DRAM 尤其是 HBM 的需求急剧上升,头部厂商的大规模采购几乎锁定了未来一段时间的高端内存产能,供需紧张已经成为行业共识。在这样的背景下,仅依赖 DRAM/HBM 来承载越来越大的模型参数和中间数据,成本和可获得性都在变得越来越不友好。

AI SSD 的出现,本质上是一种向“内存层级外延”要空间的尝试。通过让高性能 NAND 承担部分原本由内存负责的数据访问工作,尤其是在推理场景中对容量和吞吐更敏感、对极致时延要求相对可控的环节,AI SSD 有机会在不显著推高成本的前提下,缓解内存压力,提升整体系统效率。这也意味着,NAND 在 AI 系统中的角色,正在从“冷数据存储”向“主动参与计算的数据层”演进。

从产业链角度看,这并非孤立动作。一方面,DRAM 与 HBM 供给趋紧、价格上行已是公开事实;另一方面,AI 服务器整体配置正在变得越来越“存储密集”,无论是本地推理、企业私有化部署,还是多模型并行运行,对高速、大容量存储的依赖都在明显提升。NVIDIA 与 SK hynix 在这一时间点推动 AI SSD,既是技术演进的结果,也是供应链现实倒逼下的一种必然选择。

对于 AI 服务器供应商和用户而言,这类变化意味着,未来的算力系统不再只是“GPU + 内存”的简单叠加,而是需要从更系统的角度重新审视 计算、内存与存储之间的分工与协同方式。谁能更早理解这种变化,并在架构设计和选型阶段提前做出调整,往往就能在成本、可扩展性和交付确定性上占据主动。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/13 19:06:07

这6个工具,让你的Linux监控如鱼得水,运维效率翻倍!

今天想和大家分享一下我在日常运维工作中最常用的6个Linux系统监控工具。这些工具涵盖了命令行TUI(文本用户界面)和图形化GUI两种类型,能帮助我们快速定位性能瓶颈、监控资源使用、甚至直接管理进程。在服务器环境尤其是SSH远程接入时,命令行工具是首选,而在桌面或本地调试…

作者头像 李华
网站建设 2026/6/13 6:12:13

AI智能体 - A2A协议

打破孤岛:Google A2A 协议——构建下一代多智能体协作系统的基石 在 AI 智能体(AI Agents)飞速发展的今天,我们拥有了基于 LangGraph、CrewAI、Google ADK 等不同框架构建的强大智能体。然而,这些“超级大脑”往往各自…

作者头像 李华
网站建设 2026/6/13 4:11:42

突破与变革:2026年AI领域的技术创新与新机会

人工智能(AI)在过去的十年里已经从一种实验性技术变成了各行各业的核心动力之一。如今,随着AI技术的迅猛发展,2026年将是一个充满变革的时代。在这一年,AI不仅将在技术上取得突破,还将在多个领域催生新的商…

作者头像 李华
网站建设 2026/6/11 19:32:35

测试压力的管理:从压力源到韧性提升‌

——为软件测试从业者构建可持续的工作生态 测试工作的压力图谱‌ 在数字化浪潮中,软件测试作为产品质量的“守门员”,其角色日益关键。然而,测试从业者往往陷入多重压力漩涡:项目周期压缩、缺陷修复的反复性、新技术迭代的焦虑…

作者头像 李华
网站建设 2026/6/11 22:43:22

AMD GPU大模型训练性能优化终极指南:从40%到90%效率提升

AMD GPU大模型训练性能优化终极指南:从40%到90%效率提升 【免费下载链接】flash-attention Fast and memory-efficient exact attention 项目地址: https://gitcode.com/GitHub_Trending/fl/flash-attention 你是否在使用AMD GPU进行大模型训练时&#xff0c…

作者头像 李华
网站建设 2026/6/10 14:08:51

边缘计算终极指南:让物联网设备秒变智能终端

你是否曾因物联网设备响应迟缓而错失关键数据?是否因云端计算延迟而影响业务决策?边缘计算技术正在重新定义物联网的可能性,将数据处理能力从云端迁移到设备本地,让设备具备自主智能处理能力。本文为您提供边缘计算的完整解决方案…

作者头像 李华