英伟达GB300新宠:新型LPDDR5X SOCAMM内存

随着人工智能(AI)、机器学习(ML)和高性能计算(HPC)应用的快速发展,对于高效能、大容量且低延迟内存的需求日益增长。NVIDIA在其GB系列GPU中引入了不同的内存模块设计,以满足这些严格的要求。

此前,当从H100升级到H200时,由于后者提供了更高的内存带宽(4.8TB/s对比H100的3.35TB/s),所有可比较的批处理大小上的交互性普遍提高了43%。得益于KVCache对总批处理大小的限制减少,H200能够以更高的批处理速度运行,从而每秒生成三倍数量的token。这使得整体运营成本降低了约三倍,远超出了单纯硬件规格所能带来的预期收益。

图片

随着NVIDIA推出GB300 GPU,其供应链和提供的组件发生了重大变化。此前,针对GB200,NVIDIA提供了完整的Bianca板(包括Blackwell GPU、Grace CPU、512GB的LPDDR5X内存、VRM内容等集成在一个PCB上),以及交换托盘和铜背板。然而,对于GB300,NVIDIA采取了不同的策略,仅提供核心组件,并允许更多原始设备制造商(OEM)和原始设计制造商(ODM)参与计算模块的制造。

图片

NVIDIA将只提供B300 GPU作为“SXM Puck”模块,而不是整个Bianca板。这种转变使得更多的OEM和ODM能够参与到计算模块的生产中来。Grace CPU将以BGA封装形式单独提供,不再集成在Bianca板上。高带宽内存(HBM)控制器(HMC)将由美国初创公司Axiado提供,取代了GB200上的Aspeed产品。

图片

在GB200时代,NVIDIA选择了直接焊接在Bianca板上的512GB LPDDR5X作为主存方案。GB300,然而,在GB300的设计中,为了提高灵活性并降低成本,NVIDIA决定二级内存采用可插拔式的LPCAMM模块来替代传统的焊接内存,这一变化不仅简化了制造过程,还允许用户根据具体需求灵活配置内存容量和类型。

面对数据中心空间有限以及对更高密度内存解决方案的需求,NVIDIA提出了全新的SOCAMM(Space-Optimized CAMM)概念。SOCAMM旨在通过紧凑的设计实现最大化的存储容量,同时保持优异的性能表现。它特别适用于那些需要在有限的空间内部署大量计算资源的应用场景,如超大规模数据中心、边缘计算节点等。

近日,美光(Micron)与 SK 海力士(SK hynix)在存储技术领域迈出了重要一步,推出了新型的 LPDDR5X SOCAMM 内存,最高容量可达 128GB,并首次在英伟达(Nvidia)的 GB300 系统中亮相。这一创新成果为人工智能(AI)和低功耗服务器领域带来了全新的解决方案,有望重塑相关行业的内存应用格局。

SOCAMM,其尺寸仅为14x90mm,约为传统RDIMM的三分之一 。然而,“小身材”却蕴含着“大能量”,它最多可承载四个16芯片的LPDDR5X内存堆栈。美光的初始SOCAMM模块就提供了高达128GB的容量,这一容量规格在当前的内存市场中具备很强的竞争力,能够满足AI和低功耗服务器对大容量内存的需求。

image.png

美光的SOCAMM模块基于其1β(1-beta,第五代10nm级)DRAM工艺技术生产的LPDDR5X内存设备打造。虽然美光并未透露其初始SOCAMM内存棒具体支持的数据传输速率,但表明该内存的额定速度高达9.6 GT/s。

图片

而SK海力士在GTC 2025上展示的SOCAMM额定速度也达到了7.5 GT/s。与相同容量的RDIMM相比,LPDDR5X SOCAMM的带宽提升了2.5倍 ,这意味着数据能够以更快的速度在内存与处理器之间传输,大大提高了系统的数据处理能力,对于AI计算中大量数据的快速读写操作极为有利。

在服务器运行过程中,内存的功耗是一个不可忽视的问题。以配备每插槽TB级DDR5内存的服务器为例,其中DRAM的功耗甚至超过了CPU的功耗 。英伟达围绕LPDDR5X内存设计了Grace CPU,正是看中了LPDDR5X相较于DDR5更低的功耗特性。美光宣称,其128GB的SOCAMM内存功耗仅为同等容量DDR5 RDIMM的三分之一 。低功耗不仅有助于降低服务器的运营成本,还能减少数据中心的散热压力,对于追求绿色节能的数据中心而言,具有重要的意义。

图片

此次推出的LPDDR5X SOCAMM内存将首先应用于基于英伟达GB300 Grace Blackwell Ultra Superchip系统的服务器。

在AI领域,无论是训练还是推理应用,都需要处理海量的数据,这对内存的性能和容量提出了严苛的要求。例如,在AI训练过程中,深度学习模型需要频繁读取和存储大量的参数和数据,高带宽、大容量的内存能够显著加速数据的传输和处理,缩短训练时间。而在推理应用中,如智能语音助手、图像识别系统等,快速的内存响应速度可以使系统更及时地给出准确的结果。

LPDDR5X SOCAMM内存的出现,为英伟达GB300系统在AI计算方面提供了强大的内存支持,有助于进一步挖掘AI的潜力,推动相关应用的发展。

随着云计算和数据中心的发展,低功耗服务器的需求日益增长。低功耗服务器不仅可以降低运营成本,还能减少对环境的影响。LPDDR5X SOCAMM内存凭借其低功耗、高容量和高性能的特点,成为低功耗服务器的理想选择。它能够在保证服务器性能的前提下,有效降低能耗,提升服务器的能效比。这对于构建绿色、高效的数据中心具有重要意义,有助于数据中心运营商在控制成本的同时,满足不断增长的数据处理需求。

尽管LPDDR5X SOCAMM内存展现出了诸多优势,但目前仍存在一些不确定性。例如,SOCAMM是否会成为JEDEC(固态技术协会)支持的行业标准尚未可知。如果能成为行业标准,将有利于其更广泛地推广和应用,促进整个行业的规范化发展;反之,若仅作为美光、三星、SK海力士和英伟达为特定服务器开发的专有解决方案,其应用范围可能会受到一定限制 。但无论如何,LPDDR5X SOCAMM内存的出现都为存储技术的发展注入了新的活力,值得业界持续关注。

如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!

精彩推荐:

  • 深度解读PCIe相关内存操作原理

  • 基于CXL内存的热数据检测技术解读

  • 学术前沿|专为CXL SSD设计的文件系统

  • 2025伊始,PCIe 7.0的脚步更近了

  • 存储随笔2024年度技术分享总结

  • 浅析下一代NAND接口新特性SCA

  • 2025年CXL强势启航:开启内存扩展新时代

  • PCIe SSD在温变环境的稳健性技术剖析

  • DWPD指标:为何不再适用于大容量SSD?

  • 突破内存墙:DRAM的过去、现在与未来

  • E1.S接口如何解决SSD过热问题?

  • ZNS SSD是不是持久缓存的理想选择?

  • 存储正式迈入超大容量SSD时代!

  • FMS 2024: 带来哪些存储技术亮点?

  • IEEE报告解读:存储技术发展趋势分析

  • PCIe P2P DMA全景解读

  • 深度解读NVMe计算存储协议

  • 浅析不同NAND架构的差异与影响

  • 浅析PCI配置空间

  • 浅析PCIe系统性能

  • 存储随笔《NVMe专题》大合集及PDF版正式发布!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/74983.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

静态网页应用开发环境搭建实战教程

1. 前言 静态网页开发是前端工程师的基础技能之一,无论是个人博客、企业官网还是简单的Web应用,都离不开HTML、CSS和JavaScript。搭建一个高效的开发环境,能够极大提升开发效率,减少重复工作,并优化调试体验。 本教程…

Python每日一题(9)

Python每日一题 2025.3.29 一、题目二、分析三、源代码四、deepseek答案五、源代码与ai分析 一、题目 question["""企业发放的奖金根据利润提成。利润(I)低于或等于10万元时,奖金可提10%,利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部…

游戏引擎学习第187天

看起来观众解决了上次的bug 昨天遇到了一个相对困难的bug,可以说它相当棘手。刚开始的时候,没有立刻想到什么合适的解决办法,所以今天得从头开始,逐步验证之前的假设,收集足够的信息,逐一排查可能的原因&a…

【入门初级篇】布局类组件的使用(1)

【入门初级篇】布局类组件的使用(1) 视频要点 (1)章节大纲介绍 (2)布局类组件类型介绍:行布局、列布局、标题 (3)实操演示:列表统计查询布局模型 点击访问my…

对内核fork进程中写时复制的理解记录

前言 文章写于学习Redis时对aof后台重写中写时复制的疑问 一、感到不理解的歧义 在部分技术文档中(以小林的文章为例),对写时复制后的内存权限存在如歧义: ! 二、正确技术表述 根据Linux内核实现(5.15版本&#x…

Ditto-Talkinghead:阿里巴巴数字人技术新突破 [特殊字符]️

Ditto-Talkinghead:阿里巴巴数字人技术新突破 🗣️ 阿里巴巴推出了一项新的数字人技术,名为 Ditto-Talkinghead。这项技术主要用于生成由音频驱动的说话头,也就是我们常说的“数字人”。不过,现有的基于扩散模型的同类…

.NET开发基础知识1-10

1. 依赖注入(Dependency Injection) 技术知识:依赖注入是一种设计模式,它允许将对象的依赖关系从对象本身中分离出来,通过构造函数、属性或方法参数等方式注入到对象中。这样可以提高代码的可测试性、可维护性和可扩展…

每日一题 MySQL基础知识----(三)

数据库常用基础知识:代码讲解和实验 1.创建数据库student 02,创建一个名为student02的数据库 CREATE DATABASE student02; 2.在student02中创建一张 students表,并且具有学生的编号id,姓名name,年龄age,生…

MySQL多表查询实验

1.数据准备 -- 以下语句用于创建 students 表,该表存储学生的基本信息 -- 定义表名为 students CREATE TABLE students (-- 定义学生的唯一标识符,类型为整数,作为主键,且支持自动递增student_id INT PRIMARY KEY AUTO_INCREMENT…

windows第二十章 单文档应用程序

文章目录 单文档定义新建一个单文档应用程序单文档应用程序组成:APP应用程序类框架类(窗口类)视图类(窗口类,属于框架的子窗口)文档类(对数据进行保存读取操作) 直接用向导创建单文档…

C++ 初阶总复习 (16~30)

C 初阶总复习 (16~30) 目的16. 2009. volatile关键字的作用17. 2010.什么是多态 简单介绍下C的多态18. 2011. 什么是虚函数 介绍下C中虚函数的原理19. 2012 构造函数可以是虚函数嘛20. 2013.析构函数一定要是虚函数嘛?21. 2015. 什么是C中的虚…

第一天 Linux驱动程序简介

目录 一、驱动的作用 二、裸机驱动 VS linux驱动 1、裸机驱动 2、linux驱动 三、linux驱动位于哪里? 四、应用编程 VS 内核编程 1、共同点 2、不同点 五、linux驱动分类 1、字符设备 2、块设备 3、网络设备 六、Linux驱动学习难点与误区 1、学习难点 …

PaddleX产线集成功能的使用整理

一、环境搭建 1.1 安装paddle-gpu 需要根据安装机器的cuda的版本,选择合适的版本进行安装 #安装paddle-gpu 官网链接 https://www.paddlepaddle.org.cn/install/quick?docurl/documentation/docs/zh/install/pip/linux-pip.html python -m pip install paddle…

docker-compese 启动mysql8.0.36与phpmyadmin,并使用web连接数据库

1、找一个文件夹,比如 E:\zqy\file\mysql,cd到这个目录下创建文件docker-compose.yml 2、将下面的代码块复制到docker-compose.yml文件中 version: 3.3 services:mysql:image: mysql:8.0.36container_name: mysqlrestart: alwaysports:- 3306:3306netw…

解决 Gradle 构建错误:Could not get unknown property ‘withoutJclOverSlf4J’

解决 Gradle 构建错误:Could not get unknown property ‘withoutJclOverSlf4J’ 在构建 Spring 源码或其他基于 Gradle 的项目时,可能会遇到如下错误: Could not get unknown property withoutJclOverSlf4J for object of type org.gradle…

mcp 接freecad画齿轮

from mcp.server.fastmcp import FastMCP import freecad.gears.commands import os from freecad import app from freecad import part mcp FastMCP("Demo")mcp.tool() def create_gear(num_teeth20,height10,double_helix True):"""创建一个渐开线…

【大前端系列19】JavaScript核心:Promise异步编程与async/await实践

JavaScript核心:Promise异步编程与async/await实践 系列: 「全栈进化:大前端开发完全指南」系列第19篇 核心: 深入理解Promise机制与async/await语法,掌握现代异步编程技术 📌 引言 在JavaScript的世界中,异步编程是无…

如何排查java程序的宕机和oom?如何解决宕机和oom?

排查oom 用jmap生成我们的堆空间的快照Heap Dump(堆转储文件),来分析我们的内存占用 用可视化工具,例如java中的jhat分析Heap Dump文件 ,它分析完会通过一个浏览器打开一个可视化页面展示分析结果 根据oom的类型来调…

什么是 OLAP 数据库?企业如何选择适合自己的分析工具

引言:为什么企业需要 OLAP 数据库? 你是否曾经经历过这样的场景: 市场部门急需一份用户行为分析报告,数据团队告诉你:“数据太大了,报表要跑 4 个小时”;业务负责人在会议中提出一个临时性分析…

测试:认识Bug

目录 一、软件测试的生命周期 二、bug 一、软件测试的生命周期 软件测试贯穿于软件的生命周期。 需求分析: ⽤⼾⻆度:软件需求是否合理 技术⻆度:技术上是否可⾏,是否还有优化空间 测试⻆度:是否存在业务逻辑错误、…