HBM之父:HBM的终点是HBF

微信视频号:sph0RgSyDYV47z6
快手号:4874645212
抖音号:dy0so323fq2w
小红书号:95619019828
B站1:UID:3546863642871878
B站2:UID: 3546955410049087
韩国半导体公司SK海力士日前宣布,已完成下一代超高性能AI存储器产品HBM4的开发,并且已经为全球首次量产准备就绪。
HBM4将是下一代数据中心和AI芯片的首选标准,是存储三巨头海力士、三星和美光争压的一张王牌。将使用它的英伟达Rubin GPU,已经最近在台积电成功流片,2026年量产。
 
 
添加图片注释,不超过 140 字(可选)
(从HBM3到HBM4架构)
HBM4 拥有业界最佳的数据处理速度和能效,采用2048 个 I/O 端口,带宽较上一代翻倍,能效提升 40% 以上。预计该产品应用后,AI 服务性能将提升高达 69%,从而解决数据瓶颈问题,并大幅降低数据中心的电力成本。
SK海力士表示:“HBM4的开发完成将成为行业新的里程碑。”未来,HBM将不再是标准化产品。为了降低整体的功耗和性能损失,上游AI芯片厂商纷纷开启了定制化趋势。它主要是用针对特定AI加速器架构定制的基底裸片(custom base die),取代了传统的通用裸片,优化信号路径、电源分配和接口协议,从而实现更高的能效和带宽密度。半导体分析机构Semianalysis认为,这是一次革新架构层面的重大飞跃,彻底改变了HBM与AI加速器的集成方式。
今年6月,SK海力士已与英伟达、微软、博通达成HBM4E定制合作,三星也在与博通、AMD谈判。这对中国厂商意味着更高的技术门槛与商业壁垒。亚马逊AWS高管甚至称,定制化可能“关闭其他玩家的大门”。HBM国产替代仍要加速奔跑,尽早实现国产AI算力生态闭环。
HBM5时代,英伟达杀入
存储墙的长期存在,成本持续上涨,威胁着英伟达未来的市场地位。从Ampere到Blackwell Ultra,HBM不仅在材料清单(BOM)中成本超过一半,而且还在继续增长,BOM增长中绝对和相对增长的最大部分都来自HBM。
在计算与存储架构融合的趋势下,HBM决定着未来AI芯片制高点,英伟达从去年即开始布局掌握核心技术。最近更是传出英伟达将自己设计HBM基础裸片。这是一项至关重要的核心技术,英伟达已经决定,今后无论用谁家的HBM,基础裸片必须自家设计。据业内盛传,3纳米制程的基础裸片,预计将于2027年下半年小规模量产。
实际上,英伟达已经于2024年8月就向美国专利局提交了一份专利申请,并于12月获批。这项专利是一种 3D 堆叠式“近存储计算”架构,通过让处理器裸芯片与存储裸层层堆叠并一一对应,提升了数据局部性和运算效率,特别适用于 AI 大模型训练和高性能计算场景。
这样的话,英伟达的自己设计的裸芯片将有可能用于HBM5。据韩国科学技术院(KAIST)的TeraLab最近展望,HBM5 将于 2029 年上市,瞄准英伟达的Feynman GPU。
HBF将取代HBM
HBM 已经成为韩国半导体产业同义词, KAIST的金正浩教授被称为“HBM之父”。他让韩国AI半导体享誉世界,为三星电子、SK海力士等韩国半导体企业主导全球高宽带存储产业,提供了理论与技术的支持。
今年6月,金教授指导TeraLab 公布了一份至2038年的 HBM 路线图,规划了从HBM4 到HBM8的技术进步。
金教授预测:“在HBM4中,一些GPU功能将被整合进基底芯片,同时使用LPDDR 存储器,可以缓解数据瓶颈。”到了HBM5阶段,构成 HBM 的DRAM 中的TSV(硅通孔)数量将增加到 4000 根以上,嵌入SRAM 缓存,并且将封装直接浸入冷却液,这种浸没式冷却会成为标准。HBM6将在基底芯片上以“双子塔”的形式排列多个HBM堆栈,并引入玻璃与硅结合的混合中介层。
金教授认为,这时真正的变革才开始。
HBM7将采用嵌入式冷却技术,让冷却液直接在存储晶片之间流动。更重要的是,在这一阶段,一个名为高带宽闪存(HBF)的新概念将出现,它利用大容量、低成本、断电不丢失数据的 NAND 闪存。最终,HBM8将演化为完全的3D结构,HBM 将同时置于GPU的上下两侧,带宽有望达到每秒64TB。
9月3日,在仁川松岛会展中心举行的国际先进半导体基板·封装产业展(KPCA Show)Insight 2025主旨演讲中,金教授表示:“未来,将NAND闪存像高带宽内存(HBM)一样堆叠的HBF,将左右整个业界的性能表现。”
HBF是一种基于NAND闪存的堆叠式内存,其技术概念与HBM相似。今年初,美国闪存公司SanDisk公开表示正在开发这项技术。它与HBM的实现方式类似,后者是将DRAM芯片像塔一样垂直堆叠,然后通过硅通孔(TSV)进行垂直互连。HBF的不同之处在于,它用NAND闪存取代了DRAM芯片,以特定的方式进行堆叠。
Sandisk认为,今年以来发布的大模型出现了明显的新趋势。每一代新模型尺寸和上下文长度都在增加,这推动了对更高内存容量的需求,而混合专家 (MoE) 等架构创新的实施导致计算需求呈相对下降趋势。这种对更多内存和更少计算需求的组合催生了一种新范式,Sandisk称之为“以内存为中心的 AI”的新范式——它最适合基于 HBF 的系统。
而基于 NAND 的架构可提供 8 到 16 倍于HBM的容量,同时以相同的价格提供相同的读取带宽。
 
 
添加图片注释,不超过 140 字(可选)
(来源:Sandisk)
金教授指出:“目前,三星电子和SK海力士的业绩主要由HBM决定,但十年后,HBF将取而代之。”
他说:“HBM负责速度,而HBF将负责容量。”他的设想是堆叠数百层NAND闪存,将其重构为类似HBM的高带宽结构。预计在未来10年内,HBF可能会成为存储市场的另一大支柱。已有一些海外公司希望在这一研究上与金教授进行合作。
HBF可以取代HBM基底芯片上LPDDR的位置。通过补充HBM的容量限制,HBF可以直接在GPU内存储大型AI模型。在这种架构中,HBM将扮演临时快速处理数据的缓存角色,而HBF则充当存储海量AI模型本身的主内存角色。金教授预测:“同时生产DRAM和NAND闪存的三星电子和SK海力士这两家公司将迎来巨大的发展机遇。”Sandisk已经与 SK海力士合作,共同制定HBF的全面行业标准。
除了内存带宽和容量之外,金教授还将HBM的稳定供电和散热管理列为重要的AI性能决定因素。他分析道:“TSV在供电和散热管理中扮演着重要角色。三星电子和SK海力士的产品在质量上可能存在差异,部分原因可能在于对TSV的精简。”
金氏定律
如果说在加速计算领域有“黄氏定律”,在存储领域就有“金氏定律”(Kim's law)。金教授于2017年提出,密集三维集成电路中堆叠和层数大约每两年翻一番,并预测这一增长率将持续多年。
金教授的预测多年来已被证实。它已被用于指导韩国半导体行业的长期规划和制定研发目标。高带宽系统的进步与金氏定律密切相关:数据带宽、I/O数量和内存容量。高数据带宽系统促进了图形计算、高性能计算系统和机器学习应用的最新发展。
当HBM刚开始研发时,很多人质疑谁会使用这样昂贵而复杂的存储器,但金教授团队追求学术成就,坚持研究,随着ChatGPT的出现,他们的成果迎来了爆发。SK海力士和三星电子开发的HBM都融合了金教授的研究。实验室的成果也在ISSCC、VLSI等国际会议上发表,并为 HBM 标准化进程提供了关键理论。
金教授表示:“决定AI性能的不是 GPU,而是HBM的带宽和连接数量。”其团队的使命,就是为了实现这一蓝图奠定理论基础。
人工智能(AI)的性能提升越来越依赖于内存带宽和容量。金教授解释说:“当前的AI主要基于Transformer深度学习架构的生成式AI。要处理一个输入Token达到100万个的模型,需要TB级别的数据。”他补充道:“当每秒需要对TB级别的大数据进行数千次的读写操作时,如果内存带宽不足,就会出现瓶颈现象。”
一旦出现瓶颈,基于OpenAI的ChatGPT或Google Gemini等大型语言模型的生成式AI服务响应速度就会变慢。这种瓶颈源于当前计算机的基础架构,即冯·诺依曼架构。在这种架构下,CPU或GPU与内存是物理分离的,因此两者之间的数据传输速度(即带宽)至关重要。金教授强调:“即使GPU的尺寸扩大一倍,如果内存带宽不足,也无济于事。AI的性能最终受限于内存,并由内存的性能决定。”
Teralab,HBM研究枢纽
 
 
添加图片注释,不超过 140 字(可选)
(金教授在TeraLab门口)
自 2000 年代初金正浩教授创建 TeraLab 以来,这里就成为一个专注于存储与封装的全球研究枢纽。HBM是其中的核心。TeraLab把 HBM从一个概念变为现实,并且一步一步地把曾经被视为低价值元件的存储半导体,转变为高价值的半导体和AI的核心部件。金教授“HBM 之父”的称号名符其实。
金教授的团队和实验室连接着产业现场。自2010年代初期起,他们便参与与三星电子、SK海力士的HBM商用化研究,架起了学界与产业的桥梁。实验室开发的封装仿真技术,以及电源与信号完整性分析方法,成为全球首款 HBM 产品开发的基石。
TeraLab的论文在学术界和业界被广泛引用,尤其是封装与存储接口论文已被引用数百次,实验室提出的“基于混合键合的TSV结构”,直接被应用于HBM3E和下一代HBM的设计中。
HBM并不是唯一的研究重点。实验室的2.5D 和 3D封装技术同样世界领先。他们提出的微通道冷却设计和中介层功耗优化分析,已经成为全球公司在设计下一代 GPU 和 AI 芯片时参考的基础模型。金教授还代表韩国参与了《国际半导体技术路线图》(ITRS)和 IEEE 《异构集成路线图》(HIR),把TeraLab的研究成果带入全球标准化讨论。
这些研究成果也促进了人才培养。迄今为止,已有 200 多名学生在 TeraLab 获得硕士和博士学位,许多人如今在三星电子、SK 海力士、英伟达、谷歌和苹果等全球半导体公司担任核心技术人员。许多科技巨头都热衷于招募拥有半导体背景经验的学生。这些学生不仅进入主要的半导体公司,还加入了 Meta、特斯拉和 Groq。金教授说:“如今,连苹果都迫切希望招收我们实验室的学生。”
TeraLab 的运营模式非同寻常。金教授认为:“靠短期的政府项目是无法中大奖的。”他认为政府主导的研究支持实际上会限制创造力。相反,实验室通过与企业的合作研究项目来保证研究费用,而硕博生的论文研究则专注于 HBM。在金教授办公室外,可以看到众多与其合作过的公司 Logo,甚至包括现代汽车。实验室通过企业项目筹资,而论文研究则完全专注于长期的特定主题,学生获得了企业研究环境的经验,成为可立即投入工作的技术人才。
金教授在研究成果处理上也采取了不同的做法。他说:“HBM 能成功,是因为我们没有执着于专利。”他认为如果把申请专利当作目标,技术反而会受到束缚。“让更多人自由使用和发展想法更重要。”加州大学伯克利分校发明 FinFET 技术的胡正明教授(自 2010 年以来推动半导体小型化),也因类似原因没有为该技术申请专利。
最近,金教授对Agentic AI产生了浓厚兴趣。即便离退休不远,他仍全力投入新领域。他和学生们如今正在研究利用 Agentic AI 实现自动化的 HBM 设计。
 
微信视频号:sph0RgSyDYV47z6
快手号:4874645212
抖音号:dy0so323fq2w
小红书号:95619019828
B站1:UID:3546863642871878
B站2:UID: 3546955410049087
 
参考文献链接
HBM之父:HBM的终点是HBF
 
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/917974.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深圳哪家建设网站公司好网页链接打不开是什么原因

12天 本节学习了基于MindSpore的GPT2文本摘要。 1.数据集加载与处理 1.1.数据集加载 1.2.数据预处理 2.模型构建 2.1构建GPT2ForSummarization模型 2.2动态学习率 3.模型训练 4.模型推理

实用指南:40.应用层协议HTTP(三)

实用指南:40.应用层协议HTTP(三)pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco…

建德市住房和城乡建设局网站制作公司官网的步骤

目录 1 搭建嵌入式gdb调试环境 1.1 交叉编译工具链自带的gdb和gdbserver 1.2 使用gdb进行嵌入式程序调试 1.2.1编写简单测试程序 1.2.2 gdb调试程序 1.3 源码编译gdb和gdbserver 1.3.1 下载gdb和gdbserver源码 1.3.2 编译gdb 1.3.3 移植gdbserver 2 VSCodegdbserver 图…

南宁制作网站网页代码大全

我初始化h2数据库, 然后把jar 放到 springside-4.0.0.RC2\examples\mini-web 中 ,最后配置启动tomcat。 就出现这个错。 最开始我用 quick-start.bat ,但总是执行到一半就 挂掉了。 提示spy 包没找到 。 这个是在装载 xml,解析成b…

网站建设调研提纲wordpress评论页面

目录 1. 文本分类 2. 图像识别 3. 生物信息学 4. 金融预测 5. 其他领域 1. 文本分类 垃圾邮件过滤:SVM通过训练大量标记为垃圾邮件和非垃圾邮件的样本,学习出能够区分两者的模型,从而实现对新邮件的自动分类。情感分析:在社…

【GitHub每日速递 250926】12 周 24 课,边学边练!微软 AI 初学者的通关秘籍

原文:https://mp.weixin.qq.com/s/t99TeeaVhDTuzobY6WkYng 揭秘Linera:高可扩展区块链基础设施,附CLI工具快速上手攻略 linera-protocol 是一个基于Rust构建的高性能、去中心化微服务区块链协议的底层框架。简单讲,…

mcp-use mcp server 交互工具

mcp-use mcp server 交互工具mcp-use mcp server 交互工具,当然mcp-use 不支持简单的mcp client,还支持agent开发,通过mcp-use 我们可以将llm 与mcp server 集成起来,提升agent 的能力 简单示例 import asyncio i…

年薪破百万、涨薪60%,人形机器人企业疯狂「抢人」

微信视频号:sph0RgSyDYV47z6快手号:4874645212抖音号:dy0so323fq2w小红书号:95619019828B站1:UID:3546863642871878B站2:UID: 35469554100490872025年,人形机器人不再只是春晚舞台上的炫技明星,而是逐渐走进具…

深入解析:HttpClientFactory vs new HttpClient:.NET Core HTTP 客户端的正确打开方式

深入解析:HttpClientFactory vs new HttpClient:.NET Core HTTP 客户端的正确打开方式2025-09-26 08:01 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important;…

石家庄整站优化技术园区网互联及网站建设项目

目录 统一数据返回一. 概念二.实现统一数据返回2.1 重写responseAdvice方法2.2 重写beforeBodyWriter方法 三. 特殊类型-String的处理四. 全部代码 统一数据返回 一. 概念 其实统一数据返回是运用了AOP(对某一类事情的集中处理)的思维,简单…

自助建个人网站哪个好购物网站框架

在 PHP 中,多进程的处理通常会遇到一些挑战,比如资源共享、进程间通信、性能优化等。Swoole 是一个高性能的协程和多进程框架,旨在为 PHP 提供异步、并发、协程等功能,解决了传统 PHP 环境中的多进程管理问题。通过使用 Swoole&am…

华为投的这家上海独角兽,要IPO了!

微信视频号:sph0RgSyDYV47z6快手号:4874645212抖音号:dy0so323fq2w小红书号:95619019828B站1:UID:3546863642871878B站2:UID: 3546955410049087近日,赛美特信息集团股份有限公司(以下简称“赛美特”)正式向港…

0134_委托模式 (Delegate)

委托模式 (Delegate) 意图 两个对象参与处理同一个请求,接收请求的对象将请求委托给另一个对象来处理。 委托模式的核心思想是:一个对象将某些职责交给另一个专门的对象去完成,从而实现职责的分离和代码的复用。 UM…

外贸网站建设公司平台中建国能建设集团网站

强烈建议去看看《上海交通大学生存手册》,内容可能有点长,但讲得很好,说出了大学教育的本质。如果几年前我能看到它,也许我的大学生活可能会不一样。 只是,没有如果。 那么我把这本手册推荐给正在上大学或者是将要上…

注册过哪些网站瑞丽航空公司官方网站

https://vjudge.net/problem/UVA-11971 有一根长度为n的木条&#xff0c;随机选k个位置把它们切成k1段小木条。求这些小木条能组成一个多边形的概率。 将木条看做一个圆&#xff0c;线上切k刀等价于圆上切k1刀 如果能组成多边形&#xff0c;每一段木条的长度都要<圆周长/2 反…

个人或企业做网络贸易的主要网站企业信用信息查询公示系统网址

ChatGLM2-6B介绍&#xff1a; 介绍 ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本&#xff0c;在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上&#xff0c;ChatGLM2-6B 引入了如下新特性&#xff1a; 更强大的性能&#xff1a;基于 ChatGLM 初…

网站被黑了多久恢复wordpress 文章免审核

值转换器 valueconvert 使用ValueConverter需要实现IValueConverter接口&#xff0c;其内部有两个方法&#xff0c;Convert和ConvertBack。我们在使用Binding绑定数据的时候&#xff0c;当遇到源属性和目标控件需要的类型不一致的&#xff0c;就可以使用ValueConverter&#xf…

网站图标怎么设置建筑公司需求发布网站

SSE是server-sent events协议简称,SSE协议主要是依托于HTTP链接用来从服务端将消息、信息、事件推动给客户端的协议。 SSE简介 SSE最近突然的被很多人关注还有一个主要原因就是ChatGPT等大模型的聊天类系统就采用了SSE协议。在使用ChatGPT的时候,输入Prompt后的反馈是逐渐的…

邯郸网站设计公司排名wordpress 显示微博

大家好&#xff0c;我是『芯知识学堂』的SingleYork&#xff0c;前面给大家简单介绍了『开源项目』基于STM32的智能垃圾桶之成员简介&#xff0c;相信有很多小伙伴都已经忍不住跃跃欲试了&#xff0c;别着急&#xff0c;从这一篇开始&#xff0c;笔者将会带领大家一步一步来完成…

假如电脑的服务器关闭后做的网站还能打开吗logo在线设计生成免费

众所周知&#xff0c;验证码在我们的生活中都是非常常见的&#xff0c;很多公司都在各种折腾各种各样的验证码&#xff0c;这里简要的用一个小案例来实现验证码的功能&#xff08;ps:其实我挺讨厌验证码这个东西的&#xff09;。 建立一个javaweb工程&#xff0c;新建login.htm…