NVIDIA Rubin平台重磅亮相CES:六芯协同重塑AI算力,2026下半年量产落地

从行业演进视角来看,CES虽仍冠以消费电子展之名,但如今已成为科技巨头发布前沿算力技术的重要阵地,其技术辐射范围早已突破消费端边界。NVIDIA作为AI算力领域的领军者,此次率先召开芯片厂商发布会,重磅推出下一代Rubin AI平台,正是这一趋势的鲜明体现,也为2026年AI算力硬件迭代拉开了序幕。

据NVIDIA披露,Rubin平台所需核心芯片已全部完成晶圆制造,进入实验室系统调试阶段,量产与上市节奏清晰可控。作为NVIDIA算力路线图的关键迭代节点,Rubin GPU及配套芯片的核心目标是实现性能与能效的双重突破:单GPU AI推理性能较前代Blackwell提升5倍、训练性能提升3.5倍,同时配套升级计算、内存及网络资源,构建全栈算力支撑体系。这一布局既是NVIDIA对自身技术的迭代超越,也进一步巩固了其在高端AI算力领域的领先优势。

过去数年,NVIDIA为CPU、GPU及网络架构的协同演进制定了详尽且透明的技术路线图。对于头部算力厂商而言,大规模客户群体对技术稳定性与交付确定性的需求极高,突发式官宣已非最优选择。因此,NVIDIA转向“明确预期、按期交付”的策略,通过清晰的路线图同步生态伙伴,保障产业链协同推进。

基于这一策略,NVIDIA选择在CES发布Rubin平台,本质是对技术成熟度与量产进度的一次公开背书,传递出“全流程按计划推进”的明确信号。目前该硬件虽未正式发货,量产爬坡预计于2026年下半年启动,但结合已落地的芯片样品、生态伙伴的同步适配进展,此次提前发布更像是对行业的一次技术预热,强化市场对下一代算力平台的预期。

需要说明的是,此次发布会并非技术细节专场——NVIDIA已通过单独发布技术博文的形式,补充核心参数与架构细节,发布会本身则聚焦平台级价值输出,梳理Rubin的核心芯片构成、整机适配方案,仅披露关键性能指标。这种“宏观+微观”的分层披露方式,既符合行业头部厂商的发布惯例,也兼顾了不同受众的信息需求。

Rubin平台:CPU+GPU+DPU+网卡+NVLink+以太网交换机的全栈协同

正如NVIDIA过去一年多所铺垫的,Rubin既是一款GPU架构,也是一套更庞大的全栈平台。尽管NVIDIA本质仍是一家GPU厂商,但从Blackwell平台开始,尤其到Rubin时代,公司更倾向于向客户推销整套系统——若条件允许,甚至是完整的SuperPOD集群。因此,Rubin平台的研发与发布,对NVIDIA的意义不在于推出一款高端芯片,而在于打造了六款协同工作的核心芯片。

Rubin GPU:性能核心,算力翻倍突破

毫无疑问,Rubin GPU是整场发布会的核心亮点。作为NVIDIA下一代GPU架构的首款落地产品(具体型号待定),其目标是全面超越现有Blackwell及Blackwell Ultra(GB200)GPU。NVIDIA目前仍对核心技术细节守口如瓶,但驱动AI市场突破的关键,是一款支持压缩技术的升级版Transformer引擎——NVIDIA将其称为六大“技术奇迹”之一。

整体来看,这款旗舰级Rubin GPU采用NVIDIA NVFP4格式时,推理算力可达50 PFLOPS,是Blackwell GPU的5倍;训练性能提升虽略逊一筹,但同格式下训练算力仍达35 PFLOPS,较Blackwell提升3.5倍。

与前代产品一致,Rubin GPU采用双芯片封装设计,两颗芯片均为“掩膜版尺寸”,基于台积电3nm工艺制程。内存配置方面,其搭载的HBM4内存容量最高可达288GB,与当前Blackwell Ultra持平,但相较于Blackwell使用的HBM3e内存,Rubin搭配的HBM4内存带宽可达22 TB/s,较前代惊喜提升2.8倍。

晶体管数量上,Rubin GPU达到3360亿,是Blackwell的1.6倍。不过NVIDIA尚未披露该芯片的功耗数据,仅宣称其推理场景的每瓦性能是Blackwell的8倍,与5倍的绝对性能提升形成鲜明对比,能效优化显著。

NVLink交换机:带宽翻倍,全液冷散热

Rubin GPU仍将依靠NVLink技术与其他GPU互联,组建更大规模的横向扩展集群。第六代NVLink(NVLink 6)将带宽较第五代提升一倍,单GPU NVLink带宽可达3.6 TB/s,配套的新一代NVLink交换机芯片(第二款核心芯片)也同步推出。

为支撑翻倍的传输速率,NVLink 6采用了400Gbps SerDes技术。这款NVLink 6交换机可为每台接入的GPU提供全互联带宽,总带宽峰值达28.8 TB/s。高密度带宽传输会产生大量热量,因此该交换机芯片必须采用液冷散热方案。

Vera CPU:定制Arm架构,统筹全栈算力

Vera作为NVIDIA全新高端Arm架构CPU(第三款核心芯片),与Rubin GPU共同构成“Vera Rubin”命名组合的核心,负责统筹整个平台的运算调度。已确认的是,每颗Vera CPU搭载88核定制Arm v9.2-A架构核心,代号为Olympus,支持NVIDIA空间多线程技术,可实现176线程并发。目前其内部架构细节尚未过多披露,但NVIDIA明确表示,Vera的数据处理性能与压缩性能均达到Grace CPU的2倍。

内存方面,Vera CPU通过与美光联合研发的SOCAMM模块,可搭载最高1.5TB LPDDR5X内存,容量是Grace CPU的3倍。模块化内存设计解决了基于Grace的GB200平台的一大痛点——内存焊接固定、无法更换升级。整体来看,Vera CPU的内存带宽可达1.2 TB/s,略高于Grace CPU的2倍。

标准DGX节点将采用“1颗Vera CPU+2颗Rubin GPU”的配置,通过最新一代NVLink-C2C技术互联,带宽可达1.8 TB/s。

Vera CPU还补齐了NVIDIA机架级机密计算的最后一块拼图。此前Blackwell虽支持加密工作负载,但Grace CPU不具备该能力,导致机密计算范围仅限GPU层面;而Vera CPU全面兼容Rubin平台的机密计算技术,可实现整机架算力的加密防护。

ConnectX-9网卡与BlueField 4 DPU:网络与安全双加持

Rubin平台的传统以太网连接能力,由NVIDIA新一代ConnectX网卡及BlueField DPU技术提供。其中ConnectX-9网卡(第四款核心芯片)采用200G PAM4 SerDes技术,网络带宽可达1.6 Tb/s,为大规模多机架集群的横向扩展提供网络基础。

其配套的BlueField 4 DPU(第五款核心芯片)则融合新旧技术优势,内置64核Grace CPU与ConnectX-9网卡核心。NVIDIA宣称,BlueField 4的带宽、内存带宽及计算性能,分别达到上一代BlueField 3的2倍、3倍与6倍。

Spectrum-6以太网交换机与共封装光学技术:能效与可靠性跃升

最后一款核心芯片是NVIDIA最新的Spectrum-6以太网交换机,它将作为Spectrum-X交换机系列的核心,首次集成共封装光学技术,大幅降低功耗。该交换机将Rubin平台的所有硬件紧密衔接,构成完整算力网络。

脱离GPU设备单独来看,Spectrum-6系列包含两款关键以太网交换机产品:SN6800与SN6810。其中SN6800性能强悍,可提供512个800G以太网端口或2048个200G端口,总带宽达409.6 Tb/s;入门级SN6810则提供128个800G端口或512个200G端口,端口数量与总带宽(102.4 Tb/s)均为SN6800的四分之一。

共封装光学技术是此次的核心创新,NVIDIA希望借此破解高性能大型交换机的功耗与可靠性难题。通过共享激光源及硅光调制技术,Spectrum-X交换机可实现高速光网络传输,减少易损部件数量,同时规避传统光网络的高功耗问题。NVIDIA对该系列交换机寄予厚望,宣称其能效是同类传统交换机的5倍,可靠性则提升10倍。

整机系统:Vera Rubin NVL72与HGX Rubin NVL8

上述所有新芯片将集成于多款NVIDIA系统中。在Rubin全面商用前,NVIDIA确认将推出两类系统:面向深度拥抱NVIDIA生态的客户,提供升级版机架级NVL72系统;针对需兼容x86架构的客户,则推出新一代8路HGX载体设计——HGX Rubin NVL8。

与前代Grace Blackwell NVL72一致,单台Vera Rubin NVL72机架(前身为NVL144)包含72颗Vera Rubin GPU(144颗GPU芯片)与36颗Vera CPU,采用纯横向扩展方案,所有GPU通过NVLink交换机互联。整套硬件的晶体管总数高达220万亿,功耗也相当可观。

性能方面,Vera Rubin NVL72机架的各项核心指标提升幅度与单颗Rubin GPU一致:推理性能提升5倍、训练性能提升3.5倍,具体算力达3.6 EFLOPS(推理)与2.5 EFLOPS(训练)。内存配置上,LPDDR5X总容量达54TB(为GB200 NVL72的2.5倍),HBM4总容量20.7TB(1.5倍),HBM4总带宽1.6PB/s(2.8倍)。

除核心芯片的升级外,NVIDIA还重构了NVL72机架的设计,解决了Blackwell时代机架存在的诸多问题。最大的变化是采用全无线缆模块化托盘设计,大幅缩短机架部署时间——从Blackwell时代的100分钟/机架,缩短至Rubin时代仅需6分钟。同时,线缆数量的大幅减少也降低了故障点,进一步提升系统可靠性。

结合NVLink技术的优化及第二代RAS引擎,NVIDIA承诺Vera Rubin NVL72机架可实现健康检查与网络维护的零停机运行。

补充工具:NVIDIA推理上下文内存存储平台

超越单台NVL72机架的扩展计算,需依赖NVIDIA的网络技术支撑。除上述ConnectX-9网卡、BlueField DPU及Spectrum-X交换机外,NVIDIA还新增了一项关键工具——推理上下文内存存储平台,本质是一套键值(KV)缓存系统。

这款平台是NVIDIA网络硬件的又一应用场景,专门用于存储推理过程中所需的键值对数据。现代大模型(尤其是多步骤模型)生成的上下文数据量极为庞大,节点级存储难以承载,导致运维人员要么丢弃数据后续重新计算,要么额外部署存储方案。KV缓存系统恰好解决了这一痛点,可存储上下文数据并实现快速调取复用,避免重复计算。

本质上,NVIDIA将其定位为Pod级优化技术,旨在突破当前推理性能瓶颈,宣称可实现5倍推理性能提升与5倍能效优化,优化效果显著。

硬件层面,该平台基于NVIDIA网络产品搭建,并非DGX或Spectrum-X这类成品设备——NVIDIA提供核心部件,由合作伙伴完成后续组装,通过SSD存储与BlueField/ConnectX硬件搭建上下文内存存储节点,再与AI节点互联。

尽管并非NVIDIA直属成品,但公司对这项技术投入巨大:不仅研发配套网络硬件,还在CUDA生态中新增相关软件功能,适配Dynamo、DOCA等框架。NVIDIA自身也将在最高端的SuperPOD系统中采用该技术。

DGX SuperPOD:Rubin时代的终极算力集群

依托全新GPU架构与NVL72机架,NVIDIA以SuperPOD集群完成了Rubin硬件生态的闭环。与Blackwell时代一致,SuperPOD既是大规模GPU集群的蓝图与验证方案,也是NVIDIA面向客户销售的商用产品。

NVIDIA为客户提供两类Rubin SuperPOD配置:一类基于Vera Rubin NVL72机架,集成8台该机架、Spectrum-X以太网交换机、Quantum-X800 InfiniBand交换机、BlueField 4 DPU及上下文内存存储节点,代表Rubin平台的最高性能水平。

参数层面,一套基于Vera Rubin NVL72的DGX SuperPOD包含8台NVL72机架,共计576颗GPU、288颗CPU及约600TB内存,NVFP4精度下总算力达28.8 EFLOPS,NVLink带宽足以支撑机架内模型无需分区即可运行。

另一类则面向x86用户,基于DGX Rubin NVL8节点搭建SuperPOD,密度相对较低——64台NVL8节点组成一个SuperPOD,提供512颗GPU,整体采用类似的横向扩展设计,核心依托NVIDIA硬件实现跨机架扩展。

Rubin平台:2026下半年正式落地

目前NVIDIA仍处于Rubin硬件的调试阶段,但生态伙伴已在全力筹备配套服务,争夺首批Rubin服务落地权。NVIDIA透露,AWS、谷歌云、微软、OCI等主流公有云厂商,均将在2026年成为首批部署Vera Rubin实例的云服务商。

最终,NVIDIA计划于2026年下半年向合作伙伴交付量产硬件,助力其同步推出相关产品及服务,DGX系列整机也将在同一时间段上市。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1119840.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

人工智能之核心基础 机器学习 第八章 无监督学习概述

人工智能之核心基础 机器学习 第八章 无监督学习概述 文章目录人工智能之核心基础 机器学习8.1 什么是无监督学习?📌 定义:从“没有答案”的数据中找规律8.2 无监督学习的三大核心任务1️⃣ 聚类(Clustering)——“物…

有哪些好的服务器托管服务商推荐?—— 以尚航科技为核心的专业测评​

在数字化转型加速的背景下,服务器托管服务的选择直接关系到企业业务的稳定性、数据安全与长期运营成本。本文将以国内知名服务商尚航科技为主要案例,结合行业标准与公开数据,从基础设施、网络能力、安全合规、运维服务等维度进行客观测评&…

黑马反弹抄底之短炒选股指标公式

{}N:7; M:3; VAR1:(CLOSE-LLV(LOW,60))/(HHV(HIGH,60)-LLV(LOW,60))*80; B:SMA(VAR1,N,1); VAR2:SMA(B,M,1); 短炒:crOSS(B,VAR2) AND B<65 AND CLOSE>OPEN AND (C/REF(C,1))>0.5,LINETHICK1,COLORGREEN;

全新网址二维码与Ai文字转语音技术,助力电子画册轻松生成

全新网址二维码和Ai文字转语音技术的结合&#xff0c;让电子画册的生成变得更简便。这些技术使用户能轻松创建独特的二维码&#xff0c;集成网址、文档和多媒体内容。使用这些二维码&#xff0c;观众能够直接访问丰富的信息&#xff0c;提升互动体验。另外&#xff0c;Ai文字转…

基于SpringBoot的宠物店管理系统(源码+lw+部署文档+讲解等)

课题介绍 本课题聚焦宠物店日常运营规范化管理与服务效率提升的核心需求&#xff0c;设计并实现基于SpringBoot框架的宠物店管理系统。当前宠物店运营领域存在宠物信息记录零散、商品库存管控混乱、服务预约流程繁琐、客户档案管理滞后等问题&#xff0c;制约了宠物店的运营效率…

基于SpringBoot的传统手工艺文化展示平台的设计与实现(源码+lw+部署文档+讲解等)

课题介绍本课题聚焦传统手工艺文化传承与传播的核心需求&#xff0c;开展基于SpringBoot的传统手工艺文化展示平台的设计与实现工作。当前传统手工艺文化传播领域普遍存在文化资源分散碎片化、展示渠道单一有限、手工艺人作品推广受阻、年轻群体了解途径匮乏等问题&#xff0c;…

中小企业服务器托管哪家好?尚航科技综合实力解析

数字化浪潮下&#xff0c;选择一家靠谱的服务器托管商&#xff0c;对中小企业来说至关重要。对于中小企业而言&#xff0c;服务器托管不仅是将服务器放在机房那么简单&#xff0c;它关系到业务连续性、数据安全性和长期成本控制。一个好的IDC服务商能够为企业提供稳定可靠的数字…

主力上班之选股指标公式

{}ZTJ:ZTPRICE(REF(CLOSE,1),0.1); DTJ:DTPRICE(REF(CLOSE,1),0.1); 阳线:C>O; 上影线:(H-MAX(C,O))/REF(C,1); k线实体:Abs(C-O)/REF(C,1); 涨停:C/REF(C,1)>1.098&&HC; 昨日涨停:REF(C,1)REF(ZTJ,1); 两连板:EVERY(涨停,2); 五连板:EVERY(涨停,5); 昨日非涨停:…

如何快速生成说明书二维码和音频二维码?

在现代使用中&#xff0c;二维码成为共享信息的重要工具。通过二维码&#xff0c;用户可以快速访问电子说明书和音频内容&#xff0c;提高了获取信息的效率。生成二维码的过程简单&#xff0c;只需要几步。不论是将说明书转化为二维码还是处理音频文件&#xff0c;首先需选定一…

必看!2026年企业宣传二维码推荐,解锁协同操作与录音转二维码的全新体验

在2026年&#xff0c;企业宣传二维码正迎来新的机遇。协同操作二维码能够提高信息共享的效率&#xff0c;团队成员通过扫描二维码可以快速获取项目更新。这种便捷的方式&#xff0c;帮助企业保持沟通畅通&#xff0c;提升整体运营效率。同时&#xff0c;录音转二维码的应用为企…

大型企业服务器托管选型指南:尚航科技的综合优势与适用场景分析

大型企业的服务器托管不仅是技术决策&#xff0c;更是关乎业务连续性、数据主权和长期竞争力的战略选择。对于大型企业而言&#xff0c;服务器托管决策远比中小企业复杂且关键。它关系到核心数据安全、业务连续性、合规性要求以及长期数字化转型路径。大型企业需要的不再是简单…

基于SpringBoot的宠物服务系统(源码+lw+部署文档+讲解等)

课题介绍本课题聚焦宠物服务全流程规范化对接与服务质量提升的核心需求&#xff0c;设计并实现基于SpringBoot框架的宠物服务系统。当前宠物服务领域存在服务资源分散、用户与服务商对接低效、服务流程不透明、服务记录难追溯等问题&#xff0c;制约了宠物服务行业的发展效率&a…

学长亲荐8个一键生成论文工具,自考毕业论文轻松搞定!

学长亲荐8个一键生成论文工具&#xff0c;自考毕业论文轻松搞定&#xff01; AI 工具助力论文写作&#xff0c;高效省时更省心 随着人工智能技术的不断进步&#xff0c;越来越多的自考学生开始借助 AI 工具来提升论文写作效率。在当前 AIGC&#xff08;人工智能生成内容&#x…

第二届工程管理与安全工程国际学术会议 (EMSE 2026)

第二届工程管理与安全工程国际学术会议 (EMSE 2026) 2026 2nd International Conference on Engineering Management and Safety Engineering 2026年3月20-22日 中国成都 会议详情&#xff08;请点击&#xff09; 会议秘书温老师&#xff08;17620001794&#xff09; 【大…

基于SpringBoot的宠物领养管理系统(源码+lw+部署文档+讲解等)

课题介绍 本课题聚焦宠物领养全流程规范化管理与供需精准匹配的核心需求&#xff0c;设计并实现基于SpringBoot框架的宠物领养管理系统。当前宠物领养领域存在领养信息分散杂乱、领养资质审核不规范、领养流程不透明、领养后跟踪监管缺失等问题&#xff0c;制约了宠物领养事业的…

传统机器学习(如xgboost、随机森林等)和深度学习(如LSTM等)在时间序列预测各有什么优缺点?

传统机器学习方法&#xff08;如XGBoost、随机森林&#xff09;在时间序列预测中通常需要将时间序列数据转换为监督学习格式。这类方法的优势在于训练速度快、可解释性强&#xff0c;并且在中小规模数据集上往往表现稳健。此外&#xff0c;它们对超参数的敏感度相对较低&#x…

通达信主力上班指标公式

{}volUME:VOL,VOLSTICK; MAVOL1:MA(VOLUME,5); MAVOL2:MA(VOLUME,60); CC:(3*COLH)/6; MM:EMA(EMA(CC,20),2); 主力操盘基准量:HHV(MM,5)MAVOL2,COLORYELLOW,LINETHICK1; ZTJ:ZTPRICE(REF(CLOSE,1),0.1); DTJ:DTPRICE(REF(CLOSE,1),0.1); {k线} 阳线:C>O; 上影线:(H-MAX(C,O…

制造业MES、SAP、WMS之间实现工单发料都会经历什么

在制造业中&#xff0c;MES&#xff08;制造执行系统&#xff09;、SAP&#xff08;企业资源计划系统&#xff09;和WMS&#xff08;仓储管理系统&#xff09;之间的工单发料流程是一个关键的集成环节&#xff0c;用于确保生产所需的物料能够准确、及时地从仓库发放到生产线。这…

为什么我的电脑版本微信,找不到下面链接微信群删除并退出的界面——只有“删除聊天”的按钮,是相同的功能吗?这个是微信的bug吗?

为什么我的电脑版本微信&#xff0c;找不到下面链接微信群删除并退出的界面——只有“删除聊天”的按钮&#xff0c;是相同的功能吗&#xff1f;这个是微信的bug吗&#xff1f; 在电脑版微信中怎么删除并退出群聊-百度经验

基于SpringBoot的宠物领养系统(源码+lw+部署文档+讲解等)

课题介绍本课题聚焦宠物领养供需精准对接与全流程规范化运营的核心需求&#xff0c;设计并实现基于SpringBoot框架的宠物领养系统。当前宠物领养领域普遍存在待领养宠物信息零散、领养人与宠物匹配低效、领养资质审核流程繁琐、领养后跟踪服务缺失等问题&#xff0c;不仅阻碍了…