GB300加速推进,RTX 50显卡芯片量产延后,NVIDIA面临新的挑战与机遇

野村分析师Anne Lee在2月12日的报告中表示,2025年全球服务器营收将同比增长46%,2026年增长22%。其中,AI服务器营收预计在2025年和2026年分别增长75%和31%。这些预测与近期美国主要云服务提供商(CSP)上调的资本支出指引基本一致。

GB300加速推进,BOM设计仍存挑战

GB200的推出本应是AI服务器市场的一次重要升级,但由于性能与预期的差距,导致市场的接受度未能达到预期。很多客户在实际使用中发现GB200在某些应用场景下的表现不足以满足更高计算需求。此外,由于全球市场竞争加剧,GB200面临来自其他硬件厂商的激烈挑战,进一步影响了其市场表现。同时,市场已经很大程度上消化了2025年上半年GB200机架出货缓慢的风险。
在这里插入图片描述
鉴于GB200未能实现预期目标,AI服务器硬件供应链已经开始转向更高端、更具性能优势的GB300产品。GB300提供了更强的计算能力和更高效的能耗比,尤其适合用于大规模AI模型的训练和推理。英伟达的芯片和模块级供应链将从2025年第二季度开始加速向B300及相关模块迁移。估计到2025年第二季度,英伟达超过50%的芯片和模块将基于B300。
在这里插入图片描述
B300 HGX预计将在2025年年中推出,而GB300系统(标准型)可能在2025年第三季度小批量上市。然而,B300和GB300仍面临挑战。野村证券认为,B300 UBB和GB300计算板的物料清单(BOM)设计尚未确定,因为英伟达正试图引入大量新的组件供应商,以降低成本并实现供应多元化。

CoWoS供需缺口依然巨大

目前,全球主要的CoWoS供应商包括台积电等半导体巨头,然而在需求暴涨的情况下,CoWoS的生产能力无法迅速跟上市场需求,导致部分高端GPU和AI芯片的交货周期延长。这一问题对于NVIDIA尤其重要,因为其高端AI芯片(如用于AI训练的A100、H100等)都大量依赖CoWoS技术。由于供需缺口,NVIDIA的部分产品生产进度受到影响,这也导致了GPU交付周期延长,特别是在AI服务器市场和云计算客户的需求面前。随着台积电等主要半导体制造商扩建CoWoS生产线,预计到2026年,CoWoS的生产能力将得到显著提升,从而逐步解决当前的供需缺口问题。
在这里插入图片描述
报告指出,英伟达AI服务器供应链的不同层级(从芯片到模块再到最终机架)之间存在差异。在上游CoWoS芯片供应方面,野村证券调整了Hopper的供应量,并预计2025年所有CoWoS-L都将用于生产B200/300。在需求方面,野村证券估计2024年和2025年分别只有440万和550万颗英伟达GPU被制成模块和系统。理想的GB机架数量与最终GB机架出货量之间也存在较大差距。2024-2026年英伟达GPU的供需缺口约为20-23%。

RTX 50显卡芯片供应紧张

与GB200、GB300类似,RTX 50系显卡的市场供给面临着交货周期延长的问题。虽然NVIDIA已经开始进行RTX 50系显卡的量产,但由于CoWoS技术和GPU制造的高要求,生产进度依旧滞后。根据分析师郭明錤最新透露,英伟达RTX 50系列显卡面临芯片供应紧张问题,这也导致了已开售的RTX 5090和RTX 5080出现一卡难求的景象。不仅如此,中端的RTX 5070和RTX 5060的量产时间也受到影响,原本计划2月量产的RTX 5070和3月量产的RTX 5060,如今可能分别延后至3月和4月。郭明錤还表示,即使量产时间未推迟,这两款显卡也会因数量稀少而开卖即缺货。
在这里插入图片描述
根据NVIDIA的生产计划,RTX 50系显卡的量产将在2025年第一季度开始,预计全球出货量将在2025年中期逐渐攀升,届时供货压力有望得到缓解。这一供应瓶颈也将影响到相关的AI服务器硬件和高性能计算的交付时间。
在这里插入图片描述
RTX 50系显卡不仅面向游戏市场,还广泛应用于AI计算、云服务以及高端数据中心,市场需求非常旺盛。尤其是在生成式AI爆发的背景下,许多企业和研究机构都急需这些显卡来支持日益复杂的计算任务。
在这里插入图片描述

ASIC AI崛起

相较于通用GPU,ASIC(专用集成电路)的设计更适合某些特定的AI计算任务,尤其是在深度学习和大规模AI训练领域。ASIC硬件具有较高的计算效率和较低的功耗,能够在特定任务上实现更优的性能。同时,在DeepSeek驱动下,CSP业者预计将更积极发展成本较低的自有ASIC方案,并把重心从AI训练转往AI推理,预估将逐步推升AI推理服务器占比至接近50%。未来GPU仍将支持各种AI算法发展,但持续发展大型算法的CSP业者和更重视成本考量的边缘企业客户将各有需求。

总结

AI硬件市场正处于快速变化的时期,GB200未达预期、GB300的加速推进、CoWoS技术瓶颈、RTX 50系显卡量产延后以及ASIC AI的崛起,都在共同塑造着未来的竞争格局。尽管NVIDIA在GPU市场仍占据主导地位,但随着DeepSeek等新兴技术的崛起以及ASIC硬件的竞争,NVIDIA将面临更多的挑战。为了继续巩固其市场地位,NVIDIA必须加速产品创新,尤其是在专用AI硬件的研发和优化上,以应对新兴技术的冲击并维持其在AI计算领域的领导地位。

赋创(EMPOWER X),作为高性能计算领域的积极探索者,始终致力于技术创新的前沿,密切关注并吸收最新的科技进展。我们专注于提供高效且可靠的计算解决方案,旨在满足多样化的需求。

想了解更多有关AI训练推理服务器相关的信息,不管是技术问题还是应用规划,欢迎随时联系我们,期待能为您提供有价值的见解与支持。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/69875.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[NOIP2011 普及组] 统计单词数 题解

(一)读懂题目 关键词:查找单词 方法:枚举(二)分析算法时间复杂度和空间复杂度 算法:枚举 时间复杂度:O(n) 空间复杂度:O(n)(三)代码实现 代码如…

深入解析 ipoib_intf_init 函数中的 netdev_ops 设置逻辑

在 Linux 内核的网络设备驱动开发中,net_device_ops 是一个至关重要的结构体,它定义了网络设备的各种操作函数指针,决定了网络设备的行为和功能。本文将深入解析 ipoib_intf_init 函数中关于 dev->netdev_ops 和 priv->rn_ops 的设置逻辑,帮助读者理解其设计动机和实…

leetcode_1760 袋子里最少数目的球

1. 题意 给定一个数组,和一个最多次操作次数。每次操作可以将数组中的一个数 x x x分成两个数 t x − t t\quad x-t tx−t。问 m a x O p e r a t i o n C n t maxOperationCnt maxOperationCnt次操作后,数组中最大的数最小的值是多少。 2. 题解 这个…

TDengine 性能测试工具 taosBenchmark

简介工具获取运行 无参数模式命令行模式配置文件模式 命令行参数配置文件参数 通用配置参数写入配置参数 数据库相关超级表相关标签列与数据列写入行为相关 查询配置参数 执行指定查询语句查询超级表 订阅配置参数数据类型对照表 配置文件示例 写入 JSON 示例查询 JSON 示例订阅…

J6 X8B/X3C切换HDR各帧图像

1、OV手册上的切换命令 寄存器为Ox5074 各帧切换: 2、地平线control tool实现切换命令 默认HDR模式出图: HCG出图: LCG出图 SPD出图 VS出图

游戏引擎学习第101天

回顾当前情况 昨天的进度基本上完成了所有内容,但我们还没有进行调试。虽然我们在运行时做的事情大致上是对的,但还是存在一些可能或者确定的bug。正如昨天最后提到的,既然现在时间晚了,就不太适合开始调试,所以今天我…

【故障处理】- RMAN-06593: platform name ‘Linux x86 64-bitElapsed: 00:00:00.00‘

【故障处理】- RMAN-06593: platform name Linux x86 64-bitElapsed: 00:00:00.00 一、概述二、报错原因三、解决方法 一、概述 使用xtts迁移,在目标端进行恢复时,遇到RMAN-06593: platform name Linux x86 64-bitElapsed: 00:00:00.00’报错。 二、报错…

多模态本地部署和ollama部署Llama-Vision实现视觉问答

文章目录 一、模型介绍二、预期用途1. 视觉问答(VQA)与视觉推理2. 文档视觉问答(DocVQA)3. 图像字幕4. 图像-文本检索5. 视觉接地 三、本地部署1. 下载模型2. 模型大小3. 运行代码 四、ollama部署1. 安装ollama2. 安装 Llama 3.2 Vision 模型3. 运行 Llama 3.2-Vision 五、效果…

哪吒闹海!SCI算法+分解组合+四模型原创对比首发!SGMD-FATA-Transformer-LSTM多变量时序预测

哪吒闹海!SCI算法分解组合四模型原创对比首发!SGMD-FATA-Transformer-LSTM多变量时序预测 目录 哪吒闹海!SCI算法分解组合四模型原创对比首发!SGMD-FATA-Transformer-LSTM多变量时序预测效果一览基本介绍程序设计参考资料 效果一览…

MySQL调用存储过程和存储函数

【图书推荐】《MySQL 9从入门到性能优化(视频教学版)》-CSDN博客 《MySQL 9从入门到性能优化(视频教学版)(数据库技术丛书)》(王英英)【摘要 书评 试读】- 京东图书 (jd.com) MySQL9数据库技术_夏天又到了…

TCP粘包/拆包

一、什么是 TCP 粘包/拆包?发生的原因?怎么解决? TCP粘包:指在进行TCP数据传输时,多个小的数据包被合并成一个大的数据包进行传输的现象。 TCP拆包:指一个大的数据包被拆分成多个小的数据包进行传输的现象…

网络防御高级-第8章及之前综合作业

标准版 接口ip配置 r2 [r2]interface GigabitEthernet 0/0/0 [r2-GigabitEthernet0/0/0]ip address 13.0.0.3 24 [r2-GigabitEthernet0/0/0]interface GigabitEthernet 0/0/1 [r2-GigabitEthernet0/0/1]ip address 100.1.1.254 24 [r2-GigabitEthernet0/0/1]interface Gigab…

常见的排序算法:插入排序、选择排序、冒泡排序、快速排序

1、插入排序 步骤: 1.从第一个元素开始,该元素可以认为已经被排序 2.取下一个元素tem,从已排序的元素序列从后往前扫描 3.如果该元素大于tem,则将该元素移到下一位 4.重复步骤3,直到找到已排序元素中小于等于tem的元素…

【数据结构】寻找规律:算对角线长度||杨辉三角||魔方问题(C语言实现)

目录标题 三个算法1. 求矩阵对角线元素之和(C语言)2. 杨辉三角3. 幻方问题 总结:都是通过寻找规律来找出构造逻辑然后用循环来实现 三个算法 1. 求矩阵对角线元素之和(C语言) 1.初始化行循环变量i和列循环遍历j&…

Vue的学习(5)

1.路由进阶 1.路由模块封装 路由的封装抽离 问题:所有的路由配置都堆在main.js中合适么? 目标:将路由模块抽离出来。 好处:拆分模块,利于维护 小结: 路由模块的封装抽离的好处是什么? 拆分模…

设备智能化无线通信,ESP32-C2物联网方案,小尺寸芯片实现大功能

在科技飞速发展的当下,我们的生活正被各类智能设备悄然改变,它们如同一位位无声的助手,渗透到我们生活的每一个角落,让生活变得更加便捷和丰富多彩。 智能插座、智能照明和简单家电设备在家居领域的应用,为我们的生活…

python利用jenkins模块操作jenkins

安装python-jenkins 可以使用pip命令来安装python-jenkins模块: pip install python-jenkins操作jenkins 接下来就是连接和操作jenkins,写了个class,直接上代码 class Jenkins():def __init__(self, url, username, password):# jenkins服…

Excel大数据量导入导出

github源码 地址(更详细) : https://github.com/alibaba/easyexcel 文档:读Excel(文档已经迁移) B 站视频 : https://www.bilibili.com/video/BV1Ff4y1U7Qc 一、JAVA解析EXCEL工具EasyExcel Java解析、生成Excel比较…

Java基础知识总结(四十八)--TCP传输、TCP客户端、TCP服务端

**TCP传输:**两个端点的建立连接后会有一个传输数据的通道,这通道称为流,而且是建立在网络基础上的流,称之为socket流。该流中既有读取,也有写入。 **tcp的两个端点:**一个是客户端,一个是服务…

HCIA项目实践--RIP相关原理知识面试问题总结回答

9.4 RIP 9.4.1 补充概念 什么是邻居? 邻居指的是在网络拓扑结构中与某一节点(如路由器)直接相连的其他节点。它们之间可以直接进行通信和数据交互,能互相交换路由信息等,以实现网络中的数据转发和路径选择等功能。&am…