马斯克全球最大GPU集群建成,Grok要起飞了!

来源:量子位

刚刚,全球首个GW级超算集群Colossus 2,正式投入运行

马斯克兴奋喊话:

这是全球首个达到1GW的超算集群,4月还将进一步升级至1.5GW。

网友直呼疯狂:「1.5GW,光是插座估计都得给墙壁装满了。」

有了这剂算力强心针,Grok的忠实拥趸已经提前开香槟,开始畅想Grok5的统治时代。

但在全网狂欢的背后,更多的人是苦不堪言——

2026年夏天,美国13个州的6700万居民,可能要因数据中心的存在被停电,没空调吹了。

全球首个GW级训练集群

老马的执行力太恐怖了。

不靠亚马逊,不靠微软,也没有「星际之门」计划,一己之力于孟菲斯平地建起一座1GW的超算集群。

前一代超算集群Colossus 1从无到有仅用了122天。

它配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72。

而在此基础上翻了好几倍,功率达到1GW的Colossus 2,只花了仅仅不到一年。

1GW是什么概念?

一般来说,1GW可以为75万户家庭供电,相当于高峰时期的旧金山。

一座核电站的功率差不多也就是1GW。

如果按马斯克所说,今年4月份,Colossus 2将升级至1.5GW,最终总装机容量达到2GW,这个数字将与美国大多数主要城市的用电量相当。

按照规划,彻底完工后的Colossus 2将内置55.5万张GPU,远超Meta的15万、微软10万,以及谷歌的分布式基础设施。

而这庞大的资源,全部为Grok独自享用。

此前,曾有爆料称Grok 5的参数将达到惊人的6万亿左右,是Grok 4的两倍以上。

原因便是基于Colossus 2:

当时有观点认为Grok 5将在拥有数十万张英伟达GPU的Colossus 2上训练,耗电量约为1GW。

如今,Colossus 2已正式上线,1GW的条件也正正好好满足

而随着前段时间xAI E轮融资200亿美元的进账,Grok 5的Scaling筹码还在进一步增加。这意味着更大的模型参数,更快的训练速度、迭代速度,部署速度。

当OpenAI还在为2027年的算力基础设施发愁时,xAI已经把一座「城市级」AI 工厂开机运行,将Grok 5提前扶上了市场心目中的下一个SOTA。

正如网友所说,AI时代,速度就是最强的护城河。

居民受不了啦!

不过,并非所有人都因这种「速度」受益。

据《华尔街日报》消息,美国非营利电网运营商PJM,未来可能在极端高温或严寒天气期间,轮流对区域内的居民断电。

这意味着,美国13个州的6700万人,在今年不得不迎来一个相当难熬的夏天。

要说清楚这个问题,得先明白PJM是干嘛的。

PJM,简单来说就是美国能源系统的交通指挥中心,它根据实时用电需求,协调发电厂何时增发、何时降载,以维持供需平衡。

然而,大模型大力出奇迹的竞赛正在破坏这种平衡。

在数据中心建设热潮推动下,PJM预计未来10年电力需求将以年均4.8%的速度增长。

对一个多年需求变化不大的系统来说,这样的增速相当罕见。

一边需求激增,另一边,供给的增速却相当缓慢。新建电厂的速度甚至都跟不上老电厂的退役速度,电网容量面临饱和。

供需一旦出现偏差,电网频率就会波动,进而可能损坏发电厂等关键基础设施。

为避免这些风险,PJM只能两害相权取其轻,通过在用电高峰期轮流停电来卸压。

PJM也不是没想过其他办法。

去年9月,PJM发布了一系列提议,希望数据中心在高峰时段主动降低用电量,或改从其他渠道获取电力支持。

然而,亚马逊、谷歌、微软等几乎都表示了反对,认为这是对数据中心的歧视

值得一提的是,PJM主要负责美国东海岸地区,而xAI的Colossus位于中南部,并不在PJM电网覆盖范围内。

同时,为减少对当地电网的冲击,xAI还部署了168个特斯拉Megapack电池储能系统,在用电高峰期提供电力缓冲,尽量避免周边居民遭遇停电。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1186306.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智能填空系统实战:BERT模型部署指南

智能填空系统实战:BERT模型部署指南 1. 引言 1.1 BERT 智能语义填空服务 在自然语言处理领域,语义理解是构建智能交互系统的核心能力之一。随着预训练语言模型的发展,BERT(Bidirectional Encoder Representations from Transfo…

机器人学习!(二)ROS2-环境配置(6)2026/01/19

古月居ROS2 - 21讲1、ROS命令行操作帮助命令:ros2 --help 运行节点:ros2 run 功能包 节点名查看节点:ros2 node list/info 查看话题:ros2 topic list, ros2 topic echo 话题名发布话题:ros2 topic pub…

小白也能玩转文本排序!Qwen3-Reranker-0.6B保姆级教程

小白也能玩转文本排序!Qwen3-Reranker-0.6B保姆级教程 在信息爆炸的时代,如何从海量文本中快速找到最相关的内容?答案就是“语义重排序”技术。而今天我们要介绍的主角——Qwen3-Reranker-0.6B,正是阿里通义千问团队推出的轻量级…

SGLang-v0.5.6部署实战:混合精度推理加速技巧

SGLang-v0.5.6部署实战:混合精度推理加速技巧 1. 引言 随着大语言模型(LLM)在实际业务场景中的广泛应用,如何高效部署并优化推理性能成为工程落地的关键挑战。SGLang-v0.5.6作为新一代结构化生成语言框架,在提升吞吐…

GTE中文语义相似度计算实战:新闻标题去重系统构建

GTE中文语义相似度计算实战:新闻标题去重系统构建 1. 引言 1.1 业务场景描述 在新闻聚合、内容推荐和信息检索系统中,海量文本数据的重复问题严重影响用户体验与系统效率。尤其在新闻平台中,同一事件常被多个媒体以略微不同的表述方式发布…

快速理解LED显示屏与NovaStar控制系统的安装流程

从零开始:LED显示屏与NovaStar控制系统的实战安装指南你有没有遇到过这样的情况?屏已经挂上墙了,通电后却发现部分区域不亮、画面撕裂,甚至整个系统频繁重启。调试两三天都找不到根源,客户脸色越来越难看……其实&…

SenseVoice Small保姆级教程:语音识别模型训练

SenseVoice Small保姆级教程:语音识别模型训练 1. 引言 1.1 学习目标 本文旨在为开发者和研究人员提供一份完整的 SenseVoice Small 模型训练与二次开发指南。通过本教程,您将掌握: 如何部署并运行基于 SenseVoice Small 的 WebUI 界面如…

AI读脸术 vs 传统方案:人脸属性分析性能对比实战评测

AI读脸术 vs 传统方案:人脸属性分析性能对比实战评测 1. 引言 1.1 选型背景 在智能安防、用户画像、无人零售和个性化推荐等场景中,人脸属性分析(Facial Attribute Analysis)已成为一项关键的前置技术能力。其中,性…

图片旋转判断模型Docker部署全攻略:一键启动服务

图片旋转判断模型Docker部署全攻略:一键启动服务 1. 技术背景与应用场景 在图像处理和计算机视觉的实际项目中,图片方向的准确性直接影响后续任务的效果。例如,在文档扫描、OCR识别、图像分类等场景中,若输入图片存在90、180或2…

DeepSeek-R1-Distill-Qwen-1.5B参数详解:top_p与temperature协同调优

DeepSeek-R1-Distill-Qwen-1.5B参数详解:top_p与temperature协同调优 1. 引言 1.1 模型背景与技术演进 随着大语言模型在推理能力、代码生成和数学解题等复杂任务中的表现不断提升,如何通过高效训练策略提升小规模模型的性能成为研究热点。DeepSeek-R…

Qwen3-4B推理吞吐低?vLLM并行优化实战解决方案

Qwen3-4B推理吞吐低?vLLM并行优化实战解决方案 1. 背景与问题提出 在大模型实际部署过程中,尽管Qwen3-4B-Instruct-2507具备强大的语言理解与生成能力,但在高并发或长上下文场景下,其原生推理服务常面临吞吐量低、响应延迟高的问…

Hunyuan-MT-7B-WEBUI前端优化:WebSocket实现实时交互体验

Hunyuan-MT-7B-WEBUI前端优化:WebSocket实现实时交互体验 1. 背景与问题分析 随着大模型在多语言翻译场景中的广泛应用,用户对交互体验的要求也逐步提升。Hunyuan-MT-7B作为腾讯开源的高性能翻译模型,支持包括日语、法语、西班牙语、葡萄牙…

从论文到落地:SAM3提示词引导分割模型镜像一键部署教程

从论文到落地:SAM3提示词引导分割模型镜像一键部署教程 1. 引言 1.1 开放词汇分割的技术演进 近年来,视觉感知模型正从“封闭词汇”向“开放词汇”范式迁移。传统图像分割方法依赖预定义类别标签(如 COCO 的 80 类)&#xff0c…

【毕业设计】SpringBoot+Vue+MySQL 在线课程管理系统平台源码+数据库+论文+部署文档

💡实话实说: CSDN上做毕设辅导的都是专业技术服务,大家都要生活,这个很正常。我和其他人不同的是,我有自己的项目库存,不需要找别人拿货再加价,所以能给到超低价格。 摘要 随着信息技术的飞速发…

DCT-Net模型版权保护:数字水印技术应用

DCT-Net模型版权保护:数字水印技术应用 1. 引言:AI生成内容的版权挑战与应对 随着深度学习技术的发展,基于AI的人像卡通化服务正迅速普及。DCT-Net作为ModelScope平台上表现优异的图像风格迁移模型,能够将真实人像高效转换为高质…

君乐宝冲刺港股:9个月营收151亿净利9亿,刚派息10亿 红杉与春华是股东

雷递网 雷建平 1月19日君乐宝乳业集团股份有限公司(简称:“君乐宝”)日前递交招股书,准备在港交所上市。君乐宝此次赴港上市,募集资金将主要用于工厂建设和产能扩张升级、品牌营销和渠道建设、进一步加强研发创新、数智…

智能扫描仪部署教程:中小企业文档数字化入门指南

智能扫描仪部署教程:中小企业文档数字化入门指南 1. 引言 1.1 学习目标 本文旨在为中小企业IT人员或办公自动化初学者提供一套完整、可落地的文档数字化解决方案。通过本教程,您将掌握如何快速部署一个基于OpenCV的AI智能文档扫描系统,实现…

ComfyUI云端部署:基于容器化的一键启动解决方案

ComfyUI云端部署:基于容器化的一键启动解决方案 1. 引言 随着AI生成内容(AIGC)技术的快速发展,图像生成工具在设计、艺术创作和内容生产等领域扮演着越来越重要的角色。ComfyUI 作为一款基于节点式工作流的 Stable Diffusion 可…

BGE-Reranker-v2-m3优化实战:处理长尾查询的挑战

BGE-Reranker-v2-m3优化实战:处理长尾查询的挑战 1. 引言:RAG系统中的“搜不准”难题 在当前检索增强生成(RAG)系统的实际应用中,一个普遍存在的痛点是向量检索返回结果与用户真实意图不匹配,尤其是在面对…

YOLOv9/YOLOR多模型对比:基于YOLOR架构的性能评测

YOLOv9/YOLOR多模型对比:基于YOLOR架构的性能评测 1. 选型背景与评测目标 目标检测作为计算机视觉领域的核心任务之一,近年来随着YOLO系列模型的持续演进,其在工业界和学术界的影响力不断扩大。YOLOv9作为该系列的最新成员,提出…