完整教程:Alluxio正式登陆Oracle云市场,为AI工作负载提供TB级吞吐量与亚毫秒级延迟

news/2026/1/23 22:09:56/文章来源:https://www.cnblogs.com/ljbguanli/p/19524152

完整教程:Alluxio正式登陆Oracle云市场,为AI工作负载提供TB级吞吐量与亚毫秒级延迟

企业级数据访问加速平台领导者 Alluxio 宣布上线 Oracle 云市场(Oracle Cloud Marketplace),正式成为 OCI(Oracle Cloud Infrastructure )全球合作伙伴之一。这一里程碑式的合作标志着双方将为共同客户给予更便捷的AI基础设施解决方案,通过创新的数据加速技能彻底改变人工智能与机器学习工作负载的数据访问范式。

请添加图片描述

Oracle与Alluxio签署AI能力共建合作协议
甲骨文公司副总裁中国区董事总经理吴承扬与Alluxio中国区总经理王晓丹代表双方签署

在现代内容驱动型环境中,高性能计算集群(尤其是在利用 GPU 时)面临的挑战主要来自数据访问延迟和 I/O 吞吐量不足等问题。这种效率瓶颈不仅会导致宝贵的计算资源闲置,还并显著增加企业运营成本。Alluxio 与 Oracle 此次牵手,通过构建基于分层的数据架构解决方案突破了这些瓶颈,从而提高了 GPU 利用率,也提升了云基础设施投资回报率。

在最新的基准测试中,Alluxio数据访问加速层与 OCI 高性能裸金属基础设施的强强联合被展露无遗:在 350 个加速器上实现了低于 1 毫秒的平均延迟、近线性可扩展性,以及超过 90% 的 GPU 利用率。

基准测试链接:
https://blogs.oracle.com/cloud-infrastructure/alluxio-on-oci-submillisecond-latency-for-ai

Alluxio 销售总监程亮表示:“大家非常高兴能够通过 Oracle 云市场将 Alluxio 的高性能材料加速能力带给全球的 OCI 用户。AI 时代的竞争本质上是内容效率与计算效率的竞争。Alluxio 与 OCI 的深度结合,将援助客户彻底释放其数据潜力,让 GPU 每一秒都创造足量价值。”

“我们听到客户最迫切的需求是:如何让昂贵的 GPU 资源全力运转,而不是等待内容。”甲骨文公司中国区云工程部门总经理窦杰表示,“Alluxio 在 OCI 上的落地,正是对这一痛点的直接回应。通过将数据智能地缓存在计算侧,我们已帮助客户将训练效率提升了一倍以上。这项合作印证了我们的承诺:提供不只是基础设施,更是真正解放生产力的解决方案。”

Alluxio 高性能缓存架构

Alluxio 作为贴近计算部署的数据加速层,位于计算层与OCI 对象存储层之间,通过智能地管理跨内存与 NVMe 的素材,同时通过 POSIX 和 S3 API 向应用程序给出统一的命名空间。

请添加图片描述

Alluxio 在 OCI 支持两种部署模式

  1. 独立模式(Dedicated mode):Alluxio 运行在 DenseIO 节点集群上,每个节点都配备 NVMe硬盘和高网络带宽。该集群为外部客户端提供所有必需的文件和对象服务,从而最大限度地提高大型多 GPU 集群的吞吐量和一致性。
  2. 混合模式(Co-located mode):Alluxio 运行在 GPU 服务器上,使用闲置的 NVMe硬盘,无需新增硬件。这种模式经济高效,非常适合小型集群或单租户工作负载。由于 Alluxio 服务和运行在同一节点上的用户应用程序共享CPU 和缓存资源,其性能可能略低于独立模式。

请添加图片描述

独立模式(左)与混合模式(右)

这对你的团队意味着什么

假设一个机器学习团队正在 OCI 上训练一个大语言模型。由于昂贵的计算实例需要等待来自对象存储的素材,团队发现 GPU 利用率始终徘徊在 50% 左右。

无需更改任何一行应用程序代码或添加新硬件,仅仅通过在现有 GPU 服务器上以混合模式部署 Alluxio 软件, GPU 利用率可以立即提升到 95% 以上。这一简单的改动就能将模型训练时间缩短近一半,使机器学习团队能够更快地迭代,并提前将模型投入生产。

Alluxio 的架构为 OCI 用户带来以下核心价值:

  1. 通过即插即用式集成:无需将数据从一个存储迁移到另一个存储,只需挂载你的 OCI对象存储桶;无需导入或重构;无需任何代码更改,应用程序能够继续启用相同的对象路径。
  2. 高性能吞吐和低延迟:亚毫秒级数据访问和 TB/ 秒吞吐量——近乎线性扩展,最高可达可用网络带宽的 80%。
  3. 一致性无锁定: Alluxio 保留了 OCI 对象存储的原生格式,并确保缓存和后端数据的一致性;不涉及任何专有格式或供应商依赖。
  4. 灵活部署多 GPU 云:Alluxio 可无缝、自动地将正确的素材提供给每个 GPU,从而为应用程序提供低延迟和高带宽的数据访问。

将 OCI 对象存储中的数据缓存或预热到 Alluxio 后,后续读取操作将直接从本地 NVMe 或内存中献出,延迟将降低几个数量级。

基准测试结果

  1. 在 WARP 基准测试中,单节点部署实现 0.3 毫秒平均延迟;
  2. 在 MLPerf Storage 2.0 测试中,6 节点集群吞吐量达 61.6 GB/s;
  3. 同时保持 GPU 利用率稳定在 90% 以上。

请添加图片描述

以上的基准测试结果充分证明,将 Alluxio 与 OCI 的高性能裸金属基础设施相结合,是消除 AI/ML 和大数据分析中数据访问瓶颈的有效策略。依据在应用程序附近构建高性能缓存层,该解决方案能够充分发挥 OCI 计算和 GPU 资源的潜力,从而大规模地实现速度和一致性。

对于希望最大限度地提高 OCI 计算效率、加速 AI 创新和简化运行的组织而言,OCI 上的 Alluxio可帮助你消除数据孤岛、数据拷贝及配置变更,以及给出经过验证、用于生产环境的出色性能。

Alluxio-Oracle 云市场入口

Alluxio 与 OCI 的联合解决方案现已凭借 Oracle 云市场正式提供,客户可直接订阅并快速部署,加速AI落地进程。

Alluxio-Oracle 云市场入口:
https://cloudmarketplace.oracle.com/marketplace/en_US/listing/198398958

了解更多,请访问:
https://www.oracle.com/cn/cloud/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1206683.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Cesium进阶教程:Shader与三维GIS可视化实战

视频合集点击查看 视频教程大纲: 1.cesium进阶教程:在cesium后处理中移植shadertoy的代码 2.cesium进阶教程:后处理绘制圆形 3.cesium进阶教程:封装自定义materialProperty 4.cesium进阶教程:自定义材质实现流动线…

Trae AI零基础编程入门:纯小白也能快速上手

视频点击这里直接观看 1、简介 新中地推出Trae AI编程系列课程,本系列课程共分为三个模块,系统讲解Trae IDE的核心功能与实战应用,手把手教你学会Trae,提升编程效率。 PS. 针对纯小白,没有任何AI编程基础的同学也能…

java研发工程师必知必会

java研发工程师必知必会java作为一种跨平台、面向对象的编程语言,广泛应用于企业级Web开发和移动应用开发。其核心特性包括可移植性(一次编写,到处运行)、安全性、分布式支持以及泛型编程能力。又因其简单易学深受…

【笔记】【底层逻辑1】

目录 精读刘润《底层逻辑 1》:看透世界运转规律,少走人生弯路 一、 是非对错的底层逻辑:三种视角,三种答案 二、 分清人性、道德和法律:别混淆三者的边界 三、 人生的三层智慧:选择、定力、博弈 第一层智慧:选择 —— 先知道 “有的选”,再敢放弃 第二层智慧:定…

静态 Top Tree

哈哈哈学会的新东西啊,暴搓312行 在此鸣谢机房大蛇QEDQEDQED&&zxkqwq进行一个讲解 前置知识 en。没有。 (可能要理解下线段树的结构,前缀和,二分) 定义 Top Tree是什么? 就是对于一个给定的树,通过comp…

【笔记】【周期】

目录 《周期》核心解读笔记 第一类:基本面周期 —— 经济、政府、企业的底层逻辑 1. 经济周期 2. 政府调节周期 3. 企业盈利周期 第二类:心理周期 —— 投资人的情绪钟摆 1. 心理钟摆 2. 风险态度周期 第三类:市场周期 —— 信贷、房地产、股市的具体玩法 1. 信贷…

typescript-类的访问权限public、private、protected

访问权限这个你可以理解为类的某个属性或者某个方法可以在哪里访问。分三种,public(默认),protected,privatepublicpublic表示在任意的地方都可以访问某个类的属性或者方法。场景:比如你叫小名,别人要叫你的时候,得知道你的名字&a…

【笔记】【逆向思维:顶级大脑的降维思考智慧】

目录 逆向思维:顶级大脑的降维思考智慧 方法一:反向目标法 —— 从 “要什么” 到 “不要什么” 方法二:因果倒置法 —— 从 “结果推原因” 到 “原因推反向结果” 方法三:换位思考法 —— 从 “我的视角” 到 “对立面视角” 误区一:为了反向而反向,忽略底层逻辑 …

工信部擘画“开源新基建”:推动工业互联网平台生态跃迁

当工业的庞大躯干寻求智能化的灵魂,一场围绕“连接”与“控制”的深层博弈正在展开。开源,这把曾经重塑了互联网世界的钥匙,如今被赋予了打开工业互联网下一道价值之门的使命。1月13日,中华人民共和国工业和信息化部(以…

ASTM D4169-23e1测试,ASTM D4169标准模拟,包装运输测试ASTM D4169试验

一、标准定义与合规性确认 ASTM D4169-23e1 是美国材料与试验协会(ASTM International)发布的《运输集装箱和系统性能测试的标准实施规程》,2023 年 12 月批准、2024 年 1 月发布,核心是通过实验室模拟物流全链路风险&#xff0c…

【课程设计/毕业设计】基于SpringBoot的医院医疗护工陪护系统的设计与实现基于springboot的护工管理便捷服务系统【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

中国AI模型的“双向涟漪”——从全球南方自主到美企的市场转向

美国闭源AI模型长期以“技术垄断地缘绑定”主导全球市场,中国开源人工智能模型则以“自主可控、成本友好、适配本地”为核心优势,逐步渗透全球南方国家、发达国家企业及硅谷核心圈,推动全球AI技术选择格局发生深刻变革。据彭博社、英国《金融…

SRM+AI智能寻源:10分钟搞定供应商寻源!

对于采购人员而言,寻源是采购非常重要,但同时也非常耗费精力的环节。传统模式下,为找到合适的供应商,采购人员可能需要:通过搜索引擎大量检索、搜集各类供应商信息,筛选符合要求的供应商。逐一在征信平台上…

Java计算机毕设之基于Springboot的医疗护理管理服务系统(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

强烈安利8个AI论文网站,本科生搞定毕业论文不求人!

强烈安利8个AI论文网站,本科生搞定毕业论文不求人! 论文写作不再难,AI 工具助你轻松应对 对于很多本科生来说,毕业论文是一项既重要又棘手的任务。从选题到撰写,再到修改和降重,每一步都充满了挑战。而如今…

firebird 数据库 C# 开发报错

1、找不到dllUnable to load DLL fbembed or one of its dependencies: 找不到指定的模块。 (0x8007007E) 2、磁盘结构错误发现式12 不支持13的错误 firebird下载的exe选择3的版本。不要选5的版本。 3、占用,多个程…

企业邮箱收费吗?解析主流品牌的三种收费模式

在企业数字化转型的进程中,专业的企业邮箱已成为标配工具。许多初创团队和企业在初次接触时,常会疑惑:“企业邮箱收费吗?” 答案是肯定的。与个人免费邮箱不同,专业的企业邮箱服务通常需要付费,以获得专属域…

PCB行业MES厂商TOP3推荐:主流厂商对比与务实建议

在智能制造深入推进的背景下,MES系统已成为PCB企业提升效率、保障质量、满足客户追溯要求的关键基础设施。然而,PCB制造具有工序繁多(20道)、产品高度非标(HDI/FPC/厚铜板等)、质量敏感度高、交付节奏快等特…

PCB板上你是普通油墨,我是低损耗油墨,能一样吗?

一博高速先生成员--黄刚 文章一开始就先给各位选择困难症的粉丝们出一道题,如果今天让你们来设计下面的这组25G光口信号的布线,你会选择走内层还是表层呢? 其实高速先生相信在座的各位PCB工程师更愿意选择走表层,原因就是过孔如果…

重组蛋白表达系统技术详解:从原核到真核的系统比较与选择指南

重组蛋白表达系统是现代生命科学研究和生物技术服务行业的基础性技术平台。从科研试剂的角度,重组蛋白表达系统不仅支撑着基础研究、药物靶标验证、抗体筛选等多种实验,还为生物公司提供了稳定、可控的蛋白样品来源。…