MinIO 的 S3 over RDMA 计划: 为高速人工智能数据基础设施设定对象存储新标准

随着 AI 和机器学习的需求不断加速,数据中心网络正在迅速发展以跟上步伐。对于许多企业来说,400GbE 甚至 800GbE 正在成为标准选择,因为数据密集型和时间敏感型 AI 工作负载需要高速、低延迟的数据传输。用于大型语言处理、实时分析和计算机视觉等任务的 AI 模型需要处理大量数据,并几乎立即在存储和计算节点之间移动。传统的网络速度根本不足以处理这些工作负载所需的数据吞吐量。这种向 400GbE/800GbE 的转变是支持依赖大量分布式数据集的 AI 应用程序的自然演变,这些数据集通常跨 GPU 集群或专用加速器进行处理。然而,随着网络速度的提高,TCP/IP 等传统协议难以保持效率,由于 CPU 开销和延迟高而造成瓶颈。通过将其 S3 功能与 RDMA 保持一致,MinIO 正在开拓新的方法来满足现代 AI 工作负载的性能和可扩展性要求,同时也使客户能够无缝过渡到更高速的网络标准。这种对 S3 over RDMA 的前瞻性支持扩展了 MinIO 在构建针对未来优化的 AI 就绪数据基础设施的企业中的领导地位。S3 over RDMA 功能在新的 AIStor 中可用。

什么是 RDMA?

远程直接内存访问 (RDMA) 允许绕过 CPU、操作系统和 TCP/IP 堆栈,直接在两个系统的内存之间移动数据。这种直接内存访问减少了与 CPU 和操作系统处理数据相关的开销和延迟,使 RDMA 对于低延迟、高吞吐量网络特别有价值。

为什么随着我们向 800GbE 迈进,以及 AI 基础设施的联网范围,RDMA 变得更加重要

随着对更快数据访问的需求不断增加,400GbE/800GbE 网络将成为 AI 数据基础设施的支柱。虽然 TCP/IP 多年来一直支持以太网的发展,但它却难以满足超高速网络的要求,原因如下:

  • CPU 瓶颈:TCP/IP 严重依赖 CPU 来处理数据包处理、重组和流控制等任务。在 800GbE 时,数据包的庞大数量和速度可能会使 CPU 不堪重负,从而造成性能瓶颈。

  • 延迟和抖动:TCP/IP 通过多个层(应用程序、传输、网络、链接)处理数据,从而增加延迟。缓冲、重传和数据包重组会进一步增加延迟和抖动,而这些延迟和抖动会随着速度的提高而被放大。

  • 内存带宽限制:TCP/IP 在用户和内核空间之间传输数据,添加多个内存副本。在 800GbE 时,这会使内存带宽紧张,从而进一步降低性能。

RDMA 已成为处理海量数据流并在这些速度下最大限度地减少 CPU 开销的关键技术。RDMA 通过以下方式解决了 TCP/IP 在高速网络中的限制:

  • 直接内存访问:RDMA 绕过内核和 CPU,通过允许内存到内存的数据传输来减少延迟。

  • 零拷贝数据传输:数据直接从一个应用程序的内存移动到另一个应用程序的内存,无需中间缓冲,从而提高效率。

  • CPU 卸载:RDMA 将网络处理卸载到 NIC,从而释放 CPU 资源。

  • 高效的流量控制:RDMA 基于 NIC 的流量控制比 TCP 的拥塞控制更快,使用的 CPU 周期更少,从而实现更稳定的高速性能。

以太网势在必行,RDMA 的优势传统上仅限于使用 InfiniBand 的高性能计算 (HPC) 环境,长期以来一直受到低延迟、高吞吐量应用程序的青睐。然而,以太网已成为 AI 和其他数据密集型工作负载的首选,原因如下:

  • 成本和无处不在:以太网具有成本效益且广泛兼容,而 InfiniBand 需要专门的硬件和专业知识。以太网的跨平台通用兼容性使其更易于实施,尤其是在集成 RoCE 的情况下。

  • RoCE 标准化:基于融合以太网的 RDMA (RoCE) 为以太网带来了 RDMA 的优势,在熟悉的可扩展基础设施上支持低延迟、高吞吐量的数据传输。

  • 多功能性:与通常用于专用环境的 InfiniBand 不同,以太网支持单个网络基础设施上的一系列工作负载。对于 AI 和数据分析环境,以太网提供了灵活性,而无需单独的网络架构。

对于希望其 AI 数据基础设施面向未来的公司来说,以太网(尤其是支持 RDMA 的 RoCE)是平衡性能与成本效益的合理选择。

S3 over RDMA:面向未来的 AI 部署,满足未来的网络标准

随着 AI 网络基础设施的发展,MinIO 通过 RDMA 集成 S3 为需要快速、可靠数据访问的 AI 工作负载提供了必要的超低延迟和高吞吐量,尤其是在模型训练和推理期间。这有助于:

  • 减少延迟:借助 RDMA 的内存到内存数据传输,S3 GET 和 PUT 请求的处理延迟最小,从而在 AI 训练和分析工作流中实现更快的数据检索。

  • 提高吞吐量:RDMA 允许 MinIO 在没有 CPU 瓶颈的情况下处理更多的并行数据传输,这在 GPU 密集型 AI 环境中至关重要。

  • 效率提升:通过将数据处理卸载到支持 RDMA 的 NIC,MinIO 降低了 CPU 使用率,使组织能够将更多资源集中在 AI 模型训练和分析上。

  • 与未来以太网标准的兼容性:RDMA 提供了实现 TB 级以太网速度的途径,使 MinIO 的 S3 解决方案可以随着网络技术的进步而扩展。

  • 成本效益:通过减少对 CPU 的依赖,RDMA 降低了能源和运营成本,这在组织扩展其数据基础设施时尤为有价值。

借助 S3 over RDMA,MinIO 提供了一个强大的、面向未来的对象存储平台,符合数据中心网络的最高标准。

结论

MinIO 支持 S3 over RDMA 的举措是对现代高速网络环境需求的前瞻性响应。通过在熟悉的 S3 框架中利用 RDMA 的低延迟、高吞吐量功能,MinIO 使客户能够充分利用其 400GbE 和 800GbE 以太网投资,提供快速、可扩展且高效的存储解决方案。对于希望面向未来的 AI 和数据密集型工作负载的企业,MinIO 的 S3 over RDMA 可确保其基础设施能够满足未来的需求,从而将 MinIO 定位为下一代网络时代高性能对象存储的明确选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/59642.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

git config是做什么的?

git config是做什么的? git config作用配置级别三种配置级别的介绍及使用,配置文件说明 使用说明git confi查看参数 默认/不使用这个参数 情况下 Git 使用哪个配置等级? 一些常见的行为查看配置信息设置配置信息删除配置信息 一些常用的配置信…

电能表预付费系统-标准传输规范(STS)(41)

7.3.7 TokenValidation Class 0 and Class 2 tokens shall primarily be validated against the TID encoded in the token, except for key change token set. 除密钥更改令牌集外,类别0和类别2令牌应主要针对令牌中编码的TID进行验证。 Key change tokens are va…

使用 npm 安装 Yarn

PS E:\WeChat Files\wxid_fipwhzebc1yh22\FileStorage\File\2024-11\spid-admin\spid-admin> yarn install yarn : 无法将“yarn”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后…

51单片机使用NRF24L01进行2.4G无线通信

本文并不打算详细介绍NRF24L01的各个功能寄存器及指令的详细用法,因为网上都可以搜到很多非常详细的教程文档,这里只是介绍一些基本概念、用法以及代码的解释,旨在帮助新手能够快速上手调通快速使用。 基础概念 该模块使用的是SPI协议&…

python怎么加锁

在Python中,加锁是一种常见的线程同步机制,用于防止多个线程同时访问共享资源,从而避免数据竞争和不一致的问题。Python提供了多种方式来实现加锁: 1. threading模块的Lock threading.Lock是最基本的锁机制,它允许一…

常用在汽车PKE无钥匙进入系统的高度集成SOC芯片:CSM2433

CSM2433是一款集成2.4GHz频段发射器、125KHz接收器和8位RISC(精简指令集)MCU的SOC芯片,用在汽车PKE无钥匙进入系统里。 什么是汽车PKE无钥匙进入系统? 无钥匙进入系统具有无钥匙进入并且启动的功能,英文名称是PKE&…

kafka消费者出现频繁Rebalance

kafka消费者在正常使用过程中,突然出现了不消费消息的情况,项目里是使用了多个消费者消费不同数据,按理不会相互影响,看日志,发现消费者出现了频繁的Rebalance。 Rebalance的触发条件 组成员发生变更(新consumer加入组…

QList和QSet常用操作(查找、插入、排序、交集)

1、QList常用操作(查找、插入、排序) (1)QList查找(前提:已排序) /*[查找val在列表(已排序)中的位置,返回值范围[-1,0,,size()-1]]*/ int posOf(const QLis…

机器学习基础05

目录 1.随机森林 1.1随机森林的介绍 1.2算法原理 1.3API 2.线性回归 2.1回归的含义 2.2线性回归 2.3损失函数 2.4多参数回归 2.5最小二乘法MSE 2.6API 1.随机森林 集成学习的基本思想就是将多个分类器组合,从而实现一个预测效果更好的集成分类器。 集成…

深度解析 Feign

一、引言 在当今微服务架构盛行的时代,众多微服务相互协作构成了复杂的分布式系统。然而,各个微服务之间的调用往往涉及到诸多繁琐的细节,比如网络请求的构建、参数的处理、响应的解析等。为了让开发人员能够更加专注于业务逻辑的实现&#x…

数据库范式、MySQL 架构、算法与树的深入解析

一、数据库范式 在数据库设计中,范式是一系列规则,用于确保数据的组织和存储具有良好的结构、完整性以及最小化的数据冗余。如果不遵循范式设计,数据可能会以平铺式罗列,仅使用冒号、分号等简单分隔。这种方式存在诸多弊端&#…

iOS swift开发--- 加载PDF文件并显示内容

iOS开发采用pdfkit ,可以很方便的读取pdf的内容。以下是简易的显示pdf内容的代码 import UIKit import PDFKitclass ViewController: UIViewController, UIDocumentPickerDelegate {var pdfView: PDFView! //创建一个控件显示内容let selectPDFButton UIButton(ty…

统信操作系统离线安装JDK、Nginx、elasticsearch、kibana、ik、pinyin

第一步:挂载光盘 1、查看设备名称 查看光盘的名称,通常是以 /dev/sr0 或者类似格式显示lsblk 2、创建挂载点并挂载光盘 创建挂载目录sudo mkdir /mnt/cdrom 进行光盘目录挂载,/dev/sr0 要替换为实际查看到的光盘设备名称sudo mount /dev…

Linux服务器下连接kingbase并执行SQL的脚本

Linux服务器上实现通过shell脚本更新数据(非信创服务器) #!/bin/bash# PostgreSQL 连接信息 HOST"172.16.2.112" DBNAME"bxszf" USER"flexoffice" PASSWORD"123456789"# SQL 更新语句 SQL_QUERY"update f…

SQL面试题——奔驰SQL面试题 车辆在不同驾驶模式下的时间

SQL面试题——奔驰SQL面试题 我们的表大致如下 CREATE TABLE signal_log( vin STRING COMMENTvehicle frame id, signal_name STRING COMMENTfunction name, signal_value STRING COMMENT signal value , ts BIGINT COMMENTevent timestamp, dt STRING COMMENTformat yyyy-mm…

Hadoop生态圈框架部署(六)- HBase完全分布式部署

文章目录 前言一、Hbase完全分布式部署(手动部署)1. 下载Hbase2. 上传安装包3. 解压HBase安装包4. 配置HBase配置文件4.1 修改hbase-env.sh配置文件4.2 修改hbase-site.xml配置文件4.3 修改regionservers配置文件4.4 删除hbase中slf4j-reload4j-1.7.33.j…

YOLOv11改进,YOLOv11添加GnConv递归门控卷积,二次创新C3k2结构

摘要 视觉 Transformer 在多种任务中取得了显著的成功,这得益于基于点积自注意力的新空间建模机制。视觉 Transformer 中的关键因素——即输入自适应、长距离和高阶空间交互——也可以通过卷积框架高效实现。作者提出了递归门控卷积(Recursive Gated Convolution,简称 gnCo…

Queuing 表(buffer表)的优化实践 | OceanBase 性能优化实践

案例问题描述 该案例来自一个金融行业客户的问题:他们发现某个应用对一个数据量相对较小的表(仅包含数千条记录)访问时,频繁遇到性能下降的情况。为解决此问题,客户向我们求助进行分析。我们发现这张表有频繁的批量插…

nginx证书流式响应配置

要配置 Nginx 支持流式响应的反向代理,你需要进行一些特定的设置,以确保 Nginx 不会缓冲响应并正确地将数据转发到后端服务器。以下是一个简单的配置示例,假设你的后端服务器运行在 http://backend-server:port: server {listen …

CentOS 8 安装 chronyd 服务

操作场景 目前原生 CentOS 8 不支持安装 ntp 服务,因此会发生时间不准的问题,需使用 chronyd 来调整时间服务。CentOS 8以及 TencentOS 3.1及以上版本的实例都使用 chronyd 服务实现时钟同步。本文介绍了如何在 CentOS 8 操作系统的腾讯云服务器上安装并…