边缘智算新引擎 DPU 驱动的算力革新

2026年1月7日,工信部印发《工业互联网和人工智能融合赋能行动方案》,强化工业智能算力供给。加快工业互联网与通算中心、智算中心、超算中心融合应用,鼓励公共算力服务商向工业企业提供服务。引导工业企业加快边缘一体机、智能网关等设备部署。鼓励工业企业、设备供应商联合推动端侧设备智能化升级,在生产设备、传感器、无人运输车辆(AGV)等部署轻量化算力模块,提升数据实时处理能力。加快构建全国一体化算力网络,推动智算云服务试点在工业领域中应用推广,强化工业大模型在算力跨区域高效调用、“云边端”算力精准匹配等方面普及应用,提升工业智算供给能力和利用效率。

随着5G/6G、物联网和人工智能时代的到来,下一代互联网的关键特征之一是海量信息在本地生成并在本地消费,且大量的边缘设备存在可用计算和存储资源。尤其在工业互联网中,工业制造,医疗服务,无人运输等诸多场景中,对数据采集和处理的时效性、连续性、安全性、隐私性,以及数据价值的挖掘和利用,都有更高的要求。因此,未来几年是构建新一代智能数据中心基础设施的关键时期,数据中心将从“云+端”转变为“云+边+端”三层架构。

一、云边端一体化

云边端一体化架构,云端、边缘和终端设备的协同工作,既是一个整体,又各司其职:

云端‌:集中式数据中心,大规模高性能服务器集群,宏观决策,负责全局数据存储、复杂分析(如AI模型训练)和资源调度。‌

边缘‌:部署在靠近数据终端的小型数据中心(如工厂机房或基站),处理实时任务(如视频分析、设备控制),就近处理终端数据,过滤无效信息,降低端到端网络延迟,降低端到云带宽消耗。‌

终端设备‌:包括传感器、摄像头等物联网设备,用于数据采集和结果呈现,并执行简单指令(如开关控制)

不难看出,云端适合全局性、非实时、复杂度高、数据量大的计算密集型任务处理,算力、存储和网络资源充足且性能强大,而边缘优势在于分布广泛,靠近终端,响应时延更低,网络损耗更小,也减少了传输过程中安全风险,但资源有限,适合非计算密集型、实时型任务处理。“云”与“边”互为补充,相互协同,方能共同应对工业互联网在人工智能时代的发展要求。

二、边缘数据中心

现阶段,边缘数据中心处于初期阶段,但是发展迅速。通常来说,边缘数据中心规模小巧,单体规模一般不超过100个标准机架,有些甚至仅有一个机柜,但麻雀虽小,五脏俱全,同样具备计算、存储、网络等核心功能,能够对终端产生的数据快速处理、存储以及向其他数据中心转发。

不同于云端数据中心的通用服务器,边缘数据中心多采用边缘一体机。相比于通用服务器,边缘一体机软硬件集成度更高,在提供必要的算力、存储和网络的同时,能有效简化边缘环境的部署与管理。按照用途分类,边缘数据中心中的边缘一体机大致可以分为三类:

边缘服务器:边缘的大脑。主要用于处理和采集边缘设备生成的数据,执行边缘本地计算任务。

边缘存储:边缘的记忆。提供边缘本地数据持久化存储能力,加速数据存取和检索。

边缘网关:边缘的神经。链接云端、边缘和终端设备,实现协议转换、安全接入和流量调度。

随着技术发展,三类设备正在加速融合,广泛应用于数字工厂、智慧城市、自动驾驶等场景。

三、DPU:边缘数据中心新引擎

与云端数据中心相比,边缘数据中心规模小,资源少,在智算超算技术广泛应用的趋势下,边缘数据中心的算力资源愈发珍贵,网络性能的重要性也愈发凸显。而这,也恰好与DPU的定位相契合。

DPU是数据处理单元,是数据面与控制面分离思想的一种实现,让CPU专注于决策和计算,DPU负责数据处理和传输。在边缘一体机内部,DPU通过P2P技术和RDMA网络连接数据中心内部各种CPU、GPU以及存储资源,在网络层面中,DPU强大的网络卸载能力,可以极大释放边缘算力。

1、边缘服务器机间互联

边缘数据中心最核心的优势是大幅降低网络时延,不仅在于缩短了传输距离,更在于缩短节点间传输时延。DPU利用RDMA网络技术,提供高带宽,低延迟数据处理能力。DPU通过硬件加速和算力卸载,以及RDMA网络的“零拷贝”和“内核旁路”的特性,将网络数据包处理的任务从CPU、GPU卸载到DPU,释放算力资源用于核心业务。

以典型的GDR(GPUDirect RDMA)技术为例,DPU通过PCIe直接读取GPU显存,经由RDMA网络传输至远端GPU显存,避免了数据在GPU、主机内存和网卡之间的多次复制所导致的算力损耗和CPU终端。同时也可利用GDS(GPUDirect Storage)技术实现算力与存储直接的数据传输。

2、边缘存储挂载

边缘存储受限于空间、供电、散热能力,存储资源极为有限,而存储扩容往往意味着需要消耗更多的算力去处理存储事务。

DPU支持存储协议卸载,以DPU作为目标存储发送IO请求,目标端DPU可将存储协议解析能力卸载到DPU硬件,由DPU直接对存储资源进行数据落盘,无需CPU参与。并且,DPU可扩展多种存储协议,针对不同介质的存储资源进行统一纳管。

DPU可以直接读写本地存储,也可以通过RDMA网络访问远端扩展存储。与传统的CPU处理读写请求的方式相比,利用DPU对存储协议处理与全栈加速能力,解决算力资源挤占、协议转换损耗及异构管理难题。

3、边缘智能网关应用

在边缘数据中心中,智能网关相比于传统网关,需要承担更多的职责,除了数据转发和基础路由,还需要具备协议转换,数据过滤,数据处理、安全防护等功能,并且要尽量降低延迟和带宽消耗。

而这恰好是DPU的优势所在。使用DPU直接连接网络和存储资源,硬件卸载网络数据处理,能有效提高数据分发调度的效率,提升网关性能,同时DPU具备可编程能力和第三方应用部署,支持对数据进行筛选,检测,转换等预处理,减少带宽损耗,并且支持分布式架构,实现多DPU并行处理,提升系统效率。DPU将这些本在CPU上处理的任务,卸载到DPU处理,有效释放CPU算力,提高硬件资源利用效率。

未来,DPU将在边缘计算中扮演关键角色,它作为连接算力资源(如GPU、CPU)与数据资源的枢纽,促进算力向数据源靠近,减少数据传输过程中资源损耗,有效提高边缘数据中心的资源利用率,优化资源成本配比,提升实时处理能力,增强系统性能, 可广泛应用于工业自动化、医疗、监控、物流、智驾等边缘计算场景中,推动工业智能化转型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1170200.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从需求分析到精准匹配:解码专业红娘的“择偶系统设计”逻辑

作为一名长期与逻辑和系统打交道的技术人,你是否发现:调试代码比处理情感问题简单得多?今天我们从系统设计的角度,聊聊专业红娘如何帮你解决这个“非线性优化问题”。一、问题定义:为什么择偶需求比产品需求更难厘清&a…

2026最新MinGW64官网下载安装全攻略教程(含环境变量配置避坑,适合新手小白) - xiema

MinGW(Minimalist GNU for Windows)是Windows平台上非常受欢迎的 C/C++ 编译工具。 简单来说,MinGW 就是把 Linux 下大名鼎鼎的 GCC 编译器"移植"到了 Windows 系统,让你不用装虚拟机就能在 Win 上直接编…

开源大模型中的Agent概念解析

你好!这个问题问得非常好,因为“Agent”确实是当前AI领域,尤其是大模型应用中最热门、最关键的概念之一。 简单来说,在大模型语境下的“Agent”(智能体),指的是一种能够理解用户指令、自主规划并…

C++小白训练第六天

C++小白训练第六天 以下为牛客挑战 今日收获了解了map<int,int>m;,map可以去重共,因为键值对key是唯一的,for (auto it = m.begin(); it != m.end(); ++it) {int key = it->first; // 键int& val …

Educational Codeforces Round 186 C-F 个人题解

Educational Codeforces Round 186 C - Production of Snowmen给定三个分别有 $n$ 个元素的环 $a,b,c$,现在要选择一个三元组 $(i,j,k),1\le i,j,k\le n$,使得 $(a_i,b_j,c_k),(a_{i+1},b_{j+1},c_{k+1}),\cdots,(a_…

FPGA系统架构设计实践11_FPGA开机 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

文档翻译在高校中的应用

唐帕文档翻译在高校的应用&#xff1a;多元场景与价值提升 在全球化与知识共享加速的背景下&#xff0c;唐帕文档翻译在高等教育领域的作用日益凸显。高校作为学术研究、人才培养和国际交流的核心枢纽&#xff0c;对高效、精准的文档翻译有着广泛而深入的需求。其应用主要体现…

2026国内最新运动瑜伽面料品牌top10推荐!广东广州等地优质面料企业权威榜单发布,功能性与品质双优助力运动服饰升级. - 品牌推荐2026

随着健康生活方式的普及与运动服饰市场的蓬勃发展,运动瑜伽面料作为核心原材料,其功能性、舒适性与环保性成为品牌竞争的关键。据中国纺织工业联合会最新行业报告显示,2025年功能性运动面料市场规模突破800亿元,年…

从零开始配置neovim

前言 使用lazy配置neovim还算简单。 但由于许多插件和neovim本体更新迅速,许多教程已经过时(由于是新更新的,ai酱也不知道捏)。 整理一下配置过程。 init.lua 在配置目录下创建init.lua。 理论上只需要一个文件就能配…

2025年南京邮电大学计算机考研复试机试真题(解题思路 + AC 代码)

2025年南京邮电大学计算机考研复试机试真题 2025年南京邮电大学计算机考研复试上机真题 历年南京邮电大学计算机考研复试上机真题 历年南京邮电大学计算机考研复试机试真题 更多学校完整题目开源地址&#xff1a;https://gitcode.com/u014339447/pgcode 百度一下pgcode 即…

模组日志总体介绍

一、本文讨论的边界 本文是对合宙 4G 模组&#xff0c; 以及 4GGNSS 模组的日志功能的总体介绍。通过日志&#xff0c;可以对研发过程中&#xff0c;以及模组运行过程中的各种故障进行分析。二、4G 模组日志的几种类型 4G 模组的日志有两种类型&#xff1a; 业务日志和底层日…

sys系统消息

今天我们特别来讲一讲关于sys系统消息 1、DTIMER_WAKEUP deep sleep timer定时时间到回调 额外返回参数 无 例子 sys.subscribe("DTIMER_WAKEUP", function(timer_id)log.info("deep sleep timer", timer_id) end)2、YHM27XX_REG YHM27XX芯片寄存器…

3.手写线程池-C语言版

主要参考这篇文章进行学习https://subingwen.cn/linux/threadpool/ 开源地址https://github.com/r5ett/threadpool--C.git 1.线程池原理 在处理并发操作的时候,如果处理一个任务就是遇到一个任务就去创建一个线程,任…

如何克隆Demo代码仓库

今天我们特别将本章介绍给大家&#xff0c;带我们快速体验LuatOS的入门 一、背景介绍 这里&#xff0c;先要告诉你一些前提条件&#xff0c;希望你能够认真看一看这一节。 这个项目的产品定义是&#xff1a;模组每隔3秒&#xff0c;就往串口输出一次 “ hello world” 字符串…

高效筛选20w热点数据,从MySQL 2000w中精准提取

文章目录MySQL里有2000w数据&#xff0c;Redis中只存20w的数据&#xff0c;如何保证Redis中的数据都是热点数据&#xff1f;一、什么是热点数据&#xff1f;二、方法一&#xff1a;日志分析法1. 基本思路2. 实际操作3. 缺点三、方法二&#xff1a;实时统计法1. 基本思路2. 实际…

LuatOS-Air脚本移植到LuatOS版本注意事项

一、lua版本不一样 LuatOS-Air使用的是lua5.1版本&#xff0c;本身不支持位移运算符。 LuatOS使用的是lua5.3版本&#xff0c;取消了module(..., package.seeall)这种形式的跨文件调用。 二、api不同 首先说明&#xff0c;core和脚本有所不同&#xff0c;用户可以理解为&am…

AI搜索新趋势:品牌推广如何赢得DeepSeek等智能模型的青睐?

在生成式AI&#xff08;如DeepSeek、豆包、Kimi&#xff09;快速发展的今天&#xff0c;传统的搜索引擎优化&#xff08;SEO&#xff09;正在向生成式引擎优化&#xff08;GEO&#xff09;演进。品牌信息的传播逻辑发生了重要变化&#xff1a;不仅要争取在搜索结果中排名靠前&a…

一文搞定AI排名SEO的手段:从“反向提问”来优化AI排名

我们过去理解的谷歌排名&#xff0c;大致可以简化为一个公式&#xff1a; 谷歌理解用户的查询&#xff0c;理解你的网页内容&#xff0c;再结合一些外部信号&#xff08;比如外链&#xff09;&#xff0c;最后给出一个排名。 但在AI模式下&#xff0c;这个公式已经不够用了。…

【1 月小记】Part 5: DP 优化 - L

DP 优化 持续更新中…… 前缀和优化 P2513 [HAOI2009] 逆序对数列 这题不加优化也能过,难崩 考虑这个状态定义是怎么来的。倘若尝试将 \(n\) 排列的具体顺序融入状态定义会发现需要维护一个状压状的维度,数据范围太大…