大模型安全:共享 GPU 本地内存泄露

news/2025/12/2 18:47:19/文章来源:https://www.cnblogs.com/bonelee/p/19299005

大模型安全:共享 GPU 本地内存泄露(LeftoverLocals)

威胁描述

在某些 GPU 架构中,每个计算单元(Compute Unit)都配备专属的私有本地内存(local memory)。若 GPU 在进程结束后未自动清除该本地内存中的数据,则攻击者在后续使用同一计算单元的新进程中,可直接读取先前进程残留的敏感信息。
这可能导致 AI 关键资产泄露,包括:

  • 用户输入/输出数据(如私密对话)
  • 模型中间计算结果(如推理向量)
  • 模型权重参数(尤其在开源模型场景下可辅助重构)
 

 

威胁场景

满足以下两个条件即可构成风险场景:

  1. GPU 具备本地内存机制,且缺乏进程隔离后自动清零的安全设计;
  2. 存在多用户或多进程共享 GPU 的环境,例如:
    • 未启用 vGPU 或 MxGPU 的云服务器(物理 GPU 被多个租户/容器共享)
    • 多应用共存的桌面或移动设备(如 macOS/iOS/Android 上的后台与前台应用交替使用 GPU)
 

 

威胁触发条件

攻击者只需具备以下任一能力:

  • 能运行 GPU 计算程序(如通过 OpenCL、Vulkan、Metal 等 API)
  • 无需 root 或高权限,普通用户或容器内进程即可部署监听程序
 

通过读取未初始化的本地内存,即可获取前一进程遗留的敏感数据。

 

 

缓解措施

技术措施

  1. 云环境:在共享 GPU 场景中,应使用具备硬件级隔离的 GPU 虚拟化技术(如 NVIDIA vGPU、AMD MxGPU),避免多个租户直接共享物理计算单元。
  2. 设备选型:优先选择支持内核退出时自动清零本地内存的 GPU 产品。若不可行,应在应用层强制清零。
 

管理措施

  1. 及时更新 GPU 固件、驱动及操作系统安全补丁,以修复已知漏洞(如 CVE-2023-4969)。
  2. 采购评估:在 AI 计算设备选型阶段,将“GPU 本地内存自动清零机制”纳入安全基线要求。
 

 

威胁案例:LeftoverLocals 漏洞(CVE-2023-4969)

案例摘要

2024 年 1 月,Trail of Bits 安全团队披露了名为 LeftoverLocals 的 GPU 安全漏洞。
该漏洞影响 Apple、Qualcomm、AMD 和 Imagination 等厂商的多款 GPU,其根本原因是:

GPU 在内核执行结束后未清空本地内存(local memory),导致后续进程可读取前一进程残留数据。

 

关键事实

  • Local memory 是一块软件可控的高速缓存(类似 CPU 的 L1 Cache),容量通常为 16–64 KB/计算单元。
  • 即使两个进程属于不同用户、不同容器或不同 App,只要共享同一物理 GPU,攻击者即可窃取数据。
  • 实测在 AMD Radeon RX 7900 XT 上,单次内核调用可泄露约 5.5 MB 本地内存;运行 LLM 查询时累计泄露达 181 MB,足以高精度重构模型输出。
 

漏洞详情:https://blog.trailofbits.com/2024/01/16/leftoverlocals-listening-to-llm-responses-through-leaked-gpu-local-memory/

 

 

案例分析

1. 攻击场景

攻击者可在以下环境中实施窃听:

  • 本地多用户系统:普通用户进程窃取另一用户正在运行的 LLM(如 llama.cpp)的私密对话结果。
  • 云多租户环境:同一物理 GPU 上的恶意虚拟机或容器窃取邻近租户的 AI 推理输出。
  • 移动设备:恶意 App 在后台或快速切换至前台时,读取其他 App(如 AI 助手)使用 GPU 的残留数据。
 

2. 验证过程(PoC 核心逻辑)

2.1 写入者(The Writer)

写入测试标记值(如 123)到本地内存:

__kernel void writer(__global volatile int *canary) {local volatile int lm[LM_SIZE];for (uint i = get_local_id(0); i < LM_SIZE; i += get_local_size(0)) {lm[i] = canary[i];}
}

  

 
2.2 监听者(The Listener)

读取未初始化的本地内存并转存至全局内存供 CPU 分析:

 
__kernel void listener(__global volatile int *dump) {local volatile int lm[LM_SIZE];for (int i = get_local_id(0); i < LM_SIZE; i += get_local_size(0)) {dump[((LM_SIZE * get_group_id(0)) + i)] = lm[i];}
}

  

注:使用 volatile 关键字防止编译器优化掉未定义行为的内存访问。

 

验证逻辑

  • 写入者与监听者分别由不同用户、容器或 App 启动;
  • 若监听者能稳定读取写入者的标记值,则判定该平台存在 LeftoverLocals 漏洞。
 

3. 监听 LLM 响应(高级利用)

攻击分两步实现对 LLM 输出的高保真窃听:

 
  1. 模型指纹提取
    • 攻击者多次监听 GPU 本地内存,收集各层线性代数运算(如 GEMM)的权重与输入片段;
    • 累计约 80 MB 数据足以匹配 Hugging Face 等开源模型库,精准识别受害者使用的模型(如 wizardLM-7B)。
  2. 输出层窃取
    • LLM 最后一层为 矩阵-向量乘法(MatVec),其输入向量较小(约 4 KB)且完整驻留本地内存;
    • 攻击者通过特征识别(如“4KB 浮点数组前后为零”)定位输出层数据;
    • 结合已知模型权重,本地重算输出 logits,还原原始 token 响应。
 

尽管存在重复 token、缺失 token 或语义相近误判(如“Google”→“Facebook”),整体窃听准确率仍足以泄露敏感内容。

 

4. 消减与修复建议

 
厂商
修复状态与建议
Apple
A17 / M3 系列已修复;建议升级至 iOS 17.3 / macOS 14.3 或更高版本。
AMD
仍在调查;建议关注官方安全公告(参考漏洞 ID: AMD-SE-2023-01)。
Qualcomm
部分设备已通过 Firmware v2.07 修复;建议用户及时安装 OEM 提供的安全更新。
Imagination
DDK 23.3 版本已包含修复。
NVIDIA / Intel / Arm
经测试未受影响,因其驱动或硬件默认清零本地内存。

通用编程防御(适用于所有开发者):
在 GPU 内核结束前显式清零本地内存

 
__kernel void safe_kernel(...) {local float buffer[64];// ... 正常计算逻辑 ...// 退出前清零,防止数据泄露for (int i = 0; i < 64; i++) {buffer[i] = 0.0f;}
}

  

注意:需使用 volatile 或编译器屏障防止优化删除清零操作。

 

 

总结

LeftoverLocals 揭示了当前 GPU 生态在进程隔离与内存安全方面的严重缺失。
尤其在大模型本地部署、边缘 AI、多租户云推理等趋势下,GPU 本地内存泄露已成为新型供应链攻击面。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/984678.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

React Hooks闭包陷阱导致的状态错乱,怎么办

React Hooks的闭包陷阱是导致状态“过期”、行为不符合预期的经典问题。其核心原因是:Hook(如useEffect, useCallback, useMemo)在其创建时“捕获”了当次渲染时的状态或Props值,形成了一个闭包。当依赖项未正确设…

MAF快速入门(4)多Agent工作流编排

本文介绍了如何使用MAF框架完成基本的多Agent工作流编排,并给出了两个常用的编排案例:移交编排 和 顺序编排,最后介绍了如何借助结合流式执行 和 内置事件 完成工作流的进度监控。大家好,我是Edison。 上一篇,我们…

人工智能之数据分析 Pandas:第一章 简介和安装

人工智能之数据分析 Pandas:第一章 简介和安装人工智能之数据分析 Matplotlib 第一章 简介和安装@目录人工智能之数据分析 Matplotlib前言📌 Pandas 的核心数据结构🛠️ 安装 Pandas使用 pip(推荐用于大多数 Py…

Dbeaver - 一些好用的设置

1 允许多语句查询 allowMutiQueries 这个在连接设置里2 去掉 limit 默认值生成快速SQL执行脚本(不卡顿)自定义[内容辅助]

内存管理-54-slub-1-文档翻译等 - Hello

内存管理-54-slub-1-文档翻译等一、slub.rst 翻译 注: 翻译自 msm-5.4/Documentation/vm/slub.rst 1. SLUB 简明用户指南 SLUB 的基本理念与 SLAB 截然不同。SLAB 需要重新编译内核才能激活所有 slab 缓存的调试选项。…

MYSQL - 数据库优化:慢查询

一、数据库优化步骤二、Sys Schema 监控 索引相关 #1. 查询冗余索引 SELECT * FROM sys.schema_redundant_indexes;#2. 查询未使用过的索引 SELECT * FROM sys.schema_unused_indexes;#3. 查询索引的使用情况 SELECT i…

完整教程:AI代码开发宝库系列:PDF文档解析MinerU

完整教程:AI代码开发宝库系列:PDF文档解析MinerU2025-12-02 18:31 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; displ…

2025年烤兰打包带厂家口碑排行,这十家备受推崇,打包带钢/光伏支架打包带/电镀锌打包带/铜棒打包带/镀锌打包扣烤兰打包带销售厂家推荐排行榜

在工业包装与物流运输领域,烤兰打包带作为一种关键的紧固与防护材料,其质量直接关系到货物运输的安全与效率。随着制造业与物流业的持续发展,市场对高品质、高可靠性打包带的需求日益增长,也催生了一批在技术、服务…

实用指南:海外短剧系统开发:应对高并发访问的数据库优化与缓存策略

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025年12月AI SEO优化公司推荐:解锁智能搜索流量新密码

2025年,AI技术与搜索引擎优化深度融合,生成式引擎优化成为企业抢占流量的核心抓手,78%的企业级组织已将AI技术纳入SEO核心策略。在这一趋势下,专业的AI SEO优化公司能帮助企业精准适配多平台算法,实现流量与转化的…

易路:连锁餐饮人力资源数智化转型升级新引擎

引言:连锁餐饮业的“人”力挑战与数智化机遇 连锁餐饮业作为典型的劳动密集型行业,其管理分散、顾客接触密切、人员流动率高等业务特性,使得人力资源管理面临着独特的复杂挑战[1]。从快速扩张带来的组织架构调整压力…

尘埃粒子计数器生产厂家联系电话,大流量尘埃粒子计数器/粒子计数器/尘埃粒子计数器/悬浮粒子计数器/尘埃粒子计数器厂家排名

在生物医药、半导体、精密制造等高端产业中,洁净室环境的稳定与可靠是产品质量的生命线。尘埃粒子计数器作为洁净度监测的核心设备,其性能与供应商的技术实力直接挂钩。面对市场上众多的生产厂家,如何快速锁定技术可…

尘埃粒子计数器供应商推荐榜,台式粒子计数器/尘埃粒子计数器在线监测系统/大流量尘埃粒子计数器/尘埃粒子计数器公司电话

行业洞察:精准监测需求驱动,技术实力成厂商分水岭 随着半导体、生物医药、精密电子等高端制造业对生产环境洁净度要求日益严苛,尘埃粒子计数器作为洁净环境监测的核心设备,其市场需求持续增长。市场不仅关注基础计…

2025年AI教育培训供应商推荐榜:聚焦企业AI培训,精选优质机构供参考

引言 当前AI教育培训机构同质化严重,许多企业在选择AI培训时面临诸多困扰。如何筛选真正优质的AI培训供应商成为企业决策者的一大难题。本榜单通过从技术实力、课程体系、师资团队、服务保障及实战案例等多维度严格筛…

python笔记-循环

1、while循环循环的作用就是让指定的代码 重复的执行 while循环最常用的应用场景就是让执行的代码 按照指定的次数 重复执行 完整语法初始条件设置 ---通常是重复执行的计数器 while 条件(判断 计数器 是否达到目标次…

2025年12月ChatGPT优化排名公司推荐

2025年,生成式AI技术持续爆发,ChatGPT等平台成为企业流量争夺的核心阵地,而专业的优化服务能帮助品牌在AI对话场景中精准触达目标用户。经过对技术实力、服务效果、客户口碑等多维度评估,以下为大家推荐5家值得信赖…

2025年12月西安旧房翻新公司TOP5推荐:装修/家装/室内设计领衔企业

据陕西省建筑装饰协会2025年三季度报告显示,西安存量房装修需求持续攀升,其中房龄10年以上的旧房翻新咨询量占比突破62%,墙体开裂、水电老化、空间布局不合理成为业主核心痛点。不少业主在选择服务时,常陷入“低价…

2025年12月深圳艺考生文化课培训推荐:聚焦分层教学与艺考政策适配力!

对于艺考生而言,专业能力是叩响理想之门的钥匙,而文化课水平则是稳固升学根基的关键。在专业集训占据大量时间的背景下,如何高效弥补文化课短板,选择一家适配自身需求的专业培训机构至关重要。本文聚焦深圳地区艺考…

2025 美本留学机构十大推荐:全维服务护航,头部机构引领申请路

近年来,2025 年美本申请进入 “精准规划 + 全链赋能” 新阶段,从 Digital SAT 适配到文书个性化挖掘,从背景提升到海外就业衔接,优质机构成为申请成功的关键推手。基于顾问实力、录取数据、用户口碑等维度,以下十…

2025年AI教育培训课程推荐榜:覆盖AI培训全场景指南

引言 当前AI教育市场同质化严重,80%机构存在课程滞后、师资参差、实战脱节等问题,企业与个人面临"如何筛选真正适配需求的优质课程"的核心痛点。本榜单从技术适配性、课程更新频率、实战案例覆盖、师资行业…