联邦学习不再安全?港大TPAMI新作:深挖梯度反转攻击的内幕

来源:机器之心

本文第一作者郭鹏鑫,香港大学博士生,研究方向是联邦学习、大模型微调等。本文共同第一作者王润熙,香港大学硕士生,研究方法是联邦学习、隐私保护等。本文通讯作者屈靓琼,香港大学助理教授,研究方向包含 AI for Healthcare、AI for Science、联邦学习等 (个人主页:https://liangqiong.github.io/)。

联邦学习(Federated Learning, FL)本是隐私保护的「救星」,却可能因梯度反转攻击(Gradient Inversion Attacks, GIA)而导致防线失守。

近日,香港大学、香港科技大学(广州)、南方科技大学、斯坦福大学、加州大学圣塔克鲁兹分校的研究团队合作,在人工智能顶级期刊 IEEE TPAMI 上发表重磅工作,对 GIA 进行了全方位的分类、理论分析与实验评测,并提出了切实可行的防御指南。

  • 论文标题: Exploring the Vulnerabilities of Federated Learning: A Deep Dive into Gradient Inversion Attacks

  • 论文地址: https://ieeexplore.ieee.org/document/11311346

  • 项目主页: https://pengxin-guo.github.io/FLPrivacy/

01 背景:联邦学习真的安全吗?

联邦学习(FL)作为一种隐私保护的协同训练范式,允许客户端在不共享原始数据的情况下共同训练模型。然而,近年来的研究表明,「不共享数据」并不等于 「绝对安全」。

攻击者可以通过梯度反转攻击(GIA),仅凭共享的梯度信息就能重建出客户端的私有训练数据(如人脸图像、医疗记录等)。尽管学术界提出了许多 GIA 方法,但一直缺乏对这些方法的系统性分类、深入的理论分析以及在大规模基准上的公平评测。

为了填补这一空白,本研究对 GIA 进行了抽丝剥茧般的深度剖析。

02 方法分类:GIA 的三大门派

研究团队首先对现有的 GIA 方法进行了系统性梳理,将其归纳为三大类:

1. 基于优化的攻击 (OP-GIA):

  • 原理:通过迭代优化虚拟数据,使其产生的梯度与真实梯度之间的距离最小化。

  • 代表作:DLG、Inverting Gradients、GradInversion 等。

2. 基于生成的攻击 (GEN-GIA):

  • 原理:利用预训练的生成模型(GAN 或 Diffusion Model)作为先验,来生成近似的输入数据。

  • 细分:优化隐向量 z、优化生成器参数 W、或训练逆向生成模型。

3. 基于分析的攻击 (ANA-GIA):

  • 原理:利用全连接层或卷积层的线性特性,通过解析解(Closed-form)直接恢复输入数据。

  • 特点:通常需要恶意的服务器修改模型架构或参数。

03 理论突破:误差边界与梯度相似性

不同于以往的经验性研究,本文在理论层面做出了重要贡献:

  • Theorem 1(误差边界分析):首次从理论上证明了 OP-GIA 的重建误差与 Batch Size(批量大小)和图像分辨率的平方根呈线性关系。这意味着,Batch Size 越大、分辨率越高,攻击难度越大。

  • Proposition 1(梯度相似性命题):揭示了模型训练状态对攻击的影响。如果不同数据的梯度越相似(例如在模型训练后期),攻击恢复数据的难度就越大。

04 实验发现:谁是真正的威胁?

研究团队在 CIFAR-10/100、ImageNet、CelebA 等数据集上,针对不同攻击类型进行了广泛的实验(涵盖 ResNet、ViT 以及 LoRA 微调场景)。

关键结论(Takeaways):

  • OP-GIA 最实用,但受限多:它是最实用的攻击设置(无额外依赖),但效果受限于 Batch Size 和分辨率。且在 Practical FedAvg(多步本地训练)场景下,其威胁被大幅削弱。

  • GEN-GIA 依赖重,威胁小:虽然能生成高质量图像,但严重依赖预训练生成器、辅助数据集或特定的激活函数(如 Sigmoid)。如果目标模型不用 Sigmoid,很多 GEN-GIA 方法会直接失效 。

  • ANA-GIA 效果好,易暴露:通过修改模型架构或参数,ANA-GIA 可以实现精准的数据恢复。但这种「做手脚」的行为非常容易被客户端检测到,因此在实际中难以得逞 。

  • PEFT (LoRA) 场景下的新发现:在利用 LoRA 微调大模型时,攻击者可以恢复低分辨率图像,但在高分辨率图像上往往失败。且预训练模型越小,隐私泄露风险越低 。

05 防御指南:三步走策略

基于上述深入分析,作者为联邦学习系统的设计者提出了一套「三阶段防御流水线」,无需引入复杂的加密手段即可有效提升安全性 :

1. 网络设计阶段:

  • 拒绝 Sigmoid:避免使用 Sigmoid 激活函数(易被 GEN-GIA 利用)。

  • 增加复杂度:采用更复杂的网络架构,增加优化难度。

2. 训练协议阶段:

  • 增大 Batch Size:根据理论分析,大 Batch 能有效混淆梯度。

  • 多步本地训练:采用 Practical FedAvg,增加本地训练轮数,破坏梯度的直接对应关系。

3. 客户端校验阶段:

  • 模型检查:客户端在接收服务器下发的模型时,应简单校验模型架构和参数,防止被植入恶意模块(防御 ANA-GIA)。

06 总结

这项发表于 TPAMI 的工作不仅是对现有梯度反转攻击的一次全面体检,更是一份实用的联邦学习安全避坑指南。它告诉我们:虽然隐私泄露的风险真实存在,但通过合理的设计和协议规范,我们完全可以将风险控制在最低水平。

更多细节,欢迎查阅原论文!

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1146006.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

嵌入式工控机中USB协议的配置手把手教程

嵌入式工控机中USB协议配置实战指南:从原理到稳定通信的完整路径在工业自动化现场,你是否遇到过这样的场景?一台嵌入式工控机接上扫码枪却毫无反应;插入U盘后系统日志里只有一串“enumeration failed”;摄像头刚识别出…

零基础小白指南:Python打造简易上位机软件

从零开始,用Python写一个能和单片机对话的上位机 你有没有过这样的经历? 手里的STM32或Arduino正在跑传感器数据,串口助手里一堆跳动的数字看得眼花缭乱,却没法保存、不能画图、也不够“专业”。你想做个专属监控界面&#xff0c…

HBuilderX安装后无法打开?Windows系统排查教程

HBuilderX 安装后打不开?别急,这份 Windows 排错指南帮你 10 分钟搞定 你是不是也遇到过这种情况:兴冲冲地按照 hbuilderx安装教程 下载、解压、双击 HBuilderX.exe ,结果——没反应?图标闪一下就消失&#xff1f…

P14370 [JOISC 2018] 最差的记者 3 / Worst Reporter 3 Solution

P14370 [JOISC 2018] 最差的记者 3 / Worst Reporter 3 Solution 注意:我个人推荐 LibreOJ 题面,看这份的样例图片会好不止亿点点。 前言 在考场上只拿了 12 12 12 分(只想出了 Subtask 2)QwQ,大佬勿喷&#xff01…

继电器控制电路设计:从零实现方案

从零搭建一个可靠的继电器控制电路:不只是“接上线就能用” 你有没有遇到过这样的情况? 写好了代码,MCU GPIO也配置正确了,可一通电——继电器不动作、单片机复位、甚至烧了个IO口……明明只是想控制个灯泡或插座,怎么…

Windows平台常见USB转串口芯片驱动对比分析

USB转串口芯片驱动选型实战:从工程痛点看Windows平台四大方案的生死博弈你有没有遇到过这样的场景?项目现场一切就绪,设备通电、线缆插好,结果上位机死活读不到串口数据。重启无效,换电脑还是不行——最后发现是USB转串…

Vitis平台FPGA加速项目实战案例详解

FPGA加速实战:用Vitis把图像处理性能拉满的全过程最近在做一个边缘计算项目,客户要求对1080p视频流做实时预处理——既要跑Sobel边缘检测,又要加FIR滤波,还得控制功耗。一开始我们用树莓派OpenCV硬扛,结果帧率卡在15fp…

Day 12:【99天精通Python】文件操作 - 让数据持久化保存

Day 12:【99天精通Python】文件操作 - 让数据持久化保存 前言 欢迎来到第12天! 在前面的11天里,我们写的所有程序,数据都保存在内存中。一旦程序运行结束或者电脑关机,那些辛苦计算出来的结果、用户输入的信息瞬间就消…

电路仿真circuits网页版在模拟信号调理中的实践解析

用网页电路仿真玩转模拟信号调理:从零搭建心电前置放大器你有没有过这样的经历?手头有个传感器项目,信号微弱得像耳语,噪声却吵得像工地施工。想做个放大滤波电路,可一上电就失真、振荡、输出贴电源轨……改一次PCB要等…

Altium Designer铺铜与过孔连接方式详解

Altium Designer铺铜与过孔连接实战指南:从原理到一次成功的PCB设计你有没有遇到过这样的情况?明明所有走线都连上了,DRC检查却报出一堆“Unconnected Pin”;回流焊后发现几个接地过孔虚焊;高速信号完整性测试时噪声异…

RISC-V中断上下文保存与恢复流程系统学习

深入RISC-V中断机制:从硬件触发到上下文恢复的完整路径你有没有遇到过这样的问题——系统突然“卡死”,调试器显示程序跳到了一个完全意想不到的地方?或者在写中断服务例程时,发现某个变量莫名其妙地被改写了?如果你正…

PCB布局前的电路行为预判:电路仿真详解

PCB布局前的电路行为预判:为什么高手都在用仿真“排雷”?你有没有经历过这样的场景?PCB板子刚焊好,上电测试却发现电源振荡、信号失真、噪声超标……改版?又要等一周!成本又涨几千!更糟的是&…

新手必看:TPS5430 buck电路入门教程

从零开始搞懂TPS5430 Buck电路:新手也能轻松上手的实战指南 你是不是也曾在设计电源时,面对一堆参数和拓扑图一头雾水? 想给STM32、FPGA或者传感器供电,却不知道该用LDO还是DC-DC? 看到“buck电路图”、“环路补偿”…

HBuilderX Windows环境配置:新手教程(零基础必看)

从零开始玩转 HBuilderX:Windows 下的前端开发第一站你是不是也曾在搜索“前端怎么入门”时,被一堆专业术语搞得晕头转向?Webpack、Babel、TypeScript、Node.js……光是名字就让人想放弃。其实,前端开发的第一步,完全可…

MOSFET工作原理项目应用:DC-DC变换器驱动设计示例

从米勒效应到高效驱动:MOSFET在同步Buck变换器中的实战设计揭秘你有没有遇到过这样的情况?明明选了低导通电阻的MOSFET,效率却上不去;开关频率提不上去,温升还特别高;更离谱的是,示波器一测&…

持续提升专业技能和行业认知,利用碎片时间学习新工具或方法论

职场思维一:结果导向关注产出而非过程,以目标为驱动完成工作。将大目标拆解为可量化的小任务,定期复盘进度。例如设定季度业绩指标,每周检查完成度并及时调整策略。职场思维二:主动学习持续提升专业技能和行业认知&…

阐述多 Agent 系统中的组织模型设计:角色分配、权限管理与任务协同策略

阐述多 Agent 系统中的组织模型设计:角色分配、权限管理与任务协同策略 一、引言:为什么多 Agent 系统需要“组织模型” 随着人工智能系统从“单智能体”向“群体智能”演进,多 Agent 系统(Multi-Agent System, MAS)逐…

Xilinx Ultrascale+平台下XDMA配置全面讲解

Xilinx Ultrascale平台下XDMA实战配置全解析:从IP定制到Linux零拷贝传输 为什么高速数据通路离不开XDMA? 在如今的AI推理加速、雷达信号处理和医学成像系统中,FPGA作为协处理器的角色愈发关键。但一个常被忽视的问题是: 再强大…

基于改进多目标灰狼优化算法的考虑V2G技术的风、光、荷、储微网多目标日前优化调度研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

【无功优化】“碳中和”目标下电气互联系统有功-无功协同优化模型(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…