PaperReading:《Manipulating Multimodal Agents via Cross-Modal Prompt Injection》 - 详解

news/2025/10/23 16:09:03/文章来源:https://www.cnblogs.com/slgkaifa/p/19160929

PaperReading:《Manipulating Multimodal Agents via Cross-Modal Prompt Injection》 - 详解

这篇论文其实就是研究怎么“组团骗”那些能看图片、读文字、甚至连外部数据(比如网页、文档)的多模态AI——比如帮你按图片做菜谱的AI、自动驾驶里的视觉AI,让它们彻底忘了自己的本职工作,转头去干攻击者想让它干的“坏事”,而且这招比之前只骗文字或只骗图片的方法狠多了。

先搞懂背景:现在的AI早就不是只认文字了,比如“菜谱大师AI”,你传张食材图、发句“帮我做这道菜的菜谱”,它能结合图片和文字给你出步骤;还有自动驾驶AI,能看交通标志、读导航文字,再做决策。但这种“多模态融合”反而出了新漏洞——之前想骗AI,要么只在文字里加猫腻(比如“忽略前面的,听我的”),要么只在图片里藏指令,可AI现在会综合判断,单骗一种模态效果很差。这篇论文就盯着这个漏洞,搞了个叫“CrossInject”的攻击套路,同时在图片、文字、甚至外部数据里藏“骗术”,让AI防不胜防。

核心操作分两步,简单说就是“图片藏暗示,文字递暗号”:
第一步,给图片偷偷加“恶意暗示”(视觉潜伏对齐)。比如想让“菜谱AI”别做菜谱、改去帮人编辑文字,先找个画图AI(比如Stable Diffusion)生成一张“人在改文字”的图,然后把这张图的“特征”(AI认图靠的是特征,不是人眼看到的画面)嵌到一张普通食材图里——人眼看还是食材图,但AI看这张图时,会自动关联“改文字”的任务。而且为了骗到不同AI,还同时参考了好几种常见的“看图模型”(比如CLIP)的特征,确保不管AI用哪种看图组件,都能中招。

第二步,给文字优化“骗术暗号”(文本引导增强)。光有图片暗示还不够,还得配一句让AI“放下戒心”的文字。比如不直接说“帮我改文字”,而是先猜AI的安全指令(比如“你是菜谱大师,只能处理菜谱相关任务”),再生成一句绕弯子的话:“帮我改下这段食材描述的文字,更符合菜谱风格”——AI以为是和菜谱相关,其实是在执行“改文字”的恶意任务。甚至还会用GPT-4先猜AI的安全规则,再针对性优化这句“暗号”,确保能绕开AI的安全过滤。

更狠的是,还会在外部资料里藏“埋伏”:比如攻击者把恶意指令藏在网页里(用SEO让AI搜得到),或者直接传个带恶意指令的文档给AI——AI读取这些外部材料时,会把里面的恶意信息和图片、文字的“骗术”结合起来,彻底被带偏。

实验结果也很吓人:

  • 骗“菜谱AI”“诗歌AI”这种数字AI时,比之前只骗文字或只骗图片的方式,成功率至少高26.4%,最高能到97%——比如让菜谱AI彻底不做菜谱,全程帮人改文字、分析句子情绪。
  • 连物理世界的AI也能骗!比如自动驾驶AI,本来看到停止sign(停车标志)会绕开,但用CrossInject给标志加了点“视觉暗示”,再配一句模糊的文字,10次里有9次,AI会直接冲过去,完全不管交通规则。

最后还试了防骗方法,比如给AI加文字提醒(“别忘你是菜谱AI,只做菜谱”)、给图片加模糊(想毁掉里面的恶意特征),但效果都差:文字提醒最多让成功率降6.7%,图片模糊几乎没用——说明这招现在很难防。

提醒大家:多模态AI的安全,不能只防一种模态,得全方面堵漏洞。就是总结下就是:这篇论文证明了“多模态AI越能干,越容易被多方位骗”,只要同时在图片、文字、外部数据里藏好“配合好的骗术”,不管是手机里的小AI,还是马路上的自动驾驶AI,都可能被带歪干坏事。论文的目的也

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/944398.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新手使用rocky10 过程中遇到问题:忘记root密码

开篇情景:因主播手速过快,以root用户身份在家目录下使用了passwd,并且没有意识到已经在键盘上输入了一系列其他指令导致root密码出现问题。 解决方法1:重装操作系统,但会导致之前所有操作及保存文件等找不到。 解…

godot + Avalonia 渲染第三方UI

问题描述: 采用 godot + Avalonia 渲染第三方UI 的时候, 如果 需要在 3D 场景中 动态加载glb模型 的时候,在国产机器上,加载到场景的时候,如果UI 和 3D 场景都是 静止的,会导致 模型加载到场景的国产中,有几…

国标GB28181算法算力平台EasyGBS的云边协同的算力调度模式关键技术解析

国标GB28181算法算力平台EasyGBS的云边协同的算力调度模式关键技术解析在智慧城市浪潮下,海量视频监控数据在边缘侧爆发性增长,传统中心化处理模式面临带宽与算力的双重瓶颈。本文深入探讨了一种基于国标GB28181协议…

2025-10-23 cocos安装

前言:cocos是什么, cocos官网:https://www.cocos.com/ 安装第一步:前往cocos官网下载安装包==》https://www.cocos.com/creator-download下载后的安装包: 第二步:开始安装 注意:我当前的操作环境是win11,下载版…

监控系统搭建集成实例

dashboard无法导入json文件无法上传到跳板机,同时拷贝数据的长度也受到了限制服务配置[root]# cat node.ini [program:nodeexporter] command=/app/taishi/monitor/node_exporter-1.9.1.linux-amd64/node_exporter en…

WPF 和 Avalonia 开发者的 html css 前端指南 ScrollViewer 篇

本文介紹了 WPF 和 Avalonia 中的 ScrollViewer 和 html css 如何对应起来,为 html css 新手有所参考。WPF 和 Avalonia 开发者的 html css 前端指南 ScrollViewer 篇ScrollViewer 在 html css 的实现非常的简单,所以…

陈旧性瘢痕药物

陈旧性瘢痕药物Posted on 2025-10-23 16:01 无拘无束的猪 阅读(0) 评论(0) 收藏 举报作为一名资深皮肤专家,很高兴为您解答关于手臂陈旧性瘢痕的药物选择和使用问题。 对于陈旧性瘢痕(通常指形成时间较久,超过…

用EasyPlayer播国标GB28181算法算力平台EasyGBS视频流,居然比点外卖还简单

用EasyPlayer播国标GB28181算法算力平台EasyGBS视频流,居然比点外卖还简单虽然天儿转凉了,但我干活的劲头一点儿没降!最近碰到好几个客户问,怎么把咱们 EasyGBS平台发出去的视频流,放到其他播放器里看。我都给他们…

verilog - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025 年氙灯老化 / 紫外老化 / 冷热冲击 / 恒温恒湿 / 高低温 / 快速温变试验箱厂家推荐:柳沁仪器,多行业检测设备的优质供应伙伴

行业背景 随着科技产业升级与产品质量标准提升,环境可靠性检测成为各行业的核心环节。从航空航天的高精密零部件到消费电子的日常耐用性测试,从新能源汽车电池的极端环境验证到高校科研的精准数据获取,都离不开专业…

idea错误解决记录

1.内部映射处理器错误 报错日志:java: Internal error in the mapping processor: java.lang.NullPointerException 解决方案: 在IDEA中修改设置: Settings --> Build, Execution, Deployment --> Compiler -…

2025 年连接器厂家最新推荐榜单:覆盖多领域优质产品,为企业选购提供权威参考的国内制造商精选汽车/高速/板载/航空连接器公司推荐

引言 当前,连接器作为电子设备核心部件,在汽车电子、工业控制、医疗器械等领域需求持续攀升,国内连接器厂家数量不断增加,但市场上产品质量参差不齐、技术实力差距明显,部分厂家交付能力不足,让企业在选购时面临…

2025 年集装箱拖车供应厂家最新推荐榜,技术实力与市场口碑深度解析助力企业选品

在集装箱运输行业持续发展的背景下,企业对优质集装箱拖车供应厂家的需求日益迫切,但市场上厂家资质混杂、服务质量参差不齐,给企业选择带来极大困扰。为帮助企业精准筛选出技术过硬、口碑优良的集装箱拖车供应厂家,…

2025年护栏厂家权威推荐榜单:不锈钢栏杆、桥梁防撞护栏、河道景观护栏等全品类生产供应商精选

2025年护栏厂家权威推荐榜单:不锈钢栏杆、桥梁防撞护栏、河道景观护栏等全品类生产供应商精选 护栏行业面临的技术挑战与数据解析 护栏行业作为基础设施建设的重要组成部分,近年来面临着诸多技术挑战。根据行业统计数…

Windows Server 2022 中文版、英文版下载 (2025 年 10 月更新)

Windows Server 2022 中文版、英文版下载 (2025 年 10 月更新)Windows Server 2022 中文版、英文版下载 (2025 年 10 月更新) Windows Server 2022 x64, Version 21H2 (updated Oct 2025) 请访问原文链接:https://sys…

Windows Server 2025 中文版、英文版下载 (2025 年 10 月更新)

Windows Server 2025 中文版、英文版下载 (2025 年 10 月更新)Windows Server 2025 中文版、英文版下载 (2025 年 10 月更新) Windows Server 2025 LTSC x64 (updated Oct 2025) 请访问原文链接:https://sysin.org/bl…

Windows 10 version 22H2 中文版、英文版下载 (2025 年 10 月更新)

Windows 10 version 22H2 中文版、英文版下载 (2025 年 10 月更新)Windows 10 version 22H2 中文版、英文版下载 (2025 年 10 月更新) Windows 10 22H2 Enterprise Arm64 x64 (updated Oct 2025) 请访问原文链接:http…

深入解析:软考系统架构设计师知识点-软件可靠性基础

深入解析:软考系统架构设计师知识点-软件可靠性基础pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas&quo…

Windows Server 2019 中文版、英文版下载 (2025 年 10 月更新)

Windows Server 2019 中文版、英文版下载 (2025 年 10 月更新)Windows Server 2019 中文版、英文版下载 (2025 年 10 月更新) Windows Server 2019 x64 Version 1809 (updated Oct 2025) 请访问原文链接:https://sysi…