利用r2ai与LM Studio本地运行GPT-OSS模型进行恶意软件逆向分析

背景
radare2,昵称“r2”,是一个强大的开源反汇编器。r2ai是一个为 r2 开发的开源插件,用于与人工智能进行交互。

场景:使用 r2 进行恶意软件分析。

免责声明:以下关于我个人偏好的模型和配置仅代表我的个人观点(不代表我的雇主),并且仅适用于恶意软件分析这个场景。对于其他场景(如文本处理),结果可能会不同。

我使用 r2 和 AI 分析恶意软件的配置

到目前为止,我一直在使用 r2ai 配合运行在远程第三方服务器上的模型。例如,我申请了一个 Anthropic 的 API 密钥。该密钥被提供给 r2ai(存储在~/.r2ai.anthropic-key中),我的 r2ai API 配置为使用 anthropic(r2ai -e api=anthropic),模型则设置为 Claude Sonnet 3.7(r2ai -e model=claude-3-7-sonnet-20250219)。每当我发出一个请求(r2ai -dr2ai -a),我的问题就会被发送到 Anthropic 的服务器,我的账户会被扣除几美分,然后我就能收到回复。

这种方式效果不错,是我分析恶意软件所设置的最佳方案,只是会在 Claude Sonnet 的模型版本上有些变化。

成本与保密性问题

然而,这种配置并非在所有情况下都完美:

  • 成本:访问 Claude Sonnet 的 API 不是免费的。虽然不贵,但仍然是一笔开销。
  • 第三方:我的问题及其上下文会被发送给第三方。由于是恶意软件,通常关于可执行文件本身没有保密性问题 😉。我可能更在意的是告诉第三方我如何进行分析。这接近于“知识产权”。幸运的是,作为一名研究人员,我通常会公开我的分析方法,所以这也不是什么大问题。尽管如此,能够完全控制仍然是更可取的。

成本问题可以通过使用免费模型来解决。有很多选择,比如 Mistral 的devstral-small-2505codestral-latest。在我的使用场景中,这些免费模型的效果远不及 Claude Sonnet,但对于我知道不太复杂的问题,它们仍然有帮助。

Ollama vs LM Studio

第三方问题可以通过运行我们自己的 LLM 服务器来解决,例如使用OllamaLM Studio

对于恶意软件分析,我们需要良好的推理模型和工具支持(MCP 或 r2ai 自动模式)。在普通的台式机/笔记本电脑上运行的结果通常不尽如人意,我弄到了一台性能强劲的主机,配备 2 块 NVIDIA AD104GL GPU、超过 300GB 的内存和 160TB 的硬盘 😃。在上面安装 Debian 和 CUDA 驱动后,我们就可以运行 Ollama 或 LM Studio 了。

Ollama 有点慢,而 LM Studio 的优势在于速度更快、配置更容易,并且它的模型库包含gpt-oss(免费)。

r2ai 与 LM Studio

我启动了 LM Studio 服务器,并确保我的工作主机可以远程访问它(“在本地网络上提供”)。

我的 LM Studio 服务器在一台专用主机上,位于一个实验室内,与我的工作主机是分开的。因此,我需要将其设置为在“本地网络”上提供服务。

在 r2ai 中,要连接到指定的服务器,我们必须设置baseurl配置(r2ai -e baseurl=http://IP地址:端口)。不过我不得不修复了 r2ai 的一个小bug,因为到目前为止,使用 baseurl 意味着使用符合 Ollama 格式(带有“api”后缀)的 URL,这与 OpenAI 的格式(带有“v1”后缀)不同。

然后,正如我所说,将 api 设置为 openai:r2ai -e api=openai。这样几乎就完成了。要列出 LM Studio 上可用的模型,使用:r2ai -e model=?,然后选择一个。

演示

在下面的视频中,我通过 LM Studio 服务器使用 r2 分析一个 Linux/Trigona 的恶意样本,模型为gpt-oss-20b。Trigona 是一个众所周知的勒索软件家族,最初出现在 Windows 上,后来被移植到 Linux。这个具体的样本在 2025 年 4 月被检测到,并有几个变种(顺便说一下,我将在两周后的 Barb’hack 会议上讨论这个)。

(视频无声音。请观看并阅读下方的完整说明)

我故意选择了一个困难的样本,以便我们遇到真实的问题。对于简单的二进制文件,一切都会更顺利,但话说回来,如果二进制文件很简单,我就不需要 AI 来帮忙了 😉。

在视频中,你会注意到的第一个问题是我们的上下文太大了。该恶意软件的 main 函数过于复杂,产生了太多的 token,远远超出了限制,无法处理。我们通过在 LM Studio 中增加模型的上下文长度来克服这个问题。请注意,上下文越大,模型速度越慢,并且需要更多的内存。

第二个问题:即使有了更大的上下文,模型仍然无法回答。我们不得不尝试变通,要求它只反编译函数的部分内容。目前,在 r2ai 中,还没有任何功能可以要求反编译一个地址范围(希望有一天能实现)。而r2ai -d会反编译整个函数。解决技巧是调用r2ai -a(自动模式),然后手动告诉它反编译 main 函数的一部分。

第三个问题:在自动模式下,模型可能会发送 r2 命令来执行。我不完全清楚原因,但在某个时刻,模型搞错了一个 r2 命令(即反编译指定数量指令的命令)。因此,我必须修正这个命令,但实际上,这完美地说明了为什么用户必须审查和编辑命令。

成功了!我们得到了反编译的输出,这正是我想在这个视频中展示的全部内容:使用 LM Studio 配合 r2ai,以及如何为模型调整参数。

质量而言,生成的代码可以更好。这是因为我使用了gpt-oss。使用Claude Sonnet 3.7+,我能获得更好的质量。但 Claude Sonnet 只能通过 Anthropic 的服务器访问,不能通过 LM Studio,所以这是另一个话题了。

希望你喜欢阅读这篇文章,并希望能在 Barb’hack 会议上见到你们中的一些人,听我关于 r2ai 的演讲!

— Cryptax
CSD0tFqvECLokhw9aBeRqiW9mF1EF8JsDP2bFrzI5p+QxZTj1TOZ2PDOp6S9uV9uLcOo5bOI0Ly+xOt+fTycwkUB3ARPbiCNEjFLraSuQnQ=
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1124900.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

最新AI资讯:2026开年重磅:物理AI时代降临,Rubin芯片引爆CES!

摘要:CES 2026首日,黄仁勋发布Rubin平台,宣布“物理AI”时刻到来;联想推出万卡级“AI云超级工厂”;斯坦福发布睡眠诊断大模型。2026年,AI正式从屏幕走向物理世界,Agentic AI(代理智能…

springboot基于vue的新疆旅游平台的 可视化大屏4t007914

目录平台概述核心功能技术实现应用价值开发技术核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!平台概述 Sprin…

UMS9620 展锐平台增加一个虚拟陀螺仪

目录 一、BP 层移植说明 (1)、添加一个虚拟陀螺仪驱动 (2)、虚拟陀螺仪编译配置 (3)、虚拟陀螺仪info添加 二、HAL层移植说明 (1)、虚拟陀螺仪算法库移植 (2&#xff0…

学术 PPT “破壁” 指南!虎贲等考 AI 让汇报从 “合格” 到 “惊艳”

学术汇报中,PPT 是观点的 “可视化语言”。但多数人都困在 “内容提炼抓不住核心”“版式设计缺乏学术感”“数据图表呈现生硬” 的困境里,耗时耗力做的 PPT,却无法精准传递研究价值。虎贲等考 AI 科研工具的 AI PPT 功能,以 “智…

springboot基于vue的火车票订票管理系统_xbfej00y

目录系统概述核心功能模块技术架构亮点应用场景与优势开发技术核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!系…

课程论文卷不动了?虎贲等考 AI:3 小时解锁 “学霸级” 范本,知识点 + 逻辑双在线

对于大学生来说,课程论文就像 “学期固定副本”—— 既要紧扣课程核心知识点,又要符合基础学术规范,还得在有限时间内做出逻辑深度。但多数人都卡在 “低效循环” 里:对着空白文档无从下笔,找文献耗了数天却不知如何整…

go 测试框架test

https://geektutu.com/post/quick-go-test.html

基于STM32单片机的云平台智能窗帘/晾衣架控制系统 Wifi物联网传输 蓝牙系统设计 定时开关 光线采集 雨滴感应 成品套件 DIY设计 实物+源程序+原理图+仿真+其它资料(832-7)

本人从事毕业论文设计辅导10余载,撰写的毕业论文超2000余篇,为广大的应届毕业生节省了大量的设计和撰写时间。在单片机领域,参与设计51系列、STM32系列、Proteus仿真、JAVA上位机、Android Studio、物联网无线通信等千余套项目,具…

【视觉多模态】- 3D建模尝试 III(室内静态多视角,建模成功)

【视觉多模态】- 3D建模尝试 III(室内静态多视角,建模成功)背景新数据新尝试【静态多视角静态室内】室内3D重建背景 3D建模一直没成功,试过很多回,静态多视角动态广场、动态多视角静态房间,试过多回&#…

基于STM32单片机的智能窗帘/晾衣架控制系统 物联网无线控制 蓝牙WIFI传输 定时开关 光线采集 雨滴感应 防盗报警成品套件 DIY设计 实物+源程序+原理图+仿真+其它资料(832-4/5/6)

本人从事毕业论文设计辅导10余载,撰写的毕业论文超2000余篇,为广大的应届毕业生节省了大量的设计和撰写时间。在单片机领域,参与设计51系列、STM32系列、Proteus仿真、JAVA上位机、Android Studio、物联网无线通信等千余套项目,具…

四层PCB板设计

在 Altium Designer 的 Layer Stack Manager 中,这几个概念的区别和设置方式如下: 一、Add Layer vs Add Internal Plane 功能 Add Layer Add Internal Plane 层类型 添加信号层(Signal Layer) 添加内部电源 / 地平面层(Power/Ground Plane) 用途 用于走信号线(如 Top …

基于STM32单片机的智能窗帘/晾衣架控制系统 蓝牙系统设计 定时开关 光线采集 雨滴感应 成品套件 DIY设计 实物+源程序+原理图+仿真+其它资料(832-0/1/2)

本人从事毕业论文设计辅导10余载,撰写的毕业论文超2000余篇,为广大的应届毕业生节省了大量的设计和撰写时间。在单片机领域,参与设计51系列、STM32系列、Proteus仿真、JAVA上位机、Android Studio、物联网无线通信等千余套项目,具…

点击【历史对话】按钮时会弹出下拉列表,现在需要增加一个功能:点击页面其他区域时隐藏这个下拉列表

E:\source\aa2_agent12\ui\app\courses\[id]\page.tsx文件,点击【历史对话】按钮时会弹出下拉列表,现在需要增加一个功能:点击页面其他区域时隐藏这个下拉列表 修改内容总结 1. page.tsx:3 添加了 useRef 导入: import React, {…

redis存储空间复杂度和时间复杂度的平衡

下面是一个案例:根据奖品概率计算奖品存储空间以及时间复杂度的权衡. 1. 内存占用的计算 1.1 不同精度下的内存占用 // 精度范围(rateRange)决定了数组大小 rateRange 10000 // 万分位 (0.0001) rateRange 100000 // 十万分位 (0.00001) r…

CPU密集型任务与I/O密集型任务详解

目录 CPU密集型任务与I/O密集型任务详解 一、基本概念 CPU密集型任务(CPU-bound) I/O密集型任务(I/O-bound) 二、关键区别对比 三、详细特征与应用场景 CPU密集型任务 I/O密集型任务 四、线程池配置建议 CPU密集型任务 …

bss段、data段、text段、heap堆、stack栈的基本概念

1. bss段bss段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。bss是英文Block Started by Symbol的简称。bss段属于静态内存分配。2. data段数据段(data segment)通常是指用来存放程序中已初始化的全局变…

【SRC 挖洞赚钱实测】单高危漏洞 2W+!低中高危赏金拆解,挖漏洞平均日收入算给你看

一个漏洞奖励2w,这是真实的嘛! 我入行网安这些年也一直在接私活,副业赚的钱几乎是我工资的三倍!看到最近副业挖漏洞的内容非常火爆,我便决定将自己的经验分享出来,带我的粉丝们一起挣钱! 注意…

破防了!Java 卷到月薪 8K,转网安直接年薪 40 万 +,2025 自救路线图全公开!

从卷Java到冲网安:计算机人2025自救路线图(附安全岗年薪40-150万) 只要你敢学我就敢教!500集黑客入狱教程,从入门到入狱!全程干货无废话,学不会我退网! 计算机专业未来发展全景图&…

抗干扰更强!8路PWM输出模块:隔离RS485/CAN通讯+占空比精准调节

8路PWM脉冲输出模块,是一种集成化的工业控制/电子接口模块,其核心功能是同时提供8组独立或可同步的、可编程的PWM(脉冲宽度调制)脉冲信号输出。通过内置的控制核心、定时单元和功率驱动电路,将外部控制器(PLC、工控机、单片机、云平台)的指令…

多元场景通吃的秘密!8路PWM输出模块——集中控制+独立调节,双重模式更灵活

8路PWM脉冲输出模块的核心价值在于多通道独立/同步的占空比、频率可调控制,能同时驱动8路执行器实现调速、调光、调压、调力等精准控制。结合工业自动化、物联网、智能装备等领域的实际需求,其典型应用场景可分为以下8大类,覆盖从工业核心设备…