使用大语言模型在表格化网络安全数据中进行高效异常检测

论文链接

Efficient anomaly detection in tabular cybersecurity data using large language models

论文主要内容

这篇论文介绍了一种基于大语言模型(LLMs)的创新方法,用于表格网络安全数据中的异常检测,称为“基于引导式提示的表格异常检测”(Tabular Anomaly Detection via Guided Prompts,简称TAD-GP)。该方法利用了一个70亿参数的开源模型,并结合了数据样本介绍、异常类型识别、链式思考推理、虚拟多轮对话和关键信息强化等策略。实验结果表明,TAD-GP框架在CICIDS2017、KDD Cup 1999和UNSW-NB15数据集上的F1分数分别提高了79.31%、97.96%和59.09%。此外,较小规模的TAD-GP模型在多个数据集上的表现优于较大的模型,显示出其在计算资源受限和需要私有部署的环境中的实际潜力。该方法填补了使用小型开源模型进行网络安全异常检测的研究空白。

背景知识

在网络安全领域,表格数据用于捕获关键信息,如网络流量、用户行为和系统日志。随着网络攻击变得越来越复杂,传统的基于规则的检测方法已不足以应对。因此,研究人员转向使用机器学习和深度学习等先进的异常检测技术,尽管这些方法在一定程度上取得了成功,但仍面临泛化能力的挑战。

研究方法

TAD-GP框架通过以下五个关键策略来提高小型语言模型在表格数据异常检测中的性能:

数据样本介绍(Data Sample Introduction)

目的:帮助模型快速熟悉关键数据特征和模式。
方法:随机选择一个正常样本和一个异常样本,将这些样本转换为JSON格式,便于模型处理和理解数据的结构和属性。
效果:增强模型对关键模式的早期识别能力,从而实现更快、更准确的异常检测。

细粒度异常分类(Fine-grained Anomaly Classification)

目的:指导模型识别各种异常行为,提高分类精度。
方法:为每个数据集建立清晰的异常类别序列,如KDD Cup 1999数据集中的拒绝服务(DOS)、远程到本地(R2L)、本地到超级用户(U2R)和探测(PROBING)等类别。
效果:减少不同异常类型之间的混淆风险,提高检测准确性和鲁棒性。

链式思考策略(Chain-of-Thought Strategy)

目的:提高模型对复杂数据特征的理解和推理能力。
方法:采用“先部分,后整体”的策略,模型先独立分析每个特征,然后综合多个特征之间的交互来识别潜在的异常模式。
效果:增强模型对数据特征之间复杂关系的理解,使模型能够检测到不仅显式的异常,还能检测到更微妙的异常模式组合。在高维和复杂数据场景中,该策略允许模型更详细地分析特征依赖关系,从而做出更全面和准确的判断。

虚拟多轮对话技术(Virtual Multi-turn Dialogue Technology)

目的:模拟专家在复杂推理任务中的思维过程,逐步加深对异常模式的理解,同时加快模型的推理速度。
方法:设计多轮对话场景,每轮对话包括用户提问和助手回答。通过多轮互动,模型逐步获取关键信息,从数据示例到特征分析,逐步深化对异常模式的理解。在传统的与大语言模型的对话方式中,用户提问是我们的输入,助手回答是模型经过推理后的输出。例如:对于一个5轮的交互式对话,模型需要进行5次推理输出。而在虚拟多轮对话技术中,除了最后1次的助手回答为模型推理后的输出,其余的4次用户提问与助手回答都是人为设计的,这将原本需要的5次推理输出变为了1次,有效地缩短了模型推理时间。而由于前4次的助手回答都是人为设计的,我们可以在助手回答中放入更多我们所期望的信息,来更好地引导模型的推理过程。这也是我们将整个框架命名为TAD-GP,即基于引导式提示的表格异常检测的主要原因。
效果:减轻模型在单实例分析中的认知负担,通过结构化引导方法促进更精确的推理和判断。与真实对话不同,虚拟对话通过人工设计的助手回答来引导模型进行深入思考,确保其分析过程符合预定义的期望,同时加快模型的推理速度。

关键信息记忆强化(Key Information Memory Reinforcement)

目的:确保模型在多轮对话过程中始终保留关键数据点,防止模型忽略重要元素。
方法:在多轮对话中,通过一致强调重要细节来强化关键信息。例如,在第一轮对话中,模型被提示获取一个正常数据样本,而在第二轮对话中,进一步强调该数据的正常性。
效果:通过反复强调关键特征,模型可以加强对其关键异常模式的记忆,从而提高整体检测精度。在涉及复杂特征关系的场景中,该机制有助于模型保留关键信息,增强其在挑战性数据环境中的可靠性。

实验设计

实验旨在评估大语言模型在表格数据异常检测中的潜力,并通过引入创新的TAD-GP框架来验证其在小型模型中的有效性。实验设计包括多个方面:
模型和数据集选择:选择了Gemma-7b-it模型作为基础模型,并选择了KDD Cup 1999、CICIDS2017和UNSW-NB15三个广泛使用的基准数据集。
数据预处理:包括数据清洗、数据平衡和数据格式转换,以确保数据的完整性和一致性。
评估指标:使用准确率、精确率、召回率和F1分数来全面评估模型在不同实验条件下的性能。

实验结果与讨论

实验结果表明,TAD-GP框架通过引导提示策略显著提高了小型模型在异常检测任务中的性能。具体来说:
链式思考策略:在KDD Cup 1999数据集上,使用5步链式思考和多轮对话将准确率从0.50提高到0.98,F1分数达到0.9796。
多轮对话策略:在CICIDS2017数据集上,多轮对话将F1分数从0.6047提高到0.7931,强调了连续上下文增强对于理解复杂模式的重要性。
小型模型与大型模型的比较:TAD-GP框架使小型Gemma-7b-it模型在多个性能指标上优于大型模型,如GPT-3.5-turbo、Llama-2-70b-chat和Mixtral-8x7B-Instruct。Gemma-7b-it模型的F1分数为0.7879,超过了GPT-3.5-turbo的0.7146和Llama-2-70b-chat的0.7248。

结论

TAD-GP框架提供了一种创新且实用的方法,通过引导提示策略显著提高了小型语言模型在表格网络数据异常检测中的性能。该框架不仅在资源受限的环境中具有优势,还提供了能源效率、灵活部署和隐私保护的支持。未来的研究可以进一步验证该框架的泛化能力,并探索其在金融、医疗保健和供应链管理等领域的潜力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10462.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【AI绘画】MidJourney关键词{Prompt}全面整理

AI绘画整理,MidJourney关键词。喜欢AI绘画的朋友必备,建议收藏,后面用到时供查阅使用。 1、光线与影子篇 中 英 闪耀的霓虹灯 shimmeringneon lights 黑暗中的影子 shadows in the dark 照亮城市的月光 moonlightilluminatingthe cit…

剑指offer 数组 持续更新中...

文章目录 1. 数组中重复的数字1.1 问题描述1.2 方法1: 排序1.3 方法2: 哈希表1.4 方法3: 原地交换 2. 寻找重复数2.1 问题描述2.2 方案1,使用辅助数组2.3 方案2,使用二分 3. 二维数组的查找3.2 方案1,贪心 4. 合并两个有序数组4.1 问题描述4.…

SQLAlchemy 2.0的简单使用教程

SQLAlchemy 2.0相比1.x进行了很大的更新,目前网上的教程不多,以下以链接mysql为例介绍一下基本的使用方法 环境及依赖 Python:3.8 mysql:8.3 Flask:3.0.3 SQLAlchemy:2.0.37 PyMySQL:1.1.1使用步骤 1、创建引擎,链接到mysql engine crea…

nodejs:express + js-mdict 网页查询英汉词典

向 DeepSeek R1 提问: 我想写一个Web 前端网页,后台用 nodejs js-mdict, 实现在线查询英语单词 1. 项目结构 首先,创建一个项目目录,结构如下: mydict-app/ ├── public/ │ ├── index.html │ ├── st…

23.Word:小王-制作公司战略规划文档❗【5】

目录 NO1.2.3.4 NO5.6​ NO7.8.9​ NO10.11​ NO12​ NO13.14 NO1.2.3.4 布局→页面设置对话框→纸张:纸张大小:宽度/高度→页边距:上下左右→版式:页眉页脚→文档网格:勾选只指定行网格✔→ 每页:…

联想拯救者R720笔记本外接显示屏方法,显示屏是2K屏27英寸

现在某品牌的13/14代(CPU是13或14开头)CPU缩肛有设计质量问题、CPU容易氧化易损坏易蓝屏等问题,现在大家买笔记本或台式电脑请不要考虑这两代CPU,或考虑AMD的CPU。 晚上23点10分前下单,第二天上午显示屏送到&#xff…

从0到1:C++ 开启游戏开发奇幻之旅(二)

目录 游戏开发核心组件设计 游戏循环 游戏对象管理 碰撞检测 人工智能(AI) 与物理引擎 人工智能 物理引擎 性能优化技巧 内存管理优化 多线程处理 实战案例:开发一个简单的 2D 射击游戏 项目结构设计 代码实现 总结与展望 游戏…

QT简单实现验证码(字符)

0) 运行结果 1) 生成随机字符串 Qt主要通过QRandomGenerator类来生成随机数。在此之前的版本中,qrand()函数也常被使用,但从Qt 5.10起,推荐使用更现代化的QRandomGenerator类。 在头文件添加void generateRandomNumb…

C++,STL 命名空间:理解 std 的作用、规范与陷阱

文章目录 引言一、为什么需要 std 命名空间?二、std 命名空间的组成三、使用 std 命名空间的正确姿势1. 显式作用域限定2. 谨慎使用 using 声明3. 头文件中禁止 using namespace std 四、常见陷阱与解决方案陷阱 1:与第三方库命名冲突陷阱 2:…

UE5 GAS RPG Character Classes

在正常的游戏中,我们应该考虑如何去初始化角色属性,并且要给角色分好类型。比如,在我们游戏中,我们如何去初始化小兵的属性,并且还要实现小兵随着等级的增长而增加属性。而且就是小兵也有类型的区分,比如我…

RRT_STAR路径规划代码

这是一段使用MATLAB编写的代码,实现了一个基于RRT*(Rapidly-exploring Random Trees Star)算法的路径规划。RRT*是一种用于在配置空间中搜索路径的采样算法,常用于机器人路径规划等领域。以下是代码的主要功能和结构: …

常见“栈“相关题目

找往期文章包括但不限于本期文章中不懂的知识点: 个人主页:我要学编程(ಥ_ಥ)-CSDN博客 所属专栏: 优选算法专题 目录 1047.删除字符串中的所有相邻重复项 844.比较含退格的字符串 227.基本计算器 II 394.字符串解码 946.验证栈序列 104…

窥探目标文件

文章目录 源文件如何变成可执行文件编译链接目标文件格式ELF文件格式节表重定位表(.rela)符号表(.symtab)符号(链接的接口)强符号与弱符号强引用与弱引用符号表表项符号类型和绑定信息符号所在段其他节源文件如何变成可执行文件 CPU只能执行二进制指令,无法执行用户直接编写的…

22.Word:小张-经费联审核结算单❗【16】

目录 NO1.2 NO3.4​ NO5.6.7 NO8邮件合并 MS搜狗输入法 NO1.2 用ms打开文件,而不是wps❗不然后面都没分布局→页面设置→页面大小→页面方向→上下左右:页边距→页码范围:多页:拼页光标处于→布局→分隔符:分节符…

java求职学习day23

MySQL 单表 & 约束 & 事务 1. DQL操作单表 1.1 创建数据库,复制表 1) 创建一个新的数据库 db2 CREATE DATABASE db2 CHARACTER SET utf8; 2) 将 db1 数据库中的 emp 表 复制到当前 db2 数据库 1.2 排序 通过 ORDER BY 子句 , 可以将查询出的结果进行排序 ( 排序只…

你了解哪些Java限流算法?

大家好,我是锋哥。今天分享关于【你了解哪些Java限流算法?】面试题。希望对大家有帮助; 你了解哪些Java限流算法? 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 Java 中常用的限流算法主要有以下几种,它们广泛应用于处理流量控…

【HarmonyOS之旅】基于ArkTS开发(三) -> 兼容JS的类Web开发(二)

目录 1 -> HML语法 1.1 -> 页面结构 1.2 -> 数据绑定 1.3 -> 普通事件绑定 1.4 -> 冒泡事件绑定5 1.5 -> 捕获事件绑定5 1.6 -> 列表渲染 1.7 -> 条件渲染 1.8 -> 逻辑控制块 1.9 -> 模板引用 2 -> CSS语法 2.1 -> 尺寸单位 …

51单片机CLD1602显示万年历+闹钟+农历+整点报时

1. 硬件设计 硬件是我自己设计的一个通用的51单片机开发平台,可以根据需要自行焊接模块,这是用立创EDA画的一个双层PCB板,所以模块都是插针式,不是表贴的。电路原理图在文末的链接里,PCB图暂时不选择开源。 B站上传的…

CSS核心

CSS的引入方式 内部样式表是在 html 页面内部写一个 style 标签&#xff0c;在标签内部编写 CSS 代码控制整个 HTML 页面的样式。<style> 标签理论上可以放在 HTML 文档的任何地方&#xff0c;但一般会放在文档的 <head> 标签中。 <style> div { color: r…

具身智能体空间感知基础!ROBOSPATIAL:评测并增强2D和3D视觉语言模型空间理解水平

作者&#xff1a;Chan Hee Song, Valts Blukis,Jonathan Tremblay, Stephen Tyree, Yu Su, Stan Birchfield 单位&#xff1a;俄亥俄州立大学&#xff0c;NVIDIA 论文标题&#xff1a;ROBOSPATIAL: Teaching Spatial Understanding to 2D and 3D Vision-Language Models for …