【研究型论文】基于 stacking 和多特征融合的加密恶意流量检测研究(中文论文)

文章目录

  • 基于 stacking 和多特征融合的加密恶意流量检测研究
    • 摘要
    • 解决的问题
    • 1. 特征提取
    • 2. 模型框架DMMFC
    • 3. 整体流程
    • 4. 结论
    • 总结
      • 论文优点
      • 论文缺点
    • 用到的工具和数据集

基于 stacking 和多特征融合的加密恶意流量检测研究

摘要

加密技术保护网络通信安全的同时,大量恶意软件也采用加密协议来隐藏其恶意行为,传统的基于
有效负载和深度包检测的方法已经不再适用。针对已有基于机器学习 TLS 加密恶意流量检测存在单模型检测算法对多粒度特征适用性差和混合流量检测误报率高的问题,提出了基于 stacking 策略和多特征融合的非解密 TLS 加密恶意流量检测方法

分析了加密恶意流量特征多粒度的特点,提取流量的流特征连接特征TLS 握手特征。对所提取的特征利用特征工程进行规约处理,进而减少计算开销。对规约处理后的 3类特征分别建立随机森林、XGBoost 和高斯朴素贝叶斯分类器模型学习隐藏在流量内部的规律。

使用流指纹融合处理后的多维特征,通过 stacking 策略组合 3 个分类器,构成 DMMFC 检测模型来识别网络中的TLS 加密恶意流量。

利用 CTU-13 公开数据集对构建的模型进行性能评估。实验结果表明,该方法在二分类实验上识别召回率高达 99.90%,恶意流量检测的误报率低于 0.10%,能够有效的检测非解密的 TLS 加密恶意流量。

解决的问题

  1. 单模型检测算法对多粒度特征适用性差
  2. 加密与非加密混合流量检测误报率高

1. 特征提取

(1)获取三种类型的流量特征

  1. 流特征:流特征是通过分析 OSI 协议第 3 层和第 4 层之间的网络流量。收集了100维度。
  2. 连接特征:连接特征子集由 DNS 响应、HTTP 和 TLS 握手特征构成。收集了21维度。
  3. 证书特征:证书特征子集包括括‘issuer’,‘subject’和‘ciphersuites’。

(2)特征降维

  1. 使用随机森林获取流特征重要性权重,当最低阈值为0.01时,随机森林F1值效果最好,此时流特征维度降为28维。
    在这里插入图片描述

  2. 连接特征进行PCA降维,当累计特征贡献率为0.9时,XGBoost的F1值效果最好,特征降为4维度,与TLS表示特征拼接,构成7维特征。
    在这里插入图片描述

  3. 证书特征进行PCA降维,当累计特征贡献率为0.8时,GNB的F1值效果最好,特征降为28维度。
    在这里插入图片描述

2. 模型框架DMMFC

DMMFC框架是一个stacking集成架构。第一层的三个基学习器为随机森林,XGBoost和GNB,第二层的基学习器为单层逻辑回归模型。

DMMFC检测模型采用五折交叉验证的方式进行训练
在这里插入图片描述

3. 整体流程

在这里插入图片描述

4. 结论

在这里插入图片描述

总结

论文优点

  1. 该方法达到了 99.13%的召回率和 0.05%的误报率,TLS 加密流量检测检出率接近 100%。
  2. 所提取的特征克服了深度学习自动挑选的特征不具备普适性的缺点
  3. DMMFC 检测模型性能优于单一机器学习模型,抗数据敏感性更强

论文缺点

  1. 数据集CTU-13是2011年的公开数据集,时间较早。所提的检测模型不一定能检测现在的恶意流量
  2. 该研究中使用的数据集正常流量与恶意流量在同一数量级上,但是实际场景中通常正常流量要远远多于异常流量,在这种情况下,该模型的泛化能力没有在论文中提到。

用到的工具和数据集

工具:Zeek:对流量包做预处理并进行特征提取
数据集:CTU-13 公开数据集

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/47708.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

三大强者效应:鲶鱼效应,鳄鱼效应,鲦鱼效应

足球巨星梅西曾经说过:“这个世界没有谁,生来就是强者。”每个人都渴望成功,可人生之路曲折坎坷,大部分人追逐一生都求而不得。其实,让自己变强大并没有想象那么难。鸟有鸟迹,鱼有鱼道,强者也自…

让工作效率提升10倍:十大AIGC工具评测【建议收藏】

AI技术的普及已经在近年来不断增长。这种技术已经改变了我们与电脑的互动方式,让我们能够更高效、更自然地完成任务。本文将展示10个基于ChatGPT和GPT-3 AI模型构建的最强大的资源,使您更容易充分利用它们的潜力。因此,如果您想利用AI技术改进…

如何设计 CTA 按钮:用户体验最佳实践

什么是 CTA,当它们无效时会发生什么? CTA(号召性用语)是促使用户在应用程序或网站上做某事的链接或按钮。例如,在电子商务网站上,访问者被推送到“购买”产品或至少“将[它们]添加到购物车”,而…

必应聊天周报:导出聊天历史、可视化图表效果等

文章目录 目录 文章目录 序言 聊天历史 可视化图 导出 视频悬 优化食谱答案 修复分享部分问题 提高自动推荐质量 改进了 Edge 侧边栏的隐私 序言 微软必应官方今天发布博文,汇总了在过去 1 周时间里,为必应聊天(Bing Chat&#x…

初识Embodied AI

Do not blindly trust anything I say, try to make your own judgement. 目录 1. Definition 2. Survey 3. Summary 3. Reference 1. Definition 1) Internet AI: 用互联网数据比如wiki, youtube等预训练大模型(foundation model),然后将预训练的大模型应用到…

你知道会议录音识别怎么弄吗

平时工作的时候,有些朋友需要将录音转化成文字。例如,在会议上做记录的时候,有时会因为会议内容太多而跟不上,所以我们通常会选择录音的方式对会议过程进行记录,再将录音内容识别成文字,这样可以极大地提升…

会议记录怎样做得又快又好?一分钟学会录音转文字

最近有几个朋友问我会议记录要怎么记才能又快又好的问题,经验之谈,领导大会小会不断,作为助理,会议记录不仅是基本功,更是升职加薪的重要评判,以下分享我做会议记录的方法。 首先,遵照会议记录要…

java 调用科大讯飞 实现会议录音,语音转写会议既要功能

功能要求:使用java 调用科大讯飞 实现会议录音,语音转写会议既要功能。 科大讯飞官网有api,还有具体的实例,可以实现关于语音需求的大部分功能。地址如下: https://www.xfyun.cn/doc/platform/quickguide.html。 先注册…

关于语音会议自动记录的大概设计思路

关于语音会议的大概设计草图如下: 根据流程图可以看出,我一共分了六个模块分别命名为: A_preprocessor(预处理器):用来对音频进行预处理A_file_store(文件存储):用来管理…

还在找会议纪要录音转文字软件哪个好?

音频转文字是一项非常便利和实用的技术。无论是学习教育、会议记录、新闻传播还是法律领域,都可以通过使用该技术更好地记录和整理相关内容,提高效率和准确度。那么你知道录音文件转文字软件哪个好吗?这篇文章给你推荐三款非常好用的录音文件…

语音识别会议级别

人工智能的会议没有专注于语音领域的,语音算是ai的一个实际应用方向吧,所以也能投ai的会议和期刊 列一下自然语言处理(NLP)这个小方向的: 会议(C): EMNLP (Empirical Methods in Natural Language Processing) A EACL (Annual Conference of the Eu…

【实战】一文讲透ChatGPT最新功能Custom Instructions

收录于 AI实战教程 合集 嗨,又见面啦!😎 我们来更一篇最近大家非常关心的,但很多小伙伴找不到入口,和落地教程的,ChatGPT的最新功能Custom Instructions的实战贴~ 北京时间2023-07-21,Openai…

外贸网站最新的英文在线跟踪聊天咨询管理软件

十几年前,有了解外贸英文网站上的在线跟踪聊天咨询及简单管理软件;当时觉得只需要Email就可以了。老外必竟常用Email,网页上留Email, 老外就可以联系到我们。 当时也出现很多英文版的在线跟踪聊天咨询软件,且都是免费提供&#xf…

SAP-MM-内向外向交货单

1、内向&外向交货单概念 外向交货(outbound delivery)是用在客户与企业之间的交货单,而内向交货(inbound delivery)则是用在供应商与企业之间的交货单;换言之,外向交货多用于SD 模块&#…

SAP 内向交货单介绍

SAP 内向交货单介绍 外向交货(outbound delivery)是用在顾客与企业之间的交货单,而内向交货(inbound delivery)则是用在供应商与企业之间的交货单;换言之,外向交货多用于SD 模块,而…

十个数字,看懂AI现状

这十个代表性数字从不同的角度切入,揭示了AI的发展现状和潜力。 AI作为当今世界的热门话题,正在引领着我们进入一种全新的智能时代。但是,很多人对AI的认识还停留在表面,并不了解AI是怎样逐渐渗透到我们的生活和工作中&#xff0c…

BFT 最前线 | 谷歌举办 I/O 23 发布会,对标必应,百度搜索小范围公测对话功能,盖茨称AI利大于弊

文 | BFT机器人 01 谷歌举办 I/O 23 发布会,以 AI 为核心发布一系列新工具 北京时间 5 月 11 日凌晨,谷歌举办了今年的 Google I/O 开发者大会。比起去年,强调「整合全球信息,使人人都能从访问中受益」的使命,谷歌 CEO…

针对小度在家的设备分析(以1C为例,非破解)

概述 语音类的机器人已经接触和分析了很多了,但百度出的类似产品没有写过! 主要是没有机会接触到实体的机器,大写的尴尬。 因对接的需要,特申请了一台,那就借此机会把玩一下吧。 拆机的部分请移步他处,…

【两天搞定小米商城】【第四步】小米商城之左边导航和右边轮播图部分

效果图&#xff1a; &#xff08;图片文字方面还是老风格&#xff0c;重复重复再重复&#xff0c;小伙伴们也可以尝试把官网的内容如实填充~&#xff09; HTML: <!-- banner开始 --><div class"banner"><div class"wrap"><div class…

“小度小度”开启AI硬件的“量贩”时代

2020年我们经历了很多事情&#xff0c;而这些经历正在深刻影响到众多科技市场&#xff0c;甚至作用于AI产业的底层规律。 例如说&#xff0c;疫情中AI抗疫的身影让这门技术成为社会明星&#xff1b;更多宅在家里的闲暇时间让我们更喜欢琢磨硬件和产品&#xff1b;对家人的惦念&…