云安全博客阅读（三）

云安全博客阅读（三）

news/2025/1/9 17:15:45/文章来源:https://blog.csdn.net/weixin_43783814/article/details/145017939

WAF强固之盾：机器学习赋能下的语义分析

WAF 中，传统的基于正则的检测方法依赖正则的运营更新，以不断防护新的攻击方法；

主要流程为：HTTP包 -> payload解码 -> 正则匹配

但是，攻击者可以通过修改攻击载荷、使用编码技术、绕过常规规则等方式来规避正则表达式的检测，同时传统正则匹配也有上下文长度的限制；

因此，采用语义分析和机器学习结合的方式能够增强攻击检测能力，并预防一些未出现过的攻击类型；

先从语义分析角度入手，其主要流程为
HTTP包 -> payload词法分析 -> payload语法分析 -> 检测评分

和基于正则匹配的检测方法，主要区别在于：

payload词法分析：以词法状态机的形式，从预处理后的token流中，识别出有独立意义的单元序列，如关键字、标识符、运算符、常量和分隔符等；
payload语法分析：将词法单元序列，按照语法规则进行组织和解释，构建出抽象语法树AST；
构造出AST后，对抽象语法树进行遍历，进行类型检查、符号表管理、作用域规则检查等操作，以验证合法性并进行评分；

可见，相较于以往“粗暴”的正则匹配方法，语义分析能够挖掘出攻击背后的实际意义，拦截能力更强并减少误报（如粗暴拦截select关键字等正则）；

在此基础上，可以将语义分析的特征和payload原始特征结合起来，构建机器学习模型，进一步检测攻击；这使得模型可以关注更全面的信息，同时利用原始特征（关键字）和语义特征（语法）；

机器学习模型

对于针对WAF场景的机器学习模型，可以考虑 Word2Vec + Classification 的模式构建，具体来说：

Word2Vec 将 payload token 序列转为 number 序列，供分类模型学习，模型的学习可以用 n-gram 等经典算法实现，构建具有“相近语义则序号相近”特征的词典；
Classification 分类模型可以使用如 SVM 等经典算法实现，并且使用 boost 等方式进行优化训练；
Word2Vec 和 Classification 模型是分离的，可以基于大量无标签数据训练一个语义丰富的 Word2Vec，而滚动更新 Classification 模型的训练；

https://github.com/li-car-fei/WAF-AI

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/504221.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

个人博客搭建(二)—Typora+PicGo+OSS

个人博客搭建(二)—Typora+PicGo+OSS

个人博客站—运维鹿: http://www.kervin24.top CSDN博客—做个超努力的小奚： 做个超努力的小奚-CSDN博客一、前言博客搭建完一直没有更新，因为WordPress自带的文档编辑器不方便，以前用CSDN写作的时候，习惯了Typora。最近对比了…

阅读更多...

spring boot 集成 knife4j

spring boot 集成 knife4j

1、knife4j介绍以及环境介绍 knife4j是为Java MVC框架集成Swagger生成Api文档的增强解决方案,前身是swagger-bootstrap-ui,取名knife4j是希望它能像一把匕首一样小巧,轻量,并且功能强悍!其底层是对Springfox的封装，使用方式也和Springfox一致，只是对接口…

阅读更多...

案例解读 | 香港某多元化综合金融企业基础监控+网管平台建设实践

案例解读 | 香港某多元化综合金融企业基础监控+网管平台建设实践

PART01 项目背景 01客户简介案例客户是一家创立20多年的香港某多元化综合金融企业，其业务范围涵盖证券、期货、资产管理、财富管理等，凭借广泛的业务网络和多元化的金融服务产品，在市场中拥有显著的影响力。02痛点分析随着业务版图的持续拓展…

阅读更多...

KCP解读：C#库类图

KCP解读：C#库类图

本文是系列文章中的一篇，内容由浅到深进行剖析，为了方便理解建议按顺序一一阅读。 KCP技术原理 KCP解读：基础消息收发 KCP解读：重传机制 KCP解读：滑动窗口 KCP解读：拥塞控制本系列的源码基于https://gith…

阅读更多...

Nginx：Stream模块

Nginx：Stream模块

什么是 Stream 模块？ Stream 模块是 Nginx 的一个核心模块，专为处理非 HTTP 协议的流量（TCP 和 UDP 流量）而设计。它可以用来负载均衡和代理 TCP 或 UDP 连接，适用于多种应用场景，如：数据库集群（MySQL、PostgreSQL 等）邮件服务器（SMTP、IMAP、POP3）游戏服务器VoI…

阅读更多...

Profinet转EtherNet/IP网关连接AB PLC的应用案例

Profinet转EtherNet/IP网关连接AB PLC的应用案例

某大型制造企业的生产车间同时采用了西门子 S7 - 1500 PLC 作为核心控制系统的一部分，负责主要生产流程的控制与数据处理；而在特定生产环节，由于历史设备遗留或工艺配套需求，存在使用 AB PLC 的情况。这就导致了在整个自动化生产系…

阅读更多...

arcgisPro加载CGCS2000天地图后，如何转成米单位

arcgisPro加载CGCS2000天地图后，如何转成米单位

1、导入加载的天地图影像服务，一开始是经纬度显示的。 2、右键地图，选择需要调整的投影坐标，这里选择坐标如下： 3、点击确定后，就可以调整成米单位的了。 4、切换后结果如下： 如有需要，可调整成…

阅读更多...

2025新春烟花代码（二）HTML5实现孔明灯和烟花效果

2025新春烟花代码（二）HTML5实现孔明灯和烟花效果

效果展示源代码 <!DOCTYPE html> <html lang"en"> <script>var _hmt _hmt || [];(function () {var hm document.createElement("script");hm.src "https://hm.baidu.com/hm.js?45f95f1bfde85c7777c3d1157e8c2d34";var …

阅读更多...

机器人技术：ModbusTCP转CCLINKIE网关应用

机器人技术：ModbusTCP转CCLINKIE网关应用

在当今自动化生产与智能制造领域，ModbusTCP转CC-LinkIE网关KJ-MTCPZ-CCIES的应用正日益成为提升生产效率、实现设备间高效通信的重要技术手段。这一转换技术不仅打破了不同通信协议间的壁垒，还为机器人产品的应用提供了更为广阔的舞台。ModbusTCP作为一种…

阅读更多...

Openwrt @ rk3568平台固件编译实践（二）- ledeWRT版本

Openwrt @ rk3568平台固件编译实践（二）- ledeWRT版本

目录 ledeWRT介绍固件编译下载代码修改feed源更新并安装编译第三方软件包制作用于eMMC烧写的rootfs基于lede发行版验证烧写rk3568.img, LEDE wrt启动成功refhttps://blog.csdn.net/zc21463071/article/details/106751361介绍rk3568平台下， lede 大神版 openwrt固件的下载、编译…

阅读更多...

【linux系统之redis6】redisTemplate的使用方法

【linux系统之redis6】redisTemplate的使用方法

新版本的application.yml配置文件 spring:data:redis:host: 192.168.1.102port: 6379lettuce:pool:max-active: 8min-idle: 1max-idle: 0max-wait: 100redisTemplate使用方法 <dependencies><dependency><groupId>org.springframework.boot</groupId>…

阅读更多...

【算法】字符串算法技巧系列

【算法】字符串算法技巧系列

阿华代码，不是逆风，就是我疯你们的点赞收藏是我前进最大的动力！！ 希望本文内容能够帮助到你！！ 目录引入：字符串相关算法技巧 1：字符串转数组 2：子字符串 3&#xff…

阅读更多...

掌握正则表达式：从入门到精通的实战指南

掌握正则表达式：从入门到精通的实战指南

文章目录 🌍一.正则表达式❄️1.为什么学习正则表达式❄️ 2.基本介绍❄️3.分析底层实现 🌍二.正则表达式的语法❄️1.字符匹配❄️2.量词❄️3.定位符4.分组和引用❄️6.非贪婪匹配❄️7.分支结构❄️实际应用 🌍 三.正则标表达式的三个常用…

阅读更多...

leetcode 5. 最长回文子串

leetcode 5. 最长回文子串

题目如下本题可以这么来想设有一个回文串s"112211"当我们去掉左右两边的"1"时s任然是回文串。反过来说现有字符串 "x1221y"(x,y都是未知字符)当且仅当x y时这个字符串是回文串。故我们可以令i j为某一个字符串的左右两端然后有如下情况: i…

阅读更多...

BoltzGnu Boltztrap数据绘图脚本

BoltzGnu Boltztrap数据绘图脚本

BoltzGnu包含四个Gnuplot脚本，允许绘制BoltzTraP输出数据。下载网址： https://github.com/K4ys4r/BoltzGnu 1. pTRACE_E.gp -> To plot Trasport proporties as a function of energy at define Temperature2. pTRACE_E_multT.gp -> To pl…

阅读更多...

AIA - APLIC之三（附APLIC处理流程图）

AIA - APLIC之三（附APLIC处理流程图）

本文属于《 RISC-V指令集基础系列教程》之一，欢迎查看其它文章。 1 APLIC复位 APLIC复位后，其所有状态都变得有效且一致，但以下情况除外：每个中断域的domaincfg寄存器（spec第 4.5.1 节）；可能是machine-level interrupt domain的MSI地址配置寄存器（spec第4.5.3 和4.5…

阅读更多...

【MySQL】深度学习数据库开发技术：使用CC++语言访问数据库

【MySQL】深度学习数据库开发技术：使用CC++语言访问数据库

**前言：**本节内容介绍使用C/C访问数据库， 包括对数据库的增删查改操作。主要是学习一些接口的调用， 废话不多说， 开始我们的学习吧！ ps:本节内容比较容易， 友友们放心观看哦！ 目录准备mysql…

阅读更多...

微信小程序map组件所有markers展示在视野范围内

微信小程序map组件所有markers展示在视野范围内

注意：使用include-points属性不生效，要通过createMapContext实现 <template><view class"map-box"><map id"map" class"map" :markers"markers" :enable-traffic"true" :enable-poi&…

阅读更多...

全新免押租赁系统打造便捷安全的租赁体验

全新免押租赁系统打造便捷安全的租赁体验

内容概要全新免押租赁系统的推出，标志着租赁行业的一次重大变革。这个系统的最大特点就是“免押金”，大大减轻了用户在租赁过程中的经济负担。从此，不再需要为一部手机或其他商品支付高昂的押金，用户只需通过简单的信用评估&…

阅读更多...

【C++】B2106 矩阵转置

【C++】B2106 矩阵转置

博客主页： [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: C 文章目录 💯前言💯题目解析💯第一种实现方式：我的初始做法实现思路优缺点分析 💯第二种实现方式：我的优化做法实现思路优缺点分析 &#x1f4a…

阅读更多...

最新文章

推荐文章