使用DeepSeek/chatgpt等AI工具辅助网络协议流量数据包分析

随着deepseek,chatgpt等大模型的能力越来越强大,本文将介绍一下deepseek等LLM在分数流量数据包这方面的能力。为需要借助LLM等大模型辅助分析流量数据包的同学提供参考,也了解一下目前是否有必要继续学习wireshark工具以及复杂的协议知识。

pcap格式

目前来说直接将pcap传入大模型的效果不佳,例如deepseek目前不支持pcap格式,如下:
在这里插入图片描述
chatgpt目虽然不限制上传的格式,但是不支持像wireshark那样进行解码,以及对于解码的内容深度的分析,如下:
在这里插入图片描述
如果知道如何让大模型直接分析pcap方法的同学可以进行评论探讨。对于知道大模型不支持对于pcap深度分析原因的也可以评论。

图片格式

由于目前deepseek等大模型都是支持图片分析的,因此可以截取wireshark的图片,进行识别。如下截图反映了一条SMB协议交互的过程:
在这里插入图片描述
对该图片的分析如下:

在这里插入图片描述
可以看到在图片识别以及内容推理这块,大模型还是很强大,基本概括了SMB协议交互过程中重要的信息。

但是上述图片中缺乏数据包的细节,如下SMB文件中某一个数据包请求的细节:
在这里插入图片描述
如下是针对协议细节的识别分析:
在这里插入图片描述
基本也能给出协议的细节理解。

但是图片的问题在于包含的信息有限,毕竟一条流上包含大量的数据包,需要截取大量的图片,如此一来效率直接降低,因此图片的方法只适合于关键问题的问答或者一些图片格式的应用场景。

文本格式

文本格式有两种,hex dump格式和json格式。两种格式各有优缺点,如下:

  • hex dump格式导出的文件小,但是存储的是二进制,因此每一层的协议解析依赖于deepseek等大模型的能力,对于IP,TCP等常见二进制协议以及HTTP等文本协议来说,这部分的解析能力通常没有问题,但是与SMB,RDP等二进制协议来说,大模型在这方面的能力比较偏弱。
  • json格式由于包含了很多字段的文本信息,因此导出的文件比较大,对于大模型来说数据量太多。但是由于json格式会将wireshark能够解析的字段内容详尽输出,因此json格式的文件就是wireshark能力的副本,能够给大模型提供的信息比较丰富,有助于大模型全面的理解。

关于pcap转文本的方法,详见CSDN博主村中少年的专栏文章《Pcap网络数据包处理方法大全
》,这里。

HTTP

使用的示例数据包为HTTP协议,下载详见这里

hexdump

导出hex dump格式的数据示例如下:
在这里插入图片描述
使用deepseek分析如下:

在这里插入图片描述
可以看到对于HTTP协议的内容,由于其本身是文本协议,所以deepseek则能够非常直观的解析和理解,并且能够解压缩。虽然请求和响应部分展示的并不完整,但是基本上展示了HTTP以及TCP等协议主要内容。

json

导出json格式的数据示例如下:
在这里插入图片描述
使用deepseek分析如下:
在这里插入图片描述
整体来说由于json格式提供更为直接的内容,因此在相同提示词的情况下对于json格式的理解,deepseek等大模型也是更加的深入和彻底。输出的结果更为的丰富,总的来说对于文本协议的HTTP来说差别较小。

SMB

使用的示例数据包为SMB协议,下载详见这里。

hexdump

其中hexdump格式使用deepseek分析如下:
在这里插入图片描述
可以看出这块由于文件较大,对于文件内容识别就有限了,毕竟更多的内容消耗更多的算力,这块想要更加全面的分析,需要进行付费了。同时发现deepseek对于免费用户频繁传输文件也是有限制的,不够友好,

json

其中json格式使用deepseek分析如下:
在这里插入图片描述SMB等二进制协议的结果更加的明显,deepseek由于从json格式直接获取的信息比值hexdump更加的丰富,因此给出总结性的信息更多。

同时可以看到json文件内容更大,字符串更多,读取的内容更加的少。总的来说目前deepseek等大模型存在着内容数量上的限制,想要免费的分析一条完整的流往往不现实的。

结论

不能直接上传所有的信息,只适合上传某一个数据包的信息供大模型进行识别。

所以在流量分析这块仍然需要熟练的使用wireshark工具以及学习协议知识,deepseek等大模型工具可以辅助我们分析和学习其中的某些还不是特别清楚的点,想要完全依赖大模型,无论是本地的模型还是云端的模型,都需要大量的算力和token,意味着更多的钱,另一方面在流量分析这块大模型仍然没有发现赶超熟练的流量分析人员。虽然可以继续的提示,但是应用大模型的本意是提升效率,一味的提示反而效率降低。

因此仍然需要学习SMB数据包的分析技巧,详见CSDN村中少年专栏《SMB攻击流量数据包分析》专栏,这里,专栏《Wireshark从入门到精通
》,这里。

上述就是针对使用DeepSeek/chatgpt等AI工具辅助网络协议流量数据包分析f的介绍,希望对你有所帮助。

本文为CSDN村中少年原创文章,未经允许不得转载,博主链接这里。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/24887.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】CentOS7停服之后配置yum镜像源

🙋大家好!我是毛毛张! 🌈个人首页: 神马都会亿点点的毛毛张 毛毛张今天分享一个CentOS7系统停服之后,配置yum镜像源的步骤,有坑! 文章目录 1.概述2.查看系统架构2.1 查看内核版本2.2 查看lin…

2025-02-26 学习记录--C/C++-C语言 整数格式说明符

合抱之木,生于毫末;九层之台,起于累土;千里之行,始于足下。💪🏻 C语言 整数格式说明符 【例如 】🎀 :在 C 语言中,%ld 是 printf 或 scanf 等格式化输入输出函…

OpenAI开放Deep Research权限,AI智能体大战升级,DeepSeek与Claude迎来新对决

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

个人电脑小参数GPT预训练、SFT、RLHF、蒸馏、CoT、Lora过程实践——MiniMind图文版教程

最近看到Github上开源了一个小模型的repo,是真正拉低LLM的学习门槛,让每个人都能从理解每一行代码, 从零开始亲手训练一个极小的语言模型。开源地址: GitHub - jingyaogong/minimind: 🚀🚀 「大模型」2小时…

【数据结构】顺序表和链表

线性表 线性表 (linear list)是n个具有相同特性的数据元素的有限序列。线性表是一种在实际中广泛使用的数据结构,常见的线性表:顺序表、链表、栈、队列、字符串 ….. 线性表在逻辑上是线性结构,也就说是连续的一条直线。但是在物理结构上并不一定是连续的,线性表在物理上存储时…

一文讲解Redis的内存淘汰和过期策略

Redis 报内存不足怎么处理? Redis 内存不足有这么几种处理方式: 修改配置文件 redis.conf 的 maxmemory 参数,增加 Redis 可用内存 也可以通过命令 set maxmemory 动态设置内存上限 修改内存淘汰策略,及时释放内存空间 使用 R…

游戏引擎学习第125天

仓库:https://gitee.com/mrxiao_com/2d_game_3 回顾并为今天的内容做准备。 昨天,当我们离开时,工作队列已经完成了基本的功能。这个队列虽然简单,但它能够执行任务,并且我们已经为各种操作编写了测试。字符串也能够正常推送到队…

【UCB CS 61B SP24】Lecture 16 - Data Structures 2: ADTs, BSTs学习笔记

本文首先介绍了抽象数据类型与树的概念,接着重点讲解二叉搜索树的定义与操作方式,并用 Java 实现一个标准的二叉搜索树结构。 1. 抽象数据类型 首先引入一个概念叫做抽象数据类型(Abstract Data Type,ADT)&#xff0…

包子凑数——蓝桥杯真题Python

包子凑数 输入输出样例 示例 1 输入 2 4 5输出 6样例说明 凑不出的数目包括:1, 2, 3, 6, 7, 11。 示例 2 输入 2 4 6输出 INF样例说明 所有奇数都凑不出来,所以有无限多个 运行限制 最大运行时间:1s最大运行内存: 256M 最大公约数 最大公…

一周学会Flask3 Python Web开发-Jinja2模版中加载静态文件

锋哥原创的Flask3 Python Web开发 Flask3视频教程: 2025版 Flask3 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili 一个Web项目不仅需要HTML模板,还需要许多静态文件,比如 CSS、JavaScript文件、图片以及音频等。在Fla…

Python的那些事第三十二篇:用于创建静态、动画和交互式可视化的绘图库Matplotlib

Matplotlib:用于创建静态、动画和交互式可视化的绘图库 摘要 Matplotlib 是一个广泛使用的 Python 绘图库,能够创建静态、动画和交互式可视化图表。本文首先介绍了 Matplotlib 的基本功能和架构,然后通过具体的示例代码展示了如何使用 Matplotlib 创建不同类型的图表。接着…

tableau之雷达图和凹凸图

一、雷达图 概念 雷达图(Radar Chart),也称为蜘蛛网图(Spider Chart)或星状图(Star Chart),是一种用于多变量数据可视化的图表。它以中心点向外辐射的轴线表示不同的变量&#xff…

Redis-列表结构实操

列表实操 前言简单练习基本的LPUSH和RPUSH操作列表元素的访问与修改列表元素的插入和删除列表阻塞操作 困难练习分页列表游标机制业务上考虑直接访问任意页如何高效分页局限性小结 实现限时排行版轮换消息队列可靠性实现分布式锁实现 总结 前言 之前总结过-列表的数据结构,但是…

SpringBoot 2 后端通用开发模板搭建(异常处理,请求响应)

目录 一、环境准备 二、新建项目 三、整合依赖 1、MyBatis Plus 数据库操作 2、Hutool 工具库 3、Knife4j 接口文档 4、其他依赖 四、通用基础代码 1、自定义异常 2、响应包装类 3、全局异常处理器 4、请求包装类 5、全局跨域配置 补充:设置新建类/接…

实现Python+Django+Transformers库中的BertTokenizer和BertModel来进行BERT预训练,并将其应用于商品推荐功能

一、环境安装准备 #git拉取 bert-base-chinese 文件#创建 虚拟运行环境python -m venv myicrplatenv#刷新source myicrplatenv/bin/activate#python Django 集成nacospip install nacos-sdk-python#安装 Djangopip3 install Django5.1#安装 pymysql settings.py 里面需要 # 强制…

Rk3568驱动开发_点亮led灯代码完善(手动挡)_6

1.实现思路: 应用层打开设备后通过write函数向内核中写值,1代表要打开灯,0代表要关闭灯 Linux配置gpio和控制gpio多了一个虚拟内存映射操作 2.注意事项: 配置和读写操作的时候要谨慎,比如先关掉gpio再注销掉虚拟内存…

线性回归(一)基于Scikit-Learn的简单线性回归

主要参考学习资料: 《机器学习算法的数学解析与Python实现》莫凡 著 前置知识:线性代数-Python 目录 问题背景数学模型假设函数损失函数优化方法训练步骤 代码实现特点 问题背景 回归问题是一类预测连续值的问题,满足这样要求的数学模型称作…

P10108 [GESP202312 六级] 闯关游戏

题目大意 如题 分析 设最佳通关方案为 { s 1 , s 2 , . . . , s k } \{s_1,s_2,...,s_k\} {s1​,s2​,...,sk​},其中 s i s_i si​ 代表第 i i i 次到达的关卡( ≥ N \ge N ≥N 的不算)。 当 a k N − 1 a_kN-1 ak​N−1 时&#…

vllm的使用方式,入门教程

vLLM是一个由伯克利大学LMSYS组织开源的大语言模型推理框架,旨在提升实时场景下的大语言模型服务的吞吐与内存使用效率。以下是详细的vLLM使用方式和入门教程: 1. 前期准备 在开始使用vLLM之前,建议先掌握一些基础知识,包括操作…

web的分离不分离:前后端分离与不分离全面分析

让我们一起走向未来 🎓作者简介:全栈领域优质创作者 🌐个人主页:百锦再新空间代码工作室 📞工作室:新空间代码工作室(提供各种软件服务) 💌个人邮箱:[1504566…