性能问题分析排查思路之机器(3)

本文是性能问题分析排查思路的展开内容之一,第2篇,主要分为日志1期,机器4期、环境2期共7篇系列文章,本期是第三篇,讲机器(硬件)的网络方面的排查方法和最佳实践。

主要内容如图所示:

本文内容主要涉及一个网络本命工具netstat、网络的延迟、抖动和丢包率查看、流量与网络带宽上限查询、链路分析、TCP连接数检测和与网络相关的常见异常,通过这些工具和方法可了解网络的主要指标表现。

本命工具netstat

Netstat是一个控制台命令,用于显示与IP、TCP、UDP和ICMP协议相关的统计数据,它是一个强大的网络工具,可帮助用户监视网络活动、查找与网络相关的问题,并提供有关网络连接的详细信息。
Netstat命令提供了多种选项,以便用户根据需要定制输出信息,功能很多,本文不展开全部细节,只是介绍一下有这样的一个命令行工具,具体的语法随时搜索即可。

问题一:查看某个端口是否处于监听状态?
命令:netstat -nalp | grep 端口号

问题二:按连接状态分类并统计某个进程占了多少tcp连接?

命令是:netstat -anp | grep 12345 | awk '/^tcp/ {print $6}' | uniq -c
这个对于排查连接数过多,不释放或者半连接问题非常有效!

如图所示,这个进程建立了了3000多个网络连接,最后排查出该进程存在连接未释放的Bug,这就是一个直接证据!

问题三:按照PID进行分类统计,并取前10位。

命令是:

netstat -anp | awk '/^tcp/ {print $7}' | cut -d/ -f1 | sort | uniq -c | sort -nr | head

结果如图所示:

图中第一列是连接数,第二列是进程的PID,从这个统计可以直观看出一些异常进程(没错,就是排名第一那个)!

以上用法,抛砖引玉。

网络延迟与抖动

ping是一个大家所熟知的命令,虽然普通,但是它也足够强大。

图中首先可以看到网络是否联通。其次,可以直观看出现在的延迟,例如上图都是20多毫秒,这个延迟已经很高了。数据中心内部一般不到1毫秒,我这里是ping的一个外部网络。
再然后,通过最后一行的统计信息,可以看到网络抖动非常小,只有0.321毫秒,因此该网络虽然慢,但慢的很稳定很均匀。
最后,丢包率,这里直接看到是0% packet loss,你可以测试更长时间观察是否丢包。

丢包率

上面的ping命令可以查看实时的丢包情况。
ifconfig命令可以查看历史统计,它显示的是每个网卡的信息,关注每个信息块的最后两行:

分别表示接收和发送的网络包数目,其中包含了drop关键字,也就是丢包的数量,这里可看到是2010571,这种就需要确认下网络是否有拥塞或其他异常。

网络流量

一般网络流量要通过监控系统的页面进行查看,如果没有现成的页面监控可以看,使用以下的命令查看。

网络带宽上限

使用ethtool 网卡名获取,网卡名使用上面的命令可以得到!

上图中的Speed就是这个网卡的理论速度上限了,即千兆网卡,1000Mb/s。
这里需要提醒的是,千兆不是我们常说的1GB,b在这里是比特,不是Bytes!

实时网速

这里又要用到linux神器,sar命令。

sar的功能太多,关于看网速的具体命令是:sar -n DEV 1

第一列是时间戳。其他主要字段解释如下:

  • IFACE:这是网络接口的名称。在这个例子中,有两个接口。
  • rxpck/s:这是每秒接收的数据包数量(Received Packets per Second)
  • txpck/s:这是每秒发送的数据包数量(Transmitted Packets per Second)
  • rxkB/s:这是每秒接收的千字节数(Received Kilobytes per Second)
  • txkB/s:这是每秒发送的千字节数(Transmitted Kilobytes per Second)

通过收发的字节数与上面的带宽对比,可以看到是否达到网络瓶颈!

另一个实时网速

iptraf-ng还可以监控所有出入的流量,进行按照协议区分流量,并设置过滤器等。它可以用于实时监视网络流量、统计网络接口的使用情况、查看网络连接等。
这是一个略漂亮点的网速查看工具!如图所示:

链路

tracepath是一个网络诊断工具,用于追踪数据包从源主机到目标主机的路径。它通过发送一系列逐渐增加的TTL(Time To Live)值的ICMP回显请求报文来探测路径上的每个路由器,并记录每个路由器的IP地址和响应时间。
示例输出:

tracepath to www.example.com (93.184.216.34), 30 hops max, 60 byte packets 
1 192.168.1.1 (1.234 ms) 
2 10.0.0.1 (2.345 ms) 
3 * * * 
4 203.0.113.1 (123.456 ms) 
5 * * * 6 93.184.216.34 (123.456 ms)

其中星号表示在该跳点上没有收到回复。每行还包括该跳点的IP地址和从源主机到该跳点的往返时间(以毫秒为单位)。

如果发现某个跳点的响应时间特别长或没有收到回复,那么可能表示该路由器存在故障或网络拥塞等问题。这对于网络故障排查和优化非常有帮助。

TCP相关

可以继续使用sar命令来观察网络的重发数、强制关闭数。另外linux的网络半连接、全连接的队列大小可以适当扩大。

常见问题

  1. 网络连接问题

    • 报错信息:Network is unreachableConnection refusedNo route to host等。
    • 现象:无法ping通其他主机,无法上网,无法访问远程服务等。
    • 解决方法:检查本地网络设置、路由器配置、防火墙设置等。
  2. DNS解析问题

    • 错误信息:Name or service not known
    • 现象:无法通过域名访问网站,只能通过IP地址访问。
    • 解决方法:检查/etc/resolv.conf文件中的DNS设置,或者尝试更换DNS服务器。
  3. 服务端口监听问题

    • 错误信息:Connection refused
    • 现象:尝试连接某个服务端口时,被服务器拒绝。
    • 解决方法:检查服务是否正在运行,端口是否开放,以及防火墙规则是否允许该连接。
  4. 网络超时

    • 错误信息:Request timed out
    • 现象:网络请求长时间无响应。
    • 解决方法:检查网络延迟、带宽限制、服务器负载等因素。
  5. 路由配置问题

    • 错误信息:Destination Host Unreachable
    • 现象:尝试访问某个网络时,提示目标主机不可达。
    • 解决方法:使用route命令查看和修改路由表,确保默认路由设置正确。

结语

Linux网络系统的排查工具众多,每种工具都有其独特的功能和适用场景。通过结合使用这些工具和使用经验,我们能够更加高效地诊断和解决网络问题。然而,仅依赖工具是不够的,我们还需不断学习和积累网络知识,以便更好地理解和处理各种网络问题。希望本文所介绍的排查工具和使用经验能为读者在Linux网络系统维护排查中提供一些帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/269175.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Re61:读论文 PRP Get an A in Math: Progressive Rectification Prompting

诸神缄默不语-个人CSDN博文目录 诸神缄默不语的论文阅读笔记和分类 论文名称:Get an A in Math: Progressive Rectification Prompting ArXiv网址:https://arxiv.org/abs/2312.06867 官方实现网站:PRP 官方代码:https://github.…

Linux学习:初识Linux

目录 1. 引子:1.1 简述:操作系统1.2 学习工具 2. Linux操作系统中的一些基础概念与指令2.1 简单指令2.2 ls指令与文件2.3 cd指令与目录2.4 文件目录的新建与删除指令2.5 补充指令1:2.6 文件编辑与拷贝剪切2.7 文件的查看2.8 时间相关指令2.9 …

【代码】Python3|无GUI环境中使用Seaborn作图的学习路线及代码(阴影折线图)

我有个需求是需要画图,让GPT帮我生成了一下学习计划。 学习路线依照GPT的来的,使用的Prompt工具是https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor。 文章目录 PrerequisiteMain Curriculum1.1 Seaborn介绍Seaborn基础保存图形为文件练习 1.2 单变量数…

day34贪心算法 part03

1005. K 次取反后最大化的数组和 简单 给你一个整数数组 nums 和一个整数 k ,按以下方法修改该数组: 选择某个下标 i 并将 nums[i] 替换为 -nums[i] 。 重复这个过程恰好 k 次。可以多次选择同一个下标 i 。 以这种方式修改数组后,返回数…

【数据结构和算法初阶(C语言)】带环链表问题详解(快慢指针的烧脑应用)

目录 1.铺垫-----带环链表基本了解 2. 题目:环形链表 3.环形链表|| ​编辑 3.1题解1 3.2 题解2 4.总结 1.铺垫-----带环链表基本了解 环形链表题目启迪: 环形链表特点:遍历链表会出现一模一样的地址 2. 题目:环形链表 给…

C++输入输出(I\O)

我们知道C是由C语言发展而来的,几乎完全兼容C语言,换句话说,你可以在C里面编译C语言代码。如下图: C语言是面向过程的语言,C在C语言之上增加了面向对象以及泛型编程机制,因此C更适合中大型程序的开发,然而C…

Linux 设置快捷命令

以ll命令为例: 在 Linux 系统上,ll 命令通常不是一个独立的程序,而是 ls 命令的一个别名。 这个别名通常在用户的 shell 配置文件中定义,比如 .bashrc 或 .bash_aliases 文件中。 要在 Debian 上启用 ll 命令,你可以按…

李沐动手学习深度学习——4.5练习

1. 在本节的估计问题中使用λ的值进行实验。绘制训练和测试精度关于λ的函数。观察到了什么? 修改代码运行如图所示,可以发现对于lamda值的变化而言,对于训练loss和测试loss的影响不大。但是如果λ 太大后,train和test的loss会变得…

Cyber RT 组件

场景 无人车上的传感器数据可能需要被融合,比如在车辆上安装了多颗雷达,不同雷达由于安装位置与自身参数差异,可探测的角度、范围、距离等都是不尽相同的,现在需要将不同雷达感知到的数据融合在一起以建立车辆所处的完整环境&…

机器学习-面经(part5、KNN和SVM)

8. KNN 8.1 简述一下KNN算法的原理? 一句话概括:KNN的原理就是当预测一个新的值x的时候,根据它距离最近的K个点是什么类别来判断x属于哪个类别 工作原理:存在一个样本数据集合,也称作为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数…

TypeError: the JSON object must be str, bytes or bytearray, not dict

参考文章:https://blog.csdn.net/yuan2019035055/article/details/124934362 Python基础系列(一)搞懂json数据解析与字典之间的关系 代码: 报错信息: TypeError: the JSON object must be str, bytes or bytearray, not dict …

局域网如何远程?

局域网远程一直是许多用户在处理远程连接需求时面临的一个难题。随着技术的不断进步,一种名为“天联”的组网解决方案应运而生。天联组网具有操作简单、跨平台应用、无网络要求以及独创的安全加速方案等独特优势,在解决各行业客户的远程连接需求方面发挥…

解决ipconfig不能使用的问题

问题所示:ipconfig不是内部或外部命令,也不是可运行的程序或批处理文件。 解决办法如下: 1.右击此电脑,点击属性设置: 2.点击高级系统设置 3.点击进入环境变量 4.在系统变量中进行设置,双击PATH进行配置 5.点击新建&am…

【如何在Docker中,修改已经挂载的卷(Volume)】

曾梦想执剑走天涯,我是程序猿【AK】 提示:添加投票!!! 目录 简述概要知识图谱 简述概要 如何在Docker中,修改已经挂载的卷(Volume) 知识图谱 在Docker中,修改已经挂载…

matlab 提取分割位于多边形区域边缘内部或边缘上的点

[in,on] = inpolygon(xq,yq,xv,yv) xv 和 yv 为定义的多边形区域的,如xv = [1 4 4 1 1 ];yv = [1 1 4 4 1 ];注意最后一个数字与第一个重复,保证多边形闭合; xq 和 yq 为待查询的点in:在多边形内部和边缘的点序号on:仅在多边形边缘的点序号 提取分割方法: matrix=[xq yq…

智能汽车加速车规级存储应用DS2431P+TR 汽车级EEPROM 存储器IC

DS2431PT&R是一款1024位1-Wire EEPROM芯片,由四页存储区组成,每页256位。数据先被写入一个8字节暂存器中,经校验后复制到EEPROM存储器。该器件的特点是,四页存储区相互独立,可以单独进行写保护或进入EPROM仿真模式…

折线图实现柱状阴影背景的demo

这个是一个由官网的基础折线图实现的流程,将涉及到的知识点附上个人浅薄的见解,源码在最后,需要的可自取。 折线图 成果展示代码注解参数backgroundColordataZoomlegendtitlexAxisyAxisgridseries 源码 成果展示 官网的基础折线图&#xff…

【Python】OpenCV-使用ResNet50进行图像分类

使用ResNet50进行图像分类 如何使用ResNet50模型对图像进行分类。 import os import cv2 import numpy as np from tensorflow.keras.applications.resnet50 import ResNet50, preprocess_input, decode_predictions from tensorflow.keras.preprocessing import image# 设置…

计算机网络物理层知识点总结

本篇博客是基于谢希仁编写的《计算机网络》和王道考研视频总结出来的知识点,本篇总结的主要知识点是第二章的物理层。上一章的传送门:计算机网络体系结构-CSDN博客 通信基础 物理层概念 物理层解决如何在连接各种计算机的传输媒体上传输数据比特流&am…

leetcode刷题日记-K个一组翻转(链表)

题目描述 解题思路 第一种解法,也是我们常用的一种解题方法,首先遍历一遍列表,将列表中的val的值存放到数组中,然后按照要求对数组进行排序,排序之后,我们重新定义节点,将节点按照排完序的结果…