linux主机宕机排查问题的方法

  1. 原因分析

服务器分类,web服务器,数据库服务器,文件服务器,中间件,其它服务器。

web服务器分析:常见的web应用apache,nginx,IIS等。

宕机原因很多,cpu,内存,IO磁盘,应用BUG,内核BUG,硬件等

系统和内核版本

流程

1.查看宕机的时间记录和历史登陆还有重启时间

last reboot

last -F |grep crash

查看历史登陆有没有异常的用户

last

2.首先查看系统日志。如linux下的/var/log/下的log日志,包括message,内核报错日志demsg等等,sa记录,是记录cpu,内存等运行的性能文件,记录着运行时的cpu的运行状态如图所示。

利用sa文件查看宕机时CPU情况

利用sa文件查看宕机时内存情况

日志量往往很大

还可以进行模糊查询,如

查看报错

tail -200/var/log/messages |grep "Error"

cat /var/log/dmesg|grep "Error"

查看内核崩溃日志

tail -200/car/log/messages |grep "crash"

查看是否出现OOM,一般会出现kill杀死进程的情况

cat /var/log/messages|grep -i "kill"

还可以查看宕机时间段的日志,查看12月11日15点的日志

cat /vat/log/messages|grep "Feb 11 15*"

3.查看内存使用

free -m,查看swap的使用和内存剩余情况和缓存。如果swap用了,且available也不够了,具体还要查看参数cat /proc/sys/vm/swappiness,如果设置为0,说明内存不够了。

4.查看io和文件系统使用

观察idle和iowait。磁盘读写时会用到缓存,一般为系统内存的40%,但是中间有一个缓冲时间120秒,将要用完这个缓存时,且会等待120秒,才会写入磁盘,在读写频繁的时候容易造成hang住的情况。

查看IO的读写速度,如果很慢说明磁盘性能出现瓶颈。

文件系统使用

5.查看安全日志

安全日志为/var/log/secure,查看history记录,查看是否有人登陆主机并做了恶意动作,例如关机。

6.利用kdump和crash工具分析内核

检查服务器开启了kdump服务,并在/var/crash目录找到了当天生成的vmcore文件,使用crash工具分析vmcore文件。

Kdump 用于对内存镜像的转储,它不但可以转储内存镜像到本地硬盘,还可以将内存镜像通过NFS,SSH 等协议转储到不同机器的设备上。

Kdump 分为两个组件:Kexec 和Kdump。

Kexec 是一种内核的快速启动工具,可以使新的内核在正在运行的内核(生产内核)的上下文中启动,而不需要通过耗时的BIOS 检测,方便内核开发人员对内核进行调试。

Kdump 是一种有效的内存转储工具,启用 Kdump 后,生产内核将会保留一部分内存空间,用于在内核崩溃时通过 Kexec 快速启动到新的内核,这个过程不需要重启系统,因此可以转储崩溃的生产内核的内存镜像。

7.查看服务日志和监控软件

如果在能找到宕机时进程的占用情况,可以根据占用异常的服务查看其日志。

服务日志一般有数据库和web服务,中间件,框架等。

还可以查看监控软件的历史记录图像,找到峰值点和宕机时间点的图像分析如下图。

8.总结

系统宕机的原因很多,需要我们细心的按照流程分析,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/60621.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

笔记本计算机上安装软件是什么软件,电脑上如何使用剪映App软件_教你在电脑上使用剪映App软件的方法...

剪映App是一款非常实用的轻松制作短视频的软件,有着强大的视频处理功能,可以对视频进行切割、变速、倒放、画布、转场等视频处理。但是剪映APP同在只是应用于智能手机端,电脑端不能够直接使用,那么有什么办法在电脑上使用剪映App&…

TimesNet 代码阅读

主函数 ./run.py args parser.parse_args() args.use_gpu True if torch.cuda.is_available() and args.use_gpu else Falseif args.use_gpu and args.use_multi_gpu:args.dvices args.devices.replace( , )device_ids args.devices.split(,)args.device_ids [int(id_) f…

回归分析处理

线性回归 最小二乘法 对于某数据量 有呈线性关系的输出量 ,且 ,现有对这些数据量的采集序列,这些采集量会存在随机误差,线性回归的目的便是找到保证使误差最小的情况下的回归系数 。 即通过下列方程组求 可利用最小二乘法&a…

Stata作回归分析

Stata将回归分析结果直接导出到Word里 ssc install asdoc, replace写每个命令时前面加上asdoc就可将生成的结果存在word 中 将图片保存成.emf格式,可在word中直接插入。 导入数据 数据描述 . sum#描述数据Variable | Obs Mean Std. Dev. M…

[DataAnalysis]回归分析细节

1、不可解释变差与可解释变差:SSTSSESSR 2、原假设与备择假设 3、回归常见的问题 4、R方和调整后的R方

stata行logistic回归交互项(交互作用)的可视化分析(1)

交互作用效应(p for Interaction)在SCI文章中可以算是一个必杀技,几乎在高分的SCI中必出现,因为把人群分为亚组后再进行统计可以增强文章结果的可靠性,不仅如此,交互作用还可以使用来进行数据挖掘。在既往文章中,我们已…

EMGU.CV进阶 (一、银行卡识别)

一、效果 识别出银行卡上的数字,并显示 注:本文所用所有知识,均在入门系列提到过 原图: 效果: 二、模板制作 目的,将10个数分成10个模板 2.1 加载模板 var imgTemplate new Mat("NumberTemplat…

OpenCV之识别银行卡号

一、简介 利用OpenCV所学的简单基础(点我进入),制作一个识别银行卡号的程序。 也可以由深度学习来完成这个任务,具体可以参考: 项目1. PPOCRLabel半自动工具标注自制身份证数据集项目2. 基于OCR身份证号码识别全流程 结果输出如…

Coremail专家观点:如何应对当前AI技术对邮件安全的影响

近日,ChatGPT在互联网上掀起了一阵热潮,目前月活用户超过 1 亿,注册用户之多导致服务器一度爆满。 人工智能的话题遍地可见,如“ChatGPT会取代哪些行业?”、“ChatGPT的实现原理”、“ChatGPT的玩转攻略”等等&#x…

对话式AI系列:任务型多轮对话的实践与探索

移动互联网带来了大数据的普及,摩尔定律预言了计算机硬件的发展,深度学习则借助这阵东风实现了技术上的突破,人工智能成功进入大众视野,并改变了人们的日常生活。 “小X同学,请打开电视”、“小X小X,请播放…

晋飞碳纤科创板IPO被终止:曾拟募资近6亿 凯辉基金是股东

雷递网 雷建平 5月9日 上海晋飞碳纤科技股份有限公司(简称:“晋飞碳纤”)日前IPO被终止。晋飞碳纤是2022年12月底递交招股书,曾准备在科创板上市。 晋飞碳纤原计划募资5.89亿元,其中,3.2亿元用于高性能复合…

三大部门七场面试,终拿字节AI NLP 算法offer

作者 | Maxxiel 编辑 | NewBeeNLP 面试锦囊之面经分享系列,持续更新中 后台回复『面试』加入讨论组交流噢 写在前面 背景美本cs英硕ai在读,无paper无实习无研究无比赛。方向是深度学习、nlp,项目主要是情感分析 和模型蒸馏。leetcode 刷了…

【论文阅读】空间圆形拟合检测新方法

目录 1、空间圆拟合模型1.1、空间平面拟合1.2、空间圆拟合 2、参考文献3、算法伪码4、算法结果 摘 要 根据空间圆中任意两条弦所对应的中垂面与空间圆所处的平面必然相交且交点即为圆心这一空间圆特性,利用空间向量按照最小二乘法推导出圆心计算方程,按照…

海外硕士苏明哲回国后哀叹:我美本英硕,找不到工作很难受

推荐阅读: 欢迎加入我们的架构师社群 阿里跳槽拼多多,80万年薪涨到160万,值不值得去? 一名海外留学生回国后找工作,却屡受打击,感慨自己美本英硕,却找不到工作,内心真的很难受&#…

玩转AI绘图 电脑配置怎么选?

大家好,我是网媒智星,很多小伙伴留言想了解一下AI绘图相关知识,那么,想要玩转AI绘图,电脑配置该怎么选呢? 首先我们了解一下什么叫AI绘图? AI绘图指的是利用人工智能技术实现的自动绘图&#x…

chatgpt赋能python:Python做图:一个强大而灵活的工具

Python做图:一个强大而灵活的工具 Python是一个流行的编程语言, 越来越多的人开始使用它进行数据分析和可视化。 Python做图的功能非常强大,使得它成为许多人的首选工具。在这篇文章中, 我们将讨论 Python做图及其SEO优化。 Python做图的优势 Python做…

人工智能基础部分19-强化学习的原理和简单应用,一看就懂

大家好,我是微学AI,今天给大家介绍一下人工智能基础部分19-强化学习的原理和简单应用,随着人工智能的不断发展,各种新兴技术不断涌现。作为人工智能的一个重要分支,强化学习近年来受到了广泛关注。本文将介绍强化学习的…

TT语音:游戏社交乱象难平

游戏在人们生活中占据的时间越来越多,用户对游戏内的体验也愈发的丰富,有时候和朋友三五结队打几把王者荣耀,但大部分玩家是处于一个人玩游戏的状态,而这种状态也影射了当前Z世代的孤独状态。 人在孤独后会产生强烈的社交需求&am…

Android(仿QQ登入+网易新闻)

文章目录 场景内容:效果参考 场景 提示:基于期末作业开发(自增轮播图) 自评:效果蛮丑的,功能都在,仅供参考! 内容: 一,引导页 1,设计引导页Log…

运维有趣项目:搭建个人博客安全版(Appache2.4防盗链与防泄漏,防盗链httpd.conf无Load,include版)

这次算是呕心沥血了,网上的防盗链文章简直一个模子的,全部都是采用httpd.conf修改LoadModule rewrite_module modules/mod_rewrite.so或是httpd-default.conf,可是我用阿里云自动搭建的apache环境压根就没有啊,如果有相同经历的,可以看这篇文章,希望留下评论,给个鼓励不,QAQ,域…