Linux下自动监控进程运行状态

目录

  • 背景
  • 应用举例
    • 1、使用crontab+脚本监控服务
    • 2、使用shell脚本监控服务
      • 2.1 编写自定义监控脚本
      • 2.2 运行脚本

背景

假设有一个服务需要长期运行,但可能会由于某种原因导致服务意外停止,不能及时发现,某天来到公司后发现出问题了才意识到服务挂了。此时再去手动重启服务可能已经造成很大损失了,那有没有办法可以自动监控服务运行状态,发现服务停止了自动拉起呢?如果你对Linux的定时任务crontab有所了解的话,很容易实现。如果还不了解crontab,请先阅读Linux定时任务之crontab一文。

应用举例

1、使用crontab+脚本监控服务

注意,crontab最小只支持分钟级的监控,如果需要秒级的监控频率,请参考方法2。
编写监控脚本:

#!/usr/bin/bashlog="/home/scripts/check.log"
pid=0
process_num=0
cpu_usage=0
mem_usage=0
# 要监控的服务名称
service_name="java"# 日志文件不存在,就先创建
if [[ ! -e ${log} ]]; thentouch ${log}
fifunction info()
{echo "[`date +'%F %T'` - INFO] - $1" >> ${log}
}function warn()
{echo "[`date +'%F %T'` - WARN] - $1" >> ${log}
}function error()
{echo "[`date +'%F %T'` - ERROR] - $1" >> ${log}
}export -f info
export -f warn
export -f error# 获取进程id
function proc_pid()
{pid=$(ps -ef | grep -v grep | grep ${service_name} | awk '{print $2}')
}# 获取进程数量
function proc_num()
{process_num=$(ps -ef | grep -v grep | grep ${service_name} | wc -l)
}# 获取cpu memory使用情况
function proc_cpu_mem_usage()
{process_info=$(top -bn1 -p ${pid} | tail -1)cpu_usage=$(echo ${process_info} | awk '{print $9}')mem_usage=$(echo ${process_info} | awk '{print $10}')
}proc_num
if [[ ${process_num} -eq 0 ]]; thenwarn "${service_name} is not running!"# restart service# do something  ---  此处执行重启服务对应的命令,如  restart java (也可以是执行启动脚本,如sh xxx.sh start)proc_numproc_pidif [[ ${process_num} -eq 1 ]]; theninfo "${service_name} restart success(pid: ${pid})"fi
elseproc_pidproc_cpu_mem_usageinfo "${service_name} is running(pid: ${pid} cpu_usage: ${cpu_usage} mem_usage: ${mem_usage})"
fi

添加监控脚本到定时任务中:
crontab -e打开编辑器,输入:
*/1 * * * * sh /home/scripts/check.sh,表示每分钟执行一次监控脚本。
查看输出的日志文件记录
在这里插入图片描述
这样就实现了每分钟监控一次进程的运行状态,如果服务停止则会自动拉起。

2、使用shell脚本监控服务

2.1 编写自定义监控脚本

如果想要实现秒级的监控频率,就需要自己写监控脚本了。下面是一个例子:

#!/usr/bin/bashlog="/home/scripts/check_1.log"
pid=0
process_num=0
cpu_usage=0
mem_usage=0
service_name="java"if [[ ! -e ${log} ]]; thentouch ${log}
fifunction info()
{echo "[`date +'%F %T'` - INFO] - $1" >> ${log}
}function warn()
{echo "[`date +'%F %T'` - WARN] - $1" >> ${log}
}function error()
{echo "[`date +'%F %T'` - ERROR] - $1" >> ${log}
}export -f info
export -f warn
export -f errorfunction proc_pid()
{pid=$(ps -ef | grep -v grep | grep ${service_name} | awk '{print $2}')
}function proc_num()
{process_num=$(ps -ef | grep -v grep | grep ${service_name} | wc -l)
}function proc_cpu_mem_usage()
{process_info=$(top -bn1 -p ${pid} | tail -1)cpu_usage=$(echo ${process_info} | awk '{print $9}')mem_usage=$(echo ${process_info} | awk '{print $10}')
}while true
doproc_numif [[ ${process_num} -eq 0 ]]; thenwarn "${service_name} is not running!"# restart serviceproc_numproc_pidif [[ ${process_num} -eq 1 ]]; theninfo "${service_name} restart success(pid: ${pid})"fielseproc_pidproc_cpu_mem_usageinfo "${service_name} is running(pid: ${pid} cpu_usage: ${cpu_usage} mem_usage: ${mem_usage})"fi# 此处的时间根据实际需要设置,单位为秒sleep 2
done

如果想要在脚本中添加对cpu、内存的使用情况监控,比如内存占用超过50%,cpu占用超过80%时告警,可以添加如下内容:

if [[ $(echo "${cpu_usage} > 80" | bc) -eq 1 ]]; thenwarn "CPU usage of ${service_name} is high(${cpu_usage}%)"
fi
if [[ $(echo "${mem_usage} > 50" | bc) -eq 1 ]]; thenwarn "Memory usage of ${service_name} is high(${mem_usage}%)"
fi

注意,此处比较大小用到了bc,这是因为bash本身只支持整数计算,不支持小数。在Linux系统中,bc是一款用于数学运算和数据处理的强大命令行工具,其名字代表"Basic Calculator"(基本计算器)。bc命令特别适用于处理浮点数和高精度数学运算,支持各种数学运算,如加减乘除、指数运算、取模、求平方根等。

2.2 运行脚本

1)直接运行:
执行sh /home/scripts/check.sh,直接运行脚本,如果终端窗口被关闭,进程会被kill。
2) 使用nohup放在后台不挂断地运行
nohup即使退出终端或关闭终端窗口,程序也会继续在后台运行。
nohup sh check1.sh 2>&1 &
在这里插入图片描述
关闭终端后,log中也能看到记录:
在这里插入图片描述
PS: 日志中的时间间隔可能不是严格的2s,这是因为执行命令也有时间损耗,积累到一定程度之后,就会出现和上一次的时间差大于2s。

此时如何关闭进程呢?使用ps查询进程即可:
ps -aux|grep check1.sh
在这里插入图片描述
查询到pid之后,使用kill -9 pid即可关闭进程
在这里插入图片描述
相比使用crontab创建的定时任务,脚本可以实现更小粒度的监控频率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/394244.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

(Qt) QThread 信号槽所在线程

文章目录 💁🏻前言💁🏻Code💁🏻‍♂️Code💁🏻‍♂️环境 💁🏻当前线程信号💁🏻‍♂️默认效果💁🏻‍♂️Qt::…

最新CSS3伪类和伪元素详解

第4章 伪类和伪元素 4.1结构伪类 E:first-child{},第一个元素 样式&#xff1a; p:first-child {color: red; } <div><p>Lorem ipsum</p><p>Dolor sit amet.</p> </div> 4.1.1nth-*伪类 以计数为基础的&#xff0c;默认情况下&…

探索下一代互联网协议:IPv6的前景与优势

探索下一代互联网协议&#xff1a;IPv6的前景与优势 文章目录 探索下一代互联网协议&#xff1a;IPv6的前景与优势**IPv6 的特点****IPv6的基本首部****IPv6的地址****总结** 互联网的核心协议&#xff1a;从IPv4到IPv6 互联网的核心协议IP&#xff08;Internet Protocol&#…

Docker Deskpot出现Docker Engine Stopped的解决历程

前提&#xff1a;我的操作系统是Win11家庭版, Docker Descktop下载的是最新版&#xff08;此时是4.30.0&#xff09; 出现了如图所示的问题“Docker Engine Stopped”,个人认为解决问题的关键是第四点&#xff0c;读者可以直接看第四点&#xff0c;如果只看第四点就成功解决&am…

python开发上位机 - PyCharm环境搭建、安装PyQt5及工具

目录 简介&#xff1a; 一、安装PyCharm 1、下载 PyCharm 2、PyCharm安装 1&#xff09;配置安装目录 2&#xff09;安装选项 3、问题及解决方法 二、安装PyQt5 1、打开 Pycharm&#xff0c;新建 Project 2、安装 pyqt5 3、安装很慢怎么办&#xff1f; 4、安装 pyq…

RHCSA第三次作业

磁盘管理及分区&#xff1a; [rootMYyyy ~]# fdisk /dev/sda [rootMYyyy ~]# lsblk NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTS sda 8:0 0 10G 0 disk └─sda1 8:1 0 9G 0 part sdb 8:16 0 30G 0 disk sdc …

docker 部署 mysql8

命令 docker run --restartalways --name mysql8 -v /data/mysql/conf:/etc/mysql -v /data/mysql/data:/var/lib/mysql -v /data/mysql/log:/var/log -v /data/mysql/mysql-files:/var/lib/mysql-files -p 3308:3306 -e MYSQL_ROOT_PASSWORD123456 -d mysql:8 \解释 --rest…

基于SpringBoot框架的企业财务管理系统设计与实现(论文+源码)_kaic

摘 要 在快速增长的信息时代&#xff0c;每个企业都在紧随其后&#xff0c;不断改进其办公模式。与此同时&#xff0c;各家企业的传统管理模式也逐步发生变化&#xff0c;政府和企业都将需要一个更加自动化和现代化的财务管理系统。这能够便利员工之间的信息交流和公司的工作…

day22回溯学习记录第一天- - -代码随想录

77.组合 给定两个整数 n 和 k&#xff0c;返回范围 [1, n] 中所有可能的 k 个数的组合。 你可以按 任何顺序 返回答案。 思路:回溯的经典题目&#xff0c;回溯的整体结构类似于二叉树&#xff0c;如下图所示。据此图可知&#xff0c;采用递归是一种解决方法&#xff0c;在此引入…

定点数的运算

目录 1.定点数的移位运算 1.1算数移位 数学含义&#xff1a; 规律总结&#xff1a; 1.2逻辑移位 1.3循环移位 不带进位位 带进位位 2.定点数的加减运算 3.定点数的乘除运算 3.1原码 一位乘法 除法 3.2补码 一位乘法 除法 1.定点数的移位运算 1.1算数移位 数学…

Java日志框架

笔记学习原视频&#xff08;B站&#xff09;&#xff1a;全面深入学习多种java日志框架 目前常见日志框架有&#xff1a; JULLogbacklog4jlog4j2 目前常见的日志门面&#xff08;统一的日志API&#xff09;&#xff1a; JCLSlf4j 一、 老技术&#xff08;基本都弃用了&…

STM32——外部中断(EXTI)

目录 前言 一、外部中断基础知识 二、使用步骤 三、固件库实现 四、STM32CubeMX实现 总结 前言 外部中断&#xff08;External Interrupt&#xff0c;简称EXTI&#xff09;是微控制器用于响应外部事件的一种方式&#xff0c;当外部事件发生时&#xff08;如按键按下、传感器信号…

软件设计模式概述

模式的诞生 模式(Pattern)起源于建筑业而非软件业 模式之父——美国加利佛尼亚大学环境结构中心研究所所长Christopher Alexander&#xff08;克里斯托弗亚历山大&#xff09;博士 《A Pattern Language: Towns, Buildings, Construction》——253个建筑和城市规划模式。 他给出…

atsec增加Swift CSP评估资质

atsec信息安全评估员现已被Swift列为Swift客户安全计划&#xff08;CSP&#xff1a;Customer Security Programme&#xff09;认证评估员目录中的评估提供商&#xff0c;可以帮助全球金融机构评估其针对CSP强制性和咨询性控制的合规级别。在金融行业&#xff0c;Swift要求使用其…

MySQL的三大关键日志:Bin Log、Redo Log与Undo Log

MySQL的三大关键日志&#xff1a;Bin Log、Redo Log与Undo Log 1. Bin Log&#xff08;二进制日志&#xff09;2. Redo Log&#xff08;重做日志&#xff09;3. Undo Log&#xff08;回滚日志&#xff09; &#x1f496;The Begin&#x1f496;点点关注&#xff0c;收藏不迷路&…

C++现代教程四

float转string不带多余0 float a 1.2; std::tostring(a); // 1.200000 std::ostringstream strStream; strStream << a; // 1.2 if (!strStream.view().empty()) // 判定流有数据// 边框融合 float measureText(std::u8string text, FontTypes::Rectangle &recta…

科研绘图系列:R语言圆形条形图(circular barplot)

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者! 介绍 圆形条形图(circular barplot)是一种条形图,其中的条形沿着圆形而不是线性排列展示。这种图表的输入数据集与普通条形图相同:每个组(一个组即一个条形)需要一个数值。(更多解释请参…

IDEA2024.2重磅发布,更新完有4G!

JetBrains 今天宣布了其 IDE 家族版本之 2024.2 更新&#xff0c;其亮点是新 UI 现在已是默认设置&#xff0c;并且对 AI Assistant &#xff08;AI助手&#xff09;进行了几项改进。 安装密道 新 UI 的设计更加简约&#xff0c;可以根据需要以视觉方式扩展复杂功能。值得开发…

Linux 下查看 CPU 使用率

目录 一、什么是 CPU 使用率二、查看 CPU 利用率1、使用 top 查看2、用 pidstat 查看3、用 ps 查看4、用 htop 查看5、用 nmon 查看6、用 atop 查看7、用 glances 查看8、用 vmstat 查看9、用 sar 查看10、dstat11、iostat 三、总结 CPU 使用率是最直观和最常用的系统性能指标&…

QT生成.exe文件无法在未安装QT的电脑上运行的解决办法

在没有安装qt的电脑上运行qt生成的exe文件&#xff0c;提示&#xff1a; The application failed to start because no Qt platform plugin could be initialized 在网上找了很多办法&#xff0c;我尝试了 手动&#xff1a; 1、修改环境变量&#xff0c;2&#xff0c;添加pla…