一.基础知识
在进入到Linux进程状态学习之前,我们先学习一些基础知识:
1.1并发和并行
并发: 在单CPU的计算机中,并不是把当前进程执行完毕之后再执行下一个,而是给每个进程都分配一个时间片,基于时间片进行进程调度的过程叫做并发。
并行: 多个进程在多个CPU下分别、同时运行叫做并行。
1.2 时间片
Linux/Windows等民用操作系统,都是分时操作系统,他们会给一个进程规定一个时间,当这个时间过去了,这个进程就必须从CPU上剥离下来,换成另外一个进程运行,这个时间就叫做时间片。
分时操作系统的特点:调度任务追求公平。
实时操作系统:任务一旦执行,就优先并尽快使其执行完毕。
二.进程状态
在了解Linux进程状态之前,我们先了解一下进程的状态。
在操作系统的课程中,我们有如下一张图:
这张图宏观的描述了操作系统的状态,对于不同的操作系统,都有以上的这些状态,但是不同的操作系统对这些状态的处理方式是不同的。
下面,我们来详细的讲解一下等待。
等待
阻塞的本质是等待!
对于每个CPU,操作系统都要给它提供一个叫做运行队列的东西(FIFO),每次执行一个进程,就是把这个进程的task_struct链入运行队列中,CPU在处理进程时,就只需要到运行队列去取头节点即可。
当一个进程的时间片用完了之后,就删除队列的头节点,然后再将这个节点链接到队尾,之后执行下一个task_struct。
当一个进程处于运行队列中时,我们就称这个进程为运行状态,虽然可能这个进程实际上并没有被CPU执行。
那么,阻塞状态是什么样的呢?
在计算机中,大多数都是在做IO(外设访问)的。就譬如scanf函数,如果我们不输入数据的话,进程就获取不到数据,但,CPU不会一直等待这个进程。此时这个进程就会被设置为阻塞状态,需要等待底层硬件准备好,才会被重新放入运行队列中。
也就是说,阻塞状态其实就是在等待硬件。
而,操作系统管理硬件采取的态度也是:先描述,再组织。
最终也会呈现出一个结构体的形式:
struct device
{int type;//硬件类型int status;//硬件状态
//其他属性struct device* next//下一个硬件task_struct waitQueue;//等待队列
}
如下图:
还有一种状态叫做阻塞挂起。
阻塞期间,进程不会被调度,但对应进程的PCB和代码以及数据也是会占用内存的,若进程越来越多,则计算机的内存资源迟早不够用,那么,此时,操作系统为了保证整个系统的安全,就会将进程的代码和数据换出到磁盘中;当进程不阻塞时,操作系统再将对应的代码和数据换入到内存当中。
我们现在将这张图整合起来。如下:
我想,现在大家就已经明白了等待的本质。
三.Linux进程
现在,我们讲解Linux的进程状态:
在Linux的源代码中,有如下状态:
static const char * const task_state_array[] = {"R (running)", /* 0 */ //运行状态"S (sleeping)", /* 1 */ //浅度睡眠状态"D (disk sleep)", /* 2 */ //深度睡眠状态"T (stopped)", /* 4 */ //停止状态"t (tracing stop)", /* 8 */ //调试状态"X (dead)", /* 16 */ //死亡状态"Z (zombie)", /* 32 */ //僵尸状态};
R和S状态
R状态:运行状态,进程链接在运行队列中的状态
S状态:休眠状态,进程阻塞挂起的状态。可中断睡眠(浅睡眠,可以被kill杀死)
当调用printf时,由于会一直做IO操作,就会一直等待外设,也就是浅度睡眠状态。
而一直执行一个空语句时,就会是R状态。
D状态
D状态也就是disk sleep,这也是睡眠状态的一种,是不可中断的睡眠,也就是深度睡眠。
这是专门为磁盘设计的状态。
为了保护访问磁盘的进程,禁止操作系统“杀掉”该进程,该进程就会处于D状态。
至于为什么不可以杀死这个进程,打个比方。
比方说,一个进程正在将重要数据写入磁盘,数据只写到一半时,进程突然被杀死,那么磁盘上可能会留下损坏的文件或未完成的事务。为了解决这个问题,Linux 设计了 D 状态,使进程在 I/O 完成之前不会被终止,从而保证数据的完整性和系统的稳定性。
值得一提的是,如果一个系统的大量状态在D状态下,那么它距离崩溃就不远了~~~
T状态和t状态
T状态是暂停状态,在认识这个状态之前,我们先认识两个信号。
19号信号,可以让指定进程暂停,从而变成T状态
18号信号,可以让指定进程继续执行,此进程的状态就变成了S(浅度睡眠)
然后,我们使用18号信号恢复它。
我们发现,用18号信号恢复它之后就变成了R状态,而不是之前查出来的R+,这是什么意思呢?
带+号的是前台进程
不带+号的是后台进程
想要杀死后台进程,我们只能通过kill -9 pid来杀死。
另外,一个进程被暂停又被运行后,会变成后台程序运行。
而t状态是一种调试状态,就譬如使用gdb进入调试的程序,就会以t状态运行。
X状态、Z状态
X状态是死亡状态,当一个进程运行结束后就会进入X状态。不再描述
下面,我们详细的来解释一下Z状态。
Z状态,即僵尸状态。是处于死了之后还没人来管的状态,就譬如人死了法医还没来验尸的时候。
对于进程而言也是一样的,当一个进程return了之后,会返回一个退出码。
退出码
而这个退出码的信息,规定了这个进程退出的状态,就譬如0为正常退出,非0为异常退出。
我们先简单的谈一下退出码:
Linux系统中规定了一套退出码,它规定了0是正常退出,非0是异常退出。
而返回的值非0值共有256个。也就是1-255。
每一个非0的退出码都代表一类错误原因。
而我们程序员也可以自己维护一套退出码。
在Linux中,查最近一条进程退出信息的命令是:echo $?
僵尸状态
那么,为什么要返回一个退出码呢?
是因为,父进程/操作系统要知道子进程把任务执行的怎么样。
那么,什么是僵尸状态呢?
- 当一个进程退出时,它的代码和数据会被释放,但是它的任务结构体还在,task_struct中存放着该进程的退出信息。
- 当一个进程退出并且父进程还没有读取到子进程的返回码时,就会产生僵尸进程。
- 僵尸进程会以终止状态保持在进程表中,并且会一直等待父进程读取退出状态代码。
- 如果父进程不回收子进程,就会造成资源的浪费,因为数据结构本身就占据内存资源。此时就会造成内存泄漏(系统级)
现在,我们就知道了僵尸状态是什么样的了,现在我们写一段代码测试一下:
#include <iostream>
#include <unistd.h>
int main()
{printf("I am parent process.My pid is %d,My ppid is %d."getpid(),getppid());pid_t id=fork();if(id==0){int cnt=10;while(cnt--){printf("I am Child process.My pid is %d,My ppid is %d."getpid(),getppid());sleep(1);}}else if(id>0){while (1){printf("I am parent process.My pid is %d,My ppid is %d."getpid(),getppid());sleep(1);}}return 0;
}
我们果然在这里观察到了Z状态,它变成了僵尸状态。
循环查询代码:
while :; do ps ajx|head -1 && ps ajx|grep proc | grep -v grep;sleep 1;done
下面,再来一个问题,当父进程退出,子进程存在,这又是什么状态呢?
孤儿状态
儿子还在,但是parent却没了,那么这个儿子就变成了孤儿状态。
没错,这个状态就叫做孤儿状态。
下面,我们改一下代码:
#include <stdio.h>2 #include <unistd.h>3 int main()4 {5 printf("I am parent process.My pid is %d,My ppid is %d.\n",getpid(),getppid());6 pid_t id=fork();7 if(id>0)8 {9 int cnt=10;10 while(cnt--)11 {12 printf("I am parent process.My pid is %d,My ppid is %d.\n",getpid(),getppid(13 sleep(1);14 }15 }16 else if(id==0)17 {18 while (1)19 {20 printf("I am parent process.My pid is %d,My ppid is %d.\n",getpid(),getppid()); 21 sleep(1);22 }23 }24 return 0;25 }
我们发现,当父进程死亡之后,子进程的父进程会变成1,也就是操作系统。
我们可以用top查看:
top
当父进程退出时,操作系统会领养子进程,以便接收子进程的退出信息并回收进程。这个进程被称为孤儿进程。孤儿进程在后台运行。