[Linux入门]---进程的概念

文章目录

1.进程的概念
- ①描述进程-PCB
- ②task_struct-PCB的一种
- ③task_ struct内容分类
2.查看进程
3.通过系统调用获取进程表示符
4.通过系统调用创建进程---fork初识

1.进程的概念

在我们的电脑开机的时候，操作系统会被加载到内存中，点击多个应用进行时，那么将有多个应用的进程会被加载到内存中的操作系统上。说明一个操作系统不仅仅可以运行一个进程，而且可以运行多个进程！既然，有多个进程了，那么就需要将这些进程有条不紊地管理起来，那操作系统是如何管理进程的呢？先描述，在组织：任何一个进程加载到内存中形成真正的进程时，操作系统要创建描述进程的结构体对象；接下来便是将这些进程信息块组织起来，使用双链表的数据结构进行管理！

在很多人的理解中，一个加载到内存中的程序叫做进程，或者正在运行的程序叫做进程，其实这些都是片面的理解！假如你被复旦大学录取了，难道就可以说你是复旦大学的学生了吗？当然不是的！你被录取了表明你的档案信息已经被该大学收录了，而要想真正成为该大学的学生！到开学的时候，你要拿着录取通知书到复旦大学入学报到，这个时候你才真正成为了复旦大学的学生！同理，进程应该包括描述进程的信息和需要处理的代码和数据！

①描述进程-PCB

进程信息被放在一个叫做进程控制块的数据结构中，可以理解为进程属性的集合
进程=内核PCB数据结构对象+自己的数据和代码

②task_struct-PCB的一种

在Linux中描述进程的结构体叫做task_struct。
课本上称之为PCB（process control block），Linux操作系统下的PCB：task_struct

③task_ struct内容分类

标示符：描述本进程的唯一标示符，用来区别其他进程。
状态：任务状态，退出代码，退出信号等。
优先级：相对于其他进程的优先级。
程序计数器：程序中即将被执行的下一条指令的地址。
内存指针：包括程序代码和进程相关数据的指针，还有和其他进程共享的内存块的指针
上下文数据：进程执行时处理器的寄存器中的数据[休学例子，要加图CPU，寄存器]。
I／O状态信息：包括显示的I/O请求，分配给进程的I/O设备和被进程使用的文件列表。
记账信息：可能包括处理器时间总和，使用的时钟数总和，时间限制，记账号等。
其他信息

2.查看进程

PID为子进程标志，相当于学生的学号。
进程的信息可以通过 /proc 系统文件夹查看
输入ls /proc/指令，可以看到不同PID的文件
+ 大多数进程信息同样可以使用top和ps这些用户级工具来获取

创建myprocess.c文件，如下：

#include<stdio.h>                                                                                                                                                    
#include<unistd.h>    
int main()    
{    while(1)    {    printf("我是一个进程....\n");    sleep(1);    }    return 0;    
}

创建自动化构建文件Makefile文件，如下：

myprocess:myprocess.c                                                                                                                                                gcc -o $@ $^    
.PHONY:clean    
clean:    rm -rf myprocess

Xshell代码运行的结果如下：
在这里插入图片描述
在另一个窗口输入如下指令：

$ ps ajx | head &&ps ajx | grep myprocess//获取含myprocess的进程PID

指令运行的结果如下：
在这里插入图片描述

./myprocess为正在运行的可执行程序，grep --color=auto myprocess为刚才我们运行的获取PID指令中包含了myprocess，说明输入的指令在系统中变成了进程运行。

可以使用如下指令过滤掉grep myprocess进程：

$ ps ajx | head -1 && ps ajx | grep myprocess | grep -v grep

关闭进程的指令：

$ ps -9 进程的PID//杀进程

查看进程文件：
在这里插入图片描述

$ ls /proc/4356/ -l //获取PID为4356的进程文件详细信息

进程文件详细信息部分截图如下：
在这里插入图片描述

3.通过系统调用获取进程表示符

在前面操作系统的学习中，操作系统通过数据结构将描述的进程信息组织起来管理，我们作为普通用户很难和操作系统打交道，所以不能直接获取当前进程PID；但是可以通过操作系统上层封装的系统调用接口，获取PCB结构描述的信息，接下来让我们认识两个系统调用接口：

getpid()：获取子进程PID的信息。
getppid()：获取父进程PPID的信息。

创建proc.c文件，写入如下代码：

#include<stdio.h>    
#include<sys/types.h>    
#include<unistd.h>    
int main()    
{    printf("我是一个子进程，pid为:%d\n",getpid());    printf("我是一个父进程，ppid为:%d\n",getppid());    return 0;                                                                                             
}

代码运行的结果为：
在这里插入图片描述

重新运行./proc文件，其子进程一直在变（比如某学生高考失利进入复旦大学时，他可以获得一个学号，当他第二年复读再次考入复旦大学时，他又获得一个学号，而这两个学号是不同的），而父进程一直都不变。

$ ps ajx | head -1 && ps ajx | grep 3216 //父进程

在这里插入图片描述

父进程ppid为bash命令行进程，给我们输入指令的！

4.通过系统调用创建进程—fork初识

使用man指令，查找fork函数的信息
在这里插入图片描述
解释：

fork函数创建一个新的进程，让当前的父进程返回当前的子进程，创建新的子进程返回0。

eg1：

#include<stdio.h>    
#include<sys/types.h>    
#include<unistd.h>    int main()    
{    printf("我是使用fork()之前的语句\n");    pid_t ret=fork();    printf("我是使用fork()之后的语句\n");    return 0;    
}

代码运行的结果为：
在这里插入图片描述

可以发现fork()函数创建新的子进程，当前的进程执行了printf语句，创建的进程执行了一遍的printf语句，所以fork()后面的语句被执行两遍。

eg2：

#include<stdio.h>    
#include<sys/types.h>    
#include<unistd.h>        
int main()    
{    printf("begin: 我是一个进程,pid:%d,ppid:%d\n",getpid(),getppid());    pid_t ret=fork();    if(ret==0)    {    while(1)    {    printf("我是子进程，pid:%d,ppid:%d\n",getpid(),getppid());    sleep(1);                                                                                                                                                }    }    else if(ret>0)    {    while(1)    {    printf("我是父进程，pid:%d,ppid:%d\n",getpid(),getpid());    sleep(1);    }    }    return 0;    
}

代码运行的结果为：
在这里插入图片描述
指令：

while :; do ps ajx | head -1 ; ps ajx | grep proc |grep -v grep;sleep 1;done

在另一个窗口执行该指令：
在这里插入图片描述

使用fork函数创建新的进程，使用if语句，根据父进程返回当前的子进程（返回的值大于0），旧的子进程返回0，实现分流执行不同的代码。

问题1：为什么fork函数返回子进程，父进程返回当前的子进程？

一般而言fork函数之后的代码，父子进程共享；返回不同的值，让不同的执行流，执行不同的代码！

问题2：fork函数如何做到返回两次？

①创建子进程PCB；②填充PCB的内容；③让父子进程共享同一份代码；④父子进程的task_struct，可以被CPU调用…最后执行return语句返回，return语句之前fork函数的主要工作已经完成了（即创建新的子进程），所以return语句为父子进程共享的语句，所以父进程返回一次，子进程返回一次。

问题3：fork干了什么事？

进程之间是不会相互影响，相互独立：①fork创建了子进程，子进程依据父进程为模板PCB模板创建自己的PCB，指向父进程的代码；②那指向的数据是否相同呢？子进程和父进程刚开始指向的数据相同，当操作系统检测到子进程要修改数据时会开空间，会发生写时拷贝，但不是把父进程的数据全部拷贝，子进程只会拷贝自己能使用的数据，避免造成资源浪费。