文章目录
- 1.进程的概念
- ①描述进程-PCB
- ②task_struct-PCB的一种
- ③task_ struct内容分类
- 2.查看进程
- 3.通过系统调用获取进程表示符
- 4.通过系统调用创建进程---fork初识
1.进程的概念
在我们的电脑开机的时候,操作系统会被加载到内存中,点击多个应用进行时,那么将有多个应用的进程会被加载到内存中的操作系统上。说明一个操作系统不仅仅可以运行一个进程,而且可以运行多个进程!既然,有多个进程了,那么就需要将这些进程有条不紊地管理起来,那操作系统是如何管理进程的呢?
先描述,在组织
:任何一个进程加载到内存中形成真正的进程时,操作系统要创建描述
进程的结构体对象;接下来便是将这些进程信息块组织起来
,使用双链表的数据结构进行管理!
在很多人的理解中,一个加载到内存中的程序叫做进程,或者正在运行的程序叫做进程,其实这些都是片面的理解!假如你被复旦大学录取了,难道就可以说你是复旦大学的学生了吗?当然不是的!你被录取了表明你的档案信息已经被该大学收录了,而要想真正成为该大学的学生!到开学的时候,你要拿着录取通知书到复旦大学入学报到,这个时候你才真正成为了复旦大学的学生!同理,进程应该包括描述进程的信息和需要处理的代码和数据!
①描述进程-PCB
- 进程信息被放在一个叫做进程控制块的数据结构中,可以理解为
进程属性的集合
- 进程=内核
PCB
数据结构对象+自己的数据和代码
②task_struct-PCB的一种
- 在
Linux
中描述进程的结构体叫做task_struct
。- 课本上称之为
PCB(process control block)
,Linux
操作系统下的PCB
:task_struct
③task_ struct内容分类
标示符
:描述本进程的唯一标示符,用来区别其他进程。状态
:任务状态,退出代码,退出信号等。优先级
:相对于其他进程的优先级。程序计数器
:程序中即将被执行的下一条指令的地址。内存指针
:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针上下文数据
:进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。I/O状态信息
:包括显示的I/O
请求,分配给进程的I/O
设备和被进程使用的文件列表。记账信息
:可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。其他信息
2.查看进程
PID
为子进程标志,相当于学生的学号。- 进程的信息可以通过
/proc
系统文件夹查看
输入ls /proc/
指令,可以看到不同PID的文件
+ 大多数进程信息同样可以使用top和ps
这些用户级工具来获取
创建myprocess.c
文件,如下:
#include<stdio.h>
#include<unistd.h>
int main()
{ while(1) { printf("我是一个进程....\n"); sleep(1); } return 0;
}
创建自动化构建文件Makefile
文件,如下:
myprocess:myprocess.c gcc -o $@ $^
.PHONY:clean
clean: rm -rf myprocess
Xshell代码运行的结果如下:
在另一个窗口输入如下指令:
$ ps ajx | head &&ps ajx | grep myprocess//获取含myprocess的进程PID
指令运行的结果如下:
./myprocess
为正在运行的可执行程序,grep --color=auto myprocess
为刚才我们运行的获取PID指令中包含了myprocess
,说明输入的指令在系统中变成了进程运行。
可以使用如下指令过滤掉grep myprocess
进程:
$ ps ajx | head -1 && ps ajx | grep myprocess | grep -v grep
关闭进程的指令:
$ ps -9 进程的PID//杀进程
查看进程文件:
$ ls /proc/4356/ -l //获取PID为4356的进程文件详细信息
进程文件详细信息部分截图如下:
3.通过系统调用获取进程表示符
在前面操作系统的学习中,操作系统通过数据结构将描述
的进程信息组织起来
管理,我们作为普通用户很难和操作系统打交道,所以不能直接获取当前进程PID;但是可以通过操作系统上层封装的系统调用接口,获取PCB结构描述的信息,接下来让我们认识两个系统调用接口:
getpid()
:获取子进程PID
的信息。
getppid()
:获取父进程PPID
的信息。
创建proc.c
文件,写入如下代码:
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{ printf("我是一个子进程,pid为:%d\n",getpid()); printf("我是一个父进程,ppid为:%d\n",getppid()); return 0;
}
代码运行的结果为:
重新运行
./proc
文件,其子进程一直在变(比如某学生高考失利进入复旦大学时,他可以获得一个学号,当他第二年复读再次考入复旦大学时,他又获得一个学号,而这两个学号是不同的),而父进程一直都不变。
$ ps ajx | head -1 && ps ajx | grep 3216 //父进程
父进程
ppid
为bash
命令行进程,给我们输入指令的!
4.通过系统调用创建进程—fork初识
使用man
指令,查找fork
函数的信息
解释:
fork函数创建一个新的进程,让当前的父进程返回当前的子进程,创建新的子进程返回0。
eg1:
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h> int main()
{ printf("我是使用fork()之前的语句\n"); pid_t ret=fork(); printf("我是使用fork()之后的语句\n"); return 0;
}
代码运行的结果为:
可以发现
fork()
函数创建新的子进程,当前的进程执行了printf
语句,创建的进程执行了一遍的printf
语句,所以fork()
后面的语句被执行两遍。
eg2:
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{ printf("begin: 我是一个进程,pid:%d,ppid:%d\n",getpid(),getppid()); pid_t ret=fork(); if(ret==0) { while(1) { printf("我是子进程,pid:%d,ppid:%d\n",getpid(),getppid()); sleep(1); } } else if(ret>0) { while(1) { printf("我是父进程,pid:%d,ppid:%d\n",getpid(),getpid()); sleep(1); } } return 0;
}
代码运行的结果为:
指令:
while :; do ps ajx | head -1 ; ps ajx | grep proc |grep -v grep;sleep 1;done
在另一个窗口执行该指令:
使用fork函数创建新的进程,使用
if
语句,根据父进程返回当前的子进程(返回的值大于0),旧的子进程返回0,实现分流执行不同的代码。
问题1:为什么fork函数返回子进程,父进程返回当前的子进程?
一般而言fork函数之后的代码,父子进程共享;返回不同的值,让不同的执行流,执行不同的代码!
问题2:fork函数如何做到返回两次?
①创建子进程
PCB
;②填充PCB
的内容;③让父子进程共享同一份代码;④父子进程的task_struct
,可以被CPU调用…最后执行return
语句返回,return
语句之前fork
函数的主要工作已经完成了(即创建新的子进程),所以return
语句为父子进程共享的语句,所以父进程返回一次,子进程返回一次。
问题3:fork干了什么事?
进程之间是不会相互影响,相互独立
:①fork
创建了子进程,子进程依据父进程为模板PCB模板创建自己的PCB
,指向父进程的代码;②那指向的数据是否相同呢?子进程和父进程刚开始指向的数据相同,当操作系统检测到子进程要修改数据时会开空间,会发生写时拷贝,但不是把父进程的数据全部拷贝,子进程只会拷贝自己能使用的数据,避免造成资源浪费。
问题4:一个变量怎么会有不同的内容?
我们已经知道了fork函数可以返回两次,并且同一个变量可以接收两次不同的值(即访问不同的内存)!那是怎么做到一块地址空间是怎么接收呢?我们后面再进行学习🎉🎉🎉
问题5:如果父子进程被创建好,fork往后,哪个进程被先运行呢?
哪个进程先运行,是由调度器(挑选进程)决定的,我们是不能确定的!
问题6:执行不同命令时子进程不同,但这些子进程的父进程都为bash进程,为什么呢?
bash
内部也是通过fork函数创建子进程的,bash
进程执行接收新的命令、打印出命令行提示符等任务,而bash
创建的子进程执行解释新的命令,所以我们当前运行的所有的命令都是bash
的进程。