【从浅学到熟知Linux】冯诺依曼体系结构及进程概念详谈！

在这里插入图片描述

🏠关于专栏：Linux的浅学到熟知专栏用于记录Linux系统编程、网络编程等内容。
🎯每天努力一点点，技术变化看得见

文章目录

冯诺依曼体系结构
操作系统
- 如何理解管理
- 操作系统概念
- 设计操作系统目的
- 系统调用和库函数概念
进程
- 基本概念
- 描述进程-PCB
- 组织进程
- 查看进程
- 通过系统调用获取进程标识符
- 通过系统调用创建进程

冯诺依曼体系结构

我们常见的计算机，像我们日常使用的笔记本、台式机；我们不常见的计算机，如服务器，大部分都遵循冯诺依曼体系结构。

在讨论冯诺依曼体系结构前，我们先来了解一下该结构涉及的5个部分：输入设备、输出设备、存储器、运算器、控制器。（下面给出了这5个组件的举例）

组件名称	举例
输入设备	键盘、摄像头、话筒、磁盘、网卡…
输出设备	显示器、音响、磁盘、网卡…
存储器	内存…
运算器	算术运算单元、逻辑运算单元…
控制器	无举例（负责协调外部就绪事件，如将数据拷贝到内存等）

下图描述的就是冯诺依曼体系结构，其中外部设备（输入、输出设备）在进行数据交互时，都是直接与存储器直接交互。而CPU从存储器直接获取数据或存储数据。在程序需要访问外部设备时，CPU才会与外部设备有间接交互。
在这里插入图片描述
为什么CPU不直接与外部设备直接交互呢？大家可能知道木桶效应，整个木桶的盛水量取决于最低的那块木板。在计算机体系结构中也是这样的。

CPU具有非常快的计算速度，而外部设备的速度太慢了。如果CPU直接与外部设备交互，则CPU在需要获取或输出设备时均要等待外部设备，整机效率取决于外部设备的处理速度。

在这里插入图片描述
如果我们让外部设备与存储器直接交互，让CPU与存储器直接交互。在CPU进行计算时，存储器可以与多个输入设备交互，当CPU需要数据时，直接从内存中获取即可；如果CPU需要写入数据，则将数据给存储器，再由存储器与输出设备交互即可。这样一来，整机的效率就取决于存储器的处理速度。大大提高了计算机的处理效率。

因此，我们可以得出如下结论：↓↓↓

CPU读取数据（数据+代码），都是从内存中读取。站在数据的角度，CPU不和外设直接交互
CPU要处理数据，需要将外设中的数据加载到内存。站在数据的角度，外设直接只和内存打交道

★ps：在冯诺依曼体系结构中，当某个进程需要访问外设时，CPU并不会一直等待外设，而是使用中断的方式将其从CPU上换下来，由其他进程执行。该程序到对应外设上等待外设处理完成后，再向CPU的控制器发送中断信号，表明自己已经处理完成，可以回到CPU上运行。再由控制器来相应的信号、外部事件等。

★ps：计算机中的寄存器的存取效率比磁盘等存储设备速度快，为什么不将整机的存储设备均换成寄存器材质呢？
一方面，寄存器、内存设备掉电易失（没电就没办法存储数据），而磁盘、磁带等设备为磁性存储介质，可以在没电的情况下继续保存出局；另一方面，寄存器、内存价格昂贵，我们当前的计算机普遍是8G左右内存，计算机的价格就已经较为昂贵了，如果计算机将几百G的磁盘换成内存，则一台计算机的价格将比现在的计算机贵上百倍。

★ps：什么叫做IO？从外部设备将数据拷贝到内存就是Input，从内存将数据拷贝到外部设备就是Output，这就是IO。

★ps：为什么程序要运行，必须先将程序加载到内存？这其实就是冯诺依曼体系结构决定的。硬件设备为了提高整机效率，规定了CPU只能从内存读取数据及指令。因此，软件执行必须遵守硬件规定，必须将待执行程序加载到内存。

【举例说明】如果在厦门，要给远在哈尔滨的朋友发送一条消息。

此时我需要使用使用键盘（外部设备）打字，键盘数据被写入存储器中；CPU从存储器中获取键盘数据，确定要怎么传输之后，将CPU处理后的数据放到存储器中；再由存储器将该数据传给网卡；我的网卡与对方的网卡交互之后，对方网卡将获取的数据写入存储器；对方存储器再将数据传给CPU，CPU对传来的数据进行解码等操作，再将解码后的数据存入存储器；由存储器负责将数据传给显示器进行显示。
在这里插入图片描述

★关于冯诺依曼体系结构需要强调以下几点：

这里的存储器指的就是内存，不考虑缓存的情况
这里的CPU能且只能对内存进行读写，不能访问外设（输入、输出设备）
外设（输入、输出设备）要输入或输出数据，只能写入内存或从内存中读取
在冯诺依曼体系中，所有设备只能和内存打交道（以存储器为中心）

操作系统

如何理解管理

例子1：学校管理
大学里校长是怎么管理成千上午的学生的呢？我们知道，大学里面有辅导员、班长。他们协助校长管理学生，校长不直接与学生打交道，而是通过辅导员和班长来管理学生。

管理学生的本质是对学生数据做管理，也就是对学生的学号、姓名、成绩等等信息做管理。因而，我们可以使用一个结构体来定义一个学生类型，再使用顺序表或者链表来组织学生信息。这种思想叫做“先描述，再组织”。当校长发现某个数据有问题时，他并不是直接找到这个学生，而是让辅导员处理这个数据问题。

从这可知，管理者和被管理者可以不执行交互（沟通），拿到被管理者的核心数据（用于进行管理决策）才是最重要的。

在这里插入图片描述
知识点：操作系统如何管理外设
在计算机有个大boss——操作系统，它不直接与外部设备打交道，而是通过驱动程序管理外部设备。操作系统实际管理的就是一组外设的结构体数据的管理（即对数据进行增删查改）。
在这里插入图片描述
例子2：银行提供服务
生活中，我们需要到银行存取钱的时候，都需要到柜台窗口办理业务；再由业务人员与内部金库做交互。为什么不能让用户直接进入金库呢？因为，银行无法甄别哪些人是坏人。为了管理方便，直接拒绝用户进入金库，而提供了柜台这种形式的服务。这种方式不仅能给用户提供服务，还保证了银行的安全。
在这里插入图片描述

知识点：操作系统提供接口式服务
操作系统与银行类似，它既要给用户提供服务，但又担心用户的非法操作。因此，操作系统提供了一个又一个的接口（函数），这样既能给用户提供服务，又能保证操作系统的安全。

★ps：Linux是使用C语言实现的，因此Linux的系统调用本质就是使用C语言实现的函数。

银行的组织结构与操作系统相似。行长借助安保、保洁、技术员等管理了银行里的各项资源；而操作系统借助驱动程序管理计算机上的各项资源（软硬件资源）。为了给用户提供服务，他们都使用了接口式服务，但这种接口式服务对于某些用户来说，仍然使用不便。因而，银行就有了协助老年用户的引导员；而操作系统就有了图形化界面、shell外壳、第三方库来为用户提供便捷的服务。此外，操作系统上，还有各种使用第三方库、系统调用等实现的应用程序（如抖音、淘宝等），为用户提供更加便捷的服务。

在这里插入图片描述

操作系统概念

任何计算机系统都包含一个基本的程序集合，称为操作系统（OS）。它给用户提供了一个稳定、安全、简单的执行环境。

笼统的理解，操作系统包括：①内核（进程管理、内存管理、文件管理、驱动管理）②其他程序（例如：库函数、shell程序等）

在整个计算机软硬件架构中，操作系统的定位是：一款纯正的“搞管理”的软件

设计操作系统目的

与硬件交互，管理所有的软硬件资源
为用户程序（应用程序）提供一个良好的执行环境

下图是操作系统在整个计算机体系中起着承上启下的作用。操作系统对下通过驱动程序管理各种硬件；对上为用户提供各种系统接口，对各个软件进行管理。
在这里插入图片描述
★ps：计算机管理硬件：①描述起来，用struct结构体 ②组织起来，用链表或其他高效的数据结构

系统调用和库函数概念

在开发角度，操作系统对外会表现为一个整体，但是会暴露自己的部分接口，供上层开发使用，这部分由操作系统提供的接口，叫做系统调用。

系统调用在使用上，功能比较基础，对用户的要求相对也比较高，所以，有心的开发者可以对部分系统调用进行适度封装，从而形成库，有了库，就很有利于更上层用户或者开发者进行二次开发。

进程

其实，我们启动一个软件本质就是启动一个进程。在Linux系统上，运行一条命令，如"ls -al"，其实就是在系统层面创建了一个进程。因而我们可以得到如下概念↓↓↓

基本概念

●课本概念：程序的一个执行实例，正在执行的程序等。
●内核观点：担当分配系统资源（CPU时间、内存）的实体。

Linux是可以同时加载多个程序的，也就是说，Linux是可以在系统中同时存在大量的进程的。那么，Linux系统就必须对这些进程进行管理。Linux系统是如何管理大量的进程的呢？答案是：先描述，再组织。

对于进程来说，它包含各种属性数据，因此需要一个结构来存储它，即PCB（进程控制块）。

计算机中存在大量的可执行文件，我们双击可执行文件后，本质是将可执行文件从磁盘加载到内存中，该可执行文件中包含了程序的代码和数据。但操作系统中有大量运行的程序，为了管理好这些程序，需要使用PCB结构体将各个运行的程序（进程）的属性数据进行保存。这样操作系统才知道该进程已经运行到哪一行，是否已经执行结束等。

★ps：在操作系统中，会维护一个运行队列run_queue，该队列上链接着等待CPU资源的进程的PCB。当CPU空闲时，则会从run_queue中选择一个进程到CPU中执行，这就是进程调度。
在这里插入图片描述
由此，我们可以知道：进程=对应的代码和数据+进程对应的PCB结构体

描述进程-PCB

●进程信息被放在一个叫做进程控制块的数据结构中，可以理解为进程属性的集合。
●课本上将其称之为PCB，Linux操作系统下的PCB就是task_struct。

在Linux中描述进程的结构体叫做task_struct。task_struct是Linux内核的一种数据结构，它会被装载到内存里并且包含着进程的信息。下表是对task_struct中存储内容的分类↓↓↓

存储项概述	具体描述
标识符	描述进程的唯一标识符，用来区别其他进程
状态	任务状态、退出代码、退出信号等
优先级	相对于其他进程的优先级
程序计数器	程序中即将被执行的下一条指令的地址
内存指针	包括程序代码和进程相关数据的指针，还有和其他程序共享的内存块的指针
上下文数据	进程执行时处理器的寄存器中的数据
I/O状态信息	包括显示的I/O请求，分配给进程的I/O设备和被进程使用的文件列表
记账信息	可能包括处理器时间总和，使用的时钟数总和，时间限制，记账号等
其他信息	——

针对于上表中的上下文数据，这里给出一个生活示例进行说明：

大学生参军复学例子
大学里有不少同学会选择参军，如果小明他大二上学期打算参军。此时他可以直接去参军，不和学校内的学生信息管理机构上报吗？如果小明他直接参军，而没有在校报备，等他1年后回来，由于他全科挂科、旷课，被开除了，他就需要从大一重新开始读。

显然，小明去参军是需要和学校报备的，此时学生信息管理机构会将小明的信息存储起来。小明参完军是不是应该跟学校再报备一次，并将学生信息恢复为正常在读状态呢？那是当然。

这里的上下文就等同于小明的在校的信息（上到大二年级，等同于程序执行到第2行代码），像这种离开时将自己的信息保存封存下来，回来后再将信息恢复，这样的操作称为上下文切换（上下文保存及上下文恢复）。当小明回到学校，继续读大二年纪，而不是从大一重新开始读；就等同于程序回到CPU不是从头运行，而是从上次运行停止处继续向下运行。

组织进程

进程结构可以在内核代码中找到它，所有运行在Linux操作系统里的进程都以task_struct链表的形式存储在内核内。

查看进程

进程的信息可以通过/proc系统文件夹查看。我们通过"ls"命令，可以看到/proc目录下有许多带数字的文件夹，这些数字就是进程id，用于唯一标识一个进程。
在这里插入图片描述
如要获取id为26126的进程信息，我们只需要进入名为26126的目录中查看即可。使用"ls -al"查看目录内的详细内容（这些都是该进程的相关信息），其中，cwd是当前进程的工作目录，exe是当前进程对应的可执行文件的存储位置。如果创建了一个新的进程，则会在/etc目录下创建一个名称与该进程pid相同的目录，目录中保存该进程的相关属性、数据及代码；若终止该进程，则对应的目录会被操作系统自动删除。
在这里插入图片描述
还可以使用top命令查看进程的相关信息，其中PID就是进程号（进程id）。

除了上述两种方法，我们还可以使用ps命令配合选项查看进程的相关信息。↓↓↓

示例演示
下面我们编写如下代码，并将它编译运行（可执行文件名为test）。

#include <stdio.h>
#include <unistd.h>int main()
{while(1){sleep(1);}return 0;
}

执行./test程序后，我们再执行ps axj | head - 1 && ps axj | grep test，可以查看到执行该程序的进程信息↓↓↓
在这里插入图片描述
★ps：如果想终止当前在执行的程序，可以使用ctrl+C，或使用kill -9 [进程id]来结束对应程序。

通过系统调用获取进程标识符

我们可以调用getpid获取当前进程的标识符（进程id），调用getppid获取当前进程的父进程的标识符（父进程id）。在使用该接口时，需要包含sys/types和unistd两个头文件。
在这里插入图片描述
下面代码为getpid及getppid的使用示例，运行结果在代码下方↓↓↓

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>int main()
{while(1){printf("my pid is %d\n", getpid());printf("my parent's id is %d\n", getppid());sleep(1);}return 0;
}

在这里插入图片描述
我们可以使用ps命令来验证一下上面的pid和ppid是否是当前进程和它的父进程的id↓↓↓

getpid可以获得当前进程的pid，getppid确实可以获得当前进程的父进程。但当前的父进程是哪个程序呢？？我们使用ps -p [进程pid]获取来获取对应pid的进程信息，我们可以发现，该进程的父进程是bash。
在这里插入图片描述
为什么父进程是bash呢？bash就是当前与我们进行交互的命令行，为了防止bash执行时该程序崩溃退出，导致整个命令行无法使用。bash会创建子进程，让该子进程执行该程序，即使子进程崩溃退出，也不会影响bash。

通过系统调用创建进程

可以使用fork创建进程。如果创建进程成功，则会给父进程返回子进程id，给子进程返回0；如果创建失败，则会给父进程返回-1。
在这里插入图片描述
下面代码演示了如何创建子进程（程序执行结果如代码下方图片所示）↓↓↓

#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <unistd.h>int main()
{pid_t id = fork();if(id < 0)//创建子进程失败{perror("fork");exit(1);}else if(id == 0)//子进程执行{printf("I am child process, my pid is %d, my ppid is %d\n", getpid(), getppid());exit(0);}else//父进程执行{printf("I am parent process, my pid is %d\n", getpid());}return 0;
}