目录
- 1、管道
- 2、进程池
- 3、命名管道
- 4、共享内存
1、管道
我们知道进程具有独立性,但是在一些场景中进程间也需要通信,那怎么实现进程间的通信呢?
进程间通信的核心是:由OS提供一份公共的内存资源。
进程间通过文件的内核缓冲区实现资源共享,这个过程并不需要磁盘参与,所以设计了一种内存级的文件来专门实现进程间通信,这个内存级文件就是管道。
什么是管道?
- 管道是Unix中最古老的进程间通信的形式
- 从一个进程连接到另一个进程的一个数据流称为一个“管道”
管道的原理:
管道只能进行单向通信。
必须要先打开文件,再创建子进程,不能先创建子进程,再打开文件。这个过程利用的是子进程会继承父进程相关资源的特性。
- 为什么父进程打开文件的时候必须要以“读写”方式打开,不能只读或只写?
因为父进程打开文件,创建子进程后,父子进程必须有一个写,一个读,不能两个都读或两个都写。
管道不需要路径,也就不需要名字,所以叫做匿名管道。
#include <iostream>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
using namespace std;int main()
{//1、创建管道int fds[2] = {0};int n = pipe(fds);if (n != 0){cerr << "pipe error" << endl;return 1;}//2、创建子进程pid_t id = fork();if (id < 0){cerr << "fork error" << endl;return 2;}else if (id == 0){//子进程//3、关闭不需要的fdclose(fds[0]);//0是读exit(0);}else{//父进程close(fds[1]);//1是写pid_t rid = waitpid(id, nullptr, 0);if (rid > 0){cout << "father wait child success, id :" << rid << endl;}}return 0;
}
上面的操作只是让父子进程看到了同一份资源,但还没有实现通信。这个内存资源有OS提供,所以进程间通信也理应通过操作系统实现,也就是调用系统调用。
//...else if (id == 0){//子进程//3、关闭不需要的fdclose(fds[0]);//0是读int cnt = 0;while (true){string message = "hello world, hello ";message += to_string(getpid());message += ", ";message += to_string(cnt++);write(fds[1], message.c_str(), message.size());sleep(1);}exit(0);}else{//父进程close(fds[1]);//1是写char buffer[1024];while (true){ssize_t n = read(fds[0], buffer, 1024);if (n > 0){buffer[n] = 0;cout << "child->father, message: " << buffer << endl;}}pid_t rid = waitpid(id, nullptr, 0);if (rid > 0){cout << "father wait child success, id :" << rid << endl;}}//...
- 子进程写,父进程读。看待父子进程,就像看待文件一样。
在上面子进程sleep
的过程中,父进程在做什么呢?在阻塞等待。
父进程在读完了子进程的数据后,OS就不要父进程读了,让其进入阻塞状态,等待子进程再次写入。这是为了保护共享资源,防止子进程写了一半父进程就读,或者父进程读了一半子进程就写。这个过程是管道内部自己做的。
现象:
- 管道为空&&管道正常,
read
会阻塞(read是一个系统调用)。 - 管道为满(管道资源是有限的)&&管道正常,
write
会阻塞。 - 管道写端关闭&&读端继续,读端读到0,表示读到文件结尾。
- 管道读端关闭&&写端继续,OS杀掉写入的进程。
特性:
- 面向字节流。不关心对面是如何写的,按需读取。
- 用来进行具有血缘关系的进程,进行IPC,常用于父子。
- 文件的声明周期随进程,管道也是。
- 单向数据通信。
- 管道自带同步互斥等保护机制。
2、进程池
退出进程池
当关闭写端,读端读到0,表示读到文件结尾,则结束进程。即将父进程所有的读端关闭,则相应的子进程就会结束,最后再由父进程等待回收。
void CleanProcessPool()
{//virsion1for (auto &c : _channels){c.Close();}for (auto &c : _channels){pid_t rid = waitpid(c.GetId(), nullptr, 0);if (rid > 0){cout << "child: " << rid << "wait...success" << endl;}}
}
:上面关闭读端和等待子进程为什么要分开,关一个等待一个行吗?
根据上面的分析,所有的子进程的file_struct
都会指向第一个管道,越往后的子进程指向的管道越多。所以我们只是把master
的file_struct
中指向管道关闭,这个管道还有其他子进程的file_struct
指向,因此读端不会读到0,子进程不会退出,就会一直阻塞。解决这个问题有两种办法:
1、倒着关闭
因为通过分析可知,越早创建的管道指向越多,最后一个管道只被指向一次,只要将最后一个进程关闭,则前面的所有管道被指向都会少1,因此倒着关闭就不会出现阻塞的问题。
//virsion2
for (int i = _channels.size()-1; i >= 0; i--)
{_channels[i].Close();pid_t rid = waitpid(_channels[i].GetId(), nullptr, 0);if (rid > 0){cout << "child: " << rid << "wait...success" << endl;}
}
2、在子进程中关闭所有历史fd
因为父进程的3号文件描述符总为空,子进程只有3号文件描述符指向管道。在这之前子进程继承父进程对之前的管道的指向,所以只需要在子进程中把这些指向全部关掉就行。
// 3、建立通信信道
if (id == 0)
{//关闭历史fdfor (auto &c : _channels){c.Close();}// 子进程//close(pipefd[1]);//dup2(pipefd[0], 0); // 子进程从标准输入读取//_work();//exit(0);
}
3、命名管道
我们知道了,匿名管道的原理,是让父子进程看到同一份资源,而父子进程看到同一份资源,是因为子进程继承了父进程的资源。所以不难得出,匿名管道两端必须是父子进程。而如果我们想在任意进程之间建立管道呢?首先可以肯定的是这任意两个进程之间也要能看到同一份资源,因为是任意进程之间所以这个资源不能继承而来,所以就牵扯出了命名管道。
匿名管道是内存级的虚拟文件,而命名管道是真实存在的文件。
可以看到管道文件
fifo
的大小依旧为0,所以两个进程间通信的数据并没有刷新保存到磁盘中。
-
命名管道的原理:
为什么叫做命名管道,因为有名字,是真实存在的文件,既然是真实存在的文件,就一定有路径+文件名,而路径+文件名具有唯一性。这样不同的进程可以用同一个文件系统路径标志同一个资源,也就是不同的进程看到了同一个资源。 -
命名管道和普通文件的区别:
这么看来命名管道和普通文件好像除了创建方式不同外也没多大区别,而普通文件好像也能实现进程间通信,但是普通文件有两个问题,我们往普通文件中写入的数据会被刷新到磁盘中保存,另外普通文件也没有被特殊保护,也就是我们可以往里写大量的数据,在写的过程中也有可能被其他进程读,这两个问题是命名管道需要重点处理的,所以命名管道和普通文件有很大的区别,是特殊设计的。 -
这个命名管道,该由谁创建?
公共资源:一般要让指定的一个进程现行创建。一个进程创建&&使用,另一个进程获取&&使用。
4、共享内存
共享内存区是最快的IPC形式。一旦这样的内存映射到共享它的进程的地址空间,这些进程间数据传递不再涉及到内核,换句话说是进程不再通过执行进入内核的系统调用来传递彼此的数据。
-
共享内存 = 共享内存的内核数据结构 + 内存块。
-
让两个进程通过各自的虚拟地址空间,映射同一块物理内存,叫做共享内存。共享内存的本质还是让不同的进程看到同一个资源。
IPC_CEEAT
:单独使用,如果shm
不存在则创建,如果存在则获取。保证调用进程就能拿到共享内存。IPC_CEEAT
|IPC_EXCL
:组合使用,如果不存在则创建,如果存在则返回错误。只要成功,一定是新的共享内存。
:key
为什么必须要用户传入,为什么内核自己不生成?
- 任意进程间是独立的,由某一个进程内生成
key
,其他的进程是拿不到的。 - 理论上用户可以随意设置
key
,只要保证不冲突就可,为了保证key
的唯一性有函数来减小冲突的概率。
定义全局的key
,让进程间通过绝对路径都能看到,由某个进程设置进内核中,则其他进程也能够得到。
所以在应用层面,不同进程看到同一份共享内存是通过唯一路径+项目ID来确定的,类似命名管道也是通过文件路径+文件名来确定的。
在OS看来,由shmget
函数创建的共享内存是OS创建的,所以共享内存的生命周期随内核。 和文件不同,文件的生命周期随进程。所以共享内存一旦创建出来,要么由用户主动释放,要么OS重启。
共享内存的管理指令:
ipcs -m
:查看共享内存信息ipcrm -m shmid
:删除共享内存
需要注意的是,删除共享内存只能通过
shmid
删除,不能通过key
删除。
shmid VS key:
shmid
:仅供用户使用的shm
标识符(类似文件描述符fd)key
:仅供内核区分不同shm
唯一性的标识符(类似文件地址)
除了指令删除shm
,还可以通过函数删除:
共享内存也有权限。
栈区、堆区、共享区等地址空间,是用户空间,我们不需要调用系统调用就可以直接使用。
| 共享内存的特点:
- 不需要调用系统调用,通信速度快。
- 让两个进程在各自的用户空间共享内存块,是真正的共享资源,但是不像管道,共享内存没有任何保护。
- 共享内存的保护机制,需要用户自己完成。
本篇文章的分享就到这里了,如果您觉得在本文有所收获,还请留下您的三连支持哦~