【Linux】第十九站:进程替换

文章目录

  • 一、单进程版---最简单的程序替换
  • 二、进程替换的原理
  • 三、多进程的程序替换
    • 1.多进程的程序替换实例
    • 2.那么程序在替换时候有没有创建子进程呢
    • 3.再谈原理
    • 4.一个现象
    • 5.我们的CPU如何得知程序的入口地址?
  • 四、各个接口的介绍
    • 1.execl
    • 2.execlp
    • 3.execv
    • 4.execvp
    • 5.execle

一、单进程版—最简单的程序替换

在linux中存在这样的一批接口,exec系列的接口,我们可以用man手册去查看

man 3 exec

image-20231118152515461

我们先来看一下execl函数,它的第一个参数是路径,即某个程序的路径,第二个是该程序,后面的可变参数列表是该程序的选项,我们可以自己随意填写。但是最后一个一般是为NULL的,这是标准写法,但是有些编译器,即便不写NULL也是可以的

我们可以先简单的跑一下这个代码

#include<stdio.h>    
#include<unistd.h>    
#include<stdlib.h>    
int main()    
{    printf("before: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());execl("/usr/bin/ls","ls","-a","-l",NULL);printf("after: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());                                   return 0;                    
}   

运行结果为

image-20231118160059753

我们可以看到,这个进程将ls这个命令给跑起来了,而且最后after是没有被执行的。

甚至我们也可以这样做

#include<stdio.h>    
#include<unistd.h>    
#include<stdlib.h>    
int main()    
{    printf("before: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());     execl("/usr/bin/top","top",NULL);                                                                printf("after: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());    return 0;                                                   
}     

这样的话,最终会执行这个top命令的

image-20231118160334351

所以我们现在知道了使用这个execl后会发生什么事情了

将别人的程序给替换一下,然后去跑别人的程序。在替换之后,后面的程序都不会去跑了。

二、进程替换的原理

如下图所示

在程序一开始的时候,CPU调度这个进程,然后这个进程会将磁盘中的代码和数据加载到物理内存中,开始执行代码

image-20231118163116605

当我们前面的程序在执行execl时候

它里面由于用的是ls,所以ls直接将原来的代码和数据给替换下来

image-20231118163502480

也就是说,对于页表以左部分是不会变化的,只会将右侧部分的代码和数据给替换,然后将页表给稍微调整一下即可。

总之就是用自己原来的代码和数据替换为新的代码和数据,然后从新的代码和数据从0开始执行,重新开始执行。

这就是程序替换

三、多进程的程序替换

1.多进程的程序替换实例

我们用如下代码

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/types.h>
#include<sys/wait.h>
int main()
{pid_t id = fork();if(id == 0){printf("before: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());sleep(5);execl("/usr/bin/ls","ls","-a","-l",NULL);printf("after: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());exit(0);}pid_t ret = waitpid(id,NULL,0);if(ret > 0) {printf("wait success,father pid : %d, ret id : %d\n",getpid(),ret);}sleep(5);return 0;
}

搭配上监控,我们来测试观察一下现象

image-20231118171230433

一开始,父子进程同时运行,但是父进程直接进入进程等待,等待子进程结束。对于子进程则是执行了一行代码后,进程替换。然后随之结束。

子进程执行进程替换的时候,需要替换代码和数据,但是并不会影响父进程,因为有写时拷贝,以及进程之间是要保持独立性的

注意:对于数据有写时拷贝我们可以理解,对于代码而言,也是存在写时拷贝的。所以代码也并不是那么的绝对不可写入的,主要看谁去修改。这里是由操作系统去修改的,当然是可以的。

image-20231118172148965


2.那么程序在替换时候有没有创建子进程呢

其实是没有的,还是在原来的进程上,从我们前面的运行结果可以看出来,进程等待完毕后,还是原来的子进程

所以这里只进行程序代码和数据的替换工作


3.再谈原理

用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数,以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变

image-20231118173516864


4.一个现象

我们可以注意到,exec系列函数之后的代码似乎没有被执行

所以说程序替换成功之后,exec*后续的代码不会被执行,如果替换失败,才可能执行后续代码,exec*函数,它只有在失败的时候,才会有返回值,如果成功是不会返回任何值的,因为也没办法返回。

所以其实我们上面的代码可以稍作修改

在这里我们可以让他退出的时候退出码为1,因为为0也没有什么意义,程序替换失败才会执行到这里。

image-20231118174536137


5.我们的CPU如何得知程序的入口地址?

Linux中形成的可执行程序,是有格式的,ELF,这个可执行的程序有它自己的表头。可执行程序入口地址就在表头。

所以说,在程序加载到内存的时候,一定会先将表头入口地址加载到内存中的,然后后面的在慢慢加载

当我们程序替换以后,它也有自己的表头,CPU可以直接读取到表头的入口地址,从而进行执行。

四、各个接口的介绍

我们可以用man手册查找到,其实,对于exec系列有很多个接口,一共有七个,但是man手册中的三号手册有6个

image-20231118180935126

还有一个是在2号手册中的。

image-20231118183450967

在exec系列的函数中,开头都是exec开头的

1.execl

int execl(const char *path, const char *arg, ...);

这个l我们可以理解为list,即列表。

如下所示,像我们刚刚所用到的这个函数

execl("/usr/bin/ls","ls","-a","-l",NULL); 

list就相当于,在传参的时候,从第二个开始,一个一个的往里传参的,像链表一样,最后一个结点为空

像我们之前在命令行跑这个程序的时候,是这样的

image-20231118184332045

而现在,我们只需要将中间的空格改为逗号,最后加一个NULL,输入指令的时候是怎样的,最后就如何去传参。

对于第一个参数,我们要知道,执行一个程序的第一件事情一定是先找到这个程序。所以第一个参数就是用来找到这个程序的。

找到这个程序之后,接下来要怎么办???

找到这个程序以后,要做的就是如何执行这个程序,要不要涵盖选项,涵盖哪些?

所以最终就是命令行怎么写,我们就怎么传

2.execlp

如下所示,是第二个该系列的接口

 int execlp(const char *file, const char *arg, ...);

这个我们会发现,多了一个p

这个p其实就是PATH的意思,execlp会在默认的PATH环境变量中查找。

对于第一个参数,这里我们可以带上它的路径,也可以不带上路径,后面的参数都是和前面的函数一样的

如下是带上路径的

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/types.h>
#include<sys/wait.h>
int main()
{pid_t id = fork();if(id == 0){printf("before: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());sleep(5);execlp("/usr/bin/ls","ls","-al",NULL);printf("after: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());exit(1);}pid_t ret = waitpid(id,NULL,0);if(ret > 0) {printf("wait success,father pid : %d, ret id : %d\n",getpid(),ret);}sleep(5);return 0;
}

运行结果为

image-20231119154631267

如果我们不带上路径

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/types.h>
#include<sys/wait.h>
int main()
{pid_t id = fork();if(id == 0){printf("before: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());sleep(5);// execlp("/usr/bin/ls","ls","-al",NULL);execlp("ls","ls","-al",NULL);printf("after: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());exit(1);}pid_t ret = waitpid(id,NULL,0);if(ret > 0) {printf("wait success,father pid : %d, ret id : %d\n",getpid(),ret);}sleep(5);return 0;
}

运行结果为

image-20231119154747955

在这里所有的子进程都会继承父进程的环境变量。环境变量具有全局属性,所以最终可以解决路劲的问题。

不过在这里,我们可能会觉得这个函数的用法比较奇怪

 execlp("ls","ls","-al",NULL);

我们会注意到写了两个ls,很奇怪,其实这是合理的,第一个ls解决的是路径的问题,即去找到这条指令,后面是执行该指令的问题。

而要找到该指令,环境变量帮我们解决了一部分,剩下的就是在该路径下找到该指令到底有没有,要找到该指令的程序名

3.execv

其中这个v代表的就是vector。

int execv(const char *path, char *const argv[]);

这里没有带p,所以它就是需要路径去寻找。

像前面的两个都是以可变参数列表的形式传入的,现在这个使用的是字符串指针数组。

这个和前面不同之处就在于,将前面的改为了指针数组的形式。因为我们的指令最终也是要被解析为一个一个的字符串。所以这个操作直接就是将这些字符串整合为了一共字符串指针数组而已,没有什么太大的变化

image-20231119160312752

如下代码所示

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/types.h>
#include<sys/wait.h>
int main()
{pid_t id = fork();if(id == 0){char* const myargv[] = {"ls","-a","-l",NULL};printf("before: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());sleep(5);//  execlp("/usr/bin/ls","ls","-al",NULL);//  execlp("ls","ls","-al",NULL);execv("/usr/bin/ls",myargv);printf("after: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());exit(1);}pid_t ret = waitpid(id,NULL,0);if(ret > 0) {printf("wait success,father pid : %d, ret id : %d\n",getpid(),ret);}sleep(5);return 0;
}

运行结果为

image-20231119161027701

我们知道ls是一个被编译好的程序,ls有它自己的main函数,ls也有它自己的命令行参数,而它的命令行参数就是在这个系统调用中传入的。以及前面的execl也是一样的,它这种链表的形式,也要最终变为一共指针数组,然后进行命令行传参

在linux,所有的进程都是被人的子进程,在命令行中,所有的进程都是bash的子进程

所以,所有的进程在启动的时候都是采用exec系列的函数启动执行的!

所以进程替换,在单进程中,是把在内存中开辟空间以后,然后把程序和代码加载到内存当中

所以exec系列函数承担的是一个加载器的效果!把可执行程序导入到内存中。而且由于它还能接收命令行参数,所以调用可执行程序的时候,就可以将这个argv传入给可程序程序

4.execvp

所以有了前面三个函数的基础,我们也就可以理解下面这个函数了

int execvp(const char *file, char *const argv[]);

无非就是可以不用传入路径了,它可以直接在环境变量中找到对应的路径,然后我们只需要去找到这个可执行程序即可。

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/types.h>
#include<sys/wait.h>
int main()
{pid_t id = fork();if(id == 0){char* const myargv[] = {"ls","-a","-l",NULL};printf("before: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());sleep(5);//  execlp("/usr/bin/ls","ls","-al",NULL);//  execlp("ls","ls","-al",NULL);//execv("/usr/bin/ls",myargv);execvp("ls",myargv);printf("after: I am a process, pid:%d,ppid:%d\n",getpid(),getppid());exit(1);}pid_t ret = waitpid(id,NULL,0);if(ret > 0) {printf("wait success,father pid : %d, ret id : %d\n",getpid(),ret);}sleep(5);return 0;
}

运行结果如下

image-20231119163619064

5.execle

对于这个e,它代表的是env,即环境变量,换言之,它可以传入我们自己的环境变量

int execle(const char *path, const char *arg, ..., char * const envp[]);

对于这个函数而言,前面的三个参数和execl是完全一样的,

如果exec*可以执行系统命令,能不能执行我们自己的命令呢?

当然是可以的

这里我们先试着使用makefile工具一次生成多个可执行程序

我们先来创建一个c++代码(注意,对于c++代码,我们可以有三种后缀,cc、cpp、cxx这三种后缀都是一样的可以的)

image-20231119180601520

然后我们将我们的Makefile文件改为这样

image-20231119181702578

.PHONY代表总是执行all这个依赖关系,然而all的依赖关系为这两个可执行程序,所以就会先去执行他们两个的依赖关系。all它本身就是一个伪依赖的,里面什么也不执行。这样的话,就可以执行我们的代码了

此时我们就可以一次生成两个可执行程序了

image-20231119181805847

然后我们试着让这个c语言程序去调用这个c++程序

image-20231119182239107

注意这里的两个参数,第一个代表的想要执行的可执行程序是谁,在哪里。第二个参数表示的是想怎么执行

运行结果为

image-20231119182328406

那么像我们C语言形成的可执行程序既然可以调用C++的可执行程序,那么可以调用那些脚本语言形成的可执行程序吗?

比如我们创建一个.sh为结尾的脚本语言文件

touch test.sh

然后我们打开它,注意脚本语言,第一行一般都是#!开头的,然后它后面跟的是解释器。

image-20231119182959300

然后这个解释器会对我们下面的文件边读取边执行,然后我们可以写一些脚本语言

image-20231119183221453

然后我们要执行的时候就是这样执行的

image-20231119183926077

此时就把刚刚的代码批量化的执行了

所以所谓的脚本语言就是利用这个命令行解释器,从对应的文件里,一行一行的读取然后一行一行的执行

对于这些脚本语言他们也有自己的语法,比如下面的

image-20231119184511908

它的运行结果为

image-20231119184541629

如果我们想要调用这个脚本语言的话,我们可以这样做,让bash这个可执行程序带上test.sh选项即可

image-20231119184839903

运行结果为

image-20231119184822499

我们也可以去执行一个python

image-20231119185514954

直接使用命令行的话,结果如下

image-20231119185541752

我们可以去用.c进程替换一下

image-20231119185727270

运行结果为

image-20231119185759133

总之无论如何,这里是可以跨语言调用的

那么为什么无论是可执行程序,还是脚本,为什么可以跨语言调用呢?

因为所有语言运行起来,本质都是进程,只要是进程,就可以被调用

我们可以在进一步的验证一下传入命令行参数的时候

image-20231119191827577

image-20231119192101848

最终运行结果为

image-20231119192120330

我们可以在试一下第三个命令行参数,环境变量

image-20231119192430322

我们直接运行结果为

image-20231119192504130

我们可以看到,即便我们没有传入环境变量,也会自动将环境变量给传入

那么这是为什么呢?

我们需要先知道,环境变量是什么时候传给进程的。

环境变量也是数据,当我们创建子进程的时候,环境变量就已经被子进程继承下去了!!!,所以像我们之前就可以用extern char** environ去指向环境变量表

我们还发现,在发生程序替换的时候,环境变量信息依然可以打印,所以环境变量信息不会被替换

所以如果想给子进程传递环境变量,那么应该如何传递呢?

这里的传递可以分为两种

  1. 新增环境变量
  2. 彻底替换

我们先来看新增环境变量

我们最简单,最粗暴的方式就是这样的,直接在bash上导入一个环境变量,然后这个环境变量由于不随着程序替换而消失,而是一路继承下去,所以最终的结果就是如下

image-20231119193729999

那么如果我们不想要这么粗暴呢?即只在这个子进程中有这个环境变量,在bash中是没有这个环境变量的

我们之前提过getenv函数获取一个环境变量(还有第三方的的变量,命令行参数两种),其实还有一个函数putenv用于添加一个环境变量

image-20231119193949859

image-20231119194244779

此时我们就可以看到我们的环境变量了

image-20231119194321395

而我们在自己的bash里面是看不到这个环境变量的

image-20231119194445549

所以这个环境变量是可以变得越来越多的

所以如果要新增一个环境变量,在对应的父进程的进程空间直接putenv即可

那么如果我们非要传入呢?

我们就需要用到exele函数了

image-20231119195538690

运行结果为

image-20231119195605849

所以这样就可以传入环境变量了

当然不过上面的都是利用了系统的环境变量,但是如果我们想要自定义环境变量的话,我们可以这样做

image-20231119200100318

最终运行结果为

image-20231119200118244

所以用这种方法当我们传递我们自定义的环境变量时候,采用的策略是覆盖,而不是追加

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/198708.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Navicat 基于 GaussDB 主备版的快速入门

Navicat Premium&#xff08;16.2.8 Windows版或以上&#xff09; 已支持对GaussDB 主备版的管理和开发功能。它不仅具备轻松、便捷的可视化数据查看和编辑功能&#xff0c;还提供强大的高阶功能&#xff08;如模型、结构同步、协同合作、数据迁移等&#xff09;&#xff0c;这…

BGP的基础知识

BGP——边界网关协议 IGP——内部网关协议——OSPF、RIP、ISIS EGP——外部网关协议——EGP、BGP 边界网关协议BGP是一种实现自治系统AS之间的路由可达&#xff0c;并选择最佳路由的路径矢量路由协议。目前在IPV4环境下主要使用BGPV4&#xff0c;目前市场上也存在BGPV4&…

光谱融合——Deep Spatio-spectral Attention Convolutional Neural Networks

Hyperspectral Image Super-Resolution via Deep Spatiospectral Attention Convolutional Neural Networks 简介 论文链接 对于高分辨率多光谱&#xff08;高分辨率意味空间信息更好&#xff09;图像&#xff0c;采用spatial attention机制进行空间信息的保留&#xff0c;对…

【latex】公式推导等号对齐

使用aligned进行多行公式对齐&#xff0c;&作为对齐的节点&#xff0c;\作为公式换行 \begin{equation} \begin{aligned}a& bc \\& cd \end{aligned} \end{equation}

ChatGPT API 学习

参考&#xff1a;从零开始的 ChatGPT API 使用指南&#xff0c;只需三步&#xff01; - 知乎 (zhihu.com) ChatGPT API 是一种由 OpenAI 提供的 API&#xff0c;它可以用最简单的方式把 ChatGPT 的聊天能力接入到各种应用程序或服务中。 自然语言语音识别(Natural Language S…

CPU/GPU实现向量内积

向量内积&#xff08;点乘/点积/数量积&#xff09;&#xff1a;两个向量对应元素相乘之后求和&#xff1a; CPU实现&#xff1a; //cpu 实现一下向量内积#include<stdio.h> template<typedef T> void dot_mul(T *a, T *b, T *c, int n) { double tmp 0;for(i…

三层交换机实现不同VLAN间通讯

默认时&#xff0c;同一个VLAN中的主机才能彼此通信&#xff0c;那么交换机上的VLAN用户之间如何通信&#xff1f; 要实现VLAN之间用户的通信&#xff0c;就必须借助路由器或三层交换机来完成。 下面以三层交换机为例子说明&#xff1a; 注意&#xff1a; 1.交换机与三层交换…

uni-app 使用vscode开发uni-app

安装插件 uni-create-view 用于快速创建页面 配置插件 创建页面 输入页面名称&#xff0c;空格&#xff0c;顶部导航的标题&#xff0c;回车 自动生成页面并在pages.json中注册了路由 pages\login\login.vue <template><div class"login">login</d…

python-opencv 培训课程笔记(1)

python-opencv 培训课程笔记&#xff08;1&#xff09; 博主参加了一次opencv库的培训课程&#xff0c;把课程所学整理成笔记&#xff0c;供大家学习&#xff0c;第一次课程包括如下内容&#xff1a; 1.读取图像 2.保存图像 3.使用opencv库显示图像 4.读取图像为灰度图像 …

现货白银MACD实战分析例子

MACD这个技术指标的全称是平滑异同移动平均线&#xff0c;主要表示经过平滑处理后均线的差异程度&#xff0c;一般用来研判现货白银价格变化的方向、强度和趋势。MT4中的MACD指标&#xff0c;主要是由信号线、&#xff08;上升/下跌&#xff09;动能柱、0轴这三部分组成。 MACD…

9、传统计算机视觉 —— 边缘检测

本节介绍一种利用传统计算机视觉方法来实现图片边缘检测的方法。 什么是边缘检测? 边缘检测是通过一些算法来识别图像中物体之间,或者物体与背景之间的边界,也就是边缘。 边缘通常是图像中灰度变化显著的地方,标志着不同区域的分界线。 在一张图像中,边缘可以是物体的…

新能源充电桩工业4G路由器应用,推动绿色出行,响应环保理念

在智慧城市环保事业发展领域&#xff0c;新能源技术应用成熟&#xff0c;物联网技术越来越广泛&#xff0c;充电桩物联网成为了智慧城市建设的热门应用。充电桩作为新能源汽车的重要配套设施&#xff0c;对于节能减排和推动环保理念可持续发展具有重要意义。而工业4G路由器作为…

css 实现文字流光效果

经过调研发现大多滑块验证码中&#xff0c;有一些文字流光效果&#xff0c;因此在这里简单实现一下。 实现主要利用background 渐变背景以及backgorund-clip:text实现。具体代码如下 css部分 .slide {width: 300px;height: 40px;border: 1px solid #ccc;border-radius: 8px;…

医院陪诊服务预约小程序的作用如何

对陪诊服务提供者及需求者来说&#xff0c;平台很重要&#xff0c;对服务提供者而言&#xff0c;通过微信私信/电话联系的形式很容易出现漏服务的情况&#xff0c;如遇需求者内容/地址/联系方式/哪家医院等信息提供不清或临时改变主意等&#xff0c;非常烦恼&#xff0c;同时各…

面试题c/c++--语言基础

一 、语言基础 1.1 指针 野指针&#xff1a;指针指向的位置是不可知的 悬空指针&#xff1a;指针最初指向的内存已经被释放了的一种指针 两种指针都指向无效内存空间&#xff0c; 即不安全不可控 。需要在定义指针后且在使用之前完成初始化或者使用 智能指针来避免 智能指针 智…

html主页框架,前端首页通用架构,layui主页架构框架,首页框架模板

html主页框架 前言功能说明效果使用初始化配置菜单加载主题修改回调 其他非iframe页面内容使用方式iframe页面内容使用方式 前言 这是一个基于layui、jquery实现的html主页架构 平时写的系统后台可以直接套用此框架 由本人整合编写实现&#xff0c;简单上手&#xff0c;完全免…

Python开源自动化工具Playwright安装及介绍

一个非常强大的自动化项目叫 playwright-python 它支持主流的浏览器&#xff0c;包含&#xff1a;Chrome、Firefox、Safari、Microsoft Edge 等&#xff0c;同时支持以无头模式、有头模式运行&#xff0c;并提供了同步、异步的 API&#xff0c;可以结合 Pytest 测试框架 使用&…

系列五、线程间通信

一、synchronized实现 1.1、案例一&#xff08;2个线程交替对变量执行1、-1操作&#xff0c;来10轮&#xff09; 1.1.1、资源类ShareDataOne /*** Author : 一叶浮萍归大海* Date: 2023/11/20 10:44* Description: 资源类* 说明&#xff1a;2个线程使用if判断变量的值&#…

企业微信获取第三方应用凭证

上一篇介绍了如何配置通用开发参数及通过url回调验证&#xff0c; 本篇将通过服务商后台配置关联小程序应用配置和获取第三方凭证及如何配置企业可信IP。 当然上篇配置的回调设置也不会白费&#xff0c;在下方的指令和数据回调会用到。 第三方应用开发流程 官方企业微信第三方…

微服务学习|Nacos配置管理:统一配置管理、配置热更新、配置共享、搭建Nacos集群

统一配置管理 在微服务当中&#xff0c;提供一个配置中心来将一些配置提取出来&#xff0c;进行统一的使用&#xff0c;Nacos既可以充当注册中心&#xff0c;也提供配置中心的功能。 1.在Nacos中添加配置文件 在Nacos控制台&#xff0c;我们可以在配置管理中&#xff0c;添加…