本篇将要讲解有关进程中最后一个知识点——进程替换,其中主要介绍有关进程替换的六个函数,直接从函数层面来理解进程替换(在使用函数的过程中,也会对进行替换进行解释)。本篇主要围绕如下的进程替换函数:
以上的 exec* 函数就是 Linux 中的加载函数,可以将进程加载到内存中。
1. 进程替换函数
execl 函数
我们将首先介绍 execl 函数,关于该函数的参数列表如下:
int execl(const char *path, const char *arg, ...);
如上,该函数是一个可变参数列表,第一个参数为路径(需要替换的进程的目录,应该去哪找到该进程),接下来的参数的类型都是 const char* ,需要传入的参数为进程的名字,进程需要带上的参数(也就是需要告诉函数,要求替换进程怎么执行),最后在结束的位置加上 NULL 即可。具体的使用如下:
如上所示,当我们运行 execl 函数的时候,接下来会运行我们替换后的进程。但是需要注意的一点,我们在进程替换代码的后面也加入了一行打印代码,但是在运行之后并没有将其打印出来。这是为什么呢?
这是因为我们进行了程序替换。在每个进程加载的时候,都会加载对应的页表,地址空间,在内存中开辟空间,以及建立各种的映射关系。当我们调用 execl 函数的时候,会在磁盘中找到对应的进程,然后使用该进程的代码和数据覆盖原有的代码和数据,但是并不会覆盖掉原进程的内核管理数据结构(其中个别的数据将会发生变化),所以进程替换的时候,并不会创建新进程(老进程壳子、新进程运行)。所以以上的代码执行完 execl 函数之后,不会在运行之后的代码了,因为以已经被覆盖了。
多进程运行程序
通过以上函数可知,我们可以使用系统调用函数将进程进行替换,那么结合我们之前的 fork 创建子进程,我们就可以使用 fork 创建子进程,然后使用程序替换,让子进程运行我们想要运行的程序,这样就达到了多进程运行程序的效果,如下:
如上所示,我们可以在子进程中进行程序替换,运行我们想要运行的程序。这样发生的原理又是什么呢?
当我们进行程序替换的时候,会对子进程的代码和数据进行写时拷贝(因为和父进程共享的,不能直接覆盖原来的代码数据),从磁盘中写入我们想要运行进程的代码和数据。父进程在外可以进行阻塞等待和非阻塞等待,也就是可以做自己的事情,若还想要同时运行多个进程,可以创建多个子进程,然后进行替换。
execv 函数
现在我们将开始讲解 execv 函数,关于该函数的参数形式如下:
int execv(const char *path, char *const argv[]);
其中,我们需要传入的参数分别为:需要替换进程的地址(目录),第二个参数是一个指针数组,里面存的是我们要运行进程的方式,和以上的 execl 的形式一样,但是需要注意的是,指针数组的最后一个元素得是:NULL,使用如下:
如上,我们使用 execv 函数成功替换了子进程。其实这些函数的使用都大同小异,我们只需要掌握其中一两个主要的用法,其余也就无师自通了。
execvp execlp 函数
接下来我们将讲解 execvp 和 execlp 这两个函数,其函数参数形式如下:
int execlp(const char *file, const char *arg, ...); int execvp(const char *file, char *const argv[]);
以上两个函数分别相对于 execv 函数和 execl 函数多了一个 p ,其实是多了一个环境变量,也就是我们不需要在第一个参数中传入路径了,直接传入我们想要执行的语句,后面的参数形式,根据以上 execv 和 execl 函数形式传参即可,如下:
如上所示,传参形式也是和 execv execl 函数相差无几。
execvpe 函数
现在我们来讲解我们将要讲解的最后一个函数:execvp 函数,如下:
int execvpe(const char *file, char *const argv[], char *const envp[]); int execle(const char *path, const char *arg, ..., char * const envp[]);
如上所示,其实和 execvp execl 函数相比,只多了一个 envp 参数,也就是我们的环境变量,在以下只演示一种函数的使用即可,另一种的使用方法大同小异,就不在演示,如下:
如上所示,我们在我们的c语言程序中替换了一个C++程序,然后传入环境变量与参数,我们在C++程序中也在命令行中使用 argv 和 env 变量接收了命令行参数和环境变量。所以在 execvpe 函数中的 envp 变量可以将环境变量给替换掉,将程序中的环境变量替换为我们想要输入的环境变量(若我们想要传入bash中的环境变量,我们只需要传入environ进去即可)。
execve 系统调用
我们先查看我们使用的进程替换所在的手册,如下:
如上显示的为 3 好手册,是我们的 C语言中的库,说明这些进程替换函数都是来自于C语言,其中的底层调用的是系统调用:execve:
其中,关于这些函数的关系如下:
2. 自主shell -- code
在我们在 Linux 中使用的命令行解释器(bash)就是一个 shell 程序,其中主要负责解释我们输入的命令,将其反馈给我们用户。比如我们常用的 ls pwd touch 指令,但其实这些指令都是进程,那么关于 bash 运行这些指令,其实在底层中就是使用进程替换函数实现的,现在我们将在下文中使用C语言实现一个简陋版的 shell 程序(主要依靠进程替换)。我们先给出我们所有的代码,然后在下文中解释:
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <errno.h> #include <unistd.h> #include <sys/wait.h> #include <sys/stat.h> #include <sys/types.h> #include <fcntl.h>#define SIZE 512 #define NUM 32char cwd[SIZE * 2]; char* MyArgv[NUM]; char tmp[SIZE * 2]; int lastcode = 0;const char* GetUserName(){const char* name = getenv("USER");if(name == NULL) return "None";return name; }const char* GetHostName(){const char* hostname = getenv("HOSTNAME");if(hostname == NULL) return "None";return hostname; }const char* GetCwd(){const char* cwd = getenv("PWD");if(cwd == NULL) return "None";return cwd; }void MakeCommandLine(){const char* name = GetUserName();const char* hostname = GetHostName();const char* cwd = GetCwd();if(strlen(cwd) != 1){cwd += strlen(cwd) - 1;while(*cwd != '/')cwd--;cwd++;}printf("[%s@%s %s]> ", name, hostname, cwd); }char* GetCommandFromStdin(){char* command = fgets(tmp, sizeof(tmp), stdin);if(command == NULL) exit(1);command[strlen(command) - 1] = '\0';return command; }void SplitComandToArgv(char* command){// 开始截取MyArgv[0] = strtok(command, " ");//MyArgv[0] = command;//char* tmp = strtok(command, " ");//tmp = '\0';int index = 1;while((MyArgv[index++] = strtok(NULL, " "))){}MyArgv[index] = NULL; }void ExecuteCommand(char* cmd){pid_t id = fork();if(id < 0) exit(1);else if(id == 0){execvp(MyArgv[0], MyArgv);exit(errno);}else{int status = 0;pid_t rid = waitpid(id, &status, 0);if(rid > 0){lastcode = WEXITSTATUS(status);if(lastcode != 0)printf("%s:%s:%d\n", MyArgv[0], strerror(lastcode), lastcode);}} }void ChangeDir(){char* path = MyArgv[1];if(strcmp(MyArgv[1], "-") == 0) path = getenv("HOME");chdir(path);// 更新环境变量getcwd(tmp, sizeof(tmp));snprintf(cwd, sizeof(cwd), "PWD=%s", tmp);putenv(cwd); }int BuildInCommand(){int yes = 0;if(strcmp(MyArgv[0], "cd") == 0){yes = 1;ChangeDir();}return yes; }int main(){// 先创建一个命令行输入int quit = 1;while(quit != 0){MakeCommandLine(); // 创建一个读入字符串char* command = GetCommandFromStdin();//printf("%s", command);// 将command指令截取到argv表格中// 检测是否存在重定向//CheckRedir(command);// printf("cmd: %s\n", command);// printf("file: %s\n", command + RedirPos);SplitComandToArgv(command);// int i = 0;// for(; MyArgv[i]; i++){// printf("%s\n", MyArgv[i]);// }// 截取命令之后,就可以开始执行程序了int buildin = BuildInCommand();if(buildin) continue;ExecuteCommand(command);}return 0; }
命令行读取命令
首先我们需要先模拟出在命令行读取命令,其中还包括要显示出我们当前所在的目录,这就会涉及到我们的在之前文章中所提到的环境变量了(Linux环境变量-CSDN博客),我们需要从环境变量中找出当前所在的目录,以及当前的用户,实现如下:
const char* GetUserName(){const char* name = getenv("USER");if(name == NULL) return "None";return name; }const char* GetHostName(){const char* hostname = getenv("HOSTNAME");if(hostname == NULL) return "None";return hostname; }const char* GetCwd(){const char* cwd = getenv("PWD");if(cwd == NULL) return "None";return cwd; }void MakeCommandLine(){const char* name = GetUserName();const char* hostname = GetHostName();const char* cwd = GetCwd();if(strlen(cwd) != 1){cwd += strlen(cwd) - 1;while(*cwd != '/')cwd--;cwd++;}printf("[%s@%s %s]> ", name, hostname, cwd); }
其中主要使用了能寻找到环境变量的返回值的系统调用函数 getenv。以上为函数为在命令行打印读取命令行信息的提示,接下来我们还需要读取我们的指令,其中的指令是以字符串的形式传入的,如下:
char* GetCommandFromStdin(){char* command = fgets(tmp, sizeof(tmp), stdin);if(command == NULL) exit(1);command[strlen(command) - 1] = '\0';return command; }
其中主要使用的函数为一个文件读取函数,一次性就可以读取一行。
截取命令行 / 进程替换
我们进行环境变量之前,需要使用空格传入不同的穿,而我们刚刚的读取指令函数读取的是一整行的字符串,所以我们需要将其截取,以空格为间隙将其截取。如下:
void SplitComandToArgv(char* command){// 开始截取MyArgv[0] = strtok(command, " ");int index = 1;while((MyArgv[index++] = strtok(NULL, " "))){}MyArgv[index] = NULL; }
截取完命令之后,我们就可以进行进程替换了,进行进程替换,我们只需要使用使用 fork 创建出子进程,然后让父进程进行阻塞等待即可,如下:
void ExecuteCommand(char* cmd){pid_t id = fork();if(id < 0) exit(1);else if(id == 0){execvp(MyArgv[0], MyArgv);exit(errno);}else{int status = 0;pid_t rid = waitpid(id, &status, 0);if(rid > 0){lastcode = WEXITSTATUS(status);if(lastcode != 0)printf("%s:%s:%d\n", MyArgv[0], strerror(lastcode), lastcode);}} }
以上的进程替换虽然能替换大部分的指令,但是还是有部分内建命令不能替换,因为内建命令本质是 shell 程序中的一个函数,所以并不能算得上是进程替换,我们只能在函数中检测,然后运行,如下给出了 cd 内建命令的实现,关于其他的内建命令便可由读者自行完成,如下:
void ChangeDir(){char* path = MyArgv[1];if(strcmp(MyArgv[1], "-") == 0) path = getenv("HOME");chdir(path);// 更新环境变量getcwd(tmp, sizeof(tmp));snprintf(cwd, sizeof(cwd), "PWD=%s", tmp);putenv(cwd); }int BuildInCommand(){int yes = 0;if(strcmp(MyArgv[0], "cd") == 0){yes = 1;ChangeDir();}return yes; }
测试
测试结果如下: