【Linux】程序地址空间

程序地址空间

- - 首先引入地址空间的作用
  - 什么是地址空间
  - 为什么要有地址空间

首先引入地址空间的作用

  1 #include <stdio.h>2 #include <unistd.h>3 #include <stdlib.h>4 int g_val = 100;6 int main()7 {8   pid_t id = fork();9   if(id == 0)10   {11     int cnt = 0;12     while(1)13     {14       printf("I am child,pid : %d,ppid : %d,g_val : %d,&g_val : %p\n",getpid(),getppid(),g_val,&g_val);15       cnt++;16       sleep(1);17       if(cnt == 5)18       {19         g_val = 200;20         printf("child chage g_val 100 -> 200 success\n");21       }22     }23   }24   else 25   {26     //father27     while(1)28     {                                                                                                                                                29 30       printf("I am father,pid : %d,ppid : %d,g_val : %d,&g_val : %p\n",getpid(),getppid(),g_val,&g_val);31       sleep(1);32     }33   }34   return 0;35 }

我们发现，但我们子进程修改全局变量g_val的时候，父进程的g_val没有受到影响，但是他们的地址都是一样的，这是为什么呢？

在这里插入图片描述

由此我们知道，这里的地址绝对不是物理内存的地址，而是虚拟地址（线性地址）；并且几乎所有语言，如果有地址的概念，这个地址一定不是物理地址，而是虚拟地址。物理地址是由操作系统保管的。以下我们就开始介绍虚拟内存的作用

什么是地址空间

首先基本了解一下地址空间的排布情况

目前我们先不考虑解析这里的共享区

代码实现验证地址空间的排布

  1 #include <stdio.h>2 #include <unistd.h>3 #include <stdlib.h>4 int g_val = 100;5 int g_unval;6 int main(int argc,char *argv[],char *env[])7 {8   //代码区9   printf("code addr:%p\n",main);10   //初始化数据11   printf("init global addr:%p\n",&g_val);12   //未初始化数据13   printf("uninit global addr:%p\n",&g_unval);14   //堆区15   char* heap_mem = (char*)malloc(10);16   char* heap_mem1 = (char*)malloc(10);17   char* heap_mem2 = (char*)malloc(10);18   char* heap_mem3 = (char*)malloc(10);19   printf("heap_mem addr:%p\n",heap_mem);20   printf("heap_mem1 addr:%p\n",heap_mem1);21   printf("heap_mem2 addr:%p\n",heap_mem2);22   printf("heap_mem3 addr:%p\n",heap_mem3);23 24   //栈区25   printf("stack addr:%p\n",&heap_mem);26   printf("stack addr:%p\n",&heap_mem1);27   printf("stack addr:%p\n",&heap_mem2);28   printf("stack addr:%p\n",&heap_mem3);29 //字面常量30   const char *str = "helloworld";31   printf("read only string addr: %p\n", str);32   33   int i,j;34   //命令区                                                                                                35    for(i = 0 ;i < argc; i++)                                                                                                                                             36     {              37         printf("argv[%d]: %p\n", i, argv[i]);38     }        39   40  //环境区41  for(j = 0;env[j];++j)42  {43    printf("env[%d] addr:%p\n",j,&env[j]);44  }45 46   47   48   return 0;49 }

在这里插入图片描述

由此可见我们发现我们输入命令后，命令的地址在我们所执行的代码之后，这说明刚创建好这些变量就有了它自己本身的地址，地址程序结束后才打印，要分清前后

接下来我们来认识什么是地址空间

这时我们可以利用虚拟地址加映射机制（页表）来正确的讲地址存入物理内存
虚拟地址：不管哪个编译器，只要看到的地址都是虚拟地址，物理地址是操作系统保管的。
每一行代码都进行了编址。故，程序在编译的时候，每一个字段早已经具有了一个虚拟地址
=什么是映射机制？
映射机制可以将虚拟地址转换到物理地址，如果发现虚拟地址会越界或者错误，则就不会抛出，他起到了关键作用
那么映射机制是怎么判断的呢？

以上就是所描述的社么是地址空间，简单来说它是存储虚拟地址的。

在这里插入图片描述

地址空间和页表（用户级）是每一个进程都单独有一份的。
只要每一个进程的页表映射的是物理内存的不同区域，就可以做到进程之间不会互相干扰保证进程的独立性。

为什么要有地址空间

凡是非法的访问或者映射，os都会识别到，并终止你这个进程，有效的保护了物理内存。
因为地址空间和页表是os创建并维护的，所以凡是使用地址空间和页表的都会在os的监控下来进行范文，这样就间接的保护了物理内存中的所有合法数据和各个进程，以及内核的相关有效数据
物理内存和进程的管理可以做到解耦合（没关联）。
当我们申请了物理空间，但是我们不立即使用的时候，就会造成内存空间的浪费；
针对这一现象，os做出了延迟分配的策略，来提高整机的效率。
因为地址空间的存在，所有申请的空间都是在地址空间上申请的，物理内存不是被申请到一个字节，当我们真正访问物理地址的时候，才执行内存相关的算法。帮助申请内存，构建页表之间的映射关系，这些都是由os自主完成的
因为在物理内存中理论上随意加载，也是随意存放的，但是通过地址空间的虚拟地址和页表之间的映射，从进程视角来看所有的内存分布就成有序的了。
因为有地址空间的存在，每一个进程都认为自己单独有一块4GB（32）空间，并且各个区域是有序的。进而通过页表映射到不同区域，来实现进程的独立性，各个进程是不知道其他进程的存在的

回答问题，为什么地址相同值不同
在这里插入图片描述