【Linux取经路】初探进程地址空间

在这里插入图片描述

文章目录

  • 一、历史问题回顾
  • 二、语言层面的地址空间
    • 2.1 验证
  • 三、虚拟地址的引入
    • 3.1 初步解释这种现象——引入地址空间的概念
    • 3.2 再来粗粒度理解上面的现象
  • 四、细节解释
    • 4.1 地址空间究竟是什么?
    • 4.2为什么要有地址空间
    • 4.3 页表
      • 4.3.1 CR3寄存器
      • 4.3.2 页表是由页表项组成的
      • 4.3.3 缺页中断
  • 五、结语

一、历史问题回顾

之前在介绍 fork 函数的时候说过该函数返回了两次,至于为什么会返回两次,以及 fork 函数是如何做到返回两次的,在【Linux取经路】揭秘进程的父与子一文中已经做了详细的解释,忘了小伙伴可以点回去看看。在解释一个变量怎么会有两个不同值的时候,当时的说法是由于进程具有独立性,所以子进程把把父进程的数据拷贝了一份(写时拷贝),本质上是因为有两块空间,但是为什么同一个变量名可以让父子进程看到不同的内容当时并没有过多解释,因为这涉及到今天要讲解的程序地址空间问题,接下来就让我们来一探究竟吧。

二、语言层面的地址空间

相信大家在学习 C/C++ 语言的时候,一定都见过下面这张图:
在这里插入图片描述

小Tips:上图是以32位机为基础的,32位地址线最多可以表示 2 32 2^{32} 232个地址,因为每个地址线上只有0和1两种可能,最终也就是有4G个地址,一个地址对应一个字节,所以就是 2 32 2^{32} 232个字节,所以总的地址空间大小就是4G。内核空间是给操作系统使用的,一个进程对应的所有的数据结构对象都存储在内核空间。

2.1 验证

#include <stdio.h>    
#include <stdlib.h>    int g_val_1; // 定义一个未初始化全局变量    
int g_val_2 = 100; // 定义一个已初始化全局变量    
int main(int argc, char* argv[], char* env[])    
{    printf("code addr:%p\n", main);// 函数名代表的就是地址,通过打印 main 函数的地址来查看代码区的地址    const char *str = "Hello word";// 定义一个字符串常量    printf("read only string addr:%p\n", str);// 字符常量区的地址    printf("init global value addr:%p\n", &g_val_2);// 已初始化全局变量的地址    printf("uninit global value addr:%p\n", &g_val_1); // 未初始化全局变量的地址    char* men1 = (char*)malloc(100);    printf("heap addr-men1:%p\n", men1);// 堆区的地址    printf("stack addr-str:%p\n", &str); // 栈区的地址    static int a = 10;// 定义一个静态局部变量    printf("static a add:%p\n", &a); // 静态局部变量的地址    int i = 0;    for(; argv[i]; i++)    printf("argv[%d],addr:%p\n", i, argv[i]);// 打印命令行参数的地址   for(i = 0; env[i]; i++)    printf("env[%d],addr:%p\n", i, env[i]);// 打印环境变量的地址                                                                                                                                           return 0;    
}

在这里插入图片描述
小Tips:堆栈空间是相对“生长”的。即堆区是先使用低地址再使用高地址,而栈区是先使用高地址再使用低地址。

// 栈区地址由高向低增长
int main()    
{    int a;    int b;    int c;    int d;    printf("stack addr:%p\n", &a);    printf("stack addr:%p\n", &b);    printf("stack addr:%p\n", &c);    printf("stack addr:%p\n", &d);                                                                                                                                                                               
}    

在这里插入图片描述

// 堆区地址由低向高增长
int main()    
{    char* mem1 = (char*)malloc(100);    char* mem2 = (char*)malloc(100);    char* mem3 = (char*)malloc(100);    char* mem4 = (char*)malloc(100);    printf("Heap addr:%p\n", mem1);    printf("Heap addr:%p\n", mem2);    printf("Heap addr:%p\n", mem3);    printf("Heap addr:%p\n", mem4);                                                                                                                                                                              return 0;    
}

在这里插入图片描述
小Tips:这里还有一个小细节,堆栈地址其实相聚很远,原因是堆栈之间还有一块区域,这块区域在讲解动静态库的时候为大家讲解。

// 静态变量地址的验证
int g_val_1; // 定义一个未初始化全局变量    
int g_val_2 = 100; // 定义一个已初始化全局变量    
int main()    
{    printf("code addr:%p\n", main);// 函数名代表的就是地址,通过打印 main 函数的地址来查看代码区的地址    const char *str = "Hello word";// 定义一个字符串常量    printf("read only string addr:%p\n", str);// 字符常量区的地址    printf("init global value addr:%p\n", &g_val_2);// 已初始化全局变量的地址    printf("uninit global value addr:%p\n", &g_val_1); // 未初始化全局变量的地址    char* men1 = (char*)malloc(100);    printf("heap addr-men1:%p\n", men1);    printf("stack addr-str:%p\n", &str);    static int a = 10;// 定义一个静态局部变量                                                                                                                                                                     printf("static a add:%p\n", &a);    return 0;    
}

在这里插入图片描述
小Tips:从打印结果中可以看出,静态变量的地址和全局变量的地址十分接近。这是因为 static 修饰的局部变量,编译的时候已经被编译到全局数据区了。注意静态局部变量被编译到全局数据区仅仅是延长了该变量的生命周期,作用域并没有改变,还是只能在 main 函数的作用域中使用该变量。

注意:本小节的所有代码验证都是基于 Linux 操作系统的,相同的代码放在 Windows 操作系统中的 VS 下跑出来的结果可能会有所不同。

三、虚拟地址的引入

下面通过一个例子来引入虚拟地址的概念。

int g_val = 100;                                                                                                                                                                                                  
int main()
{pid_t pid = fork();if(pid == 0){int cnt = 5;// 子进程while(1){printf("I am child, pid:%d, ppid:%d, g_val:%d, &g_val:%p\n", getpid(), getppid(), g_val, &g_val);sleep(1);if(cnt){cnt--;}    else    {    g_val = 200;    }    }    }    else    {    // 父进程    while(1)    {    printf("I am parent, pid:%d, ppid:%d, g_val:%d, &g_val:%p\n", getpid(), getppid(), g_val, &g_val);    sleep(1);    }    }    return 0;    
}

代码解释:上面这段代码中创建了一个子进程,并且定义了一个全局的变量 g_val,初始化为100。让父子进程同时去访问变量 g_val。在子进程要执行的代码片段中还定义了一个局部变量 cnt,初始化为5,每执行一次循环就让 cnt--,当 cnt 减到0的时候把 g_val 的值修改为200。

在这里插入图片描述
结果分析:从打印结果中可以看出,在子进程对 g_val 进行修改后,父子进程获取到的 g_val 的值并不一样,这符合我们的预期。因为父子进程相互独立,他们拥有各自的代码和数据,子进程在对 g_val 进行修改的时候会发生写时拷贝,这一点在前面的文章中已经讲过。但奇怪的是,为什么同一个地址,从该地址获取到的数据却不相同。那么真想就只有一个,这个打印出来的地址一定不是真实存在的物理地址,因为真实存在的物理地址中只能存放一个数据,不可能同时存储两个不同的数据。因此我们可以得出一个结论:我们代码中打印出来的地址不是物理地址,一般把这个地址叫做线性地址或者虚拟地址

3.1 初步解释这种现象——引入地址空间的概念

之前在介绍进程的时候说过,一个进程就等于 task_struct + 代码数据。但实际上事情并没有这么简单。一个进程一旦被创建出来,操作系统为了让该进程能够更好的运行,除了会为该进程创建对应的 PCB 对象之外,还会为这个进程创建一个地址空间(准确的叫法是进程地址空间)。我们平时在编码过程中使用的地址就是这个地址空间中的地址。进程地址空间本质上是内核为该进程创建的一个结构体对象。进程的 PCB 中是有对应的指针,指向该地址空间。进程地址空间中的虚拟地址和真是的物理地址是通过页表建立联系的,因此每个进程也会有一张页表。
在这里插入图片描述

小Tips:进程 PCB、进程地址空间、页表、物理地址四者之间的关系如上图所示。进程相关的代码和数据一定是存储在物理内存上的。

3.2 再来粗粒度理解上面的现象

根据进程独立性可知,每个进程都要有自己独立的 PCB、进程地址空间、页表。子进程的这些东西,大部分都是以父进程为模板创建出来的。对于全局变量 g_val,在物理内存上它始终只有一份,在父进程中 g_val 有自己的虚拟地址0X601054,创建子进程的时候,子进程根据父进程的地址空间创建出自己的地址空间,此时 g_val 对应的虚拟地址仍然是0X601054。子进程的页表最初也是根据父进程的页表去创建的,因此子进程中 g_val 变量的虚拟地址和父进程中的一样,还是0X601054,并且子进程页表中的虚拟地址和物理地址的映射关系还是继承自父进程。因此,在子进程和父进程中都能够访问到 g_val 这个变量,并且在子进程和父进程中打印出来的 g_val 的地址都是一样的。父子进程共享同一份代码也是根据这个原理来实现的。当子进程要修改 g_val 变量的时候,由于父子进程的数据是相互独立的,该独立性体现在,在子进程去修改 g_val 的值不能影响到父进程,即,在父进程中 g_val 本身的值是100,在子进程将 g_val 的值修改成200的时候,父进程中 g_val 的值仍然得保持100。所以子进程在修改的时候会发生写时拷贝,其本质就是操作系统发现子进程要去修改父子进程所共享的数据,操作系统会说:“子进程你等会儿,先别改”。然后操作系统会为子进程在物理内存中开辟一块空间来存储 g_val 的值,最后修改页表中的虚拟地址0X601054所对应的物理地址。这就是为什么打印出来的是通过一个地址,但是却有两个不同的值。
在这里插入图片描述
小Tips:写时拷贝是操作系统自动完成的,子进程并不知情。这就相当于你有一个朋友要到家里来玩,但是家里有点乱,你让他等会再来,期间你收拾房子的这个过程你朋友并不知情。操作系统就相当于是你,子进程就相当于是你的朋友。重新开辟空间,但是在这个过程中,左侧的虚拟地址是0感知的,它不关心也不会影响它。

四、细节解释

4.1 地址空间究竟是什么?

所谓的进程地址空间,本质是一个描述进程可视范围的大小。并且地址空间内一定存在各种区域划分。因为每个进程将来都会有一个地址空间,所以操作系统一定会想办法把这些地址空间管理起来。管理的本质就是先描述再组织。在语言层面要描述一个事物只能通过结构体,因此地址空间本质是内核的一个数据结构对象,类似 PCB 一样。Linux 中描述地址空间的结构体是 struct mm_struct,该结构体中通过定义 startend 字段来确定地址空间的范围,以及进行区域划分。

struct mm_struct
{unsigned long start_code; // 代码段的开始地址unsigned long end_code; // 代码段的结束地址unsigned long start_data; // 数据的首地址unsigned long end_data; // 数据的尾地址unsigned long start_brk; // 堆的首地址unsigned long brk; // 堆的尾地址unsigned long start_stack; // 进程栈的首地址//...
};

小Tips:除了这些 startend 对应的地址外,我们更应该注意在 startend 范围内,连续的空间中,每一个最小单位都可以有地址,这个地址可以被直接使用。

4.2为什么要有地址空间

  • 原因一:其中一个重要的原因是让进程以统一的视角看待内存。假如没有地址空间和页表,进程直接访问存储在内存上的数据和代码是非常麻烦的,首先进程需要将对应数据和代码的物理地址保存在进程 PCB 中,其次当一个进程从挂起状态或者阻塞状态被变成运行状态的时候,其数据和代码会被重新加载到内存中,此时物理地址大概率是会发生变化的,如果没有地址空间,就需要去修改进程 PCB 中的内容,这个过程是十分复杂的,并且我们的可执行程序加载到内存中并不一定是连续的,这一点会在后面进行讲解,因为可执行程序并不是一次性全部加载到内存中,这就导致我们的代码在物理内存中是东一块西一块,很乱。而地址空间的存在会帮我们解决这些问题,我们可以对可执行程序的虚拟地址进行连续的编址,这样就可以可以根据虚拟地址的先后顺序去“从头”去执行可执行程序,我们的进程不再需要担心可执行程序实际存储在内存的什么位置。这一点也可以总结成,地址空间的存在将物理内存中的代码和数据从无序变成了有序。

  • 原因二:地址空间存在的第二个重要原因是,进程在访问内存的时候,增加一个转换的过程,在这个转换的过程中,可以对我们的寻址请求进行审查,一旦发生异常访问,比如越界访问,去修改只读数据等,会直接拦截,该请求不会到达物理内存,起到保护物理内存的作用。

  • 原因三:因为有地址空间和页表的存在,将进程管理模块和内存管理模块进行解耦合。

小Tips:地址空间就相当于是操作系统给进程画的一个大饼。操作系统给每个进程划分的地空间范围都是0~4G(以32位操作系统为例)。每个进程都不知道对方的存在,都以为自己会独享这4G的空间。但实际并不是这样的,操作系统并不会一次性把这4G的空间给同一个进程,而是每个进程需要多少了就来申请多少。

4.3 页表

关于页表我们今天只做简单的介绍,真正的页表并不是向上图中画的那样只有两个字段,而是有多个字段并且分为多级页表。今天关于页表只介绍一下几点:

4.3.1 CR3寄存器

CPU 中有一个叫做 CR3 的寄存器(X86架构),该寄存器中保存的就是当前正在运行的进程的页表的地址,本质上属于当前进程的硬件上下文,当前进程被切换走了,是会把和该进程有关的所以硬件上下文数据带走的,当然就包括 CR3 寄存器中保存的该进程页表的首地址。该进程重新被 CPU 调度的时候,会把该这些硬件上下文数据重新加载到 CPU 里对应的寄存器中。CR3 寄存器中存的是物理地址。

4.3.2 页表是由页表项组成的

页表是有多个页表项组成的,一般的页表项有如下几个。Present(存在位):表示该页是否存在于物理内存当中。如果存在数据才可以访问。如果不存在,可能会引发缺页异常。Read/Write(读/写位):表示是否允许读取和写入。如果设置了“只读”,则只允许读取,写入会引发保护异常。代码段和字符常量区的数据所对应的页就是“只读”。User/Supervisor(用户/超级用户位):用于指示是否允许用户态程序访问该页。如果设置了“用户态可访问”,则用户程序可以访问;否则,只有内核态可以访问。这些权限位通过硬件(如CPU)来执行,当程序尝试访问内存时,硬件会检查相应的页表项权限位,如果权限不符合要求,会触发相应的异常,例如页故障异常。这样可以确保对内存的合法访问,提高系统的安全性和稳定性。

小Tips:这里需要注意一下,单纯的物理内存是没有“只读”、“只写”等这些权限管理概念的,对于物理内存上的任何一块空间来说,都应该是可读可写的。所以我们在语言层面所说的代码区和字符常量区是只读的,本质上是因为存储代码和字符常量的物理内存所对应的页中设置了“只读”权限。

#include <stdio.h>    int main()    
{    char* str = "Hello World";    *str = 'B';                                                                                                                                                                                                 return 0;    
}

在这里插入图片描述

小Tips:上面这段代码一看就是错误的写法。因为正常来说是需要在 char* str 的前面加上 const。但是加上后,这段代码会在编译时就报错(语法上说不过去,被 const 修饰后是不能再进行修改的)。而不加则是在运行时报错,这就是这段代码在运行时通过页表去 *str 中的内容,被硬件检查出不符合要求,进而产生了异常。

4.3.3 缺页中断

现代操作系统几乎不做任何浪费空间和时间的事情,操作系统对大文件可以实现分批加载。这个其实很好理解,我们平时玩的大型电脑游戏动辄就几十个G,而我们的内存一般就只有8个G或者16个G,所以我们在玩这种大型游戏的时候,一定没有把和该游戏有关的所有文件一次性加载到内存中,而是采用分批加载的策略。操作系统对可执行程序一般采用的是惰性加载机制,即操作系统承诺给进程分配4G的空间(虚拟内存的大小),但实际在物理内存上是用多少加载多少。通过页表中的Present(存在位)页表项去判断,去标记该页是否存在于物理内存中,如果不存在就会发生缺页中断,将需要的代码和数据加载到物理内存中。可不要小瞧加载过程,这里会涉及到物理内存这么大,该申请那块儿内存,加载是加载可执行程序的那一部分,加载完后物理地址如何填到页表里呢?这一系列和缺页中断相关的问题最终都是由操作系统中的内存管理模块来执行的。整个缺页中断的过程对进程是不可见的。正是因为地址空间和页表的存在,才实现了进程管理和内存管理在软件层面的解耦。进程要访问对应的代码和数据只需要知道虚拟地址即可,内存管理模块根据虚拟地址去判断是否要进行缺页中断。

小Tips:进程在被创建的时候,一定是先创建内核数据结构(进程 PCB、地址空间、页表…),然后再加载对应的可执行程序。挂起状态就是将进程的代码和数据从内存中清出去,然后再将Present(存在位)标志位设置成不存在即可。

五、结语

今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下,春人的主页还有很多有趣的文章,欢迎小伙伴们前去点评,您的支持就是春人前进的动力!

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/244062.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

luffy商城项目(二)

路飞后端配置 二次封装response drf提供的Response对象&#xff0c;不能很方便的加入code和msg字段&#xff0c;自己封装一个Response类&#xff0c;以后都用我们自己封装的&#xff0c;方便咱们写code和msg 封装步骤&#xff1a; 1 在utils/common_response.py from rest_…

以太坊账户地址与比特B地址生成方法对比

作者 张群&#xff08;赛联区块链教育首席讲师&#xff0c;工信部赛迪特聘资深专家&#xff0c;CSDN认证业界专家&#xff0c;微软认证专家&#xff0c;多家企业区块链产品顾问&#xff09;关注张群&#xff0c;为您提供一站式区块链技术和方案咨询。 以太坊和比特B地址在生成方…

使用WAF防御网络上的隐蔽威胁之目录穿越

目录穿越&#xff08;Directory Traversal&#xff09;是一种网络安全攻击手段&#xff0c;也被称为路径穿越。 这种攻击允许攻击者访问存储在Web服务器文件系统上的文件和目录&#xff0c;这些文件和目录原本不应该对用户可见或可访问。 通过利用安全漏洞&#xff0c;攻击者…

FOR XML PATH 函数与同一分组下的字符串拼接

FOR XML PATH 简单介绍 FOR XML PATH 语句是将查询结果集以XML形式展现&#xff0c;通常情况下最常见的用法就是将多行的结果&#xff0c;拼接展示在同一行。 首先新建一张测试表并插入数据&#xff1a; CREATE TABLE #Test (Name varchar(70),Hobby varchar(70) );insert #T…

【JAVA语言-第14话】集合框架(一)——Collection集合,迭代器,增强for,泛型

目录 集合框架 1.1 概述 1.2 集合和数组的区别 1.3 Collection集合 1.3.1 概述 1.3.2 常用方法 1.4 迭代器 1.4.1 概述 1.4.2 常用方法 1.4.3 使用步骤 1.5 增强for循环 1.5.1 概述 1.5.2 使用 1.6 泛型 1.6.1 概述 1.6.2 使用泛型的利弊 1.6.2.1 好处 1…

Netty篇章(1)—— 核心原理介绍

终于进入到Netty框架的环节了&#xff0c;前面介绍了大量的Java-NIO的内容&#xff0c;核心的内容Selector、Channel、Buffer、Reactor掌握了&#xff0c;那么学起来Netty也是水到渠成的事情。如果没有掌握前面的内容那么学Netty会非常吃力&#xff0c;下面讲解Netty核心原理与…

Leetcode刷题笔记题解(C++):LCR 174. 寻找二叉搜索树中的目标节点

思路&#xff1a;二叉搜索树的中序遍历是有序的从大到小的&#xff0c;故得出中序遍历的结果&#xff0c;即要第cnt大的数为倒数第cnt的数 /*** Definition for a binary tree node.* struct TreeNode {* int val;* TreeNode *left;* TreeNode *right;* TreeN…

HNU-数据挖掘-实验1-实验平台及环境安装

数据挖掘课程实验实验1 实验平台及环境安装 计科210X 甘晴void 202108010XXX 文章目录 数据挖掘课程实验<br>实验1 实验平台及环境安装实验背景实验目标实验步骤1.安装虚拟机和Linux平台&#xff0c;熟悉Ubuntu环境。2.在Linux平台上搭建Python平台&#xff0c;并安装…

Macos数据库管理软件:Navicat Premium for Mac 16.3.5中文版

Navicat Premium 16 for Mac是一款强大的数据库管理和开发工具&#xff0c;支持多种数据库系统&#xff0c;如MySQL、Oracle、SQL Server等。它提供了直观的用户界面和丰富的功能&#xff0c;使用户能够轻松地创建、管理和维护数据库。 软件下载&#xff1a;Navicat Premium fo…

【C++语言1】基本语法

前言 &#x1f493;作者简介&#xff1a; 加油&#xff0c;旭杏&#xff0c;目前大二&#xff0c;正在学习C&#xff0c;数据结构等&#x1f440; &#x1f493;作者主页&#xff1a;加油&#xff0c;旭杏的主页&#x1f440; ⏩本文收录在&#xff1a;再识C进阶的专栏&#x1…

鸿蒙开发案列一

1、开发需求 案例app一打开是“Hello world” 界面&#xff0c;开发者点击“Hello world”变成“Hello ArkUI”’ 2、源代码 Entry Component struct Hello {State person_name: string Worldbuild() {Row() {Column() {Text(Hello this.person_name).fontSize(50).fontWei…

市场复盘总结 20240119

仅用于记录当天的市场情况&#xff0c;用于统计交易策略的适用情况&#xff0c;以便程序回测 短线核心&#xff1a;不参与任何级别的调整&#xff0c;采用龙空龙模式 昨日主题投资 连板进级率 11/39 28.2% 二进三&#xff1a; 进级率低 43% 最常用的二种方法&#xff1a; 方…

【面试】测试/测开(ING3)

190. 栈和堆在内存管理上的区别 栈 1&#xff09; 栈是由系统自动分配和回收的内存。 2&#xff09;栈的存储地址是由高地址向低地址扩展的。 3&#xff09;栈是一个先进后出的结构。 4&#xff09;栈的空间大小是一个在编译时确定常数&#xff0c;即栈的大小是有限制的&#x…

仰暮计划|“她告诉我,大部分时间她都是一个家庭主妇,负责照料家务和小孩,但她从来没有停止她对知识的追求”

我来到河南省开封市兰考县南北庄村内一个宁静而温馨的小院子&#xff0c;那里居住着一位九十多岁的高龄老人&#xff0c;她就是张奶奶。张奶奶是村里的一位高龄老人&#xff0c;拥有着丰富的人生经历。我对她的故事非常充满好奇&#xff0c;所以特地来到张奶奶的家中&#xff0…

测试开发基础 | 计算机网络篇(二):物理层与数据链路层

【摘要】 计算机网络知识是自动化测试等技术基础&#xff0c;也是测试面试必考题目。霍格沃兹测试学院特别策划了本系列文章&#xff0c;将带大家一步步夯实计算机网络的基础知识。由于物理层知识在互联网软件研发工作中用到的并不多&#xff0c;所以可以仅做一个简单的了解。物…

理解PCIE设备透传

PCIE设备透传解决的是使虚拟机直接访问PCIE设备的技术&#xff0c;通常情况下&#xff0c;为了使虚拟机能够访问Hypervisor上的资源&#xff0c;QEMU&#xff0c;KVMTOOL等虚拟机工具提供了"trap and emulate"&#xff0c; Virtio半虚拟化等机制实现。但是这些实现都…

MySQL之数据库DDL

文章目录 MySQL数据库基本操作数据定义DDL对数据库的常用操作创建表修改表格式结构 MySQL数据库基本操作 首先我们先了解SQL的语言组成&#xff0c;他分为四个部分 数据定义语言&#xff08;DDL&#xff09;数据操纵语言&#xff08;DML&#xff09;数据控制语言&#xff08;…

three.js从入门到精通系列教程004 - three.js透视相机(PerspectiveCamera)滚动浏览全景大图

<!DOCTYPE html> <html><head><meta charset"UTF-8"><title>three.js从入门到精通系列教程004 - three.js透视相机&#xff08;PerspectiveCamera&#xff09;滚动浏览全景大图</title><script src"js/three.js"&g…

Python 自动化办公:一键批量生成 PPT

Stata and Python 数据分析 一、导读 在实际工作中&#xff0c;经常需要批量处理Office文件&#xff0c;比如需要制作一个几十页的PPT进行产品介绍时&#xff0c;一页一页地制作不仅麻烦而且格式可能不统一。那么有什么办法可以一键生成PPT呢&#xff1f;Python提供的pptx 包…