Python源码学习笔记:Python虚拟机

Python虚拟机

注:本篇是根据教程学习记录的笔记,部分内容与教程是相同的,因为转载需要填链接,但是没有,所以填的原创,如果侵权会直接删除。此外,本篇内容大部分都咨询了ChatGPT,为笔者解决了很多问题。

问题:

在 Python 程序执行过程与字节码中,我们研究了Python程序的编译过程:通过Python解释器中的编译器对 Python 源码进行编译,最终获得代码对象 PyCodeObject 。编译器根据语法规则对源码进行作用域的划分,并以此为单位来编译源码,最终为每个作用域生成一个代码对象。代码对象则保存了字节码,以及相关名字、常量等静态上下文信息。

(上面这段话是原文章的作者总结的,我个人觉得还是很到位的,大家也可以再回顾一下这篇笔记的内容:Python 程序执行过程与字节码,更深刻体会下。)

那么当我们得到了编译产出的代码对象后,虚拟机是如何解析并执行其中的字节码指令的呢?与语法作用域相对应的运行时名字空间,在虚拟机中又是如何动态维护的呢?

1. 栈帧对象

1.1 PyFrameObject

  • 当 Python 解释器加载一个模块或者执行函数时,会为对应的 PyCodeObject 创建一个 PyFrameObject 对象,并将其压入 Python 解释器的执行栈中。以函数为例,PyFrameObject 对象表示函数调用的栈帧对象,它包含了函数调用时的所有状态信息,包括局部变量、栈、当前指令等信息。

  • 具体地我们来看一下执行上下文的具体结构——PyFrameObject,源码如下:

    typedef struct _frame {PyObject_VAR_HEADstruct _frame *f_back;      /* previous frame, or NULL */PyCodeObject *f_code;       /* code segment */PyObject *f_builtins;       /* builtin symbol table (PyDictObject) */PyObject *f_globals;        /* global symbol table (PyDictObject) */PyObject *f_locals;         /* local symbol table (any mapping) */PyObject **f_valuestack;    /* points after the last local *//* Next free slot in f_valuestack.  Frame creation sets to f_valuestack.Frame evaluation usually NULLs it, but a frame that yields sets itto the current stack top. */PyObject **f_stacktop;PyObject *f_trace;          /* Trace function */char f_trace_lines;         /* Emit per-line trace events? */char f_trace_opcodes;       /* Emit per-opcode trace events? *//* Borrowed reference to a generator, or NULL */PyObject *f_gen;int f_lasti;                /* Last instruction if called *//* Call PyFrame_GetLineNumber() instead of reading this fielddirectly.  As of 2.3 f_lineno is only valid when tracing isactive (i.e. when f_trace is set).  At other times we usePyCode_Addr2Line to calculate the line from the currentbytecode index. */int f_lineno;               /* Current line number */int f_iblock;               /* index in f_blockstack */char f_executing;           /* whether the frame is still executing */PyTryBlock f_blockstack[CO_MAXBLOCKS]; /* for try and loop blocks */PyObject *f_localsplus[1];  /* locals+stack, dynamically sized */
    } PyFrameObject;
    

    源码分析(只列出重要字段):

    • f_back:表示当前栈帧的前一个栈帧,即调用当前函数的函数的栈帧。Python解释器使用这个字段来实现函数调用的递归和返回。如果当前函数是最外层函数,即没有调用它的函数,则该字段为NULL。
    • f_code:表示当前栈帧对应的 PyCodeObject 对象,即当前函数的字节码和相关信息。Python 解释器使用这个字段来执行函数中的字节码指令。
    • f_builtins:表示当前栈帧的内建变量字典,即当前函数中访问的所有内建函数和对象的名称和值。Python 解释器使用这个字段来实现对内建函数和对象的访问。
    • f_locals:表示当前栈帧的局部变量字典,即当前函数的所有局部变量的名称和值。Python 解释器使用这个字段来实现变量的读取和写入操作。
    • f_lasti:表示当前栈帧执行的最后一条指令的指令码在字节码序列中的索引。Python 解释器使用这个字段来记录当前函数执行的进度,以便在函数被中断或者函数返回时,能够恢复到正确的执行位置。
    • f_lineno:表示当前栈帧执行的源代码行号。Python 解释器使用这个字段来跟踪当前函数的行号,以便在发生异常时能够提供更准确的错误信息。
    • f_localsplus:表示当前栈帧的栈顶指针,即当前函数调用的栈的顶部。Python 解释器使用这个字段来实现函数调用的参数传递和返回值传递。

    思考:PyFrameObject为什么没有记录闭包信息?

    • PyFrameObject 对象本身不记录闭包相关的信息是出于设计上的考虑。一个主要的原因是为了保持执行栈的简洁性和高效性。
    • 闭包是一种在 Python 中广泛使用的编程模式,但是它在实现上是比较复杂的。在解释器执行 Python 代码时,一个函数在定义时可能没有引用外部变量,但是在运行时却可能引用了。因此,如果要记录函数中使用的外部变量,就需要在运行时动态地创建一个闭包对象,并将其与函数对象关联起来。这就会给执行栈的实现带来很大的复杂性。
    • 另一个原因是,闭包可能会被频繁地创建和销毁,而在执行栈中保存大量的闭包信息会导致执行效率变慢,甚至可能引起内存泄漏。因此,Python 解释器在设计执行栈时,选择不记录闭包相关的信息,以保持执行栈的简洁性和高效性。
    • 虽然 PyFrameObject 对象本身不记录闭包相关的信息,但是 Python 解释器可以通过其他方式来获取函数的闭包信息,例如通过函数对象的 closure 属性。
  • PyFrameObject结构图如下:
    在这里插入图片描述

  • 其中,f_code字段保存了当前执行的代码对象,最核心的字节码就在代码对象中。而f_lasti字段则保存着上条已执行字节码的编号。虚拟机内部用一个C局部变量next_instr维护下条字节码的位置,并据此加载下一条待执行的字节码指令,原理和CPU的指令指针寄存器(%rip)一样。

  • 另外,注意到f_back字段执行前一个栈帧对象,也就是调用者的栈帧对象。这样一来,栈帧对象按照调用关系串成一个调用链。(这里和x86CPU栈帧布局是如出一辙的,原作者在这里介绍了x86CPU栈帧布局与函数调用之间的关系,笔者能力有限就不介绍了,大家感兴趣的可以自行查找相关资料(主要还是微机原理和汇编学的不是很好。。。))

1.2 栈帧对象链

  • 现在,我们以具体例子来考察Python栈帧对象链以及函数调用之间的关系:

    pi = 3.14def square(r):return r ** 2def circle_area(r):return pi * square(r)def main():print(circle_area(5))if __name__ == '__main__':main()
    
  • 当Python开始执行这个程序时,虚拟机先创建一个栈帧对象,用于执行模块代码对象:

    在这里插入图片描述

  • 当虚拟机执行到模块代码第13行时,发生了函数调用。这时,虚拟机会新建一个栈帧对象,并开始执行函数main()的代码对象:

    在这里插入图片描述

  • 随着函数调用逐层深入,当调用square()函数时,调用链达到最长:
    在这里插入图片描述

  • 当函数调用完毕后,虚拟机通过f_back字段找到前一个栈帧对象并回到调用者代码中继续执行。

1.3 栈帧获取

  • 栈帧对象PyFrameObject中保存着Python运行时信息,在底层执行流控制以及程序调试中非常有用。在Python代码层面,我们可以通过sys模块中的_getframe()函数,即可获得当前栈帧对象:

    >>> import sys
    >>> frame = sys._getframe()
    >>> frame
    <frame at 0x00000183FA78F870, file '<pyshell#1>', line 1, code <module>>
    >>> dir(frame)
    ['__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'clear', 'f_back', 'f_builtins', 'f_code', 'f_globals', 'f_lasti', 'f_lineno', 'f_locals', 'f_trace', 'f_trace_lines', 'f_trace_opcodes']
    
  • 拿到栈帧对象之后,我们来具体看一下相关的属性值,以之前的求面积的函数为例:

    >>> import sys
    >>> pi = 3.14
    >>> def square(r):frame = sys._getframe()while frame:print('name:', frame.f_code.co_name)print('Locals', list(frame.f_locals.keys()))print('Globals', list(frame.f_globals.keys()))print('===========')frame = frame.f_backreturn r ** 2>>> def circle_area(r):return pi * square(r)>>> def main():print(circle_area(2))>>> if __name__ == '__main__':main()name: square
    Locals ['r', 'frame']
    Globals ['__name__', '__doc__', '__package__', '__loader__', '__spec__', '__annotations__', '__builtins__', '__file__', '__cached__', 'sys', 'pi', 'square', 'circle_area', 'main']
    ===========
    name: circle_area
    Locals ['r']
    Globals ['__name__', '__doc__', '__package__', '__loader__', '__spec__', '__annotations__', '__builtins__', '__file__', '__cached__', 'sys', 'pi', 'square', 'circle_area', 'main']
    ===========
    name: main
    Locals []
    Globals ['__name__', '__doc__', '__package__', '__loader__', '__spec__', '__annotations__', '__builtins__', '__file__', '__cached__', 'sys', 'pi', 'square', 'circle_area', 'main']
    ===========
    name: <module>
    Locals ['__name__', '__doc__', '__package__', '__loader__', '__spec__', '__annotations__', '__builtins__', '__file__', '__cached__', 'sys', 'pi', 'square', 'circle_area', 'main']
    Globals ['__name__', '__doc__', '__package__', '__loader__', '__spec__', '__annotations__', '__builtins__', '__file__', '__cached__', 'sys', 'pi', 'square', 'circle_area', 'main']
    ===========
    12.56
    
  • 小拓展:自定义函数实现sys._getframe()功能:(这里是原作者举的一个例子,个人感觉对相关知识的理解是有帮助的

    • 当Python程序抛出异常时,会将执行上下文带出来,保存在异常中:

      >>> try:1 / 0except Exception as e:print(e.__traceback__.tb_frame)<frame at 0x000002440D95BC50, file '<pyshell#5>', line 4, code <module>>
      

      因此,我们可以自定义一个getframe()函数:

      >>> def getframe():try:1 / 0except Exception as e:return e.__traceback__.tb_frame.f_back
      

      注意:getframe()中通过异常获得的是自己的栈帧对象e.__traceback__.tb_frame,所以还需要通过f_back字段找到调用者的栈帧。

2. 字节码执行(略)

Python 虚拟机执行代码对象的主要函数有两个:

  • PyEval_EvalCodeEx() 是通用接口,一般用于函数这样带参数的执行场景:

    PyObject *
    PyEval_EvalCodeEx(PyObject *_co, PyObject *globals, PyObject *locals,PyObject *const *args, int argcount,PyObject *const *kws, int kwcount,PyObject *const *defs, int defcount,PyObject *kwdefs, PyObject *closure);
    
  • PyEval_EvalCode() 是更高层封装,用于模块等无参数的执行场景:

    PyObject *
    PyEval_EvalCode(PyObject *co, PyObject *globals, PyObject *locals);
    
  • 这两个函数最终调用 _PyEval_EvalCodeWithName() 函数,初始化栈帧对象并调用 PyEval_EvalFrame 系列函数进行处理。栈帧对象将贯穿代码对象执行的始终,负责维护执行时所需的一切上下文信息。而PyEval_EvalFrame 系列函数最终调用 _PyEval_EvalFrameDefault() 函数,虚拟机执行的核心就在这里(具体源码这里就不讲解了)。

    PyObject *
    PyEval_EvalFrame(PyFrameObject *f);PyObject *
    PyEval_EvalFrameEx(PyFrameObject *f, int throwflag);PyObject* _Py_HOT_FUNCTION
    _PyEval_EvalFrameDefault(PyFrameObject *f, int throwflag);
    
  • 文章后续以顺序执行、if判断、while循环详细讲解了字节码的执行过程,这里笔者就不赘述了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/45384.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Windows PyCharm 2022/2023 使用Centos7 的虚拟环境 venv 实现文件实时同步 代码代码Git自动识别 解决 Samba Cannot Save File 的问题

前期准备 git报错 fatal: unsafe repository 解决方法 因为是远程文件夹&#xff0c;老版本时没这个问题&#xff0c;新版本git或者pycharm有这个限制&#xff0c;不能自动识别更改的代码&#xff0c;报unsafe.directory的问题&#xff0c;直接暴力解决&#xff0c;加* git c…

接口间参数传递的一种解决方案

引言 做过接口自动化测试的同学肯定都熟悉在全链路测试过程中&#xff0c;很多业务场景的完成并非由单一接口实现&#xff0c;而是由很多接口组成的一条链路实现。例如你在淘宝上购物场景。 不同于单接口测试&#xff0c;这种链路型的接口自动化测试&#xff0c;由于接口间有参…

计算机应用设计大赛获奖信息,北京大学第六届“计算机应用设计大赛”圆满落幕...

6月6日下午&#xff0c;北京大学创新创意系列赛事颁奖典礼在英杰交流中心月光厅举行&#xff0c;会上颁发了计算机应用设计大赛、“挑战杯”系列竞赛、数学建模与计算机应用竞赛和“禁毒教育”创意大赛四项赛事的各类奖项。信息科学技术学院2013级本科生王迪作为获奖代表上台领…

魔物学院计算机,测试 | 你属于魔法学校什么学院的?

原标题&#xff1a;测试 | 你属于魔法学校什么学院的&#xff1f; 本Part长年主持&#xff1a;绿茶 本Part今日主人公&#xff1a;心理测试 如果你有机会在霍格沃茨魔法学校读书,依据你的性格,分院帽会把你分到哪个学院呢?你适合哪个学院呢?是高贵的斯莱特林,还是勇敢的格兰芬…

uniapp 微信小程序通过 wx.openCustomerServiceChat对接客服。

直接上解决方案&#xff0c;直接在绑定的方法中调用wx.openCustomerServiceChat 方法即可。 需要注意的几点。 hbuilder x 需升级到 3.4.3 版本以上。使用的&#xff0c;微信开发者工具中是看不到效果的&#xff0c;需要打包后&#xff0c;在微信中扫码查看。&#xff08;体验…

微软丢出王炸:微软发布重磅更新Windows Copilot

在今天凌晨结束的微软 Build 2023 大会上&#xff0c;微软发布了重磅更新Windows Copilot. 微软此前把 GPT-4 接入Office 套件而推出的 Copilot&#xff0c;将全面集成到 Windows 系统。 Windows Copilot 注册直通&#xff1a; https:/forms.office.com/pages/responsepage.asp…

仿QQ聊天程序

仿QQ聊天程序 转载请标明出处&#xff1a;牟尼的专栏 http://blog.csdn.net/u012027907 一、设计内容及要求 1.1综述 A.系统概述 我们要做的就是类似QQ这样的面向企业内部的聊天软件&#xff0c;基本功能和QQ类似。首先&#xff0c;系统分为两大部分&#xff0c;第一部分是…

仿微信语音聊天

如上图&#xff0c;是常见的仿微信的聊天程序&#xff0c;实现的效果如上图所示&#xff0c;由于项目太大&#xff0c;本文只讲录音部分。本项目示例代码&#xff1a;https://github.com/xiangzhihong/weixinAudio 主要用到4个核心类&#xff1a; 自定义录音按钮&#xff08;R…

Android 仿微信实现语音聊天功能

在此感谢鸿洋大神&#xff0c;因为我这是在慕课上看大神的视频做出来的。 代码中我已经添加了很多很多注释&#xff0c;不光是为了大家&#xff0c;也是为了自己能够更加透彻的理解该功能 支持原创&#xff0c;也不算原创了哈哈~ http://blog.csdn.net/lhk147852369/article/…

【Unity人物动画】SALSA With RandomEyes (语音生成嘴型/人物说话) 使用

SALSA使用探索 之前做项目时想实现人物说话的效果&#xff0c;因为我们的语音是AI合成的&#xff0c;有很多片段&#xff0c;如果能根据语音生成嘴部的动画&#xff0c;那将极大便利我们的工作。后面是找到了SALSA的这款插件&#xff0c;并摸索出使用方法。 1 插件介绍 官方网…

仿QQ聊天程序(java)

简易版qq聊天&#xff1a;qq聊天[简易版] (resourcecode.cn) 推荐java最新聊天项目&#xff08;java仿微信聊天&#xff09;: java 简单仿微信聊天(springboot)_Garry1115的博客-CSDN博客_springboot 模拟微信 转载请标明出处&#xff1a;牟尼的专栏 牟尼的博客_CSDN博客-算法…

LaTeX数学公式输入初级入门

LaTeX最强大的功能就是显示美丽的数学公式&#xff0c;下面我们来看这些公式是怎么实现的。 1、数学公式的前后要加上 $ 或 \( 和 \)&#xff0c;比如&#xff1a;$f(x) 3x 7$ 和 \(f(x) 3x 7\) 效果是一样的&#xff1b; 如果用 \[ 和 \]&#xff0c;或者使用 $$ 和 $$&a…

《LaTex》LaTex数学公式简介

LaTex数学公式简介 文章目录 一、引用数学公式的方法二、LaTex数学公式的基本代码1. 符号1.1. 常规的数学符号&#xff1a;直接从键盘输入1.2. 任何1.3. 存在1.4. 属于1.5. 小于等于1.6. 大于等于1.7. 约等于1.8. 更多数学符号 2. 希腊字母2.1. 阿尔法2.2. 贝塔2.3. 伽马2.4. 希…

LaTex数学公式简介

LaTex数学公式简介目录 一、引用数学公式的方法二、LaTex数学公式的基本代码1. 符号1.1. 常规的数学符号&#xff1a;直接从键盘输入1.2 标志符1.3 希腊字母1.4 运算符1.4.1 三角函数1.4.2 极限1.4.3 项数和指数1.4.4 积分1.4.5 矩阵 三、补充四、参考文献 一、引用数学公式的方…

常用数学公式,推导记录

1 组合数计算公式 组合公式的推导由排列公式去掉重复的部分得来。 排列是&#xff0c;从n个不相同元素中取出m个排成一列&#xff08;有序&#xff09;&#xff0c;第一个位置可以有n个选择&#xff0c;第二个位置可以有n-1个选择&#xff08;已经有1个放在前一个位置&#xff…

CMU 开源数学神器,可快速将数学公式转为精美图表!

公众号关注 “GitHubDaily” 设为 “星标”&#xff0c;每天带你逛 GitHub&#xff01; 转自机器之心 在有些人眼里&#xff0c;数学公式就是一堆数字和符号&#xff0c;但在另一些人看来&#xff0c;这些数字和符号是可以动的&#xff0c;而且极富美感。为什么会有这种差距&am…

Markdown / KaTex数学公式汇总

目录 【LaTex和KaTex】【软件推荐 Mathpix】一、如何插入公式二、上下标三、常用运算符四、高级运算符五、常用数学符号六、特殊符号6.1 箭头6.2 公式序号 七、括号使用八、矩阵九、集合运算十、希腊字母十一、字符大小 【LaTex和KaTex】 LaTeX是一种基于ΤΕΧ的排版系统&…

Latex数学公式表

1. Latex的两种公式模式 行间(inline)模式&#xff1a;即在正文中插入数学内容。行间公式用$ … $ 独立(display)模式&#xff1a;独立成行&#xff0c;可以有或没有编号。无编号用\ [ … \ ] 2.基本元素 希腊字母 标注 上下标 分数 运算符 求和&#xff08;\sum&#xff09;&…

陶哲轩预言成真!MIT加州理工让ChatGPT证明数学公式,数学成见证AI重大突破首个学科

来源 | 新智源 ID | AI-era 大语言模型&#xff0c;可以用来证明数学定理了&#xff01; 「数学天才」陶哲轩曾在一篇博客中称&#xff0c;2026年&#xff0c;AI将与搜索和符号数学工具相结合&#xff0c;成为数学研究中值得信赖的合著者。 这个预言&#xff0c;如今已经成…

Typora数学公式大全

Typora数学公式大全 typora做笔记时候经常要插入数学公式&#xff0c;但是好多符号难以记忆&#xff0c;所以该文总结个人常用符号便于查找 1 常见希腊字母 公式代码公式代码公式代码\alphaα\xiξ\omegaω / Ω\betaβ\zetaζ\phiΦ / φ\deltaδ / Δ\DeltaΔ\piπ\epsilo…