【汇编语言】第一个程序（四）—— 谁在幕后启动程序：探讨可执行文件的装载与执行

在这里插入图片描述

文章目录

前言
1. 可执行文件的加载与运行
- 1.1 DOS中的程序加载过程
- 1.2 问题1：谁加载了1.exe？
- 1.3 问题2：程序运行结束后的返回过程
- 1.4 操作系统的外壳
- 1.5 回答问题1和问题2
- 1.6 汇编程序执行的完整历程
2. 使用Debug加载与跟踪1.exe
- 2.1 Debug的加载流程
- 2.2 用Debug逐条跟踪程序
- - 2.2.1 观察寄存器
  - 2.2.2 补充：.exe文件中程序的加载过程
  - 2.2.2 看其它指令
  - 2.2.3 单步跟踪与程序结束
- 2.3 返回顺序及退出Debug
结语

前言

📌

汇编语言是很多相关课程（如数据结构、操作系统、微机原理）的重要基础。但仅仅从课程的角度出发就太片面了，其实学习汇编语言可以深入理解计算机底层工作原理，提升代码效率，尤其在嵌入式系统和性能优化方面有重要作用。此外，它在逆向工程和安全领域不可或缺，帮助分析软件运行机制并增强漏洞修复能力。

本专栏的汇编语言学习章节主要是依据王爽老师的《汇编语言》来写的，和书中一样为了使学习的过程容易展开，我们采用以8086CPU为中央处理器的PC机来进行学习。

1. 可执行文件的加载与运行

1.1 DOS中的程序加载过程

我们在前面文章中讲过，在DOS中，可执行文件中的程序P1若要运行，必须有一个正在运行的程序P2，将P1从可执行文件中加载入内存，将CPU的控制权交给它，P1才能得以运行；当P1运行完毕后，应该将CPU的控制权交还给使它得以运行的程序P2。

按照上面的原理，再来看一下之前的1.exe 的执行过程(思考相关的问题)。

在提示符"C:\"后面输入可执行文件的名字“1.exe”，按 Enter 键。这时，请思考下面的问题1。
1.exe 中的程序运行。
运行结束，返回，再次显示提示符“C:\”。请思考下面的问题2。

1.2 问题1：谁加载了1.exe？

此时，有一个正在运行的程序将1.exe中的程序加载入内存，这个正在运行的程序是什么？它将程序加载入内存后，如何使程序得以运行？

1.3 问题2：程序运行结束后的返回过程

程序运行结束后，返回到哪里？

如果你对 DOS 有比较深入的了解，那么，很容易回答问题1、问题2中所提出的问题。如果没有这种了解，可以先阅读下面的内容。

1.4 操作系统的外壳

操作系统是由多个功能模块组成的庞大、复杂的软件系统。任何通用的操作系统，都要提供一个称为shell（外壳）的程序，用户（操作人员）使用这个程序来操作计算机系统进行工作。

在这里插入图片描述

DOS 中有一个程序 command.com，这个程序在DOS 中称为命令解释器，也就是DOS系统的shell。

DOS 启动时，先完成其他重要的初始化工作，然后运行command.com，command.com运行后，执行完其他的相关任务后，在屏幕上显示出由当前盘符和当前路径组成的提示符，比如:“c:”或“c:\windows”等，然后等待用户的输入。
用户可以输入所要执行的命令，比如，cd、dir、type等，这些命令由command执行，command执行完这些命令后，再次显示由当前盘符和当前路径组成的提示符，等待用户的输入。

如果用户要执行一个程序，则输入该程序的可执行文件的名称，command首先根据文件名找到可执行文件，然后将这个可执行文件中的程序加载入内存，设置CS:IP指向程序的入口。此后，command 暂停运行，CPU 运行程序。程序运行结束后，返回到command中，command再次显示由当前盘符和当前路径组成的提示符，等待用户的输入。

在DOS中，command 处理各种输入：命令或要执行的程序的文件名。我们就是通过command来进行工作的。

1.5 回答问题1和问题2

现在回答问题1和问题2中所提出的问题。

在DOS中直接执行1.exe 时，是正在运行的command，将1.exe 中的程序加载入内存。
command设置CPU的CS:IP 指向程序的第一条指令(即程序的入口)，从而使程序得以运行。
程序运行结束后，返回到command 中，CPU 继续运行command。

1.6 汇编程序执行的完整历程

到此，我们知道了完成一个汇编程序从写出到执行的全部过程应该如下图所示：

在这里插入图片描述

2. 使用Debug加载与跟踪1.exe

可以用 Debug 来跟踪一个程序的运行过程，这通常是必须要做的工作。我们写的程序在逻辑上不一定总是正确，对于简单的错误，仔细检查一下源程序就可以发现；而对于隐藏较深的错误，就必须对程序的执行过程进行跟踪分析才容易发现。

下面以在前面的内容中生成的可执行文件1.exe为例，讲解如何用Debug对程序的执行过程进行跟踪。

2.1 Debug的加载流程

现在我们知道，在 DOS中运行一个程序的时候，是由command将程序从可执行文件中加载入内存，并使其得以执行。但是，这样我们不能逐条指令地看到程序的执行过程，因为command 的程序加载，设置CS:IP指向程序的入口的操作是连续完成的，而当CS:IP一指向程序的入口，command 就放弃了CPU的控制权，CPU立即开始运行程序，直至程序结束。

为了观察程序的运行过程，可以使用Debug。Debug可以将程序加载入内存，设置CS:IP指向程序的入口，但Debug并不放弃对CPU的控制，这样，我们就可以使用Debug的相关命令来单步执行程序，查看每一条指令的执行结果。

这里仍然要用到我们之前在【汇编语言】寄存器（CPU工作原理）（七）—— 查看CPU和内存，用机器指令和汇编指令编程这篇文章中所下载的软件和执行程序。

具体方法如下图所示：

在这里插入图片描述

在提示符后输入“debug 1.exe”，按 Enter 键，Debug将程序从 1.exe 中加载入内存，进行相关的初始化后设置 CS:IP 指向程序的入口。

2.2 用Debug逐条跟踪程序

2.2.1 观察寄存器

接下来可以用R命令看一下各个寄存器的设置情况，如下图所示。

在这里插入图片描述

可以看到，Debug将程序从可执行文件加载入内存后，cx中存放的是程序的长度。1.exe 中程序的机器码共有15个字节。则1.exe加载后，cx中的内容为000FH。

现在程序已从1.exe中装入内存，接下来查看一下它的内容，可是我们查看哪里的内容呢？程序被装入内存的什么地方？我们如何得知？

2.2.2 补充：.exe文件中程序的加载过程

这里，需要讲解一下在DOS系统中.EXE文件中的程序的加载过程。下图针对我们的问题，简要地展示了这个过程。

在这里插入图片描述

注意，有一步称为重定位的工作在上图中没有讲解，因为这个问题和操作系统的关系较大，我们不作讨论。

那么，我们的程序被装入内存的什么地方？我们如何得知？从上图中我们知道以
下的信息。

程序加载后，ds中存放着程序所在内存区的段地址，这个内存区的偏移地址为0，则程序所在的内存区的地址为 ds:0。
这个内存区的前256个字节中存放的是PSP，DOS用来和程序进行通信。从256字节处向后的空间存放的是程序。

所以，从ds中可以得到PSP的段地址SA，PSP的偏移地址为0，则物理地址为SA*16+0。

因为PSP占256(100H)字节，所以程序的物理地址是：SA*16+0+256=SA*16+16*16+0=(SA+16)*16+0

可用段地址和偏移地址表示为:SA+10H:0。

现在，我们看一下2.2.1图中DS的值，DS=129E，则PSP的地址为129E:0，程序的地址为12AE:0(即 129E+10:0)。
在上面2.2.1图中，CS=12AE，IP=0000，CS:IP指向程序的第一条指令。注意，源程序中的指令是 mov ax,0123H，在 Debug 中记为 mov ax,0123，这是因为 Debug 默认所有数据都用十六进制表示。