前言
📌
汇编语言是很多相关课程(如数据结构、操作系统、微机原理)的重要基础。但仅仅从课程的角度出发就太片面了,其实学习汇编语言可以深入理解计算机底层工作原理,提升代码效率,尤其在嵌入式系统和性能优化方面有重要作用。此外,它在逆向工程和安全领域不可或缺,帮助分析软件运行机制并增强漏洞修复能力。
本专栏的汇编语言学习章节主要是依据王爽老师的《汇编语言》来写的,和书中一样为了使学习的过程容易展开,我们采用以8086CPU为中央处理器的PC机来进行学习。
文章目录
- 前言
- 1. 标志寄存器
- 1.1 功能概述
- 1.2 8086CPU中的标志寄存器
- 2. ZF 标志
- 2.1 功能介绍
- 2.2 举例说明
- 2.3 注意事项
- 3. PF 标志
- 3.1 功能介绍
- 3.2 举例说明
- 4. SF 标志
- 4.1 功能介绍
- 4.2 举例说明
- 4.3 有/无符号数和补码
- 4.4 补充说明
- 5. CF 标志
- 5.1 功能介绍
- 5.2 什么是更高位?
- 5.3 举例说明
- 5.3.1 进位的情况
- 5.3.2 借位的情况
- 6. OF 标志
- 6.1 功能介绍
- 6.2 溢出
- 6.2.1 溢出的概念
- 6.2.2 机器表示的范围
- 6.2.3 举例说明
- 6.2.4 溢出导致的后果
- 6.3 CF 与 OF 的区别
- 6.3.1 示例1
- 6.3.2 示例2
- 6.3.3 示例3
- 结语
1. 标志寄存器
1.1 功能概述
CPU 内部的寄存器中,有一种特殊的寄存器(对于不同的处理机,个数和结构都可能不同)具有以下3种作用:
(1)用来存储相关指令的某些执行结果。
(2)用来为 CPU 执行相关指令提供行为依据。
(3)用来控制 CPU的相关工作方式。
1.2 8086CPU中的标志寄存器
这种特殊的寄存器在8086CPU中,被称为标志寄存器。8086CPU的标志寄存器有16位,其中存储的信息通常被称为程序状态字(PSW)。我们已经使用过8086CPU的ax、bx、cx、dx、si、di、bp、sp、IP、cs、ss、ds、es等13 个寄存器了,本章中的标志寄存器(以下简称为 fag)是我们要学习的最后一个寄存器(✌✌✌太开心了)。
flag 和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义。而flag寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息。
8086CPU的flag寄存器的结构,如下图所示。
flag的1、3、5、12、13、14、15位在8086CPU中没有使用,不具有任何含义。而0、2、4、6、7、8、9、10、11位都具有特殊的含义。
在这一章中,我们学习标志寄存器中的CF、PF、ZF、SF、OF、DF 标志位,以及一些与其相关的典型指令。
2. ZF 标志
2.1 功能介绍
flag的第6位是ZF,零标志位。
它记录相关指令执行后,
- 结果为0,ZF = 1
- 结果不为0,ZF = 0
2.2 举例说明
例如:
(1)
mov ax,1
sub ax,1
指令执行后,结果为0,则ZF = 1。
(2)
mov ax,2
sub ax,1
指令执行后,结果为1,则ZF = 0。
对于zf的值,我们可以这样来看,zf标记相关指令的计算结果是否为0。
-
如果为0,则zf要记录下“是0”这样的肯定信息。在计算机中1表示逻辑真,表示肯定,所以当结果为0的时候 zf=1,表示“结果是0”。
-
如果结果不为0,则zf要记录下“不是0”这样的否定信息。在计算机中0表示逻辑假,表示否定,所以当结果不为0的时候 zf=0,表示“结果不是0”。
比如,指令:
(1)
mov ax,1
and ax,0
执行后,结果为0,则ZF=1,表示“结果是0”。
(2)
mov ax,1
or ax,0
执行后,结果不为0,则ZF=0,表示“结果非0”。
2.3 注意事项
在8086CPU的指令集中,
有的指令的执行是影响标志寄存器的,比如:add、sub、mul、div、inc、or、and等,它们大都是运算指令(进行逻辑或算术运算);
有的指令的执行对标志寄存器没有影响,比如:mov、push、pop等,它们大都是传送指令。
我们在使用一条指令的时候,要注意这条指令的全部功能,其中包括,执行结果对标记寄存器的哪些标志位造成影响。
3. PF 标志
3.1 功能介绍
flag的第2位是PF,奇偶标志位。
它记录指令执行后,结果的所有二进制位中1的个数:
- 为偶数,PF = 1
- 为奇数,PF = 0
3.2 举例说明
比如,指令:
(1)
mov al,1
add al,10
执行后,结果为00001011B,其中有3(奇数)个1,则PF=0;
(2)
mov al,1
or al,10
执行后,结果为00000011B,其中有2(偶数)个1,则PF=1;
(3)
sub al,al
执行后,结果为00000000B,其中有0(偶数)个1,则pf=1。
4. SF 标志
4.1 功能介绍
flag的第7位是SF,符号标志位。
它记录指令执行后,
- 结果为负,SF = 1
- 结果为正,SF = 0
SF 标志,就是CPU对有符号数运算结果的一种记录 ,它记录数据的正负。
在我们将数据当作有符号数来运算的时候,可以通过它来得知结果的正负。如果我们将数据当作无符号数来运算,SF的值则没有意义,虽然相关的指令影响了它的值。
这也就是说,CPU在执行 add 等指令时,是必然要影响到SF标志位的值的。至于我们需不需要这种影响,那就看我们如何看待指令所进行的运算了。
4.2 举例说明
比如:
(1)
mov al,10000001B
add al,1
执行后,结果为10000010B,SF=1,
表示:如果指令进行的是有符号数运算,那么结果为负;
(2)
mov al,10000001B
add al,01111111B
执行后,结果为0,SF=0
表示:如果指令进行的是有符号数运算,那么结果为非负。
4.3 有/无符号数和补码
我们知道计算机中通常用补码来表示有符号数据。
计算机中的一个数据可以看作是有符号数,也可以看成是无符号数。
比如:
-
00000001B ,可以看作为无符号数 1 ,或有符号数 +1;
-
10000001B ,可以看作为无符号数 129,也可以看作有符号数 -127。
这也就是说,对于同一个二进制数据,计算机可以将它当作无符号数据来运算,也可以当作有符号数据来运算。
比如:
mov al,10000001B
add al,1
结果: (al)=10000010B。
-
可以将 add 指令进行的运算当作无符号数的运算,那么 add 指令相当于计算 129+1,结果为 130(10000010B);
-
也可以将add指令进行的运算当作有符号数的运算,那么add指令相当于计算-127+1,结果为-126(10000010B)。
不管我们如何看待,CPU 在执行 add 等指令的时候,就已经包含了两种含义,也将得到用同一种信息来记录的两种结果。关键在于我们的程序需要哪一种结果。
4.4 补充说明
某些指令将影响标志寄存器中的多个标记位,这些被影响的标记位比较全面地记录了指令的执行结果,为相关的处理提供了所需的依据。
比如指令sub al,al
执行后,ZF、PF、SF等标志位都要受到影响,它们分别为:1、1、0。
5. CF 标志
5.1 功能介绍
flag的第0位是CF,进位标志位。
一般情况下,在进行无符号数运算的时候,它记录了运算结果的最高有效位向更高位的进位值,或从更高位的借位值。
5.2 什么是更高位?
对于位数为N的无符号数来说,其对应的二进制信息的最高位,即第N-1位,就是它的最高有效位,而假想存在的第N位,就是相对于最高有效位的更高位。如下图所示。
5.3 举例说明
5.3.1 进位的情况
我们知道,当两个数据相加的时候,有可能产生从最高有效位向更高位的进位。比如,两个8 位数据:98H+98H,将产生进位。
由于这个进位值在8位数中无法保存,我们在前面的内容中,就只是简单地说这个进位值丢失了。
其实CPU在运算的时候,并不丢弃这个进位值,而是记录在一个特殊的寄存器的某一位上。
8086CPU 就用flag的CF位来记录这个进位值。
比如,下面的指令:
mov al,98H
add al,al ;执行后: (al)=30H,CF=1,CF记录了从最高有效位向更高位的进位值add al,al ;执行后: (al)=60H,CF=0,
5.3.2 借位的情况
另外一种情况,而当两个数据做减法的时候,有可能向更高位借位。
比如,两个 8 位数据:97H-98H,将产生借位,借位后,相当于计算197H-98H。
而flag的CF位也可以用来记录这个借位值。
比如,下面的指令:
mov al,97H
sub al,98H ;执行后:(a1)=FFH,CF=1,CF记录了向更高位的借位值
sub al,al ;执行后:(al)=0,CF=0,CF记录了向更高位的借位值
6. OF 标志
6.1 功能介绍
flag的第11位是OF,溢出标志位。
一般情况下,OF记录了有符号数运算的结果是否发生了溢出。
- 如果发生溢出,OF=1
- 如果没有溢出,OF=0
6.2 溢出
6.2.1 溢出的概念
在进行有符号数运算的时候,如结果超过了机器所能表示的范围称为溢出。
由于在进行有符号数运算时,可能发生溢出而造成结果的错误。
则CPU需要对指令执行后是否产生溢出进行记录。
6.2.2 机器表示的范围
那么,什么是机器所能表示的范围呢?
比如说,指令运算的结果用8位寄存器或内存单元来存放,比如,addal3,那么对于8位的有符号数据,机器所能表示的范围就是-128~127。
同理,对于16位有符号数据,机器所能表示的范围是-32768~32767。
如果运算结果超出了机器所能表达的范围,将产生溢出。
❗注意,这里所讲的溢出,只是对有符号数运算而言。(就像进位只是相对于无符号数而言!)
6.2.3 举例说明
下面我们看两个溢出的例子。
(1)
mov al,98
add al,99
执行后将产生溢出。因为add al,99
进行的有符号数运算是:
(al)=(al)+99-98+99=197。
而结果197超出了机器所能表示的8位有符号数的范围:-128~127.
(2)
mov al,0FOH ;FOH,为有符号数-16的补码
add al,088H ;88H,为有符号数-120的补码
执行后,将产生溢出。因为add al,088H
进行的有符号数运算是:
(al)=(al)+(-120)=(-16)+(-120)=-136
而结果-136超出了机器所能表示的8位有符号数的范围:-128~127。
6.2.4 溢出导致的后果
如果在进行有符号数运算时发生溢出,那么运算的结果将不正确。
就上面的两个例子来说:
(1)
mov al,98
add al,99
add 指令运算的结果是(al)=0C5H,因为进行的是有符号数运算,所以al中存储的是有符号数,而C5H是有符号数-59的补码。
如果我们用add指令进行的是有符号数运算,则 98+99=-59这样的结果让人无法接受。
造成这种情况的原因,就是实际的结果197,作为一个有符号数,在8位寄存器al中存放不下。
(2)
同样,对于:
mov al,0FOH ;FOH,为有符号数-16的补码
add al,088H ;88H,为有符号数-120的补码
add 指令运算的结果是(al)=78H,因为进行的是有符号数运算,所以al中存储的是有符号数,而78H表示有符号数120。
如果我们用add指令进行的是有符号数运算,则-16-120=120这样的结果显然不正确。
造成这种情况的原因,就是实际的结果-136,作为一个有符号数,在8位寄存器al中存放不下。
6.3 CF 与 OF 的区别
一定要注意CF和OF的区别:
CF是对无符号数运算有意义的标志位,
而OF是对有符号数运算有意义的标志位。
6.3.1 示例1
比如:
mov al,98
add al,99
add 指令执行后:CF=0,OF=1。
前面我们讲过,CPU在执行add等指令的时候,就包含了两种含义:无符号数运算和有符号数运算。
-
对于无符号数运算,CPU用CF位来记录是否产生了进位;
-
对于有符号数运算,CPU用OF位来记录是否产生了溢出。
当然,还要用SF位来记录结果的符号。
-
对于无符号数运算,98+99没有进位,CF=0;
-
对于有符号数运算,98+99发生溢出,OF=1。
6.3.2 示例2
mov al,0F0H
add al,88H
add 指令执行后:CF=1,OF=1。
-
对于无符号数运算,0F0H+88H有进位,CF=1;
-
对于有符号数运算,0F0H+88H发生溢出,OF=1。
6.3.3 示例3
mov al,0F0H
add al,78H
add 指令执行后:CF=1,OF=0。
-
对于无符号数运算,0F0H+78H有进位,CF=1;
-
对于有符号数运算,0F0H+78H不发生溢出,OF=0。
🚀🚀🚀我们可以看出,CF和OF所表示的进位和溢出,是分别对无符号数和有符号数运算而言的,它们之间没有任何关系。
结语
今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下。
也可以点点关注,避免以后找不到我哦!
Crossoads主页还有很多有趣的文章,欢迎小伙伴们前去点评,您的支持就是作者前进的动力!