ARM 汇编是嵌入式开发、操作系统底层编程和性能优化的核心技能之一。以下是一份系统的 ARM 汇编指令教学指南,涵盖基础语法、核心指令、编程模式和实用示例。
1. ARM 汇编基础
1.1 寄存器
ARM 架构(32位)包含 16 个通用寄存器(R0-R15),其中部分有特殊用途:
R0-R12:通用寄存器,用于存储数据和地址。
R13 (SP):栈指针(Stack Pointer),指向当前栈顶。
R14 (LR):链接寄存器(Link Register),保存函数返回地址。
R15 (PC):程序计数器(Program Counter),指向下一条要执行的指令。
CPSR:当前程序状态寄存器(Condition Program Status Register),存储条件标志(如 Z、N、C、V)。
2. ARM 汇编指令格式
ARM 指令通常遵循以下格式:
<操作码>{条件码}{S} <目标寄存器>, <操作数1>, <操作数2>
条件码(可选):如 EQ(相等)、NE(不等)、GT(大于)。
S(可选):更新 CPSR 标志(如 ADDS 会更新 Z/N/C/V 标志)。
操作数:可以是寄存器、立即数或内存地址。
3. 核心指令分类
3.1 数据传输指令
MOV:将数据从一个寄存器或立即数复制到另一个寄存器。
MOV R0, #42 ; R0 = 42
MOV R1, R0 ; R1 = R0
LDR/STR:从内存加载数据到寄存器(Load)或从寄存器存储到内存(Store)。
LDR R0, [R1] ; R0 = 内存地址[R1]处的值
STR R2, [R3, #4] ; 将 R2 的值存储到内存地址 R3 + 4
3.2 算术运算
ADD/SUB:加法和减法。
ADD R0, R1, R2 ; R0 = R1 + R2
SUB R3, R3, #1 ; R3 = R3 - 1
MUL/MLA:乘法和乘加。
MUL R0, R1, R2 ; R0 = R1 * R2
MLA R0, R1, R2, R3 ; R0 = R1 * R2 + R3
3.3 逻辑运算
AND/ORR/EOR/BIC:按位与、或、异或、位清除。
AND R0, R1, #0xFF ; R0 = R1 & 0xFF(取低8位)
BIC R0, R1, #0x3 ; R0 = R1 & ~0x3(清除最低2位)
3.4 比较与分支
CMP:比较两个操作数并更新 CPSR。
CMP R0, R1 ; 计算 R0 - R1,更新标志位
B/BL:无条件跳转(Branch)或带链接的跳转(Branch with Link,用于函数调用)。
B loop ; 跳转到标签 loop
BL my_function ; 调用函数 my_function,返回地址存入 LR
3.5 栈操作
PUSH/POP:压栈和弹栈操作(需指定寄存器列表)。
PUSH {R0, R1, LR} ; 将 R0, R1, LR 压入栈
POP {R0, R1, PC} ; 从栈中恢复 R0, R1,并将返回地址写入 PC(函数返回)
4. 寻址模式
4.1 立即数寻址
使用 # 前缀表示立即数:
MOV R0, #0x100 ; R0 = 0x100
注意:ARM 立即数需满足特定规则(如 8 位有效位 + 移位)。
4.2 寄存器间接寻址
通过寄存器中的地址访问内存:
LDR R0, [R1] ; R0 = 内存地址[R1]处的值
STR R2, [R3, #4] ; 存储到地址 R3 + 4
4.3 基址变址寻址
支持偏移、前变址和后变址:
LDR R0, [R1, #8]! ; 前变址:R1 = R1 + 8,然后 R0 = [R1]
LDR R0, [R1], #8 ; 后变址:R0 = [R1],然后 R1 = R1 + 8
5. 控制结构
5.1 条件分支
根据 CPSR 标志跳转:
CMP R0, #10 ; 比较 R0 和 10
BGT greater_than ; 若 R0 > 10,跳转到 greater_than
5.2 循环
使用条件分支实现循环:
MOV R0, #0 ; 初始化计数器
loop:ADD R0, R0, #1 ; 计数器加1CMP R0, #5BLT loop ; 若 R0 < 5,继续循环
6. 函数调用
遵循 AAPCS(ARM Architecture Procedure Call Standard)规范:
参数传递:前 4 个参数通过 R0-R3 传递,后续参数通过栈传递。
返回值:通过 R0 返回。
保存寄存器:被调用函数需保护 R4-R11、SP、LR 等寄存器。
示例:函数调用
.global main
main:MOV R0, #5 ; 参数 n = 5BL factorial ; 调用 factorial 函数BX LR ; 返回factorial:PUSH {R4, LR} ; 保存寄存器MOV R4, R0 ; 保存参数到 R4CMP R4, #1MOVEQ R0, #1 ; 若 n == 1,返回 1POPEQ {R4, PC} ; 恢复寄存器并返回SUB R0, R4, #1 ; 计算 n-1BL factorial ; 递归调用 factorial(n-1)MUL R0, R4, R0 ; R0 = n * factorial(n-1)POP {R4, PC} ; 恢复寄存器并返回
7. 常见问题与调试
7.1 立即数限制
如果立即数过大,需分步加载或使用 LDR 伪指令:
LDR R0, =0x12345678 ; 加载任意32位立即数(编译器自动处理)
7.2 条件执行
几乎所有 ARM 指令都可条件执行:
ADDEQ R0, R1, R2 ; 仅在 Z 标志置位时执行加法
7.3 调试工具
GDB:使用 arm-none-eabi-gdb 调试汇编代码。
QEMU:模拟 ARM 硬件环境。
Keil/STM32CubeIDE:针对嵌入式硬件的集成调试环境。
8. 完整示例:计算阶乘
.global main
main:MOV R0, #5 ; 计算 5!BL factorialB exitfactorial:CMP R0, #1 ; 基准条件:n == 1MOVEQ PC, LR ; 若满足,直接返回PUSH {R0, LR} ; 保存当前 n 和返回地址SUB R0, R0, #1 ; n = n - 1BL factorial ; 递归调用 factorial(n-1)POP {R1, LR} ; 恢复原 n 到 R1 和返回地址MUL R0, R1, R0 ; R0 = n * factorial(n-1)BX LR ; 返回exit:; 此处可添加退出代码