AAPCS:最新的ARM子程序调用规则

        AAPCS是arm公司发布的ARM架构应用程序二进制(ABI)程序调用接口,该文档由多个版本,博主第一次ARM程序调用规则是在《ARM体系与结构编程》,但书中描述的是ATPCS,AAPCS是ATPCS的升级版。后面去ARM官网看到了AAPCS的文档,遂记录下来。ARM的ABI标准有多个文档,该文档只是其中的一部分。下面的链接里面包含了相关文档,又想去的可以拿来都看看。最新版的链接:GitHub - ARM-software/abi-aa: Application Binary Interface for the Arm® Architecture

1、适用范围

        AAPCS定义了子程序如何编写、如何编译和单独组装以协同工作,它描述了调用例程和被调用例程之间的关系:

  • 调用函数需要创建一个程序状态,在该状态下,被调用例程可以开始执行。

  • 被调用函数有义务在被调用期间保留调用函数的程序状态。

  • 被调用函数有权更改调用函数的程序状态。

        该标准是一系列过程调用标准(PCS)变体的基础,这些变体是通过反映以下替代优先级的选择而生成的:

  • 代码

  • 性能

  • 功能性( 例如,调试的便捷性,运行时检查,对共享库的支持 )

每个变体的某些方面(如R9的使用情况)有执行环境决定,因此:

  • 遵循基本标准的代码可以与每个变体都兼容PCS,这是可能的。

  • 符合某个变体的代码与符合任何其他变体的代码兼容,这是不寻常的。

  • 符合某个变体或基本标准的代码不能保证与要求这些标准的执行环境兼容。执行环境可能对过程调用标准范围之外提出进一步的要求。

该标准分为四个部分:

  • 数据的布局。

  • 具有公共接口的函数之间的堆栈布局和调用方式。

  • 处理器扩展可用的变体,或者在执行环境限制寻址模型时。

  • 用于普通数据类型的C和C++语言绑定。

        本规范不标准化非C语言实体的公共可见性的表示(这些在CPPABI32中描述),并且对不在公共接口上可见的语言实体的表示不提出任何要求。

2、数据类型和对齐方式

2.1 基本数据类型

下表显示了机器的基本数据类型(机器类型),NULL指针总是由全为0表示。

2.1.1 半精度浮点

ARM架构的可选扩展为半精度值提供硬件支持,目前支持三种格式:

  • IEEE754-2008标准的半精度格式

  • ARM的替代格式,提供额外的范围,但没有无穷大(NaN)

  • Brain浮点格式,提供了类似于32位浮点格式的动态范围,但精度更少。

2.1.2 容器化向量

        容器化向量的内容对大多数调用标准来说都是不透明的:其布局的唯一定义方面是内存格式(基本类型在内存中储存的方式),与调用时不同寄存器之间的映射。

2.2 字节顺序

从软件的角度看,内存就是一个数组,每个字节都有自己的地址。

ABI支持由底层硬件实现的两种内存视图:

  • 大端视图(大端模式)

  • 小端视图(小端模式)

2.3 复合类型

        复合类型是一个或多个基本数据类型的集合,在调用过程中作为单个实体进行处理。可以是以下任意一种:

  • 顺序,其成员按照顺序排列在内存中(其实就是C的结构体)

  • 联合体,每个成员都有相同的地址

  • 数组

该定义是递归的,也就是说,每个类型都可以包含复合类型(结构体套结构体)。

3 基本过程调用标准

        该部分定义了ARM和Thumb通用的机器级、仅核心寄存器调用标准指令集。应用于没有浮点硬件的系统, 或者需要与Thumb代码高度互操作的情况。

3.1 机器寄存器

        ARM架构定义了一个核心指令集,以及协处理器附加的指令。核心指令集可以访问核心寄存器,协处理器可以提供额外操作的寄存器。

3.1.1 核心寄存器

        ARM和Thumb指令集有16个32位寄存器,R0--R15,还有一个状态寄存器(CPSR),下表是各个寄存器的功能。

        前四个寄存器r0-r3(a1-a4)用于将参数值传递到子例程,并从函数返回结果值。它们也可以用于在例程内部保存中间值(但通常仅在子例程调用之间)。

        寄存器r12(IP)可以由链接器在例程和调用的任何子例程之间用作临时寄存器(有关详细信息,请参阅链接器使用IP)。它还可以在例程内部用于保存子例程调用之间的中间值。

        在某些变体中,寄存器r11(FP)可能被用作帧指针,以便将帧激活记录链接成链表。

        寄存器r9的角色取决于平台。虚拟平台可以为该寄存器分配任何角色,并必须记录此用法。例如,它可以将其指定为无位置相关数据模型中的静态基址(SB),或者在具有线程局部存储的环境中将其指定为线程寄存器(TR)。对该寄存器的使用可能需要保持其值在所有调用之间持久。没有对这种特殊寄存器的需求的虚拟平台可以将r9指定为附加的被调用保存变量寄存器v6。

        通常,寄存器r4-r8,r10和r11(v1-v5,v7和v8)用于保存例程的局部变量的值。其中,只有v1-v4可以由整个Thumb指令集统一使用,但AAPCS并不要求Thumb代码仅使用这些寄存器。

        子例程必须保留寄存器r4-r8,r10,r11和SP的内容(在PCS变体中,将r9指定为v6时也要保留r9)。

        在过程调用标准的所有变体中,寄存器r12-r15都具有特殊角色。在这些角色中,它们被标记为IP,SP,LR和PC。

CPSR是一个具有以下属性的全局寄存器:

  • 在进入或从公共接口返回时,N、Z、C、V和Q位(位27-31)以及GE[3:0]位(位16-19)是未定义的。只有在执行支持这些特性的处理器上时,才可以修改Q和GE[3:0]位。

  • 在Arm架构6上,E位(位8)可用于在执行小端模式的应用程序中,或在大端-8模式中暂时更改对内存的数据访问的字节序。应用程序必须具有指定的字节序,并且在进入和退出任何公共接口时,E位的设置必须与应用程序的指定字节序匹配。

  • T位(位5)和J位(位24)是执行状态位。只有专为修改这些位而指定的指令才能更改它们。

  • A、I、F和M[4:0]位(位0-7)是特权位,只能由专为在特权模式下明确运行的应用程序修改。

  • 所有其他位都是保留位,不得修改。未定义这些位是读作零还是一,或者它们是否在公共接口间保持不变。

3.1.1.1 处理大于32位的值

        大于32位的基本类型可以作为参数传递给函数调用,或作为函数调用的结果返回。当这些类型位于核心寄存器中时,应用以下规则:

  • 双字大小的类型以两个连续的寄存器传递(例如,r0和r1,或r2和r3)。寄存器的内容就像使用单个LDM指令从内存表示中加载该值一样。

  • 一个128位的容器化向量以四个连续的寄存器传递。寄存器的内容就像使用单个LDM指令从内存中加载该值一样。

3.2 进程、内存和堆栈

        AAPCS适用于单个执行线程或进程(以下统称为进程)。进程具有由底层机器寄存器和其可以访问的内存内容定义的程序状态。在进程执行期间,进程能够访问的内存,而不会导致运行时故障,可能会有所变化。 进程的内存通常可分为五个类别:

  • 代码(正在执行的程序),必须对进程可读,但不必对其可写。

  • 只读静态数据。

  • 可写静态数据。

  • 堆。

  • 堆栈。

        可写的静态数据可以进一步分为已初始化、零初始化和未初始化数据。除了堆栈外,没有要求每个内存类都必须占据内存的单个连续区域。进程始终必须有一些代码和一个堆栈,但不必拥有任何其他内存类别。

        堆是由进程自身管理的内存区域(例如,使用C的malloc函数)。通常用于创建动态数据对象。

        符合规范的程序必须只执行在被指定为包含代码的内存区域中的指令。

3.2.1 堆栈

        堆栈是一块连续的内存区域,可用于存储局部变量和在参数寄存器不足时向子例程传递附加参数。

        堆栈实现是完全降序的,当前堆栈的范围保存在寄存器SP(r13)中。堆栈通常会有基地址和限制地址,尽管在实践中应用可能无法确定任何一个值的具体数值。

        堆栈可能具有固定大小,也可能是动态可扩展的(通过向下调整堆栈限制)。

        关于堆栈的维护规则分为两部分:一组必须始终遵守的约束条件和一个必须在公共接口中遵守的附加约束条件。

3.2.1.1 通用堆栈约束

始终需要满足以下基本约束条件:

  • 堆栈限制 ≤ SP ≤ 堆栈基址。堆栈指针必须位于堆栈的范围内。

  • SP mod 4 = 0。堆栈始终必须对齐到字边界。

  • 进程只能将数据存储在整个堆栈的封闭区间内,由[SP,堆栈基址 - 1](其中SP是寄存器r13的值)限定。

3.2.1.2 公共接口的堆栈约束

在公共接口处,堆栈还必须符合以下约束: SP mod 8 = 0。堆栈必须是双字对齐的。

3.2.1.3 堆栈探查

        为了确保堆栈的完整性,进程可能在分配额外的堆栈空间(从SP_old移动到SP_new)之前立即发出堆栈探查。堆栈探查必须位于[SP_new, SP_old - 1]的区域内,并且可以是读或写操作。堆栈探查的最小间隔由目标平台定义,但必须至少为4K字节。在当前分配的堆栈区域下面不能保存可恢复的数据。

3.2.1.4 帧指针

        平台可能要求构建描述程序中当前调用层次结构的堆栈帧列表。 每个帧应通过在堆栈上使用两个32位值的帧记录与其调用者的帧链接。最内层帧(属于最近例程调用)的帧记录应由帧指针寄存器(FP)指向。最低地址的字应指向上一个帧记录,最高地址的字应包含在进入当前函数时传递给LR的值。帧记录链的结束由前一帧的地址为零来表示。在堆栈帧中的帧记录位置未指定。帧指针寄存器在新的帧记录完全构建之前不能更新。

3.3 子例程调用

        Arm和Thumb指令集都包含一个基本的子例程调用指令BL,执行分支带链接操作。执行BL的效果是将程序计数器的下一个顺序值,即返回地址,传送到链接寄存器(LR),并将目标地址传送到程序计数器(PC)。如果从Thumb状态执行BL指令,则链接寄存器的第0位将设置为1,如果从Arm状态执行,则设置为0。结果是将控制权转移到目标地址,将LR中的返回地址作为附加参数传递给被调用的子例程。

        当返回地址被加载回PC时(请参见交互操作),控制将返回到BL后面的指令。

3.4 返回结果

函数返回结果的方式取决于该结果的类型。对于基本标准:

  1. 半精度浮点类型返回在r0的最低有效16位。

  2. 小于4字节的基本数据类型被零扩展或符号扩展为一个字,并返回在r0中。

  3. 字大小的基本数据类型(例如,int、float)在r0中返回。

  4. 双字大小的基本数据类型(例如,longlong、double和64位容器化向量)在r0和r1中返回。

  5. 128位容器化向量在r0-r3中返回。

  6. 不大于4字节的复合类型在r0中返回。其格式就像将结果存储在内存中的字对齐地址,然后使用LDR指令加载到r0中一样。r0中超出结果范围的任何位都具有未指定的值。

  7. 大于4字节的复合类型,或其大小无法由调用方和被调用方静态确定的,将存储在内存中,其地址作为调用函数时传递的额外参数(参数传递,基本PCS,规则A.4)。结果使用的内存在函数调用期间的任何时刻都可以进行修改。

3.5 参数传递

        基本标准提供了在核心寄存器(r0-r3)和堆栈上传递参数的机制。对于需要少量参数的子例程,仅使用寄存器,大大降低了调用的开销。 参数传递被定义为一个两级概念模型:

  1. 从源语言参数映射到机器类型。

  2. 编排机器类型以生成最终的参数列表。

        从源语言到机器类型的映射对于每种语言都是特定的,并在单独的文档中描述(C和C++语言绑定在Arm C和C++语言映射中描述)。结果是一个有序的参数列表,将传递给子例程。

        在下面的描述中,假设有许多协处理器可用于传递和接收参数。协处理器寄存器分为不同的类别。一个参数最多可以是一个协处理器寄存器类的候选项。适合分配给协处理器寄存器的参数称为协处理器寄存器候选项(CPRC)。 在基本标准中,没有适合于协处理器寄存器类的参数。

        一个变参函数始终按照基本标准的方式进行编排。

        对于调用方,假定在进行编排之前已分配足够的堆栈空间以容纳堆叠的参数:实际上,只有在参数编排完成后,才能知道所需的堆栈空间量。被调用方可以修改用于接收来自调用方的参数值的任何堆栈空间。

        当将复合类型参数分配给核心寄存器时(完全或部分),其行为就好像参数已存储到内存中的字对齐(4字节)地址,然后使用适当的加载多寄存器指令加载到连续的寄存器中。

4.总结

        本篇文章属于笔记性质的,在文章中,博主只是挑选了其中的一部分记录,奈何英文不太行,理解和翻译的水平怕是不够的,有兴趣的同学可以看原版。博主上传到自己的码云仓库里面,码云链接:https://gitee.com/zichuanning520/htq_library

最新版的链接:GitHub - ARM-software/abi-aa: Application Binary Interface for the Arm® Architecture

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/167474.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机视觉实战项目3(图像分类+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别+无人机检测+A*路径规划+单目测距与测速+行人车辆计数等)

车辆跟踪及测距 该项目一个基于深度学习和目标跟踪算法的项目,主要用于实现视频中的目标检测和跟踪。该项目使用了 YOLOv5目标检测算法和 DeepSORT 目标跟踪算法,以及一些辅助工具和库,可以帮助用户快速地在本地或者云端上实现视频目标检测和…

javaEE - 1(9000字详解多线程)

一:认识线程 1.1 线程的概念 线程是操作系统中执行的最小单位,它是进程中的一个实体。一个进程可以包含多个线程,并且这些线程共享进程的资源,如内存、文件句柄等,但每个线程有自己的独立执行流程和栈空间。 线程在…

昇腾CANN 7.0 黑科技:大模型训练性能优化之道

目前,大模型凭借超强的学习能力,已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力。大模型经过海量数据的预训练,通常具有良好的通用性和泛化性。用户基于“大模型预训练微调”开发范式即可在实际业务场景取…

【技能树笔记】网络篇——练习题解析(八)

目录 前言 一、LAN技术 1.1 堆叠与集群 1.2 MSTP的特点 二、WAN技术 2.1 PPP链路建立 2.2 PPPoE 2.3 组播 2.3.1 组播的IP 2.3.2 组播分发树 2.3.3 组播协议 三、IPv6基础 3.1 IPv6地址 3.2 IPv6协议 3.3 IPv6过渡技术 总结 🌈嗨!我是Filotimo__&#x1…

Linux下Jenkins自动化部署SpringBoot应用

Linux下Jenkins自动化部署SpringBoot应用 1、 Jenkins介绍 官方网址:https://www.jenkins.io/ 2、安装Jenkins 2.1 centos下命令行安装 访问官方,点击文档: 点击 Installing Jenkins: 点击 Linux: 选择 Red Hat/…

RK3568平台 GPIO子系统框架

一.gpio 子系统简介 gpio 子系统顾名思义,就是用于初始化 GPIO 并且提供相应的 API 函数,比如设置 GPIO为输入输出,读取 GPIO 的值等。gpio 子系统的主要目的就是方便驱动开发者使用 gpio,驱动 开发者在设备树中添加 gpio 相关信…

改进YOLO系列 | YOLOv5/v7 引入 Dynamic Snake Convolution | 动态蛇形卷积

准确分割拓扑管状结构,如血管和道路,在各个领域中至关重要,可以确保下游任务的准确性和效率。然而,许多因素使任务复杂化,包括细小的局部结构和可变的全局形态。在这项工作中,我们注意到管状结构的特殊性,并利用这一知识来引导我们的DSCNet,以在三个阶段同时增强感知:…

【问题记录】解决Qt连接MySQL报“QMYSQL driver not loaded”以及不支持MySQL事务操作的问题!

环境 Windows 11 家庭中文版,64 位操作系统, 基于 x64 的处理器Qt 5.15.2 MinGW 32-bitmysql Ver 14.14 Distrib 5.7.42, for Win32 (AMD64) 问题情况 在Qt 5.15.2 中编写连接MySQL数据库代码后,使用 MinGW 32-bit 构建套件进行编译运行后,报…

互联网Java工程师面试题·Java 面试篇·第四弹

目录 59、我们能自己写一个容器类,然后使用 for-each 循环码? 60、ArrayList 和 HashMap 的默认大小是多数? 61、有没有可能两个不相等的对象有有相同的 hashcode? 62、两个相同的对象会有不同的的 hash code 吗? …

专业安卓实时投屏软件:极限投屏(QtScrcpy作者开发)使用说明

基本介绍 极限投屏是一款批量投屏管理安卓设备的软件,是QtScrcpy作者基于QtScrcpyCore开发,主要功能有: 设备投屏&控制:单个控制、批量控制分组管理wifi投屏adb shell快捷指令文件传输、apk安装 更多功能还在持续更新。 极…

Node学习笔记之Express框架

一、express 介绍 express 是一个基于 Node.js 平台的极简、灵活的 WEB 应用开发框架,官方网址:https://www.expressjs. com.cn/ 简单来说,express 是一个封装好的工具包,封装了很多功能,便于我们开发 WEB 应用&…

【vSphere 8 自签名 VMCA 证书】企业 CA 签名证书替换 vSphere VMCA CA 证书Ⅰ—— 生成 CSR

目录 替换拓扑图证书关系示意图说明 & 关联博文1. 默认证书截图2. 使用 certificate-manager 生成CSR2.1 创建存放CSR的目录2.2 记录PNID和IP2.3 生成CSR2.4 验证CSR 参考资料 替换拓扑图 证书关系示意图 本系列博文要实现的拓扑是 说明 & 关联博文 因为使用企业 …

Rust逆向学习 (2)

文章目录 Guess a number0x01. Guess a number .part 1line 1loopline 3~7match 0x02. Reverse for enum0x03. Reverse for Tuple0x04. Guess a number .part 20x05. 总结 在上一篇文章中,我们比较完美地完成了第一次Rust ELF的逆向工作,但第一次编写的R…

SL8541 android系统环境+编译

1.Ubuntu系统的安装 最好使用ubuntu18.0.4 2.工具环境包的安装 // 安装Android8.1源码编译环境 sudo apt-get install openjdk-8-jdk --------------ok sudo apt-get install libx11-dev:i386 libreadline6-dev:i386 libgl1-mesa-dev g-multilib --------------ok sudo…

1 Go的前世今生

概述 Go语言正式发布于2009年11月,由Google主导开发。它是一种针对多处理器系统应用程序的编程语言,被设计成一种系统级语言,具有非常强大和有用的特性。Go语言的程序速度可以与C、C相媲美,同时更加安全,支持并行进程。…

curl命令服务器上执行http请求

1. 现在本地使用postman生成curl命令 注意: 将ip改成127.0.0.1,端口是实际服务运行的端口 curl --location --request POST http://127.0.0.1:63040/content/course/list?pageNo1&pageSize2 \ --header Content-Type: application/json \ --data-raw {"courseName&q…

小插曲 -- 使用Visual Studio Code远程连接香橙派

在之前的学习中,代码的修改和保存都依赖于“vi”指令,而不得不承认vi指令的编辑界面非常原始,所以,如果可以将代码编辑放到更友好的环境里进行无疑是一件大快人心的事情。 本节介绍如何通过Visual Studio Code来进行远程连接: Vi…

【计算机网络】UDP/TCP协议

文章目录 :peach:1 UDP协议:peach:1.1 :apple:UDP协议端格式:apple:1.2 :apple:UDP的特点:apple:1.3 :apple:UDP的缓冲区:apple:1.4 :apple:UDP使用注意事项:apple:1.5 :apple:基于UDP的应用层协议:apple: 2 :peach:TCP协议:peach:2.1 :apple:TCP协议端格式:apple:2.2 :apple:确…

Redis 命令—— 超详细操作演示!!!

内存数据库 Redis7 三、Redis 命令3.1 Redis 基本命令3.2 Key 操作命令3.3 String 型 Value 操作命令3.4 Hash 型 Value 操作命令3.5 List 型 Value 操作命令3.6 Set 型 Value 操作命令3.7 有序Set 型 Value 操作命令3.8 benchmark 测试工具3.9 简单动态字符串SDS3.10 集合的底…

Jenkins环境部署与任务构建

一、CI/CD 1、CI/CD 概念: CI/CD 是一种软件开发和交付方法,旨在加速应用程序的开发、测试和部署过程,以提高软件交付的质量和效率。 (1) 持续集成 (CI Continuous Integration): 持续集成是开发团队频繁集成其代码更改的过程。开发者将其…