概述
LLVM 编译器框架的核心概念是任务调用和执行
编译器开发者将IR分解为不同的处理对象,并将其处理过程实现为单独的pass类型。在编译器初始化,pass被实例化,并被添加到pass管理中
pass 管理器(pass manager) 以流水线的方式将各个独立的pass 衔接起来,然后以预定义顺序遍历每个pass,根据pass实例返回值启动、停止或重复运行不同的pass
因此,LLVM pass 管理机制的主要模块包括pass、pass 管理器、pass注册及相关模块,如PassRegistry、AnalysisUsage、AnalysisResolver 等
PASS 的作用
pass 是一种编译器开发的结构化技术,用于完成编译器对象(如IR)的转换、分析或优化等功能。 pass的执行过程就是编译器对编译对象进行转换、分析和优化过程
LLVM 提供的pass 分为三类: 分析(analyis) pass、转换(transform) pass 和 工具(utility) pass
分析(analyis) pass
分析pass 复杂计算相关IR单元的高层信息,但不对其进行修改
这些信息可以被其他pass使用,或用于程序调试和可视化。简言之,分析pass 提供其他pass 需要查询的信息并提供查询接口
例如,基本别名分析(Basic Alias Analysis) pass 生成的别名分析结果可以用于后续的其他优化pass
分析pass 不仅从IR中得到有用信息,还可以通过调用其他分析pass得到信息,并将这些信息结合起来,得到IR相关的、更有价值的信息
这些分析结果可以被缓存下来,避免重复计算。如果分析的IR 被修改,原有的分析结果当然也就失效了
转换(transform) pass
转换pass 可以查询和使用分析pass 分析得到的IR高层信息,然后以某种方式改变和优化IR,并保证改变后的IR仍然合法有效
例如,激进死代码消除(Aggressive Dead Code Elimination, ADCE) pass 可根据其他分析pass的分析结构,将死代码从原来的模块中删除
工具(utility) pass
工具pass 是一些功能性的实用程序,既不属于分析pass,也不属于转换pass。例如,块提取(extract-blocks) pass 可将基本块从模块中提取出来,供其他工具(如bugpoint) 使用
当调用RegisterPass() 函数注册自定义pass时,会要求指定是否为分析pass。通过RegisterPass()注册自定义pass后,就可以使用LLVM opt 工具对IR调用自定义pass 功能
LLVM Pass及常用子类
LLVM Pass 是 LLVM 系统的重要组成部分。其基础模块是Pass 类,这是所有LLVM Pass 的基类。Pass类定义见<llvm_root>/llvm/include/llvm/Pass.h
class Pass {AnalysisResolver *Resolver = nullptr; // Used to resolve analysisconst void *PassID;PassKind Kind;public:explicit Pass(PassKind K, char &pid) : PassID(&pid), Kind(K) {}Pass(const Pass &) = delete;Pass &operator=(const Pass &) = delete;virtual ~Pass();
……
}
基于Pass类可派生LLVM的各种预定义Pass子类。自定义的pass类都要从预定义Pass子类中继承,并根据自定义pass的具体功能要求重写虚函数或增加新的功能函数
预定义子类包括ModulePass、CallGraphSCCPass、FunctionPass、LoopPass和ReginPass类等
不同的子类有不同的约束条件、这些约束条件在调度pass时会用到。设计自定义pass时的首要条件就是确定自定义pass的基类
在为pass选择基类时,应在满足功能要求的前提下,尽可能选择最相关的类。这些类会为LLVM Pass 基础结构提供优化运行所必需的信息,避免生成的编译器因为选择的基类不合适而导致运行速度变慢或其他缺陷
编译器可以将各种pass组合在一起,完成各种IR优化任务。pass之间组合可以分为两类:
-
多个pass作用于同一个IR单元,FunctionPass就是一个典型例子。如图4-7a所示,FunctionPass实例作用于一个IR函数,但也可以在某个FunctionPass 实例中运行其他几个FunctionPass 实例,将几个FunctionPass实例组合起来,作用于同一个IR单元,以获得更好的优化效果
-
将一个IR 单元分解为更小的单元,并用相应类型的pass处理。如图4-7b所示,ModulePass作用于一个IR模块,但也可以在某个ModulePass 实例,作用于模块中的每一个函数,以将一个IR单元分解成粒度更细的多个单元来处理
总结
在编译器开发时,可以混合使用两种方式,将各种pass组合为流水线,对IR做不同的处理和优化
LLVM Pass 类及其子类的继承关系如下图所示
参考资料
- LLVM中的pass及其管理机制
- 编译入门那些事儿(1):LLVM中的Pass和PassManager