1.预处理 (Preprocessing):
在这个阶段,编译器会处理所有以 # 开头的指令,如 #include、#define 等。它会把头文件的内容插入到源代码中,进行宏替换等预处理操作,生成一个纯净的代码文件。
3.词法分析 (Lexical Analysis):
预处理完成后,源代码会被分解为基本的词法单位(tokens),如变量名、关键字、运算符等。编译器将这些词法单位传递给语法分析阶段。
5.语法分析 (Syntax Analysis):
语法分析器会检查词法单位的顺序是否符合语言的语法规则。这一过程会生成一个抽象语法树(AST),它是程序的结构化表示。
7.语义分析 (Semantic Analysis):
在这一阶段,编译器会检查代码中的语义错误,比如类型不匹配、未声明的变量等。同时,符号表会被构建,其中记录了变量、函数等标识符的相关信息。
9.优化 (Optimization):
编译器对抽象语法树进行优化,以提高生成代码的性能和效率。优化可以分为局部优化和全局优化,目的是减少内存使用或提高执行速度。
11.代码生成 (Code Generation):
经过优化后,编译器会生成目标代码,通常是机器代码或中间代码。对于一些语言,这个阶段可能生成汇编语言。
13.汇编 (Assembly):
如果目标代码是汇编语言,汇编器(Assembler)将其转化为机器代码,生成目标文件(通常是 .obj 或 .o 文件)。
15.链接 (Linking):
在链接阶段,链接器(Linker)将目标文件与程序所依赖的库文件(如动态链接库、静态库)进行合并,解决外部符号引用,最终生成可执行文件(如 .exe 文件)。每个步骤都有可能产生错误或警告,编译器会在对应的阶段进行报告,帮助程序员调试代码。