目录
引言
概括介绍
一、预处理
二、编译
三、汇编
四、链接
总结
引言
当使用集成开发环境(IDE)进行C语言编程时,点击"编译"按钮后,整个C程序从源代码到可执行文件的生成过程会自动完成。IDE会在后台为我们执行C语言的编译过程,将源代码转换为最终的可执行文件。虽然IDE隐藏了底层的细节,但理解编译过程对于程序员来说仍然是很有价值的。
概括介绍
gcc
和g++
都是GNU编译器套件(GNU Compiler Collection,简称GCC)的一部分,其中gcc
用于编译C语言代码,而g++
用于编译C++语言代码。它们的编译过程在大部分情况下是类似的,但根据输入文件的扩展名和一些默认选项的不同,它们会调用不同的编译器前端,即C前端或C++前端。
下面是gcc
和g++
的编译过程的概述
-
预处理(Preprocessing):首先,对源文件进行预处理。预处理器将处理源代码中的预处理指令,比如以
#
开头的指令,如#include
、#define
等,并展开宏定义。预处理后的代码会生成一个.i
文件,通常是在临时目录中。 -
编译(Compiling):接下来,编译器前端会将预处理后的源代码编译成汇编代码(
.s
文件)。此阶段会检查语法和语义错误,并进行优化,但不会生成可执行代码。 -
汇编(Assembling):汇编器(as)将汇编代码转换成机器代码,并生成目标文件(
.o
文件)。 -
链接(Linking):最后,链接器(
ld
)将目标文件与所需的库文件链接在一起,生成最终的可执行文件。
下面让我们在Linux环境下简单示例C程序编译过程加深理解
代码示例(main.c):
#include<stdio.h>int main(){printf("Hello Linux\n");return 0;
}
一、预处理
预处理是编译过程的第一步,它处理以
#
开头的预处理指令,并展开宏定义。预处理器会执行以下主要任务:
处理
#include
指令:将指定的头文件内容插入到源代码中。这样,可以在源文件中使用其他函数或变量的声明和定义。处理宏定义:将代码中定义的宏展开为对应的表达式或语句。例如,
#define MAX_VALUE 100
将会在源代码中把所有MAX_VALUE
替换为100
。处理条件编译指令:如
#ifdef
、#ifndef
、#if
等,这些指令根据条件判断是否编译部分代码块。预处理后的代码会生成一个
.i
文件,这是一个展开了所有宏和包含了所有头文件的中间文件。
语法示例
gcc -E main.c -o main.i
命令中-E是让编译器在预处理之后就退出,不进行后续编译过程,-o是指定输出文件名。
使用该指令的结果是将stdio.h文件全部内容插入到main.c形成main.i文件。
可以看到预处理之后的main.i文件显然比main.c文件大得多。我们查看一下main.i文件,因为此时main.i依然是文本文件。
(使用head指令查看main.i文件)
二、编译
编译是预处理后代码的第二个阶段。编译器前端(例如
cc1
或cc1plus
)接收预处理后的代码,并将其转换成汇编代码。在编译阶段,编译器执行以下主要任务:
语法和语义检查:编译器检查代码是否符合C/C++语法规则,并进行语义分析,以确保代码没有逻辑错误。
生成中间表示:编译器将代码转换成中间表示形式,通常是一种低级的、与特定硬件无关的表示。
优化:编译器可能对中间表示进行优化,以提高程序的执行效率和代码质量。
编译阶段不会生成可执行文件,而是将代码转换成汇编代码,通常保存为
.s
文件。
语法示例
gcc -S main.i -o main.s
命令中-S让编译器在编译之后停止,不进行后续编译过程,-o是指定输出文件名。
编译成汇编文件大小已经非常小了,相对于预处理之后的main.i文件小很多。
编译过程完成后,将生成程序的汇编代码test.s,这也是文本文件。我们查看一下。
图中即为main.s中的汇编代码。
三、汇编
在汇编阶段,汇编器(
as
)接收编译生成的汇编代码,并将其转换为机器代码。汇编器的任务包括:
将汇编代码转换为机器代码:将汇编代码中的汇编指令翻译成特定硬件架构能理解的机器指令。
生成目标文件:生成一个或多个目标文件(
.o
文件),每个文件对应一个源文件或编译单元。目标文件是机器代码的二进制表示形式,但它们还不是最终可执行的程序,因为某些符号引用可能仍然未解析。
语法示例
gcc -c main.s -o main.o
命令中-c
选项,它告诉gcc只进行编译,不进行链接。因此,这个命令只会将汇编代码转换为目标文件,而不会生成可执行文件。-o是指定输出文件名。
目标文件test.o
是二进制表示的机器代码,可以作为链接的输入,用于生成最终的可执行文件。
四、链接
- 链接器接收一个或多个目标文件,以及所需的库文件,并将它们合并成最终的可执行文件。
- 链接器解析目标文件中的符号引用,找到对应的符号定义,并将符号重定位,以便正确地指向它们的定义。
- 合并库文件,生成完整的可执行文件,其中包含所有的机器代码和解析后的符号。
语法示例
gcc main.o -o main
命令gcc main.o -o main
是将目标文件(main.o
)链接为可执行文件(main
)的gcc命令。在这个命令中,我们没有使用-c
选项,因此gcc会进行链接操作,生成最终的可执行文件。
当执行gcc main.o -o main
命令时,gcc会将目标文件main.o
与所需的库文件(如果有的话)一起进行链接,并生成最终的可执行文件main
。这个可执行文件就是可以在Linux下运行的C程序。
执行./main
命令会运行名为main
的可执行文件。这是我们之前用gcc
命令生成的C程序的可执行文件。
总结
生成可执行程序过程为成四个步骤:
- 由.c文件到.i文件,这个过程叫预处理。
- 由.i文件到.s文件,这个过程叫编译。
- 由.s文件到.o文件,这个过程叫汇编。
- 由.o文件到可执行文件,这个过程叫链接。
在集成开发环境中,点击"编译"按钮后,IDE会自动完成上述四个阶段,无需手动执行每个步骤。如果没有编译错误,最终的可执行文件将生成并可以在IDE中直接运行。
虽然IDE为我们提供了方便的编译工具,但了解C语言的编译过程仍然对于程序员来说是重要的,特别是在解决一些编译错误或进行优化时,理解底层过程可以帮助我们更好地理解和改进代码。