初识C语言·编译与链接

1 翻译环境和运行环境

C语言标准ANSI C 实现C语言代码的时候一般需要经过两种环境，一是翻译环境，二是运行环境，计算机能识别的是二进制的指令，人写完代码后通过翻译环境，使代码变成计算机能读懂的可执行的机器指令，运行环境就是用来执行实际的代码操作的环境。

1）翻译环境

那么翻译环境如何让源代码变成可执行的机器指令的呢？

翻译环境包含的是编译和链接两大过程，其中编译包含预处理（也可以叫做预编译），编译，汇编。

编译的时候，机器通过编译器使.c文件生成.obj文件，.obj文件是目标文件（在windows是.obj为后缀，Linux环境下是.o为后缀），多个目标文件在经过链接库的处理，最后生成 .exe文件

VS2022用到的编译器是cl.exe：

用到的链接器是link.exe：

编译的整个过程如下：（Linux下的gcc编译器为例）
.c文件 .h文件源文件经过预处理 生成.i为后缀的文件 -> 经过编译生成.s为后缀的文件 -> 经过汇编生成.o为后缀的文件 -> 经过链接器和链接库生成最后的可执行文件.exe

预处理：

在gcc环境下，我们使用指令：

gcc -E test.c -o test.i

使机器生成.i为后缀的文件的时候，我们就会发现代码出现了一下改变，这里因为在预处理阶段，存在以下规则：
1 删除所有的#define，所有宏定义被展开

2 处理所有的条件编译指令，如#endif #if #else

3 处理#include预编译指令，将头文件里面包含的内容插入到头文件所在的位置，这个过程是递归进行的，不排除头文件里面包含其他头文件的可能性

4 所有的注释都会被删除

5 或保留#pragma指令，编译器后续会使用，为了防止头文件重复包含

6 添加行号和文件名标识，方便编译器后续生成调试信息

当我们不知道宏定义是否包含正确的时候就可以经预处理之后的.i文件进行确认。

编译：

在gcc环境下，我们使用指令：

gcc -S test.i -o test.s

使机器生成了.s为后缀的文件，在这个阶段，编译器会进行三个操作，词法分析，语法分析，语义分析及优化。

array[index] = (index+4)*(2+6);

假定以上代码

词法分析：

词法分析就是把代码中的字符分隔开，分割成一系列的记号，如关键字，标识符，特殊字符，字面常量，如下：

语法分析：

通过词法分析产生的记号，语法分析器通过记号生成语法树，以表达式为结点的树，如下：

语义分析：
语义分析器会从表达式的层面分析，能做的分析使语义的静态分析，静态语义分析包括通常包括声明和类型的匹配，类型的转化等，这个阶段会显示错误的语法信息。

汇编：

汇编的指令如下：

gcc -c test.s -o test.o

汇编器将汇编代码变成机器可以执行的指令，每一个汇编语句几乎都对应一个机器指令，而汇编语言较难的一个原因就是不同的机器的汇编语言是不一样的，不具有跨平台性。

链接：

链接是一个复杂的过程，需要将一堆文件链接在一起才能生成可执行程序。

链接包括分配地址，分配空间，符号决议，重定位，等步骤。

链接解决的是一个项目中多文件多模块互相调用的问题，比如一个C语言的项目中有两个.c文件（test.c add.c）

extern int Add(int, int);//声明外部函数
extern int g_val;//声明外部全局变量
int main()
{int a = 10, b = 20;int sum = Add(a, b);printf("%d ", sum);printf("g_val = %d ", g_val);return 0;
}

int g_val  = 2024;
int Add(int x,int y)
{return x + y;
}

test.c 经过编译器处理生成了test.o文件，Add.c经过编译器处理生成了Add.o文件，通过关键字extern我们在test.c文件里面使用了函数Add 和全局变量g_val，但是每一次使用这两个外部符号的时候必须确切的知道Add g_val的地址，因为编译器是单独编译的，所以编译器编译test.c文件的时候并不知道函数Add g_val的存在，所以暂时调用Add的指令的目标地址和g_val的地址搁置，等最后链接的时候根据引用的符号Add在其他模块寻找Add函数的地址，最后修正test.c文件里面引用到的Add的地方，使目标地址成为真正的函数Add的地址，对于全局变量亦是如此，这个修正的过程叫做重定义。