C++初学者指南第一步---14.函数调用机制

C++初学者指南第一步—14.函数调用机制

文章目录

C++初学者指南第一步---14.函数调用机制
- 1.记住：内存的结构
- 2.函数调用是如何工作的
- 3. 不要引用局部变量
- 4. 常见编译器优化
- 5. Inlining内联

1.记住：内存的结构

在这里插入图片描述
堆（自由存储）

用于动态存储期对象，例如 std::vector 的内容。
空间大，可以用于大容量存储（大多数用于主内存）。
可以根据需要分配和释放任何对象。
按照无特定顺序的分配（释放） ⇒ 碎片化。
分配速度慢：需要为新对象找到连续未被占用的空间。

在这里插入图片描述
栈

自动存储期对象使用：局部变量，函数参数等。
空间小（通常只有几兆(M)字节）。
分配速度快：新对象总是放在栈顶部。
对象按它们创建的相反顺序被释放。
无法释放顶端（= 最新的）以下的对象。

2.函数调用是如何工作的

<1>该示例假定没有编译器优化，例如内联（用函数体替换函数调用），返回类型优化等。
此外，在函数调用时放入栈的确切顺序（调用约定）取决于平台（CPU 架构 + 操作系统 + 编译器）。
在这里插入图片描述
<2>程序开始。

<3>局部变量 y 被放入栈。

<4> 局部变量 i 被放入栈。

<5> 函数的返回值占位符被放入堆栈

<6> 当前指令的内存地址被放在栈上，这样在离开被调用的函数后，我们就知道从哪里恢复程序。
在这里插入图片描述
<7> 帧指针标记了当前函数的栈帧的开始。在当前栈帧内的一切都将被视为函数局部的。需要帧指针是因为不同的函数调用可能有不同大小的栈帧。

<8> 执行跳转到函数square的内存地址。

<9> 函数参数p放在栈上，它的值由调用参数(y的值)决定。
注意：返回地址、占位符、局部参数等放在栈上的顺序取决于平台的调用约定(CPU体系结构+ OS +编译器)。
在这里插入图片描述
<10> 函数局部变量 x 放到栈上。

<11> 表达式 p * p 的结果被赋给 x。
在这里插入图片描述
<12> 语句return x，将 x 的值复制到返回值占位符。

<13>离开函数square时：堆栈的顶部位置减少到堆栈帧下方；这意味着所有函数局部变量都从堆栈中弹出。

<14> 执行通过跳转到之前存储的返回地址返回到调用位置。
在这里插入图片描述
<15> 赋值语句int i = …会导致返回值被复制到i中。

<16> square函数的返回值被从栈中弹出。

<17> 局部变量k被放入栈。

<18> 程序结束，所有关联的变量都会从栈中弹出。

3. 不要引用局部变量

如果我们把返回类型改为int&会怎么样呢？
<1>
在这里插入图片描述
<2> 在从square返回之前栈内容:

函数局部变量x
函数参数p
函数调用后的下一条指令的地址
square返回值的占位符
main函数的局部变量 y 和 i

<3> 语句return x;将 x 的地址复制到返回值占位符。

<4> 离开函数square：栈的顶部位置降低到栈帧下方; 这意味着所有square函数的局部变量都会从栈中弹出。
通过跳转到先前存储的返回地址，执行流程回到调用位置。

<5> 赋值 int& i = … 会导致返回值（一个整数的内存地址）被复制到引用 i& 中。
x的内存位置实际上在栈的当前顶部位置之上。任何后续的栈分配都会导致它被其他值覆盖。
这将导致 => 未定义行为
这样的程序在运行时行为是未定义的/非确定性的，因为它有时可能会工作（如果 x 的内存没有被覆写）有时可能不会。

4. 常见编译器优化

现代的 C++ 编译器进行多项优化（尤其是在较高的优化级别 -O2 和 -O3），使函数调用速度更快。
Return Value Optimization 返回值优化 (RVO)

适用于类似：return Type{}; 或 return Type{argument,…}; 这样的语句。
不会分配额外的占位符用于返回值，也不会进行复制。相反，外部对象 res 将直接在调用位置构造。
这种优化是强制的，即在 C++17 版本中必定会执行。

Point foo (…) { …return Point{…};
}
Point res = foo();

Named Return Value Optimization 命名返回值优化（NRVO）

适用于类似： return local_variable; 这样的语句。
不会分配额外的占位符用于返回值，也不会进行复制。相反，本地对象 loc 和外部对象 res 被视为同一个对象。这样在调用点仅会发生一次分配。
这种优化不是必需的，但几乎所有现代编译器都会尽可能地执行它。

Point foo (…) {Point loc;…return loc;
}
Point res = foo();

5. Inlining内联

调用小/短函数的地方被该函数的代码替换。
在这里插入图片描述
内联只会发生在编译器“看到”函数声明的同时也看到它的完整定义，如果我们分别编译程序的不同部分，这种情况就不一定会发生（更多内容请参考《分离编译》章节）。
这是 C++ 性能优势的一个来源。在许多其他语言（比如 Java、C# 等）中，内联化要困难得多，有时甚至是不可能的。这些语言通常具有始终开启的多态性，这意味着所有/大多数函数/方法调用只能在运行时解析。