1.C/C++内存分布
sizeof和strlen有什么区别:
本质区别
特性 | sizeof | strlen |
---|---|---|
类型 | 运算符(编译时计算) | 库函数(运行时计算) |
作用对象 | 变量、数据类型、表达式 | 仅限以 \0 结尾的字符串(char* 或字符数组) |
功能 | 计算对象/类型占用的内存字节数 | 计算字符串的字符长度(不含 \0 ) |
空字符处理 | 包含字符串末尾的 \0 | 不包含 \0 |
性能 | 编译时确定,无运行时开销 | 需遍历字符串直到 \0 ,有线性时间复杂度 |
-
sizeof
用于内存分配:计算变量、类型或表达式占用的内存字节数。 -
strlen
用于字符串长度:统计\0
前的字符数量。 -
永远不要对非字符串使用
strlen
:否则可能引发内存越界或未定义行为。 -
动态内存分配时:若需存储字符串,内存大小应为
strlen(str) + 1
(为\0
预留空间)。
说明:
- 栈又叫堆栈--非静态局部变量/函数参数/返回值等等,栈是向下增长的。
- 内存映射段是高效的I/O映射方式,用于装载一个共享的动态内存库。 用户可使用系统接口创建共享内存,做进程间通信。(linux)
- 堆用于程序运行时的动态内存分配,堆是可以向上增长的。
- 数据段--存储全局数据和静态数据
- 代码段--可执行的代码/只读常量
2.C语言中动态内存管理方式
void Test()
{int* p1 = (int*)malloc(sizeof(int));free(p1);int* p2 = (int*)calloc(4, sizeof(int));int* p3 = (int*)realloc(p2, sizeof(int) * 10);free(p3);
不需要释放p2;
若原内存块可以原地扩展:直接扩大内存,p3 的地址与 p2 相同。
若需要重新分配新内存块:将原数据复制到新内存块,并自动释放原内存块(p2 的内存),p3 指向新地址。
}
2.1 malloc
-
功能:分配指定字节数的未初始化内存。
-
参数:
void* malloc(size_t size);
-
size
:需要分配的字节数。
-
-
特点:
-
分配的内存内容是未初始化的(可能包含垃圾值)。
-
效率较高,因为它不进行内存初始化。
-
2.2 calloc
-
功能:分配指定数量和大小的内存块,并初始化为零。
-
参数:
void* calloc(size_t num, size_t size);
-
num
:元素数量。 -
size
:每个元素的字节大小。
-
-
特点:
-
分配的内存会被自动初始化为零(所有位为
0
)。 -
适合需要初始化的场景(如数组、结构体)。
-
相比
malloc
稍慢,因为需要额外初始化步骤。
-
2.3 realloc
-
功能:调整已分配内存的大小(扩大或缩小)。
-
参数:
void* realloc(void* ptr, size_t new_size);
-
ptr
:指向之前分配的内存块的指针(若为NULL
,则行为等同于malloc
)。 -
new_size
:新的总字节数。
-
-
特点:
-
如果新大小大于原内存块,新增部分内容未初始化。
-
可能会在内存中移动原有数据到新位置(需用返回值更新指针)。
-
若
new_size
为 0,则等效于free(ptr)
(但行为依赖实现)。
-
2.4 对比总结
特性 | malloc | calloc | realloc |
---|---|---|---|
初始化 | 未初始化 | 初始化为零 | 新增区域未初始化 |
参数 | 总字节数 (size ) | 元素数量和大小 (num, size ) | 原指针和新字节数 (ptr, new_size ) |
用途 | 分配未初始化内存 | 分配初始化内存(如数组) | 调整已分配内存的大小 |
性能 | 较快(不初始化) | 稍慢(需初始化) | 取决于是否需要数据迁移 |
内存不足返回值 | NULL | NULL | NULL (原内存仍存在) |
2.5 malloc的实现原理
malloc
是 C 语言中动态内存分配的核心函数,其实现原理涉及操作系统内存管理、堆内存分配策略和数据结构设计。以下是其核心实现原理的逐步解析:
1. 内存管理的基本框架
程序运行时,操作系统会为其分配虚拟内存空间,其中堆(Heap)是动态内存分配的区域。malloc
负责从堆中分配内存块,free
负责释放内存块。堆的管理依赖以下关键机制:
-
堆的扩展与收缩:通过系统调用(如
sbrk
或mmap
)调整堆的大小。 -
内存块管理:将堆划分为多个内存块,每个块包含元数据(如块大小、状态)和用户数据区。
-
空闲块组织:通过链表、树或其他数据结构管理空闲块,提高分配效率。
2. 内存块的结构
每个内存块(包括已分配和空闲块)通常包含两部分:
-
元数据(Header):
-
记录块的大小(
size
)。 -
标记块是否空闲(
is_free
)。 -
其他管理信息(如前驱/后继指针,用于空闲链表)。
-
-
用户数据区:返回给用户的实际可用内存地址。
3. 空闲块管理策略
为了高效管理空闲内存块,malloc
实现通常采用以下数据结构:
(1) 隐式空闲链表(Implicit Free List)
-
原理:通过块头部的
size
字段遍历所有内存块(包括已分配和空闲块)。 -
优点:实现简单。
-
缺点:分配时需要遍历整个链表,时间复杂度为 O(n)。
-
示例:
struct block_header {size_t size;int is_free; };
(2) 显式空闲链表(Explicit Free List)
-
原理:仅维护空闲块的链表,通过指针(
prev
/next
)连接。 -
优点:减少遍历时间,分配时间复杂度接近 O(1)。
-
缺点:需额外空间存储指针。
(3) 分离空闲链表(Segregated Free List)
-
原理:将空闲块按大小分类到多个链表中(如小块、中块、大块)。
-
优点:针对不同大小请求快速匹配,减少搜索时间。
-
现代实现:
glibc
的ptmalloc2
和jemalloc
均采用此策略。
4. 内存分配策略
当用户请求分配内存时,malloc
会从空闲链表中选择一个合适的块:
(1) 首次适应(First Fit)
-
遍历链表,选择第一个足够大的空闲块。
-
优点:简单快速。
-
缺点:可能产生外部碎片。
(2) 最佳适应(Best Fit)
-
遍历链表,选择最小的足够大的空闲块。
-
优点:减少内存浪费。
-
缺点:遍历时间长,可能产生微小碎片。
(3) 最坏适应(Worst Fit)
-
选择最大的空闲块进行分割。
-
优点:减少外部碎片。
-
缺点:不利于后续的大块分配。
5. 内存分配流程
-
对齐要求:根据系统要求(如 8 字节对齐)调整请求大小。
-
搜索空闲块:
-
在空闲链表中查找足够大的块。
-
若找到,分割块(剩余部分作为新空闲块)或直接分配整个块。
-
-
扩展堆:若没有足够空闲块,通过
sbrk
或mmap
扩展堆。 -
返回地址:返回用户数据区的起始地址。
6. 内存释放与合并
free
释放内存块时:
-
标记为空闲:将块头部的
is_free
标记为 1。 -
合并相邻空闲块:检查前驱和后继块是否空闲,合并以减少碎片。
7. 实际实现细节(以 glibc 的 ptmalloc2 为例)
-
多线程支持:使用
arenas
隔离不同线程的内存池,避免锁竞争。 -
大块内存分配:超过阈值(如 128KB)时,直接通过
mmap
分配,绕过堆管理。 -
Fast Bins:维护小内存块(如 16-80 字节)的快速链表,避免频繁合并。
8. 性能与碎片问题
-
内部碎片:分配块的实际大小大于请求大小(因对齐或元数据占用)。
-
外部碎片:空闲内存分散,无法满足连续大块请求。
-
优化策略:
-
合并空闲块。
-
使用分离空闲链表减少搜索时间。
-
延迟合并(如 Fast Bins 不立即合并小内存块)。
-
总结:
通过 链表管理空闲内存块,按策略分配内存,释放时合并相邻块,依赖系统调用扩展堆,并优化多线程与碎片问题。
malloc
3.C++内存管理方式
C语言内存管理方式C++中可以继续使用,但有些地方就无能为力,而且使用起来比较麻烦,因此C++又提出了自己的内存管理方式:通过new和delete操作符进行动态内存管理。
3.1 new/delete操作内置类型
void Test()
{//动态申请一个int类型的空间int* ptr1 = new int;//动态申请一个int类型的空间并初始化为10 int* ptr2 = new int(10);//动态申请10个int类型的空间int* ptr3 = new int[10];delete ptr1;delete ptr2;delete[] ptr3;
}
注意:申请和释放单个元素的空间,使用new和delete操作符,申请和释放连续的空间,使用new[]和delete[],匹配起来用。
3.2new和delete操作自定义类型
class A
{
public:A(int a=0):_a(a){cout << "A(): " << this << endl;}~A(){cout << "~A(): " << this << endl;}
private:int _a;
};
int main()
{A* p1 = (A*)malloc(sizeof(A));cout << "new:" << endl;A* p2 = new A(1);free(p1);delete p2;A* p3 = (A*)malloc(sizeof(A) * 3);cout << "new:" << endl;A* p4 = new A[3];free(p3);delete[] p4;return 0;
}
注意:在申请自定义类型时,new会自动调用构造函数,delete会自动调用析构函数,而malloc于free不会。new/delete出来用法上,其他没什么区别。
4.operator new和operator delete函数
new和delete是用户进行动态内存申请和释放的操作符,operator new 和operator delete是
系统提供的全局函数,new在底层调用operator new全局函数来申请空间,delete在底层通过
operator delete全局函数来释放空间。
/*
operator new:该函数实际通过malloc来申请空间,当malloc申请空间成功时直接返回;申请空间
失败,尝试执行空 间不足应对措施,如果改应对措施用户设置了,则继续申请,否
则抛异常。
*/
void *__CRTDECL operator new(size_t size) _THROW1(_STD bad_alloc)
{// try to allocate size bytesvoid *p;while ((p = malloc(size)) == 0)if (_callnewh(size) == 0){// report no memory// 如果申请内存失败了,这里会抛出bad_alloc 类型异常static const std::bad_alloc nomem;_RAISE(nomem);}return (p);
}
/*
operator delete: 该函数最终是通过free来释放空间的
*/void operator delete(void *pUserData){_CrtMemBlockHeader * pHead;RTCCALLBACK(_RTC_Free_hook, (pUserData, 0));if (pUserData == NULL)return;_mlock(_HEAP_LOCK); /* block other threads */__TRY/* get a pointer to memory block header */pHead = pHdr(pUserData);/* verify block type */_ASSERTE(_BLOCK_TYPE_IS_VALID(pHead->nBlockUse));_free_dbg( pUserData, pHead->nBlockUse );__FINALLY_munlock(_HEAP_LOCK); /* release other threads */__END_TRY_FINALLYreturn;
}
/*
free的实现
*/
#define free(p) _free_dbg(p, _NORMAL_BLOCK)
通过上述两个全局函数的实现知道,operator new 实际也是通过malloc来申请空间,如果
malloc申请空间成功就直接返回,否则执行用户提供的空间不足应对措施,如果用户提供该措施
就继续申请,否则就抛异常。operator delete 最终是通过free来释放空间的。
5.new和delete的实现原理
5.1内置类型
如果申请的是内置类型的空间,new和malloc,delete和free基本类似,不同的地方是:
new/delete申请和释放的是单个元素的空间,new[]和delete[]申请的是连续空间,而且new在申
请空间失败时会抛异常,malloc会返回NULL。
5.2 自定义类型
new的原理
- 调用operator new函数申请空间
- 在申请的空间上执行构造函数,完成对象的构造
delete的原理
- 在空间上执行析构函数,完成对象中资源的清理工作
- 调用operator delete函数释放对象的空间
new T[N]的原理
- 调用operator new[]函数,在operator new[]中实际调用operator new函数完成N个对象空间的申请
- 在申请的空间上执行N次构造函数
delete[]的原理
- 在释放的对象空间上执行N次析构函数,完成N个对象中资源的清理
- 调用operator delete[]释放空间,实际在operator delete[]中调用operator delete来释放空间
6. 定位new表达式(placement-new)
定位new表达式是在已分配的原始内存空间中调用构造函数初始化一个对象。
使用格式:
new (place_address) type或者new (place_address) type(initializer-list)
place_address必须是一个指针,initializer-list是类型的初始化列表
使用场景:
定位new表达式在实际中一般是配合内存池使用。因为内存池分配出的内存没有初始化,所以如
果是自定义类型的对象,需要使用new的定义表达式进行显示调构造函数进行初始化。
7. 常见面试题
7.1 malloc/free和new/delete的区别
malloc/free和new/delete的共同点是:都是从堆上申请空间,并且需要用户手动释放。不同的地
方是:
- malloc和free是函数,new和delete是操作符
- malloc申请的空间不会初始化,new可以初始化
- malloc申请空间时,需要手动计算空间大小并传递,new只需在其后跟上空间的类型即可,如果是多个对象,[]中指定对象个数即可
- malloc的返回值为void*, 在使用时必须强转,new不需要,因为new后跟的是空间的类型
- malloc申请空间失败时,返回的是NULL,因此使用时必须判空,new不需要,但是new需要捕获异常
- 申请自定义类型对象时,malloc/free只会开辟空间,不会调用构造函数与析构函数,而new在申请空间后会调用构造函数完成对象的初始化,delete在释放空间前会调用析构函数完成空间中资源的清理
7.2 内存泄漏
7.2.1 什么是内存泄漏,内存泄漏的危害
什么是内存泄漏:内存泄漏指因为疏忽或错误造成程序未能释放已经不再使用的内存的情况。内
存泄漏并不是指内存在物理上的消失,而是应用程序分配某段内存后,因为设计错误,失去了对
该段内存的控制,因而造成了内存的浪费。
内存泄漏的危害:长期运行的程序出现内存泄漏,影响很大,如操作系统、后台服务等等,出现
内存泄漏会导致响应越来越慢,最终卡死。
void MemoryLeaks()
{
// 1.内存申请了忘记释放
int* p1 = (int*)malloc(sizeof(int));
int* p2 = new int;
// 2.异常安全问题
int* p3 = new int[10];
Func(); // 这里Func函数抛异常导致 delete[] p3未执行,p3没被释放.
delete[] p3;
}
7.2.2 内存泄漏分类
C/C++程序中一般我们关心两种方面的内存泄漏:
- 堆内存泄漏(Heap leak)
堆内存指的是程序执行中依据须要分配通过malloc / calloc / realloc / new等从堆中分配的一块内存,用完后必须通过调用相应的 free或者delete 删掉。假设程序的设计错误导致这部分内存没有被释放,那么以后这部分空间将无法再被使用,就会产生Heap Leak。 - 系统资源泄漏
指程序使用系统分配的资源,比方套接字、文件描述符、管道等没有使用对应的函数释放掉,导致系统资源的浪费,严重可导致系统效能减少,系统执行不稳定。
7.2.3 如何检测内存泄漏
在vs下,可以使用windows操作系统提供的_CrtDumpMemoryLeaks() 函数进行简单检测,该
函数只报出了大概泄漏了多少个字节,没有其他更准确的位置信息。
7.2.4如何避免内存泄漏
- 工程前期良好的设计规范,养成良好的编码规范,申请的内存空间记着匹配的去释放。ps:这个理想状态。但是如果碰上异常时,就算注意释放了,还是可能会出问题。需要下一条智能指针来管理才有保证。
- 采用RAII思想或者智能指针来管理资源。
- 有些公司内部规范使用内部实现的私有内存管理库。这套库自带内存泄漏检测的功能选项。
- 出问题了使用内存泄漏工具检测。ps:不过很多工具都不够靠谱,或者收费昂贵。
总结一下:
内存泄漏非常常见,解决方案分为两种:1、事前预防型。如智能指针等。2、事后查错型。如泄
漏检测工具