C++ malloc/free/new/delete详解(内存管理)
- malloc/free
- 典型用法
- 内存分配
- 实现过程
- brk和mmap
- 申请小于128k的内存
- 申请大于128k的内存
- 释放内存
- brk和mmap的区别
- new/delete
- 典型用法
- 内存分配
- 实现过程
- new/delete和malloc/free的区别
- malloc对于给每个进程分配的内存是不是有大小限制
- delete [] 怎么知道要销毁多少内存空间
- malloc的内存可以用delete释放吗?
- new[]分配的空间可以用free()释放吗?
- new[]和delete配对使用会发生什么
- malloc出来20字节内存,为什么free不需要传入20呢,不会产生内存泄漏吗?
- 限制对象只能建立在堆上
- 限制对象只能建立在栈上
malloc/free
典型用法
malloc()负责动态配置内存,大小由size决定,分配成功时返回值为任意类型指针,指向一段可用内存(虚拟内存)的起始地址。分配失败时为NULL。
void * malloc(size_t size)
free()负责释放动态申请的内存空间,调用free()后ptr所指向的内存空间被收回,如果ptr指向未知地方或者指向的空间已被收回,则会发生不可预知的错误,如果ptr为NULL,free不会有任何作用。
void free(void *ptr)
内存分配
malloc函数动态申请的内存空间是在堆里(而一般局部变量存于栈里),并且该段内存不会被初始化,如果不采用手动free()加以释放,则该段内存一直存在,直到程序退出才被系统,所以为了合理使用内存,在不适用该段内存时,应该调用free()。另外,如果在一个函数里面使用过malloc,最好要配对使用free,否则容易造成内存泄露。
实现过程
brk和mmap
从操作系统角度来看,malloc的实现有两种方式,分别由两个系统调用完成:brk和mmap(不考虑共享内存)。
- 申请小于128k的内存时,使用brk分配内存,将数据段.data的最高地址指针_edata向高地址移动,即增加堆的有效区域来申请新的内存空间。
- 申请大于128k的内存时,使用mmap分配内存,mmap是在进程的文件映射区找一块空闲存储空间,128K限制可由M_MMAP_THRESHOLD选项进行修改。
这两种方式分配的都是虚拟内存,没有分配物理内存。在第一次访问已分配的虚拟地址空间的时候,发生缺页中断,操作系统负责分配物理内存,然后建立虚拟内存和物理内存之间的映射关系。
申请小于128k的内存
申请小于128k的内存时,使用brk分配内存,将_edata往高地址推(只分配虚拟空间,不对应物理内存(因此没有初始化),第一次读/写数据时,引起内核缺页中断,内核才分配对应的物理内存,然后虚拟地址空间建立映射关系),如下图:
- 进程启动的时候,其(虚拟)内存空间的初始布局如图1。其中,mmap内存映射文件是在堆和栈的中间(例如libc-2.2.93.so,其它数据文件等),为了简单起见,省略了内存映射文件。_edata指针(glibc里面定义)指向数据段的最高地址。
- 进程调用A=malloc(30K)以后,内存空间如图2。malloc函数会调用brk系统调用,将_edata指针往高地址推30K,就完成虚拟内存分配。然而,_edata+30K只是完成虚拟地址的分配,A这块内存现在还是没有物理页与之对应的,等到进程第一次读写A这块内存的时候,发生缺页中断,这个时候,内核才分配A这块内存对应的物理页。也就是说,如果用malloc分配了A这块内容,然后从来不访问它,那么,A对应的物理页是不会被分配的。
- 进程调用B=malloc(40K)以后,内存空间如图3。
申请大于128k的内存
申请大于128k的内存时,使用mmap分配内存,在堆和栈之间找一块空闲内存分配,如下图:
- 进程调用C=malloc(200K)以后,内存空间如图4。默认情况下,malloc函数分配内存,如果请求内存大于128K(可由M_MMAP_THRESHOLD选项调节),那就不是去推_edata指针了,而是利用mmap系统调用,从堆和栈的中间分配一块虚拟内存。这样子做主要是因为brk分配的内存需要等到高地址内存释放以后才能释放(例如,在B释放之前,A是不可能释放的,这就是内存碎片产生的原因,什么时候紧缩看下面),而mmap分配的内存可以单独释放。
- 进程调用D=malloc(100K)以后,内存空间如图5。
释放内存
- 进程调用free©以后,C对应的虚拟内存和物理内存一起释放,如图6。
- 进程调用free(B)以后,如图7所示。B对应的虚拟内存和物理内存都没有释放,因为只有一个_edata指针,如果往回推,那么D这块内存怎么办呢?当然,B这块内存,是可以重用的,如果这个时候再来一个40K的请求,那么malloc很可能就把B这块内存返回回去了。
- 进程调用free(D)以后,如图8所示。B和D连接起来,变成一块140K的空闲内存。
默认情况下:当最高地址空间的空闲内存超过128K(可由M_TRIM_THRESHOLD选项调节)时,执行内存紧缩操作(trim)。在上一个步骤free的时候,发现最高地址空闲内存超过128K,于是内存紧缩,变成图9所示。
brk和mmap的区别
- malloc 通过 brk() 方式申请的内存,free 释放内存的时候,并不会把内存归还给操作系统,而是缓存在 malloc 的内存池中,待下次使用;同时brk分配的内存需要等到高地址内存释放以后才能释放,这也是内存碎片产生的原因
- malloc 通过 mmap() 方式申请的内存,free 释放内存的时候,会把内存归还给操作系统,内存得到真正的释放。除此之外,mmap分配的内存可以单独释放。
new/delete
典型用法
new和delete是C++中的运算符,不是库函数,不需要库的支持,同时,他们是封装好的重载运算符,并且可以再次进行重载。
new是动态分配内存的运算符,自动计算需要分配的空间,在C++中,它属于重载运算符,可以对多种数据类型形式进行分配内存空间,比如int型、char型、结构体型和类等的动态申请的内存分配,分配类的内存空间时,同时调用类的构造函数,对内存空间进行初始化,即完成类的初始化工作。new运算符的使用示例:
new int //开辟一个存放整数的存储空间,返回一个指向该存储空间的地址
new int(100) //同上,并指定该整数的初值为100
new char[100] //开辟一个存放字符数组(100个元素)的空间,返回首地址
new int[4][5]//开辟一个存放二维数组的空间,返回首元素的地址
float *p=new float(3.14157) //开辟一个存放单精度的空间,并指定该数的初值为3.14157,将返回的该空间的地址赋给指针变量p
注意:用new分配数组空间不能指定初值,若无法正常分配,则new会返回一个空指针NULL或者抛出bad_alloc异常。
delete是撤销动态申请的内存运算符。delete与new通常配对使用,与new的功能相反,可以对多种数据类型形式的内存进行撤销,包括类,撤销类的内存空间时,它要调用其析构函数,完成相应的清理工作,收回相应的内存资源。delete运算符的使用示例:
//注意,指针p存于栈中,p所指向的内存空间却是在堆中。
int *p = new int; delete p;
char *p = new char; delete p;
//注意,new申请数组,delete删除的形式需要加括号“[ ]”,表示对数组空间的操作,总之,申请形式如何,释放的形式就如何。
Obj * p = new Obj[100]; delete [ ]p;
内存分配
new申请的内存也是存于堆中,所以在不需要使用时,需要delete手动收回。
实现过程
在new一个对象的时候,首先会调用operator new() 为对象分配内存空间,然后调用对象的构造函数。
delete会调用对象的析构函数,然后调用free回收内存。
new/delete和malloc/free的区别
- new从自由存储区上分配内存,malloc从堆上分配内存。自由存储区是C++基于new操作符的一个抽象概念,凡是通过new操作符进行内存申请,该内存即为自由存储区。而堆是操作系统中的术语,是操作系统所维护的一块特殊内存,用于程序的内存动态分配。自由存储区是否能够是堆取决于operator new 的实现细节。自由存储区不仅可以是堆,还可以是静态存储区,这都看operator new在哪里为对象分配内存。
- new 可以调用对象的构造函数,对应的 delete 调用相应的析构函数;malloc 仅仅分配内存,free 仅仅回收内存,并不执行构造和析构函数。在new一个对象的时候,底层首先调用 operator new() 函数为对象分配内存空间,然后调用对象的构造函数。delete会调用对象的析构函数,然后调用free回收内存。
- 使用new操作符申请内存分配时无须指定内存块的大小,编译器会根据类型信息自行计算;使用malloc则需要显式地指出所需内存的尺寸。
- new、delete 返回的是某种数据类型指针;malloc、free 返回的是 void 指针。
- new、delete 是操作符;malloc、free 是函数。
- malloc分配失败返回NULL;new要求在内存分配失败时要求返回NULL或抛出std::bad_alloc异常。
malloc对于给每个进程分配的内存是不是有大小限制
Windows下32位程序如果单纯看地址空间能有4G左右的内存可用,不过实际上系统会把其中2G的地址留给内核使用,32位Linux是用户3G+内核1G。所以你的程序最大能用2G(Windows)或者3G(Linux)的内存。除去其他开销,你能用malloc申请到的内存只有1.9G或者2.9G左右。
delete [] 怎么知道要销毁多少内存空间
new的执行过程:先给定需要的内存大小,调用operator new,在那里面获得制定大小的内存并返回;然后才以刚才返回的内存为基础调用类的构造函数。如果使用的是new[]来生成对象数组,需要多申请sizeof(int)(即4个字节)的空间来存储对象个数,以确定析构的次数。
delete的执行过程:如果需要删除的是对象数组,首先要根据数组最开头的int数值来调用若干次析构函数;然后才释放存储空间。
这告诉我们,可以认为new就是malloc的封装。并且也解释了为什么new[]分配的空间用free()释放会出错(因为new[]分配空间返回的地址并不是它里面malloc分配空间的首地址,系统预留了sizeof(int)个字节)。
malloc的内存可以用delete释放吗?
可以,但是一般不这么用。malloc/free是c语言中的函数,c++为了兼容c保留下来这一对函数。简单来说,new 可以理解为,先执行malloc来申请内存,后调用构造函数来初始化对象;delete是先执行析构函数,后使用free来释放内存。
new[]分配的空间可以用free()释放吗?
不可以,因为new[]分配空间返回的地址并不是它里面malloc分配空间的首地址,系统预留了sizeof(int)个字节用来确定调用析构函数的次数。
new[]和delete配对使用会发生什么
- 如果数组中的元素类型为内置类型,调用delete时不需要析构函数,所以也就不需要多4个字节来存放掉调用析构函数的次数,所以不会报错。
- 如果数组中的元素类型为自定义类型,则delete只会析构数组中的第一个对象。
#include <stdlib.h>
#include <iostream>
using namespace std;int main() {int *pint = new int(5);delete[] pint;int *pinta = new int[4];delete pinta;cout << "success" << endl;return 0;
}
程序输出:
success
这段代码即使不配对使用也会正常运行,因为int是内置类型,调用delete[]时不需要析构函数,所以也就不需要多4个字节来存放数组长度,只需要直接操作内存即可。
malloc出来20字节内存,为什么free不需要传入20呢,不会产生内存泄漏吗?
这是因为虽然你告诉了malloc你要多少空间,但malloc真正分配了多少只有它自己知道。例如,你向malloc要了999字节,但某人写的malloc分配的最小粒度是1024字节,那么你会得到一个1024字节的空间。
在malloc时,所分配的不仅是你请求的那点空间,还加了一个信息块来记录额外信息,这个信息块位于你请求的空间前面。而malloc返回指针的指向的是你请求的空间,如果你想看看那个信息块的话,把malloc返回的指针往前走几步就能看到了。free所需的信息可以直接在信息块中取。信息块和空间都会被释放。
限制对象只能建立在堆上
最直观的思想:避免直接调用类的构造函数,因为对象静态建立时,会调用类的构造函数创建对象。但是直接将类的构造函数设为私有并不可行,因为当构造函数设置为私有后,不能在类的外部调用构造函数来构造对象。但是由于 new 创建对象时,底层也会调用类的构造函数,将构造函数设置为私有后,那就无法在类的外部使用 new 创建对象了。
首先我们想到的是将析构函数设置为私有。这是因为静态对象建立在栈上,是由编译器分配和释放内存空间,当析构函数设为私有时,编译器创建的对象就无法通过访问析构函数来释放对象的内存空间,因此,编译器不会在栈上为对象分配内存。
但是该方法存在两个问题:
- 用 new 创建的对象,通常会使用 delete 释放该对象的内存空间,但此时类的外部无法调用析构函数,因此类内必须定义一个 destory() 函数用来释放 new 创建的对象。
- 无法解决继承问题,因为如果这个类作为基类,析构函数要设置成 virtual,然后在派生类中重写该函数。但此时析构函数是私有的,派生类中无法访问。
因此有了下面这个解决方法:将构造函数和析构函数设置为 protected,并提供一个 public 的静态函数来完成构造,而不是在类的外部使用 new 构造。
限制对象只能建立在栈上
将 operator new() 设置为私有。原因:当对象建立在堆上时,是采用 new 的方式进行建立,其底层会调用 operator new() 函数,因此只要对该函数加以限制,就能够防止对象建立在堆上。