垃圾回收之标记算法
1、引用计数法
- 通过判断对象的引用数量来决定对象是否被回收
- 每个对象实例都有一个引用计数器,被引用则+1,完成引用则-1
优点: 执行效率高,程序执行受影响小
缺点: 无法检测出循环引用的情况,导致内存泄漏
应用较少
通过判断对象的引用链是否可达来决定对象是否可以被回收。
将程序中所有的引用链视为一张图,从一系列的GC Root 出发,无法到达的节点则标记为可回收。
可以作为GC Root的对象:
- 虚拟机栈中引用的对象(栈帧中的局部变量表)
- 方法区中的常量引用的对象
- 方法区中的类静态属性引用的对象
- 本地方法栈中JNI的引用对象
- 活跃线程的引用对象
垃圾收集(Garbage Collection, GC)是一种自动化的内存管理机制,它负责回收不再使用的对象所占用的内存。以下是几种常见的垃圾收集算法:
1、标记-清除算法
标记-清除(Mark-Sweep)算法是最基础的收集算法,它分为标记和清除两个阶段。
首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象,它的标记过程其实就是垃圾判定算法中介绍的过程。
该算法有两个缺点:
效率问题:标记和清除两个过程的效率都不高
空间碎片:标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
执行过程:
2、复制算法
复制(Copying)算法解决了效率低的问题。它将可用内存容量划分为大小相等的两块,每次只使用其中的一块。当这一块内存用完了,就将还存活的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。
这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,简单高效。
优点:解决碎片化问题
缺点:可用内存缩小为原来的一半,代价有点儿高。
使用场景:适用于对象存活率低的场景,例如新生代
执行过程:
现在的商业虚拟机都采用这种收集算法来回收新生代。
通常将内存分为一块较大的Eden区和两块较小的Survivor区,每次使用Eden和其中一块Survivor。当回收时,将Eden和Survivor中还存活的对象一次性地复制到另外一块Survivor区,最后清理掉Eden和刚用过的Survivor区。据研究表明,新生代中的对象98%是朝生夕死的。
HotSpot默认Eden和Survivor的大小比例是8:1:1,也就是每次新生代中可用内存空间为整个新生代容量的90%。
当然,并98%只是一般场景下的统计数据,实际上没办法保证每次回收都只有不多于10%的对象存活。当Survivor空间不够用时,需要依赖其他内存进行分配担保(Handle Promotion)。
3、标记-整理算法
复制算法在对象存活率较高时需要进行较多的复制操作,效率会降低很多。更关键的是需要有额外的空间进行分配担保,以应对内存中所有对象100%存活的极端情况,所以老年代一般不能直接选择这种算法。
标记-压缩(Mark-Compact)算法,也叫标记-整理算法。标记过程仍然与标记-清除算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉边界以外的内存。
特点:
- 避免了内存的不连续性
- 不用设置两块内存互换
- 适用于存活率高的场景,例如老年代
执行过程:
4、分代收集算法(主流)
现在虚拟机的垃圾收集都采用分代收集(Generational Collection)算法。这种算法根据对象存活周期的不同将内存划分为几块。
一般把Java堆分为新生代和老年代,然后根据各个年代的特点采用最适当的收集算法。
新生代:每次收集时都有大批对象死去,只有少量存活,选用复制算法,只需要复制出少量存活对象就可以快速完成收集。
老年代:对象存活率高、没有额外空间对它进行分配担保,一般使用标记-清理或标记-压缩算法。
GC的分类:
1、Minor GC:年轻代的垃圾收集,采用复制算法。执行较为频繁,尽可能快速地回收生命周期短的对象。
2、Full GC/ Major GC: 老年代回收,一般情况下同时也会触发Minor GC
常见的垃圾回收器:
1、年轻代垃圾回收器
Serial收集器(-XX:UseSerialGC, 复制算法)
- 单线程收集,进行垃圾收集时,必须暂停所有工作线程
- 简单高效,Client模式下默认的年轻代收集器
ParNew收集器(-XX:UseParNewGC, 复制算法)
- 多线程收集,其余的行为特点和Serial收集器一样
- 单核执行效率不如Serial,在多核下执行才有优势
Parallel Scavenge收集器 (-XX:UseParallelGC, 复制算法)
- 比起关注用户线程停顿时间,更关注系统的吞吐量(这里吞吐量是指 运行用户代码时间/(运行用户代码时间+垃圾收集时间))
- 在多核下执行有优势,Server模式下默认的年轻代收集器
2.老年代垃圾回收器
Serial Old收集器(-XX:UseSerialOldGC, 标记-整理算法)
- 单线程收集,进行垃圾收集时,必须暂停所有工作线程
- 简单高效,Client模式下默认的老年代收集器
Parallel Old收集器(-XX:UseParallelOldGC,标记-整理算法)
- 多线程, 吞吐量优先
CMS收集器(-XX:UseConcMarkSweepGC, 标记清除算法)
CMS全称 Concurrent Mark Sweep,是一款并发的、使用标记-清除算法的垃圾回收器,以牺牲吞吐量为代价来获得最短回收停顿时间的垃圾回收器,对于要求服务器响应速度的应用上,这种垃圾回收器非常适合。
回收流程:
- 初始标记:在这个阶段,需要虚拟机停顿正在执行的任务,官方的叫法STW(Stop The Word)。这个过程从垃圾回收的"根对象"开始,只扫描到能够和"根对象"直接关联的对象,并作标记。所以这个过程虽然暂停了整个JVM,但是很快就完成了。
- 并发标记:这个阶段紧随初始标记阶段,在初始标记的基础上继续向下追溯标记。并发标记阶段,应用程序的线程和并发标记的线程并发执行,所以用户不会感受到停顿。
- 并发预清理:并发预清理阶段仍然是并发的。在这个阶段,虚拟机查找在执行并发标记阶段新进入老年代的对象(可能会有一些对象从新生代晋升到老年代, 或者有一些对象被分配到老年代)。通过重新扫描,减少下一个阶段"重新标记"的工作,因为下一个阶段会Stop The World。
- 重新标记:这个阶段会stop the world,收集器线程扫描在CMS堆中剩余的对象。扫描从"根对象"开始向下追溯,并处理对象关联。
- 并发清理:清理垃圾对象,收集器线程和应用程序线程并发执行
- 并发重置:这个阶段,重置CMS收集器的数据结构,等待下一次垃圾回收。
CMS不会整理、压缩堆空间,这样就带来一个问题:经过CMS收集的堆会产生空间碎片,CMS不对堆空间整理压缩节约了垃圾回收的停顿时间,但也带来的堆空间的浪费。为了解决堆空间浪费问题,CMS回收器不再采用简单的指针指向一块可用堆空 间来为下次对象分配使用。;而是把一些未分配的空间汇总成一个列表,当JVM分配对象空间的时候,会搜索这个列表找到足够大的空间来hold住这个对象。
3. G1 收集器(-XX: UseG1GC, 复制+ 标记整理算法,独立的垃圾回收器包含新生代、老年代)
G1(Garbage-First)是一款面向服务端应用的垃圾收集器,主要针对配备多核CPU及大容量内存的机器,以极高概率满足GC停顿时间的同时,还兼具高吞吐量的性能特征。JDK 9以后的默认垃圾收集器,取代了CMS 回收器。