javaEE-8.JVM(八股文系列)

一.简介

二.JVM中的内存划分

JVM的内存划分图:

堆区:编辑

栈区:编辑

程序计数器：编辑

元数据区：编辑

经典笔试题：

三,JVM的类加载机制

1.加载:

2.验证:

3.准备:

4.解析:

5.初始化:

双亲委派模型

概念:

JVM的类加载器默认有三种：

双亲委派模型的工作流程：

四.JVM的垃圾回收机制(GC)

垃圾回收步骤：

1.识别出垃圾

1）引用计数

2）可达性分析

2.把标记为垃圾的对象的内存空间进行释放

1）标记-清除：

2）复制算法

3）标记整理

分带回收

一.简介

JVM : java Virtual Machine 的简称，意为Java虚拟机。

java的执行流程是：先通过javac 将.java文件转为.class（字节码文件）文件，之后在某个平台执行；然后通过JVM 将.class文件转换为CPU能识别的机器指令。

因此，编写一个java程序，只需要发布.class文件就行了。JVM拿到.class文件,就知道该如何转换了.

二.JVM中的内存划分

JVM也相当于一个进程,在启动一个java程序后,需要个JVM分配资源空间.

JVM从系统中申请的内存,会根据java程序中不同的使用途径,为其分配空间.这就是内存划分.

JVM会将申请到的空间划分成几个区域,每个区域有不同的功能,

JVM的内存划分图:

堆区:

存放的是代码中new出来的对象,对象中的非静态成员也在堆区.

栈区:

包含了一些方法调用关系和局部变量.

由本地方法栈和虚拟机栈组成,本地方法栈是JVM内部,是由C++写的；虚拟机栈保存了一些java的方法调用和局部变量。

平时所说的栈区，指的是虚拟机栈，

程序计数器：

这个区域比较小，专门用来保存下一条要执行的java指令的地址。

元数据区：

包含了一些辅助性质的，描述性质的属性。元数据区也叫做方法区。

元数据是计算机中的一个常见术语（Meta data）。

对于硬盘来说,不仅要存储文件的数据本体，还要存储一些辅助信息，像文件的大小，文件的位置，文件的使用权限，文件的拥有者....这些都称为“元数据”。

一个程序中，有哪些类，有哪些方法，每个方法中有哪些指令，....这些信息都会保存在JVM的元数据区.

对于堆区和元数据区,整个进程中只有一份;而对于栈区和程序计数区,在内存中是有很多份的.

经典笔试题：

class Test {private int n;private static int m;
}
public static void main(String args[]){Test t = new Test();
}

问: n,m,t 都在哪块JVM的哪个内存区域中?

n属于局部变量,在作用域中生效,出作用域就销毁了,存在栈区.

m：属于静态变量，存在元数据区。

t：是new出来了一个Test对象，t中保存的是Test的地址,属于局部变量,保存在栈区;而Test对象则保存在堆区.

区分变量在内存的哪个区域上,最重要的就是确定该变量的"形态",是 局部变量/成员变量/静态变量....

三,JVM的类加载机制

类加载指的是JVM把.class文件从硬盘读取到内存,进行一系列的校验解析的过程.转换成类对象的过程.

类加载过程大致分为五步:

1.加载:

把.class文件找到并打开,读取到文件中的内容.

2.验证:

需要确定当前读到的文件是合法的.class文件(字节码文件).否则若读到错误的文件,后面的工作就白费了.

具体的验证依据是在java的虚拟机规范中,有明确的格式说明:

左面这一列是类型,右面这一列是名字.

也叫做:magic number 魔幻数字,用来标识二进制文件中的格式的类型.

这两个都是版本号,u4 是主版本,u2 是次版本.属于JVM内部的版本,JVM会验证.class文件的版本号是否符合要求.

一般来说高版本的JVM可以运行低版本的.class文件,反之不行.

3.准备:

为类对象申请内存空间.此时申请到的内存空间都为默认值为全0的.

4.解析:

主要是针对类中的字符串常量进行处理.

将常量池中的符号引用替换为直接引用的过程,也就是初始化常量的过程.

我们知道,在.class文件中,是不存在地址的,而对于创建的字符串常量,变量中保存的是常量的地址,这又是怎样记录的呢?

class Test{private String s="hello";
}

这个hello在.class文件中,是否会保存呢?

当然是要保存的,只不过s中保存的是一个字符串常亮的"偏移量".

在文件中,不存在地址这样的概念,地址是内存的地址,而文件是在硬盘中的.

为了保存字符串常来那个,可以存储一个"偏移量"的概念, 这里的偏移量就认为是符号引用.

之后,把.class文件加载到内存中,就有地址了,s中的值就能根据偏移量来转换为真正地址了,也就是直接引用.

5.初始化:

针对类对象,完成后续的初始化操作.

执行静态代码块,构造方法,还可能触发父类加载.....

双亲委派模型

在类加载过程的第一步:加载环节中使用双亲委派模型描述如何查找.class文件的策略.

JVM在进行类加载的时候,有一个专门的模块,称为"类加载器".(ClassLoader)

概念:

双亲委派模型: 如果一个类加载器收到一个类加载的请求,他首先不会自己加载该类,而是将这个类委派给父类加载器,让父类加载器去完成对类的加载.每层次的类加载器都是这样委派,最终所有的加载请求都会到达最顶层的类加载器,直到当父类加载器反馈自己无法完成这个类加载请求时,子类加载器就会尝试自己完成加载.

JVM的类加载器默认有三种：

BootstrapClassLoader: 负责查找标准库目录.

ExtensionClassLoader: 负责查找扩展库目录.

ApplicationClassLoader: 负责查找当前项目的代码目录,以及第三方库.

这三个类加载器存在父子类(二叉树关系)关系.

ApplicationClassLoader的父类是ExtensionClassLoader；

ExtensionClassLoader的父类是BootstrapClassLoader，BootstrapClassLoader属于顶层父类。

双亲委派模型的工作流程：

1.类加载任务先从ApplicationClassLoader为入口，开始工作；

2.ApplicationClassLoader自己不会立即搜索自己负责的目录，会将搜索的任务向上传递给父类；

3.代码进入ExtensionClassLoader的范畴,同样,ExtensionClassLoader 也不是立即搜索自己负责的目录,继续将搜索的任务向父类传递;

4.代码进入BootstrapClassLoader的范畴,由于BootstrapClassLoader是顶级父类了,就会真正进行负责搜索目录(标准库目录),尝试在标准库目录中找到符合要求的.Class文件;

5.若是找到了,就会进入打开文件,读文件流程了,此时类加载步骤就结束了；若是没有找到，就会返回到子类的类加载器中，继续尝试加载。

6.若是在ExtensionClassLoader类加载器中找到符合要求的.Class文件,此时类加载步骤就结束了;若还未找到,就会返回给子类加载器ApplicationClassLoader继续尝试加载.

7.若在ApplicationClassLoader类加载器中搜索到了,此时类加载就结束了,就会进入后续流程；若是没有找到，就会继续向子类寻找，由于ApplicationClassLoader是底层了,就表示类加载失败了.

这一系列的列加载机制,目的是为了保证这几个类加载器的优先级顺序.

这个类加载器是系统默认的类加载机制,也可以自己实现类加载机制,可以与默认机制不同.

四.JVM的垃圾回收机制(GC)

垃圾回收指的是让程序自动回收内存,JVM中的内存分为好几种,要回收的是堆区的内存；

元数据区和程序计数区的内存不需要回收,栈区中存放的都是局部变量申请的内存，在代码结束后,会自动销毁(属于栈区自己的特点,和垃圾回收没有关系)。

回收内存其实就是回收对象，垃圾回收时，将堆区上的若干个对象释放掉。

堆区内存根据垃圾回收，又分为三类区间：

垃圾回收步骤：

1.识别出垃圾

要判定哪些对象是垃圾，哪些对象不是垃圾。就是判断该对象是否还需要使用。

在java中，使用对象，一定是通过引用指向使用对象的方式使用，若该对象没有引用指向，则表示该对象不再被使用，就可以进行垃圾回收了。

class Test{
....
}
void func(){
Test t = new Test(); }

这个代码中,执行结束后,t属于局部变量，存在于栈区，会被直接释放掉，Test对象在执行完后,由于没有对象指向了,也就属于垃圾了，就会被垃圾回收。

对于一些更复杂的代码，判定过程也就更加复杂。

Test t1 = new Test();
Test t2 = t1;
Test t3 = t2;
Test t4=t3;
....

很多引用都指向了同一个对象Test，只有当所用的引用都结束了，才能释放Test对象，但每个引用的生命周期又不一样，就很难判断了。

于是又设计一些方法来记录对象的引用：

1）引用计数

给每个对象再分配一个额外的空间，保存当前对象引用个数，当有一个引用指向了该对象，引用计数就+1，一个引用结束后，引用计数就-1.

此时的垃圾回收机制就是：有一个专门的扫描线程，取获取每个对象的引用计数的情况，当引用计数为0时，就表示该对象没有引用指向了，不再使用了，也就可以释放了。

class Test {....
}
void func() {
Test t1 = new Test();
Test t2 = t1;
}

这个代码的内存分配:

引用计数存在的问题:

1）耗费额外的空间：

引用计数需要耗费一个额外的空间,若对象本身占用的内存就比较小,总的对象数目有很多,那么总的消耗空间就会非常多。

2）可能出现“循环引用问题”：

class Test{Test t;
}
Test t1 = new Test();
Test t2 = new Test();
t1.t = t2;
t2.t = t1;
t1 = null;
t2 = null;

当t1和t2还未被置为null的时候,此时的内存是这样的情况:

当t1和t2都被置为null后,t1,t2内存被释放,但Test对象中的t还未被释放:

此时,Test的引用计数还都不是0，不能被GC回收，但又无法使用，就产生了循环引用问题，这种情况下的引用计数就无法被正常使用了。

引用计数这种思想并未在java中使用，在别的语言的垃圾回收机制中有使用到。

2）可达性分析

（JVM的垃圾回收机制识别垃圾采用的是这种思想）

可达性分析本质上是采用“时间”换“空间”的方法。

相较于引用计数，可达性分析要消耗更多的时间去“遍历”，不会存在上面引用计数中的问题。

可达性分析：一个java代码中，会定义很多变量，从这些变量为起点，向下“遍历”：从这些变量中持有的引用类型的成员，再向下遍历，所有能被访问到的对象，一定不是垃圾了，而未被访问到的对象，就是垃圾了，要被就行回收。

JVM自身有扫描线程，会不停地扫描代码，看是否有对象无法被遍历到；JVM本身是知道一共有多少个对象的。

class Node{char root;Node left;Node right;
}
Node BuildNode{
Node a = new Node();
Node b = new Node();
Node c = new Node();
Node d = new Node();
Node e = new Node();
Node f = new Node();
Node g = new Node();
a.left = b;
a.right = c;
b.left = d;
b.right = e;
c.right = f;
e.left = g;
}
public static void main(String args[]){
Node root = BuildNode();
}

代码中的树是这个样子,