JVM详解

文章目录

  • 一、JVM 执行流程
  • 二、类加载
  • 三、双亲委派模型
  • 四、垃圾回收机制(GC)

一、JVM 执行流程

程序在执行之前先要把java代码转换成字节码(class文件),JVM 首先需要把字节码通过一定的方式 类加载器(ClassLoader) 把文件加载到内存中 运行时数据区(Runtime Data Area) ,而字节码 文件是 JVM 的一套指令集规范,并不能直接交个底层操作系统去执行,因此需要特定的命令解析器 执 行引擎(Execution Engine)将字节码翻译成底层系统指令再交由CPU去执行,而这个过程中需要调 用其他语言的接口本地库接口(NativeInterface) 来实现整个程序的功能,这就是这4个主要组成部分的职责与功能。
在这里插入图片描述
总结来看, JVM 主要通过分为以下 4 个部分,来执行 Java 程序的,它们分别是:

  1. 类加载器(ClassLoader)
  2. 运行时数据区(Runtime Data Area)
  3. 执行引擎(Execution Engine)
  4. 本地库接口(Native Interface)

JVM 运行时数据区
VM 运行时数据区域也叫内存布局,但需要注意的是它和 Java 内存模型((Java Memory Model,简称 JMM)完全不同,属于完全不同的两个概念,它由以下 5 大部分组成:
在这里插入图片描述

  1. Nartiye Method Stacks就表示是JVM内部的C++代码,就是给调用native方法(JVM内部方法)准备的栈空间。(也就是说C++根本不需要虚拟机的,他是直接把代码编译成native code,也就是cpu能识别的机器指令。但是java因为有跨平台需求,需要用jvm)
  2. JVM Stacks给java代码使用的栈
    注意:
    这里的栈和数据结构里面的栈并不是同一个意思,此处所说的栈,指代的就是JVM一块特殊的存储空间,对于JVM虚拟栈而言,是存储的就是方法与方法之间的调用关系。本地方法栈存储的就是native方法的调用关系。
    整个栈空间内部,包含很多元素,一个元素称之为一个栈帧,一个栈帧里包含这个方法的入口地址、方法参数、返回地址、局部变量等
    这个栈也是先进后出的,但是和数据结构里面的栈是更广泛通用的概念
  3. progarm counter pegister(程序计数器)这是记录当前执行到那一条指令
  4. 堆是JVM中空间最大的区域,new出来的对象就是放在堆上的,类的成员变量也是放在堆上的,一个进程对应一份堆对应N个栈,而栈是每个线程都有独立的栈(一个进程对应一个虚拟机,两个进程就是两个JVM)
  5. 元数据去(方法区):主要是常量池,静态成员变量,类对象就存在这
  6. 判断某个变量在啥区域
    局部变量在栈上
    普通成员变量在堆上
    静态成员变量在方法区(元数据区)

二、类加载

类加载简单理解就是.class文件,从文件(硬盘)被加载的内存中(元数据)这样的过程
在这里插入图片描述
1.加载
1)通过一个类的全限定名来获取定义此类的二进制字节流。
2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
3)在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。
简单来说就是:把.class文件找到,打开文件,读取文件,把文件内容读到内存中。

2.验证
这一阶段的目的是确保Class文件的字节流中包含的信息符合java虚拟机规范

这里在说一下类对象实际究竟是什么
在这里插入图片描述
这是java虚拟机规范里面标准的类对象结构,也就是说在我们java代码写好之后,点击运行,首先要做的就是将我们代码里面的定义类进行重新定义(书写)书写的格式就是按照这种类似(C++)结构体的方式去书写,这就是我们.class文件。
在这里插入图片描述注意.class文件和类对象是同一个东西的不同形态,类对象是我们描述内存里实际存储的对象,class文件是这个对象以文件的形式打开后呈现的样子。

3.准备:
准备阶段是正式为类中定义的变量(即静态变量,被static修饰的变量)分配内存并设置类变量初始值 的阶段
简单来说:给类对象分配内存空间(先在元数据占个位置),将静态成员变量赋值为0。

4.解析:
针对字符串常量进行初始化(将符号引用转化为直接引用)。一个字符串常量得有一块内存空间,存这个字符的实际内容,还得有一个引用,来保存这个内存空间的起始地址。
在类加载之前,字符串常量,此时处于.class文件中,此时这个引用记录的并不是字符串常量正在的地址,而是他在文件中的偏移量(或者说占位符,或者说符号引用)
只有在类加载之后,才真的把这个字符常量放到内存中,才有了内存地址,这个引用才被真正的赋值成内存地址(直接引用)。
(就像看电影之前我只知道自己相对位置,只有坐下来之后才知道自己的实际位置)

5.初始化:
初始化阶段,Java 虚拟机真正开始执行类中编写的 Java 程序代码,将主导权移交给应用程序。初始化阶段就是执行类构造器方法的过程。(加载父类,执行静态代码块的代码等)

但是一个类啥时候会被加载,并不是java程序一运行就会加载,而是真正用到的时候才会去加载(懒汉模式)

常见的类加载时机

1.构造类的实例:new 了一个对象
2.调用这个类的静态方法,使用静态属性(因为静态的都和类绑定在一起,只有类被加载了,静态属性才会赋值)
3.如果加载一个子类,需要先加载其父类
4.如果加载过,后续就不需要重新加载

还不太明白的同学可以去看这篇文章
https://blog.csdn.net/Strange_boy/article/details/125717606?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522169200970816800226573234%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=169200970816800226573234&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2blogtop_positive~default-1-125717606-null-null.268v1koosearch&utm_term=%E7%B1%BB%E5%8A%A0%E8%BD%BD%E7%9A%84%E8%BF%87%E7%A8%8B&spm=1018.2226.3001.4450

三、双亲委派模型

双亲委派模型描述的是在加载中找.class文件怎么去找的问题

JVM默认提供了三个类加载器
BootstrapClassLoader:负责加载标准库中的类。(这是java规范要求提供哪些类,无论哪种jvm的实现,都会提供这些类)
ExtensionClassLoader:负责加载JVM扩展库中的类(规范之外,由实现JVM厂商、组织提供的额外功能)
ApplicationClassLoader:负责加载用户提供的第三方库、用户项目代码中的类
三种构成父子关系,这个并不是说父类子类的那种继承关系,单纯只是比如说ApplicationClassLoader有一个parent引用指向ExtensionClassLoader
在这里插入图片描述
在这里插入图片描述

上述类是如何配合工作的呢?

首先加载一个类的时候,先从ApplicationClassLoader开始,但是他并不是真加载,而是委托给自己的父亲ExtensionClassLoader去加载,但是ExtensionClassLoader也委托给自己的父亲去加载BootstrapClassLoader,当BootstrapClassLoader发现没有上层了,那么就开始自己加载,去所有自己的标准库目录里面的类,如果找到就加载,如果没找到,就有子类加载进行加载。ExtensionClassLoader也是一样,最后才是ApplicationClassLoader加载用户定义的类。在ApplicationClassLoader加载完如果还有类没有加载,那么ApplicationClassLoader下面也没有子类了就会抛出异常。

之所以这样安排,是因为JVM实现这个功能的逻辑是用递归写的,目的是为了防止用户创建了一些奇怪的类,比如说用户写了个java.lang.String类,这样就保证JVM先加载的一定是JVM标准库里的java.lang.String类,而不是用户自定义的这个。这样就保证起码标准库和三方库的类不会加载错误,所以最多也就是用户自己定义的类加载错误。

四、垃圾回收机制(GC)

垃圾回收机制就是帮我们回收不再使用的内存。

在C或者C++中,我们new或者malloc一块空间,实际上是在堆上申请了一块内存空间(JAVA类似),堆上申请和栈上申请是不同的,因为堆申请的内存空间,必须手动释放(C++用free 或者delete),但是栈实际上方法执行结束了就自动释放了。堆的这个特性在个人电脑上可能没有太大影响,随着进程结束,堆的空间即使没回收也会回收。但是如果是服务器就需要考虑这个问题了,因为服务器的进程是一直存活的,会运行很长时间,如果我们用完堆不及时回收的话,可能会导致剩余空间越来越少。

GC运行虽然很省心,可以帮我们自动回收一些不用的空间,但是GC也会带来更大的系统开销,对程序的执行效率肯定是会有影响的。因为C++追求极致的性能,所以并不引入GC机制

注意我们在之前的编程中比如说释放scanner 释放statement,这些不是释放内存,而是释放文件。

所以通过上面的背景我们知道GC是针对堆中的数据进行垃圾回收,GC是以对象为基本单位进行回收的,而不是字节等这样设定的目的就是为了简单。

GC实际工作过程

1.找到垃圾、判定垃圾
关键思路
抓住这个对象,看他到底有没有“引用”指向他。
如果一个对象有引用,那么就有可能被使用但是如果么有引用,那么就一定不会再被使用了。
那么怎么去做就能判断对象是不是被引用了呢?

  1. 引用计数(这不是java的做法,而是python/php的方式)
    给对象增加一个引用计数器,每当有一个地方引用它时,计数器就+1;当引用失效时,计数器就-1;任何时刻计数器为0的对象就是不能再被使用的,即对象已"死"。引用计数法实现简单,判定效率也比较高。
    但是这个方法的缺点在于内存空间浪费的空间是比较大的。在主流的JVM中没有选用引用计数法来管理内存,最主要的原因就是引用计数法无法解决对象的循环引用问题。
  2. 可达性分析
    java中的对象,都是通过引用来指向并访问的
    一般是一个引用指向一个对象,这个对象里的成员,又指向别的对象。
    实际上整个java中的对象都是通过这样的链式或者树形结构给串起来的。
    可达性分析就是把所有这些对象组织的结构看做树,从根节点区去遍历,所有能被访问到的对象,标记为可达,不能可达的就会作为垃圾进行回收。
    上述操作类似与树遍历,这种操作相对于计数来说,效率上会慢一点,但是会解决循环引用问题,此外,这个可达性分析不是每时每刻都需要做,隔一段时间分析一下就可以了。
    可达性遍历的起点(一个代码中可能由多个起点)可能是:
    1.栈上的局部变量,
    2.常量池中的对象,
    3.静态变量。

如何清除垃圾

标记清除
"标记-清除"算法是最基础的收集算法。算法分为"标记"和"清除"两个阶段 : 首先标记出所有需要回收的 对象,在标记完成后统一回收所有被标记的对象。后续的收集算法都是基于这种思路并对其不足加以改进而已。
标记-清除"算法的不足主要有两个 :

  1. 效率问题 : 标记和清除这两个过程的效率都不高
  2. 空间问题 : 标记清除后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行中
    需要分配较大对象时,无法找到足够连续内存而不得不提前触发另一次圾收集。

复制算法
"复制"算法是为了解决"标记-清理"的效率问题。它将可用内存按容量划分为大小相等的两块,每次只使 用其中的一块。当这块内存需要进行垃圾回收时,会将此区域还存活着的对象复制到另一块上面,然后 再把已经使用过的内存区域一次清理掉。这样做的好处是每次都是对整个半区进行内存回收,内存分配 时也就不需要考虑内存碎片等复杂情况,只需要移动堆顶指针,按顺序分配即可。此算法实现简单,运 行高效。算法的执行流程如下图 :
在这里插入图片描述

这样是解决了标记算法里面碎片空间的问题,但是也有缺点,就是空间利用率低,如果垃圾少,有效对象多,复制成本就会加大。

3.整理标记
复制收集算法在对象存活率较高时会进行比较多的复制操作,效率会变低。因此在老年代一般不能使用 复制算法。
针对老年代的特点,提出了一种称之为"标记-整理算法"。标记过程仍与"标记-清除"过程一致,但后续步 骤不是直接对可回收对象进行清理,而是让所有存活对象都向一端移动,然后直接清理掉端边界以外的内存。流程图如下:
在这里插入图片描述
但是这个做法效率也不高,如果搬运空间比较大,开销也还是比较大的。

分代回收
基于上述,我们可以将垃圾回收分为不同的场景,不同场景使用不同的算法

分代咋分的
实际就基于经验规律:如果一个东西,存在的时间比较长,那么大概率还会存在很长时间。这个经验会与java中的对象也是存在的(有相关的实验证明)所以可以根据对象生命周期的长短来使用不同的算法。
此时我们对对象引入一个概念:对象的年龄,对象的年龄用GC扫过的轮次为基本单位,扫过一轮没有被销毁,就是一岁,扫过两轮没有被销毁,就是两岁。
所以JVM按照对象的年龄将堆划分为多个区域

在这里插入图片描述
刚刚new出来的放入伊甸区,年龄是0岁,经过一轮之后被放入幸存区。幸存区相对于伊甸区来说要小很多,这是因为大部分的对象都是朝生夕死的,生命周期是很短的。从伊甸区到幸存区用的就是复制算法,到了幸存区之后还是还是要接受周期性的GC考验,如果变成垃圾,就会被释放,如果不是垃圾,就拷贝到另外一个幸存区,这 两个幸存区同一时刻只会用一个,对象在一轮轮的GC扫描中在两个幸存区中来回拷贝,由于幸存区体积不大,此处空间浪费也可以接受。如果这个对象已经在两个幸存区中拷贝多次,就会进入老年代,针对老年代也会周期性的GC扫描,但频率会更低,如果老年代对象扫描为垃圾,就用标记整理的方式进行释放。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/99809.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数字孪生助力智慧水务:科技创新赋能水资源保护

智慧水务中,数字孪生有着深远的作用,正引领着水资源管理和环境保护的创新变革。随着城市化和工业化的不断推进,水资源的可持续利用和管理愈发显得重要,而数字孪生技术为解决这一挑战提供了独特的解决方案。 数字孪生技术&#xf…

ByteV联合“智农”打造的数字孪生高标准农田,助力乡村振兴!

ByteV联合“智农”打造的数字孪生高标准农田,不仅要让粮食稳产、增产,更要对土壤肥力进行改良和提升。不仅能够实现科技引领农业发展,更在智慧农业的基础上实现一站式托管,真正做到技术提升、5G引领、建后管护的闭环管理。让高标准…

无服务器架构发布啦!

导读Serverless 1.15.2 已发布。The Serverless Framework (无服务器架构)允许你自动扩展、按执行付费、将事件驱动的功能部署到任何云。 目前支持 AWS Lambda、Apache OpenWhisk、Microsoft Azure,并且正在扩展以支持其他云提供商。 Serverless 降低了…

【c语言】五子棋(EasyX图形库+背景音乐)

大家好,有没有觉得写了好多c语言代码,面对的都是黑框框控制台,当我们学习了基础的c语言知识,和EasyX图形库后,终于可以和黑框框saygoodbye,今天要分享给大家的是小游戏五子棋,跟着小张一起学习吧 EasyX图形…

opencv-gpu版本编译(添加java支持,可选)实现硬解码

目录 opencv gpu版本编译,实现硬解码,加速rtsp视频流读取1、准备文件2、复制 NVCUVID 头文件到 cuda 安装目录 include3、安装相关依赖4、 执行cmake5、编译安装6、测试 opencv gpu版本编译,实现硬解码,加速rtsp视频流读取 前置条…

复习3-5天【80天学习完《深入理解计算机系统》】第七天

专注 效率 记忆 预习 笔记 复习 做题 欢迎观看我的博客,如有问题交流,欢迎评论区留言,一定尽快回复!(大家可以去看我的专栏,是所有文章的目录)   文章字体风格: 红色文字表示&#…

git创建分支和合并分支

1.创建分支 git创建分支只需要使用switch 命令就行: git switch -c 分支名 创建分支并切换到该分支 后面括号里面的内容发生改变就是修改了分支 。 然后想要合并分支就在 创建的分支中 进行提交修改的内容,还是通过:add 命令和commit命令…

6.链路追踪-Zipkin

链路追踪(Distributed Tracing)是一种用于监视分布式应用程序的技术,通过收集和展示分布式系统中不同组件之间的调用和交互情况,帮助开发人员和运维团队理解系统中的请求流程、性能瓶颈和异常情况。 1.Zipkin Zipkin 是一个开源的…

(三)行为模式:4、迭代器模式(Iterator Pattern)(C++示例)

1、迭代器模式(Iterator Pattern)含义 迭代器模式(Iterator),提供一种方法顺序访问一个聚合对象中各个元素,而不暴露该对象的内部表示。【DP】 通过使用迭代器模式,可以将遍历算法与集合对象解耦…

C#程序变量统一管理例子 - 开源研究系列文章

今天讲讲关于C#应用程序中使用到的变量的统一管理的代码例子。 我们知道,在C#里使用变量,除了private私有变量外,程序中使用到的公共变量就需要进行统一的存放和管理。这里笔者使用到的公共变量管理库划分为:1)窗体;2)…

一“码”当先,PR大征集!2023 和RT-Thread一起赋能开源!

活动地址:https://club.rt-thread.org/ask/article/3c7cf7345ca47a18.html 活动介绍 「一“码”当先,PR大征集!」是一项为了鼓励开发者积极参与开源软件开发维护的活动。 你可在Github RT-Thread( https://github.com/RT-Thread …

Unity的TimeScale的影响范围分析

大家好,我是阿赵。 这期来说一下Unity的TimeScale。 一、前言 Unity提供了Time这个类,来控制时间。其实我自己倒是很少使用这个Time,因为做网络同步的游戏,一般是需要同步服务器时间,所以我比较多是在使用System.Date…

【MySQL】多表查询

文章目录 1、单表查询2、表结构2.1 一对多(多对一) 3、多表查询(一对多)3.1 内连接(where 、inner join)3.2 外连接(left join、right join)3.3 自连接(inner join)3.4 联合查询(union all 、union&#xf…

【UML】详解UML类图

目录 1.概述 2.权限 3.关系 3.1.连线关系 3.2.依赖 3.3.泛化(继承) 3.4.实现 3.5.关联 3.6.聚合 3.7.组合 1.概述 UML是什么?书面化一点的说法是: UML(Unified Modeling Language),…

【MaxKey对接一】对接gitlab的oauth登录

MaxKey的Oauth过程 引导进入 GET http://{{maxKey_host}}/sign/authz/oauth/v20/authorize?client_idYOUR_CLIENT_ID&response_typecode&redirect_uriYOUR_REGISTERED_REDIRECT_URI 登录后回调地址 YOUR_REGISTERED_REDIRECT_URI/?code{{code}} 换取Access Token GET…

简单认识镜像底层原理详解和基于Docker file创建镜像

文章目录 一、镜像底层原理1.联合文件系统(UnionFS)2.镜像加载原理3.为什么Docker里的centos的大小才200M? 二、Dockerfile1.简介2.Dockerfile操作常用命令 三、创建Docker镜像1.基于已有镜像创建2.基于本地模板创建3.基于Dockerfile创建4.Dockerfile多阶段构建镜像 一、镜像底…

Leetcode Top 100 Liked Questions(序号53~74)

53. Maximum Subarray 题意:一个数组,找到和最大的子串 我的思路 我记得好像On的动态规划来做的?但是想不起来了,先死做,用的前缀和——TLE超时 那就只能想想dp怎么做了 假设dp[i]表示的是以 i 为右端点的最大的…

【数据结构入门指南】二叉树顺序结构: 堆及实现(全程配图,非常经典)

【数据结构入门指南】二叉树顺序结构: 堆及实现(全程配图,非常经典) 一、前言:二叉树的顺序结构二、堆的概念及结构三、堆的实现(本篇博客以实现小堆为例)3.1 准备工作3.2 初始化3.3 堆的插入3.3.1 向上调…

prometheus blackbox_exporter安装

目录 一、准备工作1.1 安装或关闭以下服务1.2 本次安装环境 二、安装blackbox_exporter2.1 下载并解压2.2配置2.3测试 三、配置blackbox_exporter3.1配置blackbox.yml3.2 开启blackbox_exporter3.3配置prometheus.yml 四、其他4.1server returned HTTP status 400 Bad Request …

webpack 和 ts 简单配置及使用

如何使用webpack 与 ts结合使用 新建项目 ,执行项目初始化 npm init -y会生成 {"name": "tsdemo01","version": "1.0.0","description": "","main": "index.js","scripts&…