JVM指令重排序

文章目录

  • 什么是指令重排序
    • 编译器优化
    • JIT 编译优化
    • 处理器优化
    • 重排序数据依赖性
  • 硬件层的内存屏障
  • 指令重排的代码验证
  • 好处
    • 减少管道阻塞
    • 提高缓存利用率
    • 利用并行执行单元
    • 性能提升
    • 更好地利用硬件资源
  • 问题
    • 内存可见性问题
    • 编程复杂性增加
    • 调试困难
  • 解决方案:Java内存模型(JMM)和关键字
    • Java内存模型(JMM):
    • 关键字 volatile:
    • 关键字 synchronized:
  • 总结
  • 参考

在 Java 中,指令重排是一种性能优化技术,它涉及到编译器和处理器对程序中指令的执行顺序进行调整,以提高执行效率。

什么是指令重排序

指令重排序是一种在编译器和处理器级别发生的优化过程,它改变了程序原有的指令执行顺序。这种优化可以在多个层面上发生,包括编译器优化、即时编译优化(JIT),以及处理器层面的优化。

编译器优化

当 Java 代码被编译成字节码时,Java 编译器可能会重新排列指令的顺序。这种重排序基于以下原则:

  • 独立性:如果两个指令之间没有直接的数据依赖关系,编译器可能会改变它们的顺序。
  • 性能提升:重排序旨在优化程序的执行,例如通过减少指令之间的延迟或改善分支预测。
  • 内存访问优化:编译器可能会重新排列内存访问指令以减少缓存未命中的情况。

JIT 编译优化

Java 运行时的即时编译器(JIT)进一步优化已经编译的字节码。JIT 在程序执行时进行优化,因此它能够根据当前的执行上下文和运行时信息进行更精细的优化。例如:

  • 基于热点代码的优化:JIT 会识别程序中的热点(频繁执行的代码区域)并对这些区域进行专门优化。
  • 动态分析:JIT 能够根据程序的实时性能数据调整优化策略。

处理器优化

现代处理器在执行指令时,也会进行自己的重排序。这是为了更有效地利用处理器资源,如执行单元、寄存器和缓存。处理器级的指令重排序基于以下原则:

  • 并行执行:处理器会尝试并行执行多个独立的指令,以提高执行效率。
  • 流水线优化:处理器使用流水线技术来执行指令。通过重排序,处理器可以减少流水线阻塞和等待时间。
  • 数据依赖性和冒险:处理器会分析指令之间的数据依赖性,确保重排序不会影响程序的正确执行。

重排序数据依赖性

如果两个操作访问同一个变量,且这两个操作中有一个为写操作,此时这两个操作之间就存在数据依赖性。数据依赖分下列三种类型:

名称示例说明
写后读a=1;b=a;写一个变量后,再读这个变量
写后写a=1;a=2;写一个变量后,再写这个变量
读后写a=b;b=1;读一个变量后,再写这个变量

上面三种情况,只要重排序两个操作的执行顺序,程序的执行结果就会被改变。

硬件层的内存屏障

Intel硬件提供了一系列的内存屏障,主要有:

  1. lfence:load fence,读屏障指令。在lfence指令前的读操作必须在lfence指令后的读操作前完成。即读串行化。
  2. sfence:save fence,写屏障指令。在sfence指令前的写操作必须在sfence指令后的写操作前完成。即写串行化。
  3. mfence:modify/mix fence,混合屏障指令,是一种全能型的屏障。在mfence指令前的读写操作必须在mfence指令后的读写操作前完成。即读写串行化。
  4. Lock前缀,Lock不是一种内存屏障,但是它能完成类似内存屏障的功能。Lock会对 CPU总线和高速缓存加锁,可以理解为CPU指令级的一种锁。它后面可以跟ADD, ADC, AND, BTC, BTR, BTS, CMPXCHG, CMPXCH8B, DEC, INC, NEG, NOT, OR, SBB, SUB, XOR, XADD, and XCHG等指令。

不同硬件实现内存屏障的方式不同,Java内存模型屏蔽了这种底层硬件平台的差异,由 JVM来为不同的平台生成相应的机器码。 JVM中提供了四类内存屏障指令:

屏障类型指令示例说明
LoadLoadLoad1; LoadLoad; Load2保证load1的读取操作在load2及后续读取操作之前执行
StoreStoreStore1; StoreStore; Store2在store2及其后的写操作执行前,保证store1的写操作已刷新到主内存
LoadStoreLoad1; LoadStore; Store2在stroe2及其后的写操作执行前,保证load1的读操作已读取结束
StoreLoadStore1; StoreLoad; Load2保证store1的写操作已刷新到主内存之后,load2及其后的读操作才能执行

内存屏障,又称内存栅栏,是一个CPU指令,它的作用有两个:
一是保证特定操作的执行顺序
二是保证某些变量的内存可见性(利用该特性实现volatile的内存可见性)
由于编译器和处理器都能执行指令重排优化,如果在指令间插入一条Memory Barrier则会告诉 编译器和CPU,不管什么指令都不能和这条Memory Barrier指令重排序,也就是说通过插 入内存屏障禁止在内存屏障前后的指令执行重排序优化。
Memory Barrier的另外一个作用是强制刷出各种CPU的缓存数据,因此任何CPU上的线程都能读取到这些数据的最新版本。
总之,volatile变量正是通过内存屏障实现其在内存中的语义,即可见性和禁止重排优化。 下面看一个非常典型的禁止重排优化的例子DCL,如下:来看一个单例模式

public class Singleton {private static Singleton instance;private Singleton(){}private static Singleton getInstance() {// 第一次检查if (instance == null) {synchronized (Singleton.class) {if (instance == null) {//多线程环境下可能出问题instance = new Singleton();}}}return instance;}
}

这段代码在单线程环境下并没有什么问题,但如果在多线程环境下就可以出现线程安全问题。
原因在于instance = new Singleton(); 这个操作不是原子性的, 它由多个操作构成,如下图:
在这里插入图片描述
查看字节码文件,发现一个new操作,在内存中经过了4步:

1. new 创建对象:申请内存空间,创建一个新的Singleton实例。
2. dup 复制引用:复制栈顶刚刚创建的Singleton实例引用,并将其圧入栈顶。
3. invokespecial 调用构造函数:调用Singleton的无参构造函数来初始化对象。
4. putstatic 赋值给静态字段:将栈顶刚刚初始化好的Singleton实例引用赋值给静态字段intance。

由于步骤3和步骤4可能会重排序,如下:

1. new
2. dup
3. putstatic //设置instance指向刚分配的内存地址,此时instance!=null,但是对象还没有初始化完成!
4. invokespecial

由于步骤3和步骤4不存在数据依赖关系,而且无论重排前还是重排后程序的执行结果在单线程中并没有改变,因此这种重排优化是允许的。但是指令重排只会保证串行语义的执行的一致性(单线程),但并不会关心多线程间的语义一致性。所以当一条线程访问instance 不为null时,由于instance实例未必已初始化完成,也就造成了线程安全问题。
那么该如何解决呢,使用volatile禁止instance变量被执行指令重排优化即可。

    private volatile static Singleton instance;

指令重排的代码验证

package org.hbin.jmm;/*** @author* @Date* @Description 指令乱排证明实力 出现0,0则说明有乱排现象。*/
public class Disorder {private static int x = 0, y = 0, a = 0, b =0;public static void main(String[] args) throws InterruptedException {int i = 0;while(true) {i++;x = 0; y = 0; a = 0; b = 0;Thread t1 = new Thread(() -> {//由于线程t1先启动,可以根据自己电脑性能调整等待时间,让它等一等线程t2.//shortWait(100000);a = 1;x = b;});Thread t2 = new Thread(() -> {b = 1;y = a;});t1.start();t2.start();t1.join();t2.join();if(x == 0 && y == 0) {System.out.printf("第%d次(%d, %d)\n", i, x, y);break;}}}
}

本地运行两次的结果如下:
在这里插入图片描述
在这里插入图片描述

好处

在程序执行过程中,并非所有指令都需要按照代码中的严格顺序来执行。有些指令之间是相互独立的,这就意味着它们可以在不影响程序最终结果的情况下,改变执行顺序。这种重排序可以更有效地利用处理器资源,具体体现在以下几个方面:

减少管道阻塞

现代处理器普遍采用流水线技术来提高指令执行效率。流水线技术将指令执行分解为多个步骤,每个步骤由不同的处理器部件完成。这样,多个指令可以同时处于不同的执行阶段,从而并行处理。然而,流水线可能会因为某些指令等待必要资源(如数据或执行单元)而暂停,这称为管道阻塞。
通过指令重排序,处理器可以调整指令的执行顺序,使得正在等待某些资源的指令不会阻碍其他指令的执行。这样做可以减少流水线的停顿时间,从而提高处理器的整体效率。

提高缓存利用率

缓存是一种快速的内存,用于存储处理器频繁访问的数据。如果处理器需要的数据不在缓存中,就会产生缓存未命中,需要从较慢的主内存中获取数据,这会导致延迟。
通过重排序数据存取指令,处理器可以优化数据的缓存利用率。例如,它可能会提前执行某些数据读取指令,确保当数据真正需要时它们已经在缓存中。同样,它也可以推迟写入操作,以减少对缓存的频繁更新。

利用并行执行单元

多核处理器可以同时执行多个指令。即使在单核处理器上,也经常有多个执行单元(如算术逻辑单元、浮点单元等)可以同时工作。
指令重排序使得处理器能够更好地利用这些并行执行单元。通过重排,处理器可以同时执行原本在程序中不相邻的指令,只要这些指令之间没有直接的依赖关系。这种并行性大大提高了执行效率,特别是在执行大量独立计算的应用程序时。

指令重排序带来的好处主要集中在性能提升和更有效地利用硬件资源两个方面。下面详细解释这些好处:

性能提升

  • 减少执行时间:通过重排序指令,处理器可以减少等待时间,例如等待数据从内存中加载。这是因为可以先执行与当前等待操作无关的其他指令。
  • 提高流水线效率:现代处理器通过流水线技术并行处理多个指令。重排序可以减少流水线中的空闲周期,因此更多的指令可以同时处于不同的执行阶段,从而提高整体的处理速度。
  • 并行处理加速:在多核处理器中,指令重排序可以使得不同的核心同时执行不相关的任务,从而在多任务处理和并行计算中取得更高的性能。

更好地利用硬件资源

  • 优化缓存使用:重排序可以优化内存访问模式,提前加载数据到缓存或推迟写操作,从而减少缓存未命中的情况。这样做可以减少从主内存获取数据的次数,提高数据访问速度。
  • 利用多核优势:在多核处理器上,指令重排序可以分散计算负载,使得多个核心可以更有效地协同工作。例如,可以将计算密集型和I/O密集型任务分配给不同的核心,以提高整体效率。
  • 适应现代处理器架构:现代处理器如超标量处理器,能够在每个时钟周期内发起多个指令。指令重排序使得这些处理器可以更充分地利用其并行执行能力。

问题

指令重排序虽然在提高程序性能和资源利用率方面带来了显著的好处,但它也引入了一些问题,特别是在多线程环境下。以下是这些问题的详细解释以及Java为解决这些问题提供的解决方案:

内存可见性问题

问题描述:在多线程环境下,由于每个线程可能在不同的处理器上运行,每个处理器都有自己的缓存。指令重排序可能导致一个线程对共享变量的修改对其他线程不可见。
影响:这会导致线程之间看到的共享数据状态不一致,从而产生难以预测和调试的错误。

编程复杂性增加

问题描述:为了正确地管理多线程之间的内存可见性和指令顺序,程序员需要对并发编程中的内存模型有深入的理解。
影响:这增加了编程的复杂性,特别是在处理共享数据和同步问题时。

调试困难

问题描述:由于指令重排序,程序的实际执行顺序可能与源代码中的顺序不一致。
影响:这使得调试多线程程序变得更加困难,因为观察到的行为可能与预期不符。

解决方案:Java内存模型(JMM)和关键字

Java内存模型(JMM):

JMM定义了线程和主内存之间的交互规则,确保了在多线程环境中对共享变量的访问和更新的一致性。
JMM解决了重排序可能导致的内存可见性问题,确保了在某个线程写入的值对其他线程可见。

关键字 volatile:

volatile是Java虚拟机提供的轻量级的同步机制。

  • volatile关键字有两个作用

    • 保证被volatile修饰的共享变量对所有线程总数可见的,也就是当一个线程修改了一个被volatile修饰共享变量的值,新值总是可以被其他线程立即得知。
    • 禁止指令重排序优化。
  • volatile的可见性
    关于volatile的可见性作用,我们必须意识到被volatile修饰的变量对所有线程总是立即可见的,对volatile变量的所有写操作总是能立刻反应到其他线程中

  • volatile无法保证原子性

  • volatile禁止指令重排
    volatile关键字另一个作用就是禁止指令重排优化,从而避免多线程环境下程序出现乱序执行的现象。

关键字 synchronized:

synchronized关键字用于在某个对象上加锁,保证了多个线程在同一时刻只能有一个线程执行该代码块。
这不仅解决了多线程之间的同步问题,而且确保了锁内的操作对其他线程是可见的,因为在锁释放时会将对共享变量的修改刷新到主内存。

总结

指令重排序是一种复杂但非常有效的优化技术。它使得处理器能够更加智能地利用自身的各种资源,如流水线、缓存和并行执行单元,从而提高整体性能。然而,这种优化也带来了额外的挑战,尤其是在多线程编程中,开发者需要对这种机制有所了解,以确保程序的正确性和效率。

参考

  • Java中的指令重排详解
  • 深入理解 Java 内存模型(二)——重排序

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/405889.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Pinia

搭建pinia环境 1.引入依赖 npm i pinia 2.在main.ts中引入pinia 准备一个基本的效果 <template><h2>测试一下pinia</h2><br><span>当前求和为&#xff1a;{{ sum }}</span><br><select v-model.number"n"><o…

2 kubeflow系统架构 学习笔记

1 Kubeflow生态系统 2 生态系统说明 2.1. Hardware&#xff08;硬件层&#xff09; 提供计算资源的底层硬件支持。GPU&#xff08;如NVIDIA&#xff09;通常用于加速机器学习和深度学习的计算任务&#xff0c;而Intel和AMD则可能提供CPU计算资源。 2.2. Infrastructure&…

[OC]萝卜圈玩行车记录仪

图1-1&#xff0c;你的手动小车 代码是 #机器人驱动主程序 #请在main中编写您自己的机器人驱动代码 import tkinter as tk import turtle v0 # 速度 accFalse;slowFalse;leftFalse;rightFalse # 按键状态 step0.5 # 一次速度变化量 def keyup_press(event):global acc;accTru…

「数组」希尔排序 / 区间增量优化(C++)

目录 概述 思路 核心概念&#xff1a;增量d 算法过程 流程 Code 优化方案 区间增量优化 Code(pro) 复杂度 概述 我们在「数组」冒泡排序|选择排序|插入排序 / 及优化方案&#xff08;C&#xff09;中讲解了插入排序。 它有这么两个特点&#xff1a; ①待排序元素较…

[Qt][Qt 文件]详细讲解

目录 1.输入输出设备类2.文件读写类3.文件和目录信息类 1.输入输出设备类 在Qt中&#xff0c;⽂件读写的类为QFile&#xff0c;其⽗类为QFileDevice QFileDevice提供了⽂件交互操作的底层功能QFileDevice的⽗类是QIODevice&#xff0c;其⽗类为QObject QIODevice是Qt中所有I/O…

【企业高性能web服务器】

目录 一、Nginx 介绍1、 Nginx 功能介绍2、基础特性3、Nginx 模块介绍 二、Nginx 编译安装1、编写systemd服务 三、平滑升级和回滚1、平滑升级的流程2、升级2、回滚 四、 Nginx 核心配置详解1、实现 nginx 的高并发配置2、Nginx 账户认证功能3、nginx作为下载服务器配置 五、re…

QT-监测文件内容重复工具)

QT-监测文件内容重复工具 一、演示效果二、核心代码三、下载链接 一、演示效果 二、核心代码 #include "widget.h" #include "ui_widget.h" #include <QDir> #include <QFile> #include <QCryptographicHash> #include <QApplicatio…

如何用Python构建高校爬虫与k-means算法实现专业评分可视化分析

&#x1f34a;作者&#xff1a;计算机毕设匠心工作室 &#x1f34a;简介&#xff1a;毕业后就一直专业从事计算机软件程序开发&#xff0c;至今也有8年工作经验。擅长Java、Python、微信小程序、安卓、大数据、PHP、.NET|C#、Golang等。 擅长&#xff1a;按照需求定制化开发项目…

多线程、多进程,还是异步?-- Python 并发 API 如何选择

如何选择正确的 Python 并发 API模块 &#xff1f; Python 标准库提供了三种并发 API &#xff0c; 如何知道你的项目应该使用哪个 API&#xff1f; 在本教程将带逐步了解各API的特性、区别以及各自应用场景&#xff0c;指导你选择最合适的并发 API。 多线程、多进程&#xff0…

F1 F4 Fn lock 指示灯不亮 联想笔记本 thinkpad

问题描述&#xff1a;F1 F4 Fn lock 指示灯开机的时候亮&#xff0c;但是使用的时候虽然能够发挥正常功能&#xff0c;但是指示灯一直熄灭&#xff0c;指示灯不亮。 电脑型号&#xff1a;联想笔记本 thinkpad E14 Gen 2 。本方案应该适用于所有联想电脑。 解决方法&#xff1a;…

鸿蒙内核源码分析(静态链接篇) | 完整小项目看透静态链接过程

下图是一个可执行文件编译&#xff0c;链接的过程. 本篇将通过一个完整的小工程来阐述ELF编译&#xff0c;链接过程&#xff0c;并分析.o和bin文件中各区&#xff0c;符号表之间的关系.从一个崭新的视角去看中间过程. 准备工作 先得有个小工程&#xff0c;麻雀虽小&#xff0…

基于数据复杂度的数据库选型

数据模型的选择对于 IT 系统的开发至关重要&#xff0c;它不仅决定了数据存储和处理的方式&#xff0c;影响系统的性能、扩展性以及维护性等。本质上来说&#xff0c;不同的数据模型反映了我们对业务问题的不同思考和抽象程度。 今天我们从不同数据模型对于复杂数据和关系的支…

【Qt】常用控件QCalendarWidget的使用

常用控件QCalendarWidget的使用 QCalendarWidget表示一个日历 核心属性 属性说明 selectDate 当前选中的⽇期 minimumDate 最⼩⽇期 maximumDate 最⼤⽇期 firstDayOfWeek 每周的第⼀天(也就是⽇历的第⼀列) 是周⼏. gridVisible 是否显⽰表格的边框 selectionMode…

python3爬虫(未完结)

一个简单的例子&#xff1a;爬取自己的csdn博客&#xff0c;统计每篇博客的访问量&#xff0c;制作一个柱状图&#xff0c;以访问量从大到小的方式显示。 1. 首先从“个人主页”爬取所有所有文章的链接 1.1 打开个人主页&#xff0c;右键->检查&#xff1a;可以看到每篇文章…

类和对象(下)(2)

类和对象&#xff08;下&#xff09;(2) static成员 • ⽤static修饰的成员变量&#xff0c;称之为静态成员变量&#xff0c;静态成员变量⼀定要在类外进⾏初始化。 • 静态成员变量为当前类的所有对象所共享&#xff0c;不属于某个具体的对象&#xff0c;不存在对象中&#…

HiveSQL实战——大厂面试真题

一、字节跳动 最高峰同时直播人数 https://blog.csdn.net/SHWAITME/article/details/135918264 0 问题描述 有如下数据记录直播平台主播上播及下播时间&#xff0c;根据该数据计算出平台最高峰同时直播人数。 ------------------------------------------------------ | us…

CTFHUB | web进阶 | JSON Web Token | 无签名

一些JWT库也支持none算法&#xff0c;即不使用签名算法。当alg字段为空时&#xff0c;后端将不执行签名验证 开启题目 账号密码随便输&#xff0c;登录之后显示只有 admin 可以获得 flag 在此页面抓包发到 repeater&#xff0c;这里我们需要用到一个 Burp 插件&#xff0c;按图…

Linux信号机制探析--信号的产生

&#x1f351;个人主页&#xff1a;Jupiter. &#x1f680; 所属专栏&#xff1a;Linux从入门到进阶 欢迎大家点赞收藏评论&#x1f60a; 目录 &#x1f4da;信号什么是信号&#xff1f;为什么要有信号&#xff1f;查看Linux系统中信号 &#x1f388;信号产生&#x1f4d5;kill…

【流媒体】RTMPDump—RTMP_ConnectStream(创建流连接)

目录 1. RTMP_ConnectStream函数1.1 读取packet&#xff08;RTMP_ReadPacket&#xff09;1.2 解析packet&#xff08;RTMP_ClientPacket&#xff09;1.2.1 设置Chunk Size&#xff08;HandleChangeChunkSize&#xff09;1.2.2 用户控制信息&#xff08;HandleCtrl&#xff09;1…

JAVA面试汇总

JAVA面试 JAVA面试精华 面试精华 互联网面试真题