指令重排相关

指令流水线所带来的一些问题

结构冒险

流水线中出现硬件资源竞争
数据冒险

流水线中后面的指令需要等待前面指令完成数据的读写
控制冒险

流水线需要个怒前面指令的执行结果来决定下一步去哪儿之行

为了解决指令流水线的数据冒险所带来的停顿、CPU 搞了个乱序执行。

在遇到数据冒险时、指令调度单元从中选择一些没有数据依赖的指令来执行。后面再进行结果回写时、才按原有顺序进行回写。

这就是 CPU 带来的乱序执行。

Java 编译器处于 “优化” 的目的、按照某种规则将指令重新排序（尽管有时候看起来像乱序）

这就是编译器带来的乱序。

因为 CPU 缓存同步顺序带来伪乱序。

在这里插入图片描述

以上即是导致重排序的三种原因。

在这里插入图片描述

我们先来看看 CPU 缓存所带来的一些问题

比如现在两个 CPU 都对变量 i 进行 +1、现在 i 在内存中的值为 0 (非并发 + 1)

那么

CPU1 从内存中将 i 值放入到自己的缓存中
CPU1 对 i 值进行 +1、并将结果写到自己的缓存中
CPU2 中的缓存中已经存在i的值了(可能是上一次读取缓存的)
CPU2 对 i 值进行 +1、并将结果写到自己的缓存中
CPU1和 CPU2 将自己缓存的 i 写回到内存中

此时 i 被加了两次、但是结果只有一次的的值。

缓存一致性协议 MESI

在这里插入图片描述

我们在来看看上面这个流程

CPU1 从内存中将 i 值放入到自己的缓存中、此时该缓存行的状态位 S （CPU2 中也有该缓存、状态为 S）
CPU1 发出失效命令、告知 CPU2 将它的缓存行状态置为I失效。CPU2 将 i 的缓存行状态更新为 I 并且回复 CPU1 ack 消息
CPU1 收到 ack 消息之后将缓存行的状态由 S 变为 E
然后CPU1 对 i 值进行 +1、并将结果写到自己的缓存中、此时状态变为 M
CPU2 对 i 值进行 +1 前发现 i 的缓存行位 I、发起读取、CPU1 收到请求、先将 i 刷回到内存、状态变为 E 然后再发 i 的值给 CPU2 然后状态变为 S。然后 CPU2 再发起失效命令
CPU2 对 i 值进行 +1、并将结果写到自己的缓存中
CPU2 将自己缓存的 i 写回到内存中

（事实上获取i和失效命令会同时发出、invalidate read）

那么最终 i 会被正确的+1

上面这里并非是一个并发+1的场景、也可以是一个串行的场景、只不过第一次和第二次的+1分配到不同的 cpu 上。

通过 MESI 协议、貌似解决了缓存一致性的问题。

但是我们每次都需要等待到其他 CPU 的 ack 才能去执行指令、这样子太慢了、并且其他 CPU 也可能并不是马上会去执行失效请求的、因为可能它可能正在执行其他高优先级的指令。

所以又引入了另一个组件、store buffer

在这里插入图片描述

它的作用很简单

CPU1 发起失效请求之后、CPU1 不会等其他 CPU 的 ack、而是马上执行指令、然后将执行的结果存放在 store buffer。由 store buffer 等待其他 CPU 回复 ack 、然后才将执行结果刷回到 CPU 的

但是这样子也会带来问题、比如我们下面的这段代码(ARM 架构上)

    int x = 0;int y = 0;private void write(){x = 1;y = 1;}private void read(){System.out.println(y);System.out.println(x);}

假设 x 的值已经被更新在 store buffer 了、这个时候 cpu 缓存里面 x 的值还是 0

这个时候 cpu 就会继续执行 y=1 假如这个时候 y

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/79719.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

指令重排相关

相关文章

Permute 3 for mac音视频格式转换

通过cpolar内网穿透发布网页测试

以太网帧格式与吞吐量计算

认识FFMPEG框架

MaxCompute发布按量付费闲时版，计算成本最高节省66.66%！

【云原生】Docker中容器管理常用所有命令

vscode自动添加注释说明

Golang之路---03 面向对象——接口与多态

华为harmonyos4.0鸿蒙4.0安装谷歌服务框架Play商店,解决从服务器检索信息时出错

Flink State 和 Fault Tolerance详解

opencv-34 图像平滑处理-2D 卷积 cv2.filter2D()

CASAIM与迈普医学合作，基于CT数据三维重建和设计，在医疗辅具研究开发中实现高精度三维建模和偏差比对

Zhang-Suen骨架提取算法

政府大数据资源中心建设总体方案[56页PPT]

decimal类型在MySQL中的正确使用 (长度和小数点)

数据采集的方法有哪些？

C++QT教程1——QT概述（下载与安装）

侯捷 C++面向对象编程笔记——9 复合委托

十四、ESP32播放音乐

《向量数据库指南》——Rockset 为实时数据库添加向量嵌入支持（一）