【MySQL性能优化】- 一文了解MVCC机制

MySQL理解MVCC

😄生命不息,写作不止
🔥 继续踏上学习之路,学之分享笔记
👊 总有一天我也能像各位大佬一样
🏆 博客首页   @怒放吧德德  To记录领地
🌝分享学习心得,欢迎指正,大家一起学习成长!
转发请携带作者信息 @怒放吧德德 @一个有梦有戏的人

在这里插入图片描述

文章目录

  • MySQL理解MVCC
    • 简介
    • 理解MVCC
      • undo日志版本链
      • read-view机制
      • 版本链对比规则
    • 案例理解
      • 可重复读
        • 时刻6查询
        • 时刻9查询
        • 时刻13查询
        • 时刻14查询
      • 读已提交
        • 时刻9查询
        • 时刻13查询
    • 总结

转发请携带作者信息 @怒放吧德德 @一个有梦有戏的人

简介

多版本并发控制(MVCC,Multi-Version Concurrency Control)是一种常用于数据库管理系统的并发控制方法,MySQL数据库中的InnoDB存储引擎就实现了这种技术。MVCC通过在每个事务中对数据进行版本控制来实现多个事务的高效并发执行,增强了数据库的读写性能,并且减少了锁的需求。

理解MVCC

在MySQL的可重复读的隔离级别中,同样的SQL查询语句在同一个事务中,查出来的数据是一致的,其他事务对这些数据进行修改,当前事务是不可见的。
这个隔离级别就是由MVCC机制来实现的。对一行数据并不会通过对读和写加互斥锁来保证隔离性,避免了频繁加锁互斥,而串行化隔离级别是通过读写互斥实现。

MySQL中读以提交和可重复读隔离级别都是通过MVCC。

undo日志版本链

undo日志版本链是指一行数据被多个事务依次修改后,为了保持数据修改之前版本的可访问性,InnoDB不会直接覆盖旧数据。会将数据的旧版本保存到undo日志中,并且用隐藏字段trx_id(事务id)和roll_pointer(回滚指针)将这些日志串联起来成为一组历史版本链。

这个undo日志不只是保存单个版本,而是随着时间推移和更多事务的执行,可能保存同一数据项的多个历史版本。这些历史版本形成一个链条,称为版本链。当需要某个记录的历史状态时,可以通过回滚undo日志中的操作来获取旧版本数据,或者在不同隔离级别的读取事务中适当地提供旧数据,以此来保证一致性读取。

如下图,可以很好的理解什么是undo日志版本链
在这里插入图片描述

如上图,我们在插入数据的时候,会开启事务,所以会带着一个事务id,接着对这条数据进行修改,MySQL也会将修改的数据加上事务id以及回滚指针(roll_pointer),并且由这个回滚指针来指向上一个事务的旧数据版本,这样就构成了日志版本链。

read-view机制

read-view机制是InnoDB存储引擎实现MVCC的一种来创建一致性读取视图的技术。主要作用是用来确保可重复读和读已提交的隔离级别下,事务能够读到一致的数据快照,即使其他事务在对数据进行修改。
当一个事务想要执行一致性读取操作时候,InnoDB通过多版本并发控制(MVCC)来保存数据的多个版本,每个版本都有一个唯一的事务ID(trx_id)与之关联。read-view机制就会创建一个视图,这个视图是由执行查询时所有未提交的事务id数组组成(数组最小的事务id为min_trx_id)和已创建事务最大id为max_trx_id组成,还有一个creator_trx_id,用来表示生成该read-view的事务ID。
在这里插入图片描述

以上图示read-view机制的区间。

版本链对比规则

1、如果trx_id<min_trx_id,表示生成该版本的事务在事务开始之前已经提交,则该版本对事务可见。
2、如果trx_id>max_trx_id,表示生成该版本的事务在事务开始后才开始,则该版本对事务不可见。
3、如果min_trx_id≤trx_id≤max_trx_id,则需要判断是否在视图数组trx_ids中。

  • 1)、如果trx_id在视图中,表示生成该版本是还没提交的事务,因此该版本对事务不可见。
  • 2)、如果trx_id不在视图中,表示生成该版本的事务是已提交的,因此该版本对事务可见。

对于删除的情况,会将版本链的最新数据复制一份,然后将trx_id修改成删除操作的trx_id,同时会在记录的头信息的标记位(delete_flag)上设置true,用来表示已经删除,在查询时,如果对应记录的delete_flag为true,则表示已经被删除,就不会返回数据。

案例理解

接下来我们通过一个案例来理解。(本次通过上篇文章所用到的数据表来作为案例)
我们假设有三个事务,根据时间顺序会执行不同操作(这里在如下的excel图中会有时刻来标记),以及提交的时间点不同,由此案例来了解MVCC机制是如何通过undo日志版本链和read-view机制工作的。并且介绍可重复读以及读已提交的MVCC机制。

可重复读

首先,假设我们插入一条新的数据(id=12)。然后我们有几个事务在执行各种操作,并且都有相应的事务id,具体的执行过程如下的excel图,用来明确表示各个事务在时间戳的执行流程。
在这里插入图片描述

注:这里需要注意一下,begin/start transation命令并不是一个事务的起点,具体真正开启事务是在执行到第一个修改操作InnoDB表的语句,这时候才会有事务id,MySQL内部是按照事务的启动顺序来分配事务id的。

时刻6查询

首先来看一种情况,事务id:100和101执行了更新操作,但是没提交,事务id:102对id=12进行了更新,并且提交事务,我们通过另一个会话进行查询id=12的这条记录,可见查出的first_name是102更新的数据。
在这里插入图片描述

我们来深入了解这MVCC机制,是如何从undo日志版本链中进行比对获取这个102所更新的数据。
如下图,首先我们需要知道read-view所选中的min_trx_id和max_trx_id。通过当前系统中活跃的最小事务id,从表格中可以看出min_trx_id是事务100,已创建事务最大id为max_trx_id是事务102,100,101是未提交的活跃事务。read-view:[100, 101], 102。

read-view {m_ids: [100, 101],   // 事务100和事务101均未提交min_trx_id: 100,     // 活跃未提交事务中最小的事务IDmax_trx_id: 102,     // 已创建事务最大事务的IDcreator_trx_id: 102  // 创建这个read-view的当前事务的ID
}

在这里插入图片描述

从日志版本链中看出事务102修改后会将回滚指针指向事务id为60上。然后就是进行版本链比对,当前row的trx_id=102,刚好是等于max_trx_id,接着需要判断这个102事务id是否在视图上,显然102是不在[100,101]中,所以就会认为这条数据是可见的,于是输出的值就是102这个事务的数据。

时刻9查询

我们接着往下走,事务id为100的事务执行了两次对id为12的记录进行更新,两次更新之后,事务还没提交,此时select 1会话又进行了一次查询。此时的查出来的数据依然是Liyongde,依旧是事务102更新的数据。
在这里插入图片描述

我们再来分析这个过程。此时如下图,read-view:[100,101], 102。
在这里插入图片描述

根据版本链,最新的数据是事务100更新的数据“Li2”,但是根据版本链规则判断,事务id=100属于视图数组里面,并且是没有提交的,于是就往版本链指向的版本进行判断,直到到达事务id=102的这条记录,不属于视图数组中,认为是可见的,因此返回的数据是“Liyongde”。

时刻13查询

接着看下一种情况,事务100提交了,随即事务101进行了一次更新,并且不提交,此时数据库的数据肯定是“Li2”,之后select 1进行查询id=12的记录,此时的read-view又是否会发生变化呢?得到的结果又是什么呢?
在这里插入图片描述

可见查出来的数据还是“Liyongde”,这是符合可重复读隔离级别的。还是需要通过undo日志版本链的规则来进行研究为什么得到的数据还是事务102提交的数据。
先确定视图数组,在可重复读级别下,同事务中的read-view是不会发生变化。所以依然是[100,101], 102。
在这里插入图片描述

此时数据库id=12是“Li2”,但是查出来的数据还是“Liyongde”,这是MVCC机制通过日志版本链的比对规则,从而达到可重复读的隔离机制。首先当前的trx_id=101,而101处于min_trx_id与max_trx_id之间,进一步判断是在视图里面,所以不可见,依此类推直到102不在视图中,则得到的记录是“Liyongde”。因为一致性视图在同事务并不会发生变化,因此,即便直到100,101,102三个事务全部都提交之后,Select 1查询得到的数据依旧是“Liyongde”。

注:在可重复读级别下,同事务中的read-view是不会发生变化。
这是因为可重复读的设计原则就是确保在同一个事务执行过程中,所看到的数据总是与事务在启动时看到的数据保持一致。当事务启动时,它会创建一个read-view,这个read-view在事务的整个生命周期内都是固定的,不会随着其他事务的提交或修改而改变。这样,即使在事务执行期间有其他事务修改了数据,当前事务所看到的数据仍然与启动时一致,从而保证了数据的可重复读性。因此,在可重复读的隔离级别下,同一个事务的read-view是不会变化的。

时刻14查询

如果此时有个新的事务Select 2,这个事务也是没有分配事务id,一直下来也没有执行查询操作,直到100,102都提交之后在执行了查询。那么此时的查询结果会是什么?
在这里插入图片描述

一致性视图(read-view)的状态取决于事务的启动时刻。根据excel图,我们可以知道创建的read-view数据以及日志版本链,如下图。
在这里插入图片描述

根据版本连的对比,可以得出此时事务查出的数据是“Li2”。当数据库事务开启之后的头一次查询,实际上read-view就已经创建了。我们通过以下例子来测试这个结果。
在这里插入图片描述

因为1是在修改之前进行了查询,此时就已经创建了一致性视图,接着进行修改值,哪怕已经提交了,查出来的结果依然是之前的数据;而2是在修改提交之后才进行的查询,此时创建的一致性视图就已经是更新过的事务数据。

读已提交

如上的案例,我们知道,在可重复读的隔离机制下,read-view是在开启事务的第一次查询就已经创建了,并且是直到事务的结束之前是不会发生变化。而接下来要介绍的读已提交隔离级别就有点不同,主要是read-view的创建,在读已提交的隔离级别下,read-view会在每次的查询的时候进行变化。

时刻9查询

根据上面的excel图,在时刻9的查询中,我们可以得出此时创建的read-view,事务102是提交的,事务100和101都是活跃未提交的事务,所以活跃数组则是[100, 101],当前事务为102,min_trx_id=100,max_trx_id=102。
接着就是一样的进行日志版本对比,对比规则与上文提到的方式是一致的,102不在视图中,所以数据可见,最后返回的是“Liyongde”。

时刻13查询

接着再来看看时刻13的情况,这个时候事务100也提交了,因为读已提交的read-view会在每次的查询发生变化,那么此时活跃事务就剩下了101,所以数组是[101],当前事务为102,min_trx_id=101,max_trx_id=102。
接着就是判断了,根据规则进行比对,最新的版本链中是事务id101,其是落在视图中,所以是不可见的数据,接着往上个版本看,事务id100是小于min_trx_id,因此此条数据是可见的。
在这里插入图片描述

总结

MVCC是一种用于解决数据库并发问题的乐观锁技术,多版本并发控制通过保存数据在某个时间点的快照来实现。换句话说,读操作不会阻塞写操作,写操作也不会阻塞读操作,以此来提高数据库性能。在每次对数据的操作,都用在undo日志版本链中进行。

👍创作不易,如有错误请指正,感谢观看!记得点赞哦!👍

转发请携带作者信息 @怒放吧德德 @一个有梦有戏的人

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/276252.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# ListView 控件使用

1.基本设置 listView1.Columns.Add("序号", 60); //向 listView1控件中添加1列 同时设置列名称和宽度listView1.Columns.Add("温度", 100); //下同listView1.Columns.Add("偏移", 100);listView1.Columns.Add("分割", 50);listView1…

QT----计算器

目录 1 搭建标准界面2、 逻辑编写2.1 初始化 github链接&#xff1a;基于qt的计算器 更多内容可以点击这里查看个人博客&#xff1a;个人博客 1 搭建标准界面 按照下图搭设界面 修改样式让这计算器看起来更像一点&#xff0c;同时对按钮分组进行样式编辑&#xff0c;添加字符…

导入fetch_california_housing 加州房价数据集报错解决(HTTPError: HTTP Error 403: Forbidden)

报错 HTTPError Traceback (most recent call last) Cell In[3], line 52 from sklearn.datasets import fetch_california_housing3 from sklearn.model_selection import train_test_split ----> 5 X, Y fetch_california_housing(retu…

IDEA编写各种WordCount运行

目录 一、编写WordCount(Spark_scala)提交到spark高可用集群 1.项目结构 2.导入依赖 3.编写scala版的WordCount 4.maven打包 5.运行jar包 ​6.查询hdfs的输出结果 二、本地编写WordCount(Spark_scala)读取本地文件 1.项目结构 2.编写scala版的WordCount 3.编辑Edit …

根据服务器系统选择对应的MySQL版本

1. 根据服务器系统选择对应的MySQL版本 MySQL有多个版本&#xff0c;选择对应的版本&#xff0c;重点信息是Linux的GLIBC版本号&#xff0c;Linux的版本、系统位数。 1.1 查看Linux的GLIBC版本号 通常libc.so会支持多个版本&#xff0c;即向前兼容&#xff0c;查看该文件中…

Hubspot 2023年推荐使用的11个AI视频生成器

视频是任何营销活动不可或缺的一部分&#xff1b;然而&#xff0c;如果你不懂编辑或时间紧迫&#xff0c;它们可能会很乏味&#xff0c;很难创建。一只手从电脑里伸出来&#xff0c;拳头碰到另一只手&#xff1b;代表AI视频生成器。 幸运的是&#xff0c;你可以利用许多人工智能…

kibana新增查看更新删除es中的数据

登录kibana&#xff0c;打开开发工具 写入数据 PUT test20240311/person/1 {"name": "张三","mobile":"13011111111" } 查询数据 GET /test20240311/person/_search {"query": {"term": {"mobile": {…

算法笔记之蓝桥杯pat系统备考(2)

算法笔记之蓝桥杯&pat系统备考&#xff08;1&#xff09; 文章目录 五、数学问题5.2最大公约数和最小公倍数5.2.1最大公约数5.2.2最小公倍数 5.3分数的四则运算5.3.1分数的表示与化简5.3.2分数的四则运算5.3.3分数的输出 5.4素数&#xff08;质数&#xff09;5.4.1[素数的…

java数据结构与算法刷题-----LeetCode47. 全排列 II

java数据结构与算法刷题目录&#xff08;剑指Offer、LeetCode、ACM&#xff09;-----主目录-----持续更新(进不去说明我没写完)&#xff1a;https://blog.csdn.net/grd_java/article/details/123063846 文章目录 1. 暴力回溯2. 分区法回溯 此题为46题的衍生题&#xff0c;在46题…

QTextToSpeech的使用——Qt

前言 之前随便看了几眼QTextToSpeech的帮助就封装使用了&#xff0c;达到了效果就没再管了&#xff0c;最近需要在上面加功能&#xff08;变换语速&#xff09;&#xff0c;就写了个小Demo后&#xff0c;发现不对劲了。 出现的问题 场景 写了个队列添加到语音播放子线程中&a…

一条 SQL 更新语句如何执行的

Server 层 存储引擎层 总流程 查询语句 连接器 查询缓存 分析器 优化器 执行器 更新语句 redo log&#xff08;节省的是随机写磁盘的 IO 消耗&#xff08;转成顺序写&#x…

Qt+FFmpeg+opengl从零制作视频播放器-3.解封装

解封装&#xff1a;如下图所示&#xff0c;就是将FLV、MKV、MP4等文件解封装为视频H.264或H.265压缩数据&#xff0c;音频MP3或AAC的压缩数据&#xff0c;下图为常用的基本操作。 ffmpeg使用解封装的基本流程如下&#xff1a; 在使用FFmpeg API之前&#xff0c;需要先注册API&a…

精简版 Obsidian 图床配置 PicGo+ gitee

精简版 Obsidian 图床配置 PicGo gitee 图床的作用 图床&#xff08;Image Hosting Service&#xff09;是一种在线服务&#xff0c;用于存储和托管用户上传的图片文件。用户可以将图片上传到图床服务器&#xff0c;并获得一个可访问的图片链接&#xff0c;然后可以在网页、博…

为什么要用scrapy爬虫库?而不是纯python进行爬虫?

为什么要用scrapy爬虫库&#xff1f;而不是纯python进行爬虫&#xff1f; Scrapy的优点Scrapy节省的工作使用纯Python编写爬虫的不足 Scrapy是一个使用Python编写的开源和协作的web爬虫框架&#xff0c;它被设计用于爬取网页数据并从中提取结构化数据。Scrapy的强大之处在于其广…

mysql 主从延迟分析

一、如何分析主从延迟 分析主从延迟一般会采集以下三类信息。 从库服务器的负载情况 为什么要首先查看服务器的负载情况呢&#xff1f;因为软件层面的所有操作都需要系统资源来支撑。 常见的系统资源有四类&#xff1a;CPU、内存、IO、网络。对于主从延迟&#xff0c;一般会…

加密货币在网络违法犯罪活动中的利用情况调查

一、调查背景 区块链基于分布式共识和经济激励等手段&#xff0c;在开放式、无许可的网络空间中&#xff0c;为价值的确立、存储、转移提供了新的解决方案。然而随着加密生态在过去若干年的快速发展&#xff0c;加密货币也越来越多地被用于各类风险活动&#xff0c;为网络赌博…

ES6(一):let和const、模板字符串、函数默认值、剩余参数、扩展运算符、箭头函数

一、let和const声明变量 1.let没有变量提升&#xff0c;把let放下面打印不出来&#xff0c;放上面可以 <script>console.log(a);let a1;</script> 2.let是一个块级作用域,花括号里面声明的变量外面找不到 <script>console.log(b);if(true){let b1;}//und…

el-table的border属性失效问题解决方案

目录 问题&#xff1a; 使用的代码&#xff1a; 官方文档的说明&#xff1a; 可能的问题所在&#xff1a; 关于使用了作用域插槽&#xff1a; a.自定义内容的样式覆盖&#xff1a; b.表格结构的改变&#xff1a; 解决方案&#xff1a; 通过css样式解决&#xff1a; 下面…

聚酰亚胺PI材料难于粘接,用什么胶水粘接?那么让我们先一步步的从认识它开始(一)

聚酰亚胺PI的基本概念 聚酰亚胺&#xff08;Polyimide&#xff0c;简称PI&#xff09;是一种重要的高性能聚合物材料。是指主链上含有酰亚胺环的一类聚合物&#xff0c;是综合性能最佳的有机高分子材料之一。它具有最高的阻燃等级&#xff08;UL-94&#xff09;&#xff0c;以及…

Editor.md-编辑器

这里写自定义目录标题 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题&#xff0c;有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个…