MySQL基础知识——MySQL事务

事务背景


什么是事务?

一组由一个或多个数据库操作组成的操作组,能够原子的执行,且事务间相互独立;

简单来说,事务就是要保证一组数据库操作,要么全部成功,要么全部失败。

注:MySQL是一个支持多引擎的系统,并不是所有的引擎都支持事务。

提到事务,你肯定会想到ACID(Atomicity、 Consistency、 Isolation、 Durability),那么什么是ACID呢?

  • 原子性(Atomicity):事务中的操作全部执行,或一个也不执行;
  • 隔离性(Isolation):事务的执行独立于其它事务,互不影响;(影响程度根据隔离级别而定)
  • 持久性(Durability):事务中的操作完成,则对数据库的影响不会变更,持久保存;
  • 一致性(Consistency):事务执行的结果是可预期的,同样的输入一定得出同样的输出;

保证数据一致性,是事务操作的最终目的(AID皆为此);

隔离性与隔离级别


当数据库上有多个事务同时执行的时候, 就可能出现脏读(dirtyread) 、 不可重复读(non-repeatable read) 、 幻读( phantom read) 的问题, 为了解决这些问题, 就有了“隔离级别”的概念。

在谈隔离级别之前, 你首先要知道, 隔离得越严实, 效率就会越低。 因此很多时候, 我们都要在二者之间寻找一个平衡点。

下面对SQL标准的事务隔离级别进行逐一介绍(隔离性由低到高):

  • 读未提交(read uncommitted): 一个事务还没提交时, 它做的变更就能被别的事务看到。
  • 读提交(read committed): 一个事务提交之后, 它做的变更才会被其他事务看到。
  • 可重复读(repeatable read): 一个事务执行过程中看到的数据, 总是跟这个事务在启动时看到的数据是一致的。 当然在可重复读隔离级别下, 未提交变更对其他事务也是不可见的。
  • 串行化(serializable): 顾名思义是对于同一行记录, “写”会加“写锁”, “读”会加“读锁”。 当出现读写锁冲突的时候, 后访问的事务必须等前一个事务执行完成, 才能继续执行。

其中“读提交”和“可重复读”比较难理解,下面用一个例子说明这几种隔离级别。

假设数据表T中只有一列, 其中一行的值为1, 下面是按照时间顺序执行两个事务的行为。

mysql> create table T(c int) engine=InnoDB; 
insert into T(c) values(1);

 

接下来,我们看一下在不同隔离级别下,事务A会有哪些不同的返回结果:

  • 若隔离级别是“读未提交”, 则V1的值就是2。 这时候事务B虽然还没有提交, 但是结果已经被A看到了。 因此, V2、 V3也都是2。
  • 若隔离级别是“读提交”, 则V1是1, V2的值是2。 事务B的更新在提交后才能被A看到。 所以, V3的值也是2。
  • 若隔离级别是“可重复读”, 则V1、 V2是1, V3是2。 之所以V2还是1, 遵循的就是这个要求:事务在执行期间看到的数据前后必须是一致的。
  • 若隔离级别是“串行化”, 则在事务B执行“将1改成2”的时候, 会被锁住。 直到事务A提交后,事务B才可以继续执行。 所以从A的角度看, V1、 V2值是1, V3的值是2。

在实现上,数据库里面会创建一个视图,访问的时候以视图的逻辑结果为准。

  • 在“可重复读”隔离级别下,这个视图是在事务启动时创建的,整个事务存在期间都用这个视图。
  • 在“读提交”隔离级别下,这个视图是在每个SELECT语句开始执行的时候创建的。

注1:“读未提交”隔离级别下直接返回记录上的最新值,所以没有视图概念。而“串行化”隔离级别下直接使用加锁的方式来避免并发访问。

注2:不同数据库其默认隔离级别有所差异。Oracle默认隔离界别为“读提交”,因此对于一些从Oracle迁移到MySQL的应用,为保证数据库隔离级别的一致,需要把MYSQL隔离级别设为“读提交”,MySQL默认隔离级别为“可重复读”。

事务隔离的实现


下面以“可重复读”隔离级别为例,介绍事务隔离是怎么实现的。

在MySQL中,实际上每条记录在更新的时候都会记录一条回滚操作。记录上的最新值,通过回滚操作,都可以得到前一个状态值。

假设一个值从1被按顺序改成了2、3、4,在回滚日志里面就会有类似下面的记录:

记录当前值是4,在查询记录时,不同时刻启动的事务会有不同的read-view。在视图A、B、C里面,这一个记录的值分别是1、2、4,同一条记录在系统中可以存在多个版本,就是数据库的多版本并发控制(MVCC);对于read-view A,要得到1,就必须将当前值依次执行图中所有的回滚操作得到。

同时你会发现, 即使现在有另外一个事务正在将4改成5, 这个事务跟read-view A、 B、 C对应的事务是不会冲突的。

问:回滚日志什么时候删除?

当没有事务再需要用到这些回滚段日志时,回滚日志会被删除。即当系统里没有比这个回滚日志更早的read-view的时候。(换句话说,回滚日志一般在当前视图所在事务中才会被用到)

问:为什么建议尽量不要使用长事务?

1)长事务表示系统存在很老的事务视图。这些事务可能访问数据库的任何数据,所以事务提交前,可能用到的回滚记录必须保留,导致回滚记录占用大量存储空间;

2)回滚日志跟数据字典一起放在ibdata文件中,即使长事务提交,回滚段被清理,文件也不会变小。我见过数据只有20GB,而回滚段有200GB的库。最终只好为了清理回滚段,重建整个库。( MySQL

3)长事务还占用锁资源,也可能拖垮整个库;

问:为避免长事务,业务开发和DBA分别应该采取哪些措施?

业务侧:

1)去掉没必要的事务,比如查询语句;

2)设置SQL执行超时时间;

DBA侧:

1)监控 information_schema.Innodb_trx表,设置长事务阈值,超过就报警/或者kill;

2)Percona的pt-kill这个工具不错,推荐使用;

3)在业务功能测试阶段要求输出所有的general_log,分析日志行为提前发现问题;

4)把innodb_undo_tablespaces设置>=2,出现大事务导致回滚段过大,方便清理。(MySQL >= 5.6)

事务的启动方式


autocommit用于决定是否开启事务自动提交:

1)autocommit=0

  • 手动提交,当用户执行start transaction/begin时(事务初始化),一个事务开启,当用户执行commit命令时当前事务提交。从用户执行start transaction命令到用户执行commit之间的一系列操作为一个完整的事务周期。回滚事务使用rollback命令;
  • 如果为显式通过start transaction/begin开启事务,则会在执行SQL时自动开启一个事务,但不提交;

2)autocommit=1

  • 若用户未执行start transaction/begin对数据库进行操作,系统默认用户对数据库的每一个操作为一个孤立的事务,也就是说用户每进行一次操作系都会即时提交或者即时回滚。这种情况下用户的每一个操作都是一个完整的事务周期。
  • 若显式执行start transaction/begin,则需要显式提交;情况同autocommit=0;

注:有些客户端连接框架会默认连接成功后先执行一个set autocommit=0的命令。这可能导致接下来的查询都在事务中,如果是长连接,就可能导致了意外的长事务;比如Java的Spring框架,可以显式告诉驱动,是否在事务环境中执行语句。

问:事务在什么时候会被隐式提交?

1)当设置autocommit = 1时,对于已经开启但是未提交的事务,若遇到DDL/begin/lock table/unlock table等语句时,会自动提交上一个事务;

2)当设置autocommit = 0时,对于已经开启但是未提交的事务,若遇到DDL/begin/lock table/unlock table等语句时,会自动回滚上一个事务;

MVCC实现


MVCC在InnoDB引擎层基于read view实现。

问:什么是事务ID?

1)引擎层用于唯一标识事务的ID,在事务开始时由InnoDB事务系统分配,按申请顺序严格递增;越早发起的事务,事务ID越小;

2)begin/start transaction命令不是InnoDB事务的起点,故不会生成事务ID;直到执行变更InnoDB表的语句,才会生成事务ID;

问:什么是数据版本?

1)每行数据有多个版本,按照事务ID倒序排列,每次事务更新数据时,会生成一个新的数据版本,并在版本中记录事务ID,即row trx_id;

2)数据表中的一行记录,可能有多个版本(row),每个版本有自己的row trx_id,可通过遍历拿到对应trx_id的版本;

3)数据版本存放在undo log中,每次查询时根据当前版本和undo log向前推算得出结果。比如,查询V2时,通过V4依次执行V3、V2算出来;

MVCC 并发控制原理详见:MVCC 并发控制原理-源码解析(非常详细)-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/313481.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TCGAplot在线版:输入基因,一键绘制TCGA基因表达与TMB相关性雷达图

1.TCGAplot简介 华科同济医院的王雄老师课题组利用TCGA数据库,开发了一个TCGA多组学数据泛癌分析和可视化R包TCGAplot[1]。用于泛癌表达以及基因表达与 TMB、MSI、TIME 和启动子甲基化之间相关性等分析。 2.TMB简介 肿瘤突变负荷(Tumor Mutation Burd…

【LLM】认识LLM

文章目录 1.LLM1.1 LLM简介1.2 LLM发展1.3 市面常见的LLM1.4 LLM涌现的能力 2.RAG2.1 RAG简介2.2 RAG 的工作流程2.3 RAG 和 Finetune 对比2.4 RAG的使用场景分析 3. LangChain3.1 LangChain简介3.2 LangChain的核心组件3.3 LangChain 入门 4.开发 RAG 应用的整体流程5. 环境配…

线上扭蛋机小程序成为年轻人创业选择

随着大众娱乐消费观的提升,带给消费者神秘感和惊喜感的扭蛋机开始走红,成为一个拥有广阔发展空间的行业。在当下二次元文化的火热下,扭蛋机的受众群体也遍布到了各个年龄层,深受大众的喜爱。 然而,玩家对扭蛋机的需求…

陇剑杯 省赛 攻击者1 CTF wireshark 流量分析

陇剑杯 省赛 攻击者1 题目 链接:https://pan.baidu.com/s/1KSSXOVNPC5hu_Mf60uKM2A?pwdhaek 提取码:haek ├───LogAnalize │ ├───linux简单日志分析 │ │ linux-log_2.zip │ │ │ ├───misc日志分析 │ │ acce…

伦敦银过夜费之——不能忽略的成本因素

众所周知,伦敦银是收益很好的投资品种,因为它采用了资金杠杆的原理,使投资者可以放大自己本金,而且还可以双向交易,并实现t0的资金回转。但在实际交易的过程中,投资者要充分考虑各种交易费用,对…

Zynq学习笔记--AXI 总线仿真(AXI VIP)

目录 1. 概述 2. Simulation with AXI VIP 2.1 axi_vip_pkg 2.2 design_1_axi_vip_0_0_pkg 2.3 参数指定 3. 实例化注意事项 3.1 名称对应关系 3.2 寄存器地址 3.3 block design 1. 概述 AXI Verification IP(AXI VIP)是一种用于验证AXI总线协议的…

MySQL行格式(row format)

MySQL行格式(row format) 表的行格式决定了其行的物理存储方式,这反过来又会影响查询和 DML 操作的性能。随着单个磁盘页面容纳更多行,查询和索引查找可以更快地工作,缓冲池中需要的高速缓存内存更少,写出…

Linux的学习之路:6、Linux编译器-gcc/g++使用

摘要 本文主要是说一些gcc的使用,g和gcc使用一样就没有特殊讲述。 目录 摘要 一、背景知识 二、gcc如何完成 1、预处理(进行宏替换) 2、编译(生成汇编) 3、汇编(生成机器可识别代码 4、链接(生成可执行文件或…

安宝特方案 | AR工业解决方案系列-工厂督查

在工业4.0时代,增强现实(AR)技术正全面重塑传统工业生产,在工厂监督领域,其应用不仅大幅提升了生产效率、监测准确性和规范执行程度,而且为整体生产力带来了质的飞跃。 01 传统挑战与痛点 在制造业生产流程…

uni.uploadFile上传图片后台接收不到数据

今天遇到一个很奇怪的问题,通过使用uni.uploadFile上传文件时后端接收不到文件,查过很多资料,原来是自定义了header的Content-Type问题。取消即可,另把自定义文件上传的代码贴出来。 分析:当我们加上请求头的时候 不…

DY视频评论ID爬取采集工具|短视频评论怕两提取获客

DY评论批量抓取工具:轻松拓展客户群,实时监控用户反馈 在当今竞争激烈的市场环境下,了解用户的反馈和需求对于企业的发展至关重要。作为一款风靡全球的社交媒体平台,(DY)汇聚了大量用户,而这些…

SQL表连接详解:JOIN与逗号(,)的使用及其性能影响

省流版 在这个详细的解释中,我们将深入探讨SQL中表连接的概念,特别是JOIN和逗号(,)在连接表时的不同用法及其对查询性能的影响。通过实际示例和背后的逻辑分析,我们将揭示在不同场景下选择哪种连接方式更为合适。 1.…

ChatGPT及GIS、生物、地球、农业、气象、生态、环境科学领域案例

以ChatGPT、LLaMA、Gemini、DALLE、Midjourney、Stable Diffusion、星火大模型、文心一言、千问为代表AI大语言模型带来了新一波人工智能浪潮,可以面向科研选题、思维导图、数据清洗、统计分析、高级编程、代码调试、算法学习、论文检索、写作、翻译、润色、文献辅助…

使用Docker部署Node.js

第一步:在Node.js项目的根目录中新建Dockerfile文件 # 使用官方 Node.js 镜像作为基础镜像 FROM node:latest# 设置工作目录 WORKDIR /usr/src/app# 将项目文件复制到容器中 COPY . .# 将npm源设置为淘宝镜像 RUN npm config set registry https://registry.npmmir…

算法部署 | 使用TensorRT部署AlphaPose姿态估计算法

项目应用场景 面向 AlphaPose 姿态估计算法的推理加速场景,项目采用 TensorRT 进行 GPU 算法加速推理。 项目效果 项目细节 > 具体参见项目 README.md (1) 模型转换 python pytorch2onnx.py --cfg ./configs/coco/resnet/256x192_res50_lr1e-3_1x.yaml --chec…

【机器学习300问】67、均方误差与交叉熵误差,两种损失函数的区别?

一、均方误差(Mean Squared Error, MSE) 假设你是一个教练,在指导学生射箭。每次射箭后,你可以测量子弹的落点距离靶心的差距(误差)。MSE就像是计算所以射击误差的平方后的平均值。它强调了每一次偏离靶心的…

python/pygame 挑战魂斗罗 笔记(三)

感觉最难的部分已经解决了,下面开始发射子弹。 一、建立ContraBullet.py文件,Bullit类: 1、设定子弹速度 Config.py中设定子弹移动速度为常量Constant.BULLET_SPEED 8。 2、载入子弹图片: 图片也是6张,子弹发出后…

盲人导航功能特点:革新出行体验的实时避障应用深度解析

作为一名资深记者,我有幸亲历并详尽报道一款专为盲人群体设计的导航应用叫做蝙蝠避障,它不仅提供了精准的路线指引,更创新性地融入了实时避障功能。这款应用凭借其盲人导航功能特点,正以前所未有的方式提升盲人的出行自由度与安全…

CSS导读 (CSS的三大特性 上)

(大家好,今天我们将继续来学习CSS的相关知识,大家可以在评论区进行互动答疑哦~加油!💕) 目录 五、CSS的三大特性 5.1 层叠性 5.2 继承性 5.2.1 行高的继承 5.3 优先级 小练习 五、CSS的三大特性 …

工作流JBPM系统数据库表介绍

文章目录 ☃️4.1 建表☃️4.2 数据库逻辑关系4.2.1 资源库与运行时的表4.2.2 历史数据表 ☃️4.3 表结构☃️4.4 流程操作与数表交互说明 ☃️4.1 建表 该系统自带18张表,用于支撑该系统的逻辑与流程业务; 建表语句如下: create database…