MySQL之性能分析和系统调优

MySQL之性能分析和系统调优

性能分析

查看执行计划 EXPLAIN

EXPLAIN作为MySQL的性能分析神器,可以用来分析SQL执行计划,需要理解分析结果可以帮助我们优化SQL

explain selectfrom[where ...]

TABLE

表名 查询的每一行记录都对于着一张表

id

该语句的唯一标识。如果explain的结果包括多个id值,则数字越大越先执行;而对于相同id的行,则表示从上往下依次执行。

select_type

每一个子查询在语句中扮演的角色

  • simple: 不包含union或者子查询的语句
  • primary :最外层的查询
  • union: union中第二个后随后的select被标记为union;如果union被from子句中的子查询包含,那么它的第一个select会被标记为derived
  • dependent union: union中第二个或后面的的查询依赖了外面的查询
  • subquery: 子查询的第一个select
  • dependent subquery: 子查询的第二个或后面的select 依赖了外面的查询
  • derived :表示包含在from子句的子查询中的select,MySQL会将执行结果放在一个临时表中;MySQL内部将其称为derived table,因为该表是从临时查询中派生出来的
  • materialized:将子查询物化之后供外层连接使用

partitions

当前查询匹配记录的分区

type

执行查询时的访问方法

  • system:表中只有一个数据并且使用的存储引擎的统计数据是精确的,有一个变量记录(比如myisam memory)

  • const:根据主键或者唯一的二级索引列等值匹配时

  • eq_ref:被驱动表是通过主键或者唯一的二级索引进行匹配的

  • ref:普通的二级索引进行等值匹配

  • ref_or_null:该类型类似于ref,但是MySQL会额外搜索哪些行包含了NULL。这种类型常见于解析子查询

  • index_merge:此类型表示使用了索引合并优化,表示一个查询里面用到了多个索引

  • unique_subquery:该类型和eq_ref类似,但是使用了IN查询,且子查询是主键或者唯一索引

  • index_subquery:和unique_subquery类似,只是子查询使用的是非唯一索引

  • range:范围扫描,表示检索了指定范围的行,主要用于有限制的索引扫描

  • index:全索引扫描,和ALL类似,只不过index是全盘扫描了索引的数据

    查询仅使用索引中的一部分列时,可使用此类型。有两种场景会触发:

    • 如果索引是查询的覆盖索引,并且索引查询的数据就可以满足查询中所需的所有数据,则只扫描索引树。此时,explain的Extra 列的结果是Using index。index通常比ALL快,因为索引的大小通常小于表数据。
    • 按索引的顺序来查找数据行,执行了全表扫描。此时,explain的Extra列的结果不会出现Uses index。
  • all:全表扫描,性能最差

possible_keys

展示当前查询可以使用哪些索引,这一列的数据是在优化过程的早期创建的,因此有些索引可能对于后续优化过程是没用的。

key

表示MySQL实际选择的索引

key_len

索引使用的字节数。由于存储格式,当字段允许为NULL时,key_len比不允许为空时大1字节
主要针对联合索引,是否充分利用索引

ref

表示将哪个字段或常量和key列所使用的字段进行比较。

如果ref是一个函数,则使用的值是函数的结果。要想查看是哪个函数,可在EXPLAIN语句之后紧跟一个SHOW WARNING语句。

rows

MySQL估算会扫描的行数,数值越小越好。

filtered

表示符合查询条件的数据百分比,最大100。用rows × filtered可获得和下一张表连接的行数。例如rows = 1000,filtered = 50%,则和下一张表连接的行数是500。

extra

  • no tables used:没有from子句
  • impossible where:where始终为false
  • using where:不使用索引;使用索引但包含不使用索引的条件
  • no match min/max:使用聚合函数但没有匹配的where、
  • using index:查询到数据使用二级索引不需要进行回表操作;如果进行回表则是null
  • using index condition:Index condition pushdown索引条件下推

EXPLAIN格式

  • 传统格式:缺少一个衡量执行计划好坏的重要信息–成本
  • JSON格式:在explain和语句之间加上format=JSON 多一些详细信息如成本
  • TREE格式:在8.0.16新增格式 主要由各部分之间的关系和执行顺序决定
  • 可视化输出:workbench

show warmings

展示真实执行的sql语句

数据库设计规范

数据库主键的设计

自增ID

自增ID的问题(缺点太多)核心业务不推荐使用

1.可靠性不高,在集群模式下存在自增ID回溯的问题

2.安全性不高,容易被被爬虫获取数据

3.性能差,需要占用数据库服务端的资源(有AUTO-INC锁来完成)

4.交互多

5.局部唯一性(在一台机器下)

业务字段

与业务有关的字段不能设计为主键,对于数据库维护造成很大困难

UUID

优点:性能高;不依赖网络;使用简单;全局唯一

缺点:占用36个字节,长度过长,没有含义,无序

有序UUID

将时间高位和地位互换,这样时间保证了单调递增,去掉无用‘-’并使用二进制存储

雪花算法

时间戳(数据单调递增)+数据中心ID+机器编码(全局唯一性)+序列号(1ms内生成多个ID的问题)

缺点:

依赖了机器ID的分配,集群的扩容和缩容需要重新分配,可能会导致ID重复

(解决:可以使用zookeeper的临时顺序节点分配ID)

依赖了系统时间,如果集群中的机器时间被回拨,也可能造成ID重复

(解决:一个客户端:在取到新ID后与之前最大的ID比较,如果ID变小则报错或者等待)

(集群:美团的leaf每次有新节点接入zk时会将节点上报的时间和集群平均的时间对比,如果新加入的节点的时间落后于平均时间则报错)

范式

1NF

确保每一个字段的值都有原子性,属性的原子性有主观性(字段不可再分)

2NF

得有主键,且非主键字段必须完全依赖于主键,不能只依赖主键的一部分

一个表只表达一个意思

如果不完全依赖候选键会导致

1.数据冗余(重复数据记录多次)

2.插入异常

3.删除异常

4.更新异常

应该将表拆分直到满足2NF

3NF

非主键字段不能依赖于其他非主键字段(非主键字段之间相互独立)不存在传递性

反范式化

遵循业务优先的原则,为了减少关联查询可以适当增加冗余字段来增强读性能,以空间换时间

一个表中的字段修改那么也应该同步修改另一张表,保证数据一致性

适用场景

增加的冗余字段不需要经常进行修改,查询的时候不可或缺

SQL语句调优

逻辑查询优化

关联查询优化

联接算法

联接算法是MySQL数据库用于处理联接的物理策略。目前MySQL数据库仅支持Nested-Loops Join算法。

两张表的Join的过程:

在这里插入图片描述

上图的Fetch阶段是指当内表关联的列是辅助索引时,但是需要访问表中的数据,那么这时就需要再访问主键索引才能得到数据的过程,不论表的存储引擎是InnoDB存储引擎还是MyISAM,这都是无法避免的,只是MyISAM的回表速度要快点,因为其辅助索引存放的就是指向记录的指针,而InnoDB存储引擎是索引组织表,需要再次通过索引查找才能定位数据。

Fetch阶段也不是必须存在的,如果是聚集索引联接,那么直接就能得到数据,无需回表,也就没有Fetch这个阶段。另外,上述给出了两张表之间的Join过程,多张表的Join就是继续上述这个过程。

接着计算两张表Join的成本,这里有下列几种概念:

外表的扫描次数,记为O。通常外表的扫描次数都是1,即Join时扫描一次外表(驱动表)的数据即可

内表的扫描次数,记为I。根据不同Join算法,内表(被驱动表)的扫描次数不同

读取表的记录数,记为R。根据不同Join算法,读取记录的数量可能不同

Join的比较次数,记为M。根据不同Join算法,比较次数不同

回表的读取记录的数,记为F。若Join的是辅助索引,可能需要回表取得最终的数据

  • Simple Nested-Loops Join(SNLJ,简单嵌套循环联接)

没有索引,小表驱动大表;暴力循环查找

  • Index Nested-Loops Join(INLJ,基于索引的嵌套循环联接)

在内表建立索引,以此降低Nested-Loop Join算法的开销,减少内表扫描次数

外连接消除

我们前边说过,内连接的驱动表和被驱动表的位置可以相互转换,而左(外)连接和右(外)连接的驱动表和被驱动表是固定的,因为有些不满足联接条件的记录会通过外部表行的方式再次添加到结果中。这就导致内连接可以通过优化表的连接顺序来降低整体的查询成本,而外连接却无法优化表的连接顺序。

外连接和内连接的本质区别就是:对于外连接的驱动表的记录来说,如果无法在被驱动表中找到匹配ON子句中的过滤条件的记录,那么该记录仍然会被加入到结果集中,对应的被驱动表记录的各个字段使用NULL值填充;而内连接的驱动表的记录如果无法在被驱动表中找到匹配ON子句中的过滤条件的记录,那么该记录会被舍弃。

  • Block Nested-Loops Join(BNL,基于块的嵌套循环联接)

引入join buffer缓冲区不是一次一条取驱动表数据而是一块一块取减少IO次数,在8.0.2版本被hash join替代

整体效率:INLJ>BNLJ>SNLJ

优化策略

1.用小的结果集驱动大的结果集

2.为被驱动表的匹配条件字段增加索引减少内层循环次数

3.使用BNLJ时可以适当增大join buffer的大小

4.hash join大数据连接时常用方式:优化器使用较小的表的join key在内存中建立散列表,通过扫描较大的表并探测散列表找出匹配的行

子查询优化

子查询可以帮准我们通过一个SQL来实现较为复杂的的查询但子查询的效率一般都不高

缺点:

1.执行子查询时内层查询会建立一个临时表,撤销临时表都会消耗资源产生大量慢查询

2.产生的临时表没有索引,效率低

建议:使用连接查询JOIN来代替子查询

排序优化

可以通用filesort和index两种方式排序

index :通过有序索引顺序扫描直接返回有序数据,不需要额外的排序,操作效率较高。

filesort:通过对返回数据进行排序,filesort 并不代表通过磁盘文件排序,而是说明进行了一个排序操作,至于排序操作是否使用了磁盘文件或临时表等,则取决于MySQL服务器对排序参数的设置和需要排序数据的大小。

有两种排序算法:

1.双路排序算法:从磁盘取排序的字段,在buffer中排序后再从磁盘中取排好序的数据

2.单路排序算法:从磁盘读取所有需要排序字段的排序数在buffer中排好序输出,内存空间占用大,sort_buffer_size适当调大

sort_buffer_size设置的排序区是每个线程独占的,所以同一时刻,MySQL中存在多个sort buffer排序区。

GROUP BY优化

先排序再分组 遵循最佳左前缀原则

无法使用索引列时增加sort_buffer_size和max_length_for_sort_data

where效率高于having

减少使用order by尽量在客户端进行数据排序,数据库的CPU资源是宝贵的

使用覆盖索引和索引下推

(在索引篇已经说明)

物理查询优化

索引优化

sql语句是否使用索引与优化器的选择有关(数据库版本,数据量,数据选择度),不基于语义,也不基于规则,而是基于const开销

什么会导致索引失效

>、<范围查询(一般将范围查询条件放在最后)

mysql 会一直向右匹配直到遇到索引搜索键使用>、<就停止匹配。一旦权重最高的索引搜索键使用>、<范围查询,那么其它>、<搜索键都无法用作索引。即索引最多使用一个>、<的范围列,因此如果查询条件中有两个>、<范围列则无法全用到索引。

like %xx

如搜索键值以通配符%开头(如:like '%abc'),则索引失效,直接全表扫描;若只是以%结尾,则不影响索引构建

类型转换导致索引失败

如果列是字符串类型,传入条件是必须用引号引起来,不然报错或索引失效

计算或者函数导致索引失效

如果查询条件中含有函数或表达式,将导致索引失效而进行全表扫描

不等于索引失效情况

普通索引使用 !=索引失效,主键索引没影响。
where语句中索引列使用了负向查询,可能会导致索引失效。
负向查询包括:NOT、!=、<>、NOT IN、NOT LIKE等。

or 条件索引问题

or 的条件列除了同时是主键的时候,索引才会生效。其他情况下的,无论条件列是什么,索引都失效。

联合索引违背最左匹配原则

联合索引中,where中索引列违背最左匹配原则,一定会导致索引失效

其他优化策略

exists和in的区别

主要由表的大小决定,in适合用于驱动表比被驱动表小的情况,exists适合用于驱动表比被驱动表大的情况

count*和count(具体字段)的区别

如果是myisam存储引擎,在每一张表都有一个row_count字段存储表数据行数,那么查询数据行数的时间复杂度是o(1)的,但由于InnoDB中支持行级锁和MVCC机制,无法维护这样的变量,所以是全表扫描时间复杂度是o(n)的

count(具体字段)一般推荐使用二级索引,因为二级索引存储的字段更小count(*)和count(1)一般自动选择key_length小的索引

关于select*

mysql中将*通过查询数据字段转变为对应的字段需要花费时间和资源

不能使用覆盖索引

limit 1

对于会进行全表扫描的sql,如果我们确定结果集只有一个,那么加上limit 1后查询到一条数据后就不会再进行查询,加快查询速度

但是如果针对已经是唯一索引的字段就没有必要了

多使用commit

commit会释放相应的资源

1.回滚段记录的用于恢复数据

2.被程序获得的锁

3.redo/undo log buffer中的空间

4.管理上述资源花费的资源

数据库其他调优

选择合适的DBMS

如果对数据安全性以及事务性处理要求高的话可以使用SQL Server或者Oracle

选择合适的存储引擎,innodb支持事务,行锁外键等,适用于事务性要求高,myisam处理大量的更新操作

优化表的设计

表要求遵循第三范式

如果查询应用较多,进行的大量的多表查询操作,可以将经常查询的字段增加来换取查询的效率也是反范式化

表的字段类型的选择

优化查询逻辑

逻辑查询优化:改变SQL语句的内容让SQL执行更高效

物理查询优化:索引优化

使用Redis作为缓存

库级优化

读写分离

数据分片,对数据库分库分表

优化MySQL服务器

服务器硬件优化

优化数据库结构

拆分表:冷热数据的分离(一个页中可以存储更多数据减少磁盘IO)

增加中间表

增加冗余字段(反范式化)

优化数据类型:
1.比如对于非负型整数可以使用unsigned来存储

2.对于文本数据类型大整数占用空间更少

3.避免使用text blog,MySQL内存临时表不支持,必须使用磁盘临时表,性能差

4.避免使用enum,修改enum需要使用alter语句,尽量用tinyint来替代

5.使用timestamp

6.使用decimal避免float double

优化插入记录的速度

myisam:

1.禁用索引

2.禁用唯一性

3.检查使用批量插入

innodb:

1.禁用唯一性检查

2.禁用外键检查

3.禁止自动提交

使用非空约束
分析表检查表优化表

分析表:ANALYZE 分析表各个字段

检查表:CHECK

优化表:OPTIMIZE

大表优化

限定查询范围

读写分离

垂直拆分 分库分表 水平拆分

其他调优策略

服务器语句超时处理

创建全局通用表空间

隐藏索引

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/207814.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是路由抖动?该如何控制

路由器在实现不间断的网络通信和连接方面发挥着重要作用&#xff0c;具有所需功能的持续可用的路由器可确保其相关子网的良好性能&#xff0c;由于网络严重依赖路由器的性能&#xff0c;因此确保您的路由器不会遇到任何问题非常重要。路由器遇到的一个严重的网络问题是路由抖动…

分布式ID生成框架Leaf升级踩坑

背景&#xff1a; 在项目中需要一个统一的拿单号等唯一ID的服务&#xff0c;就想起了之前用到的leaf&#xff0c;但是因为项目要求&#xff0c;leaf的版本不符合&#xff0c;需要做一些升级 项目地址&#xff1a;https://github.com/Meituan-Dianping/Leaf 升级点&#xff1…

如何从 Android 手机恢复已删除的视频

您是否曾经丢失过手机中的任何数据&#xff1f;如今&#xff0c;由于 Android 上的应用程序崩溃、根进程停止、Android 更新失败等等&#xff0c;数据丢失很普遍。错误删除是丢失视频、录音和音乐副本的另一种可能的方式。 丢失包含有关新完成的项目的重要信息的视频或婚礼、周…

2023-简单点-机器学习中矩阵向量求导

机器学习中矩阵向量求导的概念是什么&#xff1f; 在机器学习中&#xff0c;矩阵向量求导的概念主要涉及对函数中的矩阵或向量参数进行求导运算。这种求导运算可以帮助我们了解函数值随参数的变化情况&#xff0c;进而应用于优化算法中。具体来说&#xff0c;当损失函数是一个…

QT QComBox实现模糊查询

一、概述 在Qt中&#xff0c;可以通过QComboBox和QLineEdit实现模糊查询的功能。模糊查询是指根据用户输入的文本&#xff0c;在下拉框的选项中进行模糊匹配&#xff0c;并动态地显示匹配的选项。 二、基础知识 1、QCompleter (1)QCompleter 是 Qt 框架中提供的一个用于自动…

运算放大器和常见运放电路

关于运算放大器 运算放大器(Operational Amplifier), 简称运放, 是一种直流耦合, 差模输入, 单端输出(Differential-in, single-ended output)的高增益电压放大器件. 运放能产生一个比输入端电势差大数十万倍的输出电势. 因为刚发明时主要用于加减法等运算电路中, 因而得名运算…

如何使用windows Terminal终端连接远程Linux服务器

近接触到了zsh这个shell&#xff0c;所以在ubuntu系统上反复折腾&#xff0c;终于在ubuntu-desktop系统上使用oh-my-zsh和powerlevel10k配置好了一个比较好看的终端&#xff08;个人认为挺好看&#xff0c;勿喷&#xff09;。 但是在从windwos的Mobaxterm登录ubuntu查看时&…

Redux在React中的使用

Redux在React中的使用 1.构建方式 采用reduxjs/toolkitreact-redux的方式 安装方式 npm install reduxjs/toolkit react-redux2.使用 ①创建目录 创建store文件夹&#xff0c;然后创建index和对应的模块&#xff0c;如上图所示 ②编写counterStore.js 文章以counterStore…

java餐饮刀削面快餐店点餐服务系统springboot+jsp

网上点餐省去了客户很多不必要的时间和麻烦&#xff0c;给商家带来更多利益。同时&#xff0c;网上点餐可以辅助餐饮企业营销。传统的点餐是需要配备一个专业的服务员负责菜品介绍并记录顾客点单&#xff0c;确认后上交至后台厨房&#xff0c;厨房根据菜品种类安排做菜顺序最终…

软件设计中如何画各类图之三时序图:理解对象交互顺序的利器

目录 1 前言2 符号及说明2.1 对象&#xff08;Object&#xff09;2.2 生命线&#xff08;Lifeline&#xff09;2.3 消息&#xff08;Message&#xff09;2.4 激活&#xff08;Activation&#xff09; 3 画时序图的步骤3.1 确定参与对象3.2 绘制生命线3.3 添加消息3.4 标识激活3…

LangChain(0.0.340)官方文档三:Prompts上——自定义提示模板、使用实时特征或少量示例创建提示模板

文章目录 一、 Prompt templates1.1 langchain_core.prompts1.2 PromptTemplate1.2.1 简介1.2.2 ICEL1.2.3 Validate template 1.3 ChatPromptTemplate1.3.1 使用role创建1.3.2 使用MessagePromptTemplate创建1.3.3 自定义MessagePromptTemplate1.3.3.1 自定义消息角色名1.3.3.…

机器学习---EM算法

1. 极大似然估计与EM算法 极大似然估计是一种常用的参数估计方法&#xff0c;它是以观测值出现的概率最大作为准则。关于极 大似然估计&#xff0c;假设现在已经取到样本值了&#xff0c;这表明取到这一样本的概率L(θ) 比较 大。我们自然不会考虑那些不能使样本出现的θ作为…

【Centos8】下载 MySQL8 并开启远程连接

本文将记录一下 centos8 下载 mysql8 的安装命令&#xff0c;防止下一次安装的时候还需要查询相关资料。&#x1f923; 下载 mysql # 查看是否有 mysql&#xff0c;如果有则需要卸载 yum list installed mysql |grep mysql # or rpm -qa |grep mysql# 查看是否有 mysql 残余文…

YOLOv8创新魔改教程(一)如何进行模块创新

YOLOv8创新魔改教程&#xff08;一&#xff09;如何进行模块创新 YOLOv8创新魔改教程 本人研一&#xff0c;最近好多朋友问我要如何修改模型创新模块&#xff0c;就想着不如直接开个专栏歇一歇文章&#xff0c;也算是对自己学习的总结&#xff0c;本专栏以YOLOv8为例&#xf…

【【FPGA 之 MicroBlaze定时器中断实验】】

FPGA 之 MicroBlaze定时器中断实验 AXI Timer 具有 AXI 总线接口&#xff0c;能够产生不同时间周期和占空比的时钟、脉冲产生电路、产生与时间有关的中断和用于电机控制的脉宽调制信号。 AXI Timer IP 核提供了一个 AXI4 Lite 接口用于与处理器通信&#xff1b;它内部有两个可…

在IDEA中,如何修改Jetty的端口号,操作超简单

在IDEA中的jetty配置中的VM options中填入&#xff1a;-Djetty.portxxxx 如下图&#xff1a;

uniapp uview u-input在app(运行在安卓基座上)上不能动态控制type类型(显隐密码)

开发密码显隐功能时&#xff0c;在浏览器h5上功能是没问题的 <view class"login-item-input"><u-input:type"showPassWord ? password : text"style"background: #ecf0f8"placeholder"请输入密码"border"surround&quo…

代码随想录算法训练营第三十六天| 435 无重叠区间 763 划分字母区间 56 合并区间

目录 435 无重叠区间 763 划分字母区间 56 合并区间 435 无重叠区间 将intervals数组按照左端点进行升序排序。 设置变量len标志此时新加入端点后所有区间的位置&#xff0c;将其赋初值为第一对区间的右端点&#xff0c;因为该点是一定可达的。设置变量res来存储需要移除空间…

redis主从复制模式和哨兵机制

目录 第一章、主从复制模式1.1&#xff09;Redis 主从复制模式介绍1.2&#xff09;Redis 主从复制实现、 第二章、哨兵机制2.1&#xff09;容灾处理之哨兵2.2&#xff09;Sentinel 配置 第一章、主从复制模式 1.1&#xff09;Redis 主从复制模式介绍 ①单点故障&#xff1a;数…

图解java.util.concurrent并发包源码系列——深入理解定时任务线程池ScheduledThreadPoolExecutor

深入理解定时任务线程池ScheduledThreadPoolExecutor ScheduledThreadPoolExecutor作用与用法ScheduledThreadPoolExecutor内部执行流程DelayedWorkQueueScheduledFutureTask源码分析任务提交ScheduledFutureTask的属性和方法delayedExecute(t) 任务执行ScheduledFutureTask.su…