深度整理总结MySQL——SQL的执行顺序和流程

SQL的执行顺序和流程

- SQL的执行顺序
- 执行一条select语句,发生了什么呢
- - 连接器
  - 查询缓存
  - 解析SQL
  - 执行SQL
  - - 预处理器
    - 优化器
    - 执行器
- 总结

SQL的执行顺序

这是一条标准的查询语句:
在这里插入图片描述
但实际上并不是从上到下去解析的,真实的执行顺序是:

我们先执行from,join来确定表之间的连接关系，得到初步的数据
where对数据进行普通的初步的筛选
group by 分组
各组分别执行having中的普通筛选或者聚合函数筛选。
然后把再根据我们要的数据进行select，可以是普通字段查询也可以是获取聚合函数的查询结果，如果是集合函数，select的查询结果会新增一条字段
将查询结果去重distinct
最后合并各组的查询结果，按照order by的条件进行排序

在这里插入图片描述
那么为什么会是这样的顺序呢?
可能我们猛一下会认为先执行select,然后依次往下走,但仔细一想这实际上是不可能的.
因为一开始就select,数据源都不知道是什么?而且也没有处理过数据,如何select呢?
说白了我们写的是一个人类理解的格式,但是到计算机手里,它要去分解这个格式,我们探究运行原理,肯定要站在计算机的角度去看.
那SQL到底为什么要这样去处理呢?

首先要确认数据来源,(FROM/JOIN),因为不确定数据来源，后续操作就无法进行。
再筛选原始数据 (WHERE)，减少数据量，提高效率。
然后分组 (GROUP BY)，为聚合函数计算做准备。
对分组后的数据进行二次筛选 (HAVING)，让聚合函数发挥作用.
确定最终返回的列 (SELECT)，获取需要的字段或计算结果。
去重 (DISTINCT)，确保数据唯一性。
排序 (ORDER BY)，决定展示顺序。
限制返回的行数 (LIMIT)，控制查询结果。
这个顺序是 SQL 语法和数据库优化的结果，遵循这样的逻辑可以保证 SQL 查询能够高效执行，同时符合数据处理的逻辑顺序。

执行一条select语句,发生了什么呢

上面的话换句话问,MySQL执行流程是什么样子的
先来一张上帝视角图,解释了执行一条SQL查询语句.MySQL内部架构里的各个功能模块
在这里插入图片描述

MySQL 的架构共分为两层：Server 层和存储引擎层.

Server 层负责建立连接、分析和执行 SQL.
大多数核心功能模块都在之类实现.
主要是连接器,连接器，查询缓存、解析器、预处理器、优化器、执行器等.
所有的内置函数和跨存储引擎的功能(存储过程,视图,触发器等)也在Server层实现.
存储引擎层负责数据的存储和提取.
支持 InnoDB、MyISAM、Memory 等多个存储引擎，不同的存储引擎共用一个 Server 层.

连接器

连接器负责MySQL的连接工作,因为MySQL是基于TCP实现的协议,所以首先需要经过TCP三次握手来启动MySQL服务,然后通过验证用户输入的用户名和密码,然后为此次连接的用于授予相应的权限.
查看MySQL服务被多少个客户端连接的命令:show processlist;
在MySQL中,空闲连接(建立好连接后不进行任何操作)是不能长期存在的,有wait_timeout参数控制,默认最大时长为8h.
MySQL中也存在长连接和短连接.长连接可以避免不必要的连接的资源消耗.但在长连接中,每次查询会使用内存连接管理对象,这些连接对象会在连接断开时释放,如果连接迟迟不断开,MySQL服务会占用过多内存资源.
解决方案
a. 定期关闭长连接
b. 客户端主动重连:MySQL5.7实现了mysql_reset_connection()接口,当连接中占用很多内存资源后,客户端会重置连接,将连接恢复到刚开始连接的状态(不需要重连和权限验证).
连接器做的工作:

1. 经过TCP三次握手启动MySQL服务
2. 验证用户输入的用户名和密码
3. 读取用户的权限并在连接中使用该权限

查询缓存

查询缓存中的记录是以key-value的形式存储的,key是SQL语句,value是SQL语句对应的结果.
能够一定程度上提高查询的效率,但这种提升微乎其微.因为中缓存的记录会随着更新操作而清空.只要出现一个更新操作,查询缓存中的记录就会随之清空.因此在MySQL8.0中就将查询缓存删掉了,在MySQL8.0之前可以通过query_cache_type来手动关闭查询缓存