QEP
QEP
是指查询执行计划(Query Execution Plan),它是由数据库系统在执行查询时生成的一组操作指令。这些指令定义了查询的具体执行方式,包括涉及哪些表、使用哪些索引、以及哪些算法、操作符等。
查询执行计划是数据库查询优化过程中的重要概念,它涉及到查询的性能和效率。通过分析并优化查询执行计划,我们可以使查询更加高效和快速地运行,并避免不必要的查询开销和资源浪费。
在数据库系统中,当用户提交一个查询时,系统会根据查询的语句和条件生成一个查询执行计划,这个计划是被叫做优化器生成的。通过优化查询执行计划,系统可以选择最优的执行路径,使得查询能够快速有效的运行。
优化器可能根据不同的算法和策略生成多个不同的查询执行计划,这些计划可能会对查询的性能产生不同的影响。DBMS 会使用成本估算函数来比较不同执行计划的成本,然后选择成本最小的执行计划来执行查询。
通常我们也可以使用数据库性能分析工具来查看查询执行计划,以帮助识别查询性能问题并确定可优化的领域。
查询示例
在 SELECT
语句前加上 EXPLAIN
,可查询 SQL 的查询执行计划
也可以使用 SQL 工具查看,如:Navicat 中的“解释”选项即可查看。
执行如下语句:
EXPLAIN SELECT * FROM book WHERE price < 30;
查询结果:
-
id:SELECT 识别符。这是 SELECT 的查询序列号。
-
select_type:SELECT 类型:
-
SIMPLE
: 简单 SELECT (不使用 UNION 或子查询) -
PRIMARY
: 最外层的 SELECT -
UNION
:UNION 中的第二个或后面的 SELECT 语句 -
DEPENDENT UNION
:UNION 中的第二个或后面的 SELECT 语句,取决于外面的查询 -
UNION RESULT
:UNION 的结果 -
SUBQUERY
:子查询中的第一个 SELECT -
DEPENDENT SUBQUERY
:子查询中的第一个 SELECT,取决于外层的查询 -
DERIVED
:导出表的 SELECT (FROM 子句的子查询)
-
-
table:表名
type:联接类型。是SQL性能的非常重要的一个指标,结果值从好到坏依次是:
-
system
:表仅有一行(=系统表)。这是 const 联接类型的一个特例。 -
const
:表最多有一个匹配行,它将在查询开始时被读取。因为仅有一行,在这行的列值可被优化器剩余部分认为是常数。用于用常数值比较 PRIMARY KEY 或 UNIQUE 索引的所有部分时。 -
eq_ref
:对于每个来自于前面的表的行组合,从该表中读取一行。这可能是最好的联接类型,除了 const 类型。它用在一个索引的所有部分被联接使用并且索引是 UNIQUE 或 PRIMARY KEY。eq_ref 可以用于使用
=
操作符比较的带索引的列。比较值可以为常量或一个使用在该表前面所读取的表的列的表达式。 -
ref
:对于每个来自于前面的表的行组合,所有有匹配索引值的行将从这张表中读取。如果联接只使用键的最左边的前缀,或如果键不是 UNIQUE 或 PRIMARY KEY (如果联接不能基于关键字选择单个行的话),则使用 ref。如果使用的键仅仅匹配少量行,该联接类型是不错的。ref 可以用于使用=或<=>操作符的带索引的列。 -
fulltext
-
ref_or_null
:该联接类型如同 ref,但是添加了MySQL可以专门搜索包含 NULL 值的行。在解决子查询中经常使用该联接类型的优化。 -
index_merge
:该联接类型表示使用了索引合并优化方法。在这种情况下,key 列包含了使用的索引的清单,key_len 包含了使用的索引的最长的关键元素。 -
unique_subquery
:是一个索引查找函数,可以完全替换子查询,效率更高。该类型替换了下面形式的 IN 子查询的 ref:```
value IN (SELECT primary_key FROM single_table WHERE some_expr)
index_subquery
:该联接类型类似于 unique_subquery。可以替换 IN 子查询,但只适合下列形式的子查询中的非唯一索引:
value IN (SELECT key_column FROM single_table WHERE some_expr)
-
range
:只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引。key_len 包含所使用索引的最长关键元素。在该类型中 ref 列为 NULL。当使用 =、<>、>、>=、<、<=、IS NULL、<=>、BETWEEN或者IN操作符,用常量比较关键字列时,可以使用range -
index
:该联接类型与 ALL 相同,除了只有索引树被扫描。这通常比 ALL 快,因为索引文件通常比数据文件小。 -
ALL
:对于每个来自于先前的表的行组合,进行完整的表扫描。如果表是第一个没标记 const 的表,这通常不好,并且通常在它情况下很差。通常可以增加更多的索引而不要使用 ALL,使得行能基于前面的表中的常数值或列值被检索出。
一般来说,需要保证查询至少达到 range 级别。
-
possible_keys:possible_keys 列指出 MySQL 能使用哪个索引在该表中找到行(SQL语句中涉及到的索引)。该列完全独立于 EXPLAIN 输出所示的表的次序。这意味着在 possible_keys 中的某些键实际上不能按生成的表次序使用。
-
key:key 列显示 MySQL 实际决定使用的键(索引)。如果没有选择索引,键是 NULL。要想强制MySQL使用或忽视possible_keys列中的索引,在查询中使用FORCE INDEX、USE INDEX或者IGNORE INDEX。
-
key_len:key_len 列显示 MySQL 决定使用的键长度。如果键是NULL,则长度为 NULL。注意通过 key_len 值我们可以确定MySQL将实际使用一个多部关键字的几个部分。
-
ref:ref 列显示使用哪个列或常数与 key 一起从表中选择行。
-
rows:rows 列显示 MySQL 认为它执行查询时必须检查的行数。
-
Extra:该列包含 MySQL 解决查询的详细信息。
-
Distinct:MySQL发现第1个匹配行后,停止为当前的行组合搜索更多的行。
-
Not exists:MySQL能够对查询进行LEFT JOIN优化,发现1个匹配LEFT JOIN标准的行后,不再为前面的的行组合在该表内检查更多的行。
-
range checked for each record (index map: #):MySQL没有发现好的可以使用的索引,但发现如果来自前面的表的列值已知,可能部分索引可以使用。对前面的表的每个行组合,MySQL检查是否可以使用range或index_merge访问方法来索取行。
-
Using filesort:MySQL需要额外的一次传递,以找出如何按排序顺序检索行。通过根据联接类型浏览所有行并为所有匹配WHERE子句的行保存排序关键字和行的指针来完成排序。然后关键字被排序,并按排序顺序检索行。
-
Using index:从只使用索引树中的信息而不需要进一步搜索读取实际的行来检索表中的列信息。当查询只使用作为单一索引一部分的列时,可以使用该策略。
-
Using temporary:为了解决查询,MySQL需要创建一个临时表来容纳结果。典型情况如查询包含可以按不同情况列出列的GROUP BY和ORDER BY子句时。
-
Using where:WHERE子句用于限制哪一个行匹配下一个表或发送到客户。除非你专门从表中索取或检查所有行,如果Extra值不为Using where并且表联接类型为ALL或index,查询可能会有一些错误。
-
Using sort_union(…), Using union(…), Using intersect(…):这些函数说明如何为index_merge联接类型合并索引扫描。
-
Using index for group-by:类似于访问表的Using index方式,Using index for group-by表示MySQL发现了一个索引,可以用来查询GROUP BY或DISTINCT查询的所有列,而不要额外搜索硬盘访问实际的表。并且,按最有效的方式使用索引,以便对于每个组,只读取少量索引条目。
-
优化建议
通过分析 EXPLAIN
命令的输出结果,我们可以发现查询中的性能瓶颈,并采取相应的优化措施。以下是一些常见的优化建议:
-
优化索引:确保查询中涉及的列都建立了合适的索引。如果可能,使用覆盖索引(Covering Index)来避免访问表的数据行。
-
减少数据扫描范围:通过调整查询条件或索引策略,减少MySQL需要扫描的数据量。
-
避免全表扫描:尽量避免使用type为ALL的查询,因为这会导致MySQL扫描整个表以查找匹配的行。
-
优化JOIN操作:对于包含JOIN操作的查询,确保JOIN条件上的列都建立了索引,并考虑使用更高效的JOIN类型(如eq_ref、ref)。
-
调整查询逻辑:有时,通过调整查询的逻辑顺序或重写查询语句,可以显著提高查询性能。