MySQL 索引

文章目录

MySQL 索引
- 1. 索引概念
- 2. 索引结构
- 3. 索引分类
- 4. 索引使用
- - 4.1 单列索引和联合索引
  - 4.2 覆盖索引
  - 4.3 前缀索引
- 5. SQL提示
- 6. 索引失效情况

1. 索引概念

索引可以理解为MySQL中用来高效检索数据的数据结构，它是有序的，因为它底层使用的数据结构是B+树；

从索引的设计原则上看，一般建议根据以下方式建立索引：

针对于数据量较大，且查询比较频繁的表建立索引；
针对于常用作查询条件(where)、排序(order by)、分组(group by)操作的字段建立索引；
尽量选择区分度高的列作为索引，如唯一索引，这样使用索引的效率更高；
尽量使用联合索引，减少单列索引，因为联合索引很多时候能够实现覆盖索引，避免回表查询，提高查询效率；
需要控制索引数量，索引不是越多越好，索引越多，维护索引结构的代价就越大，会影响增删改操作的效率；

2. 索引结构

常见的有B+树索引结构和Hash索引结构，InnoDB存储引擎默认使用的就是B+树作为索引结构

B+树：数据都只存储在叶子节点中，而非叶子节点只用来进行索引，且叶子节点上维护了一条单向链表用来高效查询数据(InnoDB中维护的是双向链表)；

至于InnoDB为什么使用B+树而不使用其它数据结构作为索引结构：

使用二叉树的话，当数据存储时使用的是顺序存储的话，层数将会变得很大，索引效率会大大降低；
B树它的数据不仅存储在叶子节点中，也存储在非叶子节点中，而InnoDB中一片能够存储容量有限，只能存16KB，又要存字段又要存数据，一旦数据量大起来了，需要的层数就会变多，而索引效率就会降低，而B+树的话数据都是存储在叶子节点中的，数据量大起来了对B+树层数的影响也不会很大；
Hash索引本身索引效率是比B+Tree高的，但是在未出现哈希碰撞之前是这样，出现哈希碰撞后还需要通过添加链表的方式来解决，效率会下降，同时Hash索引本身并不支持范围查询以及排序操作，而B+树支持；

3. 索引分类

在MySQL数据库中，索引可以具体分为以下几类：

分类	含义	特点	关键字
主键索引	针对于表中主键创造的索引	若有主键默认自动创建，且只有一个	PRIMARY
唯一索引	避免同一个表中某数据列中的值重复	可有多个	UNIQUE
常规索引	快速定位特定数据	可有多个
全文索引	查找的是文本中的关键词，而本身比较索引中的值	可有多个	FULLTEXT

而在InnoDB存储引擎中，根据索引的存储格式可以分为以下两类：

分类	含义	特点
聚集索引	索引结构的叶子节点存放行数据	必须有，且只能存在一个
二级索引	索引结构的叶子节点存放主键值	可有多个

对于聚集索引来说：

若存在主键(PRIMARY KEY)，则主键索引就是聚集索引；
若不存在主键，则第一个唯一(UNIQUE)索引就是聚集索引；
若主键和唯一索引都不存在，则InnoDB会自动创建一个rowid作为隐藏的聚集索引；

聚合索引和二级索引的具体结构如下：

在这里插入图片描述

可见，聚集索引叶子节点挂载的数据为主键值对应的行数据，而二级索引叶子节点挂载的数据为主键值；

根据查询字段不同可分为：

若SQL查询语句中根据主键值进行数据查询，则直接从聚集索引中查询数据；
若根据其它索引进行数据查询，则需要先从二级索引查找出主键值然后再通过回表查询到聚集索引中查找数据(覆盖索引除外），即回表查询；

4. 索引使用

4.1 单列索引和联合索引

单列索引：一个索引中只包含一个字段；

联合索引：一个索引中包含多个字段；

一条SQL查询语句中涉及到了多个单列索引的话，只会执行其中的一个索引，而其它索引都会失效，对此，若业务需要涉及多个索引查询的话建议将这几个字段共同构建成一个联合索引：

create index idx_table_a_b_c on table(a, b, c);

联合索引的多个字段的索引值都存储在一起：

在这里插入图片描述

在使用联合查询时，需要遵守最左前缀法则，即sql语句中若使用到了联合索引中的字段，则该联合索引中的第一个字段必须出现，否则整个索引都会失效：

假设创建了一个联合索引如下：

create index idx_table_a_b_c on table(a, b, c);

则a为联合索引中最左边的列，查询时必须存在，否则整个索引都会失效：

-- 有效索引
select * from table where a = 1 and b = 2 and c = 3-- a不存在，无效索引
select * from table where b = 2 and c = 3;-- 若中间一列被跳过，则从被跳过的那列开始后面的索引无效
select * from table where a = 1 and c = 3;-- 有效索引，与顺序无关，只要第一个列存在即可实现索引
select * from table where c = 3 and b = 2 and a = 3;

注：若联合索引中出现范围查询(> 或 <)的话，则范围查询右侧的索引都会失效，对此，若业务运行建议使用<= 或 >=；

4.2 覆盖索引

若需要查询的字段在该索引中都能找到，则称为覆盖索引，覆盖索引只需在二级索引中就能找到所需的数据并直接返回，无需执行回表查询，如图所示就是一个覆盖索引：

在这里插入图片描述

若需要查询的数据无法在二级索引中都找全，则需要进行回表查询：

在这里插入图片描述

像上述例子，则可以将其这几个字段共同构建成一个联合索引，则在进行数据索引时仅通过二级索引就能查找到所需的数据，避免回表查询：

create index idx_user_name_gender on user(name, gender);

4.3 前缀索引

当字段类型为字符串时，有时候需要索引很长的字符串(文本之类)，这样会让索引变得很大，浪费大量磁盘IO，影响查询效率；此时可以只给字符串的一部分前缀建立索引，以此节约索引空间从而提高索引效率：

语法如下：

create index idx_table_a on table_name(column(n));

5. SQL提示

若一个字段存在多个索引(单列索引和联合索引)，则在查询该字段时mysql内部会自动评估哪个执行效率更高进而使用哪个索引，可如果我们想要指定执行的索引的话，就可以使用SQL提示来让mysql执行我们指定的索引！

假设现在字段 a 有 单列索引idx_a 和 联合索引 idx_a_b_c，我们想要它执行单列索引idx_a，语法如下：

-- use index，建议mysql使用指定索引，但也只是建议，mysql内部还会进行再次评估
select * from table use index(idx_a) where a = 1;-- ingonre index，忽略掉指定的索引
select * from table ignore index(idx_a_b_c) where a = 1;-- force index，强制使用指定索引
select * from table force index(idx_a) where a = 1;

注：可以通过explain关键字(加在sql语句之前)查询当前sql执行计划判断是否有使用到索引！

6. 索引失效情况

索引会在一些特殊情况会失效：

在查询中对索引列进行函数运算时，索引会失效；
字符串类型的字段使用时没有加引号，索引会失效；
进行模糊匹配时，使用头部模糊匹配时索引会失效(like '%三丰’ 或 like '%三%')，而尾部模糊匹配不会(like '张%');
使用or连接字时，or左右两边的字段都得是索引则索引才会生效，否则只有一边是索引另一边不是索引则索引会失效；
MySQL会对全表查询和索引查询的查询效率进行评估，若发现索引查询效率慢于全表查询则不会使用索引；