【Mysql】索引

【Mysql】索引

  • 一、索引的简介
  • 二、索引结构
      • 2.1 Hash
      • 2.2 二叉搜索树
      • 2.3 B树
      • 2.4 B+树
  • 三、索引分类
      • 3.1 主键索引
      • 3.2 普通索引
      • 3.3 唯一索引
      • 3.4 全文索引
      • 3.5 聚集索引
      • 3.6 非聚集索引
      • 3.7 索引覆盖
  • 四、使用索引
      • 4.1 自动创建索引
      • 4.2 手动创建索引
        • 4.2.1 主键索引
        • 4.2.2 唯一索引
        • 4.2.3 普通索引
        • 4.2.4 复合索引
      • 4.3 查看索引
      • 4.5 删除索引
  • 五、索引的总结

一、索引的简介

索引(Index)是一种数据结构,用于优化数据库查询性能。它类似于书籍的目录或图书馆的卡片目录,通过为数据库表中的列创建索引,可以快速定位到数据的位置,从而加快查询速度。

在这里插入图片描述
以二叉搜索树为例,在无索引情况下,就需要从第一行开始扫描,一直扫描到最后一行,我们称之为 全表扫描,性能很低。
显⽽易⻅,使⽤索引的⽬的只有⼀个,就是提升数据检索的效率,在应⽤程序的运⾏过程中,查询操作的频率远远⾼于增删改的频率。

二、索引结构

2.1 Hash

Hash的时间复杂度是O(1),查找速度非常快,但是Hash不支持范围查找。比如:我们想知道薪资在6000-8000之间的员工都有谁的话,用Hash查找的话就不合适了。

2.2 二叉搜索树

缺点:

  • 顺序插入时,会形成一个链表,查询性能大大降低。
  • 大数据量情况下,层级较深,检索速度慢。
  • 二叉搜索树的最坏时间复杂度是O(N)

这里大家就会想到红黑树或者AVL树,在数据过多时会想到红黑树或者AVL树,虽然可以让二叉树的数据平衡或者近似平衡,但终归还是二叉结构。

2.3 B树

B-Tree,B树是一种多叉路衡查找树,相对于二叉树,B树每个节点可以有多个分支,即多叉。即如果是一个深度为5的B树,那么每个节点最多存储4个key值,5个指针:
在这里插入图片描述
分裂:
5阶的树,一旦节点存储的key数量到达5,就会裂变,中间元素向上分裂。

2.4 B+树

B+树是⼀种经常⽤于数据库和⽂件系统等场合的平衡查找树,MySQL索引采⽤的数据结构,以4阶的B+树为例:
在这里插入图片描述
绿色框框:里面的部分,只起索引作用,不存储数据。
红色框框:是数据存储部分,在其叶子节点中要存储具体的数据。

B+树的特点

  • 能够保持数据稳定有序,插入与修改有较稳定的时间复杂度
  • 非叶子节点仅具有索引作用,不存储数据,所有叶子节点保存真实数据
  • 所有叶子节点构成一个有序链表,可以按照key排序的次序依次遍历全部数据

重点
B+树和B树的对比

  • 叶子节点中的数据是连续的,且相互链接,便于区间查找和搜索。
  • 非叶子节点的值都包含在叶子节点中
  • 对于B+树而言,在相同树高的情况下,查找任一元素的时间复杂度都一样,性能均衡。

三、索引分类

3.1 主键索引

  • 当在⼀个表上定义⼀个主键 PRIMARY KEY 时,InnoDB(InnoDB是MySQL数据库的默认存储引擎)使⽤它作为聚集索引。
  • 推荐为每个表定义⼀个主键。如果没有逻辑上唯⼀且⾮空的列或列集可以使⽤主键,则添加⼀个自增列。

3.2 普通索引

  • 最基本的索引类型,没有唯一性的限制。
  • 可能为多列创建组合索引,称为复合索引或组全索引

3.3 唯一索引

  • 当在一个表上定义一个唯一键 UNQUE 时,自动创建唯一索引。
  • 与普通索引类似,但区别在于唯一索引的列不允许有重复值。

3.4 全文索引

  • 基于文本列(CHAR、VARCHAR或TEXT列)上创建,以加快对这些列中包含的数据查询和 DML(数据操作语言) 操作
  • 用于全文搜索,仅MyISAM(MyISAM 是 MySQL 中的一个存储引擎,曾经是 MySQL 早期版本的默认存储引擎。它以快速读取性能和简单的表结构而闻名,但不支持事务(ACID)和行级锁。)和InnoDB引擎支持。

3.5 聚集索引

  • 与主键索引是同义词
  • 如果没有为表定义 PRIMARY KEY,InnoDB使用第一个 UNIQUE和 NOT NULL 的列作为聚集索引。
  • 如果表中没有 PRIMARY KEY或合适的 UNIQUE 索引,InnoDB会为新插入的行生成一个行号并用6字节的 ROW_ID 字段记录,ROW_ID 单调递增,并使用 ROW_ID 做为索引。

3.6 非聚集索引

  • 聚集索引以外的索引称为非聚集索引或二级索引
  • 二级索引中的每条记录都包含该行的主键列,以及二级索引指定的列。
  • InnoDB使用这个主键值来搜索聚集索引中的行,这个过程称为回表查询

回表查询:
orders表:

CREATE TABLE orders (order_id INT PRIMARY KEY,user_id INT,product_name VARCHAR(100),price DECIMAL(10, 2)
);

创建索引:

CREATE INDEX idx_user_id_product ON orders(user_id, product_name);

带回表查询:

SELECT order_id, user_id, product_name FROM orders WHERE user_id = 1;

这个查询使用了索引idx_user_id_product,但order_id不在索引中,MySQL需要回表查找order_id。

3.7 索引覆盖

  • 当一个select语句使用了普通索引且查询列表中的列刚好是创建普通索引时的所有或部分列,这时就可以直接返回数据,而不用回表查询,这样的现象称为索引覆盖

以上面的为例:

CREATE INDEX idx_user_id_product_all ON orders(user_id, product_name, order_id);

索引覆盖(不带回表查询):

SELECT order_id, user_id, product_name FROM orders WHERE user_id = 1;

查询就不再需要回表,因为索引中已包含所有所需字段

四、使用索引

4.1 自动创建索引

  • 当我们为一张表加主键约束(Primary key),外键约束(Foreign Key),唯一约束(Unique)时,MySQL会为对应的的列自动创建一个索引
  • 如果表不指定任何约束时,MySQL会自动为每一列生成一个索引并用ROW_ID 进行标识

4.2 手动创建索引

4.2.1 主键索引
-- 自动创建主键索引
create table t_test_pk(
id bigint PRIMARY KEY auto_increment,
name varchar(20));-- 创建表时指定主键列
create table t_test_pk1(
id bigint auto_increment,
name varchar(20),
PRIMARY KEY(id)
);-- 修改表中的列为主键列
create table t_test_pk2(
id int,
name varchar(20)
);
-- 将Id设置为主键
alter table t_test_pk2 add primary key (id) ;
-- 将Id的类型改为bigint并设置为自增列
-- 自增列:因为自增列只能是主键,所以设置自增列前需要保证此列是不是则增列
alter table t_test_pk2 modify id bigint auto_increment;
4.2.2 唯一索引

-- 自动创建唯一索引
create table t_test_uk(
id bigint PRIMARY KEY auto_increment,
name varchar(20) UNIQUE
);-- 创建表时指定唯一索引列
create table t_test_uk1(
id bigint PRIMARY KEY auto_increment,
name varchar(20),
UNIQUE(name)
);-- 单独创建索引并指定索引名
create table t_test_uk2(
id bigint PRIMARY KEY auto_increment,
name varchar(20)
);
-- 将name设置为唯一索引列
alter table t_test_uk2 add UNIQUE (name) ;
4.2.3 普通索引
-- 创建表时指定普通索引
create table t_test_index(
id bigint PRIMARY KEY auto_increment,
name varchar(20) UNIQUE,
sex varchar(20),
INDEX(sex)
);-- 修改表中的列为普通索引列
create table t_test_index1(
id bigint PRIMARY KEY auto_increment,
name varchar(20) UNIQUE,
sex varchar(10)
);
alter table t_test_index1 add index (sex) ;-- 单独创建索引并指定索引名
create table t_test_index2(
id bigint PRIMARY KEY auto_increment,
name varchar(20) UNIQUE,
sex varchar(10)
);
create index index_sex on t_test_index2(sex);
4.2.4 复合索引
-- 创建表时指定索引列
create table t_test_cp_index(
id bigint PRIMARY KEY auto_increment,
name varchar(20) UNIQUE,
sex varchar(20),
age BIGINT,
INDEX(sex,age)
);-- 修改表中的列为复合索引列
create table t_test_cp_index1(
id bigint PRIMARY KEY auto_increment,
name varchar(20) UNIQUE,
sex varchar(10),
age BIGINT
);
alter table t_test_cp_index1 add index (sex,age) ;-- 单独创建索引并指定索引名
create table t_test_cp_index2(
id bigint PRIMARY KEY auto_increment,
name varchar(20) UNIQUE,
sex varchar(10),
age BIGINT
);
create index cp_index_sex_age on t_test_cp_index2(sex,age);

4.3 查看索引

SHOW INDEX FROM table_name ;

4.5 删除索引

当我们删除主键时,我们需要确保主键不是自增列,如果主键是自增列我们就需要先将主键的自增列去掉,然后再删除主键。

alter table 表名 drop PRIMARY KEY;

举例:
在这里插入图片描述
错误信息:Incorrect table definition; there can be only one auto column and it must be defined as a key。
在这里插入图片描述

五、索引的总结

优点:

  • 提高查询性能
  • 快速定位数据:索引通过有序结构(如B树、哈希表等)快速定位数据,避免全表扫描,从而显著提高查询速度。
  • 优化排序和分组操作:索引可以加速ORDER BY和GROUP BY操作,减少排序和分组的开销。
  • 支持唯一性约束

确保数据唯一性:唯一索引(UNIQUE)可以确保列中的数据值是唯一的,防止重复数据的插入。

  • 提高数据检索效率

减少I/O操作:通过索引,数据库可以减少磁盘I/O操作,因为索引通常存储在内存中(如InnoDB的缓冲池),从而提高整体性能。

  • 支持全文搜索

全文索引:对于文本数据,全文索引可以快速定位包含特定单词或短语的行,适用于搜索引擎和文档管理系统。

缺点:

  • 增加存储空间

额外空间占用:索引会占用额外的存储空间,尤其是对于大型表。例如,B树索引需要存储键值和指向数据行的指针。

  • 过度索引

性能瓶颈:创建过多的索引会占用大量存储空间,并增加数据修改的开销,可能导致性能瓶颈。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20360.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

超全Deepseek资料包,deepseek下载安装部署提示词及本地部署指南介绍

该资料包涵盖了DeepSeek模型的下载、安装、部署以及本地运行的详细指南,适合希望在本地环境中高效运行DeepSeek模型的用户。资料包不仅包括基础的安装步骤,还提供了68G多套独立部署视频教程教程,针对不同硬件配置的模型选择建议,以…

1、Window Android 13模拟器 将编译的映像文件导入Android Studio

1、环境准备 编译环境:Ubuntu-18.04.5编译版本:android13-release下载地址:清华大学开源软件镜像站AOSP # 下载repo # 同步代码:repo init -u https://mirrors.tuna.tsinghua.edu.cn/git/AOSP/platform/manifest -b android13-r…

UE5 Niagara 粒子远处闪烁解决

在UE5.2中使用Niagara粒子系统制作水特效时,远处出现粒子闪烁的问题,通常由渲染精度、深度冲突或LOD设置引起 .效果如下: 处理深度缓冲冲突(Z-Fighting) 问题原因:粒子与场景几何体深度值重叠导致闪烁。 …

机器学习入门实战 4 - 基本模型

📌 机器学习基本模型项目实战:预测泰坦尼克号乘客的生存概率 🚢 项目背景 1912 年 4 月 15 日,泰坦尼克号在处女航中撞上冰山沉没,船上 2224 名乘客和船员中,仅有约 710 人生还。 哪些因素决定了生还几率&…

电子制造企业数字化转型实战:基于Odoo构建MES平台的深度解决方案

作者背景 拥有8年乙方项目经理经验、8年甲方信息化管理经验,主导过12个Odoo制造业项目落地,服务客户涵盖消费电子、汽车电子、工业设备等领域。本文基于华东某电子企业(以下简称"A公司")的实战案例,解析行业…

Python - 爬虫利器 - BeautifulSoup4常用 API

文章目录 前言BeautifulSoup4 简介主要特点:安装方式: 常用 API1. 创建 BeautifulSoup 对象2. 查找标签find(): 返回匹配的第一个元素find_all(): 返回所有匹配的元素列表select_one() & select(): CSS 选择器 3. 访问标签内容text 属性: 获取标签内纯文本get_t…

排序与算法:选择排序

执行效果 选择排序的执行效果是这样的: 呃……看不懂吗?没关系,接着往下看介绍 算法介绍 选择排序(Selection sort)是一种简单直观的排序算法。选择排序的主要优点与数据移动有关。如果某个元素位于正确的最终位置…

Day4:强化学习之Qlearning走迷宫

一、迷宫游戏 1.环境已知 迷宫环境是定义好的,障碍物位置和空位置是已知的; # 定义迷宫 grid [[0, 0, 0, 1, 0],[0, 1, 0, 1, 0],[0, 1, 0, 0, 0],[0, 0, 0, 1, 0],[0, 1, 1, 1, 0] ] 2.奖励方式已知 如果碰到障碍物则得-1,如果到终点则…

Windows 环境下 Grafana 安装指南

目录 下载 Grafana 安装 Grafana 方法 1:使用 .msi 安装程序(推荐) 方法 2:使用 .zip 压缩包 启动 Grafana 访问 Grafana 配置 Grafana(可选) 卸载 Grafana(如果需要) 下载 G…

栈回溯方案

注:栈回溯无法很好的定位到未调优化的函数,需要编译前使用 -fno-optimize-sibling-calls 选项禁止尾调优化。 基于unwind的栈回溯 在 arm 架构下,不少32位系统用的是 unwind 形式的栈回溯,这种栈回溯要复杂很多。首先需要程序有一…

[算法学习笔记]1. 枚举与暴力

一、枚举算法 定义 枚举是基于已有知识来猜测答案的问题求解策略。即在已知可能答案的范围内,通过逐一尝试寻找符合条件的解。 2. 核心思想 穷举验证:对可能答案集合中的每一个元素进行尝试终止条件:找到满足条件的解,或遍历完…

突破反爬困境:从服务端渲染到客户端SPA,爬虫环境的演变与新挑战(一)

声明 本文所讨论的内容及技术均纯属学术交流与技术研究目的,旨在探讨和总结互联网数据流动、前后端技术架构及安全防御中的技术演进。文中提及的各类技术手段和策略均仅供技术人员在合法与合规的前提下进行研究、学习与防御测试之用。 作者不支持亦不鼓励任何未经授…

(蓝桥杯——10. 小郑做志愿者)洛斯里克城志愿者问题详解

题目背景 小郑是一名大学生,她决定通过做志愿者来增加自己的综合分。她的任务是帮助游客解决交通困难的问题。洛斯里克城是一个六朝古都,拥有 N 个区域和古老的地铁系统。地铁线路覆盖了树形结构上的某些路径,游客会询问两个区域是否可以通过某条地铁线路直达,以及有多少条…

java基础——抽象类与接口

目录 一、抽象类 1. 定义 2. 示例代码 3. 特点 4. 使用场景 二、接口 1. 定义 2. 示例代码 3. 特点 三、抽象类和接口的区别 四、接口与抽象类的结合 五、自定义排序方法 六、总结 在 Java 编程中,抽象类和接口是两个极为重要的概念,它们在…

HTML应用指南:利用GET请求获取全国乐乐茶门店位置信息

随着新零售业态的快速发展,门店位置信息的获取变得越来越重要。作为新茶饮品牌之一,乐乐茶自2016年在上海五角场创立,乐乐茶不仅在产品质量和服务体验上持续领先,还积极构建广泛的门店网络,以支持其不断增长的用户群体。为了更好地理解和利用这些数据,本篇文章将深入探讨…

蚁剑(AutSword)的下载安装与报错解决

蚁剑(AutSword)的下载安装与报错解决 1.下载 唯一官方github下载地址 GitHub - AntSwordProject/AntSword-Loader: AntSword 加载器 2.安装 打开并且进入到下面的界面 下载需要的的版本 进行初始化 3.报错 出现下面的报错 4.解决方法 出现上面报错…

从低清到4K的魔法:FlashVideo突破高分辨率视频生成计算瓶颈(港大港中文字节)

论文链接:https://arxiv.org/pdf/2502.05179 项目链接:https://github.com/FoundationVision/FlashVideo 亮点直击 提出了 FlashVideo,一种将视频生成解耦为两个目标的方法:提示匹配度和视觉质量。通过在两个阶段分别调整模型规模…

《计算机视觉》——角点检测和特征提取sift

角点检测 角点的定义: 从直观上理解,角点是图像中两条或多条边缘的交点,在图像中表现为局部区域内的灰度变化较为剧烈的点。在数学和计算机视觉中,角点可以被定义为在两个或多个方向上具有显著变化的点。比如在一幅建筑物的图像…

Linux下ioctl的应用

文章目录 1、ioctl简介2、示例程序编写2.1、应用程序编写2.2、驱动程序编写 3、ioctl命令的构成4、测试 1、ioctl简介 ioctl(input/output control)是Linux中的一个系统调用,主要用于设备驱动程序与用户空间应用程序之间进行设备特定的输入/…

对称加密算法——IDEA加密算法

Java IDEA算法详解 1. 理论背景 IDEA(International Data Encryption Algorithm)是一种对称密钥加密算法,由Xuejia Lai和James Massey于1991年提出。它被设计用于替代DES(Data Encryption Standard)算法,…