1-002:MySQL InnoDB引擎中的聚簇索引和非聚簇索引有什么区别?

MySQL InnoDB 存储引擎 中,索引主要分为 聚簇索引(Clustered Index)非聚簇索引(Secondary Index)。它们的主要区别如下:


1. 聚簇索引(Clustered Index)

定义

  • 聚簇索引是表数据存储的方式,即 索引和数据在一起叶子节点存储的是完整的行记录
  • InnoDB 中的主键索引就是聚簇索引(如果没有主键,InnoDB 会选择一个 UNIQUE 索引作为聚簇索引;如果没有 UNIQUE,InnoDB 会自动生成一个隐藏的 rowid)。

存储结构

  • 使用 B+ 树 结构存储,叶子节点存放 完整的行数据
  • 数据物理存储顺序和主键索引顺序一致。

特点

  • 访问主键索引时,直接获取整行数据,查询速度快。
  • 数据存储在主键索引的叶子节点上表本身就是一棵 B+ 树
  • 适用于 基于主键的查询、范围查询
  • 更新、删除、插入操作可能导致数据的页分裂,影响性能。

示例

CREATE TABLE users (id INT PRIMARY KEY,  -- 主键,自动成为聚簇索引name VARCHAR(50),age INT
);

users 表中,id 作为 聚簇索引,数据在磁盘上的存储顺序与 id 值的顺序相同。


2. 非聚簇索引(Secondary Index / 辅助索引)

定义

  • 非聚簇索引是独立于数据存储的索引叶子节点存储的是主键值,而不是完整的行数据。
  • 访问非聚簇索引时,需要先查找索引,再通过主键回表查询数据,这种过程称为 回表查询(回溯查询,Bookmark Lookup)

存储结构

  • 也是 B+ 树 结构,但叶子节点存储的是主键值,而非完整的行记录。

特点

  • 加速非主键列的查询(适用于 WHERE 条件非主键字段)。
  • 需要二次查询(先通过非聚簇索引找到主键值,再回表查询完整数据)。
  • 索引占用空间较大,需要额外存储主键值。

示例

CREATE TABLE users (id INT PRIMARY KEY,  -- 主键(聚簇索引)name VARCHAR(50),age INT,INDEX idx_name (name)  -- 非聚簇索引
);

如果执行:

SELECT * FROM users WHERE name = 'Alice';

查询过程如下:

  1. 先在 非聚簇索引 idx_name 中查找 Alice,获取其 主键 id
  2. 使用 id聚簇索引 中回表查找完整的行数据。

3. 聚簇索引 vs. 非聚簇索引

对比项聚簇索引(Clustered Index)非聚簇索引(Secondary Index)
存储结构叶子节点存储 完整行数据叶子节点存储 主键值
查询速度主键查询快(无需回表)非主键查询慢(需要回表)
插入速度(影响数据存储顺序)较快(不影响主键顺序)
更新操作影响数据物理存储顺序,可能导致页分裂更新可能导致回表查询增加
占用空间只存储数据本身需要存储 索引列 + 主键值,占用空间大
适用场景主键查询,范围查询查询非主键列,提高查询性能

4. 什么时候使用聚簇索引 vs. 非聚簇索引?

适合使用聚簇索引的场景

  • 主键查询多,如 WHERE id = 100;
  • 范围查询多,如 BETWEEN 100 AND 200;
  • 数据表的主键是有序递增的(如 AUTO_INCREMENT),避免页分裂。

适合使用非聚簇索引的场景

  • 查询非主键字段时,如 WHERE name = 'Alice';
  • 涉及联合查询,如 INDEX (name, age);
  • 表很大,不希望频繁回表查询(可以使用 覆盖索引,避免回表)。

5. 可能的优化方案

  1. 覆盖索引(Covering Index)

    • 避免回表,提高查询性能

    • 优化方法:如果查询的数据只包含索引字段,则直接从索引中获取数据,不需要回表。

    • 示例:

      CREATE INDEX idx_name_age ON users(name, age);
      SELECT name, age FROM users WHERE name = 'Alice';  -- 只查 name 和 age,不回表
      
  2. 使用合适的主键

    • 采用 自增主键,避免页分裂,提高插入性能。
    • 避免使用 UUID、随机值作为主键,会导致索引失效、性能下降。
  3. 减少回表查询

    • 索引覆盖查询,如 SELECT name FROM users WHERE name = 'Alice';
    • 适当调整索引列,如 INDEX (name, age) 避免多次回表。

总结

  • InnoDB 中的主键索引是聚簇索引,数据存储在 B+ 树的叶子节点上,查询主键时速度最快
  • 非聚簇索引存储的是主键值,查询时需要回表查询完整数据,适用于非主键查询场景。
  • 优化索引可以减少回表查询,提高 MySQL 查询性能

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/33126.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot(十六):使用 Jenkins 部署 Spring Boot

Jenkins 是 Devops 神器,本篇文章介绍如何安装和使用 Jenkins 部署 Spring Boot 项目 Jenkins 搭建、部署分为四个步骤; 第一步,Jenkins 安装 第二步,插件安装和配置 第三步,Push SSH 第四步,部署项目 第…

【Linux 指北】常用 Linux 指令汇总

第一章、常用基本指令 # 注意: # #表示管理员 # $表示普通用户 [rootlocalhost Practice]# 说明此处表示管理员01. ls 指令 语法: ls [选项][目录或文件] 功能:对于目录,该命令列出该目录下的所有子目录与文件。对于文件&#xf…

解决Windows版Redis无法远程连接的问题

🌟 解决Windows版Redis无法远程连接的问题 在Windows系统下使用Redis时,很多用户会遇到无法远程连接的问题。尤其是在配置了Redis并尝试通过工具如RedisDesktopManager连接时,可能会报错“Cannot connect to ‘redisconnection’”。今天&am…

大语言模型学习及复习笔记(1)语言模型的发展历程

1.大模型进入人们视野 ChatGPT 于2022年11月底上线 模型名称 发布时间 核心突破 GPT-3 2020年6月 首款千亿参数模型,少样本学习 GPT-3.5-Turbo 2022年11月 对话能力优化,用户级应用落地 GPT-4 2023年3月 多模态、强逻辑推理 GPT-4o / GPT-4…

MySQL中count(*)与count(字段区别)

核心规则 表达式 统计规则 COUNT(*) 统计所有行数(包括所有字段为NULL的行)。 COUNT(字段) 仅统计该字段不为NULL的行数(若字段为NULL则自动忽略该行)。 误区 A表连接B表,若A和B是一对多的关系时,会出现…

【Unity】在项目中使用VisualScripting

1. 在packagemanager添加插件 2. 在设置中进行初始化。 Edit > Project Settings > Visual Scripting Initialize Visual Scripting You must select Initialize Visual Scripting the first time you use Visual Scripting in a project. Initialize Visual Scripting …

vue 仿deepseek前端开发一个对话界面

后端:调用deepseek的api,所以返回数据格式和deepseek相同 {"model": "DeepSeek-R1-Distill-Qwen-1.5B", "choices": [{"index": 0, "delta": {"role": "assistant", "cont…

基于Spring Boot的小区疫情购物系统的设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…

【openwebui 搭建本地知识库(RAG搭建本地知识库)】

安装准备 openwebui 这个本地安装之前写过使用python安装。也可以直接用docker 命令 docker run --rm -d \-p 3080:8080 \-p 3081:8081 \-e WEBUI_AUTHtrue \-e DEFAULT_LOCALEcn \-e GLOBAL_LOG_LEVEL"INFO" \-e AIOHTTP_CLIENT_TIMEOUT100 \--privilegedtrue \-…

Linux 提权

文章目录 前言1. 内核漏洞提权脏牛(CVE-2016-5195) 2. 不安全的系统配置项2.1 SUID/SGID提权2.2 sudo提权2.3 定时任务提权2.4 capabilities提权 3. 第三方软件提权Tomcat managerNginx本地提权(CVE-2016-1247)Redis未授权 4. 参考…

谷粒商城:性能压测JVM堆区

目录 Kit Apache JMeter VisualVM 堆内存 jvm内存模型 垃圾回收(Garbage Collection, GC) 新对象分配内存 GC步骤 MinorGC 性能优化 影响因素 优化 nginx动静分离 优化三级分类获取 Jvm参数配置堆区 测试 Kit Apache JMeter 压力测试&…

TCP协议支持全双工原因TCP发送接收数据是生产者消费者模型

一、TCP支持全双工的原因 TCP协议支持全双工,即使用TCP协议进行通信时,服务端和客户端可以同时进行数据的发送和接收,互不干扰,实现同时双向传输数据。 这是因为使用TCP协议通信时,读写套接字的文件描述符既用来发送…

观成科技:​加密C2框架Platypus流量分析

一、工具介绍 Platypus 是一款支持多会话的交互式反向 Shell 管理器。在实际的渗透测试中,为了解决 Netcat/Socat 等工具在文件传输、多会话管理方面的不足,该工具在多会话管理的基础上增加了在渗透测试中能更好发挥作用的功能(如:交互式 Sh…

在 C# 中,is null 和 == null ‌不完全等价‌

最近遇到了一个看似奇怪的问题,判断一个对象是否为null,我使用了null来判断,结果他是null但是仍然进入了判断。 经过讨论和验证,发现使用is null 可以解决问题,于是查阅了资料。 在 C# 中,is null 和 nul…

go语言zero框架拉取内部平台开发的sdk报错的修复与实践

在开发过程中,我们可能会遇到由于认证问题无法拉取私有 SDK 的情况。这种情况常发生在使用 Go 语言以及 Zero 框架时,尤其是在连接到私有平台,如阿里云 Codeup 上托管的 Go SDK。如果你遇到这种错误,通常是因为 Go 没有适当的认证…

VBA+FreePic2Pdf 找出没有放入PDF组合的单个PDF工艺文件

设计部门针对某个项目做了一个工艺汇总报告,原先只要几十个工艺文件,组合成一个PDF,但后来要求要多放点PDF进去,但工艺文件都混在一起又不知道哪些是重复的,找上我让我帮忙处理一下,我开始建议让她重新再组…

Webservice如何调用

webservice调用方式: (1)http方式调用 请求头增加Content-type:text/xml 或application/soapxml SOAPAction:方法名 请求body以xml字符串传递,xml格式定义 返回以xml字符串返回,xml某个字段是一个json字符串。 入…

2025-03-10 吴恩达机器学习1——机器学习概述

文章目录 1 监督学习1.1 回归1.2 分类 2 无监督学习2.1 聚类2.2 异常检测2.3 降维 3 使用 Jupyter Notebook ​ 1959 年,Arthur Samuel 将机器学习定义如下: ​ Field of study that gives computers the ability to learn without being explicitly pro…

Python 进程与线程-分布式进程

目录 分布式进程 小结 分布式进程 在Thread和Process中,应当优选Process,因为Process更稳定,而且,Process可以分布到多台机器上,而Thread最多只能分布到同一台机器的多个CPU上。 Python的multiprocessing模块不但支…

使用 Excel 实现绩效看板的自动化

引言 在日常工作中,团队的绩效监控和管理是确保项目顺利进行的重要环节。然而,面临着以下问题: ​数据分散:系统中的数据难以汇总,缺乏一个宏观的团队执行情况视图。​看板缺失:系统本身可能无法提供合适…