【MySQL】InnoDB引擎中的Compact行格式

目录

  • 1、背景
  • 2、数据示例
  • 3、Compact解释
    • 【1】组成
    • 【2】头部信息
    • 【3】隐藏列
    • 【4】数据列
  • 4、总结

1、背景

mysql中数据存储是存储引擎干的事,InnoDB存储引擎以页为单位存储数据,每个页的大小为16KB,平时我们操作数据库都是以行为单位进行增删改查,行数据是存储在页上的,行的格式有4种:Compat、Redundant、Dynamic、Compressed,今天我们来讲一下Compat行格式。

2、数据示例

我们建表语句中使用的varchar、text、blob等类型不确定长度的就使用了Compact行格式,为了方便理解我们手动创建一个表并且插入两条记录,后面都结合这两条记录来进行Compat行格式讲解,表和记录如下:
创建表

CREATE TABLE test_compact
(id INT AUTO_INCREMENT PRIMARY KEY,str1 VARCHAR(255) NOT NULL DEFAULT '',str2 VARCHAR(255),str3 CHAR(5)
) ENGINE = InnoDB DEFAULT CHARSET = utf8mb4 ROW_FORMAT=COMPACT;

插入数据

INSERT INTO test_compact (str1, str2, str3)
VALUES ('AA', 'BB', 'CCC'),('AAA', NULL, NULL);

查看数据

mysql [xxx]> select * from test_compact;
+----+------+------+------+
| id | str1 | str2 | str3 |
+----+------+------+------+
|  1 | AA   | BB   | CCC  |
|  2 | AAA  | NULL | NULL |
+----+------+------+------+
2 rows in set (0.001 sec)

查看表的行格式

mysql [xxx]> show table  status like 'test_compact' \G;
*************************** 1. row ***************************Name: test_compactEngine: InnoDBVersion: 10Row_format: Compact //目前表使用的行格式Rows: 2Avg_row_length: 8192Data_length: 16384Max_data_length: 0Index_length: 0Data_free: 0Auto_increment: 3Create_time: 2024-12-13 17:20:47Update_time: 2024-12-13 17:21:02Check_time: NULLCollation: utf8mb4_general_ciChecksum: NULLCreate_options: row_format=COMPACT  //创建表时指定的格式Comment: 
Max_index_length: 0Temporary: N
1 row in set (0.001 sec)

3、Compact解释

【1】组成

Compact行格式组成图如下:

在这里插入图片描述
Compact行由头部信息+隐藏行+数据列三部分组成。

头部信息:由三部分组成,可变长度列的实际长度信息、列是否为NULL信息、描述记录信息。
隐藏列:有三列,DB_ROW_ID、DB_TRX_ID、DB_ROLL_PTR,后面详细讲解。
数据列:每一列的值。

【2】头部信息

头部信息可以如图表示:

在这插入图片描述

接下来就结合上面创建的test_compact表和插入的记录进行理解。
可变长度列指的就是表中的str1和str2字段,因为str1和str2长度不固定,所以需要额外花费空间来记录str1和str2的长度,str1和str2的值只有不为NULL的时候才需要记录长度,并且str1和str2长度的顺序是根据列顺序的逆序来存放。
存放str1和str2长度大小为1个或者2个字节,判断方法是:可变字段存储的最大字节>255字节并且真实存储的字节数>127字节就使用2个字节存储长度,否则使用1个字节存储长度。
可变字段存储的最大字节=varchar(n)里的n * 字符集的最大字节数。n代表的是字符数,而我们用的utf8mb4字符集1个字符用1~4个字节表示,可以用如下命令看:

mysql [xxx]> show charset like 'utf8mb4';
+---------+---------------+--------------------+--------+
| Charset | Description   | Default collation  | Maxlen |
+---------+---------------+--------------------+--------+
| utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci |      4 |
+---------+---------------+--------------------+--------+
1 row in set (0.001 sec)

可以看到utf8mb4可以表示的一个字符最大字节为4,所以str1和str2列可以存储的最大字节数为255 * 4 = 4080,ASCII字符只占用1个字节,第一条记录中的str1和str2实际长度都为2个字节。
同样的str3的类型为CHAR(5),根据字符集决定存它储字节的范围为5~20,所以str3的长度信息也需要进行存储。

第一条记录str3内容’CCC’长度看起来虽然为3,实际上长度为5,这是为了防止更新str3为大于3小于5的数据时,以前的空间就成为了空间碎片需要释放。

可以用下图表示上面2条记录长度的存储信息:

可以为NULL列表指的就是没有NOT NULL修饰的str2和str3列,用二进制的0和1来表示列是否为NULL值,0代表非NULL,1代表NULL,根据列的顺序逆序排列NULL信息,必须用二进制的整数倍来存储NULL信息,不足1字节高位补0,上面2条记录的NULL信息如下:

在这里插入图片描述
行记录描述信息是由5个字节也就是40个二进制位组成,不同位代表不同的含义,不做过多解释。

【3】隐藏列

InnoDB存储引擎会为每一行数据额外分配三个列:DB_ROW_ID、DB_TRX_ID、DB_ROLL_PTR,通过表格来理解一下:

隐藏列描述大小
DB_ROW_ID唯一标识6字节
DB_TRX_ID事务id6字节
DB_ROLL_PTR指向要回滚数据的地址7字节

DB_ROW_ID只有主键和unique健都不存在时,InnoDB存储引擎会创建一个大小为6字节作为隐藏主键id使用。

【4】数据列

数据列只需要注意值为NULL的列不需要再去花空间去存储,因为头部信息的NULL列表已经存储了是否为NULL,所以上面2条记录完整表示如下:

在这里插入图片描述

4、总结

本篇文章讲了Compact行格式组成,其它几种格式都差不多,Redundant会记录所有列的长度信息,通过相邻列的偏移量来计算列的长度;Dynamic、Compressed格式在行溢出(列数据过于大页面存不下)时列数据只存储其它页的地址,数据全存储在其它页通过链表连接;Compact和Redundant会在当前页存储一部分数据信息和在其它页的剩余数据地址。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/491710.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

达梦查询表字段详细信息脚本(字段名称、描述、类型、长度及是否为空)

达梦查询表字段详细信息脚本(字段名称、描述、类型、长度及是否为空) 该SQL 脚本,用于查询表中字段的基本信息,包括字段名称、描述、数据类型、数据长度、是否为空及是否为主键等属性。 SQL 脚本 -- 输入变量 DECLAREp_owner VA…

YashanDB共享集群产品能力观测:细节足见功底

本文基于前泽塔数科研发总监-王若楠2024年11月在“2024年国产数据库创新生态大会”-“根”技术专场的演讲整理形成,主要对崖山共享集群YAC的架构、功能、高可用性、性能四大方面进行全面测试,并分享了测试环境和测试结论。 年初,基于某些商业…

[C++]类的继承

一、什么是继承 1.定义: 在 C 中,继承是一种机制,允许一个类(派生类)继承另一个类(基类)的成员(数据和函数)。继承使得派生类能够直接访问基类的公有和保护成员&#xf…

无人机节气门控制技术概述!

一、无人机节气门信号特点 无人机节气门信号主要用于调节无人机的发动机输出功率,其特点主要包括: 高精度:节气门信号需要高精度地反映发动机的转速、功率等状态,以确保无人机能够准确、稳定地飞行。 实时性:无人机…

机器学习之 K-Means

1. 什么是 K-Means? K-Means 是一种常用的无监督学习算法,主要用于聚类分析任务。其目标是将数据集划分为 K 个不同的簇,使得同一簇内的数据点之间的相似性更高,而不同簇的数据点差异更大。K-Means 算法使用了一个简单而有效的迭…

智慧公交指挥中枢,数据可视化 BI 驾驶舱

随着智慧城市的蓬勃发展,公共交通作为城市运营的核心枢纽,正朝着智能化和数据驱动的方向演进。通过整合 CAN 总线技术(Controller Area Network,控制器局域网总线)、车载智能终端、大数据分析及处理等尖端技术,构建的公交“大脑”…

盲盒3.0版h5版-可打包app-新优化版紫色版

整体界面ui美观大气,盲盒项目也是一直比较热门的,各大平台一直自己也有做。 感兴趣的小伙伴可以搭建做自己的项目。盲盒项目的利润率还是很大的。

如何理解符号引用和直接引用?

我们知道在 JVM 中类加载总共使用 5 步组成的,而类的生命周期总共有 7 个阶段,如下图所示: 其中每步的含义如下: 1.加载 加载(Loading)阶段是整个“类加载”(Class Loading)过程中…

海康萤石摄像机接入EasyNVR流程:开启RTSP-》萤石视频添加到EasyNVR-》未来支持海康SDK协议添加到EasyNVR

EasyNVR目前支持GB28181、RTSP、ONVIF、RTMP(推流)这几种协议接入,目前正在增加海康HIKSDK、大华DHSDK等几种SDK的接入,我们今天就介绍一下萤石摄像机怎么通过RTSP接入到EasyNVR。 第一步:萤石摄像机开启 萤石设备默…

【Unity离线渲染器】Octane for Unity 排坑(注册、证书申请、安装)

Unity使用Octane 异常复杂迷惑,官网多数差评就在此,Octane 论坛对unity的讨论已多年未更新。 经过我半天的不屑努力与排错,终于找到一种比较靠谱的方法。 (我用的unity版本是2022.3,估计2017都行(不确定)&…

Android Studio创建新项目并引入第三方so外部aar库驱动NFC读写器读写IC卡

本示例使用设备:https://item.taobao.com/item.htm?spma21dvs.23580594.0.0.52de2c1bbW3AUC&ftt&id615391857885 一、打开Android Studio,点击 File> New>New project 菜单,选择 要创建的项目模版,点击 Next 二、输入项目名称…

⭐️Python wxauto库解锁微信自动化

Python wxauto库解锁微信自动化 Python wxauto库解锁微信自动化一、wxauto库简介1. 消息自动化1.1 获取微信好友和群组信息1.2 读取和处理聊天记录1.3 消息发送功能1.4 自动回复1.5 文件处理 2. 界面模拟操作3. 账号管理4. 插件扩展5. 安全性与稳定性6. 易用性7. 跨平台支持 二…

【视频生成模型】——Hunyuan-video 论文及代码讲解和实操

🔮混元文生视频官网 | 🌟Github代码仓库 | 🎬 Demo 体验 | 📝技术报告 | 😍Hugging Face 文章目录 论文详解基础介绍数据预处理 (Data Pre-processing)数据过滤 (Data Filtering)数据标注 (Data…

KALI容器虚拟化Docker安装

为什么需要DOCKER 环境一致性保障 开发与生产环境统一:在软件开发过程中,开发环境和生产环境的差异常常导致应用程序出现问题。例如,开发人员在自己的机器上开发了一个 Web 应用,使用了特定版本的操作系统、数据库和编程语言运行…

第P2周:Pytorch实现CIFAR10彩色图片识别

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 目标 实现CIFAR-10的彩色图片识别实现比P1周更复杂一点的CNN网络 具体实现 (一)环境 语言环境:Python 3.10 编 译 器: …

Django基础 - 01入门简介

一、 基本概念 1.1 Django说明 Django发布于2005年, 网络框架, 用Python编写的开源的Web应用框架。采用了MVC框架模式,也称为MTV模式。官网: https://www.djangoproject.com1.2 MVC框架 Model: 封装和数据库相关…

什么是事务?隔离级别

一、什么是事务? 事务是代表单个工作单元的一组SQL语句,它确保这些语句要么全部成功,要么全部失败回滚。(想象一下,你去银行转账。你要把一笔钱从一个账户(账户A)转到另一个账户(账…

[LeetCode-Python版]206. 反转链表(迭代+递归两种解法)

题目 给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 示例 1: 输入:head [1,2,3,4,5] 输出:[5,4,3,2,1] 示例 2: 输入:head [1,2] 输出:[2,1] 示例 3&#xff1…

2025山东科技大学考研专业课复习资料一览

[冲刺]2025年山东科技大学020200应用经济学《814经济学之西方经济学[宏观部分]》考研学霸狂刷870题[简答论述计算题]1小时前[强化]2025年山东科技大学085600材料与化工《817物理化学》考研强化检测5套卷22小时前[冲刺]2025年山东科技大学030100法学《704综合一[法理学、国际法学…

kubernetes学习-使用metrics-server监控集群资源和查看日志

kubernetes学习-使用metrics-server监控集群资源和查看日志 一 、简介 Metrics Server 是一个用于 Kubernetes 集群的监控工具,它用于收集、存储和提供关于集群中各种资源的度量数据。Metrics Server 是 Kubernetes 中一个核心的指标收集器,可以提供关…