理解 InnoDB 如何处理崩溃恢复

在数据库领域,数据的一致性与可靠性至关重要。InnoDB 存储引擎的崩溃恢复机制是保障数据安全的核心,其中 Doublewrite Buffer 和 Redo Log 发挥着关键作用。下面,我们将详细探讨 InnoDB 从写入到崩溃恢复的全过程。

一、写入流程

  1. 修改页面:当事务对数据库页面进行修改时,首先在内存中的 Buffer Pool 完成操作。此时,被修改的页面成为 “脏页(Dirty Page)” ,就像刚画完画还未整理的画布,数据已变更但尚未持久化到磁盘。
  2. 记录重做日志(Redo Log):每次页面修改,InnoDB 会立即将操作记录到 Redo Log 中,并且同步写入磁盘。这就好比给每次修改都留了备份,即便系统突发崩溃,也能依据 Redo Log 将修改重新应用,确保数据不丢失。
  3. 准备刷新脏页:随着时间推移,Buffer Pool 中的脏页逐渐增多,如同堆满杂物的房间需要清理。InnoDB 会挑选一批脏页,准备将其刷新到磁盘,释放缓存空间,维持数据一致性。
  4. 写入 Doublewrite Buffer:在将选定的脏页写回数据文件前,InnoDB 会先将页面副本写入数据文件中的 Doublewrite Buffer 区域。此写入操作虽为异步,但必须成功完成后才会继续下一步,类似出门前确认门窗是否锁好。
  5. 写入最终位置:页面成功写入 Doublewrite Buffer 后,InnoDB 会尝试将其直接写入实际的数据文件位置。该写入也是异步的,并且能与写入 Doublewrite Buffer 的操作并行执行,就像同时进行烧水和准备泡茶材料,提高了效率。
  6. 确认写入完成:若两个写入操作都成功,页面可从 Buffer Pool 移除或标记为干净页面(Clean Page)。同时,Doublewrite Buffer 中对应的槽位标记为可用,供后续写操作使用,类似洗净用过的杯子以便下次再用。

二、崩溃恢复流程

若在写入过程中发生崩溃,InnoDB 重启后会执行以下恢复步骤:

  1. 分析 Redo Log:系统启动时,InnoDB 读取 Redo Log,确定哪些事务需要回滚或重做,如同经验丰富的侦探梳理线索,确保未完成的事务得到妥善处理,维护数据一致性。
  2. 检查 Doublewrite Buffer:InnoDB 检查 Doublewrite Buffer 中的页面,对比其与对应数据文件中的页面,查找是否存在因崩溃未完全写入的数据页,就像仔细核对两份文件是否一致。
  3. 修复部分写入的页面:对于部分写入的数据页,InnoDB 用 Doublewrite Buffer 中的完整副本来覆盖有问题的数据文件页面,如同用正确拼图块替换错误的,保证页面的一致性和完整性。
  4. 完成恢复:经过上述步骤,因崩溃导致的问题基本解决,数据库恢复正常运行。未提交的事务回滚,未持久化的已提交事务依据 Redo Log 重做。

三、极端情况下的应对策略

当 Doublewrite Buffer 也出现部分写入或损坏时,InnoDB 采取以下策略:

  1. 依赖 Redo Log:若 Doublewrite Buffer 中的页面不可用或损坏,InnoDB 完全依赖 Redo Log 进行恢复。Redo Log 记录了所有数据库页的修改,即便没有 Doublewrite Buffer 的协助,也能通过重放日志条目重建数据一致性。
  2. 页面修复:对于无法从 Doublewrite Buffer 获取完整副本的页面,InnoDB 根据 Redo Log 中的信息修复,可能需应用一系列日志记录,直至页面恢复到崩溃前状态。
  3. 回滚未提交事务:所有未提交的事务回滚,确保数据库处于一致状态。已提交的事务则根据 Redo Log 重做,保证其效果持久化。
  4. 标记问题页面:若某些页面因严重硬件故障等确实无法修复,InnoDB 标记这些页面为损坏,并排除在后续操作之外。数据库管理员可通过备份或其他手段恢复这部分数据。
  5. 重启后的进一步检查:在恢复正常服务前,InnoDB 执行额外的健康检查,如表空间一致性检查等,确保整个数据库系统的稳定性和可靠性。

四、双写过程

  1. 第一次写入(写入到 Doublewrite Buffer):准备将一个或多个脏页刷新到磁盘前,InnoDB 首先将页面副本写入数据文件中的 Doublewrite Buffer 区域。该区域位于共享表空间(如 ibdata1),是一段专门预留的连续空间,划分为两个 chunk,每个 chunk 可容纳 64 个页面(约 128MB,由 128 个 extent 组成,每个 extent 为 1MB) 。
  2. 第二次写入(写入到目标位置):页面成功写入 Doublewrite Buffer 后,InnoDB 尝试将其直接写入实际的数据文件位置。采用异步 I/O 操作,写入 Doublewrite Buffer 和写入最终位置的操作可在一定程度上并行执行。

InnoDB 凭借这套复杂精妙的机制,有效保护数据免受部分更新问题的影响,确保在极端情况下也能自动修复问题,维持数据的一致性和可靠性。这种设计使 InnoDB 在崩溃恢复时自动修正数据损坏,无需依赖额外备份或复杂过程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/11134.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MapReduce简单应用(一)——WordCount

目录 1. 执行过程1.1 分割1.2 Map1.3 Combine1.4 Reduce 2. 代码和结果2.1 pom.xml中依赖配置2.2 工具类util2.3 WordCount2.4 结果 参考 1. 执行过程 假设WordCount的两个输入文本text1.txt和text2.txt如下。 Hello World Bye WorldHello Hadoop Bye Hadoop1.1 分割 将每个文…

tensorboard的基本使用及案例

TensorBoard 是一个可视化工具,用于展示机器学习模型的训练过程和结果。以下是 TensorBoard 的基本使用方法及一些案例。 基本使用 安装 安装 TensorBoard: pip install tensorboard 如果使用 PyTorch,还需要安装 torch 和 torchvision&…

【ArcGIS遇上Python】批量提取多波段影像至单个波段

本案例基于ArcGIS python,将landsat影像的7个波段影像数据,批量提取至单个波段。 相关阅读:【ArcGIS微课1000例】0141:提取多波段影像中的单个波段 文章目录 一、数据准备二、效果比对二、python批处理1. 编写python代码2. 运行代码一、数据准备 实验数据及完整的python位…

吴恩达深度学习——超参数调试

内容来自https://www.bilibili.com/video/BV1FT4y1E74V,仅为本人学习所用。 文章目录 超参数调试调试选择范围 Batch归一化公式整合 Softmax 超参数调试 调试 目前学习的一些超参数有学习率 α \alpha α(最重要)、动量梯度下降法 β \bet…

Alibaba开发规范_编程规约之命名风格

文章目录 命名风格的基本原则1. 命名不能以下划线或美元符号开始或结束2. 严禁使用拼音与英文混合或直接使用中文3. 类名使用 UpperCamelCase 风格,但以下情形例外:DO / BO / DTO / VO / AO / PO / UID 等4. 方法名、参数名、成员变量、局部变量使用 low…

从0开始,来看看怎么去linux排查Java程序故障

一,前提准备 最基本前提:你需要有liunx环境,如果没有请参考其它文献在自己得到local建立一个虚拟机去进行测试。 有了虚拟机之后,你还需要安装jdk和配置环境变量 1. 安装JDK(以OpenJDK 17为例) 下载JDK…

智能园区管理系统助力企业安全与效率双提升的成功案例分析

内容概要 在当今迅速发展的商业环境中,企业面临着资产管理、风险控制和运营效率提高等多重挑战。为了应对这些挑战,智能园区管理系统应运而生,为企业提供了全新的解决方案。例如,快鲸智慧园区(楼宇)管理系…

nacos 配置管理、 配置热更新、 动态路由

文章目录 配置管理引入jar包添加 bootstrap.yaml 文件配置在application.yaml 中添加自定义信息nacos 配置信息 配置热更新采用第一种配置根据服务名确定配置文件根据后缀确定配置文件 动态路由DynamicRouteLoaderNacosConfigManagerRouteDefinitionWriter 路由配置 配置管理 …

Linux-CentOS的yum源

1、什么是yum yum是CentOS的软件仓库管理工具。 2、yum的仓库 2.1、yum的远程仓库源 2.1.1、国内仓库 国内较知名的网络源(aliyun源,163源,sohu源,知名大学开源镜像等) 阿里源:https://opsx.alibaba.com/mirror 网易源:http://mirrors.1…

16.[前端开发]Day16-HTML+CSS阶段练习(网易云音乐五)

完整代码 网易云-main-left-rank&#xff08;排行榜&#xff09; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name&q…

【ts + java】古玩系统开发总结

src别名的配置 开发中文件和文件的关系会比较复杂&#xff0c;我们需要给src文件夹一个别名吧 vite.config.js import { defineConfig } from vite import vue from vitejs/plugin-vue import path from path// https://vitejs.dev/config/ export default defineConfig({pl…

使用Pygame制作“俄罗斯方块”游戏

1. 前言 俄罗斯方块&#xff08;Tetris&#xff09; 是一款由方块下落、行消除等核心规则构成的经典益智游戏&#xff1a; 每次从屏幕顶部出现一个随机的方块&#xff08;由若干小方格组成&#xff09;&#xff0c;玩家可以左右移动或旋转该方块&#xff0c;让它合适地堆叠在…

小程序设计和开发:什么是竞品分析,如何进行竞品分析

一、竞品分析的定义 竞品分析是指对竞争对手的产品进行深入研究和比较&#xff0c;以了解市场动态、发现自身产品的优势和不足&#xff0c;并为产品的设计、开发和营销策略提供参考依据。在小程序设计和开发中&#xff0c;竞品分析可以帮助开发者了解同类型小程序的功能、用户体…

Vue简介

目录 Vue是什么&#xff1f;为什么要使用Vue&#xff1f;Vue的三种加载方式拓展&#xff1a;什么是渐进式框架&#xff1f; Vue是什么&#xff1f; Vue是一套用于构建用户界面的渐进式 JavaScript (主张最少)框架 &#xff0c;开发者只需关注视图层。另一方面&#xff0c;当与…

Linux多路转接poll

Linux多路转接poll 1. poll() poll() 结构包含了要监视的 event 和发生的 event &#xff0c;接口使用比 select() 更方便。且 poll 并没有最大数量限制&#xff08;但是数量过大后性能也是会下降&#xff09;。 2. poll() 的工作原理 poll() 不再需要像 select() 那样自行…

C++【深入底层,手撕vector】

vector是向量的意思&#xff0c;看了vector的底层实现之后&#xff0c;能够很明确的认识到它其实就是我们经常使用的顺序表。在我们的认知中&#xff0c;顺序表会有一个数组、数据的size以及容量的大小。vector作为一个向量容器&#xff0c;它可以存放任意类型的数据。所以在实…

基于FPGA的BT656编解码

概述 BT656全称为“ITU-R BT.656-4”或简称“BT656”,是一种用于数字视频传输的接口标准。它规定了数字视频信号的编码方式、传输格式以及接口电气特性。在物理层面上,BT656接口通常包含10根线(在某些应用中可能略有不同,但标准配置为10根)。这些线分别用于传输视频数据、…

关于系统重构实践的一些思考与总结

文章目录 一、前言二、系统重构的范式1.明确目标和背景2.兼容屏蔽对上层的影响3.设计灰度迁移方案3.1 灰度策略3.2 灰度过程设计3.2.1 case1 业务逻辑变更3.2.2 case2 底层数据变更&#xff08;数据平滑迁移&#xff09;3.2.3 case3 在途新旧流程兼容3.2.4 case4 接口变更3.2.5…

Microsoft Power BI:融合 AI 的文本分析

Microsoft Power BI 是微软推出的一款功能强大的商业智能工具&#xff0c;旨在帮助用户从各种数据源中提取、分析和可视化数据&#xff0c;以支持业务决策和洞察。以下是关于 Power BI 的深度介绍&#xff1a; 1. 核心功能与特点 Power BI 提供了全面的数据分析和可视化功能&…

【机器学习】自定义数据集 ,使用朴素贝叶斯对其进行分类

一、贝叶斯原理 贝叶斯算法是基于贝叶斯公式的&#xff0c;其公式为&#xff1a; 其中叫做先验概率&#xff0c;叫做条件概率&#xff0c;叫做观察概率&#xff0c;叫做后验概率&#xff0c;也是我们求解的结果&#xff0c;通过比较后验概率的大小&#xff0c;将后验概率最大的…