Mysql之主从同步

1.BinLog同步机制

Mysql要去保证高可用,或者去分担请求压力,一般会去主从部署,读写分离。写库只负责写,而读库更多的去承担读的请求,从库不写数据,数据从主库同步,那么到底是怎么同步的呢?

同步,一定十把数据同步给从,它得有个载体,比如redis里面有rdb文件,在Mysql里面充当这个载体得就是BinLog.

BinLog又称二进制文件,属于Mysql Server层去记录得,所以,不管是什么存储引擎进行的数据存储,如果binLog开启,都会进行记录。

二进制日志包含描述数据库更改 ( 如表创建操作或表数据更改 ) 事件 。它还包含可能发生更改的语句的事件( 例如,不匹配任何行的 DELETE) ,二进制日志还包含关于每条语句花费更新数据的时间的信息。

只有完整的事件或事务才会被记录或回读。

但是,BinLog不用在非修改语句,比如SELECT、SHOW,如果需要查询这些日志,可以参考通用日志: MySQL :: MySQL 8.0 Reference Manual :: 7.4.3 The General Query Log

1.1 BinLog用途

a.主从复制

b.数据恢复

redoLog BinLog 都是去保证数据一致性的,但是 RedoLog innoDB 层面,并且是覆盖写的,所以不能保证全数据备份。
还有因为备份的方式不一样,一个是二进制日志, server 层去做的,一种是物理日志,InnoDB 做的,所以 BinLog 也替代不了 RedoLog

 1.2 BinLog配置

BinLog会有很多相关的配置,这些配置决定了要不要开启、以什么方式存储、存储在哪里等等!

show variables like '%log_bin%'; -- log_bin相关配置
log_bin -- 默认on 开启 可以对binlog进行关闭
log_bin_basename -- bin文件前缀 默认
/var/lib/mysql/mysql-bin
log_bin_index -- bin文件索引 /var/lib/mysql/mysql-bin.indexbinlog_cache_size -- binlog日志 事务缓存大小
binlog_encryption -- 内容是否加密 我们的内容为了安全性可能需要加密
binlog_format -- binlog格式
binlog_expire_logs_seconds -- 多久后binlog删除 默认2592000s 也就是30天

1.3 BinLog格式

STATEMENT

基于语句记录,记录的是语句,后续去执行binLog的执行语句

比如:

update table set time=now() where id=1;

binlog就会记录这条语句,然后拿这条语句去执行。

问题: 有些场景,比如获取当前系统时间就会导致根据Binlog同步、恢复的数据跟之前的数据不一致。  因此,又有了Row的格式。

ROW

基于行格式记录,binlog记录的是单个表行是如何更改的

以刚才那个例子为例,会直接记录1这条数据改成了什么时间,并且能确定是哪条数据

update table set time=1675778373 where @1=1 and @2=.. and @3=...;

但是row格式的缺点是更加复杂,占用的空间比较大,恢复起来也相对来讲比较慢。

所以又有了一个折中的混合模式。混合模式就是去看下STATEMENT格式下会不会导致一致性问题,如果会,就用row,如果不会,就用STATEMENT

MIXED

混合模式,默认是语句,在下列场景下会切换成行模式

MySQL :: MySQL 8.0 Reference Manual :: 7.4.4.3 Mixed Binary Logging Format

1.4 查询BinLog

show master status; // 当前在写哪个binlog

知道了正在写哪个BinLog后,我们想去看下之前binLog的日志内容

[root@localhost mysql]# mysqlbinlog -vv --base64-output=decode-rows --database=zsc_edu --start-datetime='2023-02-05 00:00:00' mysql-bin.000003

指定编码格式,库名,开始时间和要查询的binlog文件名

1.5 BinLog同步机制 

binLog记录完整的日志,在开启事务后,事务语句中的二进制日志先放入内存缓存,这个内存缓存就是存储我事务没有提交的数据。具体缓存大小由binlog_cache_size设置(如果超过这个值,就会暂存到磁盘)。

show variables like '%binlog_cache_size%'; -- 事务期间用于保存二进制日志更改的内存缓冲区的大小。

commit的时候,会同步到文件系统缓存。那么为例性能与数据一致性方面的考虑,也会有不同的同步策略来让文件系统缓存同步到磁盘

mysql> show variables like '%sync_binlog%' ;
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| sync_binlog | 1 |
+---------------+-------+
1 row in set ( 0.00 sec)

sync_binlog配置选项

 1.sync_binlog=0,不同步刷新到磁盘,交给操作系统去操作,断电或者操作 系统异常,可能导致数据丢失

2.sync_binlog=1 ,能保证数据的一致性,每次提交都必须同步到磁盘,但是对性能有影响
3. sync_binlog=N,N 默认是 1 ,最大 4294967295 ,代表我达到 N binLog 后, 再同步到磁盘,能够灵活的来设置数据的一致性与性能之间的平衡

官网给的建议是,为了数据的一致性,来保证持久性跟一致性请设置 

sync_binlog= 1
innodb_flush_log_at_trx_commit= 1

 2. BinLog、RedoLog、UndoLog

2.1 BinLog跟RedoLog的二阶段机制

binLog是Mysql服务所提供的日志,并且是二进制日志,也就是说我不管你是什么存储引擎,只要你开启了,我都会记录。

那么既然有了binLog,为什么还要有RedoLog呢?

1. 首先 BinLog 只记录提交的完整的事务日志,而 RedoLog 一直在执行同步。
2.BinLog 是追加的二进制日志,不知道里面哪些已经持久化哪些没有持久化,而RedoLog 已经持久化的记录会从 RedoLog 删除。
3. 记录方式不一样, BinLog 是二进制日志,而 RedoLog 是物理日志,所以恢复的方式也会不一样。

当然。RedoLog也替代不了BinLog,因为RedoLog是InnoDB独有的,用其他存储引擎的时候,如果没有BinLog,同步跟恢复都没法完成。

所以,虽然BinLog跟RedoLog虽然作用稍微有些重合,但是缺一不可。

Mysql里面就采用了二阶段提交的形式,来保证这两个事务都是成功的,也尽可能保证我们的表数据跟日志数据一致(如果不一致,恢复的数据,以及主从同步的数据都会不一样)

所谓二阶段提交,就是我们的提交分2次进行,目的: 保证数据的一致性。

 Mysql里面保证BinLog跟RedoLog的一致性,就用了二阶段提交方案,如图:

1.在更新数据的时候,还没有提交事务的时候,提交的RedoLogprepare 状态

2. commit 事务后,会将 BinLog Cache 缓存的 bin 日志,同步到磁盘。
3. RedoLog 状态更改成 Commit 状态,整个流程结束。

 那么如果发生异常,怎么保证数据的一致性

1. 如果操作①失败,数据回滚, RedoLog binlog 都不会有
2. 如果②失败,有 RedoLog prepare 状态,但是没有 binlog 落盘,数据回滚,操作失败
3. 当③失败,这个时候,有 RedoLog 并且有 binlog ,数据都会有,并且数据是一致的,成功。

 2.2 三大日志的区别

两个事务日志 

a. RedoLog 重做日志,覆盖写的方式,保证内存缓存与数据库表中的一致性

b. undoLog  回滚日志,在事务里面,如果发生异常的,记录的是回滚的值, 在mvcc中也有应用

c. Binlog MysqlServer层的,二进制日志,主要两个作用 主从同步,数据恢复,binlog找到之前的数据。

3. 主从同步机制

3.1 主从安装流程

a. 创建负责同步数据给slave的用户

mysql> CREATE USER 'repl' @'%.mysql.slave' IDENTIFIED BY 'password' ;
mysql> GRANT REPLICATION SLAVE ON *.* TO   'repl' @'%.mysql.slave' ;
mysql> flush privileges ; -- 刷新权限

 2. 查看master信息

show master status \G -- 查看 master 信息

 3. 配置从库节点 如果不希望从库自己写数据,可以更改为只读

SHOW VARIABLES LIKE '%read_only%' ;
SET GLOBAL super_read_only= 1 ; -- super 账号也只读
SET GLOBAL read_only= 1 ; -- 只读

 4. 创建主从关系

mysql> CHANGE MASTER TO
-> MASTER_HOST= 'source_host_name' ,
-> MASTER_USER= 'replication_user_name' ,
-> MASTER_PASSWORD= 'replication_password' ,
-> MASTER_LOG_FILE= 'recorded_log_file_name' ,
-> MASTER_LOG_POS=recorded_log_position; -- 我要
binlog 的哪个位置开始同步
这个为8.0.23 的版本
Or from MySQL 8.0.23 :
mysql> CHANGE REPLICATION SOURCE TO
-> SOURCE_HOST= 'source_host_name' ,
-> SOURCE_USER= 'replication_user_name' ,
-> SOURCE_PASSWORD= 'replication_password' ,
-> SOURCE_LOG_FILE= 'recorded_log_file_name' ,
-> SOURCE_LOG_POS=recorded_log_position; --
我要从 binlog 的哪个位置开始同步

 5. 开启主从同步

mysql> start replica; -- 开启主从同步

 6.查看从库信息 show replica status

mysql> show replica status \G
*************************** 1. row ***************************
Replica_IO_State: Waiting for source to send event
Source_Host: 192.168.8.127
Source_User: replica
Source_Port: 3306
Connect_Retry: 60
Source_Log_File: mysql-bin .000004
Read_Source_Log_Pos: 9285
Relay_Log_File: localhost-relay-bin .000003
Relay_Log_Pos: 1334
Relay_Source_Log_File: mysql-bin .000004
Replica_IO_Running: Yes //IO线程
Replica_SQL_Running: Yes //sql执行线程
Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:
Last_Errno: 0
Last_Error:
Skip_Counter: 0 //跳过的事务数,还有这个数值的事务不会执行
Exec_Source_Log_Pos: 9285
Relay_Log_Space: 2002
Until_Condition: None
Until_Log_File:
Until_Log_Pos: 0
Source_SSL_Allowed: No
Source_SSL_CA_File:
Source_SSL_CA_Path:
Source_SSL_Cert:
Source_SSL_Cipher:
Source_SSL_Key:
Seconds_Behind_Source: 0 //主从延迟时间
Source_SSL_Verify_Server_Cert: No
Last_IO_Errno: 0
Last_IO_Error:
Last_SQL_Errno: 0
Last_SQL_Error:
Replicate_Ignore_Server_Ids:
Source_Server_Id: 129
Source_UUID: 978861 d8- 232 d- 11 ed-bc6f- 000 c2928fa99
Source_Info_File: mysql .slave_master_info
SQL_Delay: 0
SQL_Remaining_Delay: NULL
Replica_SQL_Running_State: Replica has read all
relay log; waiting for more updates
Source_Retry_Count: 86400
Source_Bind:
Last_IO_Error_Timestamp:
Last_SQL_Error_Timestamp:
Source_SSL_Crl:
Source_SSL_Crlpath:
Retrieved_Gtid_Set:
Executed_Gtid_Set:
Auto_Position: 0
Replicate_Rewrite_DB:
Channel_Name:
Source_TLS_Version:
Source_public_key_path:
Get_Source_public_key: 0
Network_Namespace:
1 row in set ( 0.01 sec)

Replica_IO_Running 线程以及 Replica_SQL_Running线程都为yes代表跟主建立关系,并且能进行主从同步。

如果从库同步报错,数据又不是特别重要,可以跳过事务

set GLOBAL SQL_replica_SKIP_COUNTER=100000; 跳过多少事务,设置后,后续的100000个事务讲不会执行
我们可以在主从中查看 Skip_Counter 还有多少事务是跳过的 跳过的事务从不会去执行

3.2 建立主从的必要条件

我们知道主从是怎么同步数据的了,那我怎么给2个服务建立主从关系。

我们来看两个必要的条件

a. 确保有唯一的server_id,server_id不能重复,如果实例ID都一样了,那就没法区分实例的唯一性了。

从文件中配置或SQL配置

-- vim /etc/my.cnf
server-id=128

或者

SET GLOBAL server_id = 128; -- 更改server_id

查询一下

mysql> SHOW GLOBAL VARIABLES like '%server_id%' ;
+----------------+-------+
| Variable_name | Value |
+----------------+-------+
| server_id | 128 |
| server_id_bits | 32 |
+----------------+-------+
2 rows in set ( 0.01 sec)

b.  数据源必须开启bin_log

因为主从复制是基于binLog去做的,所以如果想要把数据源的数据同步给副本,那么必须开启binLog。

但是副本不需要开启BinLog,除非这个副本想成为另外一个实例的数据源,也就是A->B->C的架构,A同步给B。B同步给C

同时,如果副本想成为别的实例数据源,还必须开启

SHOW GLOBAL VARIABLES like '%log_replica_updates%'; -- 版本8.0.6之后
SHOW GLOBAL VARIABLES like '%log_slave_updates%'; -- 版本8.0.6之前

该配置代表,从库能否把从主拿到的binlog事务写入自己的binlog

3.3 主从复制

我们先去看下主从同步用到的线程。官网MySQL :: MySQL 8.0 Reference Manual :: 19.2.3 Replication Threads

官网上提供了3种线程:其中replica 2个  master 1个

slave

a. I/O receiver thread

IO 接收线程,负责从 master 里面获取 binLog 日志,并且将日志加载到replica本地的文件,这个文件也叫作 replica's relay log ,俗称中继日志。
可以在 SHOW SLAVE STATUS 指令中查看 Replica_IO_Running

b.SQL applier thread

 slave接收到binLog日志后,得去执行到replica数据库。就是依靠SQL applier thread线程去执行

可以在 SHOW SLAVE STATUS 指令中查看 Replica_SQL_Running

master

 master收到I/O receiver thread线程发起的同步指令后,master会创建一个Binary log dump thread线程,将binLog内容发送给slave

可以通过 SHOW PROCESSLIST 查看线程状态

整体的主从复制流程图如下:

 

 3.4 同步方式

我们知道了主从数据是怎么同步的,是由异步线程去进行同步的,那么假如我主成功了,但是主从因为网络断开等异常没有进行同步,不就数据不一致了么?

所以为了主从的数据一致性,同步方式分为异步同步、半同步

MySQL :: MySQL 8.0 Reference Manual :: 20.1.1.1 Source to Replica Replication

异步同步

 利用额外的线程去dump我们的binLog然后传送给slave,并且我们master的用户线程是不会等待同步结果的。所以,默认的同步方式是异步同步。

性能比较高,但是数据一致性低(如果主挂了,没有同步到从,那么这个从就不会有最新的数据),因为会有延迟。

半同步

 由于异步同步会存在一定的数据丢失,并且会有延迟,所以Mysql的主从复制有一个半同步的概念,所谓半同步,就是我的主必须等待数据至少有一个副本(具体数量可以进行配置),接收并记录了,才会运行提交事务。

半同步不是默认的,如果要开启半同步,必须要安装半同步的插件

插件安装: MySQL :: MySQL 8.0 Reference Manual :: 7.6.1 Installing and Uninstalling Plugins

半同步插件: MySQL :: MySQL 8.0 Reference Manual :: 19.4.10.1 Installing Semisynchronous Replication

3.5 主从数据一致性不同步、或者同步慢的解决思路

网络延迟: 检查网络、优化网络能够让网络能够支撑数据量的传输。可以采用半同步的方式,确保数据不会丢失,或者最少有一个从能同步到数据,但是会牺牲一定的性能。

主库负载很高:  当主库有大量的操作的时候,有大量需要同步给从,也可能会延迟。 可以做负载、缓存减少主的压力
大事务导致:  binlog 太大太多,从库需要执行的时间越久,也会导致可能会延迟,尽量减 少大事务。
从库的机器跟不上: 从库的 cpu 、内存要跟主库能够匹配。不然从的处理性能会跟主不一致

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/331994.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

嵌入式全栈开发学习笔记---C语言笔试复习大全23

目录 联合体 联合体的定义 联合体的长度 如果来判断设备的字节序? 如何把大端数据转换成小端数据? 枚举 枚举的定义 上一篇复习了结构体,这一节复习联合体和枚举。 说明:我们学过单片机的一般都是有C语言基础的了&#xff…

VBA技术资料MF157:创建每个标题的目录

我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高数据的准确度。“VBA语言専攻”提供的教程一共九套,分为初级、中级、高级三大部分,教程是对VBA的系统讲解&#…

一步到位:用Python实现PC屏幕截图并自动发送邮件,实现屏幕监控

在当前的数字化世界中,自动化已经成为我们日常生活和工作中的关键部分。它不仅提高了效率,还节省了大量的时间和精力。在这篇文章中,我们将探讨如何使用Python来实现一个特定的自动化任务 - PC屏幕截图自动发送到指定的邮箱。 这个任务可能看…

pycharm配置python开发环境—miniconda+black+gitlab

下载miniconda管理python开发环境 miniconda下载地址:https://docs.anaconda.com/free/miniconda/ miniconda最新版本的python版本是python3.12.2,下载这个miniconda最新版本后,会导致执行conda create -n py31013 python3.10.13指令配置py…

Redis - 优惠卷秒杀

场景分析 为了避免对数据库造成压力,我们在新增优惠卷的时候,可以将优惠卷的信息储存在Redis中,这样用户抢购的时候访问优惠卷信息,通过Redis读取信息。 抢购流程: 业务分析 既然在新增优惠卷的时候,我…

蓝桥杯-班级活动

题目描述 小明的老师准备组织一次班级活动。班上一共有 ( n ) 名(( n ) 为偶数)同学,老师想把所有的同学进行分组,每两名同学一组。为了公平,老师给每名同学随机分配了一个 ( n ) 以内的正整数作为 id,第 …

基于Kafka的日志采集

目录 前言 架构图 资源列表 基础环境 关闭防护墙 关闭内核安全机制 修改主机名 添加hosts映射 一、部署elasticsearch 修改limit限制 部署elasticsearch 修改配置文件 启动 二、部署filebeat 部署filebeat 添加配置文件 启动 三、部署kibana 部署kibana 修…

Google Find My Device:科技守护,安心无忧

在数字化的时代,我们的生活与各种智能设备紧密相连。而 Google Find My Device 便是一款为我们提供安心保障的实用工具。 一、Find My Decice Netword的定义 谷歌的Find My Device Netword旨在通过利用Android设备的众包网络的力量,帮助用户安全的定位所…

深入编程逻辑:从分支到循环的奥秘

新书上架~👇全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我👆,收藏下次不迷路┗|`O′|┛ 嗷~~ 目录 一、编程逻辑的基石:分支与循环 分支逻辑详解 代码案例:判断整数是…

从 0 开始本地部署大语言模型

1、准备 ● Ollama:ollama.com ● Docker:https://docs.openwebui.com/ 2、下载 Ollama 进入 Ollama 官网,点击 Download 。 下载完成后,双击安装,什么都不需要勾选,直接下一步即可。安装完成&#xf…

【Qt】Qt组件设置背景图片

1. 方法1(paintEvent方式) 使用paintEvent()实现 1. .h文件中添加虚函数 protected:void paintEvent(QPaintEvent *event) override;添加虚函数方法: 选中父类,点击鼠标右键点击重构点击 Insert Virtual Funtion of Base Class…

【CCIE | 网络模拟器】部署 EVE-NG

目录 1. 环境准备2. 下载 EVE-NG 镜像3. 安装 EVE-NG 虚拟机3.1 创建 eve-ng 虚拟机3.2 选择存储3.3 定义虚拟机计算资源(1)开启CPU虚拟化功能(2)精简置备磁盘 3.4 检查虚拟机设置 4. 安装系统4.1 选择系统语言4.2 选择系统键盘类…

专业渗透测试 Phpsploit-Framework(PSF)框架软件小白入门教程(十二)

本系列课程,将重点讲解Phpsploit-Framework框架软件的基础使用! 本文章仅提供学习,切勿将其用于不法手段! 接上一篇文章内容,讲述如何进行Phpsploit-Framework软件的基础使用和二次开发。 我们,继续讲一…

爽!AI手绘变插画,接单赚爆了!

我最近发现一款名叫Hyper-SD15-Scribble的AI项目,可以实现一键手绘变插画的功能,而且它搭载了字节出品的超快速生成图片的AI大模型Hyper-SD15,可以实现几乎实时生成图片,有了它,拿去接一些手绘商单分分钟出图&#xff…

数据结构(四)串

2024年5月26日一稿(王道P127) 定义和实现

Ant Design Vue中 a-table 嵌套子表格

需求:在父表格中嵌套子表格,当点击展开某一行时,有展开的关闭当前展开行。使用a-table中的expandedRowKeys 属性和expand 方法。链接:Ant Design Vue 一、属性说明: expandedRowKeys:这个主要是控制展开某行…

modbus开源库libmodbus的C语言使用记录(实现简单的modbus主机/丛机程序,解决libmodbus库安装出现的问题)

libmodbus简介 libmodbus 是一个开源的、跨平台的C库,用于实现Modbus通讯协议。它支持Modbus RTU(RS-232/485)和Modbus TCP协议,可以使开发者方便地在项目中集成Modbus通讯功能。libmodbus的设计目标是简单、灵活和高效,适用于各种大小的嵌入式和桌面应用。 编译运行测试…

树莓派学习笔记——树莓派的三种GPIO编码方式

1、板载编码(Board pin numbering): 板载编码是树莓派上的一种GPIO引脚编号方式,它指的是按照引脚在树莓派主板上的物理位置来编号。这种方式对于初学者来说可能比较直观,因为它允许你直接根据引脚在板上的位置来编程。 2、BCM编…

C++第十九弹---string模拟实现(下)

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】 目录 1、修改操作 2、迭代器操作 3、字符串操作 4、非成员函数重载操作 总结 1、修改操作 1、string& operator (const char* s); //尾部插入…

Vue移动端登录页面

使用的是vant组件&#xff0c;引用和使用组件请去官网学习&#xff0c;链接↓vant组件官网 <div class"center"><!-- 背景图片 --><div class"background"><imgsrc"/assets/background.jpg"width"100%"heigh…