半同步复制

mac2022-06-30  61

Ⅰ、认识半同步

我们目前MySQL默认的复制模式是异步复制,主不关心从的数据到哪里了,主宕了,做切换,如果从落后太多,就会导致丢失的数据太多

从5.5版本开始,MySQL引入了半同步复制

简单理解:一个事务提交时,日志至少要保证有一个从接收到,那么它的提交才能继续

到5.7版本,在原来半同步的基础上又出了一种半同步,叫无损复制,所以目前有两种半同步模式如下:

1.1 semi-syncreplication

至少有一个从机收到binlog再返回减少数据丢失风险不能完全避免数据丢失MySQL5.5版本开始支持

1.2 lossless semi-syncreplication

二进制日志先写远端可保证数据完全不丢失MySQL5.7版本开始支持

Ⅱ、玩一手半同步

配置 semi-sync replication

step1: 在线加载插件安装 (root@localhost) [(none)]> install plugin rpl_semi_sync_master soname 'semisync_master.so'; (root@localhost) [(none)]> install plugin rpl_semi_sync_slave soname 'semisync_slave.so'; 写入配置文件 [mysqld] plugin-dir=/usr/local/mysql/lib/plugin plugin-load="rpl_semi_sync_master:semisync_master.so;rpl_semi_sync_slave:semisync_slave.so" (root@localhost) [(none)]> show plugins; 截取一段 +----------------------------+----------+--------------------+--------------------+---------+ | rpl_semi_sync_master | ACTIVE | REPLICATION | semisync_master.so | GPL | | rpl_semi_sync_slave | ACTIVE | REPLICATION | semisync_slave.so | GPL | +----------------------------+----------+--------------------+--------------------+---------+ 可以看到已经装好了,还多了一些参数 (root@localhost) [(none)]> show variables like 'rpl%'; +-------------------------------------------+------------+ | Variable_name | Value | +-------------------------------------------+------------+ | rpl_semi_sync_master_enabled | OFF | | rpl_semi_sync_master_timeout | 10000 | | rpl_semi_sync_master_trace_level | 32 | | rpl_semi_sync_master_wait_for_slave_count | 1 | | rpl_semi_sync_master_wait_no_slave | ON | | rpl_semi_sync_master_wait_point | AFTER_SYNC | | rpl_semi_sync_slave_enabled | OFF | | rpl_semi_sync_slave_trace_level | 32 | | rpl_stop_slave_timeout | 31536000 | +-------------------------------------------+------------+ 9 rows in set (0.00 sec) step2: (root@localhost) [(none)]> set global rpl_semi_sync_master_enabled = 1; (root@localhost) [(none)]> set global rpl_semi_sync_slave_enabled = 1; tips: 配置文件里都配上哈,主从都搞好 重启一下复制 主上执行 (root@localhost) [(none)]> show global status like 'rpl%'; +--------------------------------------------+-------+ | Variable_name | Value | +--------------------------------------------+-------+ | Rpl_semi_sync_master_clients | 1 | | Rpl_semi_sync_master_net_avg_wait_time | 0 | | Rpl_semi_sync_master_net_wait_time | 0 | | Rpl_semi_sync_master_net_waits | 0 | | Rpl_semi_sync_master_no_times | 0 | | Rpl_semi_sync_master_no_tx | 0 | | Rpl_semi_sync_master_status | ON | | Rpl_semi_sync_master_timefunc_failures | 0 | | Rpl_semi_sync_master_tx_avg_wait_time | 0 | | Rpl_semi_sync_master_tx_wait_time | 0 | | Rpl_semi_sync_master_tx_waits | 0 | | Rpl_semi_sync_master_wait_pos_backtraverse | 0 | | Rpl_semi_sync_master_wait_sessions | 0 | | Rpl_semi_sync_master_yes_tx | 0 | | Rpl_semi_sync_slave_status | OFF | +--------------------------------------------+-------+ 15 rows in set (0.03 sec)

这里面有一个超时,默认10s

如果超时了,会切为异步

相关参数:rpl_semi_sync_master_timeout

测试一把: 把从停掉(stop slave io_thread),主上insert,会被hang住,金融行业要超时时间设置很大,不让切异步,人工介入

主发给从,从没接收到,主提交不了

(root@localhost) [(none)]> show processlist; +------+------+-----------+------+---------+------+--------------------------------------+---------------------------------------+ | Id | User | Host | db | Command | Time | State | Info | +------+------+-----------+------+---------+------+--------------------------------------+---------------------------------------+ | 1460 | root | localhost | NULL | Query | 0 | starting | show processlist | | 1461 | root | localhost | test | Query | 7 | Waiting for semi-sync ACK from slave | insert into flashback values(6,7,8,9) | +------+------+-----------+------+---------+------+--------------------------------------+---------------------------------------+ 跑sysbench批量插入,show processlist可以看到全是query end,卡住了,搞不进去,一会儿又恢复了 原因:10s后,半同步切换为异步了 此时主上看几个状态(截取几个重要的) (root@localhost) [(none)]> show global status like 'rpl%'; +--------------------------------------------+---------+ | Variable_name | Value | +--------------------------------------------+---------+ | Rpl_semi_sync_master_clients | 0 | | Rpl_semi_sync_master_no_times | 1 | # 半同步切异步的次数 | Rpl_semi_sync_master_no_tx | 6588 | # 切为异步后执行的事务数 | Rpl_semi_sync_master_status | OFF | +--------------------------------------------+---------+ 15 rows in set (0.00 sec) 从: (root@localhost) [(none)]> start slave io_thread; Query OK, 0 rows affected (0.00 sec) 主: 恢复半同步,状态正常

半同步小结:

确保至少一个slave接收到日志一段时间内没接收到就切到异步slave追上后又会自动切回半同步

Ⅲ、半同步原理浅析(两种模式)

3.1 semi-sync replication

半同步复制,一个事务提交(commit)时,在InnoDB层的commit log步骤后,Master节点需要收到至少一个Slave节点回复的ACK(表示收到了binlog )后,方可继续下一个事务

若在一定时间内(timeout)内没有收到ACK,则切换为异步模式,具体流程如下:

next commit <-+ |Recv ACK +---------+ | +--------+ | M | | | | | prepare | +------+ | +----v----+ | | | binary | Wait Ack | S | +----v----+ +------> | | commit | | | | +----v----+ | +--------+ | | +--------+ [mysqld] rpl_semi_sync_master_enabled = 1 rpl_semi_sync_slave_enabled = 1 rpl_semi_sync_master_timeout = 1000

测试:

step1: 5.7默认是无损复制,先设一把普通半同步 主: set global rpl_semi_sync_master_wait_point='after_commit'; step2: 主: set global rpl_semi_sync_master_timeout = 3600; 不让切异步 create table a (a int primary key); 从: stop slave io_thread; step3: 主: insert into a values(1);hang住咯 新开个线程,但可以看到这条记录

3.2 loss less semi-sync replication

无损复制,一个事务提交(commit)时,在server层的write binlog步骤后,Master节点需要收到至少一个Slave节点回复的ACK(表示收到了binlog )后,才能继续下一个事务

如果在一定时间内(timeout)内没有收到ACK ,则切换为异步模式 ,具体流程如下:

+---------+ +--------+ | M | | | | prepare | | | +----v----+ | | | binary | +--------> | +----v----+ |Wait ACK| | | | | | | S | | +------+ | | | | | | | +---------------< | | v | Recv ACK | | | commit | | | +----+----+ +--------+ | v next commit [mysqld] rpl_semi_sync_master_wait_point = afer_sync rpl_semi_sync_master_wait_for_slave_count = 1

对比after_commit测试

同样的测试,被hang住的那条插入,在主上是不可见的

tips:

主从还未切换,主恢复的话,在两种复制模式下,主从的数据都是最终一致的(配置是crash_safe的)

3.3 小结对比

半同步模式等待ack时间点数据一致性after_commitcommit后无法保证主从一致after_sync写binlog后主从一致

tips: 5.7新参数

rpl_semi_sync_master_wait_for_slave_count 之前的半同步是保证至少一个slave接收到binlog即可,这个参数可以设置多少个slave接收到日志主上才能commit 配置多个ACK和配置一个ACK的效果是类似的,因为他们是并行执行的(理论上来说不会有两倍的等待时间),取决于最慢的那个 建议设置从机数量的一半,类似group replication 但gr并没有走mysqldump去发送日志,它有专门的端口号,专门的paxos做日志发送,logshipping

Ⅳ、几种复制的性能对比

4.1 先吹两手

异步复制和半同步复制(无损)的性能差多少?

只读的情况下,性能一样,因为没有产生二进制日志,谈不上主从oltp脚本(14个select,4个update)跑,性能其实也差不多update_none_index测试,差的也不多,百分之十的样子

综上:无损的半同步性能并不会下降非常多,性能下降多少和网络有关,用InfiniBand那更厉害了,另一点影响因素是事务的写入量,所以oltp差距不大

姜总测试报告:

两台不同机器,网络千兆,oltp,64个线程,异步和半同步差距可以忽略,百分之3到百分之5之间,纯update最差的时候差百分之三十

慢20%,主从严格一致,能接受不?

开更多线程呢?1024个线程去压呢?

半同步的性能会继续往上升,单个事务响应速度慢了,系统的整体吞吐率是上升的,所以生产环境中开启半同步,5.7场景打开after_sync(保证数据可靠性和性能的折中)

所以,5.7不用gr就能保证主从数据一致性,只是gr在做选主的话变成全自动了,不用mha,但它现在也还有一些明显的限制

4.2 再吹一手

从facebook测试结果看,after_commit性能很差,而无损复制比异步性能还好,为什么呢?

就等待ACK回包问题上,其实两种复制的开销是一样的,没有区别,都是网络的等待开销after_commit,主上一个事务等待提交的时候,不影响其他事务提交,性能一般after_sync,一个事务卡住(waiting for semi-sync ack),后面事务都是query end状态(执行中,没在等ack,binlog已经传到从上了,等待第一个事务被唤醒,后面的所有事务一起做最后一次fsync),变相提高了第三步(innodb commit)组提交的效率,减少上下文切换,降低io开销,降低资源之间的竞争,提升磁盘吞吐率,性能较好线程数越多这种性能差距越明显

对比测试如下:

after_commit (root@localhost) [(none)]> show processlist; +-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+ | Id | User | Host | db | Command | Time | State | Info | +-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+ | 14905 | root | localhost | test | Query | 14 | Waiting for semi-sync ACK from slave | insert into abc values(1) | | 14906 | root | localhost | test | Query | 10 | Waiting for semi-sync ACK from slave | insert into abc values(2) | | 14907 | root | localhost | test | Query | 7 | Waiting for semi-sync ACK from slave | insert into abc values(3) | | 14908 | root | localhost | test | Query | 4 | Waiting for semi-sync ACK from slave | insert into abc values(4 | | 14909 | root | localhost | NULL | Query | 0 | starting | show processlist | +-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+ 5 rows in set (0.00 sec) after_sync (root@localhost) [(none)]> show processlist; +-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+ | Id | User | Host | db | Command | Time | State | Info | +-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+ | 14905 | root | localhost | test | Query | 57 | Waiting for semi-sync ACK from slave | insert into abc values(1) | | 14906 | root | localhost | test | Query | 37 | query end | insert into abc values(2) | | 14907 | root | localhost | test | Query | 29 | query end | insert into abc values(3) | | 14908 | root | localhost | test | Query | 21 | query end | insert into abc values(4) | | 14909 | root | localhost | NULL | Query | 0 | starting | show processlist | +-------+------+-----------+------+---------+------+--------------------------------------+---------------------------+

tips: ①为什么after_sync会堆积事务? 这种情况下主接受ack是在一个串行锁(LOCK_COMMIT)的保护下进行的,通过pstack抓线程栈可以看得很清楚,这一点after_commit没有

②ping值返回0.1ms是个什么水准? 千兆网的速度,万兆网0.01ms的样子

③开启半同步复制,sync_binlog可以不设为1来提升性能

错,除非是无损复制(日志先传到slave,sync_binlog可以不用持久化,那after_commit呢)

如果master宕机了,sync_binlog日志没落盘,redo里面有日志,这时候重启就会回滚事务,

回滚后,那slave上又有这个事务,这样就主从不一致了

这种说法,每次主起来的时候需要把从上面的binlog补过来,这个很复杂,很少有人可以做,很难

④线上环境可以配置成两台Slave做无损复制(保证数据不丢),其他的Slave做异步复制(配置为只读,用于负载均衡),都指向同一台Master

作者:91洲际哥 链接:https://www.jianshu.com/p/20cb9967c6ca

转载于:https://www.cnblogs.com/powerwu/articles/11338255.html

相关资源:MySQL关于异步复制、同步复制半同步复制、无损复制的概念与区别
最新回复(0)