Keepalived+Mysql双主热备高可用环境

mac2024-05-20  38

 

Keepalived介绍

keepalived 免费开源,具备第3、4、7层交换机的功能主要提供 loadbalancing(负载均衡)和 high-availability(高可用)功能负载均衡实现需要依赖Linux的虚拟服务内核模块(ipvs)高可用是通过VRRP协议实现多台机器之间的故障转移服务采用多进程的设计模式,每个进程负责不同的功能

Keepalived的功能体系结构

大致分两层结构:用户空间 user space和内核空间 kernel space

 

 

处于虚线下方的是内核空间

IPVS(IP虚拟服务器),用于实现网络服务的负载均衡NETLINK,提供高级路由及其他相关的网络功能

处于虚线上方的是用户空间

WatchDog :监控子进程VRRP和healthchecker的状况Checkers :负责真实服务器的健康检查healthchecking,是keepalived最主要的功能VRRP Stack:负责负载均衡器之间的失败切换 FailOverIPVS wrapper :用来发送设定的规则到内核 ipvs代码Netlink Reflector :用来设定 vrrp 的vip地址等

VRRP( Virtual Router Redundancy Protocol )协议

用于实现路由器冗余的协议解决静态路由单点故障问题通过一种竞选(election)协议来实现虚拟路由器的功能

 

IPVS( IP Virtual Server )

              Keepalived里面所有对LVS的相关操作并不直接使用ipvsadm这样的用户端程序,而是直接使用IPVS提供的函数进程操作,该代码都在check/ipwrapper.c中

 

1)先实施Master->Slave的主主同步。主主是数据双向同步,主从是数据单向同步。一般情况下,主库宕机后,需要手动将连接切换到从库上。(但是用keepalived就可以自动切换) 2)再结合Keepalived的使用,通过VIP实现Mysql双主对外连接的统一接口。即客户端通过Vip连接数据库;当其中一台宕机后,VIP会漂移到另一台上,这个过程对于客户端的数据连接来说几乎无感觉,从而实现高可用。 MySQL主从与双主搭建请参考:http://www.cnblogs.com/wade-lt/p/9008058.html  

环境描述:

mysql的安装可以参考:http://www.cnblogs.com/kevingrace/p/6109679.html

Centos7.4版本

Master:192.168.0.103        安装mysql和keepalived

Slave : 192.168.0.104        安装mysql和keepalived

VIP:192.168.0.102

    

要实现主主同步,可以先实现主从同步,即master1->master2的主从同步,然后master2->master1的主从同步.

这样,双方就完成了主主同步。

 

            配置Mysql+Keepalived故障转移的高可用环境

1)安装keepalived并将其配置成系统服务。master和salve两台机器上同样进行如下操作: [root@master ~]# yum install -y openssl-devel        #安装依赖 [root@master ~]# cd /tmp [root@master src]# tar -zvxf keepalived-1.4.3.tar.gz   #官网下载并上传至服务器:http://www.keepalived.org/software/(官网) [root@master src]# cd keepalived-1.4.3 [root@master keepalived-1.4.3]# ./configure --prefix=/usr/local/keepalived [root@master keepalived-1.4.3]# make && make install       [root@master keepalived-1.4.3]# cp /usr/local/src/keepalived-1.4.3/keepalived/etc/init.d/keepalived /etc/rc.d/init.d/ [root@master keepalived-1.4.3]# cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/ [root@master keepalived-1.4.3]# mkdir /etc/keepalived/ [root@master keepalived-1.4.3]# cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/ [root@master keepalived-1.4.3]# cp /usr/local/keepalived/sbin/keepalived /usr/sbin/ [root@master keepalived-1.4.3]# echo "/etc/init.d/keepalived start" >> /etc/rc.local   #centos 7 /etc/rc.local ---> /etc/rc.d/rc.local 未能开启自启,修改文件 2)配置master机器上的keepalived.conf配置。(下面配置中没有使用lvs的负载均衡功能,所以不需要配置虚拟服务器virtual server) 注:keepalive.conf文件不能添加多余的字符如“#”注释等,“{}”与标识之间要空一个字符,keepalive.conf详解参考:https://www.cnblogs.com/along1226/p/5027838.html [root@master ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak [root@master ~]# vim /etc/keepalived/keepalived.conf       #清空默认内容,直接采用下面配置:     ! Configuration File for keepalived global_defs {    notification_email {   #指定keepalived在发生切换时需要发送email到的对象,一行一个      acassen@firewall.loc      failover@firewall.loc      sysadmin@firewall.loc    }    notification_email_from Alexandre.Cassen@firewall.loc  #指定发件人    smtp_server 127.0.0.1     #指定smtp服务器地址    smtp_connect_timeout 30    #指定smtp连接超时时间    router_id MASTER-HA       #运行keepalived机器的一个标识 } vrrp_script chk_mysql_port {      #检测mysql服务是否在运行。有很多方式,比如进程,用脚本检测等等     script "/opt/chk_mysql.sh"   #这里通过脚本监测     interval 2           #脚本执行间隔,每2s检测一次     weight -5           #脚本结果导致的优先级变更,检测失败(脚本返回非0)则优先级 -5     fall 2             #检测连续2次失败才算确定是真失败。会用weight减少优先级(1-255之间     rise 1             #检测1次成功就算成功。但不修改优先级 } vrrp_instance VI_1 {     state MASTER            #指定那个为master,那个为backup,如果设置了nopreempt这个值不起作用,主备由priority决定     interface ens33           #设置实例绑定的网卡     mcast_src_ip 192.168.0.103      #发送多播包的地址,如果不设置默认使用绑定网卡的primary ip     virtual_router_id 51         #路由器标识,MASTER和BACKUP必须是一致的     priority 101             #定义优先级,数字越大,优先级越高,在同一个vrrp_instance下,MASTER的优先级必须大于BACKUP的优先级。这样MASTER故障恢复后,就可以将VIP资源再次抢回来     advert_int 1             #检查间隔,默认1秒     authentication {#设置认证         auth_type PASS #认证方式         auth_pass 1111 #认证密码     }     virtual_ipaddress {#设置vip         192.168.0.102/24         #与绑定的网卡实ip掩码相同     }     track_script {  #mysql脚本检测         chk_mysql_port     } }

 

3)编写切换脚本。KeepAlived做心跳检测,如果Master的MySQL服务挂了(3306端口挂了),那么它就会选择自杀。Slave的KeepAlived通过心跳检测发现这个情况,就会将VIP的请求接管 [root@master ~]# vim /opt/chk_mysql.sh #!/bin/bash counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l) if [ "${counter}" -eq 0 ]; then     /etc/init.d/keepalived stop fi   [root@master ~]# chmod 755 /opt/chk_mysql.sh       启动keepalived服务 [root@master ~]# /etc/init.d/keepalived start 正在启动 keepalived:                                      [确定]     

4)slave机器上的keepalived配置。slave机器上的keepalived.conf文件只修改priority为99、nopreempt不设置、real_server设置本地IP。

[root@slave ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak [root@slave ~]# vim /etc/keepalived/keepalived.conf ! Configuration File for keepalived global_defs {    notification_email {      acassen@firewall.loc      failover@firewall.loc      sysadmin@firewall.loc    }    notification_email_from Alexandre.Cassen@firewall.loc    smtp_server 127.0.0.1    smtp_connect_timeout 30    router_id MASTER-HA } vrrp_script chk_mysql_port {     script "/opt/chk_mysql.sh"     interval 2     weight -5     fall 2     rise 1 } vrrp_instance VI_1 {     state BACKUP     interface ens33     mcast_src_ip 192.168.0.104     virtual_router_id 51     priority 99     advert_int 1     authentication {         auth_type PASS         auth_pass 1111     }     virtual_ipaddress {         192.168.0.102/24     }     track_script {         chk_mysql_port     }     }       [root@slave ~]# cat /opt/chk_mysql.sh #!/bin/bash counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l) if [ "${counter}" -eq 0 ]; then     /etc/init.d/keepalived stop fi   [root@slave ~]# chmod 755 /opt/chk_mysql.sh       [root@slave ~]# /etc/init.d/keepalived start 正在启动 keepalived:                                      [确定] 注:如有防火墙,请开放相关权限,如:两台主机之间的通信,vrrp通信以及mysql的3306端口,关闭selinux /etc/selinux/conf ,修改后并使之生效 Mysql+keepalived故障转移的高可用测试

1)通过Mysql客户端通过VIP连接,看是否连接成功。 比如,在远程一台测试机上连接,通过vip地址可以正常连接(下面的连接权限要是在服务端提前授权的) [root@dev-new-test ~]# mysql -h192.168.0.103 -uroot -p123456 2)默认情况下,vip是在master上的。使用"ip a"命令查看vip切换情况 [root@master ~]# ip a 停止master机器上的mysql服务,根据配置中的脚本,mysql服务停了,keepalived也会停,从而vip资源将会切换到slave机器上。(mysql服务没有起来的时候,keepalived服务也无法顺利启动!) [root@master ~]# /etc/init.d/mysql stop Shutting down MySQL.. SUCCESS! [root@master ~]# ps -ef|grep mysql root     25812 21588  0 17:30 pts/0    00:00:00 grep mysql [root@master ~]# ps -ef|grep keepalived root     25814 21588  0 17:30 pts/0    00:00:00 grep keepalived [root@master ~]# ip addr                   1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN     link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00     inet 127.0.0.1/8 scope host lo     inet6 ::1/128 scope host        valid_lft forever preferred_lft forever 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000     link/ether 52:54:00:3c:25:42 brd ff:ff:ff:ff:ff:ff     inet 192.168.0.103/24 brd 192.168.0.255 scope global ens33     inet6 fe80::5054:ff:fe3c:2542/64 scope link        valid_lft forever preferred_lft forever   如上结果,发现vip没有了,说明此时vip资源已不在master机器上了 查看下master的系统日志,如下,会发现vip资源已经切换走了 [root@master ~]# tail -f /var/log/messages

 

再到slave机器上,发现vip资源的确切换过来了 [root@slave ~]# ip addr 1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN     link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00     inet 127.0.0.1/8 scope host lo     inet6 ::1/128 scope host        valid_lft forever preferred_lft forever 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000     link/ether 52:54:00:95:1f:6d brd ff:ff:ff:ff:ff:ff     inet 192.168.0.104/24 brd 192.168.0.255 scope global ens33     inet 192.168.0.102/24 scope global ens33     inet6 fe80::5054:ff:fe95:1f6d/64 scope link        valid_lft forever preferred_lft forever  查看slave的系统日志 [root@slave ~]# tail -f /var/log/messages 3)再次启动master的mysql和keepalived服务。(注意:如果restart重启mysql,那么还要启动下keepalived,因为mysql重启,根据脚本会造成keepalived关闭) 注意:一定要先启动mysql服务,然后再启动keepalived服务。如果先启动keepalived服务,按照上面的配置,mysql没有起来,就会自动关闭keepalived。 [root@master ~]# /etc/init.d/mysql start Starting MySQL.. SUCCESS!   [root@master ~]# /etc/init.d/keepalived start 正在启动 keepalived:                                      [确定]   启动这两个服务器后,稍微等过一会儿,注意观察会发现vip资源再次从slave机器上切换回来了。 [root@master ~]# ip addr 1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN     link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00     inet 127.0.0.1/8 scope host lo     inet6 ::1/128 scope host        valid_lft forever preferred_lft forever 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000     link/ether 52:54:00:3c:25:42 brd ff:ff:ff:ff:ff:ff     inet 192.168.0.103/24 brd 192.168.0.255 scope global ens33     inet 192.168.0.102/24 scope global ens33     inet6 fe80::5054:ff:fe3c:2542/64 scope link        valid_lft forever preferred_lft forever   [root@master ~]# tail -f /var/log/messages 再看看slave机器,发现vip资源又被恢复后的master抢过去了 [root@slave ~]# ip addr 1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN     link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00     inet 127.0.0.1/8 scope host lo     inet6 ::1/128 scope host        valid_lft forever preferred_lft forever 2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000     link/ether 52:54:00:95:1f:6d brd ff:ff:ff:ff:ff:ff     inet 192.168.0.104/24 brd 192.168.0.255 scope global ens33     inet6 fe80::5054:ff:fe95:1f6d/64 scope link        valid_lft forever preferred_lft forever   [root@slave ~]# tail -f /var/log/messages 4)同样,关闭master1机器的keepalived服务,vip资源会自动切换到master2机器上。当master1的keepalived服务恢复后,会将vip资源再次切回来。 以上在vip资源切换过程中,对于客户端连接mysql(使用vip连接)来说几乎是没有任何影响的。------------------------------------温馨提示(Keepalived的抢占和非抢占模式)--------------------------------------- keepalive是基于vrrp协议在linux主机上以守护进程方式,根据配置文件实现健康检查。 VRRP是一种选择协议,它可以把一个虚拟路由器的责任动态分配到局域网上的VRRP路由器中的一台。 控制虚拟路由器IP地址的VRRP路由器称为主路由器,它负责转发数据包到这些虚拟IP地址。 一旦主路由器不可用,这种选择过程就提供了动态的故障转移机制,这就允许虚拟路由器的IP地址可以作为终端主机的默认第一跳路由器。   keepalive通过组播,单播等方式(自定义),实现keepalive主备推选。工作模式分为抢占和非抢占(通过参数nopreempt来控制)。 1)抢占模式: 主服务正常工作时,虚拟IP会在主上,备不提供服务,当主服务优先级低于备的时候,备会自动抢占虚拟IP,这时,主不提供服务,备提供服务。 也就是说,工作在抢占模式下,不分主备,只管优先级。   如上配置,不管keepalived.conf里的state配置成master还是backup,只看谁的priority优先级高(一般而言,state为MASTER的优先级要高于BACKUP)。 priority优先级高的那一个在故障恢复后,会自动将VIP资源再次抢占回来!!   2)非抢占模式: 这种方式通过参数nopreempt(一般设置在advert_int的那一行下面)来控制。不管priority优先级,只要MASTER机器发生故障,VIP资源就会被切换到BACKUP上。 并且当MASTER机器恢复后,也不会去将VIP资源抢占回来,直至BACKUP机器发生故障时,才能自动切换回来。   千万注意: nopreempt这个参数只能用于state为backup的情况,所以在配置的时候要把master和backup的state都设置成backup,这样才会实现keepalived的非抢占模式!   也就是说: a)当state状态一个为master,一个为backup的时候,加不加nopreempt这个参数都是一样的效果。即都是根据priority优先级来决定谁抢占vip资源的,是抢占模式! b)当state状态都设置成backup,如果不配置nopreempt参数,那么也是看priority优先级决定谁抢占vip资源,即也是抢占模式。 c)当state状态都设置成backup,如果配置nopreempt参数,那么就不会去考虑priority优先级了,是非抢占模式!即只有vip当前所在机器发生故障,另一台机器才能接管vip。   即使优先级高的那一台机器恢复  后也不会主动抢回vip,只能等到对方发生故障,才会将vip切回来。---------------------------------mysql状态检测脚本优化--------------------------------- 案例一: 上面的mysql监测脚本有点过于简单且粗暴,即脚本一旦监测到Master的mysql服务关闭,就立刻把keepalived服务关闭,从而实现vip转移!   下面对该脚本进行优化,优化后,当监测到Master的mysql服务关闭后,就会将vip切换到Backup上(但此时Master的keepalived服务不会被暴力kill) 当Master的mysql服务恢复后,就会再次将VIP资源切回来!   [root@master ~]# cat /opt/chk_mysql.sh #!/bin/bash MYSQL=/usr/bin/mysql MYSQL_HOST=localhost MYSQL_USER=root MYSQL_PASSWORD=root CHECK_TIME=3   #mysql  is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0   MYSQL_OK=1   function check_mysql_helth (){     $MYSQL -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1     if [ $? = 0 ] ;then     MYSQL_OK=1     else     MYSQL_OK=0     fi     return $MYSQL_OK } while [ $CHECK_TIME -ne 0 ] do     let "CHECK_TIME -= 1"     check_mysql_helth if [ $MYSQL_OK = 1 ] ; then     CHECK_TIME=0     exit 0 fi if [ $MYSQL_OK -eq 0 ] &&  [ $CHECK_TIME -eq 0 ] then     pkill keepalived     exit 1 fi sleep 1 done

 

案例二:

[root@master opt]# cat chk_mysql.sh #!/bin/bash MYSQL=/usr/bin/mysql MYSQL_HOST=localhost MYSQL_USER=root MYSQL_PASSWORD=root CHECK_TIME=3 #mysql  is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0 MYSQL_OK=1 VIP=192.168.0.102 function check_mysql_helth () {      $MYSQL  -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1      if [ $? -eq 0 ] ;then             MYSQL_OK=1      else             MYSQL_OK=0         fi      return $MYSQL_OK   } while [ $CHECK_TIME -ne 0 ] do      let "CHECK_TIME -= 1"          check_mysql_helth      if [ $MYSQL_OK = 1 ] ; then       CHECK_TIME=0       exit 0   fi   ip a|grep $VIP   if [ $? -eq 0 ] && [ $CHECK_TIME -eq 0 ];then       mount /dev/mapper/mpathb /opt/diskarray       echo "vip is here,mysql is down"       service mysqll restart        if [ $? -ne  0 ];then        echo "vip is here,but mysql is not work !"        /etc/init.d/keepalived restart        umount /dev/mapper/mpathb        exit 1      fi        exit 3    elif [ $MYSQL_OK -eq 0 ] &&  [ $CHECK_TIME -eq 0 ];then       echo " not vip , 2th  check  mysql is down "       exit 5    fi       sleep 2 done

 

 

最新回复(0)