企业中,某一台'负载均衡服务器'宕机怎么办?
作者:互联网
---部署keepalived<在所有负载均衡服务器上,本文演示效果仅lb01及lb02两台>
部署完可以达到的效果:
在'启动keepalived服务的服务器组内某台服务器'上产生一个虚拟ip,产生虚拟ip的服务器前提是能提供正常的外界访问,若不能,keepalived应及时想办法找到'可以正常提供访问的服务器',并在上面产生虚拟ip供外界用户访问
<同一组内(本例中lb01,lb02就是同一组)只能定义一个虚拟ip>
假设虚拟ip在lb01负载均衡服务器上,当服务器停止keepalived服务,停止前它会VRRP协议广播:告诉组内其他成员,根据keepalived配置文件规则,你们其中一台服务器新增虚拟ip,我那个虚拟ip会取消,外界的访问马上就到你机器上.
外界用户访问虚拟ip,访问的就是虚拟ip所在的服务器;
当lb01负载均衡服务器宕机,虚拟ip会根据配置文件规则自动跳转到lb02,而两台服务器的Nginx环境是一样的,所以用户的访问内容不会有变化,用户也不会觉得服务端有服务器被切换
要点: 提供同一服务的负载均衡服务器是一组,一组内负载均衡服务器服务器的'Ngn环境'要一模一样
Ngn环境: 安装方式,配置模块,配置文件
1-1 安装软件(负载均衡服务器都要安装)
[root@lb01 ~]# yum install keepalived -y
[root@lb02 ~]# yum install keepalived -y
编辑所有"负载均衡服务器"配置文件
1-21 编辑lb01配置文件
[root@lb01 ~]# vim /etc/keepalived/keepalived.conf
注意:以下为最终配置文件(重要)
! Configuration File for keepalived # 全局配置 global_defs { # 当前服务器中keepalived唯一标识,同一组只能有唯一的lb01<名字> router_id lb01 } # 检测脚本:检测到Nginx服务停止时,重启Nginx再检测,再异常则停止keepalived服务 # check_nginx: 起的名字 vrrp_script check_nginx { # 指定脚本路径,checkNG.sh是创建的脚本名 script "/etc/keepalived/checkNG.sh" # 执行脚本时间间隔sec interval 5 } # 配置VRRP协议 vrrp_instance VI_1 { # 非抢占式设置1: 状态改为BACKUP # 状态: MASTER和BACKUP state BACKUP # 非抢占式设置2 执行开启动作 nopreempt # 绑定网卡 interface eth0 # 虚拟路由标识,可以理解为分组 virtual_router_id 50 # 优先级- 数字大小表示 priority 90 # VRRP协议广播时间间隔 sec,下面含义: 每隔1sec广播一次 advert_int 1 # keepalived身份认证,通过密码认证,则证明其是同一个分组 authentication { # 认证类型 auth_type PASS # 认证密码 auth_pass 1111 } # 设置虚拟ip-此ip跳转到哪台'负载均衡服务器',则哪台'负载均衡服务器'开始工作 virtual_ipaddress { # 设置的虚拟ip要是当前'负载均衡服务器'绑定网卡所在的网段内;当前绑定网卡是eth0,上边有写 # 虚拟ip即公共ip 192.168.15.55 } # 调用上边检测'Nginx服务状态'的脚本,也可叫脚本启动开关 track_script { check_nginx } }
1-22 编辑其他配置文件 编辑lb02配置文件 [root@lb01 ~]# scp /etc/keepalived/keepalived.conf root@192.168.15.6:/etc/keepalived/ 修改点1 改名字 修该点2 改为BACKUP 修改点3 比lb01小即可 1-3 启动并开机自启 [root@lb01 ~]# systemctl enable --now keepalived [root@lb02 ~]# systemctl enable --now keepalived 1-4 查看新增虚拟ip(专业叫VIP)<最终版到此结束,在浏览器输入虚拟ip测试能否访问> [root@lb01 ~]# ip a [root@lb02 ~]# ip a 1-5 验证虚拟ip自动切换到'keepalived服务处于活动状态'的服务器 停止lb01keepalived活动状态 [root@lb01 ~]# systemctl stop keepalived 查看lb02ip [root@lb02 ~]# ip a 发现配置文件中虚拟ip被新增到此处,那么验证了虚拟ip自动切换 1-6 输入虚拟ip192.168.15.55可以实现访问 - 外界用户就是通过此ip所对应的域名访问的 [root@lb02 conf.d]# systemctl stop keepalived 2 ---Nginx宕机怎么办? 背景结论:虚拟ip所在的负载均衡服务器的Nginx服务停止后,虚拟ip没有自动跳转,外界用户访问失败 解决办法: 想办法告诉keepalived,当Nginx异常时,让其自动关闭keepalived服务 step2-1 新增可执行脚本-Nginx服务宕机后,停止keepalived服务 step2-2 将脚本文件的路径和启动开关添加到keepalived配置文件,实现自动化检测,并做对应处理 背景1 同一组的服务器的keepalived都处于活动状态 背景2 查看虚拟ip所在机器 [root@lb01 conf.d]# ip a 背景3 [root@lb01 conf.d]# systemctl stop nginx [root@lb01 conf.d]# systemctl status nginx 背景4 访问虚拟ip 发现无法访问,说明虚拟ip在此服务器上没有跳转 背景5 验证虚拟ip没有跳转 [root@lb01 conf.d]# ip a 解决步骤 step2-1 新增可执行脚本-Nginx服务宕机后,停止keepalived服务 2-11 脚本要创建在keepalived的配置目录下(千万不能错) [root@lb01 ~]# cd /etc/keepalived [root@lb01 keepalived]# vim checkNG.sh
#!/bin/bash # 查看Nginx进程,其中 "-q"静默输出 ps -ef | grep -q [n]ginx # 如果Nginx未正常启动; # 其中 $?: 上一指令的返回值,0表示没有错误,其他数字表示有错误;本次: Nginx正常启动,上调指令会过滤出进程,,则'$?'返回0; # 其中'-ne':不等于; if [ $? -ne 0 ];then # 启动Nginx,'&'将前边的输出结果 放到'/dev/null'路径下,原因输出结果不需要打印出来; systemctl start nginx &>/dev/null sleep 2 # 再次查看Nginx进程 ps -ef | grep -q [n]ginx # 如果Nginx未正常启动; if [ $? -ne 0 ];then # 停止keepalived服务 systemctl stop keepalived # if语句结尾固定搭配 fi fi
配置实际 2-12 添加可执行权限 [root@lb01 keepalived]# chmod +x checkNG.sh 2-13模拟Nginx故障,确认脚本效果 2-131模拟 2-131-1 查看Nginx状态,关闭则启动 [root@lb01 ~]# systemctl status nginx 关闭则执行如下命令 [root@lb01 ~]# systemctl start nginx 2-131-2 查看keepalived状态,关闭则启动 [root@lb01 ~]# systemctl status keepalived 关闭则执行如下命令 [root@lb01 ~]# systemctl start keepalived 2-131-3 确保虚拟ip在某服务器上 [root@lb01 ~]# ip a 2-131-4对nginx配置文件改成错误的 [root@lb01 ~]# cd /etc/nginx/conf.d/ [root@lb01 conf.d]# ll [root@lb01 conf.d]# vim game.conf 改成错误的配置文件 2-132 确认脚本生效 2-132-1关闭Nginx服务 [root@lb01 conf.d]# systemctl stop nginx 2-132-2启动脚本 [root@lb01 conf.d]# /etc/keepalived/checkNG.sh 2-132-3 查看keepalived活动状态 [root@lb01 conf.d]# systemctl status keepalived 结果dead,说明脚本生效 演示 2-132-4 查看同一组负载均衡服务器lb02,发现虚拟ip已经在此处新增,原来的lb01的虚拟ip也没有了 2-132-5 输入虚拟ip,访问正常;说明该脚本可以实现"某负载均衡服务器故障时,将访问切换到其他服务器" step2-2 将脚本文件的路径和启动开关添加到keepalived配置文件,实现自动化检测,并做对应处理 前提1 [root@lb01 conf.d]# vim /etc/nginx/conf.d/game.conf 把错误配置内容去掉 前提2 [root@lb01 ~]# nginx -t nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful 前提3 [root@lb01 ~]# systemctl restart nginx 确认正常启动 [root@lb01 ~]# systemctl status nginx 正文内容 2-21 [root@lb01 ~]# cd /etc/keepalived/ [root@lb01 keepalived]# vim keepalived.conf 加入以下内容到脚本 内容1: 内容2: 启动开关 2-22 复制脚本和配置文件到同组内其他负载均衡服务器 [root@lb01 keepalived]# scp /etc/keepalived/checkNG.sh root@192.168.15.6:/etc/keepalived/ [root@lb01 keepalived]# scp /etc/keepalived/keepalived.conf root@192.168.15.6:/etc/keepalived/ 修改192.168.15.6内配置 [root@lb02 keepalived]# vim /etc/keepalived/keepalived.conf 修改1 修改2 修改3 2-23 重启keepalived lb02重启 [root@lb02 keepalived]# systemctl restart keepalived [root@lb02 keepalived]# systemctl status keepalived lb01重启 [root@lb01 keepalived]# systemctl restart keepalived [root@lb01 keepalived]# systemctl status keepalived 2-24 检查配置是否生效 2-24-1 检查1 [root@lb01 ~]# systemctl stop nginx [root@lb01 ~]# systemctl status nginx 发现Nginx竟然启动了,说明时配置文件调用了脚本 2-24-2 检查2 [root@lb01 conf.d]# vim game.conf [root@lb01 conf.d]# systemctl stop nginx [root@lb01 conf.d]# systemctl status keepalived 结果dead,说明脚本生效 2-25 配置文件生效确认 2-25-1 查看同一组负载均衡服务器lb02,发现虚拟ip已经在此处新增,原来的lb01的虚拟ip也没有了 2-25-2 输入虚拟ip,访问正常;说明该脚本可以实现"某负载均衡服务器故障时,将访问切换到其他服务器",不ying 2-26 将配置文件改为正确的并启动两个服务 [root@lb01 conf.d]# vim game.conf [root@lb01 conf.d]# systemctl start nginx keepalived 3 ---某个组内的keepalived无法互相广播怎么办? 以下仅理论,并无实际脚本文件 知识点 什么是keepalived脑裂: 两台'高可用'服务器,在指定时间内,无法互相检测到对方'keepalived活动状态'而各自启动故障转移功能 比如,防火墙打开,VRRP协议所进行的广播进行不了,那么也就互相不知道对方的情况,那么会造成各自都生成配置文件中定义的虚拟ip,这是你让用户端的浏览器怎么选择? 解决思路: 如果对方机器真的时关机了,对方的ip是ping不通的;所以即使keepalived无法通信,只要ip能ping通远程服务器,说明服务器能正常提供服务,keepalived就不需要关闭; 所以,去判断对方的虚拟ip是否ping的通; 3-1 ping下虚拟ip [root@lb01 keepalived]# ping 192.168.15.55 能ping通,说明可以正常提供访问服务 3-2 指定ping次数 3-3 设定'不输出ping结果' [root@lb01 keepalived]# ping -c 1 192.168.15.55 &>/dev/null 确认上一命令执行ok [root@lb01 keepalived]# echo $? 3-4 ping一个不存在的ip,ping不通,$?对应显示数字1 4 --- 配置非抢占式 原因: 配置非抢占式,就是用户访问正常时,防止启动优先级高的keepalived服务后自动切换ip,然后出现出现卡顿(虚拟ip切换到别的机器会卡顿,哪个访问的圈一直在转,对用户来说体验非常不好) 实现非抢占式需 同一组内所有负载均衡服务器 4.1 状态全部都有设置成backup 4.2 增加 nopreempt 4.3 重启 [root@lb01 keepalived]# systemctl restart keepalived [root@lb01 keepalived]# systemctl status keepalived [root@lb02 keepalived]# systemctl restart keepalived [root@lb02 keepalived]# systemctl status keepalived 4.4 [root@lb01 keepalived]# systemctl stop keepalived 发现虚拟IP出现在了lb02 4.5 [root@lb01 keepalived]# systemctl start keepalived [root@lb01 keepalived]# systemctl status keepalived [root@lb01 keepalived]# ip a 无出现虚拟ip ip 仍在lb02 说明,虽然lb01启动了且优先级高,但是因为lb02可以正常提供服务,并没有切换机器,减少 虚拟ip切换机器时造成卡顿,使用户访问体验受挫 补充: 1 为了使其他服务器新搭建的Nginx配置与lb01服务器一样 2 挂载知识 3 [root@lb01 conf.d]# ps -ef | grep [n]ginx 4 [root@lb01 ~]# echo $?
标签:负载,宕机,ip,keepalived,lb01,conf,服务器,systemctl,root 来源: https://www.cnblogs.com/tslam/p/15786715.html