Pacemaker实现双机热备
ccwgpt 2025-01-14 11:21 62 浏览 0 评论
在互联网高速发展的今天,尤其在电子商务的发展,要求服务器能够提供不间断服务。在电子商务中,如果服务器宕机,造成的损失是不可估量的。要保证服务器不间断服务,就需要对服务器实现冗余。在众多的实现服务器冗余的解决方案中,Pacemaker为我们提供了廉价的、可伸缩的高可用解决方案。
双机热备测试环境如下:
1 2 3 4 5 | 主节点:10.0.0.20 副节点:10.0.0.21 虚拟IP:10.0.0.100 |
一、关闭selinux和防火墙-两台机均执行
1、 关闭selinux
1 2 | $ sudo sed -i “s/SELINUX=enforcing/SELINUX=disabled/g” /etc/selinux/config $ sudo reboot |
2、 闭防火墙
1 2 | $ sudo systemctl stop firewalld $ sudo systemctl disable firewalld |
二、两台机安装Pacamaker
1、 利用yum安装Pacemaker
1 | $ sudo yum install -y fence-agents-all corosync pacemaker pcs |
2、 修改两台机的hostname
1 2 3 4 5 | #主节点改为node1 $ sudo hostnamectl set-hostname node1 #副节点 $ sudo hostnamectl -set-hostname node2 |
3、 修改两台机的hosts
1 2 3 4 | $ sudo vim /etc/hosts 10.0.0.20 node1 10.0.0.21 node2 |
三、node1与node2实现无密钥访问
1 2 3 4 5 6 7 | #在两台机均运行以下命令 $ sudo -i # ssh-keygen # ssh-copy-id -p 22 root@10.0.0.20 # ssh-copy-id -p 22 root@10.0.0.21 |
四、配置两台机的集群用户hacluster,此帐户在安装Pacemaker时已经自动创建。
1 2 3 | #设置hacluster用户的密码 $ sudo passwd hacluster |
五、配置集群节点之间的认证
1、 启动并设置开机启动pcsd服务,两台机上均执行以下命令
1 2 3 | $ sudo systemctl start pcsd $ sudo systemctl enable pcsd |
2、 配置节点间的认证,以下命令只在node1节点上执行
1 2 3 | #以下操作需要输入用户名hacluster和密码 $ sudo pcs cluster auth node1 node2 |
到此为止,节点认证配置完成!
六、Pacemaker可以为多种服务提供支持,例如Apache、MySQL、Xen等,可使用的类型有IP地址、文件系统、服务、fence设备等。以下以Apache为例。
1、 两台机均安装httpd
1 | $ sudo yum install -y httpd |
2、 设置httpd.conf-两台主机均配置
1 2 3 4 5 6 7 8 9 10 | $ sudo vim /etc/httpd/conf/httpd.conf Listen 0.0.0.0:80 ServerName www.node1.com //另外一台为www.node2.coom #设置服务器状态页面以便集群检测 <Location /server-status> SetHandler server-status Require all granted </Location> |
3、Pacemaker可以控制httpd服务的启动和关闭,所以node1和node2配置完httpd后需关闭httpd服务。
1 | $ sudo systemctl stop httpd |
七、 新建并启动集群,以下操作均在node1上执行
1、 新建一个名为mycluster的集群
1 | $ sudo pcs cluster setup --name mycluster node1 node2 |
2、 启动集群
1 | $ sudo pcs cluster start --all |
3、 设置自启动集群
1 2 3 4 | $ sudo pcs cluster enable –all # 查看集群状态 $ sudo pcs status |
通过以上在node1的设置后,所有的设置都会同步在node2上。
八、为集群添加资源
1 2 3 4 5 6 7 8 9 | #添加一个名为VIP的IP地址资源 #使用heartbeat作为心跳检测 #集群每隔30s检查该资源一次 $ sudo pcs resource create VIP ocf:heartbeat:IPaddr2 ip=10.0.0.100 cidr_netmask=24 op monitor interval=30s $ sudo pcs resource create Web ocf:heartbeat:apache configfile=/etc/httpd/conf/httpd.conf statusurl="http://127.0.0.1/server-status" op monitor interval=30s $ sudo pcs status |
九、调整资源,让VIP和Web两个资源“捆绑”在一起。
1 2 3 4 5 6 7 8 9 | # 方式一:将VIP和Web添加到myweb组中 $ sudo pcs resource group add myweb VIP $ sudo pcs resource group add myweb Web # 方式二:使用托管约束 $ sudo pcs constraint colocation add Web VIP INFINITY # 设置先启动VIP,再启动Web $ sudo pcs constraint order start VIP then start Web |
十、优先级:如果node1与node2的硬件配置不同,那么应该调整节点的优先级,让资源运行于硬件配置更好的服务器上,待其失效后再转移至较低配置的服务器上。这就需要配置优先级(Pacemaker中称为Location)。
1、调整Location
1 2 3 | # 数值越大表示优先级越高 $ sudo pcs constraint location Web prefers node1=10 $ sudo pcs constraint location Web prefers node2=5 |
2、查看设置结果
1 | $ sudo crm_simulate -sL |
3、验证VIP是否启用-需显示IP10.0.0.100
1 | $ ip addr show |
4、验证httpd是否启动
1 | $ ps -aux|grep httpd |
5、报错:WARNING: no stonith devices and stonith-enabled is not false,请执行以下命令:
1 | $ sudo pcs property set stonith-enabled=false |
十一、 启动后正常情况下VIP设置在主节点10.0.0.20上。如主节点故障,则节点node2自动接管服务,方法是直接重启节点node1,然后观察备用节点是否接管了主机的资源,测试过程如下:
1、 在节点node1上执行重启操作
1 2 | #执行重启 $ sudo reboot |
2、node1重启前截图
3、node1重启后状态如下图
4、当节点node1故障时,地点node2收不到心跳请求,超过设置的时间节点后node2启用资源接管程序,上述命令输出中说明VIP和Web已经被节点node2成功接管。如果节点node1恢复且设置了优先级,VIP和Web又会重新被节点node1接管。下图为node1重启后的截图:
另附oracle主、从自动切换方案
各个部分功能说明:
1、keepalived只用作vip功能;
2、check_oracle.sh脚本用于检测master服务,并执行vip、oracle切换;
通过“select status from v$instance;”获取master上oracle的数据状态,由返回值进行判断。
check_oracle.sh
#!/bin/sh
monitor_ip=192.168.3.186
ssh_port=22
logfile=/etc/keepalived/check_oracle.log
#check ssh port status
function check_ssh_port()
{
/usr/bin/nc -z -w 5 -n $monitor_ip $ssh_port 1 > /dev/nul
if [ $? = 0 ]; then
ssh_status=0
else
ssh_status=1
fi
return $ssh_status
}
#oracle_check_status
function check_oracle_helth()
{
source /home/oracle/.bash_profile
source /home/oracle/.bashrc
oracle_check_status=$(su - oracle -c "sqlplus sys/oracle@${monitor_ip}:1521/mydb as sysdba | grep -A 2 STATUS | sed -n '3p'" <<EOF
select status from v\$instance;
EOF
)
if [ "$oracle_check_status" == OPEN ];then
oracle_status=0
else
oracle_status=1
fi
#echo $oracle_check_status
return $oracle_status
}
#update oracle slave to master
function change_oracle_status()
{
source /home/oracle/.bash_profile
source /home/oracle/.bashrc
su - oracle -c 'sqlplus / as sysdba' <<EOF
alter database recover managed standby database finish force;
alter database commit to switchover to primary with session shutdown;
alter database open;
EOF
}
check_time=5
#!=0
while [ $check_time -ne 0 ];do
let "check_time -= 1"
check_ssh_port
echo $ssh_status
if [ $ssh_status = 0 ];then
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH ok, success_code:[$ssh_status]
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - start check oracle status......
check_oracle_helth
if [ $oracle_status = 0 ];then
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - ORACLE ok, success_code:[$oracle_status]
else
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - ORACLE Down, fail_code:[$oracle_status]
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Keepalived stop......
ssh root@$monitor_ip '/etc/init.d/keepalived stop'
wait
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Keepalived Already stop
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Start update oracle slave stauts......
change_oracle_status
wait
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Oracle slave update to master Success
sed 's/.*check_oracle.sh$//g' /var/spool/cron/root
/etc/init.d/crond restart
fi
else
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH error 1, fail_code:[$ssh_status]
sleep 3
check_ssh_port
if [ $ssh_status = 0 ];then
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH ok, success_code:[$ssh_status]
else
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH error 2, fail_code:[$ssh_status]
sleep 3
check_ssh_port
if [ $ssh_status = 0 ];then
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH ok, success_code:[$ssh_status]
else
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH error 3, fail_code:[$ssh_status]
sleep 3
check_ssh_port
if [ $ssh_status = 0 ];then
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH ok, success_code:[$ssh_status]
else
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH error 4, fail_code:[$ssh_status]
sleep 3
check_ssh_port
if [ $ssh_status = 0 ];then
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH ok, success_code:[$ssh_status]
else
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - SSH error 5, fail_code:[$ssh_status]
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Start update oracle slave stauts......
change_oracle_status
wait
echo `date --date=today +"%Y-%M-%d %H:%m:%S"` - [INFO] - Oracle slave update to master Success
sed 's/.*check_oracle.sh$//g' /var/spool/cron/root
/etc/init.d/crond restart
fi
fi
fi
fi
fi
sleep 5
done
检测流程图:
脚本由crond执行,每1分钟执行一次,每执行一次,脚本内循环检测5次,首先判断服务器ssh端口是否正常,正常情况下,再去检查oracle状态,根据返回的状态决定是否进行切换,如果ssh端口异常,则进行5次检查判断,5次以内返回正常的话,则重新进行检测,如果第5次仍异常,则进行切换。
相关推荐
- 定时任务工具,《此刻我要...》软件体验
-
之前果核给大家介绍过一款小众但实用的软件——小说规则下载器,可以把网页里的小说章节按照规则下载到本地,非常适合喜欢阅读小说的朋友。有意思的是,软件作者当时看到果核写的体验内容后,给反推荐到他的帖子里去...
- 前端定时任务的神库:Node-cron,让你的项目更高效!
-
在前端开发中,定时任务是一个常见的需求。无论是定时刷新数据、轮询接口,还是发送提醒,都需要一个可靠且灵活的定时任务解决方案。今天,我要向大家介绍一个强大的工具——Node-cron,它不仅能解决定时任...
- Shutter Pro!一款多功能定时执行任务工具
-
这是一款可以在电脑上定时执行多种任务的小工具,使用它可以根据时间,电量等来设定一些定时任务,像定时打开程序、打开文件,定时关机重启,以及定时弹窗提醒等都可以轻松做到。这是个即开即用的小工具,无需安装,...
- 深度解析 Redis 缓存击穿及解决方案
-
在当今互联网大厂的后端开发体系中,Redis缓存占据着极为关键的地位。其凭借高性能、丰富的数据类型以及原子性操作等显著优势,助力众多高并发系统从容应对海量用户的访问冲击,已然成为后端开发从业者不可或...
- 从零搭建体育比分网站完整步骤(比较好的体育比分软件)
-
搭建一个体育比分网站是一个涉及前端、后端、数据源、部署和维护的完整项目。以下是从零开始搭建的详细流程:一、明确项目需求1.功能需求:实时比分展示(如足球、篮球、网球等)支持多个联赛和赛事历史数据查询比...
- 告别复杂命令行:GoCron 图形界面让定时任务触手可及
-
如果你是运维人员或者经常接触一些定时任务的配置,那么你一定希望有一款图形界面来帮助你方便的轻松配置定时任务,而GoCron就是这样一款软件,让你的配置可视化。什么是GoCron从名字你就可以大概猜到,...
- Java任务管理框架核心技术解析与分布式高并发实战指南
-
在当今数字化时代,Java任务管理框架在众多应用场景中发挥着关键作用。随着业务规模的不断扩大,面对分布式高并发的复杂环境,掌握其核心技术并进行实战显得尤为重要。Java任务管理框架的核心技术涵盖多个方...
- 链表和结构体实现:MCU软件定时器(链表在单片机中的应用)
-
在一般的嵌入式产品设计中,介于成本、功耗等,所选型的MCU基本都是资源受限的,而里面的定时器的数量更是有限。在我们软件设计中往往有多种定时需求,例如脉冲输出、按键检测、LCD切屏延时等等,我们不可能...
- SpringBoot定时任务(springboot定时任务每小时执行一次)
-
前言在我们开发中,经常碰到在某个时间点去执行某些操作,而我们不能人为的干预执行,这个时候就需要我们使用定时任务去完成该任务,下面我们来介绍下载springBoot中定时任务实现的方式。定时任务实现方式...
- 定时任务新玩法!systemd timer 完整实战详解
-
原文链接:「链接」Hello,大家好啊!今天给大家带来一篇使用systemdtimer实现定时任务调度的详细实战文章。相比传统的crontab,systemdtimer更加现代化、结构清晰...
- Celery与Django:打造高效DevOps的定时任务与异步处理神器
-
本文详细介绍了Celery这一强大的异步任务队列系统,以及如何在Django框架中应用它来实现定时任务和异步处理,从而提高运维开发(DevOps)的效率和应用性能。下面我们先认识一下Cele...
- 订单超时自动取消的7种方案,我用这种!
-
前言在电商、外卖、票务等系统中,订单超时未支付自动取消是一个常见的需求。这个功能乍一看很简单,甚至很多初学者会觉得:"不就是加个定时器么?"但真到了实际工作中,细节的复杂程度往往会超...
- 裸机下多任务框架设计与实现(gd32裸机配置lwip 网络ping不通)
-
在嵌入式系统中,特别是在没有操作系统支持的裸机环境下,实现多任务执行是一个常见的挑战。本文将详细介绍一种基于定时器的多任务框架设计,通过全局时钟和状态机机制,实现任务的非阻塞调度,确保任务执行中不会出...
- 亿级高性能通知系统构建,小白也能拿来即用
-
作者介绍赵培龙,采货侠JAVA开发工程师分享概要一、服务划分二、系统设计1、首次消息发送2、重试消息发送三、稳定性的保障1、流量突增2、问题服务的资源隔离3、第三方服务的保护4、中间件的容错5、完善...
- 运维实战:深度拆解Systemd定时任务原理,90%的人不知道的玩法
-
运维实战:深度拆解Systemd定时任务原理,90%的人不知道的高效玩法一、Systemd定时任务的核心原理Systemd定时任务是Linux系统中替代传统cron的现代化解决方案,通过...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- MVC框架 (46)
- spring框架 (46)
- 框架图 (58)
- bootstrap框架 (43)
- flask框架 (53)
- quartz框架 (51)
- abp框架 (47)
- jpa框架 (47)
- laravel框架 (46)
- express框架 (43)
- springmvc框架 (49)
- 分布式事务框架 (65)
- scrapy框架 (56)
- shiro框架 (61)
- 定时任务框架 (56)
- grpc框架 (55)
- ppt框架 (48)
- 内联框架 (52)
- winform框架 (46)
- gui框架 (44)
- cad怎么画框架 (58)
- ps怎么画框架 (47)
- ssm框架实现登录注册 (49)
- oracle字符串长度 (48)
- oracle提交事务 (47)