首页 > 代码库 > heartbeat
heartbeat
#########################
######## heartbeat ########
#########################
server4,server5
[root@server4 mnt]# ls
heartbeat-3.0.4-2.el6.x86_64.rpm heartbeat.pdf
heartbeat-devel-3.0.4-2.el6.x86_64.rpm ldirectord-3.9.5-3.1.x86_64.rpm
heartbeat-libs-3.0.4-2.el6.x86_64.rpm
[root@server4 mnt]# yum install heartbeat-* -y
cd /usr/share/doc/heartbeat-3.0.4/
cp ha.cf authkeys haresources /etc/ha.d/
cd /etc/ha.d/
vim authkeys
vim haresources
vim ha.cf
logfacility local0 ##日志等级,取默认值
keepalive 2 ##心跳频率,自己设定。1:表示 1 秒;200ms:表示 200 毫秒
deadtime 30 ##节点死亡时间阀值,就是从节点在过了 30 后还没有收到心跳就认为主节点死亡,自己设定
warntime 10 ##发出警告时间,自己设定
initdead 60 ##守护进程首次启动后应该等待 60 秒后再启动主服务器上的资源
udpport 24 ##心跳信息传递的 udp 端口,使用端口 24 进行 bcast 和 ucast 通信 , 取默认值
#baud 19200 #串口波特率,与 serial 一起使用。
#serial /dev/ttyS0 #采用串口来传递心跳信息。
bcast eth0 ##采用 udp 广播播来通知心跳
#ucast eth1 10.0.0.3 #采用网卡 eth1 的 udp 单播来通知心跳,eth1 的 IP
# mcast eth0 225.0.0.1 694 1 0 #采用 udp 多播播来通知心跳
auto_failback on ##当主节点恢复后,是否自动切回
#stonith baytech /etc/ha.d/conf/stonith.baytech #stonith 用来保证共享存储环境中的数据完整性
#watchdog /dev/watchdog #watchdog 能让系统在出现故障 1 分钟后重启该机器,这个功能可以帮助服务器在确实停止心
跳后能够重新恢复心跳。 如果使用该特性,修改系统中/etc/modprobe.conf, 添加如下行
options softdog nowayout=0
这样在系统启动的时候,在内核中装入"softdog"内核模块,用来生成实际的设备文件
/dev/watchdog
node server4 ##主节点名称,与 uname –n 保持一致。排在第一的默认为主节点,所以不要搞措顺序
node server5 ##副节点名称,与 uname –n 保持一致
ping 172.25.24.250 #网段
respawn hacluster /usr/lib64/heartbeat/ipfail
apiauth ipfail gid=haclient uid=hacluster
默认 heartbeat 并不检测除本身之外的其他任何服务,也不检测网络状况。
所以当网络中断时,并不会进行 Load Balancer 和 Backup 之间的切换。
可以通过 ipfail 插件,设置‘ping nodes‘来解决这一问题,但不能使用一个集群节点作为
ping 的节点。
chmod 600 authkeys
/etc/init.d/httpd stop
scp ha.cf authkeys haresources server5:/etc/ha.d/
/etc/init.d/heartbeat start
测试:
[root@server4 ha.d]# /etc/init.d/heartbeat stop
[root@server4 ha.d]# /etc/init.d/heartbeat start
heartbeat