首页 > 代码库 > 赛门铁克VCS(Veritas Cluster Server)双机日常管理
赛门铁克VCS(Veritas Cluster Server)双机日常管理
1. 查看VCS版本及License信息
PSDB01:~ # vxlicrep Symantec License Manager vxlicrep utility version 3.02.51.010 Copyright (C) 1996-2010 Symantec Corporation. All rights reserved. Creating a report on all VERITAS products installed on this system -----------------***********************----------------- License Key = XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-X Product Name = VERITAS Cluster Server Serial Number = XXXX License Type = PERMANENT OEM ID = 2006 Site License = YES Editions Product = YES Features := Platform = Unused Version = 5.1 Tier = Unused Reserved = 0 Mode = VCS CPU_TIER = 2 VXKEYLESS = Enabled
2. VCS集群编号及心跳网卡设置
PSDB01:~ # lltstat -l LLT link information: link 0 eth10 on ether hipri mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6 txpkts 67688788 txbytes 1843243673 rxpkts 76679165 rxbytes 1360585331 latehb 0 badcksum 0 errors 0 link 1 eth9 on ether hipri mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6 txpkts 67689522 txbytes 1843879628 rxpkts 276962155 rxbytes 1467872503 latehb 0 badcksum 0 errors 0 link 2 eth8 on ether lowpri mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6 txpkts 21897078 txbytes 1072847300 rxpkts 222319811 rxbytes 1191109452 latehb 0 badcksum 0 errors 0 PSDB01:~ # cat /etc/llttab set-node PSDB01 set-cluster 117 link eth10 eth-80:fb:06:35:b8:9f - ether - - link eth9 eth-80:fb:06:35:b8:a1 - ether - - link-lowpri eth8 eth-80:fb:06:35:b8:a0 - ether - - PSDB01:~ # lltstat -n LLT node information: Node State Links * 0 PSDB01 OPEN 3 1 PSDB02 OPEN 3说明:我们这里使用了3张网卡用于心跳。如果lltstat查看时,links数量不够,那么就有可能是有网络故障,而我碰到最多是由于网卡在down状态,ifup一下网卡即可。
3. 查看VCS双机状态
RMCDB02:~ # hastatus -sum -- SYSTEM STATE -- System State Frozen A RMCDB01 RUNNING 0 A RMCDB02 RUNNING 0 -- GROUP STATE -- Group System Probed AutoDisabled State B RCS_DB_SG RMCDB01 Y N ONLINE B RCS_DB_SG RMCDB02 Y N OFFLINE
4. 启动、停止VCS集群
(1)启动时,如果是两个节点的集群,那么需要在每个节点上,用root用户执行:hastart,然后使用hastatus来查看启动过程中资源的状态信息
(2)停止时,只需要在其中一个节点上,使用root用户执行:hastop -all,同样是使用hastatus来查看状态,这个需要在每个节点上确认VCS已经停止完毕
注意:不管是启动,还是停止,VCS的日志是一定要查看,尤其是启动时,可以帮助排查启动过程中的问题。默认的VCS日志文件:
/var/VRTSvcs/log/engine_A.log
5. 冻结、解冻资源组
这是我经常使用的。何谓冻结,通俗的来说,就是让VCS暂时不管理集群,即使监控到有节占上资源组状态不正确,也不会发生切换或重新拉起操作。在维护中经常使用到,比如:oracle数据库打补丁、重启监听之类。
<strong>冻结双机:</strong> RMCDB02:~ # hagrp -freeze RCS_DB_SG RMCDB02:~ # hastatus -sum -- SYSTEM STATE -- System State Frozen A RMCDB01 RUNNING 0 A RMCDB02 RUNNING 0 -- GROUP STATE -- Group System Probed AutoDisabled State B RCS_DB_SG RMCDB01 Y N ONLINE B RCS_DB_SG RMCDB02 Y N OFFLINE -- GROUPS FROZEN -- Group C RCS_DB_SG -- RESOURCES DISABLED -- Group Type Resource H RCS_DB_SG Application ora_raw H RCS_DB_SG Application ora_vg H RCS_DB_SG IP ora_ip H RCS_DB_SG NIC ora_nic H RCS_DB_SG Netlsnr ora_listener H RCS_DB_SG Oracle ora_ora11g <strong>解冻双机:</strong> RMCDB02:~ # hagrp -unfreeze RCS_DB_SG
6. VCS双机切换
这个也是我经常使用到的。主要是监控到集群内主机可能出现故障,所以人为有计划的将资源组切换到另外一个节点中;或者是硬件维护、系统重启。
NDMCDB04:~ # hastatus -sum -- SYSTEM STATE -- System State Frozen A NDMCDB03 RUNNING 0 A NDMCDB04 RUNNING 0 -- GROUP STATE -- Group System Probed AutoDisabled State B RCS_NDMCDB_RG NDMCDB03 Y N ONLINE B RCS_NDMCDB_RG NDMCDB04 Y N OFFLINE NDMCDB04:~ # hagrp -switch RCS_NDMCDB_RG -to NDMCDB04 ## 将资源从NDMCDB03切换到NDMCDB04主机上
7. VCS双机启动故障问题排查
故障现象
执行hastart 命令启动双机后,执行hastatus -sum命令查看双机状态,显示信息如下:
attempting to connect....connected
group resource system message
--------------- -------------------- -------------------- --------------------
test-smc3 STALE ADMIN WAIT: all systems stale
STALE_ADMIN_WAIT: The system has a stale configuration and no other system is in a RUNNING state.
ADMIN_WAIT: The system cannot build or obtain a valid configuration.
双机状态处于 STALE_ADMIN_WAIT 或ADMIN_WAIT 状态,不能正常启动双机软件。
操作步骤
步骤 1 验证配置文件main.cf是否正确。
请根据实际业务应用情况修改main.cf配置文件。
步骤 2 执行hacf –verify config_dir命令验证配置文件语法的正确性。如:
# hacf -verify /etc/VRTSvcs/conf/config
如果存在错误信息,则需要根据提示信息修改“main.cf”文件。
步骤 3 执行hasys -force 节点名命令启动VCS。
执行hastart 命令启动双机后,执行hastatus -sum命令查看双机状态,显示信息如下:
attempting to connect....connected
group resource system message
--------------- -------------------- -------------------- --------------------
test-smc3 STALE ADMIN WAIT: all systems stale
STALE_ADMIN_WAIT: The system has a stale configuration and no other system is in a RUNNING state.
ADMIN_WAIT: The system cannot build or obtain a valid configuration.
双机状态处于 STALE_ADMIN_WAIT 或ADMIN_WAIT 状态,不能正常启动双机软件。
操作步骤
步骤 1 验证配置文件main.cf是否正确。
请根据实际业务应用情况修改main.cf配置文件。
步骤 2 执行hacf –verify config_dir命令验证配置文件语法的正确性。如:
# hacf -verify /etc/VRTSvcs/conf/config
如果存在错误信息,则需要根据提示信息修改“main.cf”文件。
步骤 3 执行hasys -force 节点名命令启动VCS。
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。