首页 > 代码库 > 赛门铁克VCS(Veritas Cluster Server)双机日常管理

赛门铁克VCS(Veritas Cluster Server)双机日常管理

1. 查看VCS版本及License信息

PSDB01:~ # vxlicrep 

Symantec License Manager vxlicrep utility version 3.02.51.010
Copyright (C) 1996-2010 Symantec Corporation. All rights reserved.
Creating a report on all VERITAS products installed on this system
 -----------------***********************-----------------
   License Key                         = XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-XXXX-X
   Product Name                        = VERITAS Cluster Server
   Serial Number                       = XXXX
   License Type                        = PERMANENT
   OEM ID                              = 2006
   Site License                        = YES
   Editions Product                    = YES
 Features := 
   Platform                            = Unused                             
  Version                             = 5.1                                
   Tier                                = Unused                             
   Reserved                            = 0 
   Mode                                = VCS                                
   CPU_TIER                            = 2
   VXKEYLESS                           = Enabled

2. VCS集群编号及心跳网卡设置

PSDB01:~ # lltstat -l 
LLT link information:
link 0  eth10 on ether hipri
        mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6
        txpkts 67688788  txbytes 1843243673
        rxpkts 76679165  rxbytes 1360585331
        latehb 0  badcksum 0  errors 0
link 1  eth9 on ether hipri
        mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6
        txpkts 67689522  txbytes 1843879628
        rxpkts 276962155  rxbytes 1467872503
        latehb 0  badcksum 0  errors 0
link 2  eth8 on ether lowpri
        mtu 1500, sap 0xcafe, broadcast FF:FF:FF:FF:FF:FF, addrlen 6
        txpkts 21897078  txbytes 1072847300
        rxpkts 222319811  rxbytes 1191109452
        latehb 0  badcksum 0  errors 0
PSDB01:~ # cat /etc/llttab 
set-node PSDB01
set-cluster 117
link eth10 eth-80:fb:06:35:b8:9f - ether - -
link eth9 eth-80:fb:06:35:b8:a1 - ether - -
link-lowpri eth8 eth-80:fb:06:35:b8:a0 - ether - -
PSDB01:~ # lltstat -n
LLT node information:
    Node                 State    Links
   * 0 PSDB01            OPEN        3
     1 PSDB02            OPEN        3
说明:我们这里使用了3张网卡用于心跳。如果lltstat查看时,links数量不够,那么就有可能是有网络故障,而我碰到最多是由于网卡在down状态,ifup一下网卡即可。

3. 查看VCS双机状态

RMCDB02:~ # hastatus -sum

-- SYSTEM STATE
-- System               State                Frozen              

A  RMCDB01              RUNNING              0                    
A  RMCDB02              RUNNING              0                    

-- GROUP STATE
-- Group           System               Probed     AutoDisabled    State          

B  RCS_DB_SG       RMCDB01              Y          N               ONLINE         
B  RCS_DB_SG       RMCDB02              Y          N               OFFLINE      

4. 启动、停止VCS集群

(1)启动时,如果是两个节点的集群,那么需要在每个节点上,用root用户执行:hastart,然后使用hastatus来查看启动过程中资源的状态信息

(2)停止时,只需要在其中一个节点上,使用root用户执行:hastop -all,同样是使用hastatus来查看状态,这个需要在每个节点上确认VCS已经停止完毕

注意:不管是启动,还是停止,VCS的日志是一定要查看,尤其是启动时,可以帮助排查启动过程中的问题。默认的VCS日志文件:

/var/VRTSvcs/log/engine_A.log

5. 冻结、解冻资源组

这是我经常使用的。何谓冻结,通俗的来说,就是让VCS暂时不管理集群,即使监控到有节占上资源组状态不正确,也不会发生切换或重新拉起操作。在维护中经常使用到,比如:oracle数据库打补丁、重启监听之类。

      
<strong>冻结双机:</strong>
RMCDB02:~ # hagrp -freeze RCS_DB_SG
RMCDB02:~ # hastatus -sum

-- SYSTEM STATE
-- System               State                Frozen              

A  RMCDB01              RUNNING              0                    
A  RMCDB02              RUNNING              0                    

-- GROUP STATE
-- Group           System               Probed     AutoDisabled    State          

B  RCS_DB_SG       RMCDB01              Y          N               ONLINE         
B  RCS_DB_SG       RMCDB02              Y          N               OFFLINE        

-- GROUPS FROZEN
-- Group          

C  RCS_DB_SG      

-- RESOURCES DISABLED
-- Group           Type            Resource            

H  RCS_DB_SG       Application     ora_raw             
H  RCS_DB_SG       Application     ora_vg              
H  RCS_DB_SG       IP              ora_ip              
H  RCS_DB_SG       NIC             ora_nic             
H  RCS_DB_SG       Netlsnr         ora_listener        
H  RCS_DB_SG       Oracle          ora_ora11g  

<strong>解冻双机:</strong>
RMCDB02:~ # hagrp -unfreeze RCS_DB_SG

6. VCS双机切换

这个也是我经常使用到的。主要是监控到集群内主机可能出现故障,所以人为有计划的将资源组切换到另外一个节点中;或者是硬件维护、系统重启。

NDMCDB04:~ # hastatus -sum

-- SYSTEM STATE
-- System               State                Frozen              

A  NDMCDB03             RUNNING              0                    
A  NDMCDB04             RUNNING              0                    

-- GROUP STATE
-- Group           System               Probed     AutoDisabled    State          

B  RCS_NDMCDB_RG   NDMCDB03             Y          N               ONLINE         
B  RCS_NDMCDB_RG   NDMCDB04             Y          N               OFFLINE   

NDMCDB04:~ # hagrp -switch RCS_NDMCDB_RG -to NDMCDB04   ## 将资源从NDMCDB03切换到NDMCDB04主机上

7. VCS双机启动故障问题排查

故障现象
执行hastart 命令启动双机后,执行hastatus -sum命令查看双机状态,显示信息如下:
attempting to connect....connected
group           resource             system               message
--------------- -------------------- -------------------- --------------------
                                     test-smc3            STALE ADMIN WAIT: all systems stale
STALE_ADMIN_WAIT: The system has a stale configuration and no other system is in a RUNNING state.
ADMIN_WAIT: The system cannot build or obtain a valid configuration.
双机状态处于 STALE_ADMIN_WAIT 或ADMIN_WAIT 状态,不能正常启动双机软件。
操作步骤
步骤 1 验证配置文件main.cf是否正确。
请根据实际业务应用情况修改main.cf配置文件。
步骤 2 执行hacf –verify config_dir命令验证配置文件语法的正确性。如:
# hacf -verify /etc/VRTSvcs/conf/config
如果存在错误信息,则需要根据提示信息修改“main.cf”文件。
步骤 3 执行hasys -force 节点名命令启动VCS。