首页 > 代码库 > 曙光集群 配置和检查内容

曙光集群 配置和检查内容

第一步:检查node39 ypserv服务状态
[root@node39 ~]# /etc/init.d/ypserv status
ypserv (pid 3753) is running...
[root@node39 ~]# /etc/init.d/yppasswdd status
rpc.yppasswdd (pid 4331) is running...
[root@node39 ~]# /etc/init.d/ypxfrd status
rpc.ypxfrd (pid 3958) is running...


第二步:检查所有计算节点ypbind服务状态
[root@node39 ~]# for i in `seq 1 39`;do ssh node$i "hostname;/etc/init.d/ypbind status";done
node1
ypbind (pid 595) is running...
node2
ypbind (pid 4392) is running...
node3
ypbind (pid 3733) is running...
node4
ypbind (pid 25785) is running...
node5
ypbind (pid 4156) is running...


第三步:确认普通用户可以登陆计算节点。如果某节点普通用户登陆需要输入密码,则重启该
节点的ypbind服务
[root@node39 ~]# su - cmaq
[cmaq@node39 ~]$ for i in `seq 1 38`;do ssh node$i hostname;done
node1
node2
node3
node4
node5
node6
node7
node8
node9
node10
node11

第四步:如果有节点普通用户无法登陆,则重启该节点的ypbind服务
如:node1节点nis服务有问题,则执行:
[root@node39] ssh node1 /etc/init.d/ypbind restart

 

检查public挂载情况

for i in `seq 1 36`; do ssh node$i "hostname;df | grep /public";done

 

所有节点重启

for i in `seq 1 36`;do ssh node$i "hostname;reboot";done

 

查看cpu使用率,

一般不超过24个

for i in `seq 1 36`;do ssh node$i "hostname; pestat";done

 

服务器关机:poweroff

服务器重启:reboot

 

打开Teamviewer

teamviewer daemon restart

teamviewer info 

曙光集群 配置和检查内容