1. 程式人生 > >曙光集群 配置和檢查內容

曙光集群 配置和檢查內容

eboot power tar poweroff gre sta 普通用戶 name 服務狀態

第一步:檢查node39 ypserv服務狀態
[[email protected] ~]# /etc/init.d/ypserv status
ypserv (pid 3753) is running...
[[email protected] ~]# /etc/init.d/yppasswdd status
rpc.yppasswdd (pid 4331) is running...
[[email protected] ~]# /etc/init.d/ypxfrd status
rpc.ypxfrd (pid 3958) is running...


第二步:檢查所有計算節點ypbind服務狀態


[[email protected] ~]# for i in `seq 1 39`;do ssh node$i "hostname;/etc/init.d/ypbind status";done
node1
ypbind (pid 595) is running...
node2
ypbind (pid 4392) is running...
node3
ypbind (pid 3733) is running...
node4
ypbind (pid 25785) is running...
node5
ypbind (pid 4156) is running...


第三步:確認普通用戶可以登陸計算節點。如果某節點普通用戶登陸需要輸入密碼,則重啟該
節點的ypbind服務
[[email protected] ~]# su - cmaq
[[email protected] ~]$ for i in `seq 1 38`;do ssh node$i hostname;done
node1
node2
node3
node4
node5
node6
node7
node8
node9
node10
node11

第四步:如果有節點普通用戶無法登陸,則重啟該節點的ypbind服務
如:node1節點nis服務有問題,則執行:
[[email protected]] ssh node1 /etc/init.d/ypbind restart

檢查public掛載情況

for i in `seq 1 36`; do ssh node$i "hostname;df | grep /public";done

所有節點重啟

for i in `seq 1 36`;do ssh node$i "hostname;reboot";done

查看cpu使用率,

一般不超過24個

for i in `seq 1 36`;do ssh node$i "hostname; pestat";done

服務器關機:poweroff

服務器重啟:reboot

打開Teamviewer

teamviewer daemon restart

teamviewer info

曙光集群 配置和檢查內容