1. 程式人生 > >伺服器常見問題和故障診斷排除

伺服器常見問題和故障診斷排除

原創: AIX7 talkwithtrend x86 伺服器常見問題和故障診斷排除 | 週末送資料 : https://mp.weixin.qq.com/s/Qe_KConoUS6UzIANxAKacw

注意 :  x86是我們廣為熟知的架構,在核心處理器基礎上,輔以帶ECC、ChipKill、熱插拔技術的記憶體、防止資料異常丟失的RAID硬碟、提供不中斷電力供應的冗餘電源等等共同構建出一個完整的x86伺服器。然而用得多了,遇到的故障自然就不會少,故障可能由於網絡卡、風扇、電源、cpu、記憶體、硬碟、raid、主機板、靜電等等,以及各種不明原因。

 

伺服器常見問題彙總

伺服器支撐著整個企業的資訊資料,對公司的資訊儲存、業務開展、正常運作等等環節都具有著至關重要的意義。然而,伺服器在日常執行過程中,由於其複雜的硬體結構、繁瑣的執行原理,經常會出現一些大大小小的問題。下面精心整理一些伺服器的常見問題彙總,幫助各位排憂解難。

 

1.系統藍屏、頻繁宕機、重啟、反映速度遲鈍

伺服器的與我們平常電腦不論是硬體結構還是執行系統,都是極其類似的。因此,就如同我們的電腦一樣,一樣可能會感染病毒,同樣會因為系統漏洞、軟體衝突、硬體故障導致宕機、藍屏、重啟等故障,同樣會因為垃圾快取資訊過多而導致反應遲鈍。

 

2.遠端桌面連線超出最大連線數

由於伺服器預設為允許連線數為2個,如果登陸後忘記登出,而是直接關閉遠端桌面的話,伺服器識別此次登陸還是留在伺服器端的。出現這種情況,最常見的就是重啟伺服器,但是,如果是高峰期,重啟伺服器帶來的損失是顯而易見的。那麼此時,就可以利用mstsc/console指令進行強行登陸了。開啟“執行”框,鍵入“mstsc/v:xxx.xxx.xxx.xxx(伺服器IP)/console”,即可強行登陸到遠端桌面了。

 

3.無法刪除的檔案該怎麼清理

遇到這種情況,可能是該檔案還在執行中,可以重啟刪之,或者執行CMD,輸入arrtib-a-s-h-r想要刪除的資料夾名,最後輸入del想要刪除的資料夾名即可刪除,執行該命令後無法恢復,請慎用。

 

4.系統埠隱患

對於伺服器來說,首要保障穩定性和安全性。因此,我們僅需保證伺服器最基本的功能即可,就像音效卡都是預設禁止的。我們並不需要太多的功能,也不需要太多的埠支援。像一些不必要,而且風險較高的埠大可封掉。而一些必要的,又有風險的埠,比如:3389、80等埠,我們可以通過修改登錄檔的方法將其設定不特殊的祕密埠,這樣伺服器埠的安全隱患就不復存在了。

 

故障案例分享

 

1、IBM 3650M3伺服器外接220V意外斷電後,再來電,伺服器無法啟動,如何處理?

按以下步驟處理:

檢視伺服器是否有桔色燈,按桔色類指示檢查硬體,檢查電源工作是否正常,有AC,沒有DC是有電源有輸入沒有輸出。啟動鍵不亮,是主機板沒有加電。IMM應該不通,無法檢視IMM日誌。不加電的故障,首先判斷電源是好是壞,最好用的方法是短接電源黑綠插頭,風扇能轉動起來,電源多數是好的。相反,更換電源即可。若判斷電源能正常工作,那就在機箱內拔掉各種板卡做最小化測試,要是有加電反映,那就是板卡導致的,要是仍無加電反映,那就更換主機板。

 

2、IBM 3650M4伺服器硬碟更換流程,兩塊330g硬碟做的raid1,另一塊硬碟600g硬碟沒有做raid1,600g硬碟損壞後如何更換?

正常情況下把壞硬碟移除插入新硬碟就可以了,如果作業系統無法識別到硬碟就需要重啟動伺服器進入webbios中重新啟用新硬碟後,作業系統才能正常使用硬碟。

2塊300GB 做RAID1,損壞一塊直接更換即可。

如果另外一塊600GB硬碟就單盤使用,已經故障的話,系統內已經無法識別這塊盤了,資料也沒有了。更換後,如果無法識別,需要進RAID Web配置介面進行初始化配置。

另外,不建議單塊盤直接使用,無資料保護。

 

3、lenovo 萬全伺服器,使用者反應最近幾天辦理業務時速度很慢,經常卡住沒反應,經查應用系統沒有問題,如何處理?

首先檢查辦理業務速度慢的是個別用戶,還是所有使用者,如果是所有使用者都慢,需要進看伺服器的cpu和記憶體佔用率是否很高、之後檢視網絡卡工作狀態是否正常。

網路,應用,中介軟體,資料庫,作業系統,伺服器,儲存都會涉及到,要做綜合分析。先從系統層面著手,看看有沒有異常程序,資源使用率是否合理,IO是否有瓶頸,網路是否有丟包,連線數是否正常.....逐步排查,向外擴充套件排查範圍。

 

4、dell伺服器報W1228 ROMB Batt < 24hr錯誤如何處理?

這個報警是陣列卡的電池容量如果在停電的狀態下無法使用超過24小時,也就是電池壽命將要完結,這個報警不會影響作業系統執行,即使電池故障也不會影響作業系統,只是在陣列卡上的快取將被禁用而效能上有所影響,建議您如果伺服器在保修期內請致電商家進行報修。

 

5、更換陣列卡後如何載入驅動?

原來用的是raid1,兩塊146G的盤現在要加一個raid5的陣列卡,原先的陣列卡不支援raid5所以只能更換新的陣列卡,但是直接用新的陣列卡連線原來的raid1陣列,系統藍屏重啟。請教一下如果在不重新做系統的情況下載入新的陣列卡驅動到系統?因為原系統上面有一套單獨購買的錄音程式原來的開發公司遷移程式是要費用的。

一般raid1要實現更高級別的陣列擴容,那麼首先raid1要支援raid5,即本身兩塊盤在獨立的陣列卡支援raid5、raid1的情況下建立的raid1,那麼這種情況下,只需要加一個電池保護就可以實現raid1至raid5的擴容。就你所說的這種情況,兩塊盤如果不打算加至三塊或者三塊以上做raid5的話,建議你還是保持原環境,否則出現藍屏諸如0x0000007B的報錯很正常,而且陣列會亂資料有風險。

【提醒:切不可在不做任何備份的情況下,直接更換其他不同型號的陣列卡並開機啟動,此類操作很有風險】

 

6、IBM X3650M3機器重灌系統問題?

一臺3650安裝系統,之前安裝linux系統。現在要更換成2003系統,我在ibm官網上下載了serversguide引導盤,通過用引導盤去安裝,引導盤啟動很正常,按照啟動提示一直做,沒有任何報錯,但是通過引導盤做完後,重啟進入系統居然提示“boot fault”,難道是引導盤的問題,又去下了個9.0的版本,結果還是一樣,也沒有安裝完成。當時都不找到是什麼問題,raid也是正常的,硬碟也沒有問題。

通過用軟體將raid驅動和硬體驅動整合到2003iso映象後,然後在去安裝系統,就可以正常進入系統,實在不行硬體驅動也可以單獨安裝,raid驅動要整合到2003iso映象中。

 

7、Lenovo x3650m4伺服器更換主機板後,無法進入系統,請問如何處理?

針對 2008R2、linux6 以上版本更換主機板後無法啟動,完整解決辦法圖文文件,請到社群此連結下載:

http://www.talkwithtrend.com/Document/detail/tid/414491

 

IBM 和 DELL 伺服器故障診斷及排除

相關推薦

伺服器常見問題故障診斷排除

原創: AIX7 talkwithtrend x86 伺服器常見問題和故障診斷排除 | 週末送資料

灌漿記錄儀常見故障診斷排除方法

灌漿記錄儀 天津賽智灌漿設備 灌漿記錄儀在施工過程中經常出現各種問題,不懂技術的你是否很難解決,下面天津賽智灌漿分享灌漿記錄儀常見故障診斷與排除方法,助你快速做好灌漿記錄儀的故障診斷,快速正常施工。 灌漿記錄儀常見故障診斷與排除方法 1、開機無響應檢查主機電源開關保險管、電源線等電源開關保險管是否斷路

mysql主從同步搭建故障排除

mysql主從同步搭建 mysql主從同步線程無法開啟 mysql主從同步定義和作用 主從同步的定義: 是存儲數據的一種結構模式。主:被客戶端訪問的數據庫服務器就是主庫服務器master從:連接主庫服務器,自動同步主庫的所有數據到本機slave1、什麽是mysql主從同步? 當master

伺服器運維常見故障及其解決辦法

進入資訊時代,各種行業對資料的安全和技術要求也越來越高,,同時也遇到了各種各樣的伺服器故障問題,雖然能夠接到伺服器廠商的支援,但是往往耗時耗工,特別是有些不能夠立即判斷和解決的問題,造成了企業不必要的損失,下面是針對一些常見的伺服器故障現象和解決方法,以便更好的更快的進行故障處理和排查。 01 伺服器常見

RESTFUL框架伺服器常見返回狀態碼提示資訊

RESTFUL框架伺服器常見返回狀態碼和提示資訊,常見的有以下(方括號中是該狀態碼對應的HTTP動詞).     200 OK - [GET]:伺服器成功返回使用者請求的資料,該操作是冪等的(Idempotent)。     201 CREATED -

V.35 DTE/DCE電纜故障診斷排除

DTE--資料終端裝置,安裝在客戶端,它把資訊變成以數字程式碼表示的資料,並把這些資料送到遠端的計算機系統的處理結果,並轉換為人們可以理解的資訊,相當於人和機器間的介面。 DCE--資料電路終接裝置,安裝在局端,是DTE與傳輸通道的介面裝置。在通訊裝置中經常用到的V.35/

常見HBase故障分析解決方法

1. java.net.SocketException: Too many open files 問題原因: 問題現象:所有節點region server程序掛掉,hbase不可訪問,檢視日誌有如下資訊 tail hbase-hbase-regionserver-ip-10

【10年運維整理】伺服器常見故障及其解決方法

進入資訊時代,各種行業對資料的安全和技術要求也越來越高,,同時也遇到了各種各樣的伺服器故障問題,雖然能夠接到伺服器廠商的支援,但是往往耗時耗工(特別是有些不能夠立即判斷和解決的問題),造成了企業不必要的損失,近日小編將針對一些常見的伺服器故障現象和解決方法跟管理者分享一下,以

rhel6啟動原理故障排除

1、linux 作業系統的引導過程一般包括一下幾個步驟 開機自檢àMBR引導àGRUB選單à載入Linux核心àinit程序初始化à登入系統 BIOS -> MBR -> GRUB ->kernel -> init process -> lo

RHEL引導過程控制故障排除

RHEL引導過程 1.BIOS加電自檢,檢查並初始化硬體 2.啟用MBR 3.MBR中的載入程式(grub)載入到記憶體,生成一個微系統initramfs 4.grub讀取分割槽表,找到引導分割槽 5.grub讀取自身的配置檔案,找到核心檔案 6.載入核心檔案vmlinuz

網路故障網路診斷工具(3.0)

網路故障管理故障管理是網路管理員中最基本的內容之一,網路故障管理的目的在於防止類似故障的再次發生,確保網路系統的高穩定性。網路故障管理是相當重要的。在網路出現故障時,一般情況下,網路管理員應報警。網路管理員應執行一些診斷測試來辨別故障原因。網路管理員必須及時發現故障部位,對所

Docker daemon 配置故障排除

啟動daemon 啟動daemon命令取決與你使用的作業系統: RHEL, CentOS, Fedora, Ubuntu 16.04 或者更高版本,使用systemd管理docker服務啟動。 $ sudo systemctl enable docke

網路故障網路診斷工具(2.0)

網路故障管理系統使用ping的方法只能針對小型網路,在一些大型網路中一般用網路故障管理軟體,一個網路的故障管理系統不但能反應網路平時執行時的故障狀況,更應該在發生重大網路故障時,快速準確地報告、定位和排除故障。網路故障管理系統包括:navis NFM故障管理系統netcool

Linux常見系統故障排除

作為一名運維工程師經常會遇到各式各樣的系統故障,如何根據故障特徵鎖定問題根源,需要的不僅僅是技巧,還有遇到故障時的思路,和對系統內部的理解,本文列出了一些常見的系統故障和處理方法,在那之前首先需要對系統啟動流程有一個比較完整意義上的瞭解,以便問題出現後判斷其屬於哪個環節。

U盤的常見物理故障類型故障表現匯總

管理 工作 51cto 傳輸 1.5 不能 jpg 無法打開 真的是 U盤是一種非常普遍的存儲介質,作為一個傳遞數據的常用存儲介質,比移動硬盤價格便宜,攜帶更加方便。和硬盤原理相同,U盤中的數據如果發生丟失也分為邏輯故障和物理故障,本文為大家介紹U盤物理故障導致數據丟失的故

部署AlwaysOn第三步:集群資源組的健康檢測故障轉移

exe htm 有一個 監控器 name 檢查 oar ges 包含 資源組是由一個或多個資源組成的組,WSFC的故障轉移是以資源組為單位的,資源組中的資源是相互依賴的。一個資源所依賴的其他資源必須和該資源處於同一個資源組,跨資源組的依賴關系是不存在的。在任何時刻,每個資源

JDK命令行監控故障處理工具

快照 文件 令行 ces 垃圾 編譯 監控 align con JDK監控和故障處理工具 名稱 主要作用 jps JVM Process Status Tool,顯示指定系統內所有的HotSpot虛擬機進程。 jstat JVM Statistics Moni

書籍推薦:《實戰Java虛擬機——JVM故障診斷與性能優化》下載

java實戰java虛擬機jvm本書詳細介紹Java虛擬機的基本原理和優化診斷方法。其中重點介紹Java虛擬機的體系結構、常用的虛擬機參數、Java虛擬機的垃圾回收原理、算法以及目前虛擬機所支持的各種垃圾回收器及其區別、特點和使用方法。在實踐和調優方面,重點介紹了Java的堆、棧分析方法,性能調優的一般思路、

Raid磁盤陣列真的是100%的安全嗎?raid有哪些常見故障?

ces 磁盤陣列 text vpd 工作 控制 裏的 自然 案例 問:數據恢復既然是數據災難的一種補救措施,那設計安全的RAID磁盤陣列系統也會出現數據災難嗎?答:RAID設計的初衷大約有3個原因:解決容量問題、解決IO性能問題與解決存儲安全(冗余)問題。從數據恢復的角度看

DFS故障診斷及排錯

DFS Troubleshooting在運維DFS的時候經常會遇到這樣那樣的問題,導致DFS復制效果不佳,部分文件無法同步復制,下面就列舉2個常見的問題並說明一下解決方法。1.DFS報錯出現共享沖突,無法進行正常復制首先我們通過自帶的診斷報告,導出診斷的結果,我們可以在報告中看到有關於共享沖突的明細,可以找到