服務(wù)器硬件故障處理幾例
硬件故障是指服務(wù)器硬件出現(xiàn)異常而導(dǎo)致的各類錯誤。由于服務(wù)器構(gòu)成比較復(fù)雜,因此在檢查的時(shí)候必須認(rèn)真、仔細(xì)。下面以一臺萬全4500為例說明。(例子,在實(shí)際問題中如果遇到相似現(xiàn)象,也需要具體問題具體分析,不要盲目套用)
有一臺萬全4500,配有256M內(nèi)存,使用一個(gè)PIII XEON 500帶2M高速緩存的處理器。開機(jī)后沒有任何顯示,但系統(tǒng)日志上提示了一條CPU電壓為0伏的信息,系統(tǒng)指示燈三燈不停在閃爍(指示燈三燈閃爍是服務(wù)器的另一種報(bào)警方式,我會在文后說明)。這種錯誤一般是處理器電壓調(diào)節(jié)模塊(VRM)出錯或CPU出錯或CPU與CPU板塊接觸不良,但也可能是CPU板塊出錯,這時(shí)情況就比較復(fù)雜了,必須經(jīng)過認(rèn)真慎重的思考。因?yàn)镃PU板塊在整個(gè)服務(wù)器中,占有舉足輕重的地位,如果它出錯服務(wù)器是會報(bào)致命錯誤的,并且在系統(tǒng)日志中會提示致命錯誤,但報(bào)CPU電壓錯的情況也有5%左右。我們立刻把CPU調(diào)換在另一CPU插槽中,開機(jī)后依然是剛才的那種故障。所以在初步判斷中,可以排除是CPU板塊壞。
這時(shí),取出CPU仔細(xì)擦拭金手指,以及CPU板塊中與CPU接觸的地方后,開機(jī)依然無顯示。
相對處理器壞的情況來說處理器電壓模塊(VRM)出現(xiàn)故障的情況比較大。于是立即在另一臺萬全4500中取下一個(gè)處理器電壓模塊,安裝在此服務(wù)器中。開機(jī)后,服務(wù)器依然沒有任何顯示,系統(tǒng)日志上依然提示CPU電壓為0伏的信息,系統(tǒng)指示燈三燈依然不停在閃爍。這時(shí)的情況就比較明顯了。于是立即從另一臺萬全 4500中取下一個(gè)CPU安裝后,開機(jī)正常。