RAID物理層故障
服務器物理層故障,主要是指服務器陣列SAS、SCSI硬盤由于硬盤內(nèi)部磁頭或者電機原因引起的故障,主要包括如下幾種:
1、硬盤通電敲盤;
2、硬盤通電不轉(zhuǎn);
3、硬盤通電不識別;
網(wǎng)絡通信嚴重出錯提示
NETDEV WATCHDOG: eth1: transmit timed out
eth1: link down
eth1: link up, 10Mbps, half-duplex, lpa 0x0000
eth2: link up, 100Mbps, full-duplex, lpa 0x41E1
setting full-duplex based on MII #24 link partner capability of 45e1
這些提示是網(wǎng)絡通信中出現(xiàn)嚴重問題時才會出現(xiàn).故障基本和網(wǎng)絡斷線有關系. 這幾條提示分別代表的含意是 某塊網(wǎng)卡傳送數(shù)據(jù)超時; 網(wǎng)卡連接down; 網(wǎng)卡連接up,連接速率為10/100Mbps,全/半雙功.這里寫到的后三行的提示比較類似. 出現(xiàn)這類提示時必須注意網(wǎng)絡連接狀況進行處理!!!
NIC Link is Up 100 Mbps Full Duplex
情況和 kernel: eth1: link up,...相同.指某塊網(wǎng)卡適應的連接速率. 一般認為沒有說明哪個網(wǎng)卡down,只是連續(xù)出現(xiàn)網(wǎng)卡適應速率也是通信有問題。如果是網(wǎng)線正常的斷接可以忽略這類的信息。
eth0: Transmit timed out, status 0000, PHY status 786d, resetting... eth0: Reset not complete yet. Trying harder.
條提示 網(wǎng)卡關送數(shù)據(jù)失敗. 復位網(wǎng)卡. 第二條提示 網(wǎng)卡復位不成功.... 這些提示都屬于嚴重的通信問題。
eth1: Transmit error, Tx status register 82. Probably a duplex mismatch. See Documentation/networking/vortex.txt Flags; bus-master 1, dirty 9994190(14) current 9994190(14) Transmit list 00000000 vs. f7171580. 0: @f7171200 length 800001e6 status 000101e6 1: @f7171240 length 8000008c status 0001008c ....
這個提示是3com網(wǎng)卡特有的. 感覺如果出現(xiàn)量不大的話也不會影響很嚴重. 目前看維一的解決辦法是更換服務器上的網(wǎng)卡。 實在感覺3com的網(wǎng)卡有些問題...
服務器報警程序的提示
0001 ##WMPCheckV001## 2005-04-13_10:10:01 Found .(ARP Spoofing sniffer)! IP:183 MAC:5 0002 ##WMPCheckV001## 2005-04-07_01:53:32 Found .(MAC_incomplete)! IP:173 mac_incomplete:186 0003 ##WMPCheckV001## 2005-04-17_16:25:11 Found .(HIGH_synsent)! totl:4271 SynSent:3490 0004 ##WMPCheckV001## 20......
這是由報警程序所引起的提示. 詳細的信息需要用報警程序的客戶端進行實時接收.詳細情況請查看"告警模塊和日志"。
巧妙設置掃描的簇范圍
設置掃描簇的范圍是一個有效加快掃描速度的方法。像EasyRecovery的高級自定義掃描方式、FinalData和File Recovery的默認掃描方式都可以讓你設置掃描的簇范圍以縮短掃描時間。當然要判斷目的文件在硬盤上的位置需要一些技巧,這里提供一個簡單的方法,使用操作系統(tǒng)自帶的硬盤碎片整理程序中的碎片分析程序(千萬小心不要碎片整理啊,只是用它的碎片分析功能),在分區(qū)分析完后程序會將硬盤的未使用空間用圖形方式清楚地表示出來,那么根據(jù)圖形的比例估計這些未使用空間的大致簇范圍,搜索時設置只搜索這些空白的簇范圍就好了,對于大的分區(qū),這確實能節(jié)省不少掃描時間。
在服務器發(fā)生故障后,需注意以下幾點:
1、服務器發(fā)生故障后,用戶切忌再對服務器進行任何操作,也切忌隨意取出硬盤,以免弄亂順序增加后期數(shù)據(jù)恢復的難度。
2、如果已經(jīng)取出硬盤,標記好硬盤的順序。
3、求助專業(yè)服務器數(shù)據(jù)恢復公司的專業(yè)服務器數(shù)據(jù)恢復工程師,切忌隨意交給不知名的小數(shù)據(jù)恢復公司。
4、如果單位服務器內(nèi)存儲的是保密度較高、或者較為重要的數(shù)據(jù)資料,建議配備單位內(nèi)部服務器數(shù)據(jù)恢復設備,防止將數(shù)據(jù)庫交由外部數(shù)據(jù)恢復公司進行數(shù)據(jù)恢復時,造成數(shù)據(jù)丟失或泄漏。
5、需要在專業(yè)人員幫助下抓取服務器陣列卡或存儲管理系統(tǒng)里邊的日志,為數(shù)據(jù)恢復提供數(shù)據(jù)恢復索引。
6、如需取出硬盤恢復,則將記錄服務器硬盤接口對應編號。在取服務器硬盤時應當佩戴靜電手環(huán),以防硬盤靜電擊傷。