引言:由于運(yùn)行時(shí)間較長(zhǎng),硬盤損壞,導(dǎo)致拷貝數(shù)據(jù)非常慢,給相關(guān)業(yè)務(wù)科室工作帶來困擾。而且長(zhǎng)此以往,其他正常硬盤必將因負(fù)載過大而崩盤。那么如何快速找到損壞的硬盤,并更換新的硬盤呢?請(qǐng)看筆者是如何做的。
筆者單位某前置服務(wù)器(塔式服務(wù)器),具有三個(gè)500GB硬盤做 RAID 5,主板無獨(dú)立的陣列卡,硬盤非熱拔插,屬于老式服務(wù)器。由于運(yùn)行時(shí)間較長(zhǎng),檢查設(shè)備時(shí)發(fā)現(xiàn)硬盤壞了一個(gè),那么如何能快速找到損壞的硬盤,盡快更換新硬盤呢?
RAID 5工作原理是,數(shù)據(jù)以塊為單位分布到各個(gè)硬盤上。RAID 5不對(duì)數(shù)據(jù)進(jìn)行備份,而是把數(shù)據(jù)和與其相對(duì)應(yīng)的奇偶校驗(yàn)信息存儲(chǔ)到組成RAID 5的各個(gè)磁盤上,并且奇偶校驗(yàn)信息和相對(duì)應(yīng)的數(shù)據(jù)分別存儲(chǔ)于不同的磁盤上。當(dāng)RAID 5的一個(gè)磁盤數(shù)據(jù)損壞后,利用剩下的數(shù)據(jù)和相應(yīng)的奇偶校驗(yàn)信息去恢復(fù)被損壞的數(shù)據(jù)。
用簡(jiǎn)單的語言來表示RAID 5,至少使用3塊硬盤(也可以更多)組建RAID 5磁盤陣列,當(dāng)有數(shù)據(jù)寫入硬盤的時(shí)候,按照1塊硬盤的方式就是直接寫入這塊硬盤的磁道,如果是RAID 5,這次數(shù)據(jù)寫入會(huì)根據(jù)算法分成3部分,然后寫入這3塊硬盤,寫入的同時(shí)還會(huì)在這3塊硬盤上寫入校驗(yàn)信息,當(dāng)讀取寫入的數(shù)據(jù)的時(shí)候會(huì)分別從3塊硬盤上讀取數(shù)據(jù)內(nèi)容,再通過檢驗(yàn)信息進(jìn)行校驗(yàn)。當(dāng)其中有1塊硬盤出現(xiàn)損壞的時(shí)候,就從另外2塊硬盤上存儲(chǔ)的數(shù)據(jù)可以計(jì)算出第3塊硬盤的數(shù)據(jù)內(nèi)容。也就是說RAID 5這種存儲(chǔ)方式只允許有一塊硬盤出現(xiàn)故障,出現(xiàn)故障時(shí)需要盡快更換。當(dāng)更換故障硬盤后,在故障期間寫入的數(shù)據(jù)會(huì)進(jìn)行重新校驗(yàn)。如果在未解決故障又壞1塊,那就是災(zāi)難性的了。
了解了相關(guān)的理論后,實(shí)戰(zhàn)開始。情景是這樣的:三個(gè)500GB硬盤做的RAID 5,啟動(dòng)自檢的時(shí)候尾號(hào)1514的硬盤出現(xiàn)錯(cuò)誤。如何快速找到損壞的尾號(hào)為1514硬盤呢?(如圖1所示)
首先,拆開主機(jī)箱蓋,經(jīng)過認(rèn)真觀察,筆者發(fā)現(xiàn)所有硬盤的編號(hào)全部以條碼的形式貼在硬盤的頂端(如圖2所示),很方便快捷的就找到了損壞的硬盤。
其次,確認(rèn)硬盤的型號(hào),在市場(chǎng)上尋找相同型號(hào)的硬盤。為了避免不可預(yù)知的故障,請(qǐng)大家最好購買同一品牌同一型號(hào)的硬盤。當(dāng)然,如果因?yàn)闀r(shí)間的關(guān)系,找不到同樣型號(hào)的硬盤,那就請(qǐng)找同一品牌的,并且新硬盤的參數(shù)要大于已損壞硬盤的參數(shù)。筆者所購新硬盤尾號(hào)為8056。注意,新購的硬盤不需要另外去格式化。
圖1 自檢尾號(hào)出現(xiàn)錯(cuò)誤
圖2 硬盤編號(hào)貼在硬盤頂端
圖3 新硬盤被正常識(shí)別
第三,也是最重要的一個(gè)步驟。找到新硬盤后,請(qǐng)大家一定要先備份服務(wù)器上的相關(guān)資料。筆者單位服務(wù)器安裝了SQL2000數(shù)據(jù)庫,每天有新數(shù)據(jù)寫入,所以筆者通知了相關(guān)業(yè)務(wù)科室,停機(jī)2小時(shí),備份了數(shù)據(jù)庫及相關(guān)資料。為什么要這樣操作呢?原因就是新的硬盤換上去后,數(shù)據(jù)需要重建。如果在重建的過程中,再壞硬盤的話,那數(shù)據(jù)就是毀滅性的。所以備份相關(guān)資料就顯得非常非常重要了。即使在更換硬盤的過程中再損壞硬盤也不要緊,重新安裝服務(wù)器即可。
第四,更換新硬盤。將尾號(hào)為1514硬盤取下,把新購硬盤安裝上去,蓋好面板,重啟動(dòng)源開關(guān)。如圖3所示更換成功,新購尾號(hào)為8056硬盤被正常識(shí)別。操作系統(tǒng)正常運(yùn)行后,經(jīng)測(cè)試服務(wù)器各項(xiàng)功能均正常。
最后,總結(jié)兩點(diǎn)注意:第一點(diǎn),如果是數(shù)據(jù)庫服務(wù)器,在備份數(shù)據(jù)資料的同時(shí),一定要詳細(xì)記錄下服務(wù)器的計(jì)算機(jī)名、IP地址、安裝的軟件、數(shù)據(jù)庫名和相關(guān)用戶名、密碼等。萬一在更換的過程中出現(xiàn)異常,還有挽回的余地。
第二點(diǎn),更換之前,請(qǐng)?jiān)敿?xì)了解你的服務(wù)器參數(shù)和配置,一定要咨詢服務(wù)器品牌的售后服務(wù)部及相關(guān)工程師,確認(rèn)清楚后方可動(dòng)手操作。
總之,充分做好各種準(zhǔn)備,應(yīng)對(duì)更換過程中有可能出現(xiàn)的各種異常問題。