如何提高RAID 5數(shù)據(jù)恢復(fù)的成功率

對(duì)于IT管理員而言,遭遇RAID數(shù)據(jù)災(zāi)難總是最為頭痛的,因?yàn)橄嚓P(guān)恢復(fù)技術(shù)涉及到的知識(shí)面太廣,普通管理員甚至服務(wù)器廠商的工程師都無(wú)法解決。既然RAID數(shù)據(jù)災(zāi)難不應(yīng)當(dāng)由管理員來(lái)進(jìn)行處理,那么管理員在此時(shí)又應(yīng)該如何處理呢?我們采訪了的資深數(shù)據(jù)恢復(fù)工程師,他將告訴您如何才能確保較高的恢復(fù)成功率。


常見問(wèn)題解答-廣州天翱信息科技有限公司


不要強(qiáng)行上線:危險(xiǎn)的操作方法

在服務(wù)器的某一個(gè)硬盤出現(xiàn)故障時(shí),一般服務(wù)器都會(huì)有一個(gè)Offline指示燈提示,此時(shí)要求用戶更換一個(gè)完好的相同硬盤,并且重新校驗(yàn)算法。按理說(shuō)這是非常正常的操作過(guò)程,但是殊不知很多RAID災(zāi)難就是由此而引起的。

以一個(gè)硬盤數(shù)量比較多的RAID5磁盤陣列為例,很可能同時(shí)采購(gòu)的多個(gè)硬盤中,有幾個(gè)已經(jīng)出現(xiàn)了不穩(wěn)定現(xiàn)象。而服務(wù)器的Offline提示可能并不是最準(zhǔn)確的,經(jīng)常會(huì)誤報(bào)(也有硬盤不穩(wěn)定的因素)或是遺漏其它也同樣存在隱患的硬盤。在看似平常的強(qiáng)制上線過(guò)程中,硬盤需要進(jìn)行大量的讀寫操作,此時(shí)就是一場(chǎng)嚴(yán)峻的考驗(yàn):運(yùn)氣好的話自然平穩(wěn)度過(guò),而運(yùn)氣不好就會(huì)導(dǎo)致其它硬盤突然掉線,此時(shí)就令問(wèn)題更加棘手了。

當(dāng)然,出現(xiàn)一個(gè)硬盤掉線提示,或是在RAID容錯(cuò)范圍以內(nèi)的掉線提示,強(qiáng)制上線還是必須執(zhí)行的操作。但是在進(jìn)行這一步前,強(qiáng)烈建議大家檢測(cè)一下每一個(gè)硬盤的穩(wěn)定性情況,這樣才更加保險(xiǎn)。大家可不要忽視這樣一個(gè)小細(xì)節(jié),往往這一步能夠讓RAID服務(wù)器沒(méi)免于癱瘓。


保護(hù)第一現(xiàn)場(chǎng):什么都不做才最安全

對(duì)于廠商而言,所有的質(zhì)保承諾僅僅局限于硬件設(shè)備,也就是說(shuō)磁盤陣列故障后所引發(fā)的數(shù)據(jù)危機(jī)與之毫無(wú)關(guān)系,負(fù)責(zé)為用戶更換或者維修已經(jīng)算是“克盡職守”。但是用戶所需要的并不是找回硬盤或是重建RAID,而是更價(jià)值不菲的數(shù)據(jù)。如果尋找整機(jī)廠商,此時(shí)無(wú)異于“自討苦吃”,因?yàn)樗^的售后服務(wù)根本沒(méi)有從用戶的本源需求出發(fā),盡快確保硬件設(shè)備完好反而犧牲了數(shù)據(jù)。當(dāng)然,知名品牌的服務(wù)器廠商或是代理商會(huì)主動(dòng)選擇為大客戶的RAID數(shù)據(jù)恢復(fù)服務(wù)費(fèi)“埋單”,但是這也僅僅是個(gè)別情況。

據(jù)數(shù)據(jù)恢復(fù)中心的主管工程師介紹,因?yàn)閷ふ曳?wù)商的售后服務(wù)工程師修復(fù)而導(dǎo)致最終數(shù)據(jù)徹底破壞的案例幾乎每個(gè)星期都會(huì)發(fā)生。畢竟售后服務(wù)工程師基本都偏向于硬件,而RAID數(shù)據(jù)恢復(fù)則是以軟件類操作為主。

此外,即便是簡(jiǎn)單的檢驗(yàn)性操作,也有可能為后期的數(shù)據(jù)恢復(fù)帶來(lái)不便。以普通RAID5恢復(fù)為例,當(dāng)硬盤損壞超過(guò)容錯(cuò)能力時(shí),必須將損壞硬盤的鏡像完全提取才能進(jìn)行最終的恢復(fù)。而如果頻繁對(duì)硬盤上電,很容易造成磁頭進(jìn)一步疲勞損傷,甚至劃傷盤片。正確的處理方法應(yīng)當(dāng)是立即咨詢專業(yè)數(shù)據(jù)恢復(fù)服務(wù)商。


選擇專業(yè)數(shù)據(jù)恢復(fù)服務(wù)商:切莫迷失方向

根據(jù)數(shù)據(jù)恢復(fù)中心的統(tǒng)計(jì),很多數(shù)據(jù)恢復(fù)失敗的案例都是因?yàn)橛脩魧で罅瞬⒉徽_的解決途徑。服務(wù)器用戶所依靠的售后服務(wù)也往往不夠?qū)I(yè),RAID 磁盤列陣出現(xiàn)問(wèn)題之后輕易選擇重建,數(shù)據(jù)丟失情況更是雪上加霜。在選擇數(shù)據(jù)恢復(fù)服務(wù)商時(shí),根據(jù)規(guī)模以及業(yè)界口碑來(lái)判斷是一條可行的捷徑。而在這一方面,服務(wù)網(wǎng)點(diǎn)遍及全國(guó)的數(shù)據(jù)恢復(fù)中心有著深厚的積累,能夠幫助廣大遭遇RAID數(shù)據(jù)災(zāi)難的用戶及時(shí)度過(guò)難關(guān)。