摘要:文章從備份的重要性和傳統(tǒng)備份方式的特點以及其局限性說起,到新型存儲磁盤庫的產(chǎn)生以及隨之產(chǎn)生的新的備份方式,描述了企業(yè)在選擇備份方式時的多種選擇。
關(guān)鍵詞:傳統(tǒng)備份;新型備份;災(zāi)難恢復;磁帶;磁盤庫;備份方式
中圖分類號:TP311文獻標識碼:A文章編號:1009-2374(2009)12-0012-02
災(zāi)難是可能發(fā)生的風險,而容災(zāi)是指對災(zāi)難的容忍,在災(zāi)難發(fā)生后能恢復災(zāi)難前的業(yè)務(wù)。容災(zāi)就是減少災(zāi)難事件發(fā)生的可能性以及限制災(zāi)難對關(guān)鍵業(yè)務(wù)流程所造成的影響的一整套行為。而備份是災(zāi)難恢復的前提,必須要有完整的備份,才能進行數(shù)據(jù)的恢復,解決面臨的災(zāi)難。
一、傳統(tǒng)的備份方式
備份主要由備份的介質(zhì)、備份的軟件以及備份的策略組成。
(一)備份介質(zhì)
備份采用的介質(zhì)最常用的有磁盤和磁帶兩種。磁盤的讀寫速度較快但容量小,一般只用于一些數(shù)據(jù)量較小的備份。一直以來,磁帶都是企業(yè)備份的主要存儲介質(zhì)。
(二)備份軟件
很多企業(yè)采用的是固定時間,比如一天一次的離線備份;還有一些是采用操作系統(tǒng)定制的計劃任務(wù)或者一些應(yīng)用軟件、數(shù)據(jù)庫等的自動備份策略進行定時備份,然后再定期備份至磁帶;還有一些企業(yè)是使用備份服務(wù)器一客戶端代理程序的架構(gòu)進行備份,直接在線進行備份將數(shù)據(jù)備份至磁帶,但這種方式所需備份時間較長占用系統(tǒng)資源較多,一般是安排在晚上等應(yīng)用比較空閑時進行。
(三)備份策略
按照備份的類型來說,主要有以下三種備份類型:
1全備份(full backup)。全備份是指某一個時間點上所有數(shù)據(jù)的一個完全拷貝。
2增量備份(Incremental Backups)。增量備份指備份上一次正常或增量備份后,創(chuàng)建或改變的文件。備份后標記文件(換言之,清除存檔屬性)。如果使用正常和增量備份的組合,您需要具有上一次普通備份集和所有增量備份集,以便還原數(shù)據(jù)。
3差異備份(Differential Backups)。所謂的差異備份,就是從上次正?;蛟隽總浞莺螅瑒?chuàng)建或修改的差異備份副本文件。備份后不標記為已備份文件(換言之,不清除存檔屬性)。如果執(zhí)行了正常和差異備份的組合,還原文件和文件夾要求您執(zhí)行了上一次正常和差異備份。
傳統(tǒng)的備份方式大多是使用備份軟件,通過一定的備份策略(全備份和增量備份、差量備份的組合),將企業(yè)的信息備份至磁帶。有些磁帶作歸檔用于長期保存,而有些磁帶則為容災(zāi)所需而備份數(shù)據(jù),這些數(shù)據(jù)有一定的保存期限,超過保存期限一般被重寫以減少磁帶的消耗。
二、傳統(tǒng)備份方式的局限性
(一)速度慢
備份速度慢、恢復速度慢。磁盤的讀寫由于磁帶本身性質(zhì)速度較慢,一般備份都是安排在晚上等相對空閑的時間進行。一旦系統(tǒng)崩潰需要進行恢復,從磁帶恢復過來需要的時間較長,可能會影響企業(yè)的正常運行。
(二)容量小
隨著應(yīng)用的擴大以及支持這些應(yīng)用的硬件的快速發(fā)展,特別是大容量的磁盤出現(xiàn)后,用于備份的磁帶容量相對較小。
(三)備份方式落后
傳統(tǒng)的備份方式是通過服務(wù)器一客戶端代理程序的架構(gòu),通過備份軟件利用網(wǎng)絡(luò)進行數(shù)據(jù)傳輸備份到目標磁帶上。這種方式除了速度慢以外,占用服務(wù)器的資源和網(wǎng)絡(luò)資源也非常嚴重,從而影響整個企業(yè)的信息化應(yīng)用。
(四)可靠性相對差
由于一直以來磁帶都是企業(yè)的主要存儲介質(zhì),因此企業(yè)對備份數(shù)據(jù)的管理與備份政策制定,也都是基于磁帶的特性,如一天一次的離線備份,或是備份服務(wù)器一客戶端代理程序架構(gòu)等。但隨著數(shù)據(jù)量持續(xù)增長,這種備份架構(gòu)所需備份窗口過長,備份作業(yè)將會嚴重影響前端服務(wù)器正常運作,無法滿足企業(yè)對還原時間與還原精細度的要求,且還原的可靠性也不足,必須通過新技術(shù)才能解決這個問題。
三、新的備份方式
(一)新型存儲設(shè)備:磁盤庫
磁盤庫就是將磁盤陣列模擬成磁帶庫的存儲設(shè)備,具有高數(shù)據(jù)傳輸率、高可靠性、兼容存儲備份管理軟件等特點。
與傳統(tǒng)的磁帶庫相比,磁盤庫有以下優(yōu)點:讀寫速度快、減小備份時問;具有磁盤容錯功能、提高可用性;磁盤存儲應(yīng)用廣泛、技術(shù)認知度高、易于管理維護;結(jié)合磁盤陣列的快速拷貝、復制等功能、實現(xiàn)數(shù)據(jù)保護更高的可靠性等。
作為傳統(tǒng)磁帶庫的一個有益的補充方案,磁盤庫使用基于磁盤技術(shù)的數(shù)據(jù)備份,恢復系統(tǒng),整合了磁盤所具備的快速訪問、數(shù)據(jù)傳輸以及RAID的優(yōu)勢,同時利用仿真技術(shù)可以整合多種磁帶格式及磁帶庫類型,在此基礎(chǔ)上延續(xù)了磁帶原本具有的穩(wěn)定、可寫入大數(shù)據(jù)塊的特點,使得磁盤庫很快成為了存儲備份領(lǐng)域的一項主流技術(shù)。
(二)新的備份方式
基于磁盤庫的出現(xiàn),出現(xiàn)了很多有別于傳統(tǒng)備份方式的新的備份方式。
1磁盤到磁盤到磁帶式(disk-to-disk-to-tape)備份。通過中介磁盤作為前端在線存儲與后端磁帶間的緩沖,數(shù)據(jù)先備份到中介磁盤,再于離線時間轉(zhuǎn)存到磁帶。這種方式相比較原先的直接備份至磁帶有很多優(yōu)點。比如可縮短備份時間,由于從應(yīng)用系統(tǒng)備份數(shù)據(jù)時直接寫到調(diào)整讀寫的磁盤,因此大大縮短了備份的時間;另外轉(zhuǎn)存磁帶時不會影響在線系統(tǒng)。由于從磁盤再寫到磁帶時,是通過磁盤庫寫入磁帶,因此不會影響在線使用的系統(tǒng)。不過這種方式仍以復制方式將數(shù)據(jù)搬移到中介磁盤,一次完整備份仍須相當長的時間,雖能通過增量/差異備份與組合來縮短備份時間,但對有要求更高的用戶來說,還原點精細度仍不足。占用時間和系統(tǒng)性能仍然很多。
2磁盤快照?;谏鲜龃疟P到磁盤到磁帶備份方式的不足,又出現(xiàn)了利用磁盤快照(Snapshot),為磁盤迅速制作時間點更密集的備份副本。磁盤快照的基本概念與磁帶備份等機制有非常大的不同。在建立磁盤快照時,并不需要復制數(shù)據(jù)本身,它所作的只是通知存儲設(shè)備將目前有數(shù)據(jù)的磁盤區(qū)塊全部保留起來,不被覆寫。這個通知動作只需花費極短的時間。因此,通過密集地進行磁盤快照操作,可對數(shù)據(jù)進行多個時間點的備份操作。這種方式相比較磁盤到磁盤到磁帶的備份方式有很多的優(yōu)點:備份速度更快,可節(jié)約更多的時間;可靠性更高,由于可通過更加密集地進行磁盤快照操作,可大大地提高還原點的精細度,使系統(tǒng)的備份的可靠性得到提高。但缺點是成本較磁盤到磁盤到磁帶來說要高很多,另外即使快照的頻率很高也不能保證系統(tǒng)百分之百的可靠。
3連續(xù)數(shù)據(jù)保護技術(shù)。然而無論快照的頻率再密集,所提供的也只是多個磁盤靜止狀態(tài)的副本,對某些業(yè)務(wù)極為關(guān)鍵的企業(yè)來說,需要的還原精細度必須達到每個I/O動作的程度,此時就只有連續(xù)數(shù)據(jù)保護(Continuous Data Protection,CDP)技術(shù)才能滿足要求。CDP技術(shù)將傳統(tǒng)著眼于“數(shù)據(jù)備份”
的備份技術(shù),推進到著眼于快速恢復、最少數(shù)據(jù)丟失的數(shù)據(jù)保護的新階段。其最大的技術(shù)優(yōu)勢就在于可進行任意時間點上的數(shù)據(jù)恢復。當數(shù)據(jù)丟失的損失以分鐘(或更小的時間單位)來計算時,部署CDP方案就顯得十分必要。同時,對于對系統(tǒng)暫停一刻都不能容忍的企業(yè)來說,CDP技術(shù)能減少從災(zāi)難發(fā)生到數(shù)據(jù)恢復所需要的時間,滿足系統(tǒng)可靠性需達到99.999%的嚴苛要求。利用TimeMark與快照代理功能,通過設(shè)置合理的數(shù)據(jù)快照策略,管理員可以在任何時刻創(chuàng)建一個“TimeMark(時間標記)”,按照事先設(shè)定的時間間隔,將指定時刻點的數(shù)據(jù)視圖保存下來。同時快照代理確保數(shù)據(jù)的完整性,TimeView功能則使應(yīng)用主機能在瞬間加載過去任意時刻的數(shù)據(jù)版本,而不必忍受耗時的數(shù)據(jù)庫修復和一致性檢查,從而實現(xiàn)最小化的恢復時間目標。連續(xù)數(shù)據(jù)保護技術(shù)較之之前的磁盤到磁盤到磁帶和磁盤快照技術(shù)對數(shù)據(jù)的保護更加可靠,能夠大大縮短數(shù)據(jù)恢復和時間和精確度,對于在系統(tǒng)出現(xiàn)故障時要求在短時間內(nèi)快速恢復的應(yīng)用尤其適用。當然它的成本就更高了。
(三)新的備份架構(gòu)
與傳統(tǒng)的備份從備份服務(wù)器到安裝代理的應(yīng)用服務(wù)器數(shù)據(jù)的傳輸都要通過局域網(wǎng)來進行以及應(yīng)用服務(wù)器必須犧牲相當?shù)南到y(tǒng)性能來進行數(shù)據(jù)的傳輸備份相比,出現(xiàn)了更為先進的備份架構(gòu)。為適應(yīng)新的存儲環(huán)境,傳統(tǒng)備份軟件也有許多改進。絕大多數(shù)軟件都已支持磁盤備份,通過備份到磁盤的存儲池或虛擬磁帶柜等方式,即可將磁盤作為備份介質(zhì)。而為減輕備份對主機與網(wǎng)絡(luò)的沖擊,各備份軟件近來也陸續(xù)支持“無局域網(wǎng)絡(luò)備份(LAN Free)”與“無主機備份(Serverless)”兩種新架構(gòu)。
LAN Free Backup是在SAN環(huán)境下讓備份數(shù)據(jù)不流經(jīng)局域網(wǎng)絡(luò)的架構(gòu),備份服務(wù)器可直接向前端的應(yīng)用程序服務(wù)器下達指令,將磁盤陣列的數(shù)據(jù)透過SAN直接轉(zhuǎn)存到磁帶設(shè)備,而不經(jīng)由局域網(wǎng)絡(luò),不過仍會占用服務(wù)器資源,因此就有Serverless備份的出現(xiàn)。
Serverless備份是無須前端應(yīng)用服務(wù)器參與的一種備份,數(shù)據(jù)搬移(Data Mover)的角色由應(yīng)用服務(wù)器轉(zhuǎn)移到SAN交換器或備份服務(wù)器上,透過SAN直接在磁盤陣列與磁帶設(shè)備間復制與轉(zhuǎn)移數(shù)據(jù)。如Symantec的Off-Host Backup選購程序,即是先透過硬件或軟件的快照功能為前端應(yīng)用服務(wù)器的磁盤區(qū)(Volume)制作副本,然后將這個副本的Volume掛載到備份服務(wù)器上,備份即通過這個鏡像副本來進行,因而不會影響到前端的應(yīng)用服務(wù)器。
四、各種備份方式的實際應(yīng)用
對于重要性特別高,一旦系統(tǒng)出現(xiàn)問題,必須在短短的幾分鐘內(nèi)快速恢復運行,并且對數(shù)據(jù)以及業(yè)務(wù)的操作不能有任何丟失的應(yīng)用來說,應(yīng)該采用連續(xù)數(shù)據(jù)保護技術(shù)。對重要性高,一旦出現(xiàn)問題要在短時間內(nèi)快速恢復的系統(tǒng),可采取磁盤快照的方式。而對于一些重要性不是特別高的應(yīng)用,如果出現(xiàn)問題可以在幾小時甚至一天后恢復,這樣的應(yīng)用系統(tǒng)可仍然采用較為傳統(tǒng)的備份方式,即用備份軟件備份至磁帶上。只是目前由于磁帶的局限性可由磁盤來代替磁帶。磁盤庫可以建立多個虛擬的磁帶,按照各個應(yīng)用系統(tǒng)數(shù)據(jù)量的大小劃分大小,一個應(yīng)用系統(tǒng)對應(yīng)一個虛擬磁帶。在應(yīng)用原有的備份策略的基礎(chǔ)上,增加其他的應(yīng)用系統(tǒng),通過備份軟件備份到磁盤庫的虛擬磁帶上,這個操作可根據(jù)需要定制,每天或者每隔一段時間進行備份。這些備份可作為容災(zāi)作用,需要恢復時,可快速恢復系統(tǒng)。企業(yè)可根據(jù)實際的需求,選擇一種或者幾種備份方式混合使用的方式,來達到對企業(yè)數(shù)據(jù)安全進行保護。
作者簡介:歐陽艷,上海石油化工股份有限公司信息管理部系統(tǒng)運行管理工程師。