許辰宏
摘要 在數(shù)據(jù)對(duì)企業(yè)越來(lái)越重要的時(shí)代,怎樣利用容災(zāi)和備份兩種方式對(duì)數(shù)據(jù)進(jìn)行保護(hù),以實(shí)現(xiàn)數(shù)據(jù)的可靠性,完整性和高可用性。
【關(guān)鍵詞】容災(zāi) 備份 數(shù)據(jù)中心
1 容災(zāi)與備份的比較
1.1 容災(zāi)
容災(zāi)通常指在距離相隔較遠(yuǎn)的兩地(一個(gè)是提供正常業(yè)務(wù)運(yùn)行的數(shù)據(jù)中心,另一個(gè)為隨時(shí)接管部分或全部服務(wù)的災(zāi)備中心),建立功能相同的信息系統(tǒng),系統(tǒng)之間可進(jìn)行狀態(tài)監(jiān)控和功能切換。當(dāng)某個(gè)或多個(gè)系統(tǒng)因?yàn)?zāi)難而停止運(yùn)行時(shí),可將其全部功能切換到另一地點(diǎn),使該系統(tǒng)能夠正常運(yùn)行。容災(zāi)系統(tǒng)著重于處理外界環(huán)境對(duì)信息系統(tǒng)的影響,特別災(zāi)難性事件對(duì)企業(yè)數(shù)據(jù)中心的影響,它提供節(jié)點(diǎn)級(jí)別的系統(tǒng)恢復(fù)功能。
1.2 備份
數(shù)據(jù)是現(xiàn)代企業(yè)的核心,備份是為了防止信息系統(tǒng)出現(xiàn)數(shù)據(jù)丟失,而將系統(tǒng)中的全部或部分?jǐn)?shù)據(jù)從系統(tǒng)主機(jī)的硬盤或磁陣中復(fù)制到其它的存儲(chǔ)介質(zhì)的過(guò)程。傳統(tǒng)的數(shù)據(jù)備份主要是采用設(shè)備配置的磁帶機(jī)進(jìn)行備份,這種方式備份速度慢,不適合現(xiàn)代企業(yè)大數(shù)據(jù)吞吐的要求,而且最重要的是這種方式恢復(fù)時(shí)間很長(zhǎng),一旦對(duì)海量數(shù)據(jù)進(jìn)行恢復(fù),那耗費(fèi)的時(shí)間成本非常巨大。
由上可知,備份與容災(zāi)所關(guān)注的對(duì)象是不同的。備份側(cè)重于數(shù)據(jù)的安全,容災(zāi)關(guān)注系統(tǒng)業(yè)務(wù)應(yīng)用的安全。如果將備份稱為“數(shù)據(jù)保護(hù)”,那容災(zāi)則是“業(yè)務(wù)應(yīng)用保護(hù)”,備份僅僅是容災(zāi)的一部分。特別是在當(dāng)前以信息技術(shù)為依托的企業(yè),數(shù)據(jù)量呈幾何級(jí)數(shù)增長(zhǎng)。一旦災(zāi)難發(fā)生時(shí),僅有備份方式進(jìn)行業(yè)務(wù)恢復(fù),那將導(dǎo)致極長(zhǎng)的業(yè)務(wù)中斷時(shí)間,給企業(yè)帶來(lái)無(wú)法估量的損失。
目前支撐業(yè)務(wù)運(yùn)行的各信息系統(tǒng)數(shù)據(jù)量日益增多,已從GB級(jí)別發(fā)展到TB級(jí)別。因此傳統(tǒng)的備份方式無(wú)法滿足對(duì)應(yīng)災(zāi)難性事件的要求,而采用容災(zāi)方式可將因?yàn)?zāi)難性事件產(chǎn)生的業(yè)務(wù)中斷時(shí)間縮短在幾小時(shí),幾分鐘之內(nèi)。甚至可以在用戶無(wú)感知的情況下,實(shí)現(xiàn)容災(zāi)節(jié)點(diǎn)間的快速切換。
2 容災(zāi)等級(jí)劃分
數(shù)據(jù)中心的容災(zāi)的建設(shè),可分為三個(gè)不同的層級(jí):數(shù)據(jù)級(jí)容災(zāi),應(yīng)用級(jí)容災(zāi),業(yè)務(wù)級(jí)容災(zāi)。
(1)數(shù)據(jù)級(jí)容災(zāi)是最基礎(chǔ)形式,簡(jiǎn)單講就是數(shù)據(jù)備份,主要通過(guò)備份軟件和存儲(chǔ)設(shè)備來(lái)實(shí)現(xiàn)數(shù)據(jù)在不同地點(diǎn)的備份。備份數(shù)據(jù)一般有多份,最常見(jiàn)的模式是本地存放一份,同城備份中心存放一份,異地災(zāi)備中心再存放一份,在災(zāi)難發(fā)生時(shí),可以保證不丟失數(shù)據(jù),但不能保證業(yè)務(wù)的連續(xù)性。另外數(shù)據(jù)的恢復(fù)也需要一定的時(shí)間。
(2)應(yīng)用級(jí)容災(zāi)以數(shù)據(jù)保護(hù)為基礎(chǔ),其目的是實(shí)現(xiàn)整體恢復(fù),一般在同城備份中心有一套和主中心鏡像的應(yīng)用系統(tǒng)。當(dāng)主數(shù)據(jù)中心發(fā)生災(zāi)難時(shí),可以實(shí)現(xiàn)迅速切換,讓用戶發(fā)出的服務(wù)請(qǐng)求可以繼續(xù)運(yùn)行。
(3)業(yè)務(wù)級(jí)容災(zāi)的目的是實(shí)現(xiàn)企業(yè)所有業(yè)務(wù)的恢復(fù),即在發(fā)生意外或?yàn)?zāi)難事件,造成關(guān)鍵業(yè)務(wù)停頓時(shí),通過(guò)業(yè)務(wù)級(jí)容災(zāi)的相關(guān)恢復(fù)策略和流程,恢復(fù)、簡(jiǎn)化、改變關(guān)鍵業(yè)務(wù)的執(zhí)行流程,使得企業(yè)關(guān)鍵業(yè)務(wù)能夠在要求的時(shí)間內(nèi)迅速恢復(fù)運(yùn)營(yíng),使得企業(yè)客戶的業(yè)務(wù)要求受到的影響微乎其微。業(yè)務(wù)級(jí)容災(zāi)已成為國(guó)際上對(duì)于災(zāi)難恢復(fù)的研究重點(diǎn)。
3 總體分析與評(píng)估
從容災(zāi)建設(shè)的技術(shù)層面分析,衡量容災(zāi)系統(tǒng)的主要指標(biāo)有兩個(gè),分別是RPO和RTO。
(1) RPO (Recovery Poinr Object)…反映數(shù)據(jù)恢復(fù)完整性指標(biāo),代表了當(dāng)災(zāi)難發(fā)生時(shí)允許丟失的數(shù)據(jù)量。數(shù)據(jù)量越大,一般損失也越大。不過(guò)關(guān)鍵數(shù)據(jù)的損失和非關(guān)鍵數(shù)據(jù)的損失是有差別的。
(2) PTO (Recovery Time Object)一反映業(yè)務(wù)恢復(fù)及時(shí)性指標(biāo),代表了系統(tǒng)恢復(fù)的時(shí)間。系統(tǒng)恢復(fù)的時(shí)間越長(zhǎng),一般損失也越大。對(duì)于關(guān)鍵系統(tǒng)和非關(guān)鍵系統(tǒng),即使是相同的恢復(fù)時(shí)間,影響也是不同的。
從成本上看,如果系統(tǒng)需要保證更高的業(yè)務(wù)連續(xù)性,也就是需要保證災(zāi)難發(fā)生時(shí),丟失數(shù)據(jù)最少,而且恢復(fù)的時(shí)間最短。雖然這需要更高的成本,但是,其帶來(lái)的好處是災(zāi)難發(fā)生時(shí),損失也最小。如果沒(méi)有容災(zāi)中心,當(dāng)災(zāi)難發(fā)生時(shí),將丟失大量的生產(chǎn)數(shù)據(jù),或者需要很長(zhǎng)的時(shí)間進(jìn)行業(yè)務(wù)恢復(fù),那么企業(yè)將承受極大的損失。可將容災(zāi)實(shí)施成本與災(zāi)難發(fā)生后可能帶來(lái)的業(yè)務(wù)中斷損失組成一個(gè)圖,恢復(fù)成本越高,那么恢復(fù)的時(shí)間就應(yīng)該少,企業(yè)的損失也應(yīng)該越小;反之,如果恢復(fù)成本越低,那么需要恢復(fù)的時(shí)間就越長(zhǎng),帶來(lái)的損失可能就大到不可估計(jì)。
在這樣的情況下,可以綜合考量恢復(fù)成本和業(yè)務(wù)中斷損失兩個(gè)因素,選擇一個(gè)合理區(qū)間作為標(biāo)準(zhǔn),使恢復(fù)時(shí)間和損失都控制在一定范圍內(nèi)。因此必須對(duì)中國(guó)商飛公司現(xiàn)有信息系統(tǒng)的特點(diǎn)、業(yè)務(wù)關(guān)鍵性、數(shù)據(jù)量、訪問(wèn)頻度進(jìn)行綜合分析。以評(píng)估恢復(fù)成本與業(yè)務(wù)中斷損失的范圍值。
4 容災(zāi)中心的地點(diǎn)選擇
容災(zāi)系統(tǒng)建設(shè)的一個(gè)重要部分就是確定主數(shù)據(jù)中心與災(zāi)備中心之間的距離和地點(diǎn)。通常來(lái)說(shuō),在同城的兩個(gè)中心的距離不宜太遠(yuǎn),這樣無(wú)論是切換的速度,數(shù)據(jù)備份和恢復(fù)的速度都會(huì)比較快,而在異地建設(shè)的災(zāi)備中心,就要從防止“災(zāi)難”角度考慮,比如火災(zāi),地震,惡意破壞,甚至是戰(zhàn)爭(zhēng)的角度,考慮異地災(zāi)備中心的選址,從目前己實(shí)施的容災(zāi)系統(tǒng)建設(shè),和業(yè)界提供的產(chǎn)品和技術(shù)來(lái)看,根據(jù)容災(zāi)距離的遠(yuǎn)近,主要有兩種建設(shè)模式。
(1)幾十公里或一百公里以內(nèi),主要是同城范圍的容災(zāi)距離。也稱為“同城災(zāi)備”。
(2)幾百上千公里距離,主要是不同城市之間的遠(yuǎn)程容災(zāi)。也稱為“遠(yuǎn)程災(zāi)備”或“異地災(zāi)備”。
目前很多企業(yè)綜合“同城災(zāi)備”和“遠(yuǎn)程/異地災(zāi)備”的特點(diǎn),在災(zāi)備系統(tǒng)建設(shè)上采用“兩地三中心”的模式。
參考文獻(xiàn)
[1]劉煥淋,陳勇,通信網(wǎng)圖論及應(yīng)用[M].北京:人民郵電出版社,2010.
[2]徐偉強(qiáng),汪亞明,俞成海等.移動(dòng)Ad Hoc網(wǎng)絡(luò)的跨層優(yōu)化擁塞控制[J].軟件學(xué)報(bào),2010.