周兵(安徽省經(jīng)濟(jì)信息中心,安徽合肥 230001)
淺談災(zāi)備系統(tǒng)建設(shè)
周兵(安徽省經(jīng)濟(jì)信息中心,安徽合肥 230001)
災(zāi)備中心是專門為災(zāi)備發(fā)生時(shí)恢復(fù)系統(tǒng)功能而設(shè)計(jì)建造的高等級(jí)數(shù)據(jù)中心,提供機(jī)房和相應(yīng)的辦公生活條件、數(shù)據(jù)處理設(shè)備、網(wǎng)絡(luò)資源、日常運(yùn)行管理等。一旦災(zāi)備發(fā)生,災(zāi)備中心將接替網(wǎng)絡(luò)和數(shù)據(jù)中心運(yùn)行,利用其各種資源恢復(fù)信息系統(tǒng)運(yùn)行和業(yè)務(wù)運(yùn)作。本文通過對(duì)災(zāi)備技術(shù)分析,介紹災(zāi)備中心按照不同數(shù)據(jù)保護(hù)服務(wù)級(jí)別的靈活設(shè)計(jì)。
災(zāi)備 系統(tǒng) 建設(shè)
隨著全球信息化程度的提高,政府機(jī)構(gòu)、金融、能源、交通、電信、軍隊(duì)等重要部門、行業(yè)對(duì)計(jì)算機(jī)網(wǎng)絡(luò)基礎(chǔ)設(shè)施依賴程度逐步增大,數(shù)據(jù)安全保障的重要性與緊迫性日益凸顯,數(shù)據(jù)安全保障能力已經(jīng)成為21世紀(jì)國(guó)家綜合國(guó)力、經(jīng)濟(jì)競(jìng)爭(zhēng)能力和生存發(fā)展能力的重要組成部分,成為事關(guān)國(guó)家政治穩(wěn)定、社會(huì)穩(wěn)定的全局性問題,是國(guó)家戰(zhàn)略發(fā)展所必須關(guān)注的核心問題之一。災(zāi)備恢復(fù)是指利用技術(shù)、管理手段以及相關(guān)資源確保既定的關(guān)鍵數(shù)據(jù)、關(guān)鍵信息系統(tǒng)和關(guān)鍵業(yè)務(wù)在災(zāi)備發(fā)生后,在確定的時(shí)間內(nèi)可以恢復(fù)和繼續(xù)運(yùn)營(yíng)的過程。
災(zāi)備中心是專門為災(zāi)備發(fā)生時(shí)恢復(fù)系統(tǒng)功能而設(shè)計(jì)建造的高等級(jí)數(shù)據(jù)中心,提供機(jī)房和相應(yīng)的辦公生活條件、數(shù)據(jù)處理設(shè)備、網(wǎng)絡(luò)資源、日常運(yùn)行管理等。一旦災(zāi)備發(fā)生,災(zāi)備中心將接替網(wǎng)絡(luò)和數(shù)據(jù)中心運(yùn)行,利用其各種資源恢復(fù)信息系統(tǒng)運(yùn)行和業(yè)務(wù)運(yùn)作。災(zāi)備恢復(fù)是保證信息系統(tǒng)業(yè)務(wù)持續(xù)運(yùn)作的最后一環(huán)。主要包括:災(zāi)備備份等級(jí)標(biāo)準(zhǔn)、災(zāi)備備份實(shí)施方法、災(zāi)備備份方案和災(zāi)備恢復(fù)計(jì)劃的制定、災(zāi)備恢復(fù)機(jī)制的建立、災(zāi)備中心的信息安全保障和運(yùn)營(yíng)管理等。
數(shù)據(jù)災(zāi)備是針對(duì)計(jì)算機(jī)系統(tǒng)的非正常停機(jī)事件所采取的減少災(zāi)難發(fā)生的概率,以及減少災(zāi)難發(fā)生時(shí)或造成的損失而采取的各種防范措施。主要包括數(shù)據(jù)備份和恢復(fù)二大部份。
按照國(guó)家標(biāo)準(zhǔn)《信息系統(tǒng)災(zāi)備恢復(fù)規(guī)范》(GB/T20988-2007),數(shù)據(jù)中心的災(zāi)備恢復(fù)水平可以劃分為六個(gè)等級(jí),如表1所示。
目前,大多數(shù)單位數(shù)據(jù)中心只達(dá)到2~3級(jí)備份,即在每天數(shù)據(jù)處理完成后,將數(shù)據(jù)磁帶傳輸?shù)疆惖乇4?同時(shí)建立冷備份方式的數(shù)據(jù)中心。但是,對(duì)于國(guó)家機(jī)關(guān)、金融部門等重要企業(yè),數(shù)據(jù)中心的備份級(jí)別要求必須達(dá)到四級(jí)以上。一些特別重要的應(yīng)用需要在災(zāi)備發(fā)生時(shí),保持業(yè)務(wù)的連續(xù)性運(yùn)作,要求達(dá)到六級(jí)的標(biāo)準(zhǔn),即建立無數(shù)據(jù)丟失、災(zāi)備發(fā)生時(shí)能夠自動(dòng)切換的數(shù)據(jù)中心。
備份技術(shù)是災(zāi)難恢復(fù)的基礎(chǔ)。備份不僅是數(shù)據(jù)的保護(hù),其最終目的是為了在系統(tǒng)遇到人為或自然災(zāi)難時(shí),能夠通過備份內(nèi)容對(duì)系統(tǒng)進(jìn)行有效的災(zāi)難恢復(fù)。備份不是單純的拷貝,管理也是備份重要的組成部分。備份的方法主要有:文件備份、服務(wù)器主動(dòng)式備份、系統(tǒng)復(fù)制、跨平臺(tái)備份、SQL數(shù)據(jù)庫(kù)備份、分級(jí)式存儲(chǔ)管理、本地?cái)?shù)據(jù)備份、遠(yuǎn)程備份。此外也分熱備份和冷備份。備份方法在模式角度上可劃分為如下兩種:
(1)邏輯備份:每個(gè)文件都是由不同的邏輯塊組成。每一個(gè)邏輯的文件塊存儲(chǔ)在連續(xù)的物理磁盤塊上,但組成一個(gè)文件的不同邏輯塊極有可能存儲(chǔ)在分散的磁盤塊上。備份軟件通常既可以進(jìn)行文件操作,又可以對(duì)磁盤塊進(jìn)行操作?;谖募膫浞菹到y(tǒng)能夠識(shí)別文件結(jié)構(gòu),并拷貝所有的文件和目錄到備份資源上。這樣的系統(tǒng)跨越了存儲(chǔ)在每個(gè)inode上的指針,可順序的讀取每個(gè)文件的物理塊,然后備份軟件連續(xù)的將文件寫入到備份媒介上。這樣的備份使得每個(gè)單獨(dú)文件的恢復(fù)變得很快,但連續(xù)的存儲(chǔ)文件會(huì)使得備份速度減慢,因?yàn)樵趯?duì)非連續(xù)存儲(chǔ)磁盤上的文件進(jìn)行備份時(shí)需要額外的查找操作。這些額外的操作增加了磁盤的開銷,降低了磁盤的吞吐率。另外,對(duì)于文件一個(gè)很小的改變,基于文件的邏輯備份也需將整個(gè)文件備份。
(2)物理備份:系統(tǒng)在拷貝磁盤塊到備份媒介上時(shí)忽略文件結(jié)構(gòu),這會(huì)提高備份的性能,因?yàn)閭浞蒈浖趫?zhí)行過程中,花費(fèi)在搜索操作上的開銷很少。但這種方法使得文件的恢復(fù)變得復(fù)雜且緩慢,因?yàn)槲募⒉皇沁B續(xù)的存儲(chǔ)在備份媒介上。為了允許文件恢復(fù),基于設(shè)備的備份必須要收集文件和目錄是如何在磁盤上組織的信息,才能使備份媒介上的物理塊與特定的文件相關(guān)聯(lián)。因而,基于設(shè)備的備份適合于指定一個(gè)特定的文件系統(tǒng)來實(shí)現(xiàn),并且不易移植。而基于文件的方案則更易移植,因?yàn)閭浞菸募氖沁B續(xù)文件。另外,基于設(shè)備的備份方案可能會(huì)導(dǎo)致數(shù)據(jù)的不一致。信息系統(tǒng)應(yīng)用的不斷深入要求計(jì)算機(jī)系統(tǒng)提供不間斷的系統(tǒng)服務(wù),一旦業(yè)務(wù)系統(tǒng)出現(xiàn)問題,不僅將嚴(yán)重影響本單位和部門的業(yè)務(wù)工作,同時(shí)也將影響其它相關(guān)業(yè)務(wù)的正常開展,會(huì)帶來連鎖反應(yīng)。為保證業(yè)務(wù)系統(tǒng)的連續(xù)可用性,所需的災(zāi)備備份級(jí)別日益提高,并對(duì)災(zāi)備技術(shù)有更高的可靠性要求。除了以最合理的代價(jià)保護(hù)業(yè)務(wù)系統(tǒng)數(shù)據(jù)的完整性與安全性,還要在災(zāi)備發(fā)生后盡快恢復(fù)運(yùn)行,減少或盡可能消除業(yè)務(wù)停頓時(shí)間。為此,一般情況都要采用實(shí)時(shí)的熱備份技術(shù)。雖然實(shí)時(shí)熱備份技術(shù)具有一次性投資昂貴、通訊費(fèi)用高等缺點(diǎn),但能對(duì)數(shù)據(jù)完整性與業(yè)務(wù)連續(xù)性提供最強(qiáng)有力的支持和保證,將成為今后最重要的備份技術(shù)。
表1
備份策略是一系列的規(guī)則,包括什么數(shù)據(jù)需要備份,應(yīng)當(dāng)何時(shí)備份數(shù)據(jù)以及將數(shù)據(jù)備份到何處等。有效的備份策略應(yīng)當(dāng)可以區(qū)分很少變化的數(shù)據(jù)和經(jīng)常變化的數(shù)據(jù),并且對(duì)后者的備份要比前者的備份更加頻繁。目前被采用的最多的備份策略主要有以下三種:
(1)全備份(FullBackup):所謂全備份就是用一盤磁帶對(duì)整個(gè)系統(tǒng)進(jìn)行完全備份,包括系統(tǒng)和數(shù)據(jù)。這種備份方式的好處就是很直觀,容易被人理解。而且當(dāng)發(fā)生數(shù)據(jù)丟失的災(zāi)難時(shí),只要用一盤磁帶〔即災(zāi)難發(fā)生之前一天的備份磁帶),就可以恢復(fù)丟失的數(shù)據(jù)。然而它也有不足之處;首先由于每天都對(duì)系統(tǒng)進(jìn)行完全備份,因此在備份數(shù)據(jù)中有大量是重復(fù)的,例如操作系統(tǒng)與應(yīng)用程序。這些重復(fù)的數(shù)據(jù)占用了大最的磁帶空間,這對(duì)用戶來說就意味著增加成本;其次。由于需要備份的數(shù)據(jù)量相當(dāng)大,因此備份所需時(shí)間較長(zhǎng)。對(duì)于那些業(yè)務(wù)策忙,備份窗口時(shí)間有限的單位來說,選擇這種備份策略無疑是不明智的。
(2)增量備份(IncrementalBackup):增量備份相對(duì)全備份而言,只備份上一次備份后增加的和修改過的數(shù)據(jù)。該備份的優(yōu)點(diǎn)是沒有重復(fù)的備份數(shù)據(jù),節(jié)省磁帶空間,縮短備份時(shí)間。缺點(diǎn)在于當(dāng)發(fā)生災(zāi)難時(shí),恢復(fù)數(shù)據(jù)比較麻煩。
(3)差分備份(DifferentialBackup):差分備份就是每次備份的數(shù)據(jù)是相對(duì)于上一次全備份之后新增加的和修改過的數(shù)據(jù)。管理員先在周一進(jìn)行一次系統(tǒng)完全備份,然后在接下來的幾天里,再將當(dāng)天所有與星期一不同的數(shù)據(jù)備份到磁帶上。差分備份無需每天都做系統(tǒng)完全備份,備份所需時(shí)間短,節(jié)省磁帶空間,災(zāi)難恢復(fù)也很方便。系統(tǒng)管理員只需兩盤磁帶,即系統(tǒng)全備份的磁帶與發(fā)生災(zāi)難前一天的備份磁帶,就可以將系統(tǒng)完全恢復(fù)。
全備份所需時(shí)間最長(zhǎng),但恢復(fù)時(shí)間最短,操作最方便,當(dāng)系統(tǒng)中數(shù)據(jù)量不大時(shí),采用全備份最可靠。而增量備份和差分備份可以節(jié)省磁盤和備份時(shí)間,但可靠性低,操作復(fù)雜。在實(shí)際應(yīng)用鐘,備份策略通常是以上三種的結(jié)合。
一般地,災(zāi)難恢復(fù)能力采用三個(gè)主要的容災(zāi)指標(biāo)RTO、RPO、NRO作為評(píng)判依據(jù)。
(1)恢復(fù)時(shí)間目標(biāo)RTO(Recovery Time Object)。該指標(biāo)是容災(zāi)恢復(fù)的時(shí)間指標(biāo),從廣義上來說是從災(zāi)難發(fā)生造成業(yè)務(wù)中斷,直到通過各種方法恢復(fù)業(yè)務(wù)所需要的時(shí)間。通常越短的RTO意味著越高的容災(zāi)能力。另一個(gè)狹義的RTO指標(biāo)是指從決定進(jìn)行容災(zāi)切換到業(yè)務(wù)可以繼續(xù)運(yùn)行所經(jīng)過的時(shí)間。一般用狹義的RTO指標(biāo)評(píng)價(jià)IT層面的容災(zāi)能力。
(2)恢復(fù)點(diǎn)目標(biāo)。RPO(Recovery Point Object)宕機(jī)導(dǎo)致的停機(jī)不是故障影響的全部,宕機(jī)帶來的另一種影響對(duì)企業(yè)的損害可能更大,那就是永久性數(shù)據(jù)丟失:宕機(jī)以前的數(shù)據(jù)沒有保存到在線數(shù)據(jù)庫(kù)或文件中。宕機(jī)之后數(shù)據(jù)開始恢復(fù)的時(shí)間點(diǎn)稱之為恢復(fù)點(diǎn),恢復(fù)點(diǎn)指標(biāo)RPO,就是當(dāng)業(yè)務(wù)恢復(fù)后,可以達(dá)到與災(zāi)難發(fā)生前那個(gè)時(shí)間點(diǎn)相同的工作狀態(tài)。通常RPO對(duì)應(yīng)著災(zāi)難造成的數(shù)據(jù)丟失程度,如果RPO為0,就相當(dāng)于沒有丟失任何數(shù)據(jù)。但這種理想狀態(tài)往往是無法達(dá)到的,這就涉及到業(yè)務(wù)回滾。業(yè)務(wù)恢復(fù)與回滾的不同之處在于災(zāi)難恢復(fù)能力評(píng)價(jià)指標(biāo)。
本地存儲(chǔ)設(shè)備與災(zāi)備中心之間通過網(wǎng)絡(luò)建立遠(yuǎn)程復(fù)制連接。兩地?cái)?shù)據(jù)間初始化同步的實(shí)現(xiàn)方式有兩種,第一種是在本地使用另一臺(tái)存儲(chǔ)設(shè)備,完成所有需要備份主機(jī)的數(shù)據(jù)初始化同步后,再將存儲(chǔ)設(shè)備搬到災(zāi)備中心與本地建立起復(fù)制連接。第二種方法則通過網(wǎng)絡(luò)直接進(jìn)行數(shù)據(jù)同步,不需要進(jìn)行磁盤陣列異地運(yùn)輸,本期工程擬用裸光纖進(jìn)行連接,因此可以直接利用網(wǎng)絡(luò)進(jìn)行同步。復(fù)制策略可分為變化量觸發(fā)和周期觸發(fā)。在災(zāi)備發(fā)生時(shí),本地和災(zāi)備中心之間上一次數(shù)據(jù)復(fù)制后的新增業(yè)務(wù)數(shù)據(jù)將丟失,無法恢復(fù)。因此策略選擇的適中能使用戶本地和災(zāi)備中心的數(shù)據(jù)盡可能保持一致。