張永旺
摘要:空管作為技術(shù)密集型行業(yè),包括辦公自動化系統(tǒng)在內(nèi)的大量信息化應用基于數(shù)據(jù)庫應用體系構(gòu)建,由此對于各類系統(tǒng)而言,其所處理和存儲的數(shù)據(jù)重要性也日益增強。目前空管內(nèi)部對于數(shù)據(jù)保護和迅速恢復工作的能力仍有待提升,該文著重結(jié)合數(shù)據(jù)中心雙活技術(shù),探討了多類重要數(shù)據(jù)容災手段,力圖基于空管現(xiàn)狀,逐步實現(xiàn)數(shù)據(jù)級容災、應用級容災以及數(shù)據(jù)中心級別的雙活。
關(guān)鍵詞:空管信息化;數(shù)據(jù)容災;數(shù)據(jù)雙活
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2017)30-0004-02
伴隨空管信息化應用的日益推進,空管內(nèi)部數(shù)據(jù)中心架構(gòu)日趨向私有云架構(gòu)發(fā)展,空管信息化建設(shè)對于數(shù)據(jù)信息的保護和應用可用性的提高有了更高的要求。如何基于空管現(xiàn)狀,建設(shè)一套可用性、安全性、擴展性俱佳的雙活數(shù)據(jù)中心架構(gòu),已然成為空管信息化部門信息化網(wǎng)絡(luò)應用建設(shè)的重中之重。
1 容災基礎(chǔ)性概念及空管現(xiàn)狀概述
數(shù)據(jù)容災技術(shù)主要用于保證數(shù)據(jù)的完整性、可靠性,目前對于數(shù)據(jù)容災技術(shù)的水平,主要通過RPO和RTO兩個指標來進行衡量:
RPO(恢復點目標)是對災難發(fā)生時數(shù)據(jù)恢復節(jié)點目標的描述;而RTO(恢復時間目標)則是對于數(shù)據(jù)災難發(fā)生時,數(shù)據(jù)中心應用系統(tǒng)恢復工作的時間。
對于空管數(shù)據(jù)中心而言,RPO恢復點目標應實現(xiàn)對實時數(shù)據(jù)的備份,對于各空管地區(qū)局、空管分局而言,數(shù)據(jù)容災中心應建立于多個獨立地點,這就要使得數(shù)據(jù)RPO恢復點的數(shù)據(jù)行份操作需要實現(xiàn)高帶寬的應用,現(xiàn)階段而言,為更好地實現(xiàn)實時RPO的目標,空管部門應在本地建立高速光纖寬帶備份的同步容災備份中心,同時利用公共傳輸網(wǎng)絡(luò)和數(shù)據(jù)重刪技術(shù),實現(xiàn)異地異步容災數(shù)據(jù)備份中心的建設(shè)。
同時,空管自身的信息化系統(tǒng)建設(shè)目前可主要分為兩類,即生產(chǎn)業(yè)務(wù)用系統(tǒng),如自動化等,以及非生產(chǎn)業(yè)務(wù)用系統(tǒng),如辦公自動化系統(tǒng)、人力資源管理系統(tǒng)等。對于不同類型的系統(tǒng),其RTO的目標也有所不同。對于生產(chǎn)業(yè)務(wù)用系統(tǒng)而言,其應實現(xiàn)實時的RTO,任何業(yè)務(wù)均不能出現(xiàn)任何的中斷,服務(wù)請求應能無縫銜接,前端在未感知的情況下繼續(xù)執(zhí)行操作,而非生產(chǎn)業(yè)務(wù)用系統(tǒng)則可以有一定的系統(tǒng)中斷時間,通過管理端響應操作后,實現(xiàn)相應信息化系統(tǒng)的恢復。
為更好構(gòu)建空管信息化數(shù)據(jù)中心,相應的RPO和RTO都應按最高的0為標準進行設(shè)計,以滿足包括自動化系統(tǒng)、航行情況系統(tǒng)在內(nèi)的生死攸關(guān)系統(tǒng)的日常應用,為解決此類情況,應設(shè)計和構(gòu)建基于生產(chǎn)業(yè)務(wù)中心的容災中心的雙活數(shù)據(jù)中心系統(tǒng)。
對于雙活數(shù)據(jù)中心而言,生產(chǎn)業(yè)務(wù)中心和容災中心并沒有明確的主備之分,每套系統(tǒng)都處于實時應用狀態(tài),其內(nèi)部通過高速光纖以太網(wǎng)連接,并使用應用通知的輪詢實現(xiàn)共同執(zhí)行相關(guān)業(yè)務(wù)。應用系統(tǒng)雙活數(shù)據(jù)中心應包括下面特性:
1) 高可用性:雙活數(shù)據(jù)中心應對數(shù)據(jù)丟失零容忍,應用系統(tǒng)可實時切換;
2) 高利用率:數(shù)據(jù)中心設(shè)備應基于私有云架構(gòu)建設(shè),通過云平臺的方式,實現(xiàn)多數(shù)據(jù)中心應用資源的共享和實時調(diào)配;
3) 高冗余度:數(shù)據(jù)中心內(nèi)部應用資源應隨時處于工作狀態(tài),在發(fā)生系統(tǒng)性災難時,數(shù)據(jù)中心業(yè)務(wù)可由雙活架構(gòu)進行自動調(diào)配,實現(xiàn)對應用流程、設(shè)備資源、系統(tǒng)資源的實時轉(zhuǎn)換,運維人員的日常工作應集中于對相關(guān)數(shù)據(jù)冗余策略的制定和修訂;
4) 維護高標準:相較于傳統(tǒng)數(shù)據(jù)中心,雙活數(shù)據(jù)中心對于數(shù)據(jù)、應用層面有著更高的管理要求,除了原有的數(shù)據(jù)的同步、異步復制備份管理以外,雙活數(shù)據(jù)中心的應用系統(tǒng)還包括了多類轉(zhuǎn)換策略的制定和傳輸帶寬的監(jiān)控等。對人員能力素質(zhì)提出了更高的要求。
2 容災技術(shù)
為更好地實現(xiàn)數(shù)據(jù)中心容災系統(tǒng)的建設(shè),目前主要采用了包括云計算、存儲虛擬化等多類技術(shù),目前常見的包括雙機冷備以及熱備加存儲的模式。
2.1 雙機冷備和(或)熱備+存儲模式
空管信息化建設(shè)中,傳統(tǒng)的數(shù)據(jù)中心是雙機冷備和熱備加存儲的模式,主備機之間的切換通過軟件的方式加以實現(xiàn)。目前此類基于數(shù)據(jù)復制手段的傳統(tǒng)容災方式只能實現(xiàn)對數(shù)據(jù)的恢復使用,但無法實現(xiàn)對于獨立業(yè)務(wù)的透明實時的熱切換;同時此類模式還需要制定復雜的連續(xù)性軟件保護模式,以實現(xiàn)對于RTO目標的達成,平時大量的資源處于閑置狀態(tài),浪費較為嚴重。
2.2 傳統(tǒng)主-備容災
對于數(shù)據(jù)中心故障的切換,通常最少需要30分鐘才能實現(xiàn)災備中心的啟用,在此期間,所有業(yè)務(wù)均會中斷使用,同時相關(guān)數(shù)據(jù)會存在無法連續(xù)性校驗的情況,在主用數(shù)據(jù)中心恢復使用時,容災中心的數(shù)據(jù)與主用中心的數(shù)據(jù)會出現(xiàn)較為嚴重的數(shù)據(jù)不一致情況,從而可能導致更長時間的停機維護和工作量。
2.3 主-備雙活模式
主備準雙活模式是現(xiàn)在使用較為常見的技術(shù),在此模式下,主用數(shù)據(jù)中心出現(xiàn)故障時,容災中心可實現(xiàn)實時對系統(tǒng)業(yè)務(wù)的接管,但這需要大量的軟件層面的工作,同時其相關(guān)的操作不具有普遍性,投入巨大。
2.4 雙活數(shù)據(jù)中心
雙活數(shù)據(jù)中心與原有的主備數(shù)據(jù)中心概念不同,它將完整的應用和數(shù)據(jù)放到了一個基于虛擬化存在的“大”數(shù)據(jù)中心當中,兩個或更多的數(shù)據(jù)中心均同時運行了多類應用,同時相關(guān)數(shù)據(jù)通過類似存儲虛擬化工具進行多地同步存儲,同時為用戶提供服務(wù)和業(yè)務(wù)負載。因此此類數(shù)據(jù)中心通常稱之為雙活數(shù)據(jù)中心。在單一節(jié)點數(shù)據(jù)中心故障時,其應用其剩余數(shù)據(jù)中心負責提供連續(xù)性服務(wù)。
2.5 雙活數(shù)據(jù)中心特點
1) 有效提升資源利用率,多個數(shù)據(jù)中心內(nèi)部資源同時運行應用和數(shù)據(jù),避免了由于閑置導致的浪費,同時在極端情況下,雙活數(shù)據(jù)中心可提供更多的應用服務(wù)能力。
2) 有效減少RTO時間,雙活數(shù)據(jù)中心內(nèi)部應用需要實現(xiàn)無縫實時切換,在單個數(shù)據(jù)中心節(jié)點故障時,剩余中心應保持正常運行狀態(tài)。
2.6 雙活設(shè)計的層次endprint
雙活數(shù)據(jù)中心的設(shè)計及實現(xiàn),包括了對私有云架構(gòu)的搭建,數(shù)據(jù)庫及存儲虛擬化應用的實現(xiàn),服務(wù)器虛擬化技術(shù)的應用,完整的以太網(wǎng)和SAN光纖傳輸網(wǎng)的構(gòu)架等多個層面。一盤的雙活數(shù)據(jù)中心應包括對上述內(nèi)容的所有方面的設(shè)計。
3 雙活數(shù)據(jù)中心的構(gòu)建
3.1 容災建設(shè)方案設(shè)計
1) 在空管內(nèi)部新建一個數(shù)據(jù)中心機房,新部署能滿足當前業(yè)務(wù)需要和中長期業(yè)務(wù)規(guī)劃要求的核心交換機、IBM小機以及SAN交換機(同時進行HA、虛擬化及負載均衡等部署),部署企業(yè)級磁盤陣列作為OA辦公自動化系統(tǒng)等應用數(shù)據(jù)庫的存儲設(shè)備,并實施數(shù)據(jù)遷移替換現(xiàn)有老舊的存儲。
2) 部署基于存儲虛擬化引擎的雙活數(shù)據(jù)平臺,將應用程序數(shù)據(jù)同時存放在2個數(shù)據(jù)中心,并同時對前端應用服務(wù)器提供數(shù)據(jù)讀和寫服務(wù),在獲得工作負載彈性優(yōu)勢的同時,使空管信息系統(tǒng)具備提供全天候無中斷服務(wù)的能力。數(shù)據(jù)庫的同步工作和一致性保證由存儲虛擬化系統(tǒng)執(zhí)行。
3) 為滿足數(shù)據(jù)安全的更高要求,在新機房建成后通過部署與持續(xù)數(shù)據(jù)保護系統(tǒng),獲得任意時間點恢復的能力,搭設(shè)災備數(shù)據(jù)中心,從而實現(xiàn)兩地三中心的容災,防止由于災難或邏輯錯誤而引起的數(shù)據(jù)錯誤及丟失。當有錯誤出現(xiàn)時可借助災備系統(tǒng)中心實現(xiàn)數(shù)據(jù)的恢復以保證數(shù)據(jù)的安全。
4 結(jié)論
雙活數(shù)據(jù)中心系統(tǒng)架構(gòu)是容災建設(shè)方案的核心要點,其關(guān)鍵點在于對于存儲虛擬化引擎的實現(xiàn)。通過對雙活數(shù)據(jù)中心的邏輯應用構(gòu)建,業(yè)務(wù)可實現(xiàn)無縫從單一數(shù)據(jù)中心向多個冗余數(shù)據(jù)中心數(shù)據(jù)的切換,業(yè)務(wù)時刻保持可用狀態(tài),實現(xiàn)數(shù)據(jù)中心的高可用性。
通常對于空管業(yè)務(wù)量而言,只需要實現(xiàn)使用了兩個應用存儲虛擬化網(wǎng)關(guān)的雙數(shù)據(jù)中心即可滿足大部分需要,通過對存儲虛擬化網(wǎng)關(guān)的應用,雙數(shù)據(jù)中心打通為了一個虛擬化的私有云架構(gòu)的虛擬數(shù)據(jù)中心實體。應用和數(shù)據(jù)在私有云內(nèi)部自動態(tài)進行遷移,對于重點業(yè)務(wù)還可使用包括同步IO操作在內(nèi)的數(shù)據(jù)保護措施,實現(xiàn)業(yè)務(wù)的自動化負載均衡和無間斷響應,有效的提升關(guān)鍵性業(yè)務(wù)的完整性可靠性,使RPO和RTO的標準達到近似于0的程度。
基于存儲虛擬化構(gòu)建的雙活數(shù)據(jù)中心,可有效地提升原有數(shù)據(jù)中心主-備關(guān)聯(lián)的容災備份效率,在不斷提升了業(yè)務(wù)使用連續(xù)性的情況下,大大提升了資源的利用率,有效地節(jié)約了用戶的硬件投入成本。當然,任何技術(shù)都有其自身存在的不足,因此一套完整可靠的信息化應用體系,還需要基于管理和技術(shù)的結(jié)合,才能實現(xiàn)數(shù)據(jù)、應用的穩(wěn)步運行。endprint