中國中鋼集團(tuán)公司 瞿秋楊 武 緯 劉曉明
淺談災(zāi)難備份系統(tǒng)的技術(shù)選型
中國中鋼集團(tuán)公司 瞿秋楊 武 緯 劉曉明
很多大型企業(yè)或集團(tuán)公司都應(yīng)用了ERP系統(tǒng)等信息系統(tǒng),企業(yè)的日常業(yè)務(wù)和信息系統(tǒng)的結(jié)合越來越緊密,傳統(tǒng)的磁帶備份技術(shù)所能達(dá)到的指標(biāo)已經(jīng)無法滿足基于數(shù)據(jù)庫的業(yè)務(wù)系統(tǒng)對(duì)可靠性和數(shù)據(jù)丟失容忍度的要求。通過災(zāi)難備份(以下簡稱“災(zāi)備”)系統(tǒng)的建設(shè),企業(yè)一方面可以進(jìn)一步提升信息系統(tǒng)的風(fēng)險(xiǎn)控制管理能力,提高災(zāi)難恢復(fù)水平,保障業(yè)務(wù)持續(xù)運(yùn)作,另一方面也可以滿足國家和行業(yè)主管部門的規(guī)范性要求,與此同時(shí),還能對(duì)外樹立良好的社會(huì)形象,以增加客戶對(duì)企業(yè)的信心。
由于上線比較早且受到企業(yè)自身特點(diǎn)的限制,很多企業(yè)的信息系統(tǒng)未使用分布式存儲(chǔ)或云架構(gòu),關(guān)系型數(shù)據(jù)庫仍然是很多企業(yè)IT架構(gòu)的組成部分。因此,我們接下來分析的災(zāi)難備份系統(tǒng)主要適用于基于關(guān)系型數(shù)據(jù)庫的ERP系統(tǒng),不包括分布式部署和云架構(gòu)等架構(gòu)。本文將以本企業(yè)視角來分析對(duì)比不同技術(shù)的特點(diǎn)和優(yōu)劣,從而最終完成災(zāi)備技術(shù)選型,希望能給同類企業(yè)以參考和啟發(fā):
DataGuard是ORACLE 推出的一種高可用性(HIGH AVAILABLE)的數(shù)據(jù)庫方案,在8i之前稱之為standby database,從9i開始,正式更名為Dataguard,它是在主節(jié)點(diǎn)與備用節(jié)點(diǎn)間通過日志同步來保證數(shù)據(jù)的同步,可以實(shí)現(xiàn)快速切換與災(zāi)難性恢復(fù)。
DataGuard是一種單一針對(duì)數(shù)據(jù)庫的災(zāi)備技術(shù),如果要滿足企業(yè)對(duì)ERP系統(tǒng)整體的備份需求,需要選取對(duì)數(shù)據(jù)庫代碼及應(yīng)用服務(wù)的備份技術(shù)或單獨(dú)開發(fā)shell腳本完成對(duì)應(yīng)用層的災(zāi)難備份,所以基于DataGuard理念的純數(shù)據(jù)庫災(zāi)備解決方案不能滿足完全滿足信息系統(tǒng)對(duì)災(zāi)備系統(tǒng)的需求。
存儲(chǔ)設(shè)備鏡像復(fù)制技術(shù)的解決方案,主要依靠集成在存儲(chǔ)設(shè)備上的控制軟件管理,在存儲(chǔ)邏輯卷上生成快照,在通過生產(chǎn)中心和災(zāi)備中心存儲(chǔ)設(shè)備(光纖交換機(jī))間建立光纖鏈路完成數(shù)據(jù)的復(fù)制。在災(zāi)備過程中數(shù)據(jù)流向示意如圖1所示:
圖1
基于存儲(chǔ)設(shè)備鏡像技術(shù)原理是生產(chǎn)環(huán)境數(shù)據(jù)的復(fù)制和保護(hù)通過存儲(chǔ)完成,磁盤快照生成、拷貝和傳輸通過光纖存儲(chǔ)的管理模塊實(shí)現(xiàn),再將生產(chǎn)環(huán)境生成的鏡像通過光纖鏈路復(fù)制到災(zāi)備中心的存儲(chǔ)設(shè)備,這個(gè)過程對(duì)生產(chǎn)中心和災(zāi)備中心的主機(jī)是透明的。
基于存儲(chǔ)設(shè)備鏡像技術(shù)的解決方案依賴于存儲(chǔ)廠商的存儲(chǔ)產(chǎn)品,其典型的代表有IBM、EMC、日立、HP等存儲(chǔ)廠商,一般低端的存儲(chǔ)產(chǎn)品不支持用于災(zāi)備的鏡像拷貝相關(guān)技術(shù),故在災(zāi)備中需要使用和生產(chǎn)中心同廠商的中端光纖存儲(chǔ)產(chǎn)品;另外,基于存儲(chǔ)鏡像拷貝的技術(shù)需要光纖鏈路來進(jìn)行數(shù)據(jù)的傳輸。此類解決方案的案例覆蓋了很多電信企業(yè)、大型企業(yè)ERP系統(tǒng),如山東聯(lián)通、云南聯(lián)通、中國鋁業(yè)ERP系統(tǒng)等。
結(jié)合案例分析可以發(fā)現(xiàn),基于存儲(chǔ)設(shè)備鏡像復(fù)制技術(shù)更多的應(yīng)用于通信行業(yè)的企業(yè)中,這是由于其對(duì)數(shù)據(jù)傳送帶寬有較高的要求,甚至需要在生產(chǎn)中心和災(zāi)備中心間通過光纖鏈路來實(shí)現(xiàn)數(shù)據(jù)復(fù)制,而一般的企業(yè)難以承擔(dān)建設(shè)或租用光纖鏈路的昂貴費(fèi)用。在災(zāi)備方案的選型是要選取最適合企業(yè)現(xiàn)有災(zāi)備需求的方案,以避免投資的盲目性,同時(shí)也是從經(jīng)濟(jì)可行性的角度分析,基于存儲(chǔ)設(shè)備鏡像技術(shù)的容災(zāi)解決方案不適合大部分ERP系統(tǒng)的中小型企業(yè)用戶。
持續(xù)數(shù)據(jù)保護(hù),Continuous Data Protection(CDP),作為一種災(zāi)備的概念提出,是對(duì)傳統(tǒng)數(shù)據(jù)備份技術(shù)的一次的重大突破。CDP技術(shù)通過在操作系統(tǒng)核心層中植入文件過濾驅(qū)動(dòng)程序,來實(shí)時(shí)捕獲所有文件訪問操作。對(duì)于需要CDP連續(xù)備份保護(hù)的文件,當(dāng)CDP管理模塊經(jīng)由文件過濾驅(qū)動(dòng)攔截到其改寫操作時(shí),則預(yù)先將文件數(shù)據(jù)變化部分連同當(dāng)前的系統(tǒng)時(shí)間戳(System Time Stamp)一起自動(dòng)備份到UnaCDP存儲(chǔ)體。從理論上說,任何一次的文件數(shù)據(jù)變化都會(huì)被自動(dòng)記錄,因而稱之為持續(xù)數(shù)據(jù)保護(hù)。
CDP持續(xù)數(shù)據(jù)保護(hù)技術(shù)分為真CDP(True CDP)和準(zhǔn)CDP(Near CDP)兩類。CDP的分類是相對(duì)于數(shù)據(jù)保護(hù)時(shí)間點(diǎn)而言的。準(zhǔn)CDP技術(shù)是按照一定的時(shí)間頻率,持續(xù)的記錄并備份數(shù)據(jù)變化,每次備份有一定時(shí)間窗口,需要數(shù)據(jù)恢復(fù)時(shí),可以恢復(fù)到過去備份的時(shí)間點(diǎn),并不能形成完全意義上的持續(xù)保護(hù),因此稱為準(zhǔn)CDP技術(shù)。而真CDP技術(shù)是持續(xù)不間斷的監(jiān)控并備份數(shù)據(jù)變化,可以恢復(fù)到過去任意時(shí)間點(diǎn),是真正的實(shí)時(shí)備份。
通過與技術(shù)廠商溝通交流后發(fā)現(xiàn),按實(shí)現(xiàn)的原理區(qū)分,CDP的技術(shù)也可分為兩種:一種是通過操作系統(tǒng)層面的鏡像實(shí)現(xiàn);另一種是通過光纖交換機(jī)的端口復(fù)制技術(shù)實(shí)現(xiàn)。
3.1 基于操作系統(tǒng)磁盤鏡像的C D P解決方案
基于操作系統(tǒng)磁盤鏡像的CDP技術(shù),反映其原理的數(shù)據(jù)流示意圖如圖2所示:
圖2
生產(chǎn)環(huán)境的數(shù)據(jù)通過操作系統(tǒng)的鏡像保存為兩份,一份在原有的生產(chǎn)存儲(chǔ)上,另一份鏡像數(shù)據(jù)通過CDP服務(wù)器再連接到存儲(chǔ)設(shè)備,在操作系統(tǒng)上安裝CDP設(shè)備的驅(qū)動(dòng),改寫的驅(qū)動(dòng)將生產(chǎn)環(huán)境數(shù)據(jù)傳遞到CDP主機(jī),這樣CDP服務(wù)器就可以獲取生產(chǎn)數(shù)據(jù)的變化,以此建立映射和生成快照,并通過網(wǎng)絡(luò)鏈路傳輸實(shí)現(xiàn)災(zāi)備。
基于操作系統(tǒng)磁盤鏡像的CDP解決方案需要在生產(chǎn)中心和災(zāi)備中心添加CDP服務(wù)器,其在架構(gòu)中的位置在光纖交換機(jī)到備份存儲(chǔ)設(shè)備之間,對(duì)生產(chǎn)環(huán)境的鏡像通過主機(jī)操作系統(tǒng)實(shí)現(xiàn),CDP服務(wù)器主要用于數(shù)據(jù)分析、快照的管理和傳輸,并可使用窄帶傳輸,其典型代表有美國公司的IPStor產(chǎn)品等。此類解決方案在國外有這廣泛的應(yīng)用,在國內(nèi)也有一定的案例,如韓國電信、中國移動(dòng)、華北電網(wǎng)、深圳市國家稅務(wù)局等。
3.2 基于光纖交換機(jī)端口轉(zhuǎn)發(fā)技術(shù)的C D P解決方案
基于光纖交換機(jī)端口轉(zhuǎn)發(fā)的CDP技術(shù),反映其原理的數(shù)據(jù)流示意圖如圖3所示:
圖3
與基于操作系統(tǒng)鏡像技術(shù)的CDP不同,基于光纖交換機(jī)端口復(fù)制的CDP技術(shù),對(duì)生產(chǎn)環(huán)境主機(jī)透明,生產(chǎn)環(huán)境數(shù)據(jù)在經(jīng)過光纖交換機(jī)時(shí),使用類似網(wǎng)絡(luò)交換機(jī)端口轉(zhuǎn)發(fā)的技術(shù),將光纖協(xié)議數(shù)據(jù)包同步復(fù)制到CDP主機(jī)的光纖端口,這樣CDP主機(jī)獲取到生產(chǎn)環(huán)境的數(shù)據(jù)并以此建立映射和生成快照,并通過網(wǎng)絡(luò)鏈路傳輸實(shí)現(xiàn)災(zāi)備。
基于光纖交換機(jī)端口轉(zhuǎn)發(fā)技術(shù)的CDP解決方案需添加光纖交換機(jī)、CDP服務(wù)器;其特點(diǎn)是對(duì)生產(chǎn)環(huán)境數(shù)據(jù)的鏡像通過光纖交換機(jī)的端口轉(zhuǎn)發(fā)技術(shù)實(shí)現(xiàn),此技術(shù)是硬件實(shí)現(xiàn)技術(shù),理論上會(huì)比基于操作系統(tǒng)鏡像的技術(shù)更節(jié)省系統(tǒng)資源,同樣可使用窄帶傳輸,此類技術(shù)其典型代表有EMC的RecoverPoint和InMage CX產(chǎn)品等使用此類技術(shù)解決方案的案例大多在國外,如Citrix公司、Seagate公司等。
根據(jù)存儲(chǔ)網(wǎng)絡(luò)聯(lián)合會(huì)(Storage Networking Industry Association,SNIA)官方對(duì)于存儲(chǔ)虛擬化技術(shù)(Virtualization)的定義,如下:
①將存儲(chǔ)(子)系統(tǒng)內(nèi)部功能與具體應(yīng)用、主機(jī)及通用網(wǎng)絡(luò)資源分離、隱藏及抽象的行為。以期達(dá)到存儲(chǔ)或數(shù)據(jù)管理的網(wǎng)絡(luò)無關(guān)性。
②對(duì)于存儲(chǔ)服務(wù)及設(shè)備的虛擬化應(yīng)用,以期達(dá)到整合設(shè)備功能、隱藏復(fù)雜細(xì)節(jié)以及向已經(jīng)存在的底層存儲(chǔ)資源添加新的應(yīng)用。
當(dāng)前有許多的技術(shù)在不同層中對(duì)存儲(chǔ)層中進(jìn)行虛擬化,包括物理存儲(chǔ),RAID磁盤,LUN(Logical Unit Number),存儲(chǔ)區(qū)域,LUN分區(qū),LUN遮罩及影射,文件系統(tǒng),數(shù)據(jù)庫對(duì)象。相應(yīng)地實(shí)現(xiàn)這些虛擬化技術(shù)的設(shè)施有磁盤陣列,陣列控制器,存儲(chǔ)交換機(jī),路由器,分布式虛擬設(shè)備,總線適配器,操作系統(tǒng)以及相應(yīng)的應(yīng)用層軟件。這些不同的技術(shù)表明對(duì)于解決共有的存儲(chǔ)問題,虛擬化是一個(gè)很關(guān)鍵的技術(shù)方向。
存儲(chǔ)虛擬化技術(shù)由于類型眾多,而它們所處于存儲(chǔ)棧位置也不一樣,因此其實(shí)現(xiàn)技術(shù)也相當(dāng)?shù)亩?,而且所關(guān)注的面也不一樣。比如RAID技術(shù)其實(shí)就是基于存儲(chǔ)設(shè)備的存儲(chǔ)虛擬化技術(shù)實(shí)現(xiàn)之一,還有卷管理技術(shù)LVM邏輯鏡像,包括 SoftRAID 也都是存儲(chǔ)虛擬化的實(shí)現(xiàn)技術(shù)。作為與本文所討論的存儲(chǔ)分層存較為接近關(guān)系原因,這里重點(diǎn)介紹一下基于主機(jī)及存儲(chǔ)設(shè)備的虛擬化技術(shù)的實(shí)現(xiàn)。而對(duì)于基于網(wǎng)絡(luò)的虛擬化技術(shù)實(shí)現(xiàn)主要用于數(shù)據(jù)中心級(jí)的存儲(chǔ)規(guī)劃中。特別的,這三種實(shí)現(xiàn)技術(shù)可以同時(shí)結(jié)合起來,或者一個(gè)以另一個(gè)為基礎(chǔ)來實(shí)現(xiàn)。
存儲(chǔ)虛擬化技術(shù)是近年出現(xiàn)的新技術(shù)之一,其依靠智能光纖交換機(jī)實(shí)現(xiàn)存儲(chǔ)虛擬化,也就是使存儲(chǔ)對(duì)操作系統(tǒng)的透明,可以集中管理分配企業(yè)范圍內(nèi)所有異構(gòu)的存儲(chǔ)。而將這種技術(shù)用于災(zāi)備系統(tǒng),反映其原理的數(shù)據(jù)流示意圖如圖4所示:
圖4
基于存儲(chǔ)虛擬化的解決方案,需要在生產(chǎn)中心和災(zāi)備中心部署智能交換機(jī)和災(zāi)備SVM主機(jī)。存儲(chǔ)虛擬化技術(shù)可以實(shí)現(xiàn)存儲(chǔ)設(shè)備對(duì)主機(jī)的透明,所有的生產(chǎn)數(shù)據(jù)都由主機(jī)→光纖交換機(jī)→智能交換機(jī)→光纖交換機(jī)→存儲(chǔ)設(shè)備的路徑傳送,通過智能交換機(jī)生成數(shù)據(jù)快照,經(jīng)SVM主機(jī)通過網(wǎng)絡(luò)鏈路復(fù)制到災(zāi)備端SVM主機(jī)送達(dá)災(zāi)備中心的虛擬存儲(chǔ)環(huán)境。
基于存儲(chǔ)虛擬化的解決方案此解決方案需添加光纖智能交換機(jī)(用于虛擬化)、存儲(chǔ)虛擬化服務(wù)器(SVM),對(duì)生產(chǎn)環(huán)境架構(gòu)改動(dòng)較大,其智能交換機(jī)光纖交換機(jī)和主機(jī)、存儲(chǔ)之間,災(zāi)備中心也需要同樣的架構(gòu)部署,可使用窄帶傳輸;此類技術(shù)典型代表有Stor-Age公司的SVM產(chǎn)品等,在國外有很多成熟案例,如以色列最大的銀行Hapoalim、德國領(lǐng)先的BHF-BANK銀行等,國內(nèi)案例相對(duì)較少,有天津天獅集團(tuán)等。
通過對(duì)上述主流災(zāi)備技術(shù)的分析,通過技術(shù)類型、建設(shè)費(fèi)用、帶寬需求等方面與本企業(yè)現(xiàn)有災(zāi)備需求進(jìn)行比對(duì),詳見表1:
表1
通過對(duì)比,由于ERP系統(tǒng)備份除了關(guān)系型數(shù)據(jù)庫外,還包括應(yīng)用系統(tǒng),單純的虛擬帶庫和DataGuard都無法完全滿足需求,而在輔助以文件系統(tǒng)復(fù)制或腳本等其它技術(shù),會(huì)使得技術(shù)方案復(fù)雜性增加,因此從技術(shù)可行性方面排除了虛擬帶庫和DataGuard的技術(shù)方案;由于處于成本和擴(kuò)展性的考慮,基于存儲(chǔ)設(shè)備鏡像的災(zāi)備技術(shù),雖然能完全滿足對(duì)ERP數(shù)據(jù)庫和應(yīng)用系統(tǒng)的災(zāi)備需求,但是基于該技術(shù)的解決方案會(huì)需要光纖鏈路來進(jìn)行數(shù)據(jù)復(fù)制,將會(huì)帶來較高的成本,同時(shí)存儲(chǔ)設(shè)備的選擇也會(huì)受到廠商和設(shè)備型號(hào)的限制,從經(jīng)濟(jì)可行性方面排除了基于存儲(chǔ)設(shè)備鏡像的災(zāi)備技術(shù)。最終,本企業(yè)的ERP系統(tǒng)災(zāi)備系統(tǒng)的選型初步確定為基于CDP技術(shù)的災(zāi)備技術(shù)。
在確定了基于CDP技術(shù)的災(zāi)備解決方案后,我們通過POC測試驗(yàn)證了基于快照的CDP技術(shù)和基于光纖交換機(jī)端口復(fù)制的CDP技術(shù)方案。兩者對(duì)災(zāi)備復(fù)制鏈路的帶寬需求不高,且適用RPO均為分鐘級(jí),前者屬于準(zhǔn)CDP技術(shù),成本相對(duì)更低,方案更靈活,而后者屬于TrueCDP技術(shù),基于光纖交換機(jī)的硬件技術(shù),對(duì)生產(chǎn)系統(tǒng)的性能影響更小,RPO指標(biāo)更低,可實(shí)現(xiàn)恢復(fù)到任意時(shí)間點(diǎn),但需要現(xiàn)有系統(tǒng)的光纖交換機(jī)支持“端口鏡像”的復(fù)制技術(shù),如不支持則需要級(jí)聯(lián)一臺(tái)支持該技術(shù)的光纖交換機(jī)。
最終,考慮到企業(yè)對(duì)ERP系統(tǒng)的RPO需求只需要在2小時(shí)內(nèi),同時(shí)考慮到現(xiàn)有的光纖交換機(jī)并不支持“端口鏡像”的復(fù)制技術(shù),如采用基于光纖交換機(jī)端口復(fù)制的CDP技術(shù),需要額外采購光纖交換機(jī)與現(xiàn)有設(shè)備級(jí)聯(lián),成本和技術(shù)風(fēng)險(xiǎn)更高,因此我們選擇了基于快照的CDP技術(shù)作為災(zāi)難備份的技術(shù)解決方案。