杜文濤
摘要:該文以工作實際為例,提出利用雙機雙柜技術(shù)實現(xiàn)對系統(tǒng)業(yè)務(wù)的不間斷應(yīng)用及在線數(shù)據(jù)的存儲保護;利用CDP技術(shù)解決軟、硬故障造成的數(shù)據(jù)損壞、丟失等問題;利用原有的存儲備份系統(tǒng)對數(shù)據(jù)進行冗余備份,這些技術(shù)的應(yīng)用保證了應(yīng)用數(shù)據(jù)的不間斷運行及在線數(shù)據(jù)的安全。
關(guān)鍵詞:CDP;雙機雙柜;冗余;數(shù)據(jù)安全;業(yè)務(wù)連續(xù)
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2018)18-0007-03
數(shù)據(jù)是信息化系統(tǒng)的基礎(chǔ),應(yīng)用中要保證其數(shù)據(jù)安全性與業(yè)務(wù)連續(xù)性。好的數(shù)據(jù)存儲保護系統(tǒng)能對分散的業(yè)務(wù)數(shù)據(jù),進行集中存儲,集中管理,并在出現(xiàn)災(zāi)難時,能夠提供多層次的快速、可靠的恢復(fù)手段,確保數(shù)據(jù)安全,同時提高業(yè)務(wù)連續(xù)性。因此一種先進、可靠、安全的數(shù)據(jù)存儲保護方式就顯得至關(guān)重要了。該文以澄合礦業(yè)數(shù)據(jù)存儲備份改造工程為例論述雙機雙柜+CDP技術(shù)在數(shù)據(jù)存儲備份中的應(yīng)用。
1 澄合礦業(yè)數(shù)據(jù)保護原狀
澄合礦業(yè)公司信息化經(jīng)多年發(fā)展,已經(jīng)有限程度地組織了部分業(yè)務(wù)的計算機應(yīng)用,其數(shù)據(jù)存儲保護方式采用“物理帶庫+備份軟件”的方式對服務(wù)器中的數(shù)據(jù)進行備份。
當前,澄合礦業(yè)既沒有對應(yīng)用系統(tǒng)實施在線應(yīng)用保護,也沒有對數(shù)據(jù)進行完全安全的離線保護措施,信息系統(tǒng)的數(shù)據(jù)保護環(huán)境存在多方面的隱患:
①數(shù)據(jù)安全性差:原系統(tǒng)中數(shù)據(jù)每24小時備份一次,服務(wù)器一旦在這之間出現(xiàn)工作異常,會造成重要數(shù)據(jù)損壞、丟失、無法恢復(fù),從而造成不可估量的損失。
②數(shù)據(jù)的共享性非常差:數(shù)據(jù)的共享依靠LAN網(wǎng)絡(luò)來實現(xiàn),由于LAN網(wǎng)絡(luò)要承擔所有應(yīng)用的對外服務(wù)工作,這樣數(shù)據(jù)的共享無形中加中了LAN網(wǎng)絡(luò)的負擔,影響正常業(yè)務(wù)的運作。
③管理成本非常高:存儲設(shè)備無冗余備份,管理員需要在各服務(wù)器中再分別備份一份冗余備份數(shù)據(jù),從而增加了管理員的維護工作量。
④業(yè)務(wù)連續(xù)性無法保障:應(yīng)用系統(tǒng)及數(shù)據(jù)沒有相應(yīng)的在線保護策略,一旦發(fā)生系統(tǒng)非法指令,硬件故障、硬盤損壞、文件系統(tǒng)故障等問題時,不但故障期間一部分數(shù)據(jù)無法恢復(fù),系統(tǒng)應(yīng)用也將在一段時間無法使用。
考慮澄合礦業(yè)公司信息化發(fā)展的需要,我們決定采用雙機雙柜+cdp的組合方式來解決澄合礦業(yè)對數(shù)據(jù)安全性及業(yè)務(wù)連續(xù)性的需求。
2 雙機雙柜+cdp技術(shù)簡介
2.1雙機雙柜技術(shù)簡介
雙機雙柜采用磁盤陣列冗余配置,徹底避免了磁盤陣列的單點故障,使得用戶的應(yīng)用服務(wù)、關(guān)鍵數(shù)據(jù)均得到了保護。雙機雙柜一般采用雙服務(wù)器,雙磁盤陣列的方式,磁盤陣列間通過鏡像方式實現(xiàn)磁盤陣列的冗余,服務(wù)器端通過高可用集群軟件配置實現(xiàn)應(yīng)用服務(wù)高可用。
1)雙機雙柜技術(shù)的主要優(yōu)點
①硬件結(jié)合實現(xiàn)真正意義上的數(shù)據(jù)與系統(tǒng)分離:雙機雙柜系統(tǒng)的數(shù)據(jù)冗余存放在雙存儲中,提高了數(shù)據(jù)的安全性。
②避免了單點故障的發(fā)生:服務(wù)器和存儲都采用了雙冗余的方式。[1]
③系統(tǒng)切換時間短:雙機雙柜系統(tǒng)保證了一臺服務(wù)器發(fā)生故障時,可以在40秒內(nèi)自動切換到另一臺服務(wù)器,切換過程對應(yīng)用程序無影響,無需重新啟動或登錄,客戶端用戶不會感受到服務(wù)器中斷。
④系統(tǒng)效率高:整個系統(tǒng)中數(shù)據(jù)讀寫、管理及容錯由磁盤陣列來完成,系統(tǒng)的服務(wù)器故障糾錯處理由HA(High Available)軟件也稱為雙機熱備軟件或群集軟件來完成,這兩個都是相對獨立的子系統(tǒng)。
2)雙機雙柜工作方式
雙機雙柜系統(tǒng)以磁盤陣列及HA軟件為核心,數(shù)據(jù)庫及關(guān)鍵業(yè)務(wù)數(shù)據(jù)存放在磁盤陣列中,兩臺服務(wù)器只安裝本地系統(tǒng)文件及HA軟件,并作雙機雙工的容錯方式。當系統(tǒng)啟動后:HA首先啟動HA manager管理程序,然后啟動必要的服務(wù)和代理程序來監(jiān)控和管理系統(tǒng)服務(wù)。當HA代理程序監(jiān)測到某個服務(wù)或硬件發(fā)生故障并作相應(yīng)處理后仍不能成功時,則開始切換服務(wù):將IP飄移到相同用戶名的另一臺Standby服務(wù)器上,磁盤陣列中的數(shù)據(jù)庫由主服務(wù)器切換到從服務(wù)器,并恢復(fù)所有的服務(wù)功能。
2.2 cdp技術(shù)簡介
CDP( Continuous Data Protection),就是持續(xù)數(shù)據(jù)保護[2],是2005年國外新興的一種數(shù)據(jù)保護技術(shù),它突破了傳統(tǒng)的備份/恢復(fù)的數(shù)據(jù)保護模式,持續(xù)實時地跟蹤捕獲數(shù)據(jù)變化,并將其記錄到專用的存儲設(shè)備或通過網(wǎng)絡(luò)發(fā)送到專用服務(wù)器上,在故障發(fā)生時能夠?qū)⒈槐Wo的數(shù)據(jù)狀態(tài)恢復(fù)到任意時間點[3]。
1)cdp技術(shù)的主要優(yōu)點
①實現(xiàn)一體化的本地/異地備份與容災(zāi)體系:一體化的CDP備份/容災(zāi)技術(shù),使用戶很輕松就獲得了備份和容災(zāi)的雙重效果。進行恢復(fù)時,用戶可以自主選定在本地還是異地進行。
②瞬間恢復(fù),數(shù)據(jù)立即可用:CDP使‘恢復(fù)回歸到‘立即可用的本義。任何災(zāi)難情況下,CDP基于秒級顆粒的歷史恢復(fù)能力使數(shù)據(jù)可以輕松回到故障前的任何一秒。另外,CDP采用將內(nèi)在故障與外在故障分層恢復(fù)的架構(gòu),讓大部分常見故障的恢復(fù)更加高效。[4]
③全面防御所有災(zāi)難,徹底消除災(zāi)難死角:從‘軟錯誤,到‘硬故障;從單個文件丟失,到站點級災(zāi)難,CDP的保護能力要能夠全面覆蓋所有災(zāi)難,做到根本沒有災(zāi)難死角。
④易于維護,簡單的圖形化管理:CDP采用了全圖形化管理方式,操作方便。
2) cdp的工作方式
CDP產(chǎn)品自動在后臺運行,實時記錄文件或應(yīng)用程序中基于目標保護數(shù)據(jù)所發(fā)生的所有變化,整個過程無須應(yīng)用或管理員參與。它可以實時復(fù)制每個I/O動作并記錄時間,從而完整地保存系統(tǒng)的存取變動歷程。CDP的數(shù)據(jù)回滾時間比快照的恢復(fù)時間要快得多。CDP解決方案所具有的用數(shù)據(jù)歷史上的特定事件或特殊時刻解釋時間表的能力,可以使目標數(shù)據(jù)恢復(fù)到任何特定的時間點上,這對于用戶來講具有非常大的實用價值。
3 雙機雙柜+cdp技術(shù)在澄合礦業(yè)的實現(xiàn)方式
雙機雙柜+CDP技術(shù)在澄合礦業(yè)的應(yīng)用,使新建的存儲災(zāi)備系統(tǒng)數(shù)據(jù)丟失量達到毫秒級,數(shù)據(jù)恢復(fù)速度達到分鐘級,業(yè)務(wù)恢復(fù)速度達到小時級,提供對Windows操作系統(tǒng)保護能力,在服務(wù)器本地磁盤損壞而導(dǎo)致系統(tǒng)宕機時,以分鐘級的速度快速恢復(fù)業(yè)務(wù)。其實現(xiàn)主要分為兩個部分,一部分是使用雙機雙柜+CDP技術(shù)來實現(xiàn)。根據(jù)澄合礦業(yè)應(yīng)用系統(tǒng)的業(yè)務(wù)運行需要,一部分應(yīng)用系統(tǒng),如財務(wù)系統(tǒng)等對系統(tǒng)業(yè)務(wù)及數(shù)據(jù)的連續(xù)性、安全性要求較高,一般不允許業(yè)務(wù)中斷,我們考慮采用雙機雙柜+CDP的方式實現(xiàn)其數(shù)據(jù)保護;另有一部分業(yè)務(wù)應(yīng)用系統(tǒng),如人力資源系統(tǒng),設(shè)備管理系統(tǒng)等對數(shù)據(jù)的連續(xù)性、安全性要求較高,但其業(yè)務(wù)允許短暫的中斷??紤]到設(shè)備的成本,我們采用雙柜+CDP技術(shù)實現(xiàn)其數(shù)據(jù)保護。
考慮澄合礦業(yè)數(shù)據(jù)存儲保護的實際情況,我們從數(shù)據(jù)和業(yè)務(wù)兩個方面來說明其實現(xiàn)過程。
3.1數(shù)據(jù)存儲保護的實現(xiàn)
對數(shù)據(jù)存儲保護主要從其要實現(xiàn)的性能方面來考慮:
1)對在線數(shù)據(jù)的保護
對在線數(shù)據(jù)的保護分為以下幾個步驟:
①存儲架構(gòu)的方式:為了實現(xiàn)對在線數(shù)據(jù)的保護,我們對整個應(yīng)用系統(tǒng)的存儲進行了統(tǒng)一規(guī)劃,利用全冗余的SAN存儲架構(gòu)進行了集中存儲。在SAN結(jié)構(gòu)中,為每一臺服務(wù)器安裝兩片光纖卡,各服務(wù)器、磁盤陣列、通過兩臺光纖交換機連接成一個冗余的SAN結(jié)構(gòu)。
②磁盤陣列的應(yīng)用:實現(xiàn)冗余存儲,配置了兩臺NetStor ISUM650磁盤陣列,根據(jù)需求將磁盤陣列中的硬盤以RAID5+熱備援磁盤的方式創(chuàng)建磁盤,建立RAID邏輯磁盤與主機通道之間的映射關(guān)系:將磁盤陣列通過FC線纜連接到光纖交換機上,確保服務(wù)器以及操作系統(tǒng)能夠正常訪問磁盤陣列。
③用軟件實現(xiàn)數(shù)據(jù)的同步:通過HA軟件中的Volume Manager,可以將兩臺存儲系統(tǒng)中的數(shù)據(jù)實現(xiàn)同步復(fù)制,從而保障在任何一臺存儲系統(tǒng)出現(xiàn)故障時,都不會由于單臺存儲設(shè)備的不可訪問而導(dǎo)致應(yīng)用系統(tǒng)不能運行。
④數(shù)據(jù)庫文件的遷移:利用數(shù)據(jù)庫技術(shù)將數(shù)據(jù)庫文件遷移至共享磁盤陣列中。這時將在兩臺存儲陣列中存放相同的兩份數(shù)據(jù)庫文件,并且隨著數(shù)據(jù)的變化而同時變化。從而保證了數(shù)據(jù)庫文件不會因一臺存儲故障而導(dǎo)致數(shù)據(jù)損失的情況發(fā)生。
2)對歷史數(shù)據(jù)的保護
對歷史數(shù)據(jù)的保護通過以下兩個方面來實現(xiàn)。
①備份軟件+帶庫
為充分利用原有的資源,仍采用原帶庫及其配套備份軟件對數(shù)據(jù)進行備份,實現(xiàn)上我們將原帶庫與FC交換機相連,通過SAN結(jié)構(gòu)中的光纖通道傳輸數(shù)據(jù)。
②CDP技術(shù)的應(yīng)用
為了解決原有備份軟件數(shù)據(jù)備份間隔時間長,恢復(fù)難,發(fā)生災(zāi)難時間點到最近一次備份時間段內(nèi)數(shù)據(jù)無法恢復(fù)及數(shù)據(jù)邏輯錯誤等問題。我們采用了NetStor NRS1000F設(shè)備實現(xiàn)了基于快照的數(shù)據(jù)保護、一定時間內(nèi)的時間視圖功能、遠程復(fù)制技術(shù)、秒級數(shù)據(jù)保護和瞬態(tài)還原等功能。
3.2 業(yè)務(wù)應(yīng)用保護的實現(xiàn)
對業(yè)務(wù)應(yīng)用的保護可以通過以下兩種方式來實現(xiàn):
1)通過CDP實現(xiàn)
CDP的實現(xiàn)上采用了NRS1000F提供對windows操作系統(tǒng)保護能力,在服務(wù)器本地磁盤損壞而導(dǎo)致系統(tǒng)宕機時,能夠通過對NRS1000F控制臺及客戶端軟件的操作以分鐘級的速度快速恢復(fù)業(yè)務(wù)的應(yīng)用。
2)通過雙機雙柜方式來實現(xiàn)
通過雙機雙柜中的雙機容錯可以保證當某一服務(wù)器出現(xiàn)異常時,另一臺服務(wù)器可以接管系統(tǒng)業(yè)務(wù)繼續(xù)運行。其連接方式是雙機中每臺服務(wù)器需配備3塊光卡,其中一塊專門用來連接2臺服務(wù)器心跳線;2臺服務(wù)器通過串口相連作為備用心跳線,保證2臺服務(wù)器心跳信號的正常;2臺服務(wù)器同時通過2臺FC交換機分別連接共享存儲設(shè)備,共享存儲設(shè)備存放數(shù)據(jù)庫物理文件,從而保證數(shù)據(jù)的安全性和唯一性[5]。
4 結(jié)論
澄合礦業(yè)公司信息中心存儲災(zāi)備系統(tǒng)是在原有存儲備份系統(tǒng)基礎(chǔ)上的改造工程,不但保持了與原有設(shè)備良好的軟硬件銜接,而且更好地保證了數(shù)據(jù)的安全性與業(yè)務(wù)的連續(xù)性。項目的應(yīng)用具有普遍性,在其他相似環(huán)境的企事業(yè)單位都可廣泛推廣應(yīng)用。
參考文獻:
[1] 孫鵬程.監(jiān)測臺雙機雙柜數(shù)據(jù)安全容災(zāi)方案設(shè)計與實現(xiàn)[J].內(nèi)蒙古廣播與電視技術(shù).2014,31(2):42-45.
[2] SNIA. Storage Network Industry Association[EB/OL]. https://www.snia-dmf.org/cdp/index.shtml.
[3] 李春花,王欣興,周可.基于群組的連續(xù)數(shù)據(jù)保護服務(wù)關(guān)鍵技術(shù)研究.計算機研究與發(fā)展[J].2012,49 (Suppl.):201-205.
[4]劉偉. 基于CDP全面數(shù)據(jù)保護的災(zāi)備設(shè)計[J].長春工程學(xué)院學(xué)報:自然科學(xué)版.2011,12(3):122-126.
[5] 郭進偉,吳明發(fā).基于中小煤礦的雙機熱備數(shù)據(jù)同步系統(tǒng)[J].煤炭科學(xué)技術(shù).2009,37(7):97.