摘要:信息系統(tǒng)中斷、溝通不暢、數(shù)據(jù)丟失等問題,時時困擾著跨地區(qū)經(jīng)營企業(yè),使其面臨人財損耗、商機(jī)遺失、信譽(yù)下降的風(fēng)險。如何保證信息系統(tǒng)不間斷地安全、高效、穩(wěn)定運(yùn)行,保證總部和分支機(jī)構(gòu)之間數(shù)據(jù)暢通、訪問及時,是跨地區(qū)經(jīng)營企業(yè)急需解決的IT問題。本文認(rèn)為將雙機(jī)備份和異地數(shù)據(jù)復(fù)制兩項技術(shù)結(jié)合起來使用,可以有效提高信息系統(tǒng)的可靠性和可用性,是跨地區(qū)經(jīng)營企業(yè)比較適合的IT解決方案。
關(guān)鍵詞:數(shù)據(jù)安全;雙機(jī)備份;數(shù)據(jù)復(fù)制
中圖分類號:TP393.08 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9599 (2012) 15-0000-02
1 引言
企業(yè)贏得競爭的關(guān)鍵,不僅是要拿得出有競爭力的產(chǎn)品,而且要對市場需求做出快速反映,對企業(yè)內(nèi)外信息進(jìn)行有效管理,信息化是有效的管理手段。如何有效地保存和管理信息,預(yù)防各種突如其來的人為破壞或者自然災(zāi)害,保證信息系統(tǒng)不間斷的安全、高效、穩(wěn)定運(yùn)行,是各單位信息化管理的首要問題。同時,現(xiàn)代企業(yè)業(yè)務(wù)覆蓋面廣,通常需要在多個國家或地區(qū)設(shè)置分公司,以便更好的為當(dāng)?shù)乜蛻籼峁┓?wù)。而保持各地數(shù)據(jù)暢通、訪問及時也是現(xiàn)代企業(yè)運(yùn)營管理的重要任務(wù)之一。影響系統(tǒng)安全、高效運(yùn)行的因素是多方面的,因此需要采用不同的技術(shù)手段來解決,雙機(jī)備份和數(shù)據(jù)復(fù)制兩種技術(shù)相結(jié)合的解決方案是跨地區(qū)經(jīng)營企業(yè)的理想選擇。
雙機(jī)備份和數(shù)據(jù)復(fù)制技術(shù)相結(jié)合的解決方案,就是總部采用雙機(jī)備份系統(tǒng),避免出現(xiàn)單點故障,造成服務(wù)中斷,提高應(yīng)用系統(tǒng)的高可用性;分公司采用遠(yuǎn)程數(shù)據(jù)復(fù)制技術(shù),將總部數(shù)據(jù)實時復(fù)制到分公司備份服務(wù)器上,提高分公司本地用戶訪問系統(tǒng)的速度,充分利用備份系統(tǒng)的性能提升業(yè)務(wù)系統(tǒng)整體處理能力,享受系統(tǒng)帶來的高可靠性和高可用性。
2 雙機(jī)備份解決方案
雙機(jī)備份就是對于重要的服務(wù),使用兩臺服務(wù)器,互相備份,共同執(zhí)行同一服務(wù)。當(dāng)一臺服務(wù)器出現(xiàn)故障時,可以由另一臺服務(wù)器承擔(dān)服務(wù)任務(wù),從而在不需要人工干預(yù)的情況下,自動保證系統(tǒng)能持續(xù)提供服務(wù)。從狹義上講,雙機(jī)備份特指基于active/standby方式的服務(wù)器熱備。服務(wù)器數(shù)據(jù)包括數(shù)據(jù)庫數(shù)據(jù)同時往兩臺或多臺服務(wù)器寫入,或者使用一個共享的存儲設(shè)備。在同一時間內(nèi)只有一臺服務(wù)器運(yùn)行。當(dāng)其中運(yùn)行著的一臺服務(wù)器出現(xiàn)故障無法啟動時,另一臺備份服務(wù)器會通過雙機(jī)軟件的心跳診斷將standby機(jī)器激活,保證應(yīng)用在短時間內(nèi)完全恢復(fù)正常使用。
雙機(jī)備份由備用服務(wù)器解決了在主服務(wù)器故障時服務(wù)不中斷的問題。實現(xiàn)雙機(jī)備份可采用基于共享的存儲設(shè)備應(yīng)用方式,也可以通過專業(yè)的雙機(jī)備份軟件來實現(xiàn)。兩種方式都被大量應(yīng)用,各有優(yōu)劣。
3 數(shù)據(jù)復(fù)制解決方案
數(shù)據(jù)復(fù)制是在數(shù)據(jù)庫之間對數(shù)據(jù)和數(shù)據(jù)庫對象進(jìn)行復(fù)制和分發(fā)并進(jìn)行同步,以確保其一致性的一組功能強(qiáng)大的技術(shù),是一種實現(xiàn)數(shù)據(jù)發(fā)布的方法,它是把一個數(shù)據(jù)庫服務(wù)器上的數(shù)據(jù)通過網(wǎng)絡(luò)傳輸?shù)揭粋€或多個地理位置不同的數(shù)據(jù)庫服務(wù)器的過程。數(shù)據(jù)復(fù)制技術(shù)可以保持源數(shù)據(jù)庫與目標(biāo)數(shù)據(jù)庫中指定數(shù)據(jù)的一致性,可以適應(yīng)可伸縮組織的需要,減輕主服務(wù)器的工作負(fù)荷和提高數(shù)據(jù)的使用效率。按照數(shù)據(jù)復(fù)制的實時性,數(shù)據(jù)復(fù)制可分為同步數(shù)據(jù)復(fù)制和異步數(shù)據(jù)復(fù)制。在分布式環(huán)境中,由于數(shù)據(jù)復(fù)制和傳輸?shù)氖褂帽容^頻繁,幾乎所有的大型數(shù)據(jù)庫系統(tǒng)都提供了自己的數(shù)據(jù)復(fù)制解決方案和數(shù)據(jù)復(fù)制組件。
4 方案實施
公司總部設(shè)在北京,國內(nèi)在青島、洛陽等地設(shè)有分公司,同時業(yè)務(wù)遍布海外,在中東、南美、中亞等地區(qū)設(shè)有分公司。公司辦公系統(tǒng)是大家及時了解公司信息的窗口,辦公系統(tǒng)還集成了一些小型應(yīng)用系統(tǒng),方便大家處理日常業(yè)務(wù)。
公司用戶通常會登錄總部服務(wù)器來訪問辦公系統(tǒng),如果由于某種原因造成系統(tǒng)中斷,無法提供服務(wù),必將大大影響用戶處理相關(guān)業(yè)務(wù)。為此我們對總部服務(wù)器建立了雙機(jī)備份系統(tǒng),確保主服務(wù)器出現(xiàn)故障時自動切換到備份系統(tǒng)。同時由于訪問用戶人數(shù)眾多,數(shù)據(jù)訪問負(fù)荷較大,CPU占用率較高,網(wǎng)絡(luò)負(fù)載較重等原因,有些分公司用戶反映訪問總部服務(wù)器響應(yīng)速度很慢。我們在青島、洛陽部署了分公司鏡像服務(wù)器,本地和周邊用戶通過登錄本地服務(wù)器可以快速訪問系統(tǒng)。具體實施情況如下:
(1)總部部署兩臺服務(wù)器,均為HP Proliant ML370系列服務(wù)器,每臺服務(wù)器都配置了RAID5,每臺服務(wù)器均安裝兩塊千兆網(wǎng)卡,一塊用于兩臺服務(wù)器之間傳輸數(shù)據(jù),一塊用于對外提供服務(wù)。
(2)總部雙機(jī)備份采用Active/Standby主從工作方式。主備機(jī)安裝相同的應(yīng)用程序,主機(jī)處于活動狀態(tài),備機(jī)禁用相關(guān)服務(wù),處于待機(jī)狀態(tài)。當(dāng)主機(jī)出現(xiàn)故障時,備機(jī)通過心跳偵測激活,短時間內(nèi)完成切換,提供正常服務(wù)。
(3)總部雙機(jī)備份采用純軟件方式,使用Rose Replicator軟件。Rose Replicator支持選擇性復(fù)制,在主備系統(tǒng)上分別安裝驅(qū)動和服務(wù)兩個模塊,主系統(tǒng)上的驅(qū)動程序模塊實時監(jiān)控每個I/O操作,一旦發(fā)現(xiàn)該數(shù)據(jù)I/O是受保護(hù)的文件或目錄,則立即復(fù)制這個I/O,然后通過服務(wù)模塊,利用以太網(wǎng)傳輸這個I/O到備份系統(tǒng),在相應(yīng)的文件或目錄形成I/O副本,達(dá)到數(shù)據(jù)復(fù)制的效果。它采用Rose先進(jìn)的故障檢測機(jī)制,實時監(jiān)控主系統(tǒng)的運(yùn)行狀態(tài),若主系統(tǒng)出現(xiàn)故障,立即在備份系統(tǒng)上啟動服務(wù),在最短地時間范圍內(nèi)恢復(fù)業(yè)務(wù)系統(tǒng),提高客戶滿意度。
(4)建立總部-分公司兩級數(shù)據(jù)中心的架構(gòu),總部數(shù)據(jù)中心與分公司數(shù)據(jù)中心之間通過TCP/IP協(xié)議連接,利用Rose Replicator軟件將總部數(shù)據(jù)中心的文件數(shù)據(jù)和應(yīng)用數(shù)據(jù)實時傳送到分公司數(shù)據(jù)中心。但該軟件為了保證數(shù)據(jù)庫數(shù)據(jù)的一致性,需要將備份服務(wù)器上的數(shù)據(jù)訪問服務(wù)設(shè)置成禁用,使備份服務(wù)器上數(shù)據(jù)庫中的數(shù)據(jù)不可見,無法進(jìn)行任何數(shù)據(jù)庫操作,最簡單的查詢也不行。但對于分公司而言,必須確保數(shù)據(jù)訪問服務(wù)可用,即主備數(shù)據(jù)庫必須處于雙活狀態(tài),才能使當(dāng)?shù)赜脩艨梢哉5脑L問應(yīng)用系統(tǒng)。因此需要采用數(shù)據(jù)復(fù)制方案。
(5)每個分公司使用一臺IBM System x3650系列服務(wù)器??偛亢头止痉?wù)器之間通過Rose Replicator軟件實現(xiàn)文件同步,總部系統(tǒng)發(fā)生任何改變都可以及時傳送到分公司服務(wù)器上。
(6)總部和分公司服務(wù)器之間的數(shù)據(jù)庫采用Sql Server的發(fā)布訂閱機(jī)制實現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制。為了節(jié)省資源,我們將分發(fā)數(shù)據(jù)庫和發(fā)布數(shù)據(jù)庫配置在總部服務(wù)器的一個實例上面,為兩個分公司創(chuàng)建了訂閱,使總部數(shù)據(jù)庫中的數(shù)據(jù)實時復(fù)制到兩個分公司的服務(wù)器上。
5 方案評估
該解決方案應(yīng)用一年以來,系統(tǒng)運(yùn)行平穩(wěn),大大降低了系統(tǒng)維護(hù)的成本。方案主要優(yōu)點分析如下:
(1)在總部主服務(wù)器出現(xiàn)某些節(jié)點故障的情況下,仍能通過本地備份服務(wù)器繼續(xù)對外提供服務(wù),最大限度地減少服務(wù)中斷時間。
(2)Rose Replicator軟件支持多對一和互為備份的模式,擴(kuò)充節(jié)點簡單靈活,為系統(tǒng)后續(xù)擴(kuò)展應(yīng)用提供了方便。系統(tǒng)中任何一臺核心服務(wù)器出現(xiàn)故障時,其對應(yīng)的備份服務(wù)器都可以暫時接管該服務(wù)的工作,使業(yè)務(wù)不停頓運(yùn)行。
(3)分公司人員通過訪問分公司本地的備份系統(tǒng),訪問速度得以大大提高,并減輕了總部服務(wù)器的數(shù)據(jù)訪問負(fù)載。
(4)分公司備份系統(tǒng)也可以充當(dāng)總部系統(tǒng)的異地容災(zāi)備份,利用地理上的分離進(jìn)一步保證了系統(tǒng)對災(zāi)難性事件的防御能力。
整體來說,采用雙機(jī)備份和異地數(shù)據(jù)復(fù)制兩種技術(shù),一方面保證了數(shù)據(jù)的高可用性,另一方面也提高了系統(tǒng)的訪問性能,實現(xiàn)了應(yīng)用系統(tǒng)可靠性、可用性、適用性(reliability、availability、serviceability,即RAS)的整體提升。
參考文獻(xiàn):
[1]馮海軍.雙機(jī)熱備技術(shù)的應(yīng)用,2008,7
[2]顏琳.人民銀行雙機(jī)熱備技術(shù)的設(shè)計與實現(xiàn),2008,10
[3]李文帥,張忠林.基于SQL2005鏡像下的雙機(jī)熱備份,2009,1