依 據(jù)《福建省設(shè)區(qū)市容災(zāi)備份公共平臺建設(shè)技術(shù)指南》等文件精神及總體建設(shè)思路,在基層醫(yī)療機構(gòu)信息系統(tǒng)容災(zāi)方面基于CDP數(shù)據(jù)連續(xù)保護技術(shù)的容災(zāi)方案的在省內(nèi)還比較少見,由于資金及場地的限制,采用基于CDP數(shù)據(jù)連續(xù)保護技術(shù)的容災(zāi)方案能更好適應(yīng)當(dāng)?shù)貙嶋H情況需求。
福建某市基層衛(wèi)生信息系統(tǒng)主要設(shè)備見表1,基層衛(wèi)生信息系統(tǒng)網(wǎng)絡(luò)拓?fù)鋱D如圖1所示。目前存在的隱患有以下幾點:
圖1 福建某市基層衛(wèi)生信息系統(tǒng)網(wǎng)絡(luò)拓?fù)鋱D
表1 信息系統(tǒng)主要設(shè)備
(1)6臺服務(wù)器主要負(fù)責(zé)為全市106個鄉(xiāng)鎮(zhèn)衛(wèi)生院、19個社區(qū)衛(wèi)生服務(wù)中心,10個婦幼保健機構(gòu)、20個具有產(chǎn)科的縣級以上醫(yī)院、1891個村衛(wèi)生所提供基層衛(wèi)生信息系統(tǒng)的WEB訪問服務(wù)。雖然WEB應(yīng)用服務(wù)器的數(shù)量有6臺,但是每臺服務(wù)器都是獨立對外提供WEB訪問服務(wù),一旦其中的某臺服務(wù)器出現(xiàn)硬件或軟件故障,都將造成系統(tǒng)服務(wù)中斷。
(2)雖然有兩臺數(shù)據(jù)庫服務(wù)器,雙機集群,但如果機房出現(xiàn)自然災(zāi)難,或者這兩臺服務(wù)器同時出現(xiàn)硬件故障,系統(tǒng)服務(wù)也將中斷。
(3)雖然有兩套生產(chǎn)存儲,數(shù)據(jù)復(fù)制備份,但如果機房出現(xiàn)自然災(zāi)難,或這兩套生產(chǎn)存儲同時出現(xiàn)硬件故障,系統(tǒng)服務(wù)也將中斷。
(4)雖然有一套存儲虛擬化設(shè)備,用于實現(xiàn)主存儲與備存儲之間的數(shù)據(jù)復(fù)制,當(dāng)設(shè)備出現(xiàn)硬件故障,將造成整個系統(tǒng)服務(wù)的中斷。
(5)Oracle數(shù) 據(jù)庫雖然做了RAC保護,但沒有辦法防止各種邏輯災(zāi)難,一旦災(zāi)難發(fā)生,恢復(fù)數(shù)據(jù)可能性小。
(6)對外通訊的物理鏈路只一條,一旦該鏈路出現(xiàn)故障,或機房有斷電、火災(zāi)等事故,將造成整個系統(tǒng)服務(wù)的中斷。
通過此次項目建設(shè),可以實現(xiàn)以下目標(biāo):防止各種邏輯災(zāi)難(如人為誤刪除等);容災(zāi)系統(tǒng)要對所有應(yīng)用系統(tǒng)進(jìn)行保護,以保證當(dāng)應(yīng)用系統(tǒng)出現(xiàn)物理或邏輯故障的情況下業(yè)務(wù)不中斷;還要對生產(chǎn)存儲進(jìn)行保護,以保證當(dāng)生產(chǎn)存儲損壞的情況下業(yè)務(wù)系統(tǒng)仍然正常工作;考慮應(yīng)對站點級別的損壞或癱瘓時的數(shù)據(jù)丟失量(RPO)和業(yè)務(wù)恢復(fù)時間(RTO)指標(biāo),實現(xiàn)本地RTO≤15分鐘,RPO≈0;異地RTO≤15分 鐘,RPO≤1分鐘。
為了防范實施風(fēng)險,容災(zāi)系統(tǒng)不對原有系統(tǒng)做任何改動,包括結(jié)構(gòu)和底層卷管理等;兼容所有第三方主流存儲以及前端應(yīng)用主機的操作系統(tǒng)。解決數(shù)據(jù)庫文件或應(yīng)用程序文件丟失或損壞、硬盤物理損壞、操作系統(tǒng)的恢復(fù)等眾多IT系統(tǒng)的棘手問題。
基層衛(wèi)生容災(zāi)備份系統(tǒng)解決方案拓?fù)鋱D,如圖2所示。
圖2 福建某市基層衛(wèi)生容災(zāi)備份系統(tǒng)解決方案拓?fù)鋱D
圖3 快速業(yè)務(wù)應(yīng)用系統(tǒng)重建示意圖
圖4 機房發(fā)生災(zāi)難時的業(yè)務(wù)恢復(fù)示意圖
應(yīng)用此方案實現(xiàn)靈活和方便的實時備份機制且管理簡單,本地數(shù)據(jù)災(zāi)備與同城容災(zāi)相結(jié)合。并且實現(xiàn)應(yīng)用級、數(shù)據(jù)級容災(zāi),輕松還原任何歷史數(shù)據(jù)。
當(dāng)應(yīng)用系統(tǒng)出現(xiàn)故障時,容災(zāi)系統(tǒng)能快速重建應(yīng)用業(yè)務(wù)系統(tǒng),如圖3所示。機房發(fā)生災(zāi)難時的業(yè)務(wù)恢復(fù),如圖4所示。
飛康公司CDP (Continue Date Protection)實時備份方案,多時間點自動連續(xù)快照技術(shù), 實現(xiàn)I/O級別的備份粒度和分鐘級恢復(fù)數(shù)據(jù), 而且極少占用主機和網(wǎng)絡(luò)資源。結(jié)構(gòu)化的數(shù)據(jù)庫數(shù)據(jù)與一般的非結(jié)構(gòu)化數(shù)據(jù)文檔相比有極大的差異,是不能簡單的用基于存儲、數(shù)據(jù)塊鏡像復(fù)制或者簡單的快照技術(shù)進(jìn)行復(fù)制備份。
數(shù)據(jù)庫數(shù)據(jù)的備份,必須在物理數(shù)據(jù)被復(fù)制的同時,保證其邏輯的完整性。只有真正的持續(xù)數(shù)據(jù)保護(CDP)技術(shù)和有任意時間點回退機制保證,才能保障數(shù)據(jù)庫備份的完整可用性。
使用雙鏈路,租用兩條50M政務(wù)外網(wǎng)專線鏈路,從而保證足夠帶寬,避免單點故障,配置VPN通道,能有效的保障數(shù)據(jù)傳輸?shù)陌踩?容災(zāi)備份鏈路安全拓?fù)鋱D如圖5所示。
圖5 容災(zāi)備份鏈路安全拓?fù)鋱D
本地機房部署1臺應(yīng)急接管服務(wù)器(安裝VMware ESXi操作系統(tǒng),并在ESXi系統(tǒng)平臺下布署虛擬機(WEB應(yīng)用服務(wù)器及數(shù)據(jù)庫服務(wù)器),應(yīng)急接管服務(wù)器通過以太網(wǎng)接入到政務(wù)外網(wǎng),通過光纖接入到FC SAN存儲網(wǎng)絡(luò),用于系統(tǒng)應(yīng)急、接管、演練、測試、開發(fā)等功能)和1臺容災(zāi)管理設(shè)備(可提供3種數(shù)據(jù)保護和恢復(fù)模式:
磁盤鏡像保護、1000個CDP快照及journal實時IO錄像恢復(fù)技術(shù)),為生產(chǎn)系統(tǒng)提供數(shù)據(jù)的連續(xù)保護。當(dāng)生產(chǎn)系統(tǒng)發(fā)生故障時,可通過應(yīng)急接管服務(wù)器接管業(yè)務(wù),保證業(yè)務(wù)系統(tǒng)的正常運行。
在同城異地機房(容災(zāi)中心機房)亦部署1臺應(yīng)急接管服務(wù)器和1臺容災(zāi)管理設(shè)備,當(dāng)生產(chǎn)中心機房徹底癱瘓的情況下可以啟用容災(zāi)中心機房來接管業(yè)務(wù)。
在生產(chǎn)中心機房和容災(zāi)中心機房內(nèi)各布署一臺下一代防火墻(NGFW),以 保護兩端網(wǎng)絡(luò)的安全,免受外部網(wǎng)絡(luò)的攻擊。
福建某市基層衛(wèi)生信息容災(zāi)備份系統(tǒng)的成功應(yīng)用,滿足基層醫(yī)療機構(gòu)信息系統(tǒng)以及設(shè)區(qū)市其他電子政務(wù)業(yè)務(wù)系統(tǒng)的容災(zāi)備份需要,保障數(shù)據(jù)安全。
容災(zāi)系統(tǒng)能提供完整的、可供災(zāi)備恢復(fù)的數(shù)據(jù)備份,既能通過數(shù)據(jù)備份、數(shù)據(jù)復(fù)制等技術(shù)實現(xiàn)數(shù)據(jù)級容災(zāi),又能對部分重要應(yīng)用系統(tǒng)實現(xiàn)快速切換、數(shù)據(jù)零丟失的應(yīng)用級容災(zāi),提供核心業(yè)務(wù)系統(tǒng)的快速接管能力。
同時,還可利用容災(zāi)系統(tǒng)對數(shù)據(jù)進(jìn)行歸檔、恢復(fù)測試、演練培訓(xùn)、系統(tǒng)遷移等應(yīng)用操作。由于經(jīng)費、場地等條件限制,未能考慮虛擬存儲做到雙活及雙中心建設(shè)。
應(yīng)謹(jǐn)記:“容災(zāi)備份,必要且重要,不僅重要,而且緊急”。通過本次建設(shè)方案的應(yīng)用與實踐,達(dá)到并滿足該市基層衛(wèi)生信息容災(zāi)備份需求設(shè)計的總體要求。