蔣破荒
本文針對電力信息化建設(shè)安全中最核心的災(zāi)備建設(shè)的要求,提出并深入研究基于存儲雙活技術(shù)的數(shù)據(jù)中心相關(guān)的實(shí)質(zhì)內(nèi)涵和優(yōu)勢。應(yīng)用hypermetro技術(shù)等設(shè)計構(gòu)建雙活容災(zāi)存儲技術(shù)的數(shù)據(jù)中心。使該方案的設(shè)計和實(shí)施能夠達(dá)到數(shù)據(jù)安全存儲和應(yīng)用容災(zāi)的效果,可以完全保證關(guān)鍵業(yè)務(wù)系統(tǒng)的完整性和可持續(xù)性。
【關(guān)鍵詞】存儲虛擬化 雙活數(shù)據(jù)中心 容災(zāi)模式
1 研究內(nèi)容及現(xiàn)狀
數(shù)據(jù)恢復(fù)點(diǎn)目標(biāo) RPO=0,恢復(fù)時間目標(biāo) RTO≤10s,業(yè)務(wù)負(fù)載分布于 2 個數(shù)據(jù)中心,當(dāng)出現(xiàn)信息災(zāi)難致其中一個存儲系統(tǒng)發(fā)生故障時,業(yè)務(wù)連續(xù)運(yùn)行沒有中斷,雙活節(jié)點(diǎn)可以對這些數(shù)據(jù)進(jìn)行讀寫,此虛擬數(shù)據(jù)同時與主備節(jié)點(diǎn)數(shù)據(jù)進(jìn)行同步,主備節(jié)點(diǎn)數(shù)據(jù)可同時被讀寫。
2 雙活關(guān)鍵技術(shù)
2.1 全局負(fù)載均衡技術(shù)
2.1.1 適用場景
(1)跨站點(diǎn)負(fù)載均衡:可以實(shí)現(xiàn)跨數(shù)據(jù)中心的流量分擔(dān),用戶就近訪問某一數(shù)據(jù)中心。
(2)客戶端訪問切換:當(dāng)生產(chǎn)中心故障,可以將用戶的訪問流量自動切換到容災(zāi)站點(diǎn),從而實(shí)現(xiàn)客戶端訪問路徑的自動切換。
2.1.2 組網(wǎng)架構(gòu)
GSLB對于DNS請求的處理流程如下(如圖1):
(1)客戶端向本地DNS發(fā)起站點(diǎn)查詢請求;
(2)當(dāng)本地DNS中沒有該站點(diǎn)對應(yīng)的IP地址信息時,則轉(zhuǎn)發(fā)該請求給GSLB Master;
(3)GSLB Master轉(zhuǎn)發(fā)該請求給所有GSLB Slave;
(4)所有GSLB Slave反饋響應(yīng)信息給GSLB Master;
(5)GSLB Master會選擇最快響應(yīng)的GSLB Slave(例如:Site A中的GSLB Slave),并返回應(yīng)答給本地DNS;
(6)本地DNS轉(zhuǎn)發(fā)GSLB Master的應(yīng)答給客戶端;
(7)客戶端就可以訪問提供服務(wù)的應(yīng)用服務(wù)器了,例如:Site A中的Real Server。
2.2 存儲雙活技術(shù)
2.2.1 技術(shù)概述
HyperMetro特性基于兩套存儲陣列實(shí)現(xiàn)AA(Active-Active)雙活,兩端陣列的雙活LUN數(shù)據(jù)實(shí)時同步,且雙端能夠同時處理應(yīng)用服務(wù)器的I/O讀寫請求,面向應(yīng)用服務(wù)器提供無差異的AA并行訪問能力。當(dāng)任何一臺磁盤陣列故障時,業(yè)務(wù)自動無縫切換到對端存儲訪問,業(yè)務(wù)訪問不中斷。
2.2.2 組網(wǎng)架構(gòu)
HyperMetro陣列間組網(wǎng)支持FC或IP網(wǎng)絡(luò),可以根據(jù)用戶的實(shí)際網(wǎng)絡(luò)條件配置網(wǎng)絡(luò)。支持使用陣列直連、通過FC光纖交換機(jī)連接、通過IP交換機(jī)連接等。為了提供更好的雙活性能,推薦采用FC組網(wǎng)。
以‘跨數(shù)據(jù)中心2節(jié)點(diǎn)+2節(jié)點(diǎn)雙活組網(wǎng)為例,建議每個控制器節(jié)點(diǎn)都與對端陣列建立2條陣列間鏡像鏈路,并對兩條鏈路的交換機(jī)進(jìn)行隔離,獲得最高的鏈路可靠性,如圖2所示。
2.2.3 技術(shù)特點(diǎn)
雙活LUN具備相同的WWN,主機(jī)層通過多路徑負(fù)載均衡將I/O下發(fā)至兩臺陣列上的LUN。支持與快照、遠(yuǎn)程復(fù)制兼容,輕松擴(kuò)展方案。
整個存儲系統(tǒng)架構(gòu)全冗余,任意數(shù)據(jù)中心故障時,另外一個數(shù)據(jù)中心有一份存儲設(shè)備和相同數(shù)據(jù)可用,最大化提高了業(yè)務(wù)連續(xù)性。
2.3 虛擬化雙活技術(shù)
2.3.1 技術(shù)概述
虛擬機(jī)HA是當(dāng)計算節(jié)點(diǎn)上的虛擬機(jī)出現(xiàn)故障時,系統(tǒng)自動將此虛擬機(jī)在其他正常的計算節(jié)點(diǎn)上恢復(fù),使該虛擬機(jī)能正常使用。虛擬機(jī)在HA的過程中不可以使用。
2.3.2 組網(wǎng)架構(gòu)
生產(chǎn)站點(diǎn)部分正在運(yùn)行的主機(jī)或虛擬機(jī)發(fā)生異常(如主機(jī)下電、主機(jī)重啟、虛擬機(jī)藍(lán)屏),虛擬機(jī)優(yōu)先通過DRS功能在本地冗余主機(jī)上HA。若本地冗余主機(jī)資源不足,則虛擬機(jī)通過集群內(nèi)HA功能在容災(zāi)站點(diǎn)主機(jī)上HA。 發(fā)生容災(zāi)時,虛擬機(jī)短時間內(nèi)不可用(依賴于虛擬機(jī)HA時間),數(shù)據(jù)無丟失。容災(zāi)后,生產(chǎn)站點(diǎn)虛擬機(jī)仍然訪問本地存儲資源,容災(zāi)站點(diǎn)容災(zāi)虛擬機(jī)將跨站點(diǎn)訪問生產(chǎn)站點(diǎn)的存儲資源。
2.3.3 技術(shù)特點(diǎn)
當(dāng)計算節(jié)點(diǎn)上的虛擬機(jī)出現(xiàn)故障時,系統(tǒng)自動將此虛擬機(jī)在其他正常的計算節(jié)點(diǎn)上恢復(fù),使該虛擬機(jī)能正常使用。虛擬機(jī)在HA的過程中不可以使用。
2.4 Oracle RAC技術(shù)
2.4.1 技術(shù)概述
基于Oracle Extended RAC,構(gòu)建雙活數(shù)據(jù)中心來并行承擔(dān)相同業(yè)務(wù),提高數(shù)據(jù)中心的整體服務(wù)能力和系統(tǒng)資源利用率成為可能。在這種場景下,兩個數(shù)據(jù)中心互為備份,當(dāng)單數(shù)據(jù)中心故障時,業(yè)務(wù)可以能自動切換到另一數(shù)據(jù)中心,業(yè)務(wù)不中斷。
2.4.2 適用場景
基于Oracle Extended RAC分布式集群技術(shù)的雙活數(shù)據(jù)中心,其適用場景如下:
(1)大量的讀操作,大量的客戶連接,需要較高的系統(tǒng)性能支撐;
(2)數(shù)據(jù)庫響應(yīng)能力受到硬件的束縛,試圖通過Scale-Out來進(jìn)行性能提升;
(3)需要防止單點(diǎn)故障,以保證業(yè)務(wù)連續(xù)性。
2.4.3 技術(shù)特點(diǎn)
基于Oracle Extended RAC的華為雙活數(shù)據(jù)中心架構(gòu),在雙中心距離小于100km的情況下,其事務(wù)處理能力基本無影響,且雙活的特性可以支撐單數(shù)據(jù)中心故障時,業(yè)務(wù)無縫自動切換,數(shù)據(jù)零丟失。
參考文獻(xiàn)
[1]吳禮樂.基于雙活容災(zāi)存儲技術(shù)的云計算數(shù)據(jù)中心的設(shè)計及應(yīng)用[J].電子設(shè)計工程,2015,02(03).
[2]魯茜,徐迅.異地雙活容災(zāi)技術(shù)在數(shù)字化醫(yī)院信息安全中的應(yīng)用[J].企業(yè)科技與發(fā)展,2015,09(28).
[3]汪兆來.基于存儲虛擬化技術(shù)的雙活數(shù)據(jù)中心醫(yī)院信息系統(tǒng)容災(zāi)平臺研究與設(shè)計[J].中國醫(yī)學(xué)裝備,2015,12(09).
作者單位
國網(wǎng)湖南省電力公司信息通信公司 湖南省長沙市 410004