閻迅
【摘要】? ? 當(dāng)今信息高速發(fā)展,隨著各行業(yè)及個人用戶需求不斷增加,信息、數(shù)據(jù)與IT系統(tǒng)儲存的重要性日益體現(xiàn),對災(zāi)備需求也日益增多,“兩地三中心”的概念亦日漸被市場接受,將有變?yōu)橛残孕枨蟮内厔荩鄶?shù)據(jù)中心部署亦作為災(zāi)備的基礎(chǔ)條件。傳統(tǒng)災(zāi)備系統(tǒng)存在著各式各樣的問題:界面的差異,以及存儲服務(wù)器品牌型號不一,導(dǎo)致數(shù)據(jù)的備份遷移基本都需要業(yè)務(wù)中斷進(jìn)行,造成用戶的經(jīng)濟或運營損失。 在現(xiàn)今用戶不同品牌型號設(shè)備之間傳輸和共享日漸劇增的需求前提下,災(zāi)備云解決方案就能完全解決以上問題。
【關(guān)鍵詞】? ? 災(zāi)備云? ? 雙活
一、簡介
1.1災(zāi)備評價指標(biāo)
災(zāi)備云的標(biāo)準(zhǔn)指標(biāo)是數(shù)據(jù)的損失量與數(shù)據(jù)恢復(fù)時間,一般我們會通過數(shù)據(jù)的損失量與系統(tǒng)的恢復(fù)時間評估云平臺災(zāi)備系統(tǒng):恢復(fù)點目標(biāo)和恢復(fù)時間目標(biāo)。
1.1.1恢復(fù)點目標(biāo):
1.以時間為基準(zhǔn)單位,在數(shù)據(jù)系統(tǒng)崩潰時,系統(tǒng)和數(shù)據(jù)需要在此時間點前完成轉(zhuǎn)換或恢復(fù)的指標(biāo)要求。
2.數(shù)據(jù)系統(tǒng)發(fā)生意外停機崩潰時,可承受的數(shù)據(jù)損失量最大值。
1.1.2恢復(fù)時間目標(biāo):
1.以時間為基準(zhǔn)單位,在數(shù)據(jù)系統(tǒng)崩潰時,信息系統(tǒng)或業(yè)務(wù)功能需要在此時間點前完成轉(zhuǎn)換或恢復(fù)的指標(biāo)要求。
2.數(shù)據(jù)系統(tǒng)發(fā)生崩潰時,可承受的工作時間停止的最大值。
1.2災(zāi)難恢復(fù)能力等級
國際通用網(wǎng)絡(luò)災(zāi)難判定標(biāo)準(zhǔn)為SHARE 78,該標(biāo)準(zhǔn)主要還是以恢復(fù)點目標(biāo)和恢復(fù)時間目標(biāo)為指標(biāo)進(jìn)行判定,我國在國際通用標(biāo)準(zhǔn)SHARE78基礎(chǔ)上制定并規(guī)范了符合我國網(wǎng)絡(luò)數(shù)據(jù)災(zāi)備狀況的災(zāi)備恢復(fù)能力等級的關(guān)系,主要等級如下:
1.3災(zāi)備的分類
通過災(zāi)備距離進(jìn)行分類,可劃分為災(zāi)備系統(tǒng)部署在同一物理地址的本地災(zāi)備,災(zāi)備系統(tǒng)部署在同一城市的近距離災(zāi)備以及災(zāi)備系統(tǒng)部署在不同城市的遠(yuǎn)距離災(zāi)備。
通過災(zāi)備的層次進(jìn)行分類,可分成只對數(shù)據(jù)進(jìn)行災(zāi)備操作的數(shù)據(jù)災(zāi)備和對應(yīng)用與數(shù)據(jù)進(jìn)行災(zāi)備操作的應(yīng)用災(zāi)備。
1.4主流數(shù)據(jù)災(zāi)備技術(shù)
1.4.1數(shù)據(jù)備份
數(shù)據(jù)備份是災(zāi)備系統(tǒng)的根本,是基礎(chǔ)災(zāi)備系統(tǒng)的實現(xiàn)前提條件。當(dāng)前的數(shù)據(jù)備份技術(shù)主要有快照、離線、異地存儲等三種。
1.4.2實時備份
實時備份是指在多塊存儲磁盤、多個存儲陣列、多臺存儲服務(wù)器以至到多個數(shù)據(jù)中心進(jìn)行實時的數(shù)據(jù)或應(yīng)用保存,實現(xiàn)多個備份的高端備份模式。
1.數(shù)據(jù)鏡像。數(shù)據(jù)鏡像是冗余備份的一種,具體原理是備份于A磁盤數(shù)據(jù)或應(yīng)用同樣在B磁盤存在一致的副本,這個副本就稱之為鏡像,數(shù)據(jù)鏡像可按照備份手段分為軟件鏡像和硬件鏡像。
2.數(shù)據(jù)復(fù)制。數(shù)據(jù)復(fù)制工作原理是將原數(shù)據(jù)及其改動部分,以后續(xù)機制為手段拷貝到其他存儲點上,存儲點可以表現(xiàn)為磁盤、陣列、服務(wù)器、數(shù)據(jù)中心等等,并且通過實現(xiàn)的機制可劃分為同步復(fù)制與異步復(fù)制。
二、災(zāi)備云的必要性
現(xiàn)今高速發(fā)展的網(wǎng)絡(luò)數(shù)據(jù)時代,存儲數(shù)據(jù)并不單純?yōu)榫W(wǎng)絡(luò)的通信手段了,更發(fā)展成為各行各業(yè)、以至個人的重要資產(chǎn)組成。因此繼續(xù)沿用傳統(tǒng)災(zāi)備方案,無疑將存在資源利用率低、可用性差、災(zāi)備停機時間長、數(shù)據(jù)恢復(fù)慢等問題。
而雙活模式的兩地三中心數(shù)據(jù)中心云災(zāi)備系統(tǒng)將改進(jìn)以上傳統(tǒng)災(zāi)備系統(tǒng)的缺點,并且是往后發(fā)展的趨勢,而雙活存儲災(zāi)備更是數(shù)據(jù)中心災(zāi)備系統(tǒng)今后發(fā)展的必要基礎(chǔ)部分。
三、災(zāi)備云系統(tǒng)建設(shè)的技術(shù)原則
高性能:將災(zāi)備系統(tǒng)的處理性能提升到最大,保障災(zāi)備系統(tǒng)整體在五年內(nèi)的先進(jìn)水平與高可適用性,使災(zāi)備系統(tǒng)具備擴展能力,可適應(yīng)將來災(zāi)備核心技術(shù)的發(fā)展。
高可靠性:建立災(zāi)備系統(tǒng)的目的是增強關(guān)鍵性業(yè)務(wù)應(yīng)用與數(shù)據(jù)的抗災(zāi)難能力,因此在災(zāi)備系統(tǒng)方案制定階段需以系統(tǒng)本身穩(wěn)定性與可靠性為出發(fā),實現(xiàn)保障關(guān)鍵應(yīng)用與數(shù)據(jù)的穩(wěn)定性。
可擴展性:災(zāi)備系統(tǒng)的方案構(gòu)建除應(yīng)符合當(dāng)前應(yīng)用與數(shù)據(jù)的需求外,還需考慮到未來業(yè)務(wù)的發(fā)展對應(yīng)用與數(shù)據(jù)的需求,并且能接受新技術(shù)和新概念的擴展,實現(xiàn)當(dāng)前系統(tǒng)的穩(wěn)定保值。
可維護性:對災(zāi)備系統(tǒng)的方案構(gòu)建,應(yīng)具備方便管理,易于維護,易于擴展,智能自動操作,主動告知故障等特性。
四、災(zāi)備云實現(xiàn)的方式
4.1云到云間災(zāi)備
一般為了滿足建設(shè)災(zāi)備云平臺的需求,我們會為災(zāi)備云平臺構(gòu)建兩地三中心方案。兩地物理服務(wù)機做集群,共享存儲LUN使用。在本地機房利用原存儲結(jié)合SMA(存儲容錯引擎)和核心存儲系統(tǒng)搭建本地HA,當(dāng)本地某套存儲出現(xiàn)意外,另一套存儲可以及時接管原有存儲運行中的業(yè)務(wù),并可以保障無間斷的數(shù)據(jù)訪問,實現(xiàn)本地系統(tǒng)業(yè)務(wù)工作不間斷,確保用戶在用業(yè)務(wù)高效運營。同時異地機房利用存儲容錯引擎SMA和異地機房原有存儲搭建異地數(shù)據(jù)災(zāi)備,當(dāng)本地機房發(fā)生災(zāi)難,異地機房系統(tǒng)可以及時自動無縫接管業(yè)務(wù)并進(jìn)行數(shù)據(jù)生產(chǎn)。通過這種兩地三中心的項目規(guī)劃,使得云平臺的虛擬機可以在3個站點之間實現(xiàn)不停機的虛擬機遷移,當(dāng)某節(jié)點出現(xiàn)宕機情況,用戶在用業(yè)務(wù)系統(tǒng)可轉(zhuǎn)換至備用生產(chǎn)節(jié)點上恢復(fù)正常業(yè)務(wù),形成業(yè)務(wù)主備間零切換狀態(tài)。
4.1.1數(shù)據(jù)雙活設(shè)計
4.1.1.1通過SMA進(jìn)行數(shù)據(jù)讀寫
異地數(shù)據(jù)中心,原有存儲對SMA分配一個LUN,SMA隨即應(yīng)導(dǎo)出V-LUN,再且由兩個節(jié)點各自的SMA生成分布式虛擬LUN,并實現(xiàn)分布式Mirror防護。
兩地數(shù)據(jù)中心的災(zāi)備云系統(tǒng)都能訪問到生成后的分布式虛擬LUN,由于災(zāi)備云架構(gòu)方案實現(xiàn)的是雙活災(zāi)備云高可用方案,因此在導(dǎo)入數(shù)據(jù)同時,必須確認(rèn)數(shù)據(jù)可同時導(dǎo)入到兩地的數(shù)據(jù)中心中,通過此方式,可保障數(shù)據(jù)的一致性。
4.1.1.2數(shù)據(jù)可持續(xù)
1.主機故障切換。災(zāi)備云方案將單個云平臺的集群中的兩套業(yè)務(wù)主機分別安置在本地和異地數(shù)據(jù)中心中,使得兩套業(yè)務(wù)主機構(gòu)成跨數(shù)據(jù)中心的集群系統(tǒng)。此方案設(shè)置將確保在正常情況下,一個節(jié)點的業(yè)務(wù)正常運作,而另外一個節(jié)點備用;而當(dāng)業(yè)務(wù)正常運作節(jié)點的業(yè)務(wù)主機發(fā)生意外導(dǎo)致停機,業(yè)務(wù)會即時無縫切換到備用節(jié)點的業(yè)務(wù)主機實現(xiàn)雙活接管。
2.存儲故障切換。業(yè)務(wù)主機停機切換由HA集群實現(xiàn),而業(yè)務(wù)存儲系統(tǒng)停機的切換則由SMA實現(xiàn)。雙HA數(shù)據(jù)中心的構(gòu)建,通過SMA能為用戶實現(xiàn)零恢復(fù)點目標(biāo)的高效解決方案。而SMA系統(tǒng)自身是全冗余設(shè)計,包括電源風(fēng)扇,管理端口等,可用性接近100%。
3.本地數(shù)據(jù)中心恢復(fù)。本地數(shù)據(jù)中心完成修復(fù)后,需要重新將本地數(shù)據(jù)中心與異地數(shù)據(jù)中心的SMA關(guān)聯(lián)起來。通過配置SMA,本地數(shù)據(jù)中心和異地數(shù)據(jù)中心的數(shù)據(jù)在后臺進(jìn)行復(fù)制,直到兩邊數(shù)據(jù)一致。在這個過程中。在此過程中,不會影響到本地數(shù)據(jù)應(yīng)用。
4.1.2應(yīng)用雙活設(shè)計
4.1.2.1對于x86服務(wù)器應(yīng)用的災(zāi)備
這個部分也分為兩種:第一種部署了虛擬化集群的x86服務(wù)器;第二種直接物理部署應(yīng)用的服務(wù)器。
第一種,通過在備機房部署一定比例的服務(wù)器同主機房的x86服務(wù)器形成一個大的虛擬化資源池,借助云平臺特有的故障恢復(fù)、應(yīng)用集群等功能實現(xiàn)兩地應(yīng)用的災(zāi)備集群。
第二種,我們可以通過部署雙機軟件實現(xiàn)主機機房與災(zāi)備機房物理服務(wù)器的雙機集群系統(tǒng),從而保證兩地直接的物理服務(wù)器災(zāi)備。
4.1.2.2核心數(shù)據(jù)庫系統(tǒng)的災(zāi)備
在災(zāi)備中心部署專門的數(shù)據(jù)庫一體機系統(tǒng),并安裝數(shù)據(jù)庫作為業(yè)務(wù)數(shù)據(jù)庫服務(wù)器對外提供服務(wù),通過配置異構(gòu)平臺軟件:DSG數(shù)據(jù)庫災(zāi)備軟件,獲取在線日志數(shù)據(jù)所產(chǎn)生的變化,轉(zhuǎn)變成用戶指定的數(shù)據(jù)格式儲存在本地隊列或遠(yuǎn)端隊列中,實現(xiàn)由數(shù)據(jù)中心至災(zāi)備數(shù)據(jù)中心的雙活。另外,為了保證系統(tǒng)的高效可用,生產(chǎn)中心自身小型機系統(tǒng)可以組成雙機集群;災(zāi)備中心可根據(jù)實際需要部署1臺數(shù)據(jù)庫一體機,要求數(shù)據(jù)庫一體機采用分布式存儲架構(gòu)實現(xiàn)軟件與設(shè)備硬件的松耦合,同時業(yè)務(wù)節(jié)點與存儲節(jié)點都能實現(xiàn)冗余架構(gòu)。
4.2存儲級災(zāi)備服務(wù)
云平臺可提供分布式存儲,可以實現(xiàn)應(yīng)用數(shù)據(jù)存放于分布式存儲上,通過分布式存儲技術(shù)將數(shù)據(jù)分別儲存在多臺設(shè)備上。云平臺通過分布式網(wǎng)絡(luò)存儲系統(tǒng)的可擴展性結(jié)構(gòu),實現(xiàn)無需購買額外的存儲設(shè)備,能夠通過每臺物理機的本地硬盤構(gòu)建分布式存儲環(huán)境,支持在分布式存儲上的故障恢復(fù)及多副本功能,默認(rèn)三個副本,副本數(shù)量可根據(jù)用戶實際需要進(jìn)行配置,當(dāng)主副本所在硬盤出現(xiàn)故障時,能自動切換到可用副本,不影響業(yè)務(wù)正常運行,同時保障數(shù)據(jù)高可靠性。
4.3應(yīng)用級備份服務(wù)
云平臺可提供多級別數(shù)據(jù)備份技術(shù),支持硬盤配置備份與恢復(fù)功能,包括主動備份與自動備份,同時支持異地自動備份功能,多種備份方案,靈活方便;同時增加了鏡像去重技術(shù),節(jié)約了備份文件儲存空間。云平臺通過定時備份功能支持配置備份服務(wù)器地址方式支持異地自動備份。并且云平臺通過快照的方式對運作中的業(yè)務(wù)主機進(jìn)行在線備份。
五、結(jié)束語
在云平臺日益普及的當(dāng)代,其具有部署便捷,可用性高,可擴展性大等優(yōu)點已被廣大用戶接受,而日漸增長的云平臺業(yè)務(wù)量,必將造成龐大的云數(shù)據(jù)存儲需求的產(chǎn)生,而數(shù)據(jù)存儲的災(zāi)備功能將是往后各大云平臺關(guān)注的重點所在。
基于云平臺的災(zāi)備云系統(tǒng)具備了可靠性高、擴展性大、維護便捷容易、業(yè)務(wù)風(fēng)險低、性價比超傳統(tǒng)等等特點,因此,今后各大企業(yè)以及政府機關(guān)的數(shù)據(jù)存儲必將通過災(zāi)備云系統(tǒng)實現(xiàn)數(shù)據(jù)信息的保駕護航。
參? 考? 文? 獻(xiàn)
[1]鄭晨溪,史曉卓.存儲災(zāi)備私有云數(shù)據(jù)中心建設(shè)[J].電子世界,2013,10.
[2]張慧,張鵬,李文學(xué).以“云災(zāi)備”防不測——“中小金融機構(gòu)災(zāi)備服務(wù)云平臺”順利實施災(zāi)備切換[J].金融電子化,2012,10.
[3]姜杰.基于二層網(wǎng)絡(luò)互通的跨數(shù)據(jù)中心電信私有云災(zāi)備體系研究[J].互聯(lián)網(wǎng)天地,2015,12.