方偉華,周藍捷,汪 豪,林鴻杰
(廈門地震勘測研究中心,福建 廈門 361021)
?
基于Vsphere的高可用性方案在地震業(yè)務(wù)系統(tǒng)中的設(shè)計與應(yīng)用
方偉華,周藍捷,汪 豪,林鴻杰
(廈門地震勘測研究中心,福建 廈門 361021)
以福建省簡易烈度計數(shù)據(jù)處理系統(tǒng)為例,介紹了福建省簡易烈度計數(shù)據(jù)處理系統(tǒng)的體系流程,引用Vsphere的高可用性解決方案,重點闡述了數(shù)據(jù)處理系統(tǒng)中服務(wù)端的高可用性體系架構(gòu)與配置,對當前業(yè)務(wù)系統(tǒng)進行優(yōu)化,實現(xiàn)了數(shù)據(jù)處理系統(tǒng)的5個主要功能,有效地保障地震業(yè)務(wù)系統(tǒng)高可連續(xù)性。
Vsphere ;高可用性方案;地震簡易烈度臺網(wǎng);業(yè)務(wù)連續(xù)性
近年來,隨著地震行業(yè)面向公眾的業(yè)務(wù)增多以及自身業(yè)務(wù)提出的需求,要求地震業(yè)務(wù)具有高可連續(xù)性。以福建省地震預(yù)警項目中簡易烈度計臺網(wǎng)系統(tǒng)部署為例,項目按照每個鄉(xiāng)鎮(zhèn)布置一個臺站,評估地震對鄉(xiāng)鎮(zhèn)的影響;按平均臺間距10 km左右設(shè)置;單臺平均定位精度小于5 km,最大不超過8 km;首臺觸發(fā)3~5 s發(fā)布首報預(yù)警信息;運行維護率≥90%。總體計劃分2期實施,1期在地震活動性較強或者地震影響較大的區(qū)域,選擇人口較多和經(jīng)濟發(fā)達區(qū)域進行設(shè)備安裝。在完成第1期較高密度建設(shè)以后,開展第2期建設(shè),在部分城市稀疏布點。對于這套由1 000臺站點組建的臺網(wǎng)系統(tǒng),數(shù)據(jù)中心服務(wù)器將面臨巨大的數(shù)據(jù)交換訪問壓力,需要研究如何更好地提高系統(tǒng)運行的高可用性與業(yè)務(wù)的連續(xù)性。本文將引用系統(tǒng)運維中的高可用技術(shù),來提高系統(tǒng)業(yè)務(wù)可靠性、維護率、時效性,并通過部署與試運行,解決業(yè)務(wù)系統(tǒng)運維中存在的以下各種問題[1]:
1)業(yè)務(wù)系統(tǒng)服務(wù)器出現(xiàn)日常維護時(計劃宕機、硬件升級),停機時間較長,如何縮短維護時間,提高業(yè)務(wù)連續(xù)性是我們所面臨的挑戰(zhàn)。
2)出現(xiàn)突發(fā)故障時(如硬件宕機、中毒、黑客攻擊)需手動檢測故障發(fā)生點,無自動檢測機制來實現(xiàn)平滑過渡,需提高業(yè)務(wù)自動恢復(fù)能力。
3)傳統(tǒng)系統(tǒng)備份繁雜,且不易操作,無可靠的系統(tǒng)容災(zāi)機制對當前業(yè)務(wù)做冗余保障。
高可用性技術(shù)以解決數(shù)據(jù)業(yè)務(wù)連續(xù)性為目的,是一項集虛擬化、集群、數(shù)據(jù)容災(zāi)、虛擬機遷移、容錯、負載均衡等多項功能為一體的綜合體系架構(gòu)方案。本文介紹采用基于Vsphere整體高可用性解決方案,搭建基于B/S方式可視化的福建省簡易烈度計臺網(wǎng)數(shù)據(jù)中心高可連續(xù)性系統(tǒng),旨在提高業(yè)務(wù)系統(tǒng)連續(xù)性[2]。
1.1 高可用性技術(shù)介紹
高可用性已成為未來IT的發(fā)展方向之一,實現(xiàn)高可用性的有效方法就是虛擬化整體解決方案,是指通過盡量縮短因日常維護操作(計劃內(nèi))和突發(fā)的系統(tǒng)崩潰(計劃外)所導(dǎo)致的停機時間,以提高系統(tǒng)和應(yīng)用的可用性。高可用性系統(tǒng)是目前行業(yè)內(nèi)防止核心數(shù)據(jù)中心業(yè)務(wù)系統(tǒng)因故障停機的最有效手段。
1.2 工具平臺選擇
目前國內(nèi)外公司高可用性解決方案很多,比如有微軟的Hyper-V,VMware的vSphere,紅帽的KVM。VMware Vsphere因其產(chǎn)品相對其它產(chǎn)品資源更豐富,國內(nèi)外網(wǎng)站相關(guān)學術(shù)交流平臺多,問題更易得到解決[3]。
應(yīng)用VMware Vsphere自身的vSphere HA功能可提供中斷快速恢復(fù)和連續(xù)可用性,以最小化或消除非計劃停機時間,從而輕松提高為應(yīng)用程序提供的基準級別,且以更低成本和更簡單的操作來實現(xiàn)更高級別的可用性。使用vSphere可以實現(xiàn):
1)獨立于硬件、操作系統(tǒng)和應(yīng)用程序,提供更高可用性;
2)減少常見維護操作的計劃停機時間;
3)在出現(xiàn)故障時提供自動恢復(fù)。
福建省簡易烈度臺網(wǎng)設(shè)備規(guī)模為1 000臺左右,通過中國電信的MPLS VPN組網(wǎng)方式將數(shù)據(jù)傳輸至廈門地震勘測研究中心與福建省地震局。每個觀測臺站提供2 M SDH鏈路帶寬供烈度計記錄數(shù)據(jù)上報使用,省局與廈門地震勘測研究中心分別采用一條10 M光纖匯聚專線接入中國電信VPN平臺,用于收集各觀測臺站數(shù)據(jù)。對于部分未輔設(shè)SDH鏈路的區(qū)域,采用3G信號進行輔助接入數(shù)據(jù)處理中心采用基于Earthworm的地震報警軟件框架系統(tǒng)(圖1)。
圖1 福建省簡易烈度計臺網(wǎng)業(yè)務(wù)系統(tǒng)拓撲圖
提高數(shù)據(jù)處理系統(tǒng)的業(yè)務(wù)連續(xù)性,采用Vsphere HA的高可用性方案,需要在7臺高性能的服務(wù)器上進行實施部署。DC域服務(wù)器主要用于系統(tǒng)環(huán)境中用戶權(quán)限的統(tǒng)一管理;Vcenter服務(wù)器主要用于ESXI虛擬主機的統(tǒng)一管理,對資源層做資源動態(tài)分配管理,應(yīng)用Vsphere的HA,VMOTION,F(xiàn)T組件等功能來實現(xiàn)業(yè)務(wù)的高可用和業(yè)務(wù)連續(xù)性;SQLserver數(shù)據(jù)庫服務(wù)器用于存儲Vcenter統(tǒng)一管理中所產(chǎn)生的數(shù)據(jù);2臺ESXI主機實現(xiàn)集群功能;基于Openfiler搭建的NAS共享存儲用于實現(xiàn)虛擬機的存儲備份功能。我們通過使用VMware Data Recovery組件來實現(xiàn)異地備份虛擬機的功能[4](圖2)。
圖2 系統(tǒng)架構(gòu)示意圖
重要硬件配置見表1:
表1 軟硬件配置及功能說明
為了保證簡易烈度臺網(wǎng)業(yè)務(wù)系統(tǒng)的連續(xù)穩(wěn)定性,我們采用基于Vsphere平臺高可用性方案,對原有系統(tǒng)進行調(diào)整與優(yōu)化,以實現(xiàn)數(shù)據(jù)處理系統(tǒng)的高可用性。系統(tǒng)部署在福建省地震行業(yè)網(wǎng),部署后系統(tǒng)的主要功能主要包括以下5個方面(圖3):
圖3 基于Vsphere HA功能規(guī)劃圖
1)HA(高可性)功能模塊:主要解決在系統(tǒng)遇到計劃停機時,縮短維護時間,提高業(yè)務(wù)連續(xù)性作用。
HA的主要目的是在日常維護中,讓業(yè)務(wù)中斷時間盡可能短的功能。它是將多臺主機組建成一個故障轉(zhuǎn)移集群(Cluster),運行在集群上的服務(wù)(或VM)不會因為單臺主機的故障而停止。vSphere HA 利用配置為群集的多臺 ESXi 主機,為虛擬機中運行的應(yīng)用程序提供快速中斷恢復(fù)和具有成本效益的高可用性[5-6]。vSphere HA通過在群集內(nèi)的其他主機上重新啟動虛擬機,防止服務(wù)器故障。持續(xù)監(jiān)控虛擬機并在檢測到故障時對其進行重新設(shè)置,防止應(yīng)用程序故障。
2)容錯(FT)功能模塊:主要解決在系統(tǒng)遇到突發(fā)故障時,起到對系統(tǒng)的熱備作用,使得備用系統(tǒng)可平滑過渡,保障業(yè)務(wù)連續(xù)性作用。
FT是在業(yè)務(wù)出現(xiàn)突發(fā)故障時所采取的保障措施,使得業(yè)務(wù)平滑過渡,無中斷現(xiàn)象, Fault Tolerance 通過確保在虛擬機的指令執(zhí)行的任何時間點,主虛擬機和輔助虛擬機的狀態(tài)均相同來提供連續(xù)可用性。主機容錯FT業(yè)務(wù)是使用 ESXi 主機平臺上的 VMware vLockstep 技術(shù)來完成系統(tǒng)連續(xù)可用。通過vLockstep使主虛擬機和輔助虛擬機執(zhí)行相同順序的 x86 指令來完成此過程。主虛擬機捕獲所有輸入和事件(從處理器到虛擬 I/O 設(shè)備),并在輔助虛擬機上進行重放。輔助虛擬機執(zhí)行與主虛擬機相同的指令序列,而僅單個虛擬機映像(主虛擬機)執(zhí)行工作負載。如果運行主虛擬機的主機或運行輔助虛擬機的主機發(fā)生故障,則會發(fā)生即時且透明的故障切換。正常運行的ESXi 主機將無縫變成主虛擬機的主機,而不會斷開網(wǎng)絡(luò)連接或中斷正在處理的事務(wù)。使用透明故障切換,不會有數(shù)據(jù)損失,并且可以維護網(wǎng)絡(luò)連接。
3)數(shù)據(jù)備份功能模塊:主要解決系統(tǒng)數(shù)據(jù)容災(zāi)備份作用,保證數(shù)據(jù)的可靠性。
VMware Data Recovery軟件是運行在Esxi主機上的一個虛擬機,實現(xiàn)VM周期異地備份,不僅能起到數(shù)據(jù)備份作用,同時起到了地震業(yè)務(wù)功能的備份,可以在最短的時間內(nèi)恢復(fù)地震業(yè)務(wù)功能,并將其信息收集在還原點中。如果發(fā)生數(shù)據(jù)丟失或損壞,它可以將單個虛擬文件或整個虛擬機還原到前一狀態(tài)。
4)業(yè)務(wù)快速恢復(fù):主要實現(xiàn)主業(yè)務(wù)系統(tǒng)出現(xiàn)突發(fā)情況時,業(yè)務(wù)能夠快速恢復(fù),減少了傳統(tǒng)系統(tǒng)部署費時、費力的情況,只需要一個模板即可輕松恢復(fù)原有的業(yè)務(wù)。
通過配置一臺Earthworm數(shù)據(jù)處理系統(tǒng),常規(guī)做法需經(jīng)過安裝系統(tǒng)、配置相關(guān)參數(shù)、費時費力,通過該模塊功能,僅需將一臺部署好的系統(tǒng)配置成模板即可。
實現(xiàn)Vsphpere高可用性的前提,是在系統(tǒng)環(huán)境中搭建Vcerter,才可以實現(xiàn)HA、FT、Vmotion、負載均衡等高級功能。Vcenter的作用是對所有ESXi主機進行統(tǒng)一的管理與調(diào)度的工具,如果只是單一ESXi主機,它的功能就相當一臺Vmware workstation一樣,無任何高可用性功能。它的搭建需建立在DC(域環(huán)境)、SQL Server 2008、DNS環(huán)境下進行。
5.1 HA高可用性的實現(xiàn)
與其他群集解決方案不同,vSphere HA 提供基礎(chǔ)架構(gòu)并使用該基礎(chǔ)架構(gòu)保護所有工作負載,無需在應(yīng)用程序或虛擬機內(nèi)安裝特殊軟件,所有工作負載均受 vSphere HA 保護。配置 vSphere HA 之后,不需要執(zhí)行操作即可保護新虛擬機,它們會自動受到保護。建立HA的關(guān)鍵配置:①相同的共享存儲;②相同的虛擬網(wǎng)絡(luò)配置;③DNS正確的解析。
HA配置中接入控制為參數(shù)設(shè)置的的重要環(huán)節(jié)。在福建省簡易烈度臺網(wǎng)環(huán)境中共有1 000個簡易烈度計觀測站點。一般1臺Earthworm服務(wù)器可以接收400左右個數(shù)據(jù)通道的匯聚數(shù)據(jù)。2016年福建省預(yù)計先布設(shè)300臺烈度計,1臺設(shè)備有3個通道數(shù)據(jù),總計900個數(shù)據(jù)通道,因此需在1臺Esxi主機上搭建3個VM,分別接收閩南、閩西、閩北3個區(qū)域的數(shù)據(jù),2臺Esxi主機搭建成一個簇,實現(xiàn)HA功能,每臺主機有36G內(nèi)存,單個VM Earthworm接收站消耗5G內(nèi)存,系統(tǒng)消耗1GB,主機閑置18G。當其中1臺主機宕機或常規(guī)維護時,啟用群集允許的主機故障數(shù)目為3臺,即可在不斷記的情況下實現(xiàn)3臺接收站同時維護(圖4~5)。
圖4 HA功能規(guī)劃與設(shè)計圖
圖5 集群的故障恢復(fù)參數(shù)配置圖
5.2 主機容錯FT的實現(xiàn)
主機容錯FT業(yè)務(wù)是使用 ESXi 主機平臺上的 VMware vLockstep 技術(shù)來完成系統(tǒng)連續(xù)可用,在進行透明故障切換之后,將重新生成新的輔助虛擬機,并將重新建立冗余。整個過程是透明且全自動的,并且即使 vCenter Server 不可用,仍能保證工作。建立FT關(guān)鍵配置(圖6):
1)在建立FT雙機熱備之前,要確保虛擬機的虛擬CPU是1顆1核心。
2)其次是要建立FT功能的主機必須有VMlernel網(wǎng)絡(luò)用于FT。
3)在群集設(shè)置中,滿足FT的群集要求,創(chuàng)建并啟用vSphere HA 群集,在群集設(shè)置中勾選“打開vSphere HA”。
4)檢查ESXi主機的CPU是否支持FT指令,如果不支持,會在打開FT時報錯。
5)右擊一個虛擬機,并在彈出的快捷菜單中選擇 Fault Tolerance > ,打開 Fault Tolerance。
6)開啟FT需要使用精簡置備的磁盤,所以在開啟FT前,vCenter會自動轉(zhuǎn)換虛擬機磁盤。
7)轉(zhuǎn)換之后,特定的虛擬機將指定為主虛擬機,并在另一臺主機上運行輔助虛擬機?,F(xiàn)在,主虛擬機已啟用了容錯功能。虛擬機運行在esxi01上,F(xiàn)T保護副本運行在esxi02上。
圖6 Vsphere架構(gòu)FT功能配置圖
5.3 數(shù)據(jù)備份的實現(xiàn)
利用VMware Data Recovery軟件,用戶可自行決定何時運行VMware Data Recovery任務(wù)及還原點的保存時間,方便恢復(fù)數(shù)據(jù)。例如,用戶可以調(diào)度備份在凌晨進行,得到的還原點可以保留數(shù)周、數(shù)月或數(shù)年(圖7)。
5.4 業(yè)務(wù)快速恢復(fù)功能實現(xiàn)
通過在新機器中部署Earthworm數(shù)據(jù)處理系統(tǒng),不用任何配置,只需將模板轉(zhuǎn)換成新的虛擬機即可,相當于電腦中的復(fù)制粘貼功能,方便高效,整個恢復(fù)過程只需10分鐘(圖8)。
圖7 系統(tǒng)備份配置示意圖
圖8 模板部署業(yè)務(wù)系統(tǒng)示意圖
6.1 應(yīng)用效果比對分析
經(jīng)過一段時間的測試,系統(tǒng)運行良好,穩(wěn)定性與可連續(xù)性較高,對于系統(tǒng)運維過程中所面臨的計劃宕機、非計劃宕機、數(shù)據(jù)容災(zāi)的問題都能得到有效的保障,各項測試任務(wù)如表2所示。
表2 各項功能比測
6.2 總結(jié)
地震行業(yè)內(nèi)存在大量的業(yè)務(wù)系統(tǒng)運維工作,十三五規(guī)劃以來,地震系統(tǒng)的重點工作是地震預(yù)警,直接面臨社會服務(wù)效力的問題。地震系統(tǒng)業(yè)務(wù)連續(xù)性需要得到有效保證,解決傳統(tǒng)的運維模式存在的諸多問題,如業(yè)務(wù)連續(xù)性差、系統(tǒng)恢復(fù)工作效率低下、數(shù)據(jù)災(zāi)備費時費力、統(tǒng)一監(jiān)控難等。本文通過在福建省簡易烈度計數(shù)據(jù)處理系統(tǒng)中應(yīng)用Vsphere 高可性解決方案,具有高效便捷經(jīng)濟的特性,使得地震行業(yè)內(nèi)的業(yè)務(wù)運維連續(xù)性問題得到有效解決,適于在整個地震行業(yè)內(nèi)進行推廣與借鑒。
[1] 許高攀,曾文華.高可用性系統(tǒng)技術(shù)研究[J].微計算機信息,2010,26(15):6-7,5.
[2] 孫曉蓉,牛忠賓.計算機系統(tǒng)高可用性解決方案[J].計算機與網(wǎng)絡(luò),2004(10):53-54,59.
[3] 李琳,祁天.服務(wù)器虛擬化技術(shù)探討-Hyper-V與VMware的分析與比較[J].科技傳播,2010(11):114,118.
[4] 李剛,周利霞,宋軍,等.基于 VMware Esxi 軟件的服務(wù)器虛擬化技術(shù)在天津地震監(jiān)測網(wǎng)絡(luò)中的應(yīng)用[J].震災(zāi)防御技術(shù),2011,6(3):311-318.
[5] 劉震宇.基于 VMware vSphere4.0的PC服務(wù)器資源池構(gòu)建[D].大連:大連海事大學,2010.
[6] 楊斌,馬朝暉,郝志勇.虛擬技術(shù)在地震應(yīng)急指揮技術(shù)系統(tǒng)中的應(yīng)用[J].震災(zāi)防御技術(shù),2012,7(3):313-321.
Design and Implementation of Seismological Business System Based on the High Availability Scheme of Vsphere
FANG Wei-hua,ZHOU Lan-jie,WANG Hao,LIN Hong-jie
(Xiamen Research Center of Seismic Exploration,Xiamen 361021,China)
In this paper,the flow of the data processing system of facile seismic intensity meter in Fujian Province is introduced.On basis of the high availability scheme of Vsphere,according to the architecture and configuration of the high availability server in the data processing system,we optimize the current business system,implements the five major functions of a data processing system to ensure the comprehensive high availability and business continuity of the seismological business system in Fujian Province.
Vsphere; high availability; facile seismic intensity reporting network; business continuity
方偉華,周藍捷,汪豪,等.基于Vsphere的高可用性方案在地震業(yè)務(wù)系統(tǒng)中的設(shè)計與應(yīng)用[J].華北地震科學,2016,34(4):28-33.
2016-04-14
福建省簡易烈度計地震預(yù)警項目(2015DZLDY004)
方偉華(1982—),男,工程師,主要從事的工作地震業(yè)務(wù)系統(tǒng)運維工作.E-mail:258279496@qq.com
P315-391
A
1003-1375(2016)04-0028-06
10.3969/j.issn.1003-1375.2016.04.005