方偉華,周藍(lán)捷,李文惠
(廈門地震勘測研究中心,福建 廈門 361021)
地震行業(yè)虛擬化數(shù)據(jù)中心監(jiān)控與運(yùn)維的搭建與應(yīng)用
方偉華,周藍(lán)捷,李文惠
(廈門地震勘測研究中心,福建 廈門 361021)
隨著社會(huì)經(jīng)濟(jì)和技術(shù)的快速發(fā)展,IT行業(yè)共經(jīng)歷了傳統(tǒng)數(shù)據(jù)中心、虛擬化數(shù)據(jù)中心、私有云、公共云4個(gè)發(fā)展階段。當(dāng)前,地震業(yè)務(wù)系統(tǒng)普遍完成了虛擬化數(shù)據(jù)中心建設(shè)工作,逐步由傳統(tǒng)數(shù)據(jù)中心向云數(shù)據(jù)中心轉(zhuǎn)變。引用VMWARE公司Vcops的虛擬化數(shù)據(jù)中心監(jiān)控體系架構(gòu)方案,解決當(dāng)前地震行業(yè)內(nèi)虛擬池化的資源管理方面存在的問題,從而提高地震業(yè)務(wù)的服務(wù)質(zhì)量,減少突發(fā)事件以及基礎(chǔ)架構(gòu)和應(yīng)用服務(wù)停機(jī)事件。簡單介紹了該方法的體系架構(gòu),重點(diǎn)闡述了該方法在地震虛擬化數(shù)據(jù)中心配置與應(yīng)用舉例,通過數(shù)據(jù)收集,經(jīng)過分析后,用報(bào)表的形式展示給用戶,并給出虛擬化數(shù)據(jù)中心未來趨勢意見,有效保障地震業(yè)務(wù)系統(tǒng)的高效運(yùn)行。希望相關(guān)闡述能夠讓更多這方面的工作人員了解,更好地將其推廣至地震行業(yè)內(nèi)。
Vcops;地震虛擬化數(shù)據(jù)中心;監(jiān)控運(yùn)維;容量分析
《中國地震局防震減災(zāi)信息化規(guī)劃》(GH/2—13)提出了在下一代基礎(chǔ)信息系統(tǒng)建設(shè)中要應(yīng)用云計(jì)算技術(shù)的目標(biāo)。一般情況下,IT行業(yè)的發(fā)展需經(jīng)歷傳統(tǒng)數(shù)據(jù)中心、虛擬化數(shù)據(jù)中心、私有云和公共云4個(gè)階段。當(dāng)前地震業(yè)務(wù)系統(tǒng)在經(jīng)過“十二五”項(xiàng)目建設(shè)的改造后,普遍完成了虛擬化數(shù)據(jù)中心建設(shè)工作,天津局、上海局、山東局已經(jīng)開展了云計(jì)算部署試點(diǎn)。目前,福建省地震局有3套基于VMWare Vsphere的虛擬化云計(jì)算系統(tǒng),分別承載地震研究室的地震預(yù)警與烈度速報(bào)數(shù)據(jù)產(chǎn)品的展示,臺(tái)網(wǎng)維護(hù)室的流接收與處理系統(tǒng),信息網(wǎng)絡(luò)室的通用信息系統(tǒng)等應(yīng)用。
面對(duì)當(dāng)前地震業(yè)務(wù)系統(tǒng)如此眾多的虛似化系統(tǒng),如何管理好這些系統(tǒng)——監(jiān)控虛擬化數(shù)據(jù)中心的各類資源的使用情況,也包括了虛擬化環(huán)境中的性能、告警、事件類的信息監(jiān)控是很重要的。其實(shí),在Vsphere架構(gòu)方案中,Vcenter本身已具有簡單的監(jiān)控功能,但它是以配置管理為主,對(duì)于相對(duì)復(fù)雜的場景,無法滿足更高標(biāo)準(zhǔn)的監(jiān)控與運(yùn)維要求。而Vcops是一個(gè)虛擬化數(shù)據(jù)中心自動(dòng)運(yùn)營管理工具,Vcops中展示的所有與虛擬化相關(guān)的數(shù)據(jù)都來自于Vcenter。Vcops可以判斷數(shù)據(jù)中心的健康狀況和使用效率,給出相關(guān)預(yù)測和建議,并及時(shí)向管理員報(bào)警,指明潛在的風(fēng)險(xiǎn)和異常,從而更好地提升地震業(yè)務(wù)的服務(wù)質(zhì)量。
Vcenter Operations Manager(Vcops)是一個(gè)在 VMWare Vsphere的虛擬化云計(jì)算系統(tǒng)環(huán)境下,用于管理數(shù)據(jù)中心內(nèi)所有ESXi服務(wù)器性能和容量的軟件。通過監(jiān)控ESXi物理服務(wù)器的計(jì)算資源和存儲(chǔ)資源的使用情況,Vcops可以有效判斷數(shù)據(jù)中心的健康狀況和使用效率,給出必要的預(yù)測和建議,及時(shí)地向管理員反應(yīng)潛在的風(fēng)險(xiǎn)和異常。
在VMWare Vsphere的虛擬化云計(jì)算系統(tǒng)中部署Vcops,有以下幾個(gè)優(yōu)勢:①提高服務(wù)質(zhì)量,減少突發(fā)事件以及基礎(chǔ)架構(gòu)和應(yīng)用服務(wù)停機(jī)事件的發(fā)生;②通過簡化性能、事件和變更管理任務(wù),大大提高IT工作的效率;③適當(dāng)調(diào)整規(guī)模和回收過度調(diào)配的容量,減少服務(wù)器方面的開銷;④每位虛擬基礎(chǔ)架構(gòu)管理員可管理的虛擬機(jī)數(shù)量增加。
從圖1中可以看出,Vcops的工作是由2臺(tái)虛擬機(jī)(VM)完成的。
“分析”虛擬機(jī)負(fù)責(zé)收集、存放和分析性能指標(biāo)數(shù)據(jù)(Metrics)、拓?fù)浣Y(jié)構(gòu)數(shù)據(jù)(Topology)和事件數(shù)據(jù)(Event)。其中,收集到的原始數(shù)據(jù)被儲(chǔ)存在FSDB數(shù)據(jù)庫中,而經(jīng)過分析、處理的數(shù)據(jù)則被儲(chǔ)存在PostgreSQL數(shù)據(jù)庫中?!胺治觥碧摂M機(jī)的數(shù)據(jù)采集源包括vSphere Cloud、Vcenter、Vcenter Configuration Manager以及其他的第三方設(shè)備。
“界面”虛擬機(jī)負(fù)責(zé)將經(jīng)過分析、處理的數(shù)據(jù)呈現(xiàn)給用戶。該虛擬機(jī)通過OpenVPN從“分析”虛擬機(jī)中獲取數(shù)據(jù),再經(jīng)過自己的處理后將這些數(shù)據(jù)儲(chǔ)存在PostgreSQL數(shù)據(jù)庫中。
“界面”虛擬機(jī)的核心是3個(gè)Web應(yīng)用程序,即:①Vsphere WebApp。由VMware提供,用于呈現(xiàn)Vsphere產(chǎn)品的狀態(tài)信息。Vsphere WebApp的訪問路徑是https://{UI VM IP}或者 https://{UI VM IP}/Vcops-vsphere.②Custom WebApp。它由第三方提供,一般用于呈現(xiàn)第三方設(shè)備的狀態(tài)信息。比如,由EMC發(fā)布的ESA產(chǎn)品就是一個(gè)第三方插件,將其安裝到Vcops上后,用戶就可以通過Custom WebApp來查看Vsphere后端的EMC存儲(chǔ)設(shè)備的狀態(tài)信息。Custom WebApp的訪問路徑是https://{UI VM IP}/Vcopscustom.③Admin WebApp。它是由VMware提供的,用于配置和管理Vcops本身。Admin WebApp的訪問路徑是https://{UI VM IP}/admin.
圖1 系統(tǒng)架構(gòu)圖
在系統(tǒng)部署的過程中,只需要用2臺(tái)硬件服務(wù)器即可完成Vcops的部署,一臺(tái)安裝VMware ESXi5.5,負(fù)責(zé)安裝Vcops應(yīng)用;另一臺(tái)服務(wù)器安裝Vcenter,負(fù)責(zé)管理Vcops應(yīng)用中產(chǎn)生的2臺(tái)虛擬機(jī)。Vcenter的安裝本文中就不再介紹,一般虛擬化數(shù)據(jù)中心都已架構(gòu),本文主要介紹Vcops的安裝過程。Vcops工具是以O(shè)VF模板的方式提供的,安裝部署簡單。
這里簡單介紹一下Vcops的安裝步驟:①從VMWare官網(wǎng)下載最新版——VMware-Vcops-5.7.0.0-1073531-vapp.ova模板,使用虛擬數(shù)據(jù)中心連接工作Vsphere Client登錄Vcenter Server,在“文件”菜單選擇“部署OVF模板”,如圖2所示。②在“源”對(duì)話框單擊“瀏覽”按鈕,選擇下載的Vcops安裝模板。這是一個(gè)“VMware-Vcops-5.7.0.0-1073531-vapp.ova”、大小為1.36 GB的文件。③“OVF模板詳細(xì)信息”對(duì)話框中顯示了要部署的OVF模板的信息,包括產(chǎn)品的名稱、版本、下載大小、占用的空間。④在“最終用戶許可協(xié)議”對(duì)話框中單擊“接受”按鈕,然后單擊“下一步”按鈕。⑤在“名稱和位置”對(duì)話框顯示要部署的Vcops模板的名稱(以vAPP提供),在此選擇默認(rèn)值。⑥在“部署配置”對(duì)話框中選擇“小”,這可以管理1 500個(gè)以內(nèi)的虛擬機(jī)。Vcops有3種配置方式,分別為大、中、小3種方式。當(dāng)配置方式為“小”時(shí),需要4個(gè)vCPU和16 GB內(nèi)存(實(shí)際運(yùn)行時(shí)可以配置為8 GB),它可以管理1 500個(gè)以內(nèi)的虛擬機(jī);當(dāng)配置方式為“中等”時(shí),需要8個(gè)vCPU、25 GB內(nèi)存,它可以管理1 500~3 000個(gè)虛擬機(jī);當(dāng)管理方式為“大”時(shí),需要16個(gè)vCPU、34 GB內(nèi)存,它可以管理3 000個(gè)以上虛擬機(jī)。⑦在“資源池”對(duì)話框中選擇資源池,在此選擇根目錄即HA群集。⑧在“存儲(chǔ)器”對(duì)話框中選擇將Vcops模板保存的目標(biāo)存儲(chǔ)器。推薦選擇群集中的共用存儲(chǔ)或網(wǎng)絡(luò)存儲(chǔ)。⑨在“磁盤格式”對(duì)話框中選擇以什么格式存儲(chǔ)虛擬磁盤。Vcops需要3.8 GB精簡置備和344 GB(厚置備)的虛擬磁盤,如果是實(shí)驗(yàn),可以將344 GB磁盤設(shè)置為“精簡置備”磁盤。這里是一個(gè)生產(chǎn)環(huán)境,要有足夠的磁盤空間,所以,選擇“厚置備”磁盤。⑩在“網(wǎng)絡(luò)映射”對(duì)話框中選擇此模板使用什么網(wǎng)絡(luò),然后選擇相應(yīng)的網(wǎng)絡(luò)。?在“IP地址分配”對(duì)話框中選擇使用“固定的”IP地址。部署Vcops模板后,會(huì)創(chuàng)建2個(gè)虛擬機(jī),每個(gè)虛擬機(jī)需要1個(gè)IP地址。?在“屬性”對(duì)話框中選擇時(shí)區(qū),并設(shè)置UI VM IP地址和Analytics虛擬機(jī)的IP地址。?“即將完成”對(duì)話框中顯示了Vcops模板的部署屬性,確認(rèn)無誤之后單擊“完成”按鈕。通過以上幾個(gè)步驟即可完成Vcops的安裝,簡單方便。
圖2 部署OVF模板
在首次登錄時(shí),需要打開“初始設(shè)置向?qū)А保矗孩僭凇疤摂M設(shè)備詳細(xì)信息”對(duì)話框中輸入宿主Vcenter Server的地址、管理員賬戶和密碼,并輸入Analytics VM的地址。②在“安全警示”對(duì)話框中單擊“是”按鈕,信任Vcenter Server服務(wù)器的證書信息。③在“更改密碼”對(duì)話框中更改Vcenter Operations Manager管理員密碼和root賬戶密碼。默認(rèn)管理員賬戶密碼為admin,默認(rèn)root密碼為vmware。更改密碼時(shí),密碼至少需要8位,并且至少包含一個(gè)字母和一個(gè)數(shù)字。④在“指定要監(jiān)控的Vcenter Server”對(duì)話框中輸入Vcenter Server的IP地址172.30.5.20,輸入Vcenter Server的管理員賬戶和密碼,并在“顯示名稱”中輸入顯示名稱。⑤開始鏈接到Vcenter Server。⑥顯示Vcenter Operations Manager的管理界面。Vcops向Vcenter注冊信息界面如圖3所示。
圖3 Vcops向Vcenter注冊信息
與Vcenter不同,Vcops是面向管理目標(biāo)的監(jiān)控方式,這些管理目標(biāo)包括故障/告警/異常、使用率/性能數(shù)據(jù)、資源池容量、虛擬機(jī)使用活躍度、資源配置、計(jì)費(fèi)等。通常的視圖是先選擇一種管理目標(biāo),再選擇要查看的設(shè)備。
Vcops不是簡單的顯示數(shù)據(jù)和曲線,它是將數(shù)據(jù)進(jìn)行分析,記錄分析系統(tǒng)常規(guī)行為特征,從而評(píng)估任意時(shí)刻下該系統(tǒng)是否在正常狀態(tài)運(yùn)行的結(jié)論。虛擬化數(shù)據(jù)中心整體健康狀態(tài)如圖4所示。
圖4 虛擬化數(shù)據(jù)中心整體健康狀態(tài)
由Vcenter收集來的數(shù)據(jù),經(jīng)過Vcops分析,可有效預(yù)估故障情況,而使用圖表便于進(jìn)行問題診斷,具體步驟是:①管理員發(fā)現(xiàn)某個(gè)Oracle虛機(jī)出現(xiàn)告警;②檢查存儲(chǔ)磁盤設(shè)備;③檢查EMC VNX存儲(chǔ);④得出故障原因。故障分析步驟如圖5所示。
Vcops通過Vcenter收集數(shù)據(jù)、分析數(shù)據(jù),可得出虛擬機(jī)未來容量預(yù)測。以福建省簡易烈度計(jì)數(shù)據(jù)中心Earthworm系統(tǒng)為列,通過分析每日資源利用率,與當(dāng)前虛擬機(jī)資源配置進(jìn)行比對(duì),得出未來容量需求形勢。
虛擬機(jī)容量分析情況如圖6所示,數(shù)據(jù)中心CPU容量趨勢報(bào)告如圖7所示。
應(yīng)用Vcops的報(bào)告功能,可以明確一段時(shí)間內(nèi)資源利用率較低的虛擬機(jī),并將其回收,同時(shí),還可以分析出近期資源緊張的虛擬機(jī),盡快對(duì)資源進(jìn)行調(diào)優(yōu)。虛擬化數(shù)據(jù)中心資源調(diào)優(yōu)建議如圖8所示。
在地震行業(yè)網(wǎng)虛擬化數(shù)據(jù)中心應(yīng)用Vcops工具,基于其部署簡單、可視化直觀、數(shù)據(jù)分析標(biāo)準(zhǔn)化、趨勢意見報(bào)告機(jī)制等特點(diǎn),可有效保障當(dāng)前地震行業(yè)內(nèi)池化數(shù)據(jù)中心面臨的管理困難的問題。
通過該應(yīng)用工具的試部署,可以有效提高服務(wù)質(zhì)量,減少突發(fā)事件以及基礎(chǔ)架構(gòu)和應(yīng)用服務(wù)停機(jī)事件的發(fā)生,提高工作效率,降低運(yùn)維成本。
圖5 故障分析步驟
圖6 虛擬機(jī)容量分析
圖7 數(shù)據(jù)中心CPU容量趨勢報(bào)告
圖8 虛擬化數(shù)據(jù)中心資源調(diào)優(yōu)建議
[1]錢瓊芬.云數(shù)據(jù)中心虛擬資源管理研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2012(7):2412-2415.
[2]高宏卿,邢穎.基于經(jīng)濟(jì)學(xué)的云資源管理模型研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(19):4139-4146.
[3]虛擬化與云計(jì)算小組著.云計(jì)算寶典——技術(shù)與實(shí)踐[M].北京:電子工業(yè)出版社,2012:4-12.
[4]張琪勝.云計(jì)算平臺(tái)監(jiān)控系統(tǒng)的研究與應(yīng)用[D].北京:北京交通大學(xué),2011.
[5]苑文成,朱怡安,陸偉.面向虛擬資源的云計(jì)算資源管理機(jī)制[J].西北工業(yè)大學(xué)學(xué)報(bào),2010,28(5):34-39.
TP308
A
10.15913/j.cnki.kjycx.2017.20.144
2095-6835(2017)20-0144-04
方偉華(1982—),男,工程師,主要從事地震業(yè)務(wù)系統(tǒng)運(yùn)維方面的工作。
〔編輯:白潔〕