楊代才 秦運(yùn)龍
摘要:針對(duì)湖北省氣象云平臺(tái)資源池分散、異構(gòu)、無(wú)法統(tǒng)一管理的現(xiàn)狀,設(shè)計(jì)了湖北省異構(gòu)資源池的統(tǒng)一監(jiān)控系統(tǒng),實(shí)現(xiàn)統(tǒng)一監(jiān)控,解決了多個(gè)分散異構(gòu)資源池?zé)o法統(tǒng)一監(jiān)控和運(yùn)維的難題,以更好的規(guī)劃資源提升資源利用率。
關(guān)鍵詞:虛擬化;異構(gòu);分布式;資源池
中圖分類號(hào):TP309 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2018)07-0060-02
我省從2013年起經(jīng)過(guò)多年時(shí)間初步搭建了湖北省氣象云平臺(tái),實(shí)現(xiàn)服務(wù)器虛擬化和桌面虛擬化,擁有混合異構(gòu)的VMware資源、KVM資源和CTRIX資源池[1]。分階段多廠商參與建設(shè),導(dǎo)致當(dāng)前階段分散、異構(gòu)的多資源池普遍存在,解決如何將不同的虛擬化技術(shù)架構(gòu)下的集群環(huán)境采用一種統(tǒng)一的方式來(lái)進(jìn)行監(jiān)控管理,避免監(jiān)控管理不同的池化資源需要采用不同的管理方法和工具,要達(dá)到的效果是在一個(gè)統(tǒng)一管理的工具環(huán)境下就可以監(jiān)控管理VMware資源池、CTRIX資源池、KVM資源池,管理范圍包括網(wǎng)絡(luò)層、存儲(chǔ)資源層、服務(wù)器層,粒度能夠監(jiān)控管理到服務(wù)器操作系統(tǒng)進(jìn)程級(jí)別、磁盤(pán)組RAID級(jí)別、網(wǎng)絡(luò)VLAN級(jí)別。如何快速、有效的監(jiān)控和管理云平臺(tái)中大量的網(wǎng)絡(luò)設(shè)備、計(jì)算資源、存儲(chǔ)設(shè)備,保障各種應(yīng)用系統(tǒng)穩(wěn)定可靠運(yùn)行變的越來(lái)越重要,迫切需要開(kāi)發(fā)建設(shè)混合異構(gòu)的資源池的統(tǒng)一管理監(jiān)控平臺(tái)。
1 總體設(shè)計(jì)
基礎(chǔ)設(shè)施資源池監(jiān)控涵蓋對(duì)虛擬化環(huán)境和物理主機(jī)各項(xiàng)性能指標(biāo)的監(jiān)控,同時(shí)支持按業(yè)務(wù)系統(tǒng)維度、部門(mén)維度和地理位置維度進(jìn)行的監(jiān)視功能[2][3]。通過(guò)SNMP協(xié)議、IPMI協(xié)議、Agent代理等采集方式,對(duì)資源的KPI性能指標(biāo)包括CPU使用率、內(nèi)存使用率、存儲(chǔ)使用率、I/O速率、告警等,按設(shè)定監(jiān)控時(shí)間進(jìn)行主動(dòng)輪詢收集,并在此基礎(chǔ)上達(dá)到實(shí)時(shí)監(jiān)控資源健康狀態(tài)、主動(dòng)發(fā)現(xiàn)故障、及時(shí)運(yùn)維的目的。
(1)綜合視圖。綜合視圖為總體展示界面,從物理地域的角度、業(yè)務(wù)使用的角度以及部門(mén)角度對(duì)云系統(tǒng)中的資源進(jìn)行展示。具體包括資源池運(yùn)行概況、資源池運(yùn)行趨勢(shì)、核心業(yè)務(wù)系統(tǒng)和各部門(mén)資源池使用情況。(2)資源池監(jiān)控。對(duì)資源池中單個(gè)虛擬機(jī)及物理主機(jī)進(jìn)行監(jiān)控,用顏色直觀展示機(jī)器狀態(tài),可進(jìn)行精準(zhǔn)查找和分組查看,支持圖形界面與表格界面切換。點(diǎn)擊問(wèn)題機(jī)器小圓點(diǎn)可直接查看機(jī)器詳細(xì)狀態(tài),方便業(yè)務(wù)人員處理相關(guān)問(wèn)題。(3)各部門(mén)使用情況及各地區(qū)使用情況監(jiān)視。為物理機(jī)及虛擬機(jī)添加標(biāo)簽,標(biāo)明其所屬部門(mén)及所屬地區(qū),省級(jí)各部門(mén)及市縣地區(qū)可使用帶權(quán)限的用戶登錄,查看本部門(mén)及地區(qū)被分配的的虛擬化資源及所管轄主機(jī)的狀態(tài)信息。(4)權(quán)限管理。為省級(jí)、市(區(qū))級(jí)、縣級(jí)建立區(qū)分權(quán)限的用戶,省級(jí)可查看本省所有物理主機(jī)、虛擬機(jī)及云管理平臺(tái)信息,可創(chuàng)建市、縣級(jí)用戶,修改權(quán)限配置;市級(jí)地區(qū)可查看本市所屬主機(jī)、縣級(jí)主機(jī),市級(jí)可建立下級(jí)縣用戶,各縣級(jí)臺(tái)站使用本臺(tái)站用戶可查看臺(tái)站內(nèi)主機(jī)運(yùn)行狀態(tài);省級(jí)還支持部門(mén)管理權(quán)限,各部門(mén)使用其賬戶登錄監(jiān)控平臺(tái),可查看本部門(mén)的主機(jī)運(yùn)行狀態(tài)。(5)告警管理。在界面中展示當(dāng)前告警,對(duì)嚴(yán)重告警需要有聲音提示和移動(dòng)端告警功能。具體查看全流程告警模塊。(6)事件臺(tái)。在定義事件時(shí),針對(duì)此事件定義告警規(guī)則。系統(tǒng)支持每次符合條件觸發(fā)、周期內(nèi)發(fā)生多次產(chǎn)生事件、周期內(nèi)一直產(chǎn)生事件,三種告警觸發(fā)策略。支持以占位符的方式靈活設(shè)置告警內(nèi)容,且能以郵件、系統(tǒng)消息、短信等多種方式來(lái)發(fā)布告警消息,通知相關(guān)人員,以便告警得到及時(shí)處理。
2 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
異構(gòu)的資源池的統(tǒng)一監(jiān)控基于分布式架構(gòu)實(shí)現(xiàn),通過(guò)云平臺(tái)接口模塊調(diào)用云API接口,采集云計(jì)算資源。對(duì)于服務(wù)器設(shè)備采用客戶端軟件,SNMP協(xié)議主要用在對(duì)網(wǎng)絡(luò)設(shè)備的監(jiān)控方面,如交換機(jī)、防火墻等。邏輯處理模塊負(fù)責(zé)將數(shù)據(jù)儲(chǔ)存在數(shù)據(jù)庫(kù)中,實(shí)現(xiàn)資源管理、時(shí)間管理和報(bào)警管理。最終通過(guò)Web前端展示,展示界面如圖1所示。
3 結(jié)語(yǔ)
本文設(shè)計(jì)了異構(gòu)資源池的統(tǒng)一監(jiān)控研究系統(tǒng),告別了傳統(tǒng)運(yùn)維管理針對(duì)不同的虛擬化服務(wù)和虛擬化設(shè)備需要采用各式工具集的繁瑣場(chǎng)景,使用一個(gè)統(tǒng)一的平臺(tái)就可以完成VMware虛擬機(jī)資源管理、KVM云平臺(tái)資源管理、基礎(chǔ)設(shè)施硬件監(jiān)控、基礎(chǔ)設(shè)施存儲(chǔ)管理、基礎(chǔ)設(shè)施網(wǎng)絡(luò)管理等工作。使得計(jì)算資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源得到高效復(fù)用,有力的支撐了我單位信息業(yè)務(wù)。
參考文獻(xiàn)
[1]楊光,謝銳,薛廣濤.私有云平臺(tái)資源監(jiān)控與優(yōu)化系統(tǒng)[J].計(jì)算機(jī)工程,2018,44(3):1-7.
[2]王笑宇,程良倫.云計(jì)算環(huán)境下動(dòng)態(tài)資源碎片管理機(jī)制[J].計(jì)算機(jī)應(yīng)用,2014,34(4):999-1004.
[3]劉鵬.基于OpenStack 的私有云部署和監(jiān)控技術(shù)的研究[D].北京:北京郵電大學(xué),2015.