李大瑋 王璐 劉鵬
【摘要】? ? 隨著血站業(yè)務(wù)的不斷發(fā)展,信息化水平不斷提高,血站網(wǎng)絡(luò)拓?fù)浜脱竟芾硇畔⑾到y(tǒng)越來(lái)越復(fù)雜,傳統(tǒng)的人工運(yùn)維巡檢方式由于故障發(fā)現(xiàn)滯后性已經(jīng)難以滿足血站業(yè)務(wù)發(fā)展對(duì)于系統(tǒng)穩(wěn)定性和可靠性的需求。青島市中心血站基于多年運(yùn)維管理經(jīng)驗(yàn),基于Zabbix開(kāi)源平臺(tái)配合二次開(kāi)發(fā)建立了自動(dòng)化運(yùn)維監(jiān)控平臺(tái),整合并關(guān)聯(lián)所有報(bào)警事件,實(shí)現(xiàn)了對(duì)全網(wǎng)的一體化監(jiān)控,并通過(guò)企業(yè)微信實(shí)時(shí)推送重要告警信息,有效提升運(yùn)維效率。
【關(guān)鍵詞】? ? Zabbix? ? 運(yùn)維? ? 監(jiān)控? ? 血站? ? 報(bào)警
一、背景分析
隨著血站業(yè)務(wù)的快速發(fā)展,支撐業(yè)務(wù)的血站網(wǎng)絡(luò)拓?fù)浜脱竟芾硇畔⑾到y(tǒng)越來(lái)越復(fù)雜。信息管理部門(mén)擔(dān)負(fù)著對(duì)IT基礎(chǔ)設(shè)施運(yùn)維的重要使命,核心任務(wù)是保障采供血業(yè)務(wù)的正常運(yùn)行,并提高軟硬件環(huán)境的交付質(zhì)量。血站業(yè)務(wù)的特殊性對(duì)業(yè)務(wù)系統(tǒng)的實(shí)時(shí)性要求高,但I(xiàn)T運(yùn)維人員在監(jiān)控機(jī)制、服務(wù)理念等幾個(gè)方面,仍然存在不少問(wèn)題,加之人員匱乏、缺少運(yùn)維監(jiān)控機(jī)制等,這些都有可能影響采供血業(yè)務(wù)的穩(wěn)定運(yùn)行。
二、血站IT運(yùn)維現(xiàn)狀
青島市中心血站現(xiàn)有物理服務(wù)器18臺(tái),實(shí)際運(yùn)行服務(wù)器數(shù)量42臺(tái)(含虛擬機(jī)),安全產(chǎn)品14臺(tái),各類網(wǎng)絡(luò)設(shè)備40余臺(tái),業(yè)務(wù)系統(tǒng)及各類支撐系統(tǒng)22個(gè),有業(yè)務(wù)網(wǎng)、省市兩級(jí)衛(wèi)生健康專網(wǎng)、獻(xiàn)血車(chē)移動(dòng)互聯(lián)VPDN、互聯(lián)網(wǎng)、虛擬化環(huán)境等,網(wǎng)絡(luò)環(huán)境極為復(fù)雜。雖然實(shí)施了一些網(wǎng)絡(luò)管理軟件,但是缺乏有效的手段和工具對(duì)系統(tǒng)運(yùn)行情況進(jìn)行監(jiān)督和預(yù)警,同時(shí)無(wú)法提供服務(wù)及應(yīng)用層面的故障信息,也無(wú)法提供及時(shí)準(zhǔn)確的信息預(yù)警。很多情況下,只能等到事件已經(jīng)發(fā)生并已造成業(yè)務(wù)影響時(shí)才能發(fā)現(xiàn)并著手處理,延誤了隱患的最佳處理時(shí)間,同時(shí)也使運(yùn)維工作處于被動(dòng)的狀態(tài)。
為解決目前IT運(yùn)維的困境,青島市中心血站基于開(kāi)源監(jiān)控軟件Zabbix并配合二次開(kāi)發(fā),建立了血站自動(dòng)化運(yùn)維監(jiān)控平臺(tái),整合企業(yè)微信實(shí)現(xiàn)報(bào)警信息實(shí)時(shí)推送,實(shí)現(xiàn)對(duì)服務(wù)器、網(wǎng)絡(luò)及安全設(shè)備、操作系統(tǒng)、數(shù)據(jù)庫(kù)、應(yīng)用狀態(tài)以及關(guān)鍵進(jìn)程進(jìn)行報(bào)警推送,取得了較好的成效。
三、基于Zabbix的自動(dòng)化運(yùn)維管理平臺(tái)
3.1 Zabbix簡(jiǎn)介
Zabbix是一個(gè)基于Web界面的提供分布式系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級(jí)的開(kāi)源解決方案。能監(jiān)視各種網(wǎng)絡(luò)參數(shù),保證服務(wù)器系統(tǒng)的安全運(yùn)營(yíng);并提供靈活的通知機(jī)制以讓系統(tǒng)管理員快速定位并解決存在的各種問(wèn)題。Zabbix主要有ZabbixServer和ZabbixAgent組成,除此之外還支持基于ZabbixProxy的擴(kuò)展(Zabbix體系結(jié)構(gòu)見(jiàn)圖1)。Zabbix支持基于Agent,SNMP,IPMI等多種形式實(shí)現(xiàn)對(duì)服務(wù)器、網(wǎng)絡(luò)設(shè)備、安全設(shè)備、數(shù)據(jù)庫(kù)、Web應(yīng)用乃至系統(tǒng)進(jìn)程的監(jiān)控,可以靈活設(shè)置監(jiān)控閾值,Zabbix提供了強(qiáng)大的二次開(kāi)發(fā)能力,用戶可以根據(jù)自己的需要靈活設(shè)置監(jiān)控項(xiàng)目。Zabbix還提供了第三方報(bào)警平臺(tái)的對(duì)接,支持通過(guò)郵件、短信以及釘釘、企業(yè)微信等第三方應(yīng)用的關(guān)聯(lián)報(bào)警。
3.2 Zabbix相比商業(yè)監(jiān)控系統(tǒng)的優(yōu)勢(shì)
同傳統(tǒng)商業(yè)監(jiān)控系統(tǒng)相比,Zabbix具有以下顯著優(yōu)勢(shì):
1.商業(yè)監(jiān)控軟件,產(chǎn)品費(fèi)用和維護(hù)成本高,存在license限制,Zabbix是一款完全開(kāi)源的監(jiān)控軟件,可以從網(wǎng)絡(luò)自行下載,沒(méi)有l(wèi)icense限制。
2.商業(yè)監(jiān)控軟件原生無(wú)法監(jiān)控各種新型應(yīng)用組件,需要廠家重新定制,使用和維護(hù)難度高,Zabbix提供了大量的通用模板提供了對(duì)于設(shè)備的支持,官方提供了模板銀行供使用者下載,對(duì)于個(gè)性化的需求,可以根據(jù)使用者需求自行定制模板。
3.商業(yè)軟件原廠的技術(shù)支持力度會(huì)因?yàn)樵瓘S戰(zhàn)略轉(zhuǎn)型等原因越來(lái)越弱,Zabbix作為一款開(kāi)源軟件,網(wǎng)上有大量的使用分享可供參考。
綜合上述原因,經(jīng)過(guò)長(zhǎng)期的調(diào)研和測(cè)試,青島市中心血站決定采用Zabbix開(kāi)源監(jiān)控系統(tǒng)來(lái)構(gòu)建新一代運(yùn)維監(jiān)控平臺(tái)。
3.3 自動(dòng)化運(yùn)維監(jiān)控系統(tǒng)設(shè)計(jì)
基于Zabbix監(jiān)控系統(tǒng)的特點(diǎn)和血站工作實(shí)際,我們采用了ZabbixServer-Agent模式實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)的全面監(jiān)控,具體功能實(shí)現(xiàn)如下:
1.網(wǎng)絡(luò)監(jiān)控:對(duì)于交換機(jī)、路由器、防火墻等網(wǎng)絡(luò)設(shè)備,主要采用SNMP協(xié)議進(jìn)行監(jiān)控,主要監(jiān)控其可用性、流量、CPU內(nèi)存使用率等。對(duì)于核心交換機(jī)、匯聚交換機(jī)、防火墻、路由器等核心網(wǎng)絡(luò)設(shè)備監(jiān)控期端口狀態(tài)和流量,對(duì)于接入層交換機(jī)由于終端運(yùn)行狀態(tài)差異性較大,不再監(jiān)控其端口狀態(tài)。
2.服務(wù)器監(jiān)控:對(duì)于服務(wù)器監(jiān)控,我們主要采用了Agent方式進(jìn)行監(jiān)控,在每臺(tái)服務(wù)器部署ZabbixAgent實(shí)現(xiàn)對(duì)服務(wù)器信息的采集,監(jiān)控項(xiàng)包括CPU負(fù)載、磁盤(pán)空間、網(wǎng)絡(luò)流量、內(nèi)存使用情況等系統(tǒng)正常運(yùn)行的基本指標(biāo)。
3. Web應(yīng)用監(jiān)控:對(duì)于Web應(yīng)用監(jiān)控只要采用http連接方式監(jiān)控其狀態(tài),監(jiān)控項(xiàng)包括程序啟動(dòng)時(shí)間、網(wǎng)站訪問(wèn)速度、是否可用、服務(wù)狀態(tài)等。
4.數(shù)據(jù)庫(kù)監(jiān)控:針對(duì)數(shù)據(jù)庫(kù)的監(jiān)控我們主要采用了使用腳本監(jiān)控的方式。通過(guò)自行編制腳本實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)的查詢,實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)可用性、狀態(tài)鎖、表空間使用情況的狀態(tài)監(jiān)控。
5.個(gè)性化監(jiān)控:Zabbix為我們提供了強(qiáng)大的二次開(kāi)發(fā)能力,我們可以根據(jù)自己實(shí)際工作需要定制監(jiān)控項(xiàng)目,滿足工作需求。青島市中心血站目前使用的業(yè)務(wù)系統(tǒng)為唐山啟奧科技股份有限公司開(kāi)發(fā)的ShinowV9.5系統(tǒng),該系統(tǒng)提供了一個(gè)任務(wù)計(jì)劃服務(wù)運(yùn)行每天的定時(shí)任務(wù),一旦該服務(wù)停止定時(shí)任務(wù)將無(wú)法執(zhí)行,通過(guò)Zabbix的個(gè)性化定制,實(shí)現(xiàn)了對(duì)該服務(wù)運(yùn)行狀態(tài)的監(jiān)控,一旦服務(wù)退出可立即觸發(fā)報(bào)警。除此之外,還通過(guò)個(gè)性化定制實(shí)現(xiàn)了對(duì)96606服務(wù)熱線主服務(wù)進(jìn)程、國(guó)家衛(wèi)健委采供血信息采集軟件的實(shí)時(shí)監(jiān)控,確保96606服務(wù)熱線的平穩(wěn)運(yùn)行和國(guó)家衛(wèi)健委采供血信息日?qǐng)?bào)的按時(shí)上報(bào)。
6.實(shí)時(shí)報(bào)警推送:設(shè)置觸發(fā)器,通過(guò)腳本直接調(diào)用企業(yè)微信API,將報(bào)警信息實(shí)時(shí)推送給相關(guān)人員,并按照各人分工不同實(shí)現(xiàn)差異化推送。
四、應(yīng)用效果
目前自動(dòng)化運(yùn)維監(jiān)控系統(tǒng)已接入服務(wù)器42臺(tái),網(wǎng)絡(luò)及安全設(shè)備51臺(tái),支持SNMP協(xié)議的網(wǎng)絡(luò)設(shè)備55臺(tái),監(jiān)控操作系統(tǒng)42臺(tái),數(shù)據(jù)庫(kù)7個(gè),Web應(yīng)用10余個(gè),總監(jiān)控項(xiàng)達(dá)17801項(xiàng),取得了較為理想的應(yīng)用效果。系統(tǒng)整合并關(guān)聯(lián)所有事件,將機(jī)房環(huán)境、網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫(kù)、應(yīng)用系統(tǒng)都納入了IT運(yùn)行監(jiān)控體系,及時(shí)推送報(bào)警信息,幫助運(yùn)維人員跟蹤并響應(yīng)報(bào)警事件(圖2報(bào)警事件示例),避免其影響業(yè)務(wù)的正常運(yùn)轉(zhuǎn)。
五、結(jié)束語(yǔ)
Zabbix是一種可以對(duì)各種數(shù)據(jù)中心監(jiān)控對(duì)象進(jìn)行狀態(tài)數(shù)據(jù)收集的監(jiān)控平臺(tái),實(shí)現(xiàn)了對(duì)機(jī)房環(huán)境、網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫(kù)、應(yīng)用系統(tǒng)等內(nèi)容的統(tǒng)一監(jiān)控和管理,具有分布式、自動(dòng)化、全方位監(jiān)控的特點(diǎn),讓運(yùn)維人員能夠快速定位并解決系統(tǒng)問(wèn)題,降低運(yùn)維的難度和風(fēng)險(xiǎn),提升IT運(yùn)維服務(wù)質(zhì)量和效率,為血站提供效率高、低成本的自動(dòng)化運(yùn)維監(jiān)控平臺(tái)。Zabbix也存在圖形界面比較簡(jiǎn)單可視化程度差,報(bào)表功能薄弱等缺點(diǎn),今后工作中還需不斷完善,建設(shè)更加全面、高效、智能、高度可視化的自動(dòng)化運(yùn)維平臺(tái)。
參? 考? 文? 獻(xiàn)
[1]程雪松.基于Zabbix的醫(yī)院自動(dòng)化運(yùn)維監(jiān)控平臺(tái)的設(shè)計(jì)與應(yīng)用[J].福建電腦,2018,34(9):126-127.
[2]劉遠(yuǎn)超,李樹(shù)彬.基于Zabbix和微信企業(yè)號(hào)實(shí)現(xiàn)網(wǎng)絡(luò)監(jiān)控的研究[J],山東科學(xué),2017,30(4):124-130
[3]龍煒.自動(dòng)化運(yùn)維工具在企業(yè)信息系統(tǒng)管理中的應(yīng)用[J].微型機(jī)與應(yīng)用,2017,36(5):102-104
[4]肖海琴.Zabbix性能監(jiān)控軟件在高性能集群上的應(yīng)用[J].中國(guó)管理信息化,2017,20(3):139
[5]郭曉慧,李潤(rùn)知,張茜,等.基于Zabbix的分布式服務(wù)器監(jiān)控應(yīng)用研究[J].通信學(xué)報(bào),2013(S2):94-98.
[6]楊磊.基于Zabbix的云監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].成都:電子科技大學(xué),2017.
[7]吳兆松.Zabbix企業(yè)級(jí)分布式監(jiān)控系統(tǒng)[M].北京:電子工業(yè)出版社,2014.
[8]劉思堯.基于ZABBIX的自動(dòng)化巡檢系統(tǒng)的研究與實(shí)現(xiàn)[J].電力信息與通信技術(shù),2014(12):111-115.
[9]周萌,林國(guó)策,楊厚云.CentOS下ZABBIX的配置與使用[J].北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2015(1):90-94.
[10]王紹成,史磊.公安網(wǎng)絡(luò)智能巡檢系統(tǒng)的研究與思考[J].科技展望,2016(10):302.
[11]周昊.利用Zabbix和企業(yè)微信實(shí)現(xiàn)公安監(jiān)控網(wǎng)絡(luò)的自動(dòng)化運(yùn)維.中國(guó)有線電視,2017(11):1324-1325