摘 要:隨著計(jì)算機(jī)信息技術(shù)的快速發(fā)展,近年來(lái)IT系統(tǒng)規(guī)模持續(xù)擴(kuò)大已經(jīng)成為我國(guó)各類企業(yè)的常態(tài),基于此,本文首先分析了IT系統(tǒng)一體化運(yùn)維監(jiān)控及服務(wù)預(yù)警平臺(tái)的建設(shè)需求,并詳細(xì)論述了該平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)思路,希望由此能夠?yàn)橄嚓P(guān)業(yè)內(nèi)人士帶來(lái)一定啟發(fā)。
關(guān)鍵詞:IT系統(tǒng);運(yùn)維監(jiān)控;預(yù)警平臺(tái)
中圖分類號(hào):TP311.5 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004-7344(2018)26-0326-01
前 言
資料信息分散、設(shè)備缺乏統(tǒng)一監(jiān)控平臺(tái)、缺乏運(yùn)行健康情況評(píng)估手段和預(yù)警措施均屬于較為常見(jiàn)的IT系統(tǒng)運(yùn)與發(fā)展問(wèn)題,隨著企業(yè)IT系統(tǒng)規(guī)模的不斷擴(kuò)大,這類問(wèn)題帶來(lái)的負(fù)面影響也往往隨之增長(zhǎng),而為了盡可能解決這類問(wèn)題,正是本文圍繞IT系統(tǒng)一體化運(yùn)維監(jiān)控及服務(wù)預(yù)警平臺(tái)開(kāi)展具體研究的原因所在。
1 建設(shè)需求
1.1 監(jiān)測(cè)IT系統(tǒng)運(yùn)行
結(jié)合我國(guó)現(xiàn)階段企業(yè)IT系統(tǒng)面臨的普遍性問(wèn)題,本文研究的運(yùn)維監(jiān)控及服務(wù)預(yù)警平臺(tái)需首先滿足IT系統(tǒng)的運(yùn)行監(jiān)測(cè)需要,這一需要的滿足需關(guān)注IT系統(tǒng)監(jiān)控、故障處理、健康運(yùn)行報(bào)告生成、運(yùn)行事件響應(yīng)等功能的集成,企業(yè)IT系統(tǒng)的業(yè)務(wù)連續(xù)性、健康度由此即可得到較好保障。為真正實(shí)現(xiàn)IT系統(tǒng)運(yùn)行的監(jiān)測(cè),平臺(tái)必須采用高效穩(wěn)定安全的檢測(cè)工作,同時(shí)還需要關(guān)注IT系統(tǒng)核心內(nèi)容的全流程監(jiān)控、監(jiān)控結(jié)果的可視化展示、大屏集中式告警,故障點(diǎn)快速定位也應(yīng)成為平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)所關(guān)注的焦點(diǎn)[1]。
1.2 保障業(yè)務(wù)連續(xù)性
隨著大數(shù)據(jù)、云計(jì)算等技術(shù)的不斷完善,我國(guó)企業(yè)的信息化進(jìn)程不斷加快,IT技術(shù)與業(yè)務(wù)的融合已經(jīng)成為很多企業(yè)的常態(tài),企業(yè)的穩(wěn)定運(yùn)行、長(zhǎng)期可持續(xù)發(fā)展實(shí)現(xiàn)也需要得到IT系統(tǒng)的支持,因此IT系統(tǒng)的業(yè)務(wù)連續(xù)性保障理應(yīng)成為本文研究平臺(tái)的建設(shè)需求之一。在筆者的實(shí)際調(diào)研中發(fā)現(xiàn),相較于IT基礎(chǔ)設(shè)施故障,各類業(yè)務(wù)系統(tǒng)故障的發(fā)生更為頻繁,因此平臺(tái)建設(shè)需同時(shí)關(guān)注IT系統(tǒng)的業(yè)務(wù)運(yùn)行層、應(yīng)用系統(tǒng)層、基礎(chǔ)設(shè)施層,以此更好為IT系統(tǒng)業(yè)務(wù)連續(xù)性保障提供支持。
1.3 管理業(yè)務(wù)容量
平臺(tái)還需要具備管理業(yè)務(wù)容量的能力,該能力需通過(guò)分析工作負(fù)載、調(diào)整業(yè)務(wù)系統(tǒng)容量、調(diào)整業(yè)務(wù)時(shí)間實(shí)現(xiàn)IT系統(tǒng)的高水準(zhǔn)運(yùn)行,由此將單一、零散的業(yè)務(wù)數(shù)據(jù)進(jìn)行趨勢(shì)化整理,IT系統(tǒng)也將為企業(yè)運(yùn)行發(fā)展提供更有力支持,業(yè)務(wù)的處理性能、處理量、各資源使用狀況同樣屬于平臺(tái)所關(guān)注的重點(diǎn)。
2 設(shè)計(jì)與實(shí)現(xiàn)
2.1 平臺(tái)技術(shù)架構(gòu)
為保證IT系統(tǒng)一體化運(yùn)維監(jiān)控及服務(wù)預(yù)警平臺(tái)能夠真正實(shí)現(xiàn)應(yīng)用系統(tǒng)、安全產(chǎn)品、網(wǎng)絡(luò)設(shè)備、計(jì)算機(jī)設(shè)備網(wǎng)上行為及運(yùn)行狀況的集中監(jiān)控,并同時(shí)實(shí)現(xiàn)各類設(shè)備的全面集中統(tǒng)一管理,平臺(tái)必須具備快速發(fā)現(xiàn)設(shè)備異常情況、快速定位故障并自動(dòng)形成“工單”的能力,因此平臺(tái)采用了三層架構(gòu)設(shè)計(jì),數(shù)據(jù)使用層、數(shù)據(jù)處理層、數(shù)據(jù)采集層將通過(guò)相互配合賦予平臺(tái)事件告警、實(shí)時(shí)數(shù)據(jù)/故障診斷、歷史數(shù)據(jù)分析等功能,而在管理控制臺(tái)支持下,整個(gè)平臺(tái)可實(shí)現(xiàn)各個(gè)層面的全方位配置管理,具體平臺(tái)構(gòu)成如下所示:①數(shù)據(jù)使用層。數(shù)據(jù)使用層也可以被稱作展現(xiàn)層,IT系統(tǒng)監(jiān)測(cè)數(shù)據(jù)查詢、健康度巡檢報(bào)表、全局視圖屬于數(shù)據(jù)使用層的主要構(gòu)成,其中IT系統(tǒng)監(jiān)測(cè)數(shù)據(jù)查詢可通過(guò)日期、關(guān)鍵字查詢IT系統(tǒng)歷史運(yùn)行情況,健康度巡檢報(bào)表則能夠通過(guò)重要設(shè)備、業(yè)務(wù)視圖、告警統(tǒng)計(jì)、邏輯拓?fù)渲庇^展示系統(tǒng)健康程度,全局視圖則能夠?qū)崟r(shí)展示IT系統(tǒng)的監(jiān)視與告警情況,同時(shí)全局視圖所展示的信息還會(huì)自動(dòng)記錄于事件管理平臺(tái)。②數(shù)據(jù)處理層。數(shù)據(jù)處理層的功能實(shí)現(xiàn)需得到相應(yīng)的性能指標(biāo)集支持,這里的性能指標(biāo)集構(gòu)建需結(jié)合監(jiān)控對(duì)象特點(diǎn)及運(yùn)維管理需要,由此圍繞測(cè)量頻度、預(yù)警閡值、計(jì)算方法、數(shù)據(jù)來(lái)源、測(cè)量范圍等參數(shù)構(gòu)建性能指標(biāo)集,即可實(shí)時(shí)監(jiān)測(cè)、分析IT系統(tǒng)性能,如發(fā)現(xiàn)系統(tǒng)出現(xiàn)超出預(yù)警閡值狀況,數(shù)據(jù)處理層將傳遞相應(yīng)信息至數(shù)據(jù)使用層。③數(shù)據(jù)采集層。作為平臺(tái)的最底層,數(shù)據(jù)采集層主要負(fù)責(zé)故障數(shù)據(jù)、性能數(shù)據(jù)的采集,采集的實(shí)現(xiàn)需得到Agent部署、NSMP協(xié)議的支持,同時(shí)數(shù)據(jù)采集層還具備被動(dòng)接收采集指令功能,平臺(tái)的后續(xù)分析、數(shù)據(jù)挖掘?qū)崿F(xiàn)由此即可得到保障[2]。
2.2 平臺(tái)功能架構(gòu)
結(jié)合IT系統(tǒng)一體化運(yùn)維監(jiān)控及服務(wù)預(yù)警平臺(tái)的建設(shè)需求,平臺(tái)選擇了基于松藕合的體系架構(gòu),同時(shí)結(jié)合了云計(jì)算技術(shù)賦予結(jié)構(gòu)部署靈活性,靈活模塊化組裝也將由此實(shí)現(xiàn),而為了更好賦予平臺(tái)“監(jiān)控、管理、管控”的協(xié)同處理能力,平臺(tái)功能架構(gòu)由統(tǒng)一訪問(wèn)門戶、集中監(jiān)控管理中心、事件與性能管理平臺(tái)、資源與指標(biāo)管理平臺(tái)、運(yùn)維管理中心組成,具體組成如下所示:①統(tǒng)一訪問(wèn)門戶。個(gè)人工作臺(tái)、消息中心、個(gè)性化定制、大屏展示、用戶權(quán)限管理、綜合視圖屬于統(tǒng)一訪問(wèn)門戶的主要功能模塊構(gòu)成,由此即可為不同用戶提供針對(duì)性的輔助工具,滿足其個(gè)性化使用需要與權(quán)限分級(jí)需要。②集中監(jiān)控管理中心。綜合展示、綜合分析、綜合報(bào)表、預(yù)警管理、告警管理、模型管理屬于其主要功能模塊,流量、拓?fù)?、?bào)表、性能等信息可由此實(shí)現(xiàn)多樣化展示。③事件與性能管理平臺(tái)、事件壓縮、事件過(guò)濾、告警策略、告警處理、性能壓縮、性能過(guò)濾屬于該平臺(tái)的主要功能模塊,采集信息將由此實(shí)現(xiàn)初步處理。④資源與指標(biāo)管理平臺(tái)。模型管理、資源管理、自動(dòng)發(fā)信、拓?fù)湔宫F(xiàn)、模型管理、數(shù)據(jù)管理、定義管理屬于平臺(tái)主要功能模塊,事件的統(tǒng)一處理將由此得以實(shí)現(xiàn)。⑤運(yùn)維管理中心。服務(wù)臺(tái)、計(jì)劃作業(yè)、任務(wù)管理、自助服務(wù)、故障管理、變更管理等屬于其主要功能模塊構(gòu)成,資源的高效利用和綜合管理將由此實(shí)現(xiàn)。
3 結(jié) 論
綜上所述,IT系統(tǒng)一體化運(yùn)維監(jiān)控及服務(wù)預(yù)警平臺(tái)具備較高推廣潛力,在此基礎(chǔ)上,本文涉及的平臺(tái)技術(shù)架構(gòu)、平臺(tái)功能架構(gòu)內(nèi)容,則提供了可行性較高的平臺(tái)建設(shè)路徑建議,而為了進(jìn)一步提升該平臺(tái)性能,各類新技術(shù)的應(yīng)用探索需得到關(guān)注。
參考文獻(xiàn)
[1]狄 剛.國(guó)家級(jí)“一帶一路”投資平臺(tái)信息化頂層設(shè)計(jì)的回顧與思考[J].金融發(fā)展評(píng)論,2018,02:1~8.
[2]陳志勇,李忠富,李 環(huán).基于動(dòng)態(tài)環(huán)境監(jiān)測(cè)系統(tǒng)的新能源變電站管理方法的改進(jìn)與創(chuàng)新研究[J].環(huán)境科學(xué)與管理,2018,4301:181~186.
收稿日期:2018-8-9