田夏利,熊 瑩
(武漢理工大學華夏學院,湖北武漢430223)
本地網(wǎng)網(wǎng)優(yōu)性能實時監(jiān)控系統(tǒng)的構(gòu)建
田夏利,熊 瑩
(武漢理工大學華夏學院,湖北武漢430223)
提出了一個網(wǎng)絡優(yōu)化監(jiān)控中心的構(gòu)建方案,本系統(tǒng)采用現(xiàn)代計算機信息技術(shù)、先進可靠的系統(tǒng)平臺和穩(wěn)定高效的應用軟件,建立通訊功能強、操作界面直觀方便,集BSC監(jiān)控管理、基站監(jiān)控管理、小區(qū)監(jiān)控管理、故障告警統(tǒng)計、實時告警智能排障處理、自動巡查檢測基站運行狀況、自動檢測小區(qū)性能狀態(tài)指標、告警前轉(zhuǎn)、自動故障派單等若干先進功能于一體的現(xiàn)代化計算機局域網(wǎng)系統(tǒng).
網(wǎng)絡優(yōu)化;實時監(jiān)控;告警處理
武漢(移動)本地網(wǎng)網(wǎng)優(yōu)中心目前在網(wǎng)絡優(yōu)化方面?zhèn)戎赜趯υO備運行情況和運行性能的監(jiān)控,無法準確反映客戶使用網(wǎng)絡通信時對網(wǎng)絡質(zhì)量的實際感知情況.目前主要采取手動搜告警的方法對TCH掉話和擁塞進行實時查看,對全網(wǎng)基站的性能監(jiān)控工作量極為巨大,人工監(jiān)控相對困難,有時甚至會遺漏一些重要的告警,所以我們需要實現(xiàn)網(wǎng)絡性能告警自動化.即可以實時地對網(wǎng)絡的運行狀態(tài)進行監(jiān)視,對網(wǎng)絡優(yōu)化關(guān)鍵性能指標的實時檢測和對特定事件的記錄,對超出門限值的指標應予告警等.
通過本系統(tǒng)建立武漢本地網(wǎng)網(wǎng)絡優(yōu)化監(jiān)控中心.系統(tǒng)的實時監(jiān)控模塊除監(jiān)控到小區(qū)級的用戶感知告警外,還為維護人員建立健全實時、準確、實用、方便的符合武漢本地網(wǎng)特點的小區(qū)性能監(jiān)控、維護手段,把維護人員從繁重的重復勞動中解放出來,把有限的精力投入到更高層次的網(wǎng)絡優(yōu)化工作中去.同時,系統(tǒng)的各類統(tǒng)計報表模塊為各級領(lǐng)導提供網(wǎng)絡擴容、網(wǎng)絡優(yōu)化、基站建設方面的決策支持.
系統(tǒng)總體框架——軟件模型
武漢本地網(wǎng)網(wǎng)優(yōu)性能監(jiān)控系統(tǒng)技術(shù)需求有如下特點:適應業(yè)務的變化、適應網(wǎng)絡的變化、適應應用報表的變化、網(wǎng)絡資源的安全性、大容量數(shù)據(jù)存儲處理等.因此我們建議的系統(tǒng)軟件模型采用三層客戶機/應用服務器/數(shù)據(jù)庫模式(C/AS/DS),同時引入數(shù)據(jù)倉庫技術(shù).系統(tǒng)總體框架如下圖所示:
采用三層C/AS/DS結(jié)構(gòu),形成了業(yè)務表現(xiàn)層、業(yè)務管理層、數(shù)據(jù)采集管理層三個層次,降低了數(shù)據(jù)庫服務器的負擔;同時在業(yè)務管理層實現(xiàn)了用戶管理等業(yè)務功能,使得在業(yè)務變化時,只需在本層調(diào)整相關(guān)構(gòu)件,大大提高了系統(tǒng)的可管理性、可擴展性;三層C/AS/DS結(jié)構(gòu)在系統(tǒng)的安全性方面也較二層C/S結(jié)構(gòu)有重大的提高,使得對權(quán)限的管理從數(shù)據(jù)級的控制上升到業(yè)務功能級的控制;另外,三層C/AS/DS結(jié)構(gòu)更適合在分布式廣域網(wǎng)環(huán)境下運行,便于以后系統(tǒng)的擴展、升級.同時在業(yè)務邏輯層使用了多線程技術(shù)來提高系統(tǒng)的處理能力.
根據(jù)選用的軟件模型,系統(tǒng)采用嚴格的分層設計思想,構(gòu)建了網(wǎng)優(yōu)數(shù)據(jù)適配層、業(yè)務處理層以及上層應用等三個邏輯層次,程序處理與邏輯處理分離技術(shù),每個邏輯層都有相應的基礎(chǔ)模塊.
數(shù)據(jù)采集層主要通過多線程實時監(jiān)控硬件設備的使用狀態(tài),完成數(shù)據(jù)的動態(tài)采集,業(yè)務邏輯層對數(shù)據(jù)通過映射、變形、匯總、分析、保存、轉(zhuǎn)發(fā)等提交到上一層,應用層主要是對客戶前端發(fā)出的請求數(shù)據(jù)或業(yè)務邏輯層轉(zhuǎn)發(fā)數(shù)據(jù)進行相應的處理并呈現(xiàn).
在業(yè)務邏輯層的描述中,我們將業(yè)務邏輯和業(yè)務操作分離開來.所以在業(yè)務操作請求與具體的業(yè)務操作之間需要一個映射層,而且由于業(yè)務操作的分散性和數(shù)據(jù)格式的多樣性,該層還需要保障信息可靠傳遞和轉(zhuǎn)換不同數(shù)據(jù)格式的功能.
業(yè)務操作是業(yè)務邏輯的基礎(chǔ).業(yè)務操作層的作用是把業(yè)務請求轉(zhuǎn)化為一個個具體的數(shù)據(jù)操作.我們通過將業(yè)務中一個具體操作轉(zhuǎn)化為一個響應的應用邏輯,從而將業(yè)務操作的請求和數(shù)據(jù)源分離.
告警管理模塊
該模塊為系統(tǒng)核心模塊之一,包括告警采集、分析、入庫、發(fā)布、前轉(zhuǎn)等子模塊.該模塊普遍采用多線程技術(shù),各子模塊都由一組獨立的線程組成,系統(tǒng)自動調(diào)整各線程組的線程數(shù)量,以使服務器達到最佳性能.各子模塊相互關(guān)系如下:
告警采集:采用多線程技術(shù)同時連接20個BSC,采集各類告警數(shù)據(jù),包括A1告警、A2告警、各類性能告警.接收線程收到數(shù)據(jù)后將實時反饋給服務器的告警分析線程,讓告警轉(zhuǎn)入后續(xù)處理過程.
告警分析:根據(jù)用戶定義的規(guī)則分析高進采集線程反饋的數(shù)據(jù),產(chǎn)生其他模塊能夠理解的xml格式的告警信息,包括告警報告號、告警網(wǎng)元、告警基站、告警小區(qū)、告警級別、產(chǎn)生時間、告警標題、告警正文等信息,如果是小區(qū)告警,系統(tǒng)還需分析出告警MO、ALARM SLOGAN等信息.同時該子模塊還維護各BSC的活躍告警列表,以減少對數(shù)據(jù)庫的直接操作,提升數(shù)據(jù)庫服務器的整體性能.告警分析完成后將轉(zhuǎn)入入庫、發(fā)布、前站等流程.
告警入庫:告警入庫線程組根據(jù)告警分析線程分析出的告警列表,將新產(chǎn)生的告警插入數(shù)據(jù)庫相關(guān)數(shù)據(jù)表中,當告警消除時在數(shù)據(jù)庫中做相應標記并記錄消除時間.
告警發(fā)布:告警發(fā)布程序負責把分析過的告警數(shù)據(jù)發(fā)送到客戶端,由客戶端完成告警的顯示及聲光提示等功能.告警發(fā)布線程組的線程數(shù)量跟當前聯(lián)機的客戶端數(shù)量一致,即一個線程管理一個監(jiān)控客戶端的告警發(fā)布.
告警前轉(zhuǎn):通過本系統(tǒng)的短信網(wǎng)關(guān)接口模塊,告警前轉(zhuǎn)模塊根據(jù)前轉(zhuǎn)規(guī)則配置將符合前轉(zhuǎn)條件的告警信息(一般為重大告警)發(fā)送到相應的手機上,提醒維護人員及時處理.
網(wǎng)優(yōu)經(jīng)驗管理模塊
系統(tǒng)提供網(wǎng)絡優(yōu)化經(jīng)驗管理機制,用戶可針對各類告警填寫處理步驟及每個步驟的含義,一方面實現(xiàn)維護經(jīng)驗的積累,另一方面,當障礙發(fā)生時系統(tǒng)會搜索經(jīng)驗庫,并作為建議恢復方法顯示在用戶操作界面中,供用戶參考.
命令代理模塊
系統(tǒng)提供命令代理機制,整個系統(tǒng)中只有服務器連接網(wǎng)元,保證所有命令都只從服務器發(fā)出,客戶端不直接向網(wǎng)元發(fā)送任何命令;同時服務器建立授權(quán)命令列表,提供命令審核機制,該審核機制只允許經(jīng)授權(quán)的、特定的、安全的、不對網(wǎng)元造成影響的命令通過,保證交換機的安全性;另外,當有成批命令發(fā)往網(wǎng)元時,系統(tǒng)提供暫緩執(zhí)行的保護機制,降低系統(tǒng)給網(wǎng)元帶來的負荷.系統(tǒng)還提供命令記錄、查詢機制,對發(fā)往網(wǎng)元的命令記錄詳細的日志,以備用戶事后查詢.
EOMS接口模塊
系統(tǒng)提供與EOMS系統(tǒng)的接口,并可根據(jù)用戶配置的規(guī)則生成故障工單自動發(fā)送給相關(guān)部門或相關(guān)人員,無需人工干預,規(guī)范了障礙處理流程,加快了障礙處理速度,減少維護人員工作量.
智能排障:系統(tǒng)提供智能化的、可配置的自動排障機制:用戶可根據(jù)特定障礙的處理流程撰寫障礙處理腳本,當告警發(fā)生時系統(tǒng)執(zhí)行相應的腳本,向網(wǎng)元發(fā)送障礙恢復命令,自動處理并恢復障礙,達到無需人工干預即自動恢復障礙的目的,一方面減少了維護人員的工作量,另一方面極大的提高了障礙處理效率,縮短了障礙恢復時間.
系統(tǒng)自帶一定的處理腳本,經(jīng)培訓后,用戶可以自行編制這種腳本,經(jīng)過不斷的積累,系統(tǒng)會變的越來越“聰明”、越來越人性化,需要人工處理的障礙會越來越少,維護人員的重復勞動工作量也會越來越少.
TCH擁塞、掉話監(jiān)控模塊
系統(tǒng)根據(jù)用戶設定的采集頻率7×24小時自動采集各小區(qū)的TCH擁塞、掉話數(shù)據(jù),記錄在數(shù)據(jù)庫中,并按用戶設定的門限值產(chǎn)生相應告警發(fā)送到客戶端,通過GIS系統(tǒng)在客戶端進行準確的圖形化再現(xiàn);同時客戶端程序也提供列表化的呈現(xiàn)方式,將告警統(tǒng)一呈現(xiàn)在表格中,并提供簡捷實用的過濾方法方便用戶查看告警.系統(tǒng)每天自動產(chǎn)生《TCH擁塞率超標小區(qū)排名表》、《TCH可用率不足小區(qū)排名表》、《TCH掉話率超標小區(qū)排名表》等報表,方便維護人員進行網(wǎng)絡優(yōu)化.
話務量異常管理模塊
系統(tǒng)自動保存30天每小時每小區(qū)的話務量,以上周同一時段的平均話務量為標準,如果當日該時段的話務量高于或低于該標準的40%則產(chǎn)生告警,時間以小時為單位.
本文闡述了一種擴展性好、功能全面、運行穩(wěn)定的網(wǎng)絡性能監(jiān)控系統(tǒng).提出了層次化、模塊化的系統(tǒng)設計模型,描述了各模塊的實現(xiàn)方法.通過開發(fā)實時監(jiān)控告警系統(tǒng)以后,起到對網(wǎng)絡系統(tǒng)的監(jiān)測和控制.隨著它的誕生,業(yè)務信息系統(tǒng)的運行搭建了統(tǒng)一的管理平臺,從而減少了人工維護的成本,提高了數(shù)據(jù)管理的效率,使業(yè)務得到了集中,技術(shù)風險的可控性提高.
〔1〕陳蕊.移動通信機房設備故障集中監(jiān)控探討[J].科技探索,2011(10).
〔2〕劉進軍,趙生慧,等.可擴展的網(wǎng)絡性能監(jiān)控系統(tǒng)[J].計算機工程與設計,2010,31(10).
TN919.2
A
1673-260X(2013)09-0133-02
華夏學院科研基金資助項目“面向用戶的網(wǎng)絡性能實時告警系統(tǒng)”(HX 20120201),(湖北移動通信有限責任公司武漢運維中心“武漢本地網(wǎng)網(wǎng)優(yōu)性能監(jiān)控系統(tǒng)工程”,合同號:ZHIYUAN 200506)