王洋 ,滿毅 ,陳志鵬
(1.中國(guó)移動(dòng)通信集團(tuán)山西有限公司網(wǎng)絡(luò)部網(wǎng)絡(luò)管理中心,山西 太原 030009;2.億陽(yáng)信通股份有限公司,北京 100093)
基于集中監(jiān)控?cái)?shù)據(jù)資源的4G基站退服故障預(yù)警模型
王洋1,滿毅2,陳志鵬2
(1.中國(guó)移動(dòng)通信集團(tuán)山西有限公司網(wǎng)絡(luò)部網(wǎng)絡(luò)管理中心,山西 太原 030009;2.億陽(yáng)信通股份有限公司,北京 100093)
4G無(wú)線基站設(shè)備是直接影響信息通信網(wǎng)絡(luò)用戶服務(wù)質(zhì)量的重要環(huán)節(jié),而4G無(wú)線基站退服故障將直接阻斷用戶正常通信。針對(duì)上述問(wèn)題,基于集中監(jiān)控告警消息數(shù)據(jù)資源通過(guò)關(guān)聯(lián)規(guī)則挖掘和時(shí)間追溯推演分析,實(shí)現(xiàn)了4G基站退服故障的短期預(yù)警?;诩斜O(jiān)控設(shè)備性能數(shù)據(jù)資源通過(guò)網(wǎng)元分類(數(shù)據(jù)清洗、特征篩選、網(wǎng)元聚類)、指標(biāo)降維(按簇分組、主成分分析)、主成分表達(dá)式與退服故障關(guān)聯(lián)分析、性能指標(biāo)選取及閾值分析實(shí)現(xiàn)了4G基站退服故障長(zhǎng)期預(yù)警,經(jīng)測(cè)試可準(zhǔn)確預(yù)測(cè)次月27.8%的4G基站設(shè)備退服故障。
信息通信網(wǎng)絡(luò);集中故障管理;集中監(jiān)控;網(wǎng)絡(luò)運(yùn)維數(shù)據(jù)資源;基站退服;故障預(yù)警
4G無(wú)線基站是4G移動(dòng)通信網(wǎng)的末端接入設(shè)備,其運(yùn)行狀態(tài)不僅影響了信息通信網(wǎng)絡(luò)的服務(wù)能力,而且直接關(guān)系到了客戶服務(wù)質(zhì)量和客戶滿意度。4G無(wú)線基站退服(out of service)故障作為影響網(wǎng)絡(luò)服務(wù)質(zhì)量的嚴(yán)重故障,一直是網(wǎng)絡(luò)監(jiān)控關(guān)注點(diǎn)和網(wǎng)絡(luò)運(yùn)維技術(shù)難點(diǎn)[1]。基站退服,即基站退出服務(wù),該故障將直接導(dǎo)致該基站所覆蓋范圍內(nèi)通信信號(hào)嚴(yán)重變?nèi)趸蛘咧袛?,進(jìn)而嚴(yán)重影響用戶的正常通信服務(wù),導(dǎo)致基站退服故障的主要原因包括傳輸故障、載頻故障、天饋故障和外部因素(如市電/蓄電池停電、高溫水浸)等。
在傳統(tǒng)網(wǎng)絡(luò)監(jiān)控模式通常采用事中監(jiān)測(cè)(對(duì)網(wǎng)絡(luò)告警變化和網(wǎng)絡(luò)指標(biāo)異動(dòng)實(shí)施7×24 h實(shí)時(shí)監(jiān)控派單和故障閉環(huán)管理)和事后分析(深度分析故障原因,共享運(yùn)維經(jīng)驗(yàn),降低重復(fù)發(fā)生風(fēng)險(xiǎn))方式,而傳統(tǒng)網(wǎng)絡(luò)監(jiān)控模式在主動(dòng)發(fā)現(xiàn)和快速響應(yīng)等方面仍然略顯不足。因此,基于通信網(wǎng)絡(luò)集中監(jiān)控?cái)?shù)據(jù)資源和數(shù)據(jù)挖掘算法形成故障事前預(yù)警,將網(wǎng)絡(luò)監(jiān)控?cái)?shù)據(jù)資源(網(wǎng)絡(luò)告警消息數(shù)據(jù)、網(wǎng)絡(luò)性能指標(biāo)數(shù)值)轉(zhuǎn)化為網(wǎng)絡(luò)運(yùn)維數(shù)據(jù)價(jià)值,進(jìn)而形成智能網(wǎng)絡(luò)運(yùn)維新模式,如圖1所示。
4G基站退服故障預(yù)警模型包括4G基站退服故障短期預(yù)警模型(即退服短期預(yù)警)和4G基站退服故障長(zhǎng)期預(yù)警模型(即退服長(zhǎng)期預(yù)警)。退服短期預(yù)警模型主要用于網(wǎng)絡(luò)維護(hù)資源調(diào)度、用戶投訴快速響應(yīng)[2]等方面;退服長(zhǎng)期預(yù)警模型主要用于動(dòng)態(tài)定點(diǎn)巡檢、網(wǎng)優(yōu)指標(biāo)診斷(故障工單)等方面。
4G基站退服故障短期預(yù)警模型是利用信息通信網(wǎng)絡(luò)告警消息數(shù)據(jù)資源,采用了Apriori算法和FP-Growth算法獲得關(guān)聯(lián)規(guī)則,將4G基站退服故障告警消息數(shù)據(jù)及其關(guān)聯(lián)告警消息數(shù)據(jù)進(jìn)行追溯時(shí)間推演分析,最終獲得時(shí)間推演概率分布模型。
Apriori算法流程可歸納為以下步驟[3]。
(1)分析頻繁項(xiàng)集,即從全量數(shù)據(jù)庫(kù)迭代獲取不小于預(yù)設(shè)最小支持計(jì)數(shù)閾值的所有項(xiàng)集(連接、剪枝、枚舉)。
(2)獲取強(qiáng)關(guān)聯(lián)規(guī)則,即基于最小支持度和最小置信度標(biāo)準(zhǔn)從已分析獲取的頻繁項(xiàng)集中提煉關(guān)聯(lián)規(guī)則。
FP-Growth算法較Apriori算法而言,不是首先生成候選項(xiàng)集,然后統(tǒng)計(jì)計(jì)算是否頻繁的“項(xiàng)集生成—頻繁評(píng)估”的方式。FP-Growth算法流程如下[4]:將項(xiàng)集數(shù)據(jù)逐個(gè)讀入并按照支持度進(jìn)行降序排序,將排序后的項(xiàng)集逐個(gè)映射至一棵以 null為根節(jié)點(diǎn)的頻繁模式樹(shù) (frequent pattern-tree,F(xiàn)P-tree),在每個(gè)節(jié)點(diǎn)處記錄該節(jié)點(diǎn)出現(xiàn)的支持度,最后輸出滿足最小支持度的頻繁模式。將群體智能[5]、負(fù)載均衡策略[6]、多叉樹(shù)結(jié)構(gòu)存儲(chǔ)[7]等方法與上述經(jīng)典關(guān)聯(lián)規(guī)則挖掘算法思想相結(jié)合,可進(jìn)一步提升關(guān)聯(lián)規(guī)則挖掘效率。
選取某地市30天4G基站退服相關(guān)專業(yè)告警消息數(shù)據(jù)(含無(wú)線專業(yè)、傳輸專業(yè)、交換專業(yè)、動(dòng)力環(huán)境專業(yè))分別從全專業(yè)(全網(wǎng)級(jí))、單專業(yè)(專業(yè)級(jí))、單網(wǎng)元(設(shè)備級(jí))3個(gè)維度進(jìn)行關(guān)聯(lián)關(guān)系挖掘分析。
·全專業(yè)(全網(wǎng)級(jí)):全專業(yè)關(guān)聯(lián)規(guī)則表征了4G基站退服故障與各專業(yè)告警之間的關(guān)聯(lián)關(guān)系,該關(guān)聯(lián)規(guī)則將信息通信網(wǎng)絡(luò)中所隱藏的專業(yè)之間的鏈路連接、數(shù)據(jù)配置、業(yè)務(wù)邏輯層面關(guān)系顯性化,實(shí)現(xiàn)了全程全網(wǎng)的網(wǎng)絡(luò)監(jiān)管支撐手段。
·單專業(yè)(設(shè)備級(jí)):?jiǎn)螌I(yè)關(guān)聯(lián)規(guī)則表征了專業(yè)內(nèi)設(shè)備之間的故障消息傳播機(jī)理,該關(guān)聯(lián)規(guī)則可指導(dǎo)專業(yè)維護(hù)人員對(duì)4G基站退服故障影響范圍和排障定位的分析處理。
·單網(wǎng)元(板卡級(jí)):?jiǎn)尉W(wǎng)元關(guān)聯(lián)規(guī)則表征了設(shè)備內(nèi)部消息的工作機(jī)制,由于消息傳遞屬于板卡級(jí)連接方式,因此,單網(wǎng)元關(guān)聯(lián)規(guī)則中的告警消息傳遞迅速敏感。
圖1 智能網(wǎng)絡(luò)運(yùn)維新模式
以單網(wǎng)元(板卡級(jí))為例,選擇某地市60天4G基站全量告警消息數(shù)據(jù)并對(duì)告警數(shù)據(jù)按照其對(duì)應(yīng)的網(wǎng)元名稱進(jìn)行第1次告警消息數(shù)據(jù)分組,然后各組告警消息數(shù)據(jù)以10 min時(shí)間窗口進(jìn)行第2次告警消息數(shù)據(jù)分組;通過(guò)關(guān)聯(lián)規(guī)則挖掘算法(支持度大于0.5)輸出與4G基站退服相關(guān)的關(guān)聯(lián)規(guī)則;基于時(shí)間屬性進(jìn)行追溯推演分析獲得關(guān)聯(lián)告警的時(shí)間分布特征,其計(jì)算方法如下:
將時(shí)間流劃分為不同區(qū)間,根據(jù)上述時(shí)間間隔計(jì)算結(jié)果將4G基站退服關(guān)聯(lián)告警消息歸屬到不同的時(shí)間區(qū)間內(nèi),然后統(tǒng)計(jì)該關(guān)聯(lián)告警消息發(fā)生的概率分布。以4G基站退服故障消息前 200~400 s為例(見(jiàn)表1),4G基站退服告警消息發(fā)生前200~400 s“射頻單元輸入電源能力不足告警”消息發(fā)生的概率為71.43%,“遠(yuǎn)程維護(hù)通道故障告警”消息發(fā)生的概率為66.56%。
表1 4G基站退服前200~400 s關(guān)聯(lián)告警發(fā)生概率統(tǒng)計(jì)
4G基站退服故障長(zhǎng)期預(yù)警模型(如圖2所示)是利用信息通信網(wǎng)絡(luò)4G基站設(shè)備性能指標(biāo)數(shù)據(jù)資源,對(duì)設(shè)備性能指標(biāo)數(shù)據(jù)進(jìn)行清洗、均值化,對(duì)設(shè)備性能指標(biāo)數(shù)據(jù)進(jìn)行聚類分析形成具有相同/類似特征的網(wǎng)元集合;對(duì)每簇4G基站設(shè)備進(jìn)行主成分分析獲得主成分表達(dá)式(貢獻(xiàn)率>85%)實(shí)現(xiàn)4G基站設(shè)備性能指標(biāo)降維;將主成分表達(dá)式與4G基站退服故障次數(shù)進(jìn)行關(guān)聯(lián)分析,進(jìn)而獲得表征4G基站退服故障的4G基站設(shè)備性能指標(biāo)數(shù)據(jù)集;對(duì)該4G基站設(shè)備性能指標(biāo)數(shù)據(jù)集進(jìn)行閾值分析得出預(yù)警閾值門限區(qū)間。
(1)數(shù)據(jù)清洗
以某地市5個(gè)月4G基站設(shè)備性能指標(biāo)數(shù)據(jù)資源為例,約為76萬(wàn)條性能指標(biāo)數(shù)據(jù)(4G基站數(shù)量為5 119個(gè)、數(shù)據(jù)時(shí)間粒度為天、4G基站設(shè)備性能指標(biāo)維度560個(gè)),剔除異常數(shù)據(jù)(數(shù)值為零或者數(shù)值為空),對(duì)相同網(wǎng)元相同維度指標(biāo)按照工作日和非工作日進(jìn)行均值計(jì)算。
(2)特征篩選
圖2 4G基站退服故障長(zhǎng)期預(yù)警模型
對(duì)全量均值化指標(biāo)數(shù)據(jù)計(jì)算相關(guān)矩陣,根據(jù)相關(guān)系數(shù)判別標(biāo)準(zhǔn)(見(jiàn)表2)選擇相關(guān)系數(shù)大于0.5的性能指標(biāo),則全量560個(gè)4G基站設(shè)備性能指標(biāo)集降至77個(gè)。進(jìn)一步剔除數(shù)值波動(dòng)微弱的指標(biāo)(如上行PUSCH TTI總數(shù)、下行PUSCH TTI總數(shù))后,4G基站設(shè)備性能指標(biāo)集降至39個(gè)。
表2 相關(guān)系數(shù)評(píng)價(jià)標(biāo)準(zhǔn)
(3)網(wǎng)元聚類
對(duì)4G基站設(shè)備的39個(gè)性能指標(biāo)集進(jìn)行聚類分析,聚類分析采用K-means聚類算法,即:將每個(gè)4G基站設(shè)備(39維性能指標(biāo))分配到距它最近的簇中心獲得K個(gè)簇;分別計(jì)算各簇中所有實(shí)例的均值,把它們作為各簇新的簇中心(見(jiàn)表3)。通過(guò)歐式距離計(jì)算各簇的簇內(nèi)、簇間距離并通過(guò)“簇平方誤差和之比”來(lái)優(yōu)選聚類參數(shù),其計(jì)算方法如下:
其中,m為聚類分簇的個(gè)數(shù),n為聚類各簇之間存在距離關(guān)系的個(gè)數(shù)。簇平方誤差和之比的數(shù)值越小,則表明簇內(nèi)網(wǎng)元性能指標(biāo)的“距離”較小,而簇間網(wǎng)元性能指標(biāo)的“距離”較大,即聚類效果越好,反之則較差。
根據(jù)基站的服務(wù)區(qū)域重要性、業(yè)務(wù)量水平、網(wǎng)絡(luò)拓?fù)涔?jié)點(diǎn)作用等因素,基站可以分為VVIP基站、VIP基站、普通基站(A類基站、B類基站、C類基站)[8],因此將4G基站設(shè)備聚類為5簇(見(jiàn)表4)。
網(wǎng)元分類(數(shù)據(jù)清洗、特征篩選、網(wǎng)元聚類)環(huán)節(jié)通過(guò)基于設(shè)備性能指標(biāo)自身特征的網(wǎng)絡(luò)設(shè)備分類,避免了由于4G基站設(shè)備業(yè)務(wù)劃分與4G基站設(shè)備實(shí)際運(yùn)行性能指標(biāo)之間所存在的差異所帶來(lái)的分析干擾,實(shí)現(xiàn)了基于網(wǎng)元性能指標(biāo)特征的差異化分類。
表4 各簇4G基站設(shè)備數(shù)量及占比分布
(1)按簇分組
根據(jù)網(wǎng)元分類結(jié)果對(duì)4G基站設(shè)備進(jìn)行分組 (后續(xù)模型分析以第2簇為例)。
(2)主成分分析
首先4G基站設(shè)備性能指標(biāo)數(shù)據(jù)構(gòu)建560維的指標(biāo)向量x=(x1,x2,x3,…,x560)T,則5 119個(gè) 4G基站將形成全量樣本矩陣,即:xi=(xi1,xi2,xi3,…,xi560)T,i=1,2,3,…,5 119,對(duì)樣本陣元進(jìn)行標(biāo)準(zhǔn)化變換獲得標(biāo)準(zhǔn)化矩陣Z:
經(jīng)過(guò)指標(biāo)降維(按簇分組、主成分分析)分析發(fā)現(xiàn):89個(gè)主成分表達(dá)式的累計(jì)貢獻(xiàn)率為100%,最終按照累計(jì)信息利用率達(dá)到85%選定45個(gè)主成分表達(dá)式(例如:第8主成分 U8、第 21 主成分 U21、第 22 主成分 U22,見(jiàn)表5~表7)。
表3 4G基站設(shè)備性能指標(biāo)分簇中心點(diǎn)分布實(shí)例
表5 第8主成分U8主要性能指標(biāo)及其權(quán)重
表6 第21主成分U21主要性能指標(biāo)及其權(quán)重
表7 第22主成分U22主要性能指標(biāo)及其權(quán)重
根據(jù)多元線性回歸模型應(yīng)用所需滿足的條件:自變量與因變量存在線性關(guān)系,各樣本數(shù)據(jù)相互獨(dú)立。因此,將指標(biāo)降維后的45個(gè)主成分表達(dá)式和基站退服次數(shù)通過(guò)計(jì)算相關(guān)系數(shù)實(shí)現(xiàn)關(guān)聯(lián)關(guān)系分析。測(cè)試選取相關(guān)系數(shù)的絕對(duì)值大于0.1的主成分表達(dá)式包括:主成分表達(dá)式8、主成分表達(dá)式16、主成分表達(dá)式21和主成分表達(dá)式 22(見(jiàn)表8),說(shuō)明主成分表達(dá)式和基站退服次數(shù)存在一定的關(guān)聯(lián)關(guān)系。
對(duì)45個(gè)主成分表達(dá)式和基站退服次數(shù)進(jìn)行回歸分析獲得回歸方程:
表8 主成分表達(dá)式與基站退服次數(shù)相關(guān)系數(shù)
其中,xi表示第i個(gè)主成分表達(dá)式,ai表示第i個(gè)主成分表達(dá)式對(duì)應(yīng)的系數(shù),b為常數(shù)項(xiàng)。經(jīng)計(jì)算獲得回歸方程各項(xiàng)參數(shù)可以得出(見(jiàn)表9):偏回歸系數(shù)絕對(duì)值相對(duì)較大的主成分表達(dá)式指標(biāo)為第8主成分U8、第21主成分U21、第22主成分 U22。
表9 基于主成分表達(dá)式和基站退服次數(shù)的回歸方程參數(shù)(含常數(shù)項(xiàng))
通過(guò)顯著性水平(significant level)檢驗(yàn)回歸方程的線性關(guān)系是否顯著,若顯著性水平在0.05以上則分析結(jié)果有意義。經(jīng)F檢驗(yàn)(F=25.449,P<0.001)表明回歸方程的線性關(guān)系顯著。判定系數(shù)R2是用于檢驗(yàn)多元回歸方程效果的一項(xiàng)重要指標(biāo),取值范圍為0~1,R2數(shù)值表示因變量中可由回歸模型中自變量解釋的部分所占的比例。由于4G基站設(shè)備退服故障原因涉及傳輸線路、動(dòng)力環(huán)境等多種突變因素,而且此類突變因素占導(dǎo)致基站設(shè)備退服故障原因的40%~60%,例如:市電停電巡檢、外部施工斷纖等[10,11],雖然性能指標(biāo)的變化不能全部表征4G基站設(shè)備退服故障,但通過(guò)回歸分析中的通過(guò)判定系數(shù)R2(R2=0.224 6)來(lái)看,4G基站設(shè)備退服故障變化由22.46%的主成分表達(dá)式所涉及的性能指標(biāo)所引起,此效果在后續(xù)的工程測(cè)試同時(shí)得到了驗(yàn)證。
對(duì)第 8主成分 U8、第 21主成分 U21、第 22主成分U22所包含的22個(gè)主要性能指標(biāo)進(jìn)行相關(guān)性分析,將相關(guān)系數(shù)大于0.75的性能指標(biāo)歸為一組。由于具有相關(guān)性的同組網(wǎng)優(yōu)指標(biāo)具有相同或者類似的分布特征及變化規(guī)律,因此,通過(guò)分析各組中一個(gè)典型的網(wǎng)優(yōu)指標(biāo)與退服故障次數(shù)的關(guān)系即可表征該組指標(biāo)數(shù)據(jù)的特征規(guī)律。
以第2簇為例,首先對(duì)第8主成分U8、第21主成分U21、第22主成分U22所包含的22個(gè)主要性能指標(biāo)依次編號(hào)為1~22,通過(guò)相關(guān)性分析將22個(gè)主要性能指標(biāo)劃分為9組 (相關(guān)系數(shù)大于0.75),對(duì)9組主要性能指標(biāo)數(shù)值與4G基站設(shè)備退服次數(shù)變化進(jìn)行分析,得出4類波動(dòng)特征見(jiàn)表10。
(1)中軸波動(dòng)型性能指標(biāo)(性能指標(biāo)編號(hào)為 1、2、3、4、21、22)
圖3 RRU_PdschPrbMeanTot_6與4G基站設(shè)備退服次數(shù)的數(shù)值分布特征
表10 4G基站設(shè)備退服故障預(yù)警模型參考指標(biāo)選取及閾值
以 RRU_PdschPrbMeanTot_6(性能指標(biāo)編號(hào) 4)為例(如圖 3所示),當(dāng) 4G基站設(shè)備退服次數(shù)較少時(shí),該性能指標(biāo)值相對(duì)平穩(wěn);當(dāng)4G基站設(shè)備退服次數(shù)為5~10次時(shí),該性能指標(biāo)值出現(xiàn)小幅度波動(dòng)上升;當(dāng)4G基站設(shè)備退服次數(shù)大于10次時(shí),該性能指標(biāo)值逐步出現(xiàn)大幅度的中軸性波動(dòng)。因此,此類指標(biāo)屬于中軸波動(dòng)型性能指標(biāo),可根據(jù)工程實(shí)踐的容忍度建立雙邊閾值分級(jí)預(yù)警。
(2)降低型性能指標(biāo)(性能指標(biāo)編號(hào)為1~16)
以 erab_nbrsuccmod_qci9(性能指標(biāo)編號(hào) 5)為例(如圖4所示),當(dāng)4G基站設(shè)備退服次數(shù)較少時(shí),該性能指標(biāo)值相對(duì)平穩(wěn);當(dāng)4G基站設(shè)備退服次數(shù)逐步增大時(shí),該性能指標(biāo)值出現(xiàn)整體下降趨勢(shì)且無(wú)明顯反比線性關(guān)系。因此,此類指標(biāo)屬于降低型性能指標(biāo),可根據(jù)工程實(shí)踐容忍度建立上限型閾值分級(jí)預(yù)警。
(3)升高型性能指標(biāo)(性能指標(biāo)編號(hào)為17)
從 PHY_CellMaxTxPower(性能指標(biāo)編號(hào) 5)變化特征來(lái)看(如圖5所示),當(dāng)4G基站設(shè)備退服次數(shù)較少時(shí),該性能指標(biāo)值相對(duì)恒定;當(dāng)4G基站設(shè)備退服次數(shù)逐步增大時(shí),該性能指標(biāo)值出現(xiàn)整體上升趨勢(shì)且無(wú)明顯正比線性關(guān)系。因此,此類指標(biāo)屬于升高型性能指標(biāo),可根據(jù)工程實(shí)踐容忍度建立下限型閾值分級(jí)預(yù)警。
(4)中軸恒定型性能指標(biāo)(性能指標(biāo)編號(hào)為18~20)
以CONTEXT_NbrLeft(性能指標(biāo)編號(hào) 18)為例(如圖 6所示),隨著4G基站設(shè)備退服次數(shù)增加,該性能指標(biāo)值圍繞中軸波動(dòng),但未呈現(xiàn)出明顯變化特征,因此不納入4G基站設(shè)備退服故障預(yù)警模型參考指標(biāo)體系。
通過(guò)4G基站設(shè)備退服故障次數(shù)和性能指標(biāo)的變化規(guī)律分析,最終選定第1類(第1組,共計(jì)6個(gè)性能指標(biāo))、第2類(第 2~7組,共計(jì) 12個(gè)性能指標(biāo))和第 3類(第 8組,共計(jì)1個(gè)性能指標(biāo))形成由19個(gè)參考性能指標(biāo)構(gòu)成的4G基站設(shè)備退服故障長(zhǎng)期預(yù)警模型。
綜上所述,基于4G基站設(shè)備退服故障長(zhǎng)期預(yù)警模型性能指標(biāo)體系和閾值判別方法,采用某地市5個(gè)月的4G基站設(shè)備性能指標(biāo)數(shù)據(jù)(日粒度),通過(guò)上月對(duì)次月的4G基站設(shè)備退服故障進(jìn)行預(yù)測(cè)分析,經(jīng)測(cè)試可準(zhǔn)確27.8%(均值)的基站設(shè)備退服故障事件。
圖4 erab_nbrsuccmod_qci9與4G基站設(shè)備退服次數(shù)的數(shù)值分布特征
圖5 PHY_CellMaxTxPower與4G基站設(shè)備退服次數(shù)的數(shù)值分布特征
表6 CONTEXT_NbrLeft與4G基站設(shè)備退服次數(shù)的數(shù)值分布特征
從工程實(shí)踐角度而言,4G基站退服故障短期/長(zhǎng)期預(yù)警模型方法特點(diǎn)如下。
(1)將退服故障與告警數(shù)據(jù)之間的關(guān)聯(lián)邏輯明確化、清晰化、工具化
以退服故障為著眼點(diǎn),通過(guò)數(shù)據(jù)挖掘算法工具實(shí)現(xiàn)了基于本地化告警特征的關(guān)聯(lián)規(guī)則挖掘方法,該方法不僅提高了關(guān)聯(lián)規(guī)則的本地化適用性,而且規(guī)避了人工分析關(guān)聯(lián)規(guī)則的主觀性所帶來(lái)的遺漏和片面性[12],更大程度地提升了關(guān)聯(lián)規(guī)則獲取的客觀性、完備性、科學(xué)性和便捷性。
(2)基于時(shí)間屬性采用追溯推演+數(shù)據(jù)統(tǒng)計(jì)方式實(shí)現(xiàn)短期/長(zhǎng)期退服預(yù)警
本工程實(shí)踐充分發(fā)揮了數(shù)據(jù)的時(shí)間屬性特征,采用調(diào)整時(shí)間窗口形成追溯推演分析方式,同時(shí)通過(guò)大量的數(shù)據(jù)統(tǒng)計(jì)分析形成了影響退服故障的告警消息/性能指標(biāo)數(shù)據(jù)集。
(3)將網(wǎng)絡(luò)性能數(shù)值分析引入退服故障預(yù)警工程實(shí)踐
人工經(jīng)驗(yàn)和本研究前期都發(fā)現(xiàn)部分指標(biāo)在退服時(shí)發(fā)生的劇烈變化,但都是退服后突變的網(wǎng)優(yōu)指標(biāo)的變化,并不具有預(yù)警功能,本文從長(zhǎng)時(shí)間粒度上發(fā)現(xiàn)網(wǎng)優(yōu)指標(biāo)與退服次數(shù)的關(guān)系,可以規(guī)避突變指標(biāo)的影響,突出退服前緩變指標(biāo)的影響。
從生產(chǎn)運(yùn)維角度而言,4G基站退服故障短期預(yù)警模型方法可用于豐富故障工單信息詳情字段,為維護(hù)人員提供歷史正常數(shù)據(jù)和異常數(shù)據(jù)對(duì)比分析,簡(jiǎn)化排障操作,提供有價(jià)值信息;根據(jù)預(yù)測(cè)結(jié)果合理調(diào)度外派維護(hù)人員、車輛、設(shè)備進(jìn)而提升維護(hù)效率,降低物料消耗;及時(shí)制定投訴答復(fù)信息,有效支撐客服人員的信息發(fā)布。4G基站退服故障長(zhǎng)期預(yù)警模型方法可用于網(wǎng)絡(luò)運(yùn)維短板定向提升,制定具有優(yōu)先級(jí)的日常巡檢設(shè)備清單目錄,提高日常維護(hù)費(fèi)用的生產(chǎn)價(jià)值轉(zhuǎn)化效能。
[1]王洋.集中監(jiān)控模式下的信息通信網(wǎng)絡(luò)故障管理探索與實(shí)踐[J].電信科學(xué),2015,31(1):170-176.WANG Y.Discuss on the exploration and practice of information communication network fault in the centralized monitoring mode[J].Telecommunications Science,2015,31(1):170-176.
[2]黃夏.提高網(wǎng)絡(luò)類公告信息發(fā)布效率的探討 [J].廣西通信技術(shù),2014(1):7-10.HUANG X.How to improve the issuing efficiency of notices related to network operation [J].GuangxiCommunication Technology,2014,1:7-10.
[3]蔣盛益,李霞,鄭琪.數(shù)據(jù)挖掘原理與實(shí)踐[M].北京:電子工業(yè)出版社,2011.JIANG Y S,LI X,ZHENG Q.Data mining principles and practice[M].Beijing:Publishing House of Electronics Industry,2011.
[4]HAN J W,PEI J,YIN Y W.Mining frequent patterns without candidate generation[C]//The
2000 ACM SIGMOD International Conference on Management of Data,May 15-18,2000,Dallas,Texas,USA.New York:ACM Press,2000:1-12.
[5] 王洋.基于群體智能的通信網(wǎng)絡(luò)告警關(guān)聯(lián)規(guī)則挖掘算法研究[D].太原:太原理工大學(xué),2015.WANG Y.Information communication network alarm association rule mining algorithm based on swarm intelligence[D].Taiyuan:Taiyuan University of Technology,2015.
[6]施亮,錢雪忠.基于Hadoop的并行 FP-Growth算法的研究與實(shí)現(xiàn)[J].微電子學(xué)與計(jì)算機(jī),2015,32(4):150-154.SHI L,QIAN X Z.Research and implementation of parallel FP-Growth algorithm based on Hadoop[J].Microelectronics&Computer,2015,32(4):150-154.
[7]郭方方,梁曉,王慧強(qiáng),等.一種基于多叉樹(shù)的并行 Apriori算法[J].小型微型計(jì)算機(jī)系統(tǒng),2015,36(6):1176-1180.GUO F F,LIANG X,WANG H Q,et al.Parallel Apriori algorithm based on multi-tree[J].Journal of Chinese Computer Systems,2015,36(6):1176-1180.
[8]區(qū)旭青.江門通信公司基站應(yīng)急油機(jī)調(diào)度系統(tǒng)的研究與分析[D].昆明:云南大學(xué),2015.OU X Q.Research and analysis on a base of oil machine scheduling system in Jiangmen communication company[D].Kunming:Yunnan University,2015.
[9]韓冰.主成分分析和神經(jīng)網(wǎng)絡(luò)在工業(yè)經(jīng)濟(jì)數(shù)據(jù)中的應(yīng)用[D].長(zhǎng)春:吉林大學(xué),2014.HAN B.The application of principal component analysis and neural network in industrial economy data[D].Changchun:Jilin University,2014.
[10]楊順祥,謝永任.降低CDMA網(wǎng)基站傳輸原因斷站率的研究[J].電信科學(xué),2013(S2):112-115.YANG S X,XIE Y R.Lowering transmission interruption rate of base station in CDMA network [J].Telecommunications Science,2013(S2):112-115.
[11]宮琦.移動(dòng)網(wǎng)小區(qū)退服情況分析 [J].中國(guó)新通信,2014(15):11-12.GONG Q.The situation analysis of cell out of service in mobile network[J].China New Telecommunications,2014(15):11-12.
[12]王洋,李國(guó)才,徐亞昆.信息通信網(wǎng)絡(luò)告警分類、關(guān)聯(lián)性與管理方法研究[J].電信科學(xué),2013(8):132-135.WANG Y,LI G C,XU Y K.Research on management method,classification and correlation of alarm in information communication network[J].Telecommunications Science,2013,(8):132-135.
Fault early warning model of 4G base station out of service based on centralized monitoring data resources
WANG Yang1,MAN Yi2,CHEN Zhipeng2
1.Network Management Center,Network Department of China Mobile Group Shanxi Co.,Ltd.,Taiyuan 030009,China 2.Bright Oceans Inter-Telecom Co.,Ltd.,Beijing 100093,China
4G wireless base station equipment is an important link which has direct impact on information communication network customer service quality,and 4G wireless base stations out of service fault will directly block users’normal communication.Aiming at these problems,based on the centralized monitoring warning message data resources through association rule mining and time trace deduction analysis,4G base stations out of service fault short-term warning was achieved.Based on centralized monitoring equipment performance data resources,by the classification of network elements(data cleaning,feature selection,network elements clustering),index dimension reduction(grouped by cluster,principal component analysis),principal component expression and out of service fault correlation analysis,performance indicators selection and threshold analysis,4G base stations out of service fault long-term warning was achieved.The test can accurately predict the 27.8%of 4G base station equipment out of service fault next month.
information and telecommunication network,centralized fault management,centralized monitoring,network operational data resource,base station out of service,fault early warning
TN915.07;TP306+.3;TP277
A
10.11959/j.issn.1000-0801.2016147
2015-11-11;
2016-05-11
王洋,wangyang1@sx.chinamobile.com
王洋(1983-),男,博士,中國(guó)移動(dòng)通信集團(tuán)山西有限公司網(wǎng)絡(luò)部網(wǎng)絡(luò)管理中心網(wǎng)絡(luò)分析工程師、通信工程師,主要研究方向?yàn)橐苿?dòng)通信大數(shù)據(jù)分析技術(shù)、集中監(jiān)控技術(shù)與集中故障管理。
滿毅(1974-),男,博士,億陽(yáng)信通股份有限公司新產(chǎn)品預(yù)研部總工程師,主要研究方向?yàn)殡娦啪W(wǎng)絡(luò)管理、大數(shù)據(jù)分析處理。長(zhǎng)期從事電信網(wǎng)絡(luò)管理研究,主持或參與國(guó)內(nèi)主要電信運(yùn)營(yíng)商的OSS系統(tǒng)規(guī)劃設(shè)計(jì)開(kāi)發(fā)及相關(guān)規(guī)范制定等工作。
陳志鵬(1989-),女,億陽(yáng)信通股份有限公司數(shù)據(jù)挖掘工程師,主要研究方向?yàn)榻y(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘。