岳烈驥 孫 偉 侯 普 呂程程 陳 凱
1 中國移動通信集團北京有限公司 北京 100027
2 中國信息通信研究院 北京 100191
5G時代隨著用戶和設備規(guī)模的持續(xù)上升,多網(wǎng)絡融合、多設備互聯(lián)、多業(yè)務并發(fā),5G得到越來越廣泛的應用[1]。與此同時,5G網(wǎng)絡的復雜性也在持續(xù)增加,故障所造成的影響范圍也越來越廣。實際業(yè)務中,針對5G網(wǎng)絡的運維,存在故障發(fā)現(xiàn)被動、根因定位困難等一系列問題,各專業(yè)運維支撐系統(tǒng)面臨開發(fā)周期長、閉環(huán)流程自動化程度低的技術瓶頸,難以做到主動維護和根因自動定位。在日常網(wǎng)絡運維中,依靠人工處理的傳統(tǒng)方式,存在分析工作量大、投訴根因定位難、跨部門溝通成本高等問題,特別是復雜故障場景下往往需要多次上站排查才能找到故障根因,費時費力,對于VIP站點或重點保障站點,一旦發(fā)生故障容易引發(fā)關鍵用戶投訴。由于5G投訴涉及終端、錨點、5G站點等各種因素,迫切需要形成一套統(tǒng)一標準的5G投訴定位流程,提高5G投訴分析效率,并最終基于5G投訴根因情況監(jiān)控全網(wǎng)質量波動,持續(xù)提升移動網(wǎng)絡的質量和端到端的運營能力[2]。
近年來,大數(shù)據(jù)、深度學習等技術的發(fā)展推動了人工智能產(chǎn)業(yè)的進步,人工智能在各行各業(yè)都取得了落地應用的成果。大數(shù)據(jù)分析和機器學習是實現(xiàn)人工智能的重要技術手段。本文利用大數(shù)據(jù)分析、特征工程和無監(jiān)督機器學習算法,根據(jù)歷史用戶投訴信息、投訴地點周邊站點狀態(tài)、規(guī)劃站點情況以及用戶常駐站點、4/5G流量駐留比、異常事件、關鍵性能指標等數(shù)據(jù),使用人工智能機器學習算法,構建特征指標和根因之間的關系模型,快速定位5G投訴的根因,實現(xiàn)5G用戶投訴處理的自動化和智能化。
在業(yè)務系統(tǒng)中收集歷史5G用戶投訴工單,對于每份投訴工單,提取投訴的時間和地點信息,其中地點信息包含投訴時刻經(jīng)度和緯度的坐標值。根據(jù)包含所有基站經(jīng)緯度坐標、方位角信息的工參數(shù)據(jù),基于距離和方位角兩個維度,定位出每份投訴工單關聯(lián)的基站。距離閾值設置為500米,方位角閾值設置為正負30度。用戶投訴位置和基站之間的距離使用Haversine公式[3]進行計算:
用戶投訴位置和基站之間的方位角計算方式為
針對每份5G投訴,基于距離和方位角兩個維度查找出投訴時刻的關聯(lián)基站,進一步地,對于每個關聯(lián)基站,提取基站的特征指標數(shù)據(jù),構建5G投訴特征指標候選集合,如圖1所示。
圖1 特征指標候選集合示例
特征指標候選集合具體包括投訴工單265個特征、5G不滿意用戶22個特征、5G BI系統(tǒng)313個特征和無線感知540個特征。
結合常駐地點數(shù)據(jù)、業(yè)務專家經(jīng)驗以及統(tǒng)計科學中的信息增益準則和皮爾遜自相關分析算法[4],從5G投訴特征指標候選集合中篩選出指標候選子集。
信息增益準則基于信息熵的概念,隨機變量的信息熵定義為:
熵的大小只依賴隨機變量X的分布,而與的取值無關,隨機變量的不確定性越大,其計算出的熵值越大。信息增益表示得知特征的信息而使得基站類別信息的不確定性減少的程度,根據(jù)特征和基站類型的信息增益值進行排序,篩選出信息增益大的特征指標。
皮爾遜相關系數(shù)是用來檢測兩個連續(xù)型變量之間線性相關的程度,計算公式為:
根據(jù)上述篩選準則,篩選出相關性高的128個特征指標,構成特征指標候選子集。進一步地,使用隨機森林算法模型[5]收集關鍵性能指標集合。具體地,收集1 000個投訴關聯(lián)基站和1 000個正常基站的指標數(shù)據(jù),構建出包含128項特征維度的2 000例樣本,構建隨機森林模型,預測數(shù)據(jù)集中的每個樣本的類別,判定該樣本屬于正?;具€是投訴關聯(lián)基站。訓練隨機森林模型直至模型收斂。模型訓練結束后,將128項性能指標按照隨機森林模型給出的特征重要性得分進行排序,最終篩選出和5G投訴強相關的34項性能指標。篩選出的性能指標以及各自的權重值,如圖2所示。
圖2 5G投訴關鍵特征指標示例
對于每條5G投訴關聯(lián)的基站,從業(yè)務系統(tǒng)數(shù)據(jù)庫中收集投訴時刻的34項關鍵性能指標數(shù)據(jù),并從中定位出異常指標集合,結合業(yè)務專家經(jīng)驗,得出投訴的根因。對于異常指標的定位,在綜合評估比較各個算法模型的性能之后,選擇采用無監(jiān)督[6]的孤立森林[7]機器學習算法模型。
收集5 000條投訴關聯(lián)基站在投訴當天的34項特征指標數(shù)據(jù),另外再收集5 000條其它正?;驹谌我饽程斓?4項特征指標數(shù)據(jù),構建出包含10 000個元素的數(shù)據(jù)集S。在數(shù)據(jù)預處理上,對于數(shù)據(jù)集中的缺失值,采用正?;镜木颠M行填充。
基于數(shù)據(jù)集S,隨機構建100棵獨立的二叉樹。對于每顆二叉樹,在10 000個訓練樣本中隨機選擇1 000個樣本,放入樹的根節(jié)點中。在34項特征指標集合中,隨機選擇一個特征指標F,在F的數(shù)值范圍中,隨機產(chǎn)生一個切割點p,如果某個樣本在F特征指標上的值小于p,則將該樣本分配到節(jié)點左子樹中,反之,分配到節(jié)點右子樹中。遞歸重復上述過程,直至無法再進行切割,或者達到二叉樹預設的20的高度。100棵二叉樹構建完畢后,即構建出檢測異常指標的孤立森林模型M[8]。圖3給出了模型構建的整體算法流程。
圖3 異常指標定位模型算法流程
對于每個樣本X,將X輸入進孤立森林模型M,計算X的得分,計算公式為:
其中E(h(X)) 表示樣本X在孤立森林模型M中的平均高度,n表示構建每顆樹的樣本數(shù)量也即1 000,c(n)的計算方式為:
其中H代表諧波函數(shù)[9]。如果S(X)的得分大于0.8,判定X為異?;局笜藬?shù)據(jù),反之判定X為正?;局笜藬?shù)據(jù)。對于異?;局笜藬?shù)據(jù)X,計算所有100棵樹的平均高度EM,并篩選出路徑長度低于0.2×EM的葉子節(jié)點,這些葉子對應的特征指標,即為X中的異常指標集合。
對于每條5G用戶投訴,基于距離和方位角兩個維度查找出投訴時刻的關聯(lián)基站,提取出關聯(lián)基站的34項特征指標數(shù)值,輸入進異常指標定位模型M,預測得出異常指標集合。對于模型預測出的異常特征指標,根據(jù)業(yè)務專家規(guī)則,轉換得出5G投訴的根因。圖4給出了根據(jù)異常指標定位5G根因的規(guī)則流程。
圖4 異常指標和投訴根因關聯(lián)規(guī)則
對于覆蓋異常根因,基于投訴位置附近有無站點、SA用戶覆蓋不滿意指標和Top n常駐小區(qū)MR覆蓋率三個因素進行判定。對于投訴位置附近是否存在站點,根據(jù)用戶投訴的經(jīng)緯度位置和工參表中所有5G站點的經(jīng)緯度位置,計算用戶投訴一定距離范圍內(nèi)是否存在站點,如果投訴位置附近不存在站點,則判定為覆蓋異常根因。對于SA用戶覆蓋不滿意指標,計算SA用戶覆蓋不滿意指標是否大于閾值,其中閾值由數(shù)據(jù)集S中正常基站的SA用戶覆蓋不滿意指標的均值計算得出。對于Top n常駐小區(qū)MR覆蓋率,計算Top n常駐小區(qū)MR覆蓋率是否小于閾值hmr,閾值hmr由數(shù)據(jù)集S中正?;镜腗R覆蓋率指標的均值計算得出。滿足上述三者中任何一項,判定5G投訴根因是覆蓋異常。
對于干擾異常根因,基于重疊覆蓋度和小區(qū)NI指標兩個因素進行判定。對于重疊覆蓋度,判斷異常特征集合中重疊覆蓋度指標是否大于閾值hoverlap,閾值hoverlap由數(shù)據(jù)集S中正常基站的重疊覆蓋度指標的均值計算得出。對于小區(qū)NI指標,判斷小區(qū)NI指標是否大于閾值,閾值由數(shù)據(jù)集S中正?;镜腘I指標的均值計算得出。滿足上述兩者中任何一項,判定5G投訴根因是干擾異常。
對于容量異常根因,判斷異常特征集合用戶數(shù)指標是否大于閾值hnum,閾值hnum由數(shù)據(jù)集S中正?;镜挠脩魯?shù)指標的均值計算得出。如果大于閾值,判定5G投訴根因是容量異常。
對于站點故障根因,根據(jù)故障站點表中的站點經(jīng)緯度位置,判斷投訴位置附近是否存在距離小于500米的故障站點,如果存在,判定5G投訴根因是站點故障。
上述四個條件均不滿足,判定5G投訴根因是其它異常。
文章給出了5G用戶投訴根因定位方法,方法包括5G投訴關鍵指標集合篩選、異常指標定位模型構建、異常指標和投訴根因轉換規(guī)則構建等流程。驗證階段,選取6 564個5G投訴工單,5 384個正常的模擬工單,構建出11 948個測試工單集合。對于每個工單,根據(jù)工單中的經(jīng)緯度信息,按照方法流程預測得出5G投訴根因,并以人工定位的結果作為基準,進行準確率的驗證,其中10 428單和人工定位的結果一致,定位準確率為87.3%。表1展示了模型在各個根因類別上的預測結果。
表1 用戶投訴根因定位各個類別準確率
該方法上線投入實際應用之后,通過對接網(wǎng)優(yōu)基礎數(shù)據(jù)庫,對于每條5G投訴拉取關聯(lián)基站指標數(shù)據(jù)輸入進模型,并基于模型的預測結果和轉換規(guī)則得出用戶的投訴根因,將結果輸出進EMOS平臺派發(fā)工單流轉至分公司優(yōu)化解決,同時基于5G投訴感知根因情況監(jiān)控全網(wǎng)質量波動,持續(xù)提升了5G的服務質量。