鄭波+花純征+花磊+楊勇
摘要:PON技術可以提高光纖資源的利用率,但是在上行鏈路中容易受到干擾,影響PON系統(tǒng)的穩(wěn)定運行。為解決這個問題,該文基于決策樹理論,提出了基于決策樹的ONU故障診斷算法。該算法提取ONU故障中豐富的OLT和ONU運行相關信息,按照特征和規(guī)則進行組合構建決策樹,然后將決策樹進行存儲,應用于ONU的故障診斷。通過仿真實驗,證明了該文提出的故障診斷算法可用于代替人工故障診斷方法,提高了故障診斷的效率,而且取得了較高的準確率、較低的誤報率。
關鍵詞:無源光網絡;光網絡單元;干擾;故障診斷
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2017)34-0253-03
Abstract: PON technology can improve the utilization of fiber resources, but PON uplink is susceptible to be interfered, which affects the stable operation of PON system. In order to solve this problem, this paper proposes an ONU fault diagnosis algorithm Based on decision tree. The algorithm extracts the abundant OLT and ONU operation information related to the ONU fault, and combines the characteristics and rules to form the decision tree. Then the decision tree is stored and applied to the ONU fault diagnosis. Through the simulation experiment, it is proved that the fault diagnosis algorithm proposed in this paper can be used to replace the artificial fault diagnosis method, improve the efficiency of fault diagnosis, and obtain high accuracy and low false alarm rate.
Key words: PON; ONU; Interference; fault diagnosis
1 背景
PON技術可以提高光纖資源的利用率,但是在上行鏈路中容易受到干擾,影響PON系統(tǒng)的穩(wěn)定運行[1,2]。另外,PON系統(tǒng)傳輸距離延伸環(huán)境下,增加了相關光信號延伸設備,使這個問題更加復雜[3]。一般來說,產生干擾的原因主要包括:長發(fā)光、發(fā)光超出或偏離授權窗口、消光比不達標、隨機突發(fā)式亂發(fā)光等幾種。從已有研究成果可知,長發(fā)光對業(yè)務的影響最為嚴重[1,2]。所以,解決長發(fā)光問題,是當前的研究重點。已有相關研究提出了一些長發(fā)光告警診斷方法,包括信號掃描法、虛擬ONU法[4-5]。但是,在這些算法中,需要人工積累判斷規(guī)則,然后基于判斷規(guī)則和告警信息,通過人工打開和關閉發(fā)光器、電源開關等措施,進行故障診斷,這種故障診斷的效率較低。
為了提高ONU故障診斷的效率,本文提出了基于決策樹的ONU故障診斷算法。該算法基于決策樹理論[6-7],將人工積累的ONU故障診斷判斷規(guī)則進行預處理,提取特征和故障的關聯(lián)關系,生成故障診斷的決策樹,然后將決策樹進行存儲,應用于ONU的故障診斷。通過仿真實驗,證明了本文提出的故障診斷算法可用于代替人工故障診斷方法,不但提高了故障診斷的效率,而且取得了較高的準確率,較低的誤報率。
2 問題分析與故障診斷模型構建
2.1 問題描述與分析
為了便于對問題進行分析,下面首先對長發(fā)光的特征進行分析。長發(fā)光是指ONU的發(fā)光不是在OLT允許的時限范圍內進行發(fā)光,而是發(fā)光的時間較長,嚴重影響其他ONU的數據發(fā)送。出現長發(fā)光故障的原因主要是由于ONU出現硬件或軟件故障,導致ONU的光發(fā)射機不受控制。為便于進行故障診斷,現對長發(fā)光業(yè)務特征進行分析,從而建立癥狀和故障的關聯(lián)關系。
2.2 故障診斷模型構建
故障診斷模型構建,即建立特征(也叫癥狀)與故障的關聯(lián)關系。所以,構建故障診斷模型首先需要定義特征與故障的關聯(lián)規(guī)則。下面根據突發(fā)式長發(fā)光干擾時相關ONU及鏈路的特征信息,來設置故障ONU 的特征與故障的關聯(lián)規(guī)則。
考慮到特征與故障所在場景的不同,可以將特征與故障的關聯(lián)規(guī)則分為:狀態(tài)特征與故障、告警特征與故障、性能特征與故障等3種。其中,狀態(tài)特征與故障主要指ONU出現的狀態(tài)與ONU發(fā)生故障之間的關系,例如,同時在線的ONU個數、離線的ONU個數等狀態(tài)與發(fā)生故障的ONU之間的關系。告警特征與故障主要指發(fā)生光路干擾時,ONU告警的特征與故障的關系,包括ONU 離線發(fā)生的時間間隔、ONU離線發(fā)生的次數間隔、部分ONU 離線與某ONU 上線時間間隔等。性能特征與故障主要指ONU性能的變化與ONU發(fā)生故障之間的關聯(lián)關系。例如,ONU的光功率變化、誤碼率變化與故障之間的關系。
3 基于決策樹的ONU故障診斷算法
3.1 基于決策樹的ONU故障診斷流程
基于決策樹的ONU故障診斷流程如下圖1所示。主要包括生成決策樹、存儲決策樹、應用決策樹、性能分析四個子過程。下面進行詳細介紹。
生成決策樹子過程包括數據采集和特征識別、數據存儲和預處理、構造決策樹3個模塊。其中,數據采集和特征識別模塊采集一段時間內ONU的狀態(tài)特征與故障、告警特征與故障、性能特征與故障等數據,并進行特征識別。數據存儲和預處理模塊將采集的數據進行存儲、規(guī)范化處理,獲得特征數據及結果數據。構造決策樹模塊采用Hunt算法構建決策樹。endprint
存儲決策樹子過程將決策樹存儲為文件,便于快速方便應用于故障診斷。
應用決策樹子過程包括數據采集和特征識別、數據預處理、應用決策樹3個模塊。 其中,數據采集和特征識別模塊實時采集ONU的狀態(tài)特征與故障、告警特征與故障、性能特征與故障等數據,并進行特征識別。數據預處理模塊按照規(guī)則特征,對數據進行處理。應用決策樹模塊采用決策樹,判斷當前數據是否可判斷出當前ONU是否正常運行。
性能分析子過程包括結果分析、是否滿足性能要求判斷2個模塊。其中,結果分析模塊從準確率和誤判率兩個維度,進行分析。是否滿足性能要求判斷模塊對檢測結果進行判斷,如滿足預設的閾值,輸出診斷結果,程序結束。如不滿足,需進行重新構造決策樹。
3.2 生成決策樹的過程
從基于決策樹的ONU故障診斷流程可知,生成決策樹的過程是故障診斷流程中最重要的過程。下面對此過程進行詳細介紹。
3.2.1 數據采集和特征識別
通過OLT、ONU的OAM模塊獲取運行、維護等數據,從EPON系統(tǒng)的MPCP模塊獲取協(xié)議消息數據,抽取出狀態(tài)特征與故障、告警特征與故障、性能特征與故障等數據。然后基于維護經驗,挖掘出關鍵特征,以及關鍵特征組合下的故障診斷結果。例如:當診斷發(fā)現部分ONU滿足以下特征的相關組合時,則可將其列為疑似故障ONU。特征包括:特征1:多個ONU發(fā)生告警的時間與單個ONU告警修復的時間間隔小于N分鐘;特征2:同一時間內,多于1個ONU在線;特殊3:多個ONU發(fā)生告警的時間間隔小于M分鐘;特征4:多個ONU誤碼率超過K比特;特征5:出現長發(fā)光的ONU數量發(fā)生變化;特征6:ONU與OLT之間的通信時間超出正常閾值。
3.2.2 數據儲存和預處理
數據的存儲方面,為提高數據存儲的實時性,以及便于數據字段的調整,采用HBase新型數據庫存儲采集到的數據。
數據預處理中心首先對不同來源的數據做時間和空間的對準,然后對數據進行清洗和整理。其中使用的處理算法主要包括數據整合算法、數據抽樣算法、缺失值處理算法、行內去重算法、數據修改算法等。其中,各個特征的最優(yōu)參數不是本文的研究重點,此部分基于已有研究成果,也可以根據PON網絡運行過程中的實際數據進行調整。所以,特征4中的M取值1 分鐘;特征5中的N取值1分鐘;特征6中的K取值10比特。基于已有研究成果,以及PON網絡運行過程中的實際數據,整理訓練數據集,用于模型構建?;跊Q策樹的ONU故障診斷訓練數據舉例見下表1。
3.2.3 構造決策樹
創(chuàng)建決策樹的遞歸算法如下:1)判斷數據集[D]中的數據是否屬于同一個類別,如果是,標記為[yt];2)采用信息熵理論,選擇一個合適的特征,將數據集劃分為較小的數據子集;3)將未劃分的數據劃分到新的數據子集中;4)遞歸調用該算法,直到所有子集中的數據都屬于同一類別。
在該算法中,選擇最好的數據特征來劃分數據集,是構造決策樹的關鍵。下一節(jié)進行詳細介紹。
3.2.4 選擇最好的數據特征來劃分數據集
4 性能分析
4.1 比較方法
為了分析本文算法的性能,本文使用準確率和誤報率來分析算法的性能,計算方法見公式(2)和公式(3)。
[準確率=|診斷算法得到的故障集?真實的故障集||真實的故障集|] (2)[誤報率=|診斷算法得到的故障集?無故障節(jié)點被診斷為故障||真實的故障集|] (3)
4.2 性能分析
采用Python語言編寫決策樹算法?;谝延醒芯砍晒蛯嶋H運行環(huán)境結果,模擬1000條到10000條數據進行試驗。取總數據量的90%作為訓練數據;取總數據量的10%作為測試數據。
從圖2算法的準確率可知,算法的準確率在85%左右。從圖3算法的誤報率可知,算法的誤報率在15%左右。所以,相對于人工故障診斷,本文提出的ONU診斷模型能夠準確地進行各種ONU故障的診斷預警,系統(tǒng)運行性能穩(wěn)定,具有較高的實用價值。
5 結束語
PON技術可以提高光纖資源的利用率,但是在上行鏈路中容易受到干擾,影響PON系統(tǒng)的穩(wěn)定運行。為解決這個問題,本文提出一種基于優(yōu)化決策樹的ONU故障診斷方法,提取ONU故障中豐富的OLT和ONU運行相關信息,采用決策樹構造ONU故障診斷模型。實驗證明,本文提出的ONU的故障預測與診斷模型,相對于目前大都采用依靠人工經驗與定期巡檢,具有較高的準確率,具有較強的實用價值。
參考文獻:
[1] 董偉, 葉憲軍. 對光纜線路故障原因及處理方法的分析[J]. 中國新通信, 2014(13):25.
[2] 張歐.光纜線路的故障分析及障礙處理[J].中國管理信息化, 2015(18):84-85.
[3] 程洪. GEPON系統(tǒng)的長距離傳輸技術方案探討[J]. 電子世界, 2015(23):160-161.
[4] 于金輝, 余辰東. PON網絡中的ONU 干擾問題研究[J]. 光通信研究, 2015(4):19-21.
[5] 余辰東. PON網絡中的ONU 干擾問題研究[J]. 光通信研究, 2017(1):23-26.
[6] 江書榮, 劉月. 基于粗糙集與決策樹的配電網故障診斷研究[J].中國高新技術企業(yè),2016(2):22-23.
[7] 范庚, 馬登武, 張繼軍, 等. 基于決策樹和相關向量機的智能故障診斷方法[J]. 計算機工程與應用, 2013, 49(14):267-270.endprint