楊富民+花純征+劉軍偉+梁永進(jìn)
摘要:ONU(光網(wǎng)絡(luò)單元)的異常上行光信號(hào)干擾是PON(無源光網(wǎng)絡(luò))中常見且難以徹底避免的問題,在PON系統(tǒng)傳輸距離延伸之后,這個(gè)問題更加嚴(yán)重威脅著PON的穩(wěn)定運(yùn)行。為解決這個(gè)問題,該文設(shè)計(jì)了一種新的PON系統(tǒng)ONU故障診斷模型,并提出了一種基于OLT和ONU相互協(xié)作的ONU故障管理機(jī)制。通過從ONU硬件故障和軟件故障兩個(gè)方面的分析可知,該文提出的ONU故障管理機(jī)制很好地解決了現(xiàn)有的ONU故障管理的問題,提高了故障管理的準(zhǔn)確性和及時(shí)性。
關(guān)鍵詞:無源光網(wǎng)絡(luò);光網(wǎng)絡(luò)單元;干擾;故障管理
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)34-0063-03
Abstract: Abnormal uplink optical signal interference of ONU (Optical Network Unit)is a common problem in PON (passive optical network), which is difficult to be avoided completely. After the PON system transmission distance is extended, this problem is more serious threat to the stable operation of PON. In order to solve this problem, a new fault diagnosis model of ONU for PON system is designed, and an ONU fault management mechanism is proposed. Through the analysis of ONU hardware failure and software failure, the ONU fault management mechanism proposed in this paper solves the ONU fault management problem and improves the accuracy and timeliness of fault management.
Key words: PON; ONU; Interference; fault management
1 背景
PON 技術(shù)具有節(jié)省光路資源、動(dòng)態(tài)分配帶寬等諸多優(yōu)點(diǎn),但是,傳統(tǒng)的PON系統(tǒng)的傳輸距離一般局限在20KM以內(nèi)[1-2]。但是在農(nóng)村和偏遠(yuǎn)地區(qū),要求PON系統(tǒng)的傳輸距離遠(yuǎn)遠(yuǎn)大于20KM。當(dāng)前已有研究中,針對(duì)GEPON系統(tǒng),采用再生GEPON信號(hào)技術(shù)提高GEPON系統(tǒng)的傳輸距離到80km,滿足了農(nóng)村和偏遠(yuǎn)地區(qū)的傳輸距離要求[3]。PON技術(shù)可以提高光纖資源的利用率,但是在上行鏈路中容易受到干擾,影響PON系統(tǒng)的穩(wěn)定運(yùn)行。尤其是PON傳輸距離延伸之后,這個(gè)問題更加嚴(yán)重威脅著PON的穩(wěn)定運(yùn)行。
為解決這個(gè)問題,當(dāng)前已有一些研究成果[4-5]。但是,當(dāng)前已有研究基于現(xiàn)有協(xié)議模型,將OLT和ONU分為兩個(gè)相互獨(dú)立的實(shí)體進(jìn)行故障診斷,影響ONU故障管理的準(zhǔn)確性和及時(shí)性。基于此,本文設(shè)計(jì)了一種新的PON系統(tǒng)ONU故障診斷模型,并提出了一種基于OLT和ONU相互協(xié)作的ONU故障管理機(jī)制。該機(jī)制通過在OLT和ONU的OAM層和多點(diǎn)控制協(xié)議(MPCP)層部署Agent,實(shí)現(xiàn)OLT和ONU的相互協(xié)作,生成發(fā)光時(shí)長(zhǎng)模型,并由OLT和ONU相互協(xié)作進(jìn)行更新。基于發(fā)光時(shí)長(zhǎng)模型,OLT和ONU分別進(jìn)行主動(dòng)控制和自動(dòng)控制,提高了故障管理的準(zhǔn)確性和及時(shí)性。
2 問題分析
PON 技術(shù)具有節(jié)省光路資源、動(dòng)態(tài)分配帶寬等諸多優(yōu)點(diǎn),但是,ONU的發(fā)光異常,容易導(dǎo)致其他ONU上行信號(hào)受到干擾,影響PON系統(tǒng)的穩(wěn)定運(yùn)行。導(dǎo)致ONU發(fā)光異常的主要原因是ONU(光網(wǎng)絡(luò)單元)的軟件故障或者硬件故障,導(dǎo)致ONU不能在允許的時(shí)間范圍內(nèi)進(jìn)行發(fā)光。另一方面,在PON系統(tǒng)傳輸距離延伸之后,ONU上行數(shù)據(jù)經(jīng)過OEO-GEPON設(shè)備后連接到OLT,使得OLT與ONU的發(fā)光信號(hào)協(xié)商更容易出現(xiàn)問題。在發(fā)生PON上行鏈路干擾故障時(shí),ONU會(huì)出現(xiàn)長(zhǎng)時(shí)間發(fā)光、不在OLT指定的時(shí)間限制內(nèi)發(fā)光、短時(shí)發(fā)光或任意發(fā)光等幾種故障癥狀。
從上述現(xiàn)象可知,為了有效解決ONU故障導(dǎo)致的PON系統(tǒng)運(yùn)行問題,需要收集故障和癥狀特征,并分析其之間的關(guān)系,從而建立故障和癥狀特征之間的關(guān)聯(lián)關(guān)系,解決GEPON系統(tǒng)的上行鏈路受干擾的問題。另外,該解決問題的方法既相對(duì)容易實(shí)現(xiàn),而且可保證結(jié)果的可靠性。所以,為提高本文提出的ONU故障管理機(jī)制的可用性和有效性,本文基于現(xiàn)有的EPON協(xié)議參考模型,進(jìn)行優(yōu)化和調(diào)整后提出新的ONU故障診斷模型。
3 ONU故障診斷模型
3.1 模型基礎(chǔ)架構(gòu)
現(xiàn)有的EPON協(xié)議的參考模型中數(shù)據(jù)鏈路層如下圖1所示。與本文研究比較相關(guān)的是OAM 子層、多點(diǎn)MAC控制子層[6]。其中,OAM 子層是指負(fù)責(zé)網(wǎng)絡(luò)的運(yùn)營(yíng)和維護(hù)的子層,主要實(shí)現(xiàn)PON網(wǎng)絡(luò)的實(shí)時(shí)監(jiān)控和維護(hù)工作。多點(diǎn)MAC控制子層是指負(fù)責(zé)網(wǎng)絡(luò)接入控制的子層,主要按照多點(diǎn)控制協(xié)議(MPCP),實(shí)現(xiàn)OLT下的所有ONU的光路資源分配等功能。其中, 在IEEE 802.3 標(biāo)準(zhǔn)中定義了多點(diǎn)控制協(xié)議(MPCP) [7]。
3.2 ONU故障管理模型
從ONU故障原因和癥狀分析可知,OLT和ONU之間的控制消息受到影響和ONU發(fā)光故障是導(dǎo)致ONU上行鏈路干擾的主要原因。所以,本文提出的ONU故障管理模型優(yōu)化思路為: 基于OLT與ONU間進(jìn)行協(xié)作, 提高OLT和ONU之間的控制消息的可靠性和穩(wěn)定性。基于此,本文提出的ONU故障管理模型需要滿足下面幾個(gè)目標(biāo): 1)當(dāng)OLT和ONU的光路受到干擾時(shí),也可以對(duì)ONU進(jìn)行控制。2)OLT與ONU支持遠(yuǎn)程管理協(xié)議。 3)在ONU出現(xiàn)故障時(shí),可以通過打開和關(guān)閉發(fā)光器的方式、打開和關(guān)閉電源的方式進(jìn)行遠(yuǎn)程控制ONU。 4)基于決策樹、支持向量機(jī)等算法,實(shí)現(xiàn)自動(dòng)化檢測(cè)并告警,定位到具體的故障ONU。
為了實(shí)現(xiàn)上述ONU故障管理模型目標(biāo),本文提出的ONU故障管理模型如下圖2所示。在OAM 子層,增加OLT OAM Agent和ONU OAM Agent,其中,ONU OAM Agent從業(yè)務(wù)、發(fā)光、電源,三個(gè)方面,對(duì)ONU進(jìn)行自主控制;實(shí)現(xiàn)故障的自診斷、自管理。OLT OAM Agent從業(yè)務(wù)、發(fā)光、電源,三個(gè)方面,對(duì)ONU進(jìn)行主動(dòng)控制;實(shí)現(xiàn)故障的遠(yuǎn)程診斷、遠(yuǎn)程管理。在多點(diǎn)MAC控制子層,增加OLT MPCP Agent和ONU MPCP Agent,其中,OLT MPCP Agent基于OAM Agent的主動(dòng)管理能力,將發(fā)現(xiàn)的問題和采取的行動(dòng)發(fā)送給MPCP層,有助于MPCE層進(jìn)行數(shù)據(jù)的發(fā)送和接收。ONU MPCP Agent基于OAM Agent的自主管理能力,將發(fā)現(xiàn)的問題和采取的行動(dòng)發(fā)送給MPCP層,有助于MPCE層進(jìn)行數(shù)據(jù)的發(fā)送和接收。
基于ONU故障管理模型,OLT 和ONU相互協(xié)作,完成ONU的發(fā)現(xiàn)、注冊(cè)、測(cè)距、定時(shí)、上行動(dòng)態(tài)帶寬分配等工作。在OLT 側(cè):OLT不但實(shí)現(xiàn) 對(duì)ONU 進(jìn)行發(fā)現(xiàn)、注冊(cè)、認(rèn)證、測(cè)距、定時(shí)等功能,并且基于歷史信息,挖掘各ONU的業(yè)務(wù)特點(diǎn),有助于確定MPCP(多點(diǎn)控制協(xié)議)的時(shí)間分配。例如,當(dāng)業(yè)務(wù)突然異常時(shí),可以對(duì)發(fā)光時(shí)間進(jìn)行調(diào)整。如業(yè)務(wù)無異常,但發(fā)光時(shí)間變化,需要啟動(dòng)故障診斷算法進(jìn)行故障診斷。在ONU側(cè):主要完成業(yè)務(wù)上報(bào)、發(fā)光時(shí)長(zhǎng)調(diào)整、定時(shí)向 OLT報(bào)告擁塞狀態(tài)等功能。如業(yè)務(wù)需要調(diào)整,發(fā)送消息給OLT側(cè),請(qǐng)求調(diào)整發(fā)光時(shí)長(zhǎng)。
4 基于ONU故障管理模型的故障管理機(jī)制
4.1 基于ONU故障管理模型的故障管理機(jī)制
基于ONU故障管理模型的故障管理機(jī)制分為2個(gè)級(jí)別。第一個(gè)級(jí)別是ONU側(cè)Agent的自主故障管理機(jī)制,第二個(gè)級(jí)別是OLT側(cè)Agent的主動(dòng)故障管理機(jī)制。下面分別進(jìn)行介紹。
1) ONU側(cè)Agent的自主故障管理機(jī)制:ONU根據(jù)發(fā)光時(shí)長(zhǎng)模型,自主確定是否在時(shí)限內(nèi)發(fā)光。如不在其允許的發(fā)光時(shí)間內(nèi)發(fā)光,ONU自主關(guān)閉發(fā)光器。如果關(guān)閉發(fā)光器失敗,ONU關(guān)閉發(fā)光器電源。
2) OLT側(cè)Agent的主動(dòng)故障管理機(jī)制:首先,OLT根據(jù)發(fā)光時(shí)長(zhǎng)模型,主動(dòng)確定相連接的ONU是否在時(shí)限內(nèi)發(fā)光。如某個(gè)或某些ONU不在其允許的發(fā)光時(shí)間內(nèi)發(fā)光,主動(dòng)發(fā)送關(guān)閉發(fā)光器信息給相關(guān)的ONU,并檢測(cè)ONU是否關(guān)閉發(fā)光器,,如沒有,則下發(fā)相關(guān)ONU關(guān)閉電源的信息。
從上述分析可知, 發(fā)光控制機(jī)制是故障診斷的關(guān)鍵,下面進(jìn)行介紹。
4.2 發(fā)光控制機(jī)制
OLT對(duì)ONU的發(fā)光控制可分為靜態(tài)帶寬分配、動(dòng)態(tài)帶寬分配(DBA)2種。靜態(tài)帶寬分配即固定帶寬分配,雖然簡(jiǎn)單,但是帶寬資源利用率較低。DBA可以根據(jù)各個(gè)ONU業(yè)務(wù)的需求和OLT資源情況,動(dòng)態(tài)地進(jìn)行對(duì)光路資源進(jìn)行調(diào)整,從而提高了帶寬資源利用率。所以,現(xiàn)有場(chǎng)景中,發(fā)光控制以DBA為主。
本文在現(xiàn)有基礎(chǔ)上,通過OLT側(cè)Agent和ONU側(cè)Agent的協(xié)作,提出一種基于ONU故障管理模型的發(fā)光控制機(jī)制,如圖3所示。該機(jī)制主要包括下面五個(gè)過程:1)業(yè)務(wù)調(diào)整請(qǐng)求:當(dāng)ONU的業(yè)務(wù)調(diào)整時(shí),ONU側(cè)OAM層的Agent向OLT側(cè)OAM層的Agent提交業(yè)務(wù)調(diào)整信息;2)業(yè)務(wù)調(diào)整:OLT側(cè)OAM層的Agent向MPCP層的Agent提出發(fā)光時(shí)長(zhǎng)調(diào)整請(qǐng)求;3)發(fā)光時(shí)長(zhǎng)調(diào)整:OLT側(cè)MPCP層的Agent基于發(fā)光時(shí)長(zhǎng)調(diào)整信息,請(qǐng)求對(duì)發(fā)光時(shí)長(zhǎng)模型進(jìn)行創(chuàng)建和更新;4)發(fā)光時(shí)長(zhǎng)模型創(chuàng)建和更新:基于新需求,創(chuàng)建或更新現(xiàn)有的發(fā)光時(shí)長(zhǎng)模型;5)發(fā)光時(shí)長(zhǎng)控制:ONU側(cè)MPCP層Agent接收OLT側(cè)MPCP層Agent的發(fā)光控制指令,按照分配的時(shí)限進(jìn)行發(fā)光。
4.3 ONU故障管理機(jī)制性能分析
下面從ONU硬件故障和軟件故障兩個(gè)方面,對(duì)基于ONU故障管理模型的故障管理機(jī)制進(jìn)行分析。
在ONU硬件故障方面:硬件故障一般是由于ONU硬件出現(xiàn)故障,光發(fā)射機(jī)打開后無法關(guān)閉導(dǎo)致。本文提出的故障管理機(jī)制,可以通過關(guān)閉發(fā)光器、關(guān)閉電源的措施,有效解決長(zhǎng)發(fā)光、漏光、加電啟動(dòng)或復(fù)位的問題。在ONU軟件故障方面:軟件故障一般是因?yàn)闀r(shí)鐘不準(zhǔn)或ONU對(duì)光模塊的開關(guān)操作時(shí)間過長(zhǎng)、ONU 與OLT時(shí)鐘存在偏差或硬件參數(shù)配置錯(cuò)誤導(dǎo)致。本文提出的故障管理機(jī)制,可以通過ONU和OLT在OAM層的協(xié)商,更加有效地確保時(shí)鐘一致,有效解決了時(shí)鐘偏差等問題。
5 結(jié)束語
PON 技術(shù)具有節(jié)省光路資源、動(dòng)態(tài)分配帶寬等諸多優(yōu)點(diǎn)。但是,PON系統(tǒng)的上行鏈路易受到干擾,導(dǎo)致PON 鏈路遭到破壞進(jìn)而崩潰,嚴(yán)重威脅到PON的穩(wěn)定和安全。在PON系統(tǒng)傳輸距離延伸之后,這個(gè)問題更加嚴(yán)重威脅著PON的穩(wěn)定運(yùn)行。本文提出一種基于OLT和ONU相互協(xié)作的ONU故障管理機(jī)制。通過從ONU硬件故障和軟件故障兩個(gè)方面,對(duì)基于ONU故障管理模型的故障管理機(jī)制進(jìn)行分析可知,本文提出的ONU故障管理機(jī)制很好地解決了現(xiàn)有ONU故障管理的問題,提高了故障管理的準(zhǔn)確性和及時(shí)性。
參考文獻(xiàn):
[1] 張歐. 光纜線路的故障分析及障礙處理[J]. 中國(guó)管理信息化, 2015(18):84-85.
[2] 顧林君, 沈元隆. 下一代無源光網(wǎng)絡(luò)技術(shù)[J]. 通信技術(shù), 2010(9):95-97.
[3] 程洪. GEPON系統(tǒng)的長(zhǎng)距離傳輸技術(shù)方案探討[J]. 電子世界, 2015(23):160-161.
[4] 于金輝, 余辰東. PON網(wǎng)絡(luò)中的ONU 干擾問題研究[J]. 光通信研究, 2015(4):19-21.
[5] 余辰東. PON網(wǎng)絡(luò)中的ONU 干擾問題研究[J]. 光通信研究, 2017(1):23-26.
[6] 張鵬, 閻闊. FTTX PON技術(shù)與應(yīng)用[M]. 北京: 人民郵電出版社, 2010.
[7] 王宏偉, 陳明華, 謝世鐘. 智能電網(wǎng)用電信息采集系統(tǒng)EPON DBA 算法研究[J]. 光通信技術(shù), 2014(2):16-18.