黃宏棟,劉中健,詹鵬飛,孔鎮(zhèn)
(1 中國(guó)移動(dòng)通信集團(tuán)廣東有限公司,廣州 510640;2 中國(guó)移動(dòng)通信集團(tuán)公司,北京 100032)
邊緣節(jié)點(diǎn)定義為:子網(wǎng)路徑對(duì)接的參考點(diǎn)為邊緣節(jié)點(diǎn)。本文中的子網(wǎng)路徑限定為子網(wǎng)中一個(gè)邊界出口到另一個(gè)邊界出口的連接(如圖1)。具體到國(guó)際電路構(gòu)成中的子網(wǎng)路徑就存在封閉子網(wǎng)路徑、半開子網(wǎng)路徑以及全開子網(wǎng)路徑,所謂封閉子網(wǎng)路徑就是源目出口在同一個(gè)子網(wǎng)內(nèi)且能夠在現(xiàn)有網(wǎng)管中進(jìn)行管理,半開子網(wǎng)路徑僅部分能夠在自有網(wǎng)管中進(jìn)行管理(如離境系統(tǒng)),全開子網(wǎng)路徑也即黑匣子路徑,由第三方提供,無(wú)法在自有網(wǎng)管對(duì)其監(jiān)管。
圖1 子網(wǎng)路徑
基于上面的定義,邊緣節(jié)點(diǎn)根據(jù)電路的不同而不同,可以通過程序自動(dòng)進(jìn)行判斷,如一般情況下半開子網(wǎng)路徑與封閉子網(wǎng)路徑的對(duì)接點(diǎn)為離境系統(tǒng)的邊緣節(jié)點(diǎn),封閉子網(wǎng)路徑與封閉子網(wǎng)路徑的對(duì)接點(diǎn)為兩個(gè)骨干網(wǎng)的邊緣節(jié)點(diǎn),全開子網(wǎng)路徑與封閉子網(wǎng)絡(luò)經(jīng)的對(duì)接點(diǎn)為骨干網(wǎng)與省干或其他租用電路的邊緣節(jié)點(diǎn)。
國(guó)際業(yè)務(wù)電路由各運(yùn)營(yíng)商提供的域內(nèi)電路(下稱運(yùn)營(yíng)商電路)級(jí)聯(lián)構(gòu)成,如一條香港—法蘭克福的電路由中國(guó)移動(dòng)提供的以諸如香港—蒙古國(guó)x電路、俄羅斯電信電路以及其他運(yùn)營(yíng)商提供的運(yùn)營(yíng)商電路串接而成,最終形成一條從香港到法蘭克福的端到端的國(guó)際業(yè)務(wù)傳輸通道。運(yùn)營(yíng)商電路是由運(yùn)營(yíng)商或服務(wù)商提供的域內(nèi)電路,其定義為一序列子網(wǎng)路徑聚合組成(如圖2所示)。
路徑由A端出口、Z端出口以及路由組成,路由由直達(dá)通道和交叉連接組成(如圖3所示)。
段即通常所說(shuō)的再生段和復(fù)用段,本文特指復(fù)用段。
圖2 電路與路徑示例
圖3 路徑
直達(dá)通道即兩個(gè)相鄰交叉矩陣之間的ODU通道,如波道為100 Gbit/s帶寬OTN的相鄰兩個(gè)OTU4終結(jié)點(diǎn)之間的ODU4通道(未經(jīng)解復(fù)用也未經(jīng)交叉連接)以及ODU4通道解復(fù)用出來(lái)的ODU2、ODU1、ODU0子通道(未經(jīng)解復(fù)用也未經(jīng)交叉連接)。
在對(duì)華為、中興和烽火OTN告警信號(hào)流進(jìn)行分析后總結(jié)得出:在單個(gè)子網(wǎng)路徑的情況下,本端支路側(cè)引入的告警,在子網(wǎng)路徑另一端支路側(cè)產(chǎn)生對(duì)告或直接下插到客戶設(shè)備,如圖4(1)中A站的client(支路)側(cè)接收到的R_LOS(信號(hào)丟失)、R_LOF(幀丟失)、MSAIS(復(fù)用段告警指示信號(hào))在B站client(支路)側(cè)出現(xiàn)REM_SF(遠(yuǎn)端信號(hào)失效),相應(yīng)的在B站的客戶設(shè)備上呈現(xiàn)出R_LOF和MS-AIS告警,而A站的client側(cè)接收到誤碼則直接傳送到B站客戶設(shè)備。在子網(wǎng)路徑中間部分檢測(cè)到的通道級(jí)告警在本子網(wǎng)路徑末端的支路側(cè)不一定會(huì)有告警,而支路側(cè)對(duì)接的客戶設(shè)備會(huì)檢測(cè)到告警,通道級(jí)性能告警在下游客戶設(shè)備上的體現(xiàn)為檢測(cè)到誤碼,在圖4(1)中B站的WDM(波分)側(cè)收到的性能告警DEG(劣化)、EXC(超門限)在B站支路側(cè)沒有告警,但B站客戶設(shè)備上接收到信號(hào)誤碼,而B站的WDM(波分)側(cè)收到的通道級(jí)故障告警AIS(告警指示信號(hào))、LOM(復(fù)幀丟失)、LOF(幀丟失)、OCI(開放連接指示,一般是缺少交叉連接造成)、LOS(信號(hào)丟失)以及LCK(維護(hù)鎖定)在B站支路側(cè)也沒有告警,但B站客戶設(shè)備上接收到R_LOF告警。
國(guó)際電路通常由多個(gè)子網(wǎng)路徑串聯(lián)組成,上游子網(wǎng)路徑的告警會(huì)影響下游子網(wǎng)路徑告警的呈現(xiàn),將電路按照上述模型切分成多條子網(wǎng)路徑進(jìn)行迭代分析。即將圖4(1)中的客戶設(shè)備替換為下游子網(wǎng)路徑進(jìn)行分析,如圖4(2)。從圖4(2)中可以看出,此時(shí)子網(wǎng)路徑2的B站支路側(cè)接收到從子網(wǎng)路徑1傳送過來(lái)的告警信號(hào),然后子網(wǎng)路徑2按照上述規(guī)則將告警傳送到C站客戶設(shè)備或下游子網(wǎng)路徑的C站支路側(cè)。
根據(jù)上述分析結(jié)論,本算法的核心思想為:通過檢測(cè)支路側(cè)告警來(lái)定位根源故障所在的子網(wǎng)路徑,找到根源子網(wǎng)路徑后根據(jù)告警信號(hào)流確定具體的“段”位置,結(jié)合光層告警信號(hào)流關(guān)系,找到真正的故障源。
(1) 當(dāng)告警為OTU 級(jí)別以上的告警,設(shè)置該段子通道相關(guān)聯(lián)的電路的通道級(jí)級(jí)電路級(jí)告警予以忽略,進(jìn)行光層根源告警分析;
(2) 根據(jù)告警端口找到關(guān)聯(lián)電路,切分成多個(gè)串聯(lián)的子網(wǎng)路徑;
(3) 定位故障所在的子網(wǎng)路徑,具體分析見3.2;
(4) 定位根源告警所在的段;
(5) 分析光層故障(如果是光層故障)位置。
圖4 級(jí)聯(lián)子網(wǎng)路徑電路告警信號(hào)流迭代分析
路由中每段是否存在支路告警,支路端口關(guān)鍵告警如表1所示。本次研究的對(duì)象為國(guó)際電路,目前承載在OTN網(wǎng)絡(luò)上的國(guó)際專線主要以STM-64、10 GE WAN和10 GE LAN為主,因此本研究以這三大類特征研究為重點(diǎn),關(guān)注的也為常見告警:非OTN信號(hào)支路側(cè)信號(hào)以及子網(wǎng)通道級(jí)的OTUk層告警:OTUk_AIS、OTUk_LOM、OTUk_LOF、OTUk_TIM ODUk_PM_AIS和ODUk層告警:ODUk_PM_OCI、ODUk_PM_LCK、OTUk_DEG、ODUk_PM_DEG。
3.2.1 華為告警信號(hào)流規(guī)律總結(jié)
當(dāng)告警發(fā)生在中間通道時(shí)(子網(wǎng)路徑中間)時(shí),在下游站支路側(cè)要么沒有告警,要么看不到告警(透?jìng)鞯较掠蜗噜徸泳W(wǎng)路徑或客戶設(shè)備),當(dāng)告警從本站支路側(cè)引入時(shí),對(duì)端站支路側(cè)沒有告警或者包含告警REM_SF(遠(yuǎn)端信號(hào)失效)/REM_SD(遠(yuǎn)端信號(hào)劣化),故確定是否支路告警以A站支路側(cè)告警檢測(cè)為主,B站支路側(cè)告警用于確認(rèn)和復(fù)核,或在半開路徑中用于確認(rèn)是否為外部引起,如離境電路,可在境內(nèi)落地支路口觀測(cè)告警是否存在REM_SF或REM_SD。
表1 支路側(cè)關(guān)鍵告警
3.2.2 中興告警信號(hào)流規(guī)律總結(jié)
本站支路側(cè)引入的告警在對(duì)端站支路側(cè)體現(xiàn)為OPU_CSF或與本站支路側(cè)一樣,即復(fù)制了本站支路側(cè)告警(如RS_DEG、B1_SD、MS-AIS),如果告警為中間通道引入,在下游站支路側(cè)告警體現(xiàn)為包含ODU_AIS或沒有告警。因此在程序處理時(shí),處理方法與華為區(qū)別不大。
3.2.3 烽火告警信號(hào)流規(guī)律總結(jié)
烽火本站支路側(cè)引入告警在末站支路側(cè)告警體現(xiàn)為Port_OPU2告警,且告警體現(xiàn)為FDI、RS_LOF、RS_SD、REM_FAULT;中間通道引入的告警體現(xiàn)為PORT_ODU2(性能類)和PORT_OPU2:PLM(故障類)且在相關(guān)的線路側(cè)有ODU級(jí)AIS告警,告警處理方法也與華為類似。
綜上,區(qū)分告警屬于本路徑內(nèi)還是其他路徑引入是可以程序?qū)崿F(xiàn)的,算法偽代碼如圖5。算法的思路為:
(1) 對(duì)電路組成中的每條子網(wǎng)路徑,確定子網(wǎng)設(shè)備的提供商,根據(jù)設(shè)備商設(shè)置入支路口特征告警、出支路口特征告警以及通道特征告警。
(2) 檢查子網(wǎng)路徑的類型,設(shè)置子網(wǎng)類型參數(shù)。
(3) 根據(jù)子網(wǎng)類型和特征告警定位根源告警所在的子網(wǎng)。
對(duì)封閉類型:如果入支路口有路徑特征告警或出支路口有路徑特征告警,則檢查上游子網(wǎng)路徑,如有通道特征告警或出支路口有通道故障特征告警,在本子網(wǎng)查找根源告警。
對(duì)半開類型:如果出支路口有路徑特征告警或前一段子網(wǎng)路徑的入支路口檢查到路徑特征告警,判斷為半開路徑另外一端的問題,如果有通道特征告警或出支路口有通道故障特征告警,在本子網(wǎng)查找根源告警。
圖5 算法偽代碼
對(duì)全開路徑,程序發(fā)出提示。
在確定根源告警所在的子網(wǎng)路徑后,就可以通過分析通道告警確定告警的根源位置。
展開本段子網(wǎng)路徑模型形成樹形結(jié)構(gòu),依次為子網(wǎng)路徑、低階ODU通道、高階ODU通道、OTU、OMS、OTS。
根據(jù)通道正向第一個(gè)主告警與反方向第一個(gè)BDI確定告警的所在的低階直達(dá)ODU通道。
依次往高階通道查找:正向第一個(gè)主告警與反方向第一個(gè)BDI確定告警的所在的該級(jí)直達(dá)ODU通道,直到?jīng)]有更高階的ODU或OTU告警或性能告警。
如果最后確定的告警位置為ODU層級(jí),檢查是否OCI、LCK或TIM,如果是,提示檢查對(duì)應(yīng)的交叉連接、鎖定操作以及跟蹤設(shè)置,如果是其他通道告警,提示檢查其他如幀配置等并檢查是否存在硬件故障。
如果前述步驟確定的告警位置為OTU層級(jí),按照OTU→OMS→OTS依次檢查告警或性能。
如果最后確定的告警位置為OTU層級(jí),則建議檢查單波性能和故障,單波性能可通過程序比較性能基線(參考值),看是否存在變動(dòng),如性能無(wú)變化,提升檢查是否為硬件問題(如OTU4_LOF可能因?yàn)镹S4板隱性故障引起)。
如最后確定的告警位于OTS段,則檢查是否光纜中斷或性能劣化,性能檢查通過比較基線數(shù)據(jù)(參考值)或比較變動(dòng)值發(fā)現(xiàn)。
國(guó)際傳輸專線組網(wǎng)具有其獨(dú)有的特性,基于其特性,本文定義了便于機(jī)器判斷的邊緣節(jié)點(diǎn)、電路、路徑以及段和直達(dá)通道,在這些基本定義的基礎(chǔ)上,通過迭代分析告警信號(hào)流傳遞的規(guī)律,總結(jié)從電路層到路徑層、通道層,然后到光層,依次分析告警或故障的根源因素,給出了機(jī)器可實(shí)現(xiàn)的故障定位算法。
[1] 凌海燕,劉志增,王毅,等. 國(guó)際傳輸系統(tǒng)的保護(hù)策略與應(yīng)用[J]. 數(shù)字通信世界, 2013(10):60-62.
[2] 劉新宇. 國(guó)際SDH傳輸系統(tǒng)的設(shè)計(jì)規(guī)劃與網(wǎng)絡(luò)保護(hù)模式的探討[D].北京:北京郵電大學(xué),2010.
[3] 葉胤. 國(guó)際傳輸網(wǎng)絡(luò)組網(wǎng)方案探討[J]. 電信工程技術(shù)與標(biāo)準(zhǔn)化, 2008,21(5):47-50.
[4] 沈青,孟凡,王瑋,等. 超高速、超長(zhǎng)距傳輸系統(tǒng)性能分析[J].電信工程技術(shù)與標(biāo)準(zhǔn)化, 2017,30(7):78-81.