袁福橋 裴俊芳
ECC路由不通導(dǎo)致傳輸網(wǎng)元脫管故障分析及排除
袁福橋*裴俊芳*
嵌入式控制通道(ECC,),用于SDH網(wǎng)元間通信,傳送TMN信息,實(shí)現(xiàn)網(wǎng)管對非網(wǎng)關(guān)網(wǎng)元的管理。通過對一例ECC路由不通導(dǎo)致傳輸網(wǎng)元脫管的故障進(jìn)行分析,了解ECC原理,掌握ECC故障處理的方法和技巧。
嵌入式控制通道;通信;信息
嵌入式控制通道(ECC,Embedded Control Channel),用于SDH網(wǎng)元間通信,傳送TMN信息,實(shí)現(xiàn)網(wǎng)管對非網(wǎng)關(guān)網(wǎng)元的管理。在2個(gè)SDH網(wǎng)元之間光纖連接時(shí),一般使用段開銷的再生段DCC字節(jié)傳送TMN信息。網(wǎng)關(guān)網(wǎng)元和非網(wǎng)關(guān)網(wǎng)元的通信過程:首先網(wǎng)管和網(wǎng)關(guān)網(wǎng)元通過TCP/IP協(xié)議傳遞信息,然后網(wǎng)關(guān)網(wǎng)元和非網(wǎng)關(guān)網(wǎng)元通過ECC通信,最后實(shí)現(xiàn)網(wǎng)管和非網(wǎng)關(guān)網(wǎng)元的通信。下面對一例ECC路由不通導(dǎo)致傳輸網(wǎng)元脫管的故障進(jìn)行分析,了解ECC原理,掌握ECC故障處理的方法和技巧。
如圖1所示,站點(diǎn)A和站點(diǎn)B是網(wǎng)關(guān)網(wǎng)元,傳輸設(shè)備為華為OSN3500。其余站點(diǎn)為非網(wǎng)關(guān)網(wǎng)元,傳輸設(shè)備為華為OSN2000。站點(diǎn)1至站點(diǎn)5采用的主用網(wǎng)關(guān)網(wǎng)元是站點(diǎn)A,備用網(wǎng)關(guān)網(wǎng)元是站點(diǎn)B。ECC子網(wǎng)內(nèi)有主備2個(gè)網(wǎng)關(guān)。站點(diǎn)1—站點(diǎn)2—站點(diǎn)3—站點(diǎn)4—站點(diǎn)5構(gòu)成二纖雙向復(fù)用段保護(hù)環(huán),傳輸光纜采用雙徑路組環(huán)保護(hù),傳輸設(shè)備主要板件采取冗余或“1+1”保護(hù)。
2011年6月,值班人員巡視傳輸網(wǎng)管發(fā)現(xiàn)站點(diǎn)3收站點(diǎn)4有R_LOS告警,且站點(diǎn)4、站點(diǎn)5傳輸網(wǎng)元脫管。復(fù)用段倒換狀態(tài)正常,業(yè)務(wù)未受影響。當(dāng)R_LOS告警消除,網(wǎng)元脫管現(xiàn)象也恢復(fù)正常。過了不久,再次發(fā)生站點(diǎn)3、站點(diǎn)4、站點(diǎn)5傳輸脫管,業(yè)務(wù)未受影響。復(fù)位站點(diǎn)3的主控板后,脫管告警消失。
圖1 二纖雙向復(fù)用段保護(hù)環(huán)組網(wǎng)示意圖
ECC通道是通過發(fā)端并發(fā)、收端選擇方式建立路由。選擇的原則是根據(jù)最短路徑建立路由,最短路徑不是指地理上的距離,而是邏輯表中的邏輯距離即間隔站點(diǎn)的數(shù)量。比如,網(wǎng)管登錄站點(diǎn)5有2條路徑,一條是從站點(diǎn)5-1-2-A的短路徑;另一條是從站點(diǎn)5-4-3-2-A的長路徑,以間隔站點(diǎn)的數(shù)量來確定長短路徑。在環(huán)網(wǎng)中,如果站點(diǎn)1至站點(diǎn)5的短路徑有問題,網(wǎng)管可以通過長路徑登錄站點(diǎn)5。所以不能以能否登錄網(wǎng)元來判斷ECC是否正常,應(yīng)在網(wǎng)管中查看ECC路由,發(fā)現(xiàn)走長路徑時(shí)就應(yīng)查找原因。
ECC路由不通,有外部原因,比如供電電源掉電、供電電壓過低;或光纖傳輸性能劣化,損耗過高或中斷,尾纖頭臟或者松動(dòng),會(huì)在光路上產(chǎn)生大量的誤碼。首先應(yīng)排除外部因素,然后檢查設(shè)備SCC板、光板。對于ECC問題,可從不能登錄的站點(diǎn)入手。如果站點(diǎn)4、5不能登錄,故障可以定位到站點(diǎn)5和站點(diǎn)1。不僅分析登錄不上的站點(diǎn),還要分析其上游站點(diǎn)。
1.檢查站點(diǎn)5的SCC板是否硬件故障,主要是查看SCC板的紅綠燈閃爍是否正常:紅燈長亮表明SCC板硬件故障,綠燈快閃表明SCC在復(fù)位,綠燈長亮表明SCC板死機(jī)。如果有以上情況,按SCC的“RST”按紐或拔插一下,再觀察,還不行則須更換SCC板。
2.如果SCC板閃燈正常,也可以嘗試復(fù)位SCC板。先復(fù)位站點(diǎn)5的SCC板,若無效則復(fù)位站點(diǎn)1的SCC板。
復(fù)位方法:網(wǎng)管進(jìn)行軟件復(fù)位,按SCC板的“RST”復(fù)位按紐;硬件復(fù)位,拔、插SCC板。
3.若復(fù)位SCC板還無效,可將SCC板拔出,使ECC通道在本站穿通。即從西向光板直接穿通到東向光板,不經(jīng)過SCC板。檢查線路板穿通DCC字節(jié)是否有問題。
檢查光接口板有沒有告警,如有告警應(yīng)先查明告警原因,如光功率過低或光功率過高,否則用互換法、替換法,更換光接口板。
站點(diǎn)4、站點(diǎn)5傳輸網(wǎng)元脫管,但是傳輸業(yè)務(wù)未受影響,說明這2個(gè)網(wǎng)元沒有發(fā)生掉電或是斷纖,查看網(wǎng)元ID也正常。網(wǎng)元脫管恢復(fù)正常后,用cm-get-chanerror命令查看站點(diǎn)5和站點(diǎn)1,RECV-ERRORS數(shù)值為0,說明光板無誤碼。
正常情況下無論是站點(diǎn)3或站點(diǎn)4出現(xiàn)故障,在復(fù)用段保護(hù)倒換成功,業(yè)務(wù)不受影響的情況下,從出現(xiàn)故障的后幾個(gè)網(wǎng)元可以通過并發(fā)選收的ECC路徑登錄網(wǎng)元,根據(jù)最短路徑建立路由。
1.查詢光板狀態(tài)。確認(rèn)每個(gè)光板是否正確分配了通道,用命令行cm-get-bdinfo查詢站點(diǎn)5光板通道分配情況,如表1所示。
表1 查詢站點(diǎn)5光板通道分配情況
返回結(jié)果是站點(diǎn)5對應(yīng)站點(diǎn)1的28槽光板的D1-D3字節(jié)為收發(fā)正常。查詢站點(diǎn)5對應(yīng)站點(diǎn)1的DCC通道使能,且通信狀態(tài)收正常,用cm-getchaninfo命令確認(rèn)通道信息是否正常。返回結(jié)果如表2所示。
表2 查詢站點(diǎn)5通道信息
返回的DNEID值(目的網(wǎng)元ID)為0,說明站點(diǎn)5西向光板對應(yīng)的目標(biāo)網(wǎng)元為0,站點(diǎn)5—站點(diǎn)1沒有ECC路徑。通過網(wǎng)管查詢站點(diǎn)5網(wǎng)元ECC鏈路管理,只有1條且距離為0,目標(biāo)網(wǎng)元號(hào)為站點(diǎn)4的ECC鏈路,而目標(biāo)網(wǎng)元站點(diǎn)1的距離不為0。說明ECC走了長路徑。同理:查詢站點(diǎn)1對應(yīng)站點(diǎn)5的DCC通道使能,且通信狀態(tài)收正常,查詢站點(diǎn)1網(wǎng)元ECC通信鏈路時(shí),查詢不到距離為0目標(biāo)網(wǎng)元站點(diǎn)5的鏈路。沒有遵循最短路徑原則。故障定位在站點(diǎn)5和站點(diǎn)1之間。
2.檢查站點(diǎn)5和站點(diǎn)1的SCC板狀態(tài)燈。顯示正常,通過復(fù)位2個(gè)網(wǎng)元的SCC板后,站點(diǎn)5到站點(diǎn)1的短路徑仍舊不通。為了進(jìn)一步判斷故障原因,分別將站點(diǎn)5和站點(diǎn)1的SCC板拔出,使ECC通道在本站穿通,查看故障現(xiàn)象仍未消除。
3.故障定位在站點(diǎn)1東向光板和站點(diǎn)5西向光板之間。對這2個(gè)光板分別復(fù)位,再做倒換測試,查看各站登錄情況。對站點(diǎn)1東向光板復(fù)位,故障依然。對站點(diǎn)5西向光板復(fù)位,故障消除。說明是站點(diǎn)5西向光板接觸不良所致,復(fù)位即可消除故障。
實(shí)際上,有很多情況會(huì)導(dǎo)致網(wǎng)元雖然有光纖相連,但ECC卻不通,在處理ECC不通故障時(shí)要注意以下幾個(gè)方面。
1.拔插光板將導(dǎo)致相關(guān)業(yè)務(wù)中斷,慎用拔插和復(fù)位光板,建議在夜間小業(yè)務(wù)量時(shí)進(jìn)行。
2.線路誤碼及系統(tǒng)工作環(huán)境溫度,可能引起系統(tǒng)光板和SCC板間DCC配合時(shí)序混亂及軟硬件死鎖,會(huì)導(dǎo)致系統(tǒng)ECC單向通或ECC全斷,因此通過復(fù)位主控板或線路板解決ECC不通的問題。
3.ECC路由的分配與業(yè)務(wù)配置無關(guān),但與光接口板的環(huán)回狀態(tài)有關(guān),在對遠(yuǎn)端站點(diǎn)進(jìn)行VC-4級別的遠(yuǎn)端環(huán)回時(shí),若是對第一個(gè)VC-4環(huán)回,也可能會(huì)切斷ECC通信,因此在環(huán)回第一個(gè)VC-4時(shí)需要特別注意。光纖相連的2個(gè)網(wǎng)元的對應(yīng)光口是否設(shè)置了環(huán)回,設(shè)置了環(huán)回是不能進(jìn)行ECC通信的。
4.如果所有網(wǎng)元無法登錄,故障不會(huì)出在網(wǎng)元之間的ECC通信,而是在網(wǎng)管計(jì)算機(jī)和網(wǎng)關(guān)網(wǎng)元之間。檢查計(jì)算機(jī)和網(wǎng)關(guān)網(wǎng)元的IP地址,重啟計(jì)算機(jī),PING對方的IP地址等方式可解決問題。
5.拔出SCC板使ECC穿通。在ECC故障定位到某站的SCC板后為減小ECC故障的影響范圍,可以先將該站的SCC板拔出,使ECC通道在該站穿通,相當(dāng)于跳過了該站,這樣網(wǎng)管可以繼續(xù)登錄下游站點(diǎn)。
環(huán)網(wǎng)中網(wǎng)管通過網(wǎng)關(guān)網(wǎng)元登錄其他網(wǎng)元,所走的路徑為收發(fā)一致路由。若路由一切正常,網(wǎng)管通過網(wǎng)關(guān)網(wǎng)元登錄非網(wǎng)關(guān)網(wǎng)元,走環(huán)網(wǎng)上的短路徑;若短路徑不正常,走環(huán)網(wǎng)上的長路徑;若長、短路徑皆不正常,則不能登錄。因此,不能以是否能登錄網(wǎng)元判斷ECC正常與否,應(yīng)在網(wǎng)管中查看ECC路由,發(fā)現(xiàn)走長路徑時(shí)就應(yīng)查找原因,排除故障。
Embedded control channel is used for SDH network element communication to transfer TMN data,realizing the network management of non-gateway network elements.Through analyzing a failure case of transmission network element getting out of network management due to ECC route disconnection,it help the understanding of ECC principles,master ECC troubleshooting methods and techniques.
Embedded Control Channel;Communication;Information
*廣州通信段長沙南高鐵通信車間助理工程師,410000長沙
2011-10-13
(責(zé)任編輯:諸紅)