莊達(dá)希
(中國(guó)民用航空湛江空中交通管理站,廣東 湛江 524000)
民航通信網(wǎng)由一張傳輸網(wǎng)和兩張承載網(wǎng)組成,主要承接的業(yè)務(wù)包括民航綜合及專(zhuān)業(yè)業(yè)務(wù)、空管綜合管理業(yè)務(wù)、部分航空安全業(yè)務(wù)、臺(tái)站環(huán)動(dòng)監(jiān)控以及航空安全保障業(yè)務(wù)(雷達(dá)、甚高頻、轉(zhuǎn)報(bào)等)等。傳輸網(wǎng)采用的是雙星型架構(gòu),采用自有傳輸設(shè)備(華為的OptiX OSN系列設(shè)備),為承載網(wǎng)提供各種干線(xiàn)[1-3]。兩個(gè)承載網(wǎng)分別是IP網(wǎng)和時(shí)分復(fù)用(Time-Division Multiplexing,TDM)網(wǎng)。IP網(wǎng)主要承載大寬帶民航業(yè)務(wù),例如民航綜合管理業(yè)務(wù)等;TDM網(wǎng)主要承載與空管安全業(yè)務(wù)相關(guān)的窄帶IP業(yè)務(wù),包括雷達(dá)、甚高頻、轉(zhuǎn)報(bào)以及管制移交電話(huà)等[4]。
民航通信網(wǎng)光傳輸網(wǎng)是民航通信網(wǎng)的基礎(chǔ)傳送支撐平臺(tái),網(wǎng)絡(luò)覆蓋站點(diǎn)包括兩個(gè)網(wǎng)控中心、7個(gè)地區(qū)空管局、7個(gè)區(qū)域管制中心、民航局、民航空管局、十里河、37個(gè)空管分局/站、7個(gè)地區(qū)管理局、41個(gè)監(jiān)管局、兩個(gè)終端管制中心、6個(gè)機(jī)場(chǎng)航管樓以及176個(gè)民航運(yùn)輸機(jī)場(chǎng)等物理站點(diǎn),并部署傳輸設(shè)備、波分設(shè)備。
光傳輸網(wǎng)核心層采用雙星型結(jié)構(gòu),一級(jí)節(jié)點(diǎn)為北京、上海網(wǎng)控中心,二級(jí)節(jié)點(diǎn)為7個(gè)地區(qū)空管局和7個(gè)區(qū)域管制中心。傳輸網(wǎng)的匯聚層包含三級(jí)節(jié)點(diǎn)和37個(gè)空管分局/站。傳輸網(wǎng)的接入層包含民航局、空管局、7個(gè)管理局、41個(gè)監(jiān)管局以及各中小機(jī)場(chǎng)等節(jié)點(diǎn)。光傳輸網(wǎng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示。
圖1 光傳輸網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
光傳輸網(wǎng)采用華為的OSN系列設(shè)備。其中,一級(jí)節(jié)點(diǎn)和二級(jí)節(jié)點(diǎn)部署OSN7500設(shè)備;三級(jí)節(jié)點(diǎn)和各管理局、監(jiān)管局部署OSN3500設(shè)備;各民用機(jī)場(chǎng)部署OSN1500設(shè)備。下面以三級(jí)節(jié)點(diǎn)使用的OSN3500為例進(jìn)行介紹。OSN3500支架尺寸為722 mm(高)×497 mm(寬)×295 mm(深),結(jié)構(gòu)如圖2所示。
圖2 OSN3500設(shè)備結(jié)構(gòu)
OSN系列設(shè)備的板卡分為5大類(lèi),分別是同步數(shù)字體系(Synchronous Digital Hierarchy,SDH)單元、準(zhǔn) 同 步 數(shù) 字 體 系(Plesiochronous Digital Hierarchy,PDH)單元、以太網(wǎng)單元、交叉時(shí)鐘和系統(tǒng)控制單元以及常見(jiàn)輔助單元。SDH單元板卡的作用是連接光纖。PDH板卡的作用是連接E1/T1接口。以太網(wǎng)單元板卡提供以太網(wǎng)透?jìng)骰蚪粨Q的功能。時(shí)鐘交叉單元板卡集中了時(shí)鐘單元和交叉單元[5]。對(duì)于時(shí)鐘單元,其作用是跟蹤外部時(shí)鐘源或接口時(shí)鐘源,為本板和系統(tǒng)提供同步時(shí)鐘源提供兩路同步時(shí)鐘的輸入和輸出;對(duì)于交叉單元,其作用是提供多種業(yè)務(wù)級(jí)別的子網(wǎng)連接保護(hù)(Sub-network Connection Protection,SNCP),包括VC-4-4c、VC-4-8c、VC-4-16c、VC-4-64c、VC-4、VC-12、VC-3以及自身的1+1熱備份等。主控單元板卡的作用是保存配置數(shù)據(jù)、收集管理告警與性能事件以及外聯(lián)網(wǎng)管軟件等。
民航傳輸網(wǎng)承載著主要的民航業(yè)務(wù),傳輸網(wǎng)的安全穩(wěn)定對(duì)保障民航的安全運(yùn)行非常關(guān)鍵。采用OSN設(shè)備的光纖自愈環(huán)可實(shí)現(xiàn)多種形式的通道保護(hù),例如線(xiàn)性復(fù)用段保護(hù)、環(huán)形網(wǎng)絡(luò)保護(hù)以及子網(wǎng)連接保護(hù),具有較強(qiáng)的網(wǎng)絡(luò)自愈能力。其中,線(xiàn)性復(fù)用段保護(hù)包括“1+1線(xiàn)性復(fù)用段”與“1∶N線(xiàn)形復(fù)用段”[6-8]。環(huán)形網(wǎng)絡(luò)保護(hù)分為復(fù)用段保護(hù)環(huán)(Multiplex Section Protection,MSP) 和 通 道 保 護(hù) 環(huán)(Path Protection rings,PP)。MSP包含二纖單向復(fù)用段共享保護(hù)環(huán)、二纖雙向復(fù)用段共享保護(hù)環(huán)以及四纖雙向復(fù)用段保護(hù)環(huán);PP包含二纖單向通道保護(hù)環(huán)、二纖雙向通道保護(hù)環(huán)以及子網(wǎng)連接保護(hù)。雖然光環(huán)網(wǎng)具以上的網(wǎng)絡(luò)自愈性能,但是也會(huì)存在網(wǎng)絡(luò)自愈性能故障的情況,例如復(fù)用段倒換故障。
復(fù)用段倒換是指以復(fù)用段為基礎(chǔ)的倒換,倒換與否是由環(huán)上傳輸?shù)膹?fù)用段信號(hào)的質(zhì)量決定的,倒換的發(fā)生由K1K2字節(jié)所攜帶的APS協(xié)議來(lái)啟動(dòng),當(dāng)復(fù)用段出現(xiàn)問(wèn)題時(shí),環(huán)上整個(gè)STM-N或1/2STM-N的業(yè)務(wù)都切換到備用通道上[9-11]。復(fù)用段的保護(hù)條件是LOF、LOS、MS-AIS、MS-ESC(復(fù)用段誤碼過(guò)量)告警信號(hào)。當(dāng)發(fā)生保護(hù)倒換故障時(shí),則會(huì)出現(xiàn)以下幾種情況。一是全網(wǎng)正常狀態(tài)下,突然發(fā)生不明原因的倒換;二是在應(yīng)該發(fā)生保護(hù)倒換時(shí),全網(wǎng)未進(jìn)入保護(hù)倒換狀態(tài);三是進(jìn)入保護(hù)倒換后,全網(wǎng)或部分業(yè)務(wù)發(fā)生中斷的情況。作為光傳輸網(wǎng)重要的自愈保護(hù)功能,復(fù)用段倒換故障會(huì)對(duì)民航傳輸業(yè)務(wù)造成巨大的影響。常見(jiàn)的導(dǎo)致復(fù)用段倒換故障的原因可分為外部原因、數(shù)據(jù)配置原因以及設(shè)備故障原因3大類(lèi),具體如表1所示。
表1 復(fù)用段保護(hù)倒換故障的常見(jiàn)原因分類(lèi)
根據(jù)復(fù)用段倒換故障的原因,故障處理可采取以下思路。
在處理故障時(shí),首先應(yīng)該檢查設(shè)備外部的情況,例如是否人為停止了自動(dòng)保護(hù)倒換(Automatic Protection Switching,APS)協(xié)議、錯(cuò)誤設(shè)置了強(qiáng)制倒換、人為插入了MS_AIS、MS_RDI告警。同時(shí)應(yīng)檢查是否供電系統(tǒng)出現(xiàn)了問(wèn)題,如電源故障、蓄電池故障等。在排除外部原因后,如果故障仍然存在,可采用其他方法進(jìn)行故障定位。
(1)保護(hù)倒換協(xié)議正常啟動(dòng),但保護(hù)倒換不成功。檢查復(fù)用段協(xié)議是判斷故障時(shí)必須進(jìn)行的步驟,通過(guò)網(wǎng)管對(duì)各個(gè)網(wǎng)元的當(dāng)前狀態(tài)進(jìn)行查詢(xún),若整個(gè)網(wǎng)絡(luò)中有兩個(gè)相鄰網(wǎng)元的狀態(tài)為“倒換態(tài)”(S),而其他網(wǎng)元均為“穿通態(tài)”(P),則說(shuō)明APS協(xié)議正常啟動(dòng)。若各網(wǎng)元的狀態(tài)正確,APS正常啟動(dòng),但業(yè)務(wù)仍然中斷,則可以考慮通過(guò)網(wǎng)管重新啟動(dòng)協(xié)議。如果重新啟停協(xié)議后業(yè)務(wù)仍然中斷,則需考慮是否是單板存在問(wèn)題,這時(shí)可以按一般的業(yè)務(wù)中斷故障進(jìn)行處理。
(2)保護(hù)倒換協(xié)議異常,保護(hù)倒換不成功。APS協(xié)議異常會(huì)引起K字節(jié)的穿通和上報(bào)出現(xiàn)問(wèn)題,從而導(dǎo)致保護(hù)倒換不成功。此時(shí)可以先檢查各網(wǎng)元的復(fù)用段參數(shù)是否配置正確、是否有網(wǎng)元的復(fù)用段參數(shù)丟失,如果參數(shù)設(shè)置沒(méi)有異常,就可以檢查光板和交叉板是否工作正常。
(3)強(qiáng)制倒換,先恢復(fù)業(yè)務(wù)。例如某段光路有大誤碼,可以通過(guò)拔纖或下發(fā)強(qiáng)制倒換命令,使業(yè)務(wù)先恢復(fù)正常后再處理故障。
3.3.1 故障情況描述
某單位6個(gè)站組成一個(gè)復(fù)用段保護(hù)環(huán),如圖3所示。其中1號(hào)站為中心站,連接網(wǎng)管服務(wù)器。3號(hào)站和4號(hào)站的光纖斷后,部分業(yè)務(wù)中斷。
圖3 案例分析網(wǎng)絡(luò)示意圖
3.3.2 故障處理過(guò)程
首先,檢查設(shè)備外部的情況。在網(wǎng)管服務(wù)器檢查設(shè)置,是否人為停止了APS協(xié)議、錯(cuò)誤設(shè)置了強(qiáng)制倒換或人為插入了MS_AIS、MS_RDI告警。同時(shí)檢查3號(hào)站及4號(hào)站是否供電系統(tǒng)出現(xiàn)了問(wèn)題,如電源故障、蓄電池故障等。經(jīng)檢查,設(shè)備外部情況正常。
其次,排除外部故障后檢查APS協(xié)議和復(fù)用段參數(shù)。通過(guò)網(wǎng)關(guān)服務(wù)器檢查復(fù)用段倒換保護(hù)狀態(tài),無(wú)APS_INDI等復(fù)用段倒換告警上報(bào),各網(wǎng)元倒換狀態(tài)不正常,確定未發(fā)生倒換,倒換協(xié)議未正常啟動(dòng)。
最后,檢查復(fù)用段配置參數(shù)。檢查發(fā)現(xiàn),導(dǎo)致復(fù)用段無(wú)法倒換的原因?yàn)閺?fù)用段參數(shù)配置錯(cuò)誤,各節(jié)點(diǎn)復(fù)用段保護(hù)參數(shù)錯(cuò)誤按照順時(shí)針?lè)较蚺渲?。原?fù)用段節(jié)點(diǎn)參數(shù)如表2所示。
表2 原復(fù)用段節(jié)點(diǎn)參數(shù)
按照逆時(shí)針順序修改配置參數(shù)后重啟協(xié)議,環(huán)路正常進(jìn)行倒換,業(yè)務(wù)恢復(fù)正常。修改后配置參數(shù)如表3所示。
表3 修改后復(fù)用段節(jié)點(diǎn)參數(shù)
3.3.3 原因分析
案例中,復(fù)用段倒換失敗的原因?yàn)閺?fù)用段參數(shù)配置不正確。節(jié)點(diǎn)號(hào)未按照逆時(shí)針順序配置,3號(hào)網(wǎng)元復(fù)用段模塊處理時(shí)默認(rèn)為西向光板對(duì)應(yīng)的網(wǎng)元節(jié)點(diǎn)號(hào)比自身小1,東向光板對(duì)應(yīng)的網(wǎng)元節(jié)點(diǎn)號(hào)比自身大1,導(dǎo)致協(xié)議處理異常。環(huán)上復(fù)用段節(jié)點(diǎn)號(hào)建議從0開(kāi)始,節(jié)點(diǎn)號(hào)小于16,按主環(huán)方向逐站遞增。
民航傳輸網(wǎng)作為民航領(lǐng)域重要的傳輸干線(xiàn),整體架構(gòu)已逐漸完善。設(shè)備保障人員不但要充分了解傳輸網(wǎng)絡(luò)配置情況及網(wǎng)絡(luò)拓?fù)淝闆r、熟悉傳輸設(shè)備的硬件配置、熟練掌握各種基本保護(hù)子網(wǎng)的保護(hù)機(jī)理、掌握命令行及網(wǎng)管配置業(yè)務(wù)的方法,而且還要熟悉故障排查方法,在組網(wǎng)及配置上充分考慮傳輸?shù)陌踩裕诿鎸?duì)故障時(shí)要思路清晰,熟練解決各種問(wèn)題,盡量避免業(yè)務(wù)受到影響。同時(shí)也需要與時(shí)俱進(jìn),多交流學(xué)習(xí)新的故障處理方法,積累經(jīng)驗(yàn)。