裴俊芳
隨著網(wǎng)絡(luò)技術(shù)和智能終端的發(fā)展,IP業(yè)務(wù)逐漸成為最主流的業(yè)務(wù)類型,大顆粒業(yè)務(wù)需求也逐步增加,這種變化對傳送網(wǎng)提出了大容量、粗管道、IP化和高可靠的要求。OTN(光傳送網(wǎng))網(wǎng)絡(luò)由于具備大帶寬承載的經(jīng)濟(jì)性,又能支持小顆粒業(yè)務(wù)靈活調(diào)度,現(xiàn)已成為鐵路數(shù)通設(shè)備互聯(lián)電路的主要承載系統(tǒng)。但是OTN網(wǎng)絡(luò)的復(fù)雜度遠(yuǎn)高于SDH網(wǎng)絡(luò),從設(shè)備管理、業(yè)務(wù)發(fā)放、告警排障和資源管理各個(gè)方面都與SDH網(wǎng)絡(luò)有很多差異,對通信維護(hù)人員的技術(shù)水平提出了更高的要求,維護(hù)人員不僅需要建立全程全網(wǎng)的概念,而且需要掌握各專業(yè)之間的關(guān)聯(lián)和制約機(jī)制。本文首先介紹了光傳送網(wǎng)的組網(wǎng)方式,然后通過一個(gè)案例來了解保護(hù)倒換的原理,分析數(shù)據(jù)網(wǎng)延遲時(shí)間與傳輸保護(hù)倒換間的關(guān)系,并提出方案以解決倒換過程對承載的數(shù)據(jù)網(wǎng)業(yè)務(wù)的影響。
湖南省干OTN網(wǎng)絡(luò),由湘北環(huán)1、湘北環(huán)2、湘南環(huán)和塘豹鏈組成,光纜里程達(dá)2100 km,在每個(gè)環(huán)網(wǎng)和鏈中采用華為OSN8800系統(tǒng)設(shè)備搭建局干層的傳輸平臺(tái),每個(gè)環(huán)網(wǎng)是40波道、每個(gè)波道10 Gb/s,共400 Gb/s的光傳送網(wǎng)。湖南省干OTN系統(tǒng)作為省級干線傳輸平臺(tái),可實(shí)現(xiàn)GE、2.5 Gb/s和10 Gb/s大顆粒業(yè)務(wù)的安全、可靠傳送,主要承載SDH系統(tǒng)光口互聯(lián)以及數(shù)據(jù)網(wǎng)設(shè)備間互聯(lián)電路業(yè)務(wù)[1]。湖南省干OTN網(wǎng)絡(luò)結(jié)構(gòu)見圖1。
圖1 湖南省干OTN網(wǎng)絡(luò)結(jié)構(gòu)圖
基于現(xiàn)有的組網(wǎng)方式,運(yùn)用OTN傳輸系統(tǒng)的傳輸機(jī)制和保護(hù)原理,在光層采用光線路保護(hù)(OLP),在電層采用子網(wǎng)連接保護(hù)(SNCP)[2]。
數(shù)據(jù)網(wǎng)互聯(lián)通道中斷案例見圖2。在對B站至F站區(qū)間進(jìn)行備用光纜整治過程中,A、B站的DR(匯聚路由器)與上部站的CR(核心路由器)互聯(lián)電路均出現(xiàn)閃斷告警,并影響數(shù)據(jù)網(wǎng)上承載的防災(zāi)、電力業(yè)務(wù)。檢查OTN網(wǎng)管告警情況,發(fā)現(xiàn)B和F站均上報(bào)OLP_PS倒換告警,C站收A站的業(yè)務(wù)上報(bào)ODU_SNCP_PS告警,表示ODU顆粒的SNCP保護(hù)倒換發(fā)生時(shí)產(chǎn)生該告警;A站去往D站和B站去往C、D站的3條業(yè)務(wù)均上報(bào)ODU_SNCP_STA_INDI(指示倒換組狀態(tài))告警,代表保護(hù)組主/備通道存在SF/SD(信號(hào)失效/劣化),同時(shí)數(shù)據(jù)網(wǎng)網(wǎng)管對應(yīng)的4條電路分別產(chǎn)生ISIS(中間系統(tǒng)-中間系統(tǒng))鄰接改變和BFD(雙向轉(zhuǎn)發(fā)檢測)會(huì)話宕機(jī)等異常告警。
圖2 數(shù)據(jù)網(wǎng)互聯(lián)通道中斷
OTN的SNCP業(yè)務(wù)倒換時(shí)間≤50 ms,如果倒換正常,對業(yè)務(wù)不會(huì)造成影響,那為什么只有一條電路產(chǎn)生倒換,其他3條電路未產(chǎn)生倒換?SNCP倒換是否正常?還是由于OLP保護(hù)倒換不正常引發(fā)的業(yè)務(wù)中斷等一系列問題有待分析解決。
2.2.1 OLP倒換
光線路保護(hù)控制由OLP單板實(shí)現(xiàn),該單板包括耦合器和開關(guān),分別完成對光信號(hào)的雙發(fā)及選收功能。OLP提供對2路輸入光信號(hào)(RI1、RI2)的功率檢測,倒換依據(jù)為光功率,保護(hù)原理為雙發(fā)選收和單端倒換。倒換觸發(fā)條件有2種情況:①主或備用通道LOS告警(信號(hào)丟失);②產(chǎn)生POWER-DIFF-OVER告警,即主備通道相對光功率差異值越限(默認(rèn)為5 dB)[3]。
檢查B站和F站OLP保護(hù)設(shè)置為單端倒換、恢復(fù)式,恢復(fù)等待時(shí)間600 s。在正常狀態(tài)下,發(fā)送端OLP同時(shí)發(fā)送光信號(hào)到工作路徑和保護(hù)路徑,接收端OLP僅選收工作路徑上的光信號(hào)[4]。通過對歷史告警和性能分析,發(fā)現(xiàn)當(dāng)時(shí)因光纜整治,B站和F站主用OLP收光功率均下降,導(dǎo)致站點(diǎn)B和F因主備光功率相對差異值大于5 dB產(chǎn)生了OLP倒換,從主通道倒換到備通道;主通道信號(hào)失效(SF)結(jié)束,進(jìn)入WTR(等待恢復(fù))狀態(tài),等待10 min后恢復(fù)到主通道,B站和F站OLP屬于正常倒換。
2.2.2 SNCP倒換
SNCP保護(hù)運(yùn)用電層交叉的雙發(fā)選收功能,對線路板和OCh光纖進(jìn)行保護(hù),交叉粒度為ODUk信號(hào)。ODU為光數(shù)據(jù)單元,其中k=0,1,2,3,4,不同數(shù)字代表不同等級速率[5]。在圖1中,A、B站分別去往C、D站的4條電路是A、B站DR(匯聚路由器)與上部站CR(核心路由器)的互聯(lián)電路,配置為ODU0 SNCP的子網(wǎng)連接保護(hù),其中“0”代表速率為1.25 Gb/s的GE信號(hào)。觸發(fā)條件為單板不在位、OTU單板的信號(hào)失效/劣化(SF/SD)。SNCP信號(hào)流向見圖3。
圖3 ODUk SNCP信號(hào)流向
A站TOA同時(shí)發(fā)送信號(hào)到主、備NS2板,C站TOA板建立到主用NS2單板的電交叉連接,只有主用NS2單板的信號(hào)通過TOA板傳送到客戶側(cè)設(shè)備。當(dāng)主用NS2單板或線路光纖故障,由收端的各故障檢測點(diǎn)上報(bào)事件,主控板比較并控制交叉板完成倒換動(dòng)作,建立備用NS2單板到TOA板的電交叉,刪除主用NS2單板到TOA板的電交叉,只有備用NS2單板的信號(hào)通過TOA板傳送到客戶側(cè)設(shè)備[6]。
2.3.1 電路狀態(tài)
數(shù)據(jù)網(wǎng)互聯(lián)電路均配置為ODU0 SNCP單端倒換、非恢復(fù)式,SD使能標(biāo)識(shí)未打開。光通道不可用的門限為-16.0 dBm,A站去往C站的ODU0信號(hào),由于C站主用NS2板收光功率降低到-16.6 dBm,低于門限而產(chǎn)生ODU_SNCP_PS倒換;檢查C站SNCP倒換狀態(tài),A站經(jīng)過F站去往C站的工作路由倒換至經(jīng)G站的保護(hù)路由,當(dāng)前通道為保護(hù)通道,工作通道當(dāng)前狀態(tài)是SF(信號(hào)失效),保護(hù)通道狀態(tài)正常[7]。其他3條電路因單波收光功率為-12 dBm,雖然下降了4 dBm,但未低于不可用門限,電路發(fā)出ODU_SNCP_STA_INDI告警,表示工作通道存在信號(hào)劣化(SD),SD使能標(biāo)識(shí)未打開,故沒有發(fā)生SNCP倒換。上述4條電路的SNCP倒換過程未發(fā)現(xiàn)異常。
2.3.2 電路配置
檢查A、B站去往C、D站的4條電路,電路流向見圖1,配置為ODU0 SNCP,4條電路工作路由走短路徑經(jīng)F站去往C、D站,保護(hù)路由走長路徑經(jīng)G站去往C、D站。正常情況下C、D站從工作路由接收業(yè)務(wù)信號(hào),因B站至F站光纜割接,引發(fā)4條電路同時(shí)出現(xiàn)倒換告警[8]。
2.3.3 查看24 h性能及日志
為了進(jìn)一步分析A站去往C站的電路倒換至保護(hù)路由后通道性能是否正常,查看24 h性能顯示C站備用NS2無誤碼,檢查單板e(cuò)qpt日志未發(fā)現(xiàn)硬件異常,進(jìn)一步檢查C站TOA板無相關(guān)告警,說明業(yè)務(wù)倒換至保護(hù)路由性能正常。
為什么在傳輸業(yè)務(wù)倒換正常的情況下,會(huì)同時(shí)影響到4條GE業(yè)務(wù),通過檢查發(fā)現(xiàn)路由器缺省情況下延遲時(shí)間(Hold off time)為0 ms,即接口狀態(tài)變?yōu)镈own后系統(tǒng)立即響應(yīng),造成重新生成路由表。
IP數(shù)據(jù)通信網(wǎng)通過光傳輸設(shè)備承載,光傳輸設(shè)備的倒換時(shí)間≤50 ms(保護(hù)嵌套除外),若IP數(shù)據(jù)通信網(wǎng)在傳輸設(shè)備發(fā)生倒換時(shí)同時(shí)感知接口Down并作出響應(yīng),則會(huì)進(jìn)行2次路由收斂和倒換,進(jìn)而影響通信網(wǎng)絡(luò)的穩(wěn)定性。具體過程:當(dāng)IP層以下網(wǎng)絡(luò)鏈路發(fā)生故障時(shí),光傳輸設(shè)備和IP數(shù)據(jù)通信網(wǎng)都能感知到故障存在,如果在光傳輸設(shè)備完成倒換之前,IP數(shù)據(jù)通信網(wǎng)已完成路由協(xié)議收斂、流量切換、次優(yōu)路徑選擇,那么當(dāng)光傳輸設(shè)備完成倒換后,原最優(yōu)路徑又重新可用,于是IP數(shù)據(jù)通信網(wǎng)會(huì)再次進(jìn)行路由協(xié)議收斂,這就要求IP數(shù)據(jù)通信網(wǎng)的延遲時(shí)間要大于光傳輸設(shè)備的倒換時(shí)間,即必須大于50 ms[9]。
經(jīng)調(diào)查分析,防災(zāi)、電力等業(yè)務(wù)受到影響的原因:①4條電路的工作路由物理同路徑,由于光纜整治,B站至F站主用光功率突降,造成4條電路均產(chǎn)生倒換告警;②數(shù)據(jù)網(wǎng)設(shè)備延遲時(shí)間默認(rèn)為0 ms,只要收光有異常接口會(huì)立即宕掉并觸發(fā)倒換,重新生成路由表,影響了該區(qū)段數(shù)據(jù)網(wǎng)設(shè)備承載的業(yè)務(wù)。
將A、B站去往C站的工作路由,由經(jīng)F站調(diào)整至經(jīng)G站到達(dá)C站,保證DR去往CR的2條工作路由不存在物理同路徑,優(yōu)化后的數(shù)據(jù)網(wǎng)互聯(lián)通道SNCP電路路由情況見圖4。
圖4 優(yōu)化后的數(shù)據(jù)網(wǎng)互聯(lián)通道SNCP電路路由情況
根據(jù)現(xiàn)網(wǎng)實(shí)際應(yīng)用情況,路由器的延遲時(shí)間大于波分的保護(hù)倒換時(shí)間加波分的延遲時(shí)間,將路由器的延遲時(shí)間配置為200 ms,具體時(shí)間與波分設(shè)備倒換時(shí)間有關(guān)[10]。這樣在傳輸鏈路發(fā)生故障倒換時(shí)數(shù)據(jù)網(wǎng)就不會(huì)感知,可以避免傳輸側(cè)保護(hù)倒換引起的震蕩。
隨著高鐵業(yè)務(wù)對帶寬的需求越來越大,行車業(yè)務(wù)也逐漸由傳輸系統(tǒng)改至數(shù)據(jù)網(wǎng)系統(tǒng)承載,但數(shù)據(jù)網(wǎng)之間的互聯(lián)始終還是離不開傳輸通道來建立連接。數(shù)據(jù)網(wǎng)互聯(lián)電路是采用OTN的SNCP電層保護(hù)方式,比起光層的OLP保護(hù)來說更安全,也更復(fù)雜。SNCP保護(hù)有主備2條路徑,在電路規(guī)劃時(shí)需全面考慮路由走向問題,滿足不同物理路徑。通信網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,行車業(yè)務(wù)承載在數(shù)據(jù)網(wǎng)系統(tǒng),IP數(shù)據(jù)網(wǎng)業(yè)務(wù)承載在傳輸OTN系統(tǒng),盡可能做到傳輸網(wǎng)、數(shù)據(jù)網(wǎng)的協(xié)同規(guī)劃,以切實(shí)提高網(wǎng)絡(luò)的可靠性。