李秀芳
(中國鐵路北京局集團有限公司北京通信段,北京 100860)
鐵路移動通信系統(tǒng)(GSM-R)如圖1 所示,包括智能網(wǎng)(IN)、網(wǎng)絡交換子系統(tǒng)(NSS)、基站子系統(tǒng)(BSS)、操作支撐子系統(tǒng)(OSS)、通用分組無線子系統(tǒng)(GPRS)以及移動臺(MS)等。本文主要針對服務GPRS 支持節(jié)點(SGSN)設備時鐘系統(tǒng)功能出現(xiàn)異常時對相關無線網(wǎng)絡的影響進行分析、處理、應急等,最終對諾基亞SGSN 系統(tǒng)(硬件版本為DX200,軟件版本為SG7CD10)時鐘軟件配置、硬件設置等達到更深入的了解,以提高維護人員對諾基亞SGSN DX200 系統(tǒng)的維護水平,進而提高設備維護質(zhì)量。
圖1 GSM-R系統(tǒng)網(wǎng)絡結構Fig.1 Network structure of GSM-R system
京廣高鐵無線系統(tǒng)網(wǎng)管告警信息,基站控制器(BSC)與SGSN 互聯(lián)的兩個2 M 接口,其中 PCMG:1 和PCMG:0 同時出現(xiàn)級別為重要告警的信息內(nèi)容,顯示:Loss of Frame/slip Alarm onLink B 和Loss of Fram e/slip Alarm onLink A,如圖2 所示。
圖2 京廣高鐵無線系統(tǒng)網(wǎng)管告警截圖Fig.2 Alarm screenshot of wireless system network management of Beijing-Guangzhou high-speed railway
在京廣高鐵BSC 系統(tǒng)上報告警信息的同時,京滬高鐵BSC 系統(tǒng)也同樣上報上述告警信息,即兩條高鐵線的BSC 系統(tǒng)與SGSN 互聯(lián)的接口均出現(xiàn)滑碼/幀丟失告警。
鑒于同時兩條高鐵線的無線系統(tǒng)BSC 網(wǎng)管均上報同樣的告警信息,引起維護人員的高度重視,立即對問題進行排查分析。由于兩套BSC 均出現(xiàn)與SGSN 之間滑碼/幀丟失告警,所以首先對SGSN 系統(tǒng)運行情況進行檢查,發(fā)現(xiàn)SGSN 出現(xiàn)時鐘晶振告警,而且處于主用狀態(tài)的CLS-0 單元發(fā)生了自動切換,導致原來備用狀態(tài)的CLS-1 單元變成主用狀態(tài)。
上述SGSN 晶振告警與京廣高鐵、京滬高鐵的BSC PCMG 出現(xiàn)滑碼告警相吻合,需要進一步對SGSN 系統(tǒng)此時的時鐘同步狀態(tài)進行檢查。在SGSN網(wǎng)管界面主菜單下使用DRI 命令查看時鐘同步狀態(tài),結果如圖3 所示。
此時時鐘狀態(tài)顯示當前SGSN 提取為“2M1”線路時鐘,同步單元CLS-0 為快速跟隨模式,暫未跟蹤到時鐘信號。初步分析CLS-0 時鐘模塊故障導致主備冗余板件進行自動倒換,計劃對SGSN 系統(tǒng)的CLS-0 時鐘模塊進行更換。
圖3 SGSN系統(tǒng)晶振告警時的時鐘同步狀態(tài)Fig.3 Clock synchronization status when the crystal oscillator of SGSN system alarm is given
2019年12月11日00:00,更換CLS-0 時鐘模塊1 h 后,發(fā)生如下變化:1)SGSN 的時鐘晶振告警消除;2)京滬高鐵和京廣高鐵BSC 告警未消除;3)使用DRI 命令查詢SGSN 系統(tǒng)時鐘同步狀態(tài),除同步晶振控制字為15359 偏離正常標稱值32768 較大外,其他均正常。當時判斷更換時鐘模塊后,同步外部參考時鐘需要一定的時間,于是進一步觀察。
直至11日10:57,再次使用DRI 命令查看SGSN 系統(tǒng)時鐘狀態(tài),發(fā)現(xiàn)時鐘狀態(tài)與CLS-0 故障時狀態(tài)一致,而且0、1 兩側同步晶振控制字均為0。正常應該接近標稱值32768,0 側同步晶振控制模式為快速跟隨模式(FAST),暫未跟蹤到時鐘信號。而1 側同步晶振控制模式為NORMAL,而且京廣、京滬BSC PCMG 滑碼告警仍然未消除,如圖4 所示。
圖4 更換SGSN的CLS-0時鐘模塊9 h后的系統(tǒng)時鐘同步狀態(tài)System clock synchronization status after replacing the CLS-0 clock module of SGSN for 9 hours
通過上述問題的排查,發(fā)現(xiàn)問題原因非SGSN系統(tǒng)本身CLS-0 時鐘模塊問題,于是對系統(tǒng)在用的2M1 時鐘徑路進行排查。由于SGSN 的外部時鐘從2M1 抽取,即SGSN 通過固定的時鐘線纜2M1接入特定的交換終端(ET)2 M 接口背板槽位,再通過成端至DDF 架ET 的2 M 線與上級網(wǎng)元實現(xiàn)2 M 對接,最終SGSN 系統(tǒng)達到提取上級網(wǎng)元的頻率同步信號。根據(jù)上述時鐘抽取方式,進一步確定SGSN 系統(tǒng)時鐘線纜與ET-256 相連。
需要進一步檢查線路時鐘2M1 的時鐘提取方式、相關的線纜接入以及涉及到ET-256 的硬件設備等。首先嘗試更換線路時鐘源2M1 的2 M 電路線纜,發(fā)現(xiàn)斷開時鐘2M1 的2 M 線纜后, SGSN 設備對應的ET-256 沒有上報中斷的傳輸告警,狀態(tài)依舊為正常狀態(tài),并對ET-256 進行診斷,結果未通過,由此可以判斷為2 M1 提供線路時鐘的ET-256 硬件存在問題,而承載ET-256 的硬件為ET4C模塊,其中一個ET4C 可以提供4 個2 M,只能從序號第一個2 M 抽取時鐘,分析由于ET4C 模塊故障導致無法提取線路時鐘,需要進一步對ET4C 硬件模塊進行更換。
后續(xù)對SGSN 的ET-256 對應的ET4C 模塊進一步檢查時,發(fā)現(xiàn)此模塊除ET-256 其中此2 M 承載SGSN 與信令轉接點(STP)互聯(lián),專門用來抽取時鐘外(此2 M 無其他業(yè)務,只提供時鐘信號跟蹤),還有1 個2 M ET-258 承載SGSN 至STP 互聯(lián)即Gr 接口業(yè)務,考慮到更換ET4C 模塊會影響Gr 接口互聯(lián)業(yè)務,計劃通過應急措施調(diào)整ET 位置,改變線路時鐘源位置,即調(diào)整機框背板外部參考時鐘線纜的位置,來實現(xiàn)從其他固定的ET 位置來獲取線路時鐘,將ET-256 調(diào)整到ET-276。諾基亞SGSN 可以提供時鐘信號的ET 位置如表1 所示。
表1 諾基亞SGSN系統(tǒng)可以提供時鐘信號的ET編號Tab.1 ET number of clock signal which can be provided by Nokia SGSN syste
在調(diào)整機框背板外部參考時鐘線纜時,發(fā)現(xiàn)2M3 外部參考時鐘線纜插錯位置, 2M3 對應的外部參考時鐘線纜SGAC_152 插在了ET-258 的位置,由于ET-258 不對外提供線路時鐘信號,只有每個ET4C 的第1 個2 M 位置才有時鐘信號輸出,當時錯誤的時鐘線纜接線位置如圖5 所示。
圖5 SGSN 2M3時鐘線纜錯誤接至ET258位置Fig.5 SGSN 2M3 clock cable is incorrectly connected to ET258
SGAC_150 電纜為2M1,對應的ET 位置為ET-256;SGAC_152 電纜為2M3,對應的ET 位置為ET-258;所以導致2M3 一直跟蹤不到線路時鐘,整個設備只通過一路2M1 來抽取線路時鐘。正常情況下,當2M1 外時鐘不正常時,系統(tǒng)會自動倒換至2M3 的外時鐘,使SGSN 系統(tǒng)時鐘跟蹤不會出現(xiàn)問題。在處理2M1 抽取時鐘異常的問題時,同時又發(fā)現(xiàn)了2M3 的錯誤接法,所以還要對2M3 進行處理,保證正常情況下SGSN 系統(tǒng)兩路線路時鐘跟蹤均處于良好狀態(tài),系統(tǒng)再根據(jù)人為設置的時鐘優(yōu)先等級進行外時鐘的抽取等。
鑒于上述2M1 和2M3 的時鐘線纜均需要調(diào)整位置,結合SGSN 設備本身ET 的出線成端至DDF架的情況,再根據(jù)表1 進行適當?shù)恼{(diào)整,最終調(diào)整情況如下。
在SGSN 設備的后背板調(diào)整2M1 外部參考時鐘線纜SGAC_150 至ET-276 位 置,同時將ET-276 成端至DDF 架的2 M 線跳至原與STP 2 M互聯(lián)的DDF 位置,通過SGSN的時鐘設置可以看到,將2M1設置優(yōu)先級最高為7 級,通過STP 進行時鐘同步。
在SGSN 設備的后背板調(diào)整2M3 外部參考時鐘線纜SGAC_152 至ET-260 位 置,ET-260 是SGSN 與STP 互聯(lián)業(yè)務電路,同樣可以完成從STP 側抽取時鐘功能,只是優(yōu)先級設置為5 級,低于2M1 的優(yōu)先級。
調(diào)整后的時鐘2M1 和2M3 的電纜與ET 背板接線如圖6 所示。
經(jīng)過上述調(diào)整后,2M1 線路時鐘立刻同步成功,同步晶振控制狀態(tài)也恢復為NORMAL,同時將2M1 外部參考時鐘斷開,系統(tǒng)也能自動切換到2M3外部參考時鐘,而且無線網(wǎng)絡系統(tǒng)京廣高鐵和京滬高鐵BSC、PCMG 滑碼等告警消失,觀察數(shù)小時后,系統(tǒng)穩(wěn)定運行,時鐘跟蹤異常的問題得到解決。
圖6 SGSN系統(tǒng) 2M1和2M3時鐘線纜正確調(diào)整至ET相關位置圖Fig.6 Diagram of the 2M1 and 2M3 clock cables of SGSN system are correctly adjusted to ET related positions
問題解決后當時的系統(tǒng)時鐘跟蹤情況如圖7 所示,2M1 和2M3 為鏈接狀態(tài)“CONNECTED”,同步單元0 側和1 側均能跟蹤到時鐘信號,狀態(tài)顯示NORMAL。當2 M1 時鐘跟蹤有問題時,系統(tǒng)會自動選擇狀態(tài)為“CONNECTED”的2M3 進行時鐘跟蹤。當時只有同步晶振控制字40072 和41 108偏離正常值較大外(正常后會逐步接近頻率標稱值32768),其他均恢復正常,相關告警全部消失。
圖7 問題解決后的SGSN系統(tǒng)時鐘跟蹤情況Fig.7 Clock tracking situation of SGSN system after the problem is resolved
原SGSN 2M1 外部參考時鐘源線纜SGAC_150接的ET-256 硬件故障,無法取到線路時鐘信號。
原SGSN 2M3 外部參考時鐘源線纜SGAC_152 接的ET-258 位置不提供線路時鐘信號。
開局時SGSN 系統(tǒng)外部參考時鐘設置存在問題,4 路外部參考時鐘,其中只有第一路外部參考時鐘為正常狀態(tài),由于第三路外部參考時鐘線纜接入錯誤,整個SGSN 系統(tǒng)只有一路外部參考時鐘,所以當僅有的一路時鐘出現(xiàn)任何問題,導致整個SGSN 系統(tǒng)時鐘出現(xiàn)異常。
掌握系統(tǒng)提供外時鐘的方式及方法,才能做到在處理時鐘問題時先應急恢復再排查問題,本案例由于采取了及時的應急處置方式,將時鐘倒接至其他ET 位置,所以后續(xù)仍需對攜帶業(yè)務的ET4C 故障模塊進行更換。
日常技術維護人員在對SGSN 系統(tǒng)執(zhí)表維護時,在熟悉系統(tǒng)時鐘設置的情況下,根據(jù)檢修周期,定期檢查時鐘跟蹤狀態(tài),發(fā)現(xiàn)異常及時排查處理,確保系統(tǒng)時鐘運行正常。
高速鐵路利用GSM-R 的GPRS 網(wǎng)絡分組數(shù)據(jù)業(yè)務實現(xiàn)車載設備和地面設備間雙向信息傳輸,包括行車調(diào)度命令、進路預告、無線車次號校核信息傳送以及承載列車自動駕駛(ATO)應用系統(tǒng)等,所以GPRS 系統(tǒng)在高速鐵路通信系統(tǒng)中發(fā)揮著重要的作用,而SGSN 做為 GPRS 系統(tǒng)的重要組成部分,日常維護人員需要深入研究設備的相關工作原理,提高對設備的維護水平,以提供高可靠性的設備質(zhì)量,為高速鐵路行車調(diào)度提供可靠的通信保障。