李志越
一直以來,CTCS-3級(jí)列控系統(tǒng)車載設(shè)備中的移動(dòng)終端[1-2](Mobile Terminal,MT)(也稱“車載電臺(tái)”)技術(shù)被國(guó)外廠家壟斷,造成核心技術(shù)受制于人,在問題的分析、新需求的跟進(jìn)等方面對(duì)我國(guó)CTCS-3級(jí)列控系統(tǒng)的發(fā)展形成了嚴(yán)重的技術(shù)屏障。2015年,國(guó)鐵集團(tuán)組織國(guó)內(nèi)各設(shè)備廠家開展車載電臺(tái)技術(shù)攻關(guān),目的是實(shí)現(xiàn)車載電臺(tái)自主化,并根據(jù)現(xiàn)實(shí)需求增加電臺(tái)日志記錄等功能,彌補(bǔ)現(xiàn)有國(guó)外電臺(tái)存在的不足。自主化電臺(tái)自2019年在天津電務(wù)段試用以來,為無線通信超時(shí)分析提供了有效的數(shù)據(jù)支撐,成為解決該問題的有力抓手,大大提升了電務(wù)段CTCS-3級(jí)列控系統(tǒng)的運(yùn)維效率。本文主要介紹自主化電臺(tái)的日志記錄功能,該功能可方便追溯故障發(fā)生時(shí)網(wǎng)絡(luò)及電臺(tái)的狀態(tài),有利于快速、精準(zhǔn)地定位出無線通信超時(shí)的根本原因。
自主化電臺(tái)采用具有完全自主知識(shí)產(chǎn)權(quán)的GSM-R 協(xié)議棧,該協(xié)議??蚣芤妶D1,分為非接入層、接入層和物理層。其中,非接入層包含:①AT 子層,負(fù)責(zé)處理ATP 的AT 指令及向ATP回復(fù)響應(yīng);②CC子層,負(fù)責(zé)處理ATP呼叫請(qǐng)求或掛斷請(qǐng)求;③SIM 卡管理子層,為GSM-R 協(xié)議棧的各子層與SIM 卡交互提供讀、寫、查詢接口;④MM子層,實(shí)現(xiàn)網(wǎng)絡(luò)選擇、網(wǎng)絡(luò)注冊(cè)鑒權(quán)加密和連接管理功能。接入層主要是無線資源實(shí)體(Radio Resources entity,RR)子層,實(shí)現(xiàn)小區(qū)選擇、小區(qū)重選、小區(qū)切換、信道切換、信令解析及小區(qū)測(cè)量等功能,保證電臺(tái)和GSM-R 網(wǎng)絡(luò)間可靠的無線連接。物理層主要實(shí)現(xiàn)編/解碼、調(diào)制/解調(diào)、信道均衡、交織/去交織等功能。
圖1 自主化電臺(tái)GSM-R協(xié)議??蚣?/p>
電臺(tái)記錄的內(nèi)容非常豐富,主要包括:①Igsm-r接口[3]上的命令和數(shù)據(jù)交互;②電臺(tái)與SIM 卡間的數(shù)據(jù)交互;③電臺(tái)與GSM-R 網(wǎng)絡(luò)間的Um接口上的數(shù)據(jù)交互;④電臺(tái)對(duì)GSM-R 網(wǎng)絡(luò)覆蓋情況的監(jiān)測(cè)[4]等。自主化電臺(tái)將這些數(shù)據(jù)通過日志實(shí)時(shí)完整地保存,事后可通過日志準(zhǔn)確查找和追溯無線通信超時(shí)的真實(shí)原因。
2021年4月16日,天津電務(wù)段配屬的CRH380 BL-5518動(dòng)車組在擔(dān)當(dāng)某次運(yùn)行交路時(shí),01 端在天津站停車待發(fā)時(shí)發(fā)生單電臺(tái)故障。結(jié)合電務(wù)段歷史統(tǒng)計(jì)數(shù)據(jù),多年來不同車型列車在天津站都發(fā)生過無線通信超時(shí)故障,因故障呈現(xiàn)偶發(fā)性,也缺少電臺(tái)數(shù)據(jù),無法深入分析原因,最后都判定為電臺(tái)性能異常所致。
此車裝有自主化電臺(tái),MT2 掉網(wǎng)日志見表1。由表1 可以看出,電臺(tái)在14:06:31 正常注冊(cè)到BCCH 頻點(diǎn)為1006 的服務(wù)小區(qū),駐網(wǎng)13 min 后,ATP 通過“AT+CREG?”查詢電臺(tái)狀態(tài),電臺(tái)回復(fù)“+CREG 0,2”,表示掉網(wǎng),ATP 報(bào)單電臺(tái)故障。
表1 MT2掉網(wǎng)日志
MT2 掉網(wǎng)前后監(jiān)測(cè)到服務(wù)小區(qū)的下行信號(hào)強(qiáng)度及駐網(wǎng)狀態(tài)見表2。從表2 可以看出,電臺(tái)附著在BCCH 頻點(diǎn)為1006 的小區(qū),并且測(cè)量到該小區(qū)下行信號(hào)強(qiáng)度在-51~-56 dBm 間變化:①當(dāng)信號(hào)強(qiáng)度大于-53 dBm 時(shí),ATP 查詢電臺(tái)狀態(tài),電臺(tái)回復(fù)“+CREG:0,1”,ATP 報(bào)MT2 駐網(wǎng)成功;②當(dāng)信號(hào)強(qiáng)度為-54 dBm 時(shí),ATP 查詢電臺(tái)狀態(tài),電臺(tái)回復(fù)“+CREG:0,1”,ATP 報(bào)MT2 駐網(wǎng)成功,但電臺(tái)下行鏈路失敗告警;③當(dāng)信號(hào)強(qiáng)度低于-54 dBm 時(shí),ATP 查詢電臺(tái)狀態(tài),電臺(tái)回復(fù)“+CREG:0,2”,ATP報(bào)單電臺(tái)故障。
從表2 還可以看出,同時(shí)間段MT1 下行信號(hào)強(qiáng)度均高于-53 dBm,ATP查詢電臺(tái)狀態(tài),電臺(tái)回復(fù)“+CREG:0,1”,ATP報(bào)MT1駐網(wǎng)成功。
表2 下行信號(hào)強(qiáng)度及駐網(wǎng)狀態(tài)
通過上述MT1和MT2在同時(shí)間段接收同一個(gè)基站的信號(hào)強(qiáng)度對(duì)比可得出:當(dāng)服務(wù)小區(qū)(BCCH頻點(diǎn)為1006 的小區(qū))下行信號(hào)低于-54 dBm 時(shí),電臺(tái)解碼時(shí)誤碼率很高,導(dǎo)致電臺(tái)解析系統(tǒng)消息失敗而掉網(wǎng)。
按照3GPP 協(xié)議[5],電臺(tái)掉網(wǎng)后,會(huì)啟動(dòng)搜網(wǎng)流程重新搜網(wǎng)。MT2 電臺(tái)在BCCH 1006 小區(qū)掉網(wǎng)后,在4 MHz 的GSM-R 頻段內(nèi)重新選擇6個(gè)信號(hào)強(qiáng)度最強(qiáng)的頻點(diǎn)去嘗試駐網(wǎng),MT2 電臺(tái)2 次搜索到的最強(qiáng)8 個(gè)頻點(diǎn)為1000、1002、1003、1006、1007、1008、1009 和1016,見表3。電臺(tái)監(jiān)測(cè)到這8 個(gè)頻點(diǎn)的信號(hào)強(qiáng)度基本相當(dāng),但這些頻點(diǎn)配置明顯不符合GSM-R 網(wǎng)絡(luò)要求,確定在BCCH 頻點(diǎn)為1006 的小區(qū)位置,整個(gè)GSM-R 頻段底噪被抬升,存在嚴(yán)重干擾,這種類型的干擾源一般是公網(wǎng)強(qiáng)信號(hào)阻塞干擾或基站發(fā)射雜散干擾[6]。
表3 MT2電臺(tái)掉網(wǎng)后搜索到的信號(hào)強(qiáng)度最強(qiáng)的GSM-R頻點(diǎn)
為進(jìn)一步確定干擾源,電務(wù)段聯(lián)合通信段、網(wǎng)絡(luò)設(shè)備廠商及電臺(tái)廠商共同進(jìn)行現(xiàn)場(chǎng)排查。首先排查公網(wǎng)潛在干擾,對(duì)GSM900 公網(wǎng)頻段頻譜進(jìn)行掃頻,掃頻結(jié)果見圖2。圖2中最強(qiáng)的信號(hào)強(qiáng)度為-60 dBm,這種強(qiáng)度的信號(hào)不會(huì)對(duì)鐵路GSM-R 頻段造成阻塞干擾;但發(fā)現(xiàn)整個(gè)GSM900公網(wǎng)頻段的底噪明顯異常,高達(dá)-70 dBm。其次排查GSM-R 網(wǎng)內(nèi)潛在干擾,對(duì)GSM-R 頻段開展全頻譜掃描,掃描結(jié)果見圖3。由圖3可見,在GSM-R頻段內(nèi)信號(hào)最強(qiáng)小區(qū)的頻點(diǎn)為1006,信號(hào)強(qiáng)度為-70 dBm,未見有同頻、鄰頻、阻塞和互調(diào)等干擾,但整個(gè)GSM-R 頻段也存在-75 dBm 的強(qiáng)底噪。最后測(cè)量列車尾部至列車頭部BCCH 1006小區(qū)的下行信號(hào)強(qiáng)度變化,以驗(yàn)證電臺(tái)掉網(wǎng)與列車停靠位置間的關(guān)系,測(cè)量結(jié)果見圖4。從圖4 可以看出,BCCH 1006 小區(qū)的信號(hào)強(qiáng)度在列車頭部位置最弱,最容易受強(qiáng)底噪干擾[7],導(dǎo)致電臺(tái)掉網(wǎng),引發(fā)單電臺(tái)故障。
圖2 GSM900公網(wǎng)頻點(diǎn)信號(hào)強(qiáng)度分布
圖3 GSM-R頻點(diǎn)信號(hào)強(qiáng)度分布
圖4 BCCH 1006小區(qū)下行信號(hào)強(qiáng)度分布
因不同列車在股道內(nèi)停靠位置存在些許差異,導(dǎo)致電臺(tái)在干擾強(qiáng)的位置接收的下行信號(hào)強(qiáng)度低于-54 dBm,引發(fā)電臺(tái)下行鏈路失敗造成無線通信超時(shí),而在干擾弱的位置接收的信號(hào)強(qiáng)度超過-54 dBm,電臺(tái)駐網(wǎng)成功,這就造成多年來在此位置總是出現(xiàn)偶發(fā)性無線通信超時(shí)故障。
經(jīng)對(duì)現(xiàn)場(chǎng)的發(fā)射源逐一排查,發(fā)現(xiàn)站內(nèi)某一直放站工作異常,關(guān)閉該直放站后,底噪恢復(fù)正常,后續(xù)該位置未再發(fā)生無線通信超時(shí)。
2021 年9 月24 日,電務(wù)段配屬裝有自主化電臺(tái)的CR400BF-5111 動(dòng)車組在擔(dān)當(dāng)某次運(yùn)行交路時(shí),該車00端在K18+661處報(bào)無線通信超時(shí)。
發(fā)生故障時(shí)PRI 接口數(shù)據(jù)見圖5。由圖5 可以得出,在20:28:31—20:28:53 的22 s 內(nèi),無線閉塞中心RBC 正常向車載發(fā)送數(shù)據(jù),但未收到車載發(fā)送的數(shù)據(jù);在K18+661 處,20:28:53,電臺(tái)收到RBC 發(fā)送的正常拆鏈DISCONNECT 消息,造成無線通信超時(shí)。
圖5 PRI接口數(shù)據(jù)
對(duì)超時(shí)前網(wǎng)絡(luò)側(cè)接口數(shù)據(jù)進(jìn)行分析,20:28:31,電臺(tái)從BCCH 1004 小區(qū)成功切換至BCCH 1010小區(qū),電臺(tái)在BCCH 1010小區(qū)上/下行電平均正常,上/下行信號(hào)質(zhì)量也均正常,未發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備異常。
因?yàn)楫?dāng)前網(wǎng)絡(luò)不具備記錄業(yè)務(wù)數(shù)據(jù)的功能,也沒有電臺(tái)的日志,電臺(tái)在完成小區(qū)切換后,PRI接口能夠記錄到RBC 給ATP 發(fā)送的數(shù)據(jù),無ATP發(fā)送給RBC 的數(shù)據(jù)記錄;A/Abis 接口記錄到衡量網(wǎng)絡(luò)無線環(huán)境的參數(shù)(電平及質(zhì)量)也均正常。故此類故障之前都被認(rèn)定為電臺(tái)軟件異常,小區(qū)切換后不轉(zhuǎn)發(fā)業(yè)務(wù)數(shù)據(jù)[8]。
對(duì)電臺(tái)無線通信超時(shí)日志進(jìn)行分析,見表4,電臺(tái)從BCCH 1004 小區(qū)切換至BCCH 1010 小區(qū),下行信號(hào)及質(zhì)量均正常,但切換至BCCH 1010 小區(qū)后,網(wǎng)絡(luò)通信狀態(tài)明顯異常,將電臺(tái)轉(zhuǎn)發(fā)RBC業(yè)務(wù)數(shù)據(jù)的業(yè)務(wù)信道(TCH)用作快速隨路控制信道(FACCH),在業(yè)務(wù)信道上長(zhǎng)時(shí)間持續(xù)發(fā)送填充幀,造成網(wǎng)絡(luò)單通,電臺(tái)持續(xù)22 s 收不到RBC 發(fā)送的無線鏈路層(HDLC)數(shù)據(jù)[9],車地?cái)?shù)據(jù)交互異常,引發(fā)RBC 主動(dòng)斷開通信連接,從而造成無線通信超時(shí)。
表4 電臺(tái)無線通信超時(shí)日志
3GPP 0406 協(xié)議[10]規(guī)定:如果基站(BTS)在專用控制信道(DCCH)上沒有數(shù)據(jù)幀發(fā)送,基站通過發(fā)送特殊格式的UI 幀(無編號(hào)信息幀)使專用控制信道保持激活狀態(tài)。該特殊格式的UI 幀為填充幀,按照?qǐng)D6 中定義的填充幀類型,當(dāng)基站需發(fā)送填充幀時(shí),UI 幀中的C 必須設(shè)置為1,該UI 幀對(duì)應(yīng)的格式為3 3 1 X X …,與自主化電臺(tái)捕獲到的3 3 1 2B 2B …一致。
圖6 填充幀類型定義
基站使用專用控制信道發(fā)送填充幀的前提條件是基站無業(yè)務(wù)數(shù)據(jù)發(fā)送給電臺(tái)。但在無線通信超時(shí)前,RBC是有發(fā)送業(yè)務(wù)數(shù)據(jù)的,說明GSM-R網(wǎng)絡(luò)中的基站控制器(BSC)并未將這些業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)發(fā)給基站,基站發(fā)送大量的填充幀,以保證專用控制信道可用。后續(xù)通過排查,此次故障是基站控制器和基站間的傳輸異常所致,經(jīng)過調(diào)整后,該基站未再發(fā)生此類故障。
當(dāng)前對(duì)于多數(shù)CTCS-3級(jí)列控系統(tǒng)無線通信超時(shí)故障的分析,因缺少故障時(shí)車載側(cè)有效的數(shù)據(jù)記錄,事后僅通過網(wǎng)絡(luò)側(cè)數(shù)據(jù)難以對(duì)故障進(jìn)行準(zhǔn)確定位,有時(shí)只能預(yù)防性地更換電臺(tái),但無法從根本上解決問題,而這又給現(xiàn)場(chǎng)帶來諸多次生作業(yè)風(fēng)險(xiǎn)。通過自主化電臺(tái)實(shí)時(shí)日志功能可準(zhǔn)確回溯到無線通信超時(shí)故障時(shí)的狀態(tài),在定位故障的準(zhǔn)確性上優(yōu)勢(shì)明顯,能大大提升CTCS-3 級(jí)列控系統(tǒng)的運(yùn)維效率。
后續(xù)建議充分利用自主化電臺(tái)優(yōu)勢(shì),結(jié)合大數(shù)據(jù)、人工智能等先進(jìn)技術(shù),深挖日志數(shù)據(jù)價(jià)值,將全國(guó)范圍內(nèi)GSM-R 網(wǎng)絡(luò)的參數(shù)配置、網(wǎng)絡(luò)覆蓋、小區(qū)切換位置、小區(qū)重選位置等與CTCS-3級(jí)列控系統(tǒng)無線通信超時(shí)關(guān)聯(lián)起來,給設(shè)備維護(hù)部門提供數(shù)據(jù)支持,將事后故障分析轉(zhuǎn)變?yōu)槌邦A(yù)防,為降低無線通信超時(shí)故障提供有力支撐。