郭海財
目前,在TDCS系統(tǒng)內(nèi)部新增加了一項列車占用丟失報警功能,可以實時監(jiān)控列車運行狀態(tài),給調(diào)度員提供行車指揮參考信息。然而該功能在試運行階段,存在許多誤報警,且大部分是由于軟件故障、硬件故障、網(wǎng)絡(luò)故障等問題導致。為確保TDCS設(shè)備的功能可靠穩(wěn)定,對2013年所有TDCS不良情況進行了統(tǒng)計分析,查找關(guān)鍵因素,提出整改方案。
2013年,對管內(nèi)TDCS設(shè)備故障進行了統(tǒng)計,其中網(wǎng)絡(luò)故障41次占總不良反應的69.5%,硬件故障15次占總不良反應的25.4%,軟件故障2次占總不良反應的3.4%,其他故障1次占1.7%。硬件故障中,4次分機故障是由于雷擊導致,11次終端故障都是由于工控機配置較低引起,上半年已將配置低的工控機全部予以更換。于是,解決網(wǎng)絡(luò)故障就成為減少TDCS設(shè)備不良反應的關(guān)鍵因素。
進一步統(tǒng)計分析網(wǎng)絡(luò)故障,路由器問題、協(xié)轉(zhuǎn)問題和通道自身問題是引起TDCS設(shè)備網(wǎng)絡(luò)故障的主要問題,因此,要從這三個方面查找故障原因。
根據(jù)詳細統(tǒng)計內(nèi)容分析,大部分路由器表現(xiàn)出來的問題,都是由于通道無法迂回引起的通道故障。針對此現(xiàn)象,采取提報施工計劃的形式,采用“遍歷法”對所有網(wǎng)絡(luò)通道進行測試,以判斷路由器問題產(chǎn)生的各種原因。
杭州電務段管內(nèi)的網(wǎng)管圖如圖1所示。根據(jù)圖1的環(huán)網(wǎng),制作試驗表格,對每兩站的通道逐段斷開測試,測試結(jié)果見表1,表中只列出了存在問題的欄目,序號保留試驗表格原序號。
根據(jù)測試結(jié)果,與廠家共同查找中心服務器、路由器以及車站路由器配置,發(fā)現(xiàn)滬昆一臺、二臺的一部分站點與站點之間通道發(fā)生不通時,就會發(fā)生從杭州維護中心ping不通一些車站的路由器的情況,但是可以ping通這些車站下連的終端,這樣的網(wǎng)絡(luò)問題是由于早期網(wǎng)絡(luò)規(guī)劃遺留的。蕭甬臺的網(wǎng)絡(luò)問題是由于路由器配置不完善和局部配置錯誤產(chǎn)生的。
協(xié)轉(zhuǎn)屬于協(xié)議轉(zhuǎn)換設(shè)備,不需要進行內(nèi)部設(shè)置,只要安裝時嚴格按照撥碼開關(guān)設(shè)置,通信就沒問題。對2013年更換下來的協(xié)轉(zhuǎn)進行統(tǒng)計分析,發(fā)現(xiàn)有6個是由于即將到使用壽命(大修周期為10年),有9個是在三季度高溫時段更換下來,經(jīng)返廠分析,是由于夏天機房溫度過高,導致協(xié)轉(zhuǎn)電路板工作不穩(wěn)定。
圖1 杭州電務段管內(nèi)的網(wǎng)管圖
通道主要包括主通道和連接頭 (2M頭子)。根據(jù)2013年詳細記錄分析,有1次是由于電纜斷線導致主通道不通,其余7次是由于2M頭子松動和虛焊導致通道不良。
另外還有一些通道不良是由于雷擊導致路由器損壞,不屬于主要原因。
1.路由規(guī)劃。此問題可以通過重新規(guī)劃中心路由器,使重分布明確。此外還有一個快速解決方案,就是局部站與站通道斷開時,可能有一些路由器telnet不上去,但是信息還是會回到中心,可以通過參照網(wǎng)管軟件的開圖,從另一側(cè)telnet到需要的路由器上,然后盡快恢復故障線路。
2.配置錯誤。圖1中的H車站與中心切斷后,H車站到紹興的沿途站就訪問不到中心,這是因為紹興與紹興東的eigrp配置錯誤,鄰居關(guān)系建立不起來,通道環(huán)路是單向的,一端斷了就不會從另一端與中心通信。在紹興路由器上修改配置如下:
表1 TDCS通道試驗表
int lo1
ip add 192.23.67.50 255.255.255.252
int s0/0
en ppp
ip unn
no sh
3.配置不完善。中心訪問不到圖1的J車站和寧波的站點,這是因為路由缺失問題導致的。需要在中心與站點更改的配置如下:
中心地址是172.23.62.161路由器
iproute 192.23.67.18 255.255.255.255.255 192.23.62.5
iproute 192.23.67.0 255.255.255.255.252 192.23.62.5
iproute 172.23.67.192 255.255.255.224 192.23.62.5
iproute 172.23.68.0 255.255.255.224 192.23.62.5
iproute 172.23.67.160 255.255.255.224 192.23.62.5
中心地址是192.23.62.5路由器
iproute 192.23.67.18 255.255.255.255.255 192.23.62.1
iproute 192.23.67.0 255.255.255.255.252 192.23.62.1
iproute 172.23.67.192 255.255.255.224 192.23.62.1
iproute 172.23.68.0 255.255.255.224 192.23.62.1
iproute 172.23.67.160 255.255.255.224 192.23.62.1
J站
iproute 172.23.62.160 255.255.255.224 192.23.67.18
寧波站點
iproute 172.23.62.160 255.255.255.224 192.23.67.1
1.使用壽命。在日常檢查巡視中,注意查看路由端口狀態(tài),發(fā)現(xiàn)丟包較為嚴重的車站,查詢協(xié)轉(zhuǎn)使用時間。對即將到達使用壽命的,提前安排進行更換,以避免發(fā)生通道故障,導致信息傳輸不暢,引起占用丟失誤報警。
2.溫度過高。協(xié)議轉(zhuǎn)換器的最適宜使用溫度是20℃~30℃,夏季溫度高,為了不影響設(shè)備正常使用,且還兼顧節(jié)能環(huán)保,在夏季由信號工區(qū)在每天的10:00-16:00期間,將機房空調(diào)溫度設(shè)置于25℃以下,以確保協(xié)轉(zhuǎn)穩(wěn)定傳輸。此方法在夏季使用效果明顯。
3.通道自身問題。在日常設(shè)備巡視檢查時,將2M頭子作為檢查重點,發(fā)現(xiàn)丟包嚴重現(xiàn)象,立即聯(lián)系更換協(xié)轉(zhuǎn),若還不能得以恢復,建議對2M頭子進行重新制作。每年配合通信部門對2M網(wǎng)絡(luò)進行測試,在掛誤碼儀測試時,重點檢查2M頭子接觸是否良好,是否會引起網(wǎng)絡(luò)誤碼,并向通信專家請教維護2M頭子相關(guān)知識,以提高其穩(wěn)定性,確保網(wǎng)絡(luò)可靠運行。
通過以上解決方案,管內(nèi)網(wǎng)絡(luò)問題整治效果明顯,產(chǎn)生網(wǎng)絡(luò)故障的問題沒再發(fā)生。根據(jù)統(tǒng)計,2014年6~8月也未發(fā)生由于溫度過高導致的協(xié)轉(zhuǎn)不良。2M頭子經(jīng)過全面整治后,運行也相對穩(wěn)定,未發(fā)生不良接觸。
占用丟失報警功能的開通,使TDCS系統(tǒng)已經(jīng)不再是單獨的復示作用,而是作為一項主要行車設(shè)備,實時跟蹤列車運行軌跡。TDCS功能的增強,對于維護部門來說,既是一種責任,也是一種挑戰(zhàn)。要通過日常的檢修,發(fā)現(xiàn)問題,解決問題,不斷摸索前進,總結(jié)出一套適合設(shè)備穩(wěn)定運行的維護手段,以確保鐵路運輸安全暢通。
[1] 董昱.區(qū)間信號與列車運行控制系統(tǒng)[M].北京.中國鐵道出版社.2008.6.
[2] 譚浩強.Cisco路由器使用技術(shù)[M].北京:中國鐵道出版社,2006.
[3] 中華人民共和國鐵道部.鐵路信號維護規(guī)則技術(shù)標準[M].中國鐵道出版社,2008.