夏 明,蔣仁鋼
(卡斯柯信號有限公司 北京分公司,北京 100055)
城際鐵路列控系統(tǒng)[1-2]通過建立車地之間連續(xù)、雙向的通信,使列車命令和狀態(tài)信息在車輛和地面之間可靠交互,將地面設(shè)備和受控列車緊密的結(jié)合,可靠而精確地檢測列車位置,控制列車按運行計劃運行。城際鐵路列控系統(tǒng)的地面設(shè)備和車載設(shè)備,通過GSM-R無線數(shù)據(jù)通信網(wǎng)絡(luò)連接,構(gòu)成了系統(tǒng)的核心。
因為采用GSM-R無線通信網(wǎng)絡(luò)進(jìn)行信息傳輸,地面設(shè)備與車載設(shè)備之間的通信延時是無法克服的。車地通信延時的存在造成系統(tǒng)中車載設(shè)備和地面設(shè)備對信息使用的不同步。例如,當(dāng)軌旁設(shè)備收到車載設(shè)備的位置報文時,列車實際位置可能已發(fā)生改變,這對列車的運行控制而言存在一定的安全風(fēng)險[3-4]。因此,城際鐵路列控系統(tǒng)需考慮通信延時對列車運行控制的影響。由于延時時間的無法準(zhǔn)確計算,目前的研究主要基于統(tǒng)計學(xué)方法,如文獻(xiàn)[5]提出了一種延時時間的檢測方法,利用一段歷史時間內(nèi)(10個周期)的延時時間的平均值作為估算值。該方法的估算值精確度不高,難以獲得良好的效果。
鑒于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)自身具有高度自學(xué)習(xí)性,不依賴高質(zhì)量特征的特點,相比于統(tǒng)計學(xué)等數(shù)學(xué)模型更具有適用性,被廣泛的應(yīng)用在圖像識別、語音識別、預(yù)測分析等領(lǐng)域[6-9]。本文運用具有長短期記憶(LSTM ,Long Short Term Memory)單元的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)構(gòu)建了無線延時時間預(yù)測模型,解決無線通信延遲時間估計問題,選取了實際數(shù)據(jù)、歷史平均時間數(shù)據(jù)進(jìn)行比較分析,仿真結(jié)果表明LSTM神經(jīng)網(wǎng)絡(luò)模型優(yōu)于平均值算法,訓(xùn)練結(jié)果與實際值接近,預(yù)測精度高。預(yù)測結(jié)果為車地通信消息有效性的精確判斷、列車精確定位提供依據(jù)。
車地通信延時時間Tdt包括車地通信網(wǎng)絡(luò)的固有傳輸時間Tnetwork和信息傳輸延誤時間Tdelay,即Tdt=Tnetwork+Tdelay。其中,Tnetwork可依據(jù)網(wǎng)絡(luò)傳輸設(shè)備的反應(yīng)時間和通信周期等進(jìn)行估算。但是,列車消息在由車載系統(tǒng)采用GSM-R無線方式傳送至地面系統(tǒng)時受無線信號質(zhì)量的影響和無線通信延時的制約,設(shè)備具有一定的反應(yīng)時間,所以Tdelay無法控制且不能直接檢測。因此,一般采用常量時間判定的方式來確定車地通信時間是否有效。即在系統(tǒng)中設(shè)置一個車地通信報文時效性的時間參數(shù),通過該參數(shù)判定車地通信報文的最大使用許可時間。例如:CCS系統(tǒng)在接收列車消息后,獲取消息時間戳發(fā)送給列車的消息時間戳列車接收列車消息后,判斷Tccs是否在之間(a為延時常量),否則將丟棄該消息。如果Tdt估算不準(zhǔn)確,將影響消息有效性判斷的準(zhǔn)確性。城際鐵路地面設(shè)備與車載設(shè)備信息通信示意圖,如圖1所示。
圖1 城際鐵路地面設(shè)備與車載設(shè)備信息通信示意圖
簡單的遞歸神經(jīng)網(wǎng)絡(luò)(RNN ,Simple-RNN)和一般的深度神經(jīng)網(wǎng)絡(luò)(DNN)區(qū)別是在隱藏層中增加節(jié)點間的互連,通過這種連接,隱藏層能夠保存并利用歷史信息來輔助處理當(dāng)前數(shù)據(jù)。RNN展開后相當(dāng)于一個多層的DNN神經(jīng)網(wǎng)絡(luò),當(dāng)層數(shù)過多時會導(dǎo)致參數(shù)訓(xùn)練的梯度消失問題,導(dǎo)致長時信號損失。為了彌補這一缺陷,設(shè)計出LSTM替代隱藏層中的RNN網(wǎng)絡(luò),使模型能夠建模信號的長時依賴關(guān)系。LSTM遞歸神經(jīng)網(wǎng)絡(luò)將隱含層作了改進(jìn),其神經(jīng)元結(jié)構(gòu),如圖2所示,灰色線代表有權(quán)重的網(wǎng)絡(luò)連接關(guān)系,灰色虛線代表遞歸連接關(guān)系。
圖2 LSTM內(nèi)部神經(jīng)元結(jié)構(gòu)
LSTM遞歸神經(jīng)網(wǎng)絡(luò)中遞歸連接為線性連接,該連接依靠信號來控制,該門被稱為遺忘門(forget gate)。因為它不需要經(jīng)過類似sigmoid函數(shù)的非線性變換,所以在訓(xùn)練中,LSTM的梯度信號在不同時刻的傳遞過程中不會衰減。除了遺忘門之外,還有輸入門(input gate)和輸出門(output gate),對應(yīng)信號it和ot。在LSTM遞歸神經(jīng)網(wǎng)絡(luò)模型中,xt和yt分別為t時刻網(wǎng)絡(luò)的輸入和輸出。令ct和mt分別為t時刻的神經(jīng)元激活函數(shù)輸出和隱含層輸出,則從xt到y(tǒng)t的計算式為:
其中:Wcx、Wix、Wfx、Wox是連接輸入信號xi的權(quán)重矩陣;
Wcm、Wim、Wfm、Wom是連接神經(jīng)元隱含層輸出信號m_t的權(quán)重矩陣;
Wic、 Wfc、 Woc是連接神經(jīng)元激活函數(shù)輸出矢量ct和門函數(shù)的對角矩陣;
bi、bf、bc、bo是偏置向量;
Wym和 by是LSTM輸出的權(quán)重矩陣和偏置矢量;ct是胞元的激活函數(shù)輸出矢量;
g和h是胞元輸入到輸出的激活函數(shù);
g和h通常是tanh函數(shù);
σ為sigmoid函數(shù);
φ是輸出層的softmax函數(shù);
代價函數(shù)這里使用交叉熵。
在實際的建模過程中使用兩層的LSTM遞歸神經(jīng)網(wǎng)絡(luò),對于深層的LSTM遞歸神經(jīng)網(wǎng)絡(luò),它在時間域和空間域上都具有深層結(jié)構(gòu)。
本文使用兩層的LSTM神經(jīng)網(wǎng)絡(luò),文獻(xiàn)[5]認(rèn)為延時時間與數(shù)據(jù)包的大小有關(guān),所以提取無線通信延時問題的輸入特征為數(shù)據(jù)包大小(字節(jié)數(shù))和對應(yīng)的延時時間。
LSTM神經(jīng)網(wǎng)絡(luò)以損失函數(shù)評價實驗結(jié)果,通常選為均方誤差(MSE ,Mean Squared Error)。這是回歸分析中普遍采用的評價標(biāo)準(zhǔn)。均方誤差的式為:
實驗數(shù)據(jù)為每隔單位時間從CCS系統(tǒng)上采集的數(shù)據(jù)包大小與傳輸延時時間數(shù)據(jù)。實驗采用Python語言,LSTM模型由Tensorflow深度學(xué)習(xí)框架提供[10]。應(yīng)用規(guī)范化(BN ,Batch Normalization)方法提高收斂速度,采用指數(shù)衰減法自動調(diào)整學(xué)習(xí)效率,避免訓(xùn)練時間過長,防止參數(shù)在最優(yōu)點附近震蕩。經(jīng)過多次實驗,當(dāng)隱藏層節(jié)點數(shù)為10,batch size取為40,timesteps(timesteps代表LSTM能夠利用的時間序列長度,LSTM可以訓(xùn)練時間序列上的數(shù)據(jù),利用數(shù)據(jù)在時間上的相關(guān)性使得訓(xùn)練結(jié)果更加精確。)取為10時取得較好的訓(xùn)練效果,如圖3所示,經(jīng)過1 000組數(shù)據(jù)訓(xùn)練后,損失函數(shù)降低為:0.044,預(yù)測精度達(dá)到95%以上。在80個測試集上的MSE平均值沒有超過0.06,證明該預(yù)測方法在實踐上具有有效性。與之相比,平均值法曲線波動較大,準(zhǔn)確度不高。
圖3 預(yù)測數(shù)據(jù)與采用歷史平均延時時間的計算結(jié)果的比較
因為列控系統(tǒng)的工作狀態(tài)前后之間具有關(guān)聯(lián)性,因此該數(shù)據(jù)在時間上具有天然的連續(xù)性。具體采用timesteps的大小應(yīng)由生產(chǎn)過程中的客觀因素決定,當(dāng)天氣、地形、線路、設(shè)備等條件發(fā)生改變時,數(shù)據(jù)前后之間的關(guān)聯(lián)性便會隨之變化。
實驗結(jié)果如圖4所示,當(dāng)timestep=1,收斂最快,收斂速度與timesteps大小成反比。原因是當(dāng)timesteps增加時,同樣的輸出結(jié)果對應(yīng)的輸入數(shù)據(jù)增多,計算量增加。同時可以看到,當(dāng)timesteps=10時,模型精度反而略高于timesteps=64,說明timesteps不是越大越好,過大的timesteps不僅會增加收斂時間、提高模型訓(xùn)練難度,有可能降低模型精度。因為當(dāng)數(shù)據(jù)在時間序列上的長度過長時,前后之間的關(guān)聯(lián)性可能就逐漸減低甚至失去關(guān)聯(lián)性。因此建議將timesteps設(shè)置為可以被學(xué)習(xí)的參數(shù),當(dāng)模型的訓(xùn)練精度不再下降甚至反而上升時,便可以進(jìn)行參數(shù)學(xué)習(xí)更改,取得更優(yōu)的訓(xùn)練效果。
城際鐵路列控系統(tǒng)車-地?zé)o線通信延時,會影響無線消息有效性判斷。本文引入遞歸神經(jīng)網(wǎng)絡(luò)對無線通信延遲時間進(jìn)行預(yù)測,解決了傳統(tǒng)統(tǒng)計分析方法難以從歷史延時時間數(shù)據(jù)中提取特征的問題,證明了該預(yù)測方法在實踐上具有有效性,并解決傳統(tǒng)方法難以解決的問題。本文采用BN等深度學(xué)習(xí)方法,結(jié)合LSTM的模型特點對模型的訓(xùn)練方法進(jìn)行優(yōu)化,大大縮短了模型的訓(xùn)練時間。下一步工作的目標(biāo)之一是在本文模型上進(jìn)一步提高收斂速度與精度,提高模型的適用性。
圖 4 不同timesteps對比圖
[1]邸洪濤,王長林.關(guān)于客運專線列車運行控制系統(tǒng)的探討[J].鐵路計算機應(yīng)用,2007,16(5):21-22.
[2]楊曉娟,賈利民.列車控制系統(tǒng)架構(gòu)與技術(shù)現(xiàn)狀及發(fā)展方向[J].鐵路計算機應(yīng)用,2012,21(3):49-52.
[3]李曉剛.車地通信延時對CBTC系統(tǒng)列車運行控制的影響分析[J].鐵路通信信號工程技術(shù),2011,12(8):44-46.
[4]劉宏杰,劉 波,夏夕盛.CBTC列車安全定位中通信延時的研究[J].市政技術(shù),2010,(S2):474-479.
[5]劉立明,韓 濤,蔣仁鋼.一種城際鐵路GSM-R無線消息延遲的檢測方法技術(shù):CN105873123A[P].中國專利,2016-03-21.
[6]黃光許,田 筀,康 健,等.低資源條件下基于i-vector特征的LSTM遞歸神經(jīng)網(wǎng)絡(luò)語音識別系統(tǒng)[J].計算機應(yīng)用研究,2017,34(2):392-396.
[7]王 晶.基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的車牌字符識別技術(shù)的研究[J].工業(yè)控制計算機,2017(3):51-52.
[8]張洪剛,李 煥.基于長短時記憶模型的中文分詞方法[J].華南理工大學(xué)學(xué)報:自然科學(xué)版,2017(3):61-67.
[9]殷瑞剛,魏 帥,李 晗,等.深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述[J].計算機系統(tǒng)應(yīng)用,2016(8):1-7.
[10]鄭澤宇,顧思宇.TensorFlow實戰(zhàn)Google深度學(xué)習(xí)框架[M].北京:電子工業(yè)出版社,2017.