周睿
通過合理路徑規(guī)劃實現(xiàn)高速鐵路能量效率的優(yōu)化是鐵路運行中的重要研究內(nèi)容。本文引入資格跡(eligibility trace)改進徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡。在此基礎上,使用改良的徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡實現(xiàn)列車在復雜情況下的路徑規(guī)劃。
【關鍵詞】鐵路路徑規(guī)劃 徑向基函數(shù) 神經(jīng)網(wǎng)絡
1 引言
地鐵和高鐵的廣泛使用使得鐵路在現(xiàn)代社會的日常生活中扮演著越來越重要的角色。與飛機、汽車相比,鐵路能耗較少,更加清潔環(huán)保。但不合理的軌跡規(guī)劃仍然會造成大量不必要的能量損耗。所以優(yōu)化列車軌跡規(guī)劃,提高能量使用效率一直是重要的研究方向之一。
Pengling Wang[1] 通過遺傳算法分析列車變速過程,從而提高列車運行能量效率。Bart De Schutter[2]提出了分別關于非線性連續(xù)時間列車運行模型和連續(xù)空間列車運行模型的優(yōu)化方法。XU Yanping[3]使用多尺度動態(tài)規(guī)劃改進列車自動駕駛系統(tǒng),實現(xiàn)列車能量效率優(yōu)化。
本文使用資格跡(eligibility trace)改良徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡。在此基礎上提出關于連續(xù)狀態(tài)空間列車運行模型的軌跡優(yōu)化方案。
2 問題定義與建模
2.1 火車運動模型
為簡化列車運動狀態(tài),列車可視為僅受牽引力和摩擦力影響,由此列車的運動模型可由以下公式表示:
基礎阻力主要由空氣阻力和摩擦力引起,通??梢暈殛P于速度的二次函數(shù)。附加阻力是關于列車所在位置的函數(shù),與軌道性質相關。
輸出力 f 既可表示列車運行的牽引力也表示列車的制動力。當輸出力 f 為正數(shù)時,輸出力 f 表示牽引力。當輸出力 f 為負數(shù)時,輸出力 f 表示制動力。當輸出力 f 等于零時,輸出力 f 表示列車處于惰性運轉狀態(tài)。輸出力 f 的范圍可由下式表示:
2.2 運行數(shù)據(jù)評判標準
本文主要研究列車運行中的能量損耗問題。與此同時,列車的運行時間也是評判列車軌跡規(guī)劃合理性的一個重要標準。且列車的運行時間和能量損耗存在直接的影響關系,列車準時性可由下式評判:
2.3 馬爾科夫決策過程建模
由上述條件,本文涉及火車軌跡規(guī)劃問題可視為馬爾科夫過過程(MDP) 。馬爾科夫過程可由數(shù)組 < S, A, T, R > 表示:S 是一個無限的狀態(tài)空間,本文中 S 表示列車的運行狀態(tài)。A 是一個有限的動作空間。T 是一個未知的狀態(tài)轉移函數(shù),定義為:
在本文中,狀態(tài)是一個二維向量,兩個分量分別代表列車的運行速度和運行位移。動作 A 代表列車的單位質量輸出力。本例中獎勵函數(shù) R 的定義是問題解決的關鍵。R 函數(shù)首先包括上文所述的評價標準。此外為了防止列車模型在運行途中(未到終點前)停車,R 函數(shù)需要設置一定懲罰,如果列車速度,在初始位置或者終點位置以外的地方等于零。
3 RBF神經(jīng)網(wǎng)絡
人工神經(jīng)網(wǎng)絡因其良好的學習能力,在非線性系統(tǒng)的預測中有廣闊的運用?;趶较蚧瘮?shù)(RBF)的神經(jīng)網(wǎng)絡是一種局部收斂的神經(jīng)網(wǎng)絡,它包含了兩層結構,即只含一層隱含層。它的輸入量是狀態(tài) S,輸出量是 Q(動作值函數(shù))。它的第一層結構為非線性結構:
4 仿真模擬
為了驗證算法算法的合理性,本文引入一段虛擬軌道。具體參數(shù)設置如表1。
基礎阻力由下式表示:
通過運算,可得圖 3 函數(shù)的收斂過程。由圖3可得,通過此算法可以得到穩(wěn)定的規(guī)劃軌跡(本文算法中根據(jù)獎勵函數(shù)的較小值選取相應動作)。
5 結論
本文將資格跡和徑向基函數(shù)神經(jīng)網(wǎng)絡結合,提出了一種用于提高列車運行能量效率的算法。仿真表明,此算法可以有效解決問題。
參考文獻
[1]Wang Y,Ning B,Cao F,et al.A survey on optimal trajectory planning for train operations[C].Service Operations,Logistics, and Informatics (SOLI),2011 IEEE International Conference on.IEEE,2011:589-594.
[2]Xu Y,Zhao X,Wang L,et al.Optimal control of automatic train operation based on multi-scale dynamic programming[C]//Control Conference (CCC),2014 33rd Chinese. IEEE,2014:3429-3433.
[3]Wang P,Lin X,Li Y.Optimization analysis on the energy saving control for trains with adaptive genetic algorithm[C]//Systems and Informatics (ICSAI),2012 International Conference on.IEEE,2012:439-443.
[4]Pakizeh E,Pedram M M,Palhang M.Multi-criteria expertness based cooperative method for SARSA and eligibility trace algorithms[J].Applied Intelligence,2015,43(03):487-498.
[5]王學雷,邵惠鶴,李亞芬.一種徑向基函數(shù)神經(jīng)網(wǎng)絡在線訓練算法及其在非線性控制中的應用[J].信息與控制,2001,30(03):249-253.
作者單位
法國里爾第一大學 法國 59650