竇鵬飛,王化深
(北京交通大學(xué)軌道交通控制與安全國家重點實驗室,北京100044)
采用先進的列車自動控制(ATC)技術(shù),可以提高行車的密度、效率與安全性[1],列車自動運行(ATO)系統(tǒng)是ATC系統(tǒng)中用于取代司機并對列車進行自動控制的智能子系統(tǒng),其功能包括列車的自動啟動、自動調(diào)速、自動停車和定點停車等。作為ATC的一個重要子系統(tǒng),ATO是提高軌道交通列車運行效率、實現(xiàn)列車高密度運行的關(guān)鍵[2]。
ATO系統(tǒng)的核心技術(shù)是列車速度自動控制(ASC)算法,列車速度自動控制的主要功能是根據(jù)接收到的來自ATP的目標(biāo)速度,對列車的牽引與制動實施控制。其控制目標(biāo)是在有限時間區(qū)間上對給定計劃速度曲線(由ATP系統(tǒng)計算得到的一次模式制動曲線)進行完全跟蹤。ATO速度控制算法的性能對整個系統(tǒng)的效率、安全性、準(zhǔn)時性、舒適性和節(jié)能具有重大的影響,是列車自動控制系統(tǒng)的關(guān)鍵技術(shù)之一[3]。
早期的ATO算法基于列車動力學(xué)模型的經(jīng)驗公式,通過比例、積分、微分(PID)控制技術(shù)實現(xiàn)列車速度調(diào)整?;赑ID的ATO速度控制算法是目前為大部分城市軌道交通ATO系統(tǒng)所采用,并且具有成功應(yīng)用經(jīng)驗的控制算法[4~5]。許多學(xué)者后來提出各種改進的PID算法(智能型PID算法),主要是通過與其他智能控制算法結(jié)合實現(xiàn)對PID控制器的參數(shù)的自整定。20世紀(jì)80年代,一些學(xué)者開始嘗試將模糊控制應(yīng)用到ATO中,其控制質(zhì)量高于PID,并能實現(xiàn)多目標(biāo)控制。但由于經(jīng)驗不完善導(dǎo)致控制規(guī)則不能細化,致使模糊控制不能適應(yīng)控制過程中列車動力系統(tǒng)參數(shù)的不斷變化。許多研究將專家系統(tǒng)運用到ATO中,但專家系統(tǒng)中專家知識仍然是移植自駕駛員的經(jīng)驗,因此專家系統(tǒng)與模糊控制一樣無法克服因經(jīng)驗不完善而帶來的控制質(zhì)量的下降。
在城市軌道交通實際運營中,列車在區(qū)間的運行是由運行圖及運行計劃決定的,因此是近似重復(fù)的。在重復(fù)的任務(wù)中,受控系統(tǒng)會表現(xiàn)出相似的行為,但上述PID控制算法及一些智能控制算法都未能充分利用系統(tǒng)在重復(fù)過程中的有用信息,不能在過去的操作中對系統(tǒng)知識進行學(xué)習(xí)。而迭代學(xué)習(xí)控制方法在提出之前,其創(chuàng)始人Arimoto就充分認(rèn)識到這點,所有迭代學(xué)習(xí)控制在構(gòu)造當(dāng)前的控制行為時,可以學(xué)習(xí)并充分利用過去重復(fù)操作中的重要信息[6]。因而,迭代學(xué)習(xí)控制以完全跟蹤為目標(biāo),對系統(tǒng)的先驗知識要求較少,可用于具有強不確定性,復(fù)雜非線性的列車自動駕駛控制。
迭代學(xué)習(xí)控制的核心思想是:在具有重復(fù)性的系統(tǒng)中進行軌跡跟蹤時,利用前幾次操作得到的控制輸入和誤差信息修正本次跟蹤的控制輸入,使控制任務(wù)完成得更好[6~7]。
相對于PID控制,迭代學(xué)習(xí)控制器的設(shè)計需要較少的系統(tǒng)知識,本質(zhì)上是一種無模型的控制方法,而且非常適用于像列車速度控制這種非線性控制系統(tǒng)。相對于其他智能控制方法如模糊控制、專家系統(tǒng)等,迭代學(xué)習(xí)控制通過重復(fù)操作,不斷學(xué)習(xí)并積累“控制經(jīng)驗”,以保證隨著迭代次數(shù)的增加控制效果會不斷提高或保持穩(wěn)定,而不需要總結(jié)人工經(jīng)驗然后向控制器移植。但是,迭代學(xué)習(xí)控制應(yīng)用于ATO中,必須考慮安全性要求,如果控制穩(wěn)定性差,精度不足,列車速度極有可能超出限速從而觸發(fā)緊急制動停車。
在文獻[9] 中,作者將迭代學(xué)習(xí)控制應(yīng)用到列車自動駕駛中,從理論上證明了系統(tǒng)的收斂性,仿真結(jié)果也顯示經(jīng)過數(shù)次迭代后能夠保證很高的控制精度。但其算法的設(shè)計不能保證迭代初期列車運行的安全性,即列車速度會超出限速,這將引發(fā)列車實施緊急制動。在本文控制方案的設(shè)計中,將引入一些改進措施來解決這一問題。
列車的動力學(xué)模型可以表述為[10]
在實際中,牽引力與制動力不會同時作用于列車。在不同的工作狀況下,列車的受力情況各不相同。不考慮緊急制動的情況,把列車的工況劃分為加速、動力制動(調(diào)速制動)、惰行、常用制動。在這4種工況中,牽引力Ftr(t)與主動制動力Fb(t)只有一個在起作用。
在迭代學(xué)習(xí)控制中,列車動力學(xué)模型改寫為:
在文獻[1] 和文獻[9] 中,取迭代學(xué)習(xí)控制律為uk(t)=uk-1(t)+gek-1(t)時,學(xué)習(xí)增益g只要滿足|1-g|≤γ<1,系統(tǒng)即收斂。然而,其迭代學(xué)習(xí)控制方案設(shè)計不能避免迭代初期因控制不穩(wěn)定導(dǎo)致列車超速觸發(fā)緊急制動停車。
為避免迭代初期列車超速,我們提出一種新的控制方案。在迭代控制的初期,期望軌跡的設(shè)定遠低于計劃速度曲線,因此,即便列車速度會超出期望軌跡,這種冗余設(shè)計也能保證速度不會超過計劃速度曲線。隨著迭代次數(shù)的增加,設(shè)置期望軌跡接近并保持為計劃速度曲線。因為控制精度逐漸提高,期望軌跡的設(shè)置既能保證列車速度不會超出計劃速度曲線,又能保證經(jīng)過一定的迭代后列車在該算法的控制下按照計劃速度曲線運行,完成控制任務(wù)。
圖1為整個迭代學(xué)習(xí)控制過程中期望軌跡的變化,前10次迭代中,期望軌跡逐漸向列車在區(qū)間運行的計劃速度曲線逼近。并且在最后10次迭代中,期望軌跡一致為計劃速度曲線。
為了實現(xiàn)變期望軌跡漸近跟蹤,學(xué)習(xí)律中加入期望軌跡的變化信息,并改寫為:
其中,esk(t)=sk(t)-sk-1(t),為2次迭代之間期望軌跡的變化信息。通過在學(xué)習(xí)律中加入期望軌跡的變化信息,迭代學(xué)習(xí)控制能夠響應(yīng)期望軌跡的變化,并根據(jù)變化量的相關(guān)信息對列車進行額外的超前控制,更有效地控制列車,使其按新的期望軌跡運行。
圖1 迭代過程中期望軌跡的變化
期望軌跡的設(shè)置可以保證esk(t)的值隨迭代次數(shù)的增加而單調(diào)下降,并且由于期望軌跡最后與計劃速度曲線保持一致而不再變化,即
esk(t)=0,k≥m,m為一常數(shù)。
因此,期望軌跡變化信息esk(t)的加入不會改變控制的收斂性。
[10] ,在仿真中,設(shè)定運行中列車單位質(zhì)量所受的基本阻力rv為:
假設(shè)區(qū)間長度Ls為6 km,設(shè)置列車單位質(zhì)量所受的附加阻力ws=ws+wi+wr:
列車在區(qū)間中運行的計劃速度曲線為:
與之對應(yīng)的列車計劃運行軌跡為:
仿真中,學(xué)習(xí)律中的學(xué)習(xí)增益取g=0.9,gs=1,帶入式(3),得uk(t)=uk-1(t)+0.9·ek-1(t)+esk(t)。圖2顯示了仿真結(jié)果。
圖2 速度跟蹤曲線
圖2為仿真得到的速度跟蹤曲線。由于在初次迭代中,設(shè)置的期望軌跡低于列車在區(qū)間的計劃速度曲線,所以在迭代學(xué)習(xí)控制下,列車速度不會超出速度曲線,從而避免出現(xiàn)列車超出限速觸發(fā)ATP實施緊急制動的情況。由于期望軌跡逐漸逼近計劃速度曲線,故仿真中隨著迭代次數(shù)的增加,列車的速度逐漸接近速度曲線,在第12次迭代中,列車的運行曲線與計劃速度曲線重合而且沒有超速。這一結(jié)果表明,變期望軌跡的設(shè)計可以有效地防止因控制初期的不穩(wěn)定性導(dǎo)致列車超速觸發(fā)緊急制動停車。學(xué)習(xí)律中引入期望軌跡變化信息可以使迭代學(xué)習(xí)控制對變化的期望軌跡進行有效跟蹤,期望軌跡保持穩(wěn)定后,迭代學(xué)習(xí)控制能快速地以高精度控制列車按期望軌跡運行。
圖3 位置跟蹤曲線
圖3為位置跟蹤曲線,顯示了列車運行軌跡與計劃運行軌跡的關(guān)系。在迭代初期,由于較低的期望軌跡設(shè)置,列車沒有完成計劃的整個行程。隨著迭代次數(shù)的逐漸增加,計劃速度曲線成為期望軌跡,列車運行也逐漸接近計劃運行軌跡。在第12次迭代中,列車實際運行軌跡與計劃運行軌跡重合,列車完成預(yù)訂的行駛計劃。
圖4 牽引力變化曲線與列車運行加速度曲線
迭代學(xué)習(xí)控制具有很高的平穩(wěn)性,可以避免列車頻繁的加速與減速切換,保證旅行的舒適度。從圖4所示的列車牽引力變化曲線中可以看到,在列車運行過程中,牽引力沒有出現(xiàn)較大或者頻繁的波動,當(dāng)目標(biāo)速度逐漸增加或降低,列車需要進行加速或減速時,列車牽引力能夠快速響應(yīng),對列車進行加速或制動。從圖4中的列車運行過程中加速度變化曲線可以看到,在計劃速度曲線中勻速運行區(qū)段,列車的加速度能夠穩(wěn)定地保持在零附近,即列車的牽引力全部用于克服列車運行基本阻力與線路附加阻力,而不會對列車產(chǎn)生額外的加速度或減速度。在計劃速度曲線中列車速度變化階段,加速度能夠保持恒定,不會出現(xiàn)震蕩。
圖5中的列車平均速度誤差曲線顯示,隨著迭代次數(shù)的增加,列車的速度誤差逐漸減小,經(jīng)過一定的迭代之后,列車的速度誤差可以保持在零附近的水平。平均誤差結(jié)果顯示,該迭代學(xué)習(xí)算法的控制效果隨著迭代次數(shù)的增加而迅速提高,基于該算法的ATO在經(jīng)過幾次學(xué)習(xí)之后能夠保證列車運行的高精度與平穩(wěn)性。
圖5 速度跟蹤誤差與位置跟蹤誤差
圖5中的列車位置誤差顯示,在迭代初期,位置追蹤誤差處于較高水平,這是因為列車速度控制中期望軌跡的設(shè)置致使列車不能在有限的時間范圍內(nèi)跑完一個區(qū)間全程。隨著迭代次數(shù)的增加,位置誤差迅速下降,從第11次迭代開始,由于計劃速度曲線成為期望軌跡,基于迭代學(xué)習(xí)算法的ATO能夠控制列車跑完區(qū)間全程,位置追蹤誤差降低到0附近,并維持在這一較低水平。該結(jié)果顯示,迭代初期較低的期望軌跡設(shè)置造成列車無法在計劃的時間內(nèi)完成整個旅程。因此,合理的期望軌跡設(shè)計會縮短需要的迭代學(xué)習(xí)次數(shù),同時又不會對列車的安全運行造成負(fù)面影響。
迭代學(xué)習(xí)控制是一種無模型控制方法,經(jīng)過足夠次數(shù)的迭代學(xué)習(xí)后可以保證較高的控制精度,因此非常適用于像列車速度控制這類控制目標(biāo)重復(fù)的復(fù)雜非線性系統(tǒng)。在本文中,我們提出了基于迭代學(xué)習(xí)的ATO控制算法來控制列車按照計劃速度曲線行車。為了避免迭代初期的控制誤差導(dǎo)致列車速度超出計劃速度曲線觸發(fā)ATP緊急制動停車,在迭代學(xué)習(xí)控制的初期,設(shè)置低于計劃速度曲線的期望軌跡,隨著迭代次數(shù)的增加,期望軌跡快速接近并保持為計劃速度曲線。在學(xué)習(xí)律中加入期望軌跡的變化信息,以實現(xiàn)迭代學(xué)習(xí)控制算法對變化期望軌跡的跟蹤。由于在一定迭代次數(shù)后期望軌跡將保持計劃速度曲線不變,故學(xué)習(xí)律中期望軌跡變化信息的加入不會改變系統(tǒng)在迭代方向上的收斂性。
仿真結(jié)果表明,在迭代學(xué)習(xí)的初期,列車運行速度不會超出計劃速度曲線,從而可以有效避免緊急制動停車的發(fā)生。隨著迭代次數(shù)的增加,列車的運行速度曲線逐漸接近并最終與計劃速度曲線重合,列車的運行軌跡也與計劃運行軌跡一致。仿真得到的速度追蹤誤差和位置追蹤誤差也顯示:隨著迭代次數(shù)的增加,列車的速度誤差與位置誤差快速接近并保持在零水平。因此,本文提出的迭代學(xué)習(xí)算法在列車自動運行控制中具有良好的控制能力,可以保證列車運行的高精度、高平穩(wěn)性與高安全性。
參考文獻:
[1] 唐濤,黃良驥. 列車自動駕駛系統(tǒng)控制算法綜述[J] . 鐵道學(xué)報,2003,25(2): 98-102.
[2] 黃良驥,唐濤.地鐵列車自動運行系統(tǒng)的分析與設(shè)計[J] .城市軌道交通研究,2003,6(2):51-55.
[3] 陳榮武,劉 莉,諸昌鈐. 基于CBTC的列車自動駕駛算法[J] . 計算機應(yīng)用,2007,27 (11):2649-2651.
[4] 劉賀文,趙海東,賈利民. 列車運行自動控制(ATO)算法的研究[J] . 中國鐵道科學(xué),2000,21(4):38-43.
[5] 劉海東,毛寶華,丁 勇,和天健.列車自動駕駛仿真系統(tǒng)算法及其實施研究[J] .系統(tǒng)仿真學(xué)報,2005,17(3):577-580.
[6] 許建新,侯忠生.學(xué)習(xí)控制的現(xiàn)狀與展望[J] .自動化學(xué)報,2005,31(6): 943-955.
[7] 李仁俊,韓正之. 迭代學(xué)習(xí)控制綜述[J] . 控制與決策,2005,20(9):961-966.
[8] 池榮虎,侯忠生,于 鐳,隋樹林. 高階無模型自適應(yīng)迭代學(xué)習(xí)控制[J] . 控制與決策,2008,23(7):795-798.
[9] Yi Wang, Zhongsheng Hou, Xingyi Li, A Novel Automatic Train Operation Algorithm Based on Iterative Learning Control Theory[C] . IEEE International Conference on Service Operations and Logistics, and Informatics, Beijing, 2008: 1766-1770.
[10] 中華人民共和國鐵道部.列車牽引計算規(guī)程[Z] . 北京:中國鐵道出版社,1999.