郭北苑,孫玉龍
(北京交通大學(xué) a.軌道交通控制與安全國家重點(diǎn)實(shí)驗(yàn)室,b.電子信息工程學(xué)院,北京 100044)
列車ATO控制算法能實(shí)現(xiàn)精確的速度以及位置控制,可以有效降低能耗,提高乘客的舒適度[1],已經(jīng)在高速列車駕駛領(lǐng)域中逐步展開應(yīng)用.其中,實(shí)現(xiàn)列車精確的對(duì)標(biāo)停車是評(píng)價(jià)自動(dòng)駕駛算法控制性能的一個(gè)重要指標(biāo),需要控制算法在保證乘客舒適性的條件下將列車在停車點(diǎn)處的誤差控制在一個(gè)極小的誤差范圍內(nèi).
當(dāng)前列車ATO控制算法主要有PID控制、參數(shù)自適應(yīng)控制、模糊控制以及智能控制算法等[2].PID控制在實(shí)際工程中應(yīng)用較多,具有算法結(jié)構(gòu)簡單等特點(diǎn),但是其抗干擾能力差、控制切換較頻繁,因此,需要對(duì)PID控制算法做出改進(jìn)和優(yōu)化[3].通過對(duì)PID控制算法的輸入部分設(shè)計(jì)微分器,引入非線性控制律補(bǔ)償外界干擾等自抗擾控制技術(shù)對(duì)PID進(jìn)行改進(jìn)[4],可以有效改善傳統(tǒng)列車PID控制算法魯棒性差、穩(wěn)定性不高的缺點(diǎn).模糊控制可以按照一定的模糊規(guī)則進(jìn)行模糊推理,對(duì)PID參數(shù)進(jìn)行自適應(yīng)調(diào)整[5].利用強(qiáng)化學(xué)習(xí)方法設(shè)計(jì)列車控制算法,具有無參學(xué)習(xí)、動(dòng)態(tài)優(yōu)化、自適應(yīng)等突出優(yōu)點(diǎn)[6],但是強(qiáng)化學(xué)習(xí)需要學(xué)習(xí)大量的駕駛數(shù)據(jù),相關(guān)參數(shù)的調(diào)節(jié)也需要一定的經(jīng)驗(yàn)積累.
上述控制算法均需要追蹤離線已生成的目標(biāo)速度曲線,未充分考慮司機(jī)的駕駛經(jīng)驗(yàn)并存在靈活性不足的缺點(diǎn).認(rèn)知建模從認(rèn)知結(jié)構(gòu)的角度對(duì)人類的認(rèn)知過程進(jìn)行建模仿真,構(gòu)建的模型具有類似人的認(rèn)知行為特征.
當(dāng)前有上百種認(rèn)知建模方法,常用的有MHP、EPIC、Sigma以及ACT-R等,MHP可用于分析人機(jī)交互階段中那些階段花費(fèi)的時(shí)間最長或者錯(cuò)誤最多的方法[7],但是MHP僅僅以時(shí)間和錯(cuò)誤率為評(píng)價(jià)指標(biāo),已遠(yuǎn)遠(yuǎn)不能滿足構(gòu)建復(fù)雜系統(tǒng)的設(shè)計(jì)要求.EPIC對(duì)知覺和運(yùn)動(dòng)子系統(tǒng)的描述比較詳細(xì),但是對(duì)于記憶和學(xué)習(xí)的描述作用比較弱[8].Sigma是目前提出的最新的認(rèn)知結(jié)構(gòu)之一[9],應(yīng)用相對(duì)較少.ACT-R認(rèn)知結(jié)構(gòu)由卡內(nèi)基梅隆大學(xué)John Anderson所提出[10],整合了感覺知覺、記憶學(xué)習(xí)、推理判斷以及問題解決等各方面的認(rèn)知心理學(xué)理論,模型的一些理論假設(shè)有客觀的認(rèn)知實(shí)驗(yàn)的驗(yàn)證,能更全面準(zhǔn)確地模擬人類的認(rèn)知過程,是目前認(rèn)知建模領(lǐng)域最為成熟的認(rèn)知結(jié)構(gòu)之一.在汽車駕駛、控制、人機(jī)交互等領(lǐng)域存在廣泛的應(yīng)用[11].
列車自動(dòng)駕駛的整個(gè)駕駛按照列車在區(qū)間的運(yùn)行狀態(tài)可劃分為牽引、巡航、惰行以及制動(dòng)四個(gè)階段,其中巡航和惰行階段不需要對(duì)列車級(jí)位做過多的調(diào)整,牽引階段只需要將列車速度從0提高到巡航速度即可.而制動(dòng)階段對(duì)ATO控制算法的控制績效最為關(guān)鍵,因?yàn)楦咚倭熊囋谥苿?dòng)階段初始速度較高、走行距離較長,除了需要滿足良好的乘客舒適性、合理的運(yùn)行時(shí)間等性能指標(biāo)外,還需要滿足停車精度的要求,故制動(dòng)階段是決定列車ATO控制算法控制效果良好的關(guān)鍵.
本文作者采用ACT-R認(rèn)知結(jié)構(gòu)構(gòu)建了高速列車司機(jī)在停車對(duì)標(biāo)階段的認(rèn)知模型,并基于此模型設(shè)計(jì)相關(guān)的停車控制算法.研究內(nèi)容主要分為:1)對(duì)高速列車司機(jī)的停車對(duì)標(biāo)任務(wù)進(jìn)行分析,通過對(duì)司機(jī)進(jìn)行訪談,從認(rèn)知結(jié)構(gòu)的角度描述列車司機(jī)在駕駛過程中的信息感知、思維決策以及輸出控制,構(gòu)建高速列車司機(jī)停車對(duì)標(biāo)任務(wù)認(rèn)知結(jié)構(gòu)模型;2)基于構(gòu)建的模型,設(shè)計(jì)高速列車停車控制算法;3)將設(shè)計(jì)好的算法與PID控制算法、人類司機(jī)進(jìn)行仿真對(duì)比,比較控制算法的駕駛績效.
停車過程的認(rèn)知主要分為任務(wù)感知、思維決策以及輸出控制三個(gè)部分.本文對(duì)具有多年駕駛經(jīng)驗(yàn)的動(dòng)車組指導(dǎo)司機(jī)進(jìn)行訪談并對(duì)訪談結(jié)果分析,得到表1所示的司機(jī)停車任務(wù)認(rèn)知過程.司機(jī)從開始停車到最終在停車標(biāo)處停車包括調(diào)速和站停兩個(gè)階段,這兩個(gè)階段采取的制動(dòng)策略有所不同,調(diào)速階段是依據(jù)駕駛經(jīng)驗(yàn)參照限速調(diào)整列車速度并保證列車速度不超過限制速度;站停階段是到達(dá)參照點(diǎn)后,回憶參考速度對(duì)應(yīng)的制動(dòng)距離對(duì)列車速度做出最后的調(diào)整,使列車能在停車標(biāo)處剛好停車.調(diào)速和站停階段司機(jī)均需要感知當(dāng)前列車DMI界面信息,包括當(dāng)前速度、限速、走行距離,以及車型、天氣狀況等.司機(jī)感知到駕駛相關(guān)信息之后,注意到當(dāng)前速度和當(dāng)前限速的差異,在調(diào)速階段從大腦中記憶相關(guān)的駕駛經(jīng)驗(yàn)等,判斷當(dāng)前速度是否超過限速,并且判斷當(dāng)前速度、走行距離與經(jīng)驗(yàn)的差異,做出增加、降低或者保持制動(dòng)的決策.在站停階段,司機(jī)需要依據(jù)經(jīng)驗(yàn)判斷列車的制動(dòng)狀態(tài)能否在當(dāng)前速度條件下在停車標(biāo)處停車,并根據(jù)判斷結(jié)果對(duì)當(dāng)前狀態(tài)下的級(jí)位做出調(diào)整.
表1 高速列車司機(jī)停車對(duì)標(biāo)認(rèn)知過程Tab.1 Cognitive process of high-speed train drivers’ brake control
1.2.1 高速列車認(rèn)知結(jié)構(gòu)
分析列車司機(jī)的駕駛特征,可以發(fā)現(xiàn)司機(jī)感知過程只需要感知到關(guān)鍵信息,不涉及到復(fù)雜的視覺搜尋過程,同時(shí)由于司機(jī)的操作對(duì)象是司控器,因此本文在ACT-R認(rèn)知結(jié)構(gòu)的基礎(chǔ)上,針對(duì)高速列車對(duì)標(biāo)停車任務(wù)提出高速列車停車認(rèn)知結(jié)構(gòu),基本框架如圖1(a)所示,包括感知模塊、目標(biāo)模塊、陳述性知識(shí)模塊、程序性知識(shí)模塊以及輸出模塊,感知模塊包括感知緩沖區(qū),可以直接從外界獲取駕駛信息并保存到感知緩沖區(qū),模擬人類獲取外界視覺信息并保存到大腦的過程.輸出模塊用于執(zhí)行級(jí)位轉(zhuǎn)換并向外界輸出級(jí)位,模擬人類從大腦中接收運(yùn)動(dòng)指令并控制手部運(yùn)動(dòng)的過程.陳述性知識(shí)模塊由組塊(chunk)組成,用于模擬海馬體存儲(chǔ)人類的長期記憶,當(dāng)模型通過程序性知識(shí)模塊向陳述性知識(shí)模塊中提出檢索請(qǐng)求時(shí),檢索緩沖區(qū)會(huì)提取到與當(dāng)前情景相關(guān)的經(jīng)驗(yàn)知識(shí).程序性知識(shí)模塊用于實(shí)現(xiàn)人類技能方面的一些知識(shí),模擬人腦的基底神經(jīng)節(jié);由產(chǎn)生式規(guī)則構(gòu)成,每個(gè)產(chǎn)生式由條件和行為兩種規(guī)則組成.只有滿足產(chǎn)生式的條件規(guī)則,才能觸發(fā)行為規(guī)則.由于高速列車停車認(rèn)知結(jié)構(gòu)假設(shè)人是目標(biāo)驅(qū)動(dòng)性,目標(biāo)模塊中存儲(chǔ)有人類完成特定任務(wù)的多個(gè)目標(biāo),每次目標(biāo)緩區(qū)中保存一個(gè)目標(biāo),用于模擬額葉前部背外側(cè),通過不同子目標(biāo)的實(shí)現(xiàn)完成最終的任務(wù).
圖1 高速列車停車認(rèn)知結(jié)構(gòu)Fig.1 Basic cognitive structure framework of high-speed train brake
高速列車停車認(rèn)知結(jié)構(gòu)的工作過程是通過基于目標(biāo)緩沖區(qū)中的目標(biāo),匹配到程序性知識(shí)模塊中的產(chǎn)生式,產(chǎn)生式通過調(diào)用高速列車認(rèn)知結(jié)構(gòu)的目標(biāo)模塊、感知模塊、陳述性知識(shí)模塊或手控模塊等完成一次認(rèn)知過程,執(zhí)行過程中修改產(chǎn)生式行為規(guī)則中相應(yīng)模塊的緩沖區(qū)的組塊內(nèi)容,并產(chǎn)生新的目標(biāo),當(dāng)產(chǎn)生式完成以后,將得到的新目標(biāo)更新到目標(biāo)模塊中,完成一次循環(huán).完整的認(rèn)知過程就是循環(huán)執(zhí)行上述的過程直到所有目標(biāo)完成,沒有新的目標(biāo)進(jìn)入目標(biāo)緩沖區(qū).
1.2.2 高速列車停車任務(wù)認(rèn)知建模
1)感知過程建模.
感知過程反映了列車司機(jī)的信息感知過程.根據(jù)前述認(rèn)知任務(wù)分析,司機(jī)在駕駛過程中最關(guān)注的信息是天氣狀況、速度、限速以及車型.通常來說,控制算法都會(huì)面向一種具體的控制對(duì)象,因此本文只考慮一種車型.同時(shí),為簡化模型,本文暫不考慮天氣影響.因此感知過程只需要感知當(dāng)前速度、限制速度以及當(dāng)前走行距離,構(gòu)建的感知過程如圖1(b)所示.
如果目標(biāo)是“獲取視覺信息”(圖1(b)-①),則程序性知識(shí)模塊控制感知模塊執(zhí)行感知搜索過程(圖1(b)-②),并將感知到的視覺信息保存到感知緩沖區(qū)中,添加完之后通過程序性知識(shí)模塊將目標(biāo)模塊中的目標(biāo)設(shè)置為下一目標(biāo)(圖1(b)-③).
2)記憶加工過程建模.
根據(jù)感知過程的信息向陳述性知識(shí)模塊中提取駕駛經(jīng)驗(yàn)的信息加工過程稱之為記憶加工過程,陳述性知識(shí)模塊中存儲(chǔ)了高速列車司機(jī)以往的成功駕駛經(jīng)驗(yàn).調(diào)速和站停階段的記憶加工過程有所區(qū)別,感知過程感知到相關(guān)的駕駛信息之后,由思維決策過程根據(jù)調(diào)速與站停階段的劃分條件判斷列車處于哪個(gè)階段,對(duì)于調(diào)速階段,記憶加工過程需要從陳述性知識(shí)模塊中檢索某一速度、某一限速以及某一目標(biāo)位置下的制動(dòng)級(jí)位經(jīng)驗(yàn),而對(duì)于站停階段,則需要從陳述性知識(shí)模塊的檢索緩沖區(qū)中檢索某個(gè)參照速度下的制動(dòng)距離.構(gòu)建的記憶加工過程如圖1(c)所示.
當(dāng)目標(biāo)為“回憶”(圖1(c)-①),且感知緩沖區(qū)中保存有視覺信息(圖1(c)-②),則根據(jù)視覺信息向陳述性知識(shí)模塊中檢索駕駛經(jīng)驗(yàn)或駕駛階段的劃分知識(shí)(圖1(c)-③),并將獲取的知識(shí)保存到檢索緩沖區(qū)中(圖1(c)-④),同時(shí)將目標(biāo)模塊的目標(biāo)設(shè)置為下一目標(biāo)(圖1(c)-⑤).
3)思維決策過程建模.
思維決策過程反映了列車司機(jī)的判斷、注意和決策的信息加工過程.
司機(jī)感知到視覺信息后,由于調(diào)速階段和站停階段的判斷策略有所不同,故首先需要判斷列車當(dāng)前處于哪個(gè)階段,之后比較視覺信息和駕駛經(jīng)驗(yàn),再結(jié)合當(dāng)前階段采取不同的檔位調(diào)整策略,從而對(duì)駕駛經(jīng)驗(yàn)中的級(jí)位值做出調(diào)整,并調(diào)用手控模塊操縱司控器.構(gòu)建的思維決策過程如圖1(d)所示.
當(dāng)目標(biāo)為“判斷”(圖1(d)-①),則比較感知緩沖區(qū)中存儲(chǔ)的視覺信息(圖1(d)-②)和檢索緩沖區(qū)中存儲(chǔ)的經(jīng)驗(yàn)信息組塊(圖1(d)-③),將判斷結(jié)果信息添加到目標(biāo)緩沖區(qū)的相應(yīng)組塊中(圖1(d)-④),并將目標(biāo)模塊中的目標(biāo)設(shè)置為下一目標(biāo)(圖1(d)-⑤).
4)輸出過程建模.
輸出過程反映了司機(jī)完成級(jí)位移動(dòng)的過程.構(gòu)建的輸出過程如圖1(e)所示.
當(dāng)目標(biāo)為“執(zhí)行動(dòng)作”(圖1(e)-①),且目標(biāo)緩沖區(qū)中存放有級(jí)位信息(圖1(e)-②),則通過程序性知識(shí)模塊將級(jí)位信息輸入到輸出模塊(圖1(e)-③),輸出模塊完成整個(gè)級(jí)位設(shè)置的執(zhí)行過程.
基于上述高速列車停車對(duì)標(biāo)任務(wù)認(rèn)知模型,本節(jié)通過構(gòu)建組塊、產(chǎn)生式等來實(shí)現(xiàn)高速列車停車控制算法.
視覺感知過程:視覺感知的目的是獲得當(dāng)前的關(guān)鍵駕駛信息,沒有復(fù)雜的視覺轉(zhuǎn)移過程,因此,本文在構(gòu)建產(chǎn)生式的過程中將駕駛信息直接注入到映像模塊中,在映像緩沖區(qū)中保存一個(gè)駕駛信息組塊,該駕駛信息組塊包含三個(gè)槽:①當(dāng)前速度;②限制速度;③走行距離.每個(gè)槽的取值即為司機(jī)需要的相關(guān)視覺信息.
記憶加工過程:在調(diào)速階段算法獲得當(dāng)前視覺信息之后,向陳述性知識(shí)模塊的檢索緩沖區(qū)中提取相關(guān)駕駛經(jīng)驗(yàn)組塊,駕駛經(jīng)驗(yàn)組塊用于保存駕駛相關(guān)經(jīng)驗(yàn),本文的駕駛經(jīng)驗(yàn)組塊包含4個(gè)槽:①制動(dòng)級(jí)位;②速度;③限制速度;④走行距離,取值為司機(jī)以往的成功駕駛過程中對(duì)應(yīng)的值.從檢索緩沖區(qū)中提取組塊的過程由每個(gè)組塊的激活值所決定,算法會(huì)選擇激活值最大的組塊.激活值為
(1)
式中:Ai表示每個(gè)組塊i的激活值,與基級(jí)激活值Bi、關(guān)注權(quán)重Wj和相關(guān)強(qiáng)度Sji有關(guān),j表示組塊的第j個(gè)槽值,每個(gè)組塊共包含n個(gè)槽值.激活值與某個(gè)組塊的出現(xiàn)次數(shù)和存在時(shí)間成正比,出現(xiàn)次數(shù)越多,使用時(shí)間越長,相關(guān)強(qiáng)度越大.這與人類的記憶規(guī)律相符合,也就是一段知識(shí)使用的次數(shù)越多,與當(dāng)前的時(shí)間越接近,則越容易被檢索到.
而對(duì)于站停階段的記憶加工,由于列車與停車標(biāo)的距離較短,本文只選取幾組參考速度以及參考速度對(duì)應(yīng)的制動(dòng)距離,不通過陳述性知識(shí)模塊保存相關(guān)知識(shí).
思維決策過程:在調(diào)速階段,提取到相關(guān)的駕駛經(jīng)驗(yàn)組塊后,與映像緩沖區(qū)中的視覺信息進(jìn)行比較,根據(jù)比較結(jié)果得到級(jí)位的決策結(jié)果,判斷策略如表2所示.當(dāng)視覺信息中的速度比經(jīng)驗(yàn)組塊中的速度小,視覺信息中的走行距離比經(jīng)驗(yàn)組塊中的走行距離大,說明速度偏小、走行距離偏大,根據(jù)表2的策略,此時(shí)應(yīng)該采取釋放制動(dòng)的決策.
表2 程序性知識(shí)判斷策略Tab.2 Procedural knowledge judgment strategies
在站停階段,算法根據(jù)多個(gè)參考速度對(duì)應(yīng)的制動(dòng)距離對(duì)檔位進(jìn)行調(diào)整.如果當(dāng)前列車與停車標(biāo)的距離大于參考速度對(duì)應(yīng)的制動(dòng)距離,則釋放制動(dòng);如果與停車標(biāo)的距離等于參考速度對(duì)應(yīng)的制動(dòng)距離,則采用一級(jí)制動(dòng);如果與停車標(biāo)的距離小于參考速度對(duì)應(yīng)的制動(dòng)距離,則在上次制動(dòng)的基礎(chǔ)上增加一級(jí)制動(dòng);如果當(dāng)前位置已經(jīng)超過停車標(biāo),則直接采用最大制動(dòng)級(jí)位.
根據(jù)上述的結(jié)果對(duì)存放在目標(biāo)緩沖區(qū)中的判斷結(jié)果組塊的相應(yīng)槽值進(jìn)行修改.判斷結(jié)果組塊包含五個(gè)槽:①列車當(dāng)前所處駕駛階段,該槽共有5種取值可能,其中調(diào)速階段1種,站停階段4種,站停階段的4種取值分別為在上次制動(dòng)的基礎(chǔ)上增加一級(jí)制動(dòng)、釋放制動(dòng)、采用一級(jí)制動(dòng)和采用最大制動(dòng)級(jí)位;②限速狀態(tài),根據(jù)列車的當(dāng)前速度與限速的關(guān)系相應(yīng)的取值分別為超過、低于或遠(yuǎn)低于;③速度狀態(tài),根據(jù)列車的當(dāng)前速度與檢索緩沖區(qū)中的速度經(jīng)驗(yàn)的關(guān)系相應(yīng)的取值分別為偏大、偏小或等于;④走行距離狀態(tài),根據(jù)列車的當(dāng)前走行距離與檢索緩沖區(qū)中的走行距離經(jīng)驗(yàn)的關(guān)系相應(yīng)的取值為偏大、偏小或等于;⑤經(jīng)驗(yàn)制動(dòng)級(jí)位狀態(tài),根據(jù)檢索緩沖區(qū)中的經(jīng)驗(yàn)制動(dòng)級(jí)位的狀態(tài)相應(yīng)的取值為制動(dòng)狀態(tài)或釋放狀態(tài).
輸出過程:通過思維決策過程得到進(jìn)一步調(diào)整后的制動(dòng)級(jí)位,將制動(dòng)級(jí)位通過程序性知識(shí)模塊輸入到手控模塊,手控模塊進(jìn)而將輸出的級(jí)位值傳遞給列車控制網(wǎng)絡(luò)系統(tǒng).
本文設(shè)計(jì)的高速列車停車控制算法共有17個(gè)產(chǎn)生式:①視覺感知過程需要感知到當(dāng)前駕駛所需的視覺信息并向檢索緩沖區(qū)中發(fā)出檢索請(qǐng)求,有1個(gè)產(chǎn)生式;②記憶加工過程需要獲得調(diào)速階段中與當(dāng)前駕駛相關(guān)的陳述性知識(shí)模塊中的駕駛經(jīng)驗(yàn)組塊,有1個(gè)產(chǎn)生式;③思維決策過程和輸出過程,算法需要依據(jù)映像緩沖區(qū)的視覺信息和檢索緩沖區(qū)的駕駛經(jīng)驗(yàn)組塊對(duì)列車的駕駛狀況進(jìn)行判斷,并修改目標(biāo)緩沖區(qū)的判斷結(jié)果組塊,根據(jù)不同的判斷結(jié)果調(diào)整級(jí)位,這部分在調(diào)速階段有11個(gè)產(chǎn)生式,在站停階段有4個(gè)產(chǎn)生式.
表3為本文停車控制算法的認(rèn)知參數(shù)和一些任務(wù)相關(guān)參數(shù).認(rèn)知參數(shù)與ACT-R認(rèn)知結(jié)構(gòu)的子符號(hào)系統(tǒng)相關(guān),模擬了人類大腦的神經(jīng)計(jì)算過程,這些參數(shù)涉及到感知、記憶等方面,已經(jīng)經(jīng)過了先前研究者的認(rèn)知實(shí)驗(yàn)的驗(yàn)證,因此本文的大多數(shù)參數(shù)直接采用默認(rèn)參數(shù),只對(duì)部分參數(shù)做了調(diào)整,由于本文模擬的是高速列車司機(jī),司機(jī)由于經(jīng)過了很多訓(xùn)練,對(duì)于某一條線路非常熟悉,相應(yīng)的司機(jī)面對(duì)新的駕駛情景的時(shí)候必然會(huì)從大腦中檢索的對(duì)應(yīng)的知識(shí)經(jīng)驗(yàn),激活閾值反映了人類記憶中知識(shí)的可用度,故將激活閾值設(shè)置為極小值.使得算法一定能夠得到最佳的“駕駛經(jīng)驗(yàn)”知識(shí),組塊中的瞬時(shí)噪聲也設(shè)置為0,使算法在回憶“駕駛經(jīng)驗(yàn)”知識(shí)的時(shí)候沒有干擾;關(guān)聯(lián)強(qiáng)度反映了緩沖區(qū)中的當(dāng)前內(nèi)容對(duì)檢索,就是回憶過程的影響設(shè)置值為0.9;衰減參數(shù)模擬了人類的記憶遺忘,反映人類對(duì)于某個(gè)知識(shí)的記憶水平隨著時(shí)間會(huì)不斷下降,該值采用默認(rèn)值0.5.
表3 高速列車停車控制算法的部分參數(shù)值Tab.3 Parameters of brake control algorithm for high-speed train
同時(shí)本文也涉及到一些任務(wù)相關(guān)參數(shù),任務(wù)相關(guān)參數(shù)與具體的停車控制任務(wù)相關(guān),如調(diào)速與站停階段的劃分點(diǎn),不同的列車司機(jī)可能不同,如速度、地理標(biāo)志等,結(jié)合對(duì)列車司機(jī)的訪談以速度作為階段劃分的參考點(diǎn),當(dāng)列車速度低于劃分速度時(shí)開始執(zhí)行站停階段的控制策略,將劃分速度條件設(shè)置為20 km/h.
算法首先判斷列車當(dāng)前速度,如果當(dāng)前速度大于0,說明列車還未停車,則將目標(biāo)緩沖區(qū)的目標(biāo)設(shè)置為“開始”,同時(shí)將當(dāng)前速度、當(dāng)前限速、當(dāng)前走行距離添加到映像緩沖區(qū)中,然后,開始產(chǎn)生式的匹配過程,程序性知識(shí)模塊會(huì)檢查所有處于激活狀態(tài)的模塊,并與該模塊中儲(chǔ)存的產(chǎn)生式的條件規(guī)則進(jìn)行匹配,此時(shí)會(huì)匹配到目標(biāo)模塊和映像模塊被激活的相應(yīng)產(chǎn)生式,該產(chǎn)生式觸發(fā)并執(zhí)行其行為規(guī)則,行為規(guī)則會(huì)修改該規(guī)則相關(guān)模塊緩沖區(qū)中的組塊內(nèi)容,此時(shí)相關(guān)模塊被激活,程序性知識(shí)模塊則會(huì)根據(jù)這些模塊的激活狀態(tài)匹配符合條件規(guī)則的下一個(gè)產(chǎn)生式,觸發(fā)該產(chǎn)生式并執(zhí)行其行為規(guī)則,依此類推,當(dāng)所有模塊的狀態(tài)均不能匹配產(chǎn)生式的條件規(guī)則時(shí),此時(shí)手控模塊獲得了當(dāng)前駕駛情景下的級(jí)位決策并將級(jí)位輸出到列車控制網(wǎng)絡(luò),算法完成一次循環(huán).為了簡化算法,當(dāng)前速度、當(dāng)前限速、當(dāng)前走行距離等視覺信息的獲取以及為了得到駕駛階段、限速狀態(tài)等而進(jìn)行的速度比較、距離比較、級(jí)位比較等數(shù)值計(jì)算,未采用產(chǎn)生式規(guī)則實(shí)現(xiàn),而是采用將相關(guān)信息直接注入到映像緩沖區(qū)或者采用數(shù)值計(jì)算程序計(jì)算并將結(jié)果添加到目標(biāo)緩沖區(qū)中的方法實(shí)現(xiàn).如下所示為高速列車停車對(duì)標(biāo)控制算法:
算法:高速列車停車對(duì)標(biāo)控制算法
while列車運(yùn)行速度> 0do:
目標(biāo)緩沖區(qū)←“開始”
映像緩沖區(qū)←當(dāng)前速度、當(dāng)前限速、當(dāng)前走行距離
while有模塊處于激活狀態(tài) do:
if映像緩沖區(qū)激活 then
計(jì)算得到當(dāng)前駕駛階段狀態(tài)、限速狀態(tài)
判斷結(jié)果組塊對(duì)應(yīng)槽←當(dāng)前駕駛階段狀態(tài)、限速狀態(tài)
end if
if檢索緩沖區(qū)激活 then
計(jì)算得到速度狀態(tài)、距離狀態(tài)、經(jīng)驗(yàn)制動(dòng)級(jí)位狀態(tài)
判斷結(jié)果組塊對(duì)應(yīng)槽←速度狀態(tài),距離狀態(tài),經(jīng)驗(yàn)制動(dòng)級(jí)位狀態(tài)
目標(biāo)緩沖區(qū)←判斷結(jié)果組塊
end if
匹配產(chǎn)生式的條件規(guī)則,獲得匹配產(chǎn)生式
執(zhí)行該產(chǎn)生式的行為規(guī)則,修改相關(guān)模塊緩沖區(qū)中的組塊內(nèi)容
end while
從手控模塊中獲得級(jí)位
end while
在實(shí)際駕駛過程中,人類司機(jī)的綜合駕駛績效普遍好于ATO自動(dòng)控制算法,同時(shí)考慮到現(xiàn)有的自動(dòng)駕駛系統(tǒng)大多采用PID控制算法[12].為了驗(yàn)證本文停車控制算法的有效性,將本文實(shí)現(xiàn)的停車控制算法與PID控制算法、人類司機(jī)進(jìn)行仿真對(duì)比分析.
仿真分析的初始條件如下,初始速度為270 km/h,初始制動(dòng)級(jí)位為3級(jí)制動(dòng),停車運(yùn)行時(shí)間為309 s,終點(diǎn)距離為9 155.7 m.該數(shù)據(jù)來源于京滬高速CR400AF型高速列車上海虹橋至北京南站的一次人類進(jìn)站停車作業(yè)的駕駛記錄.由于駕駛記錄的原始數(shù)據(jù)沒有停車標(biāo)的千米標(biāo),無法得到人類司機(jī)的實(shí)際停車精度,但考慮到人類司機(jī)的綜合駕駛績效普遍好于ATO自動(dòng)控制算法,故本文假設(shè)人類司機(jī)的停車精度為0.CR400AF型高速列車的列車動(dòng)力學(xué)模型通過實(shí)際駕駛數(shù)據(jù)擬合得到,限速曲線采用駕駛記錄中的實(shí)際數(shù)據(jù).根據(jù)線路情況和駕駛目標(biāo)設(shè)置了一條理想優(yōu)化曲線用于PID算法的控制,通過多次試驗(yàn)得到PID控制算法的控制參數(shù)值KP=25.12,Ki=4.23,Kd=0.1.
圖2所示為人類司機(jī)、本文停車控制算法和PID控制算法控制列車的運(yùn)行速度對(duì)比,可知人類司機(jī)、本文停車控制算法與PID控制算法趨勢(shì)相近,三者均實(shí)現(xiàn)了既定的駕駛?cè)蝿?wù)目標(biāo).但是也可以看到PID控制效果相對(duì)更加光滑,本文停車控制算法其次,人類司機(jī)最不光滑,原因是PID控制算法追蹤的是一條理想曲線,具有最佳的制動(dòng)減速度,故運(yùn)行速度曲線更加的平滑.而本文算法人類司機(jī)都是依據(jù)“駕駛經(jīng)驗(yàn)”和限速來進(jìn)行判斷,控制過程中曲線較不平滑.
圖2 運(yùn)行速度對(duì)比Fig.2 Comparison of running speed
圖3所示為3種控制方式的輸出加速度對(duì)比,圖4為本文停車控制算法與人類司機(jī)的輸出制動(dòng)級(jí)位對(duì)比.可以看到,本文算法與人類司機(jī)在級(jí)位調(diào)節(jié)次數(shù)以及整體趨勢(shì)上更加接近,在調(diào)速階段調(diào)節(jié)次數(shù)相對(duì)較少,級(jí)位保持時(shí)間更長,這樣的操作會(huì)使得高速列車運(yùn)行的更加平穩(wěn),而在站停階段調(diào)節(jié)次數(shù)有所增加,這種控制會(huì)使得列車有更高的停車精度.而PID為了實(shí)現(xiàn)精確的追蹤效果,全程級(jí)位調(diào)節(jié)非常頻繁.通過對(duì)司機(jī)訪談得知,優(yōu)秀列車司機(jī)的駕駛特點(diǎn)是:惰行時(shí)間長、牽引制動(dòng)的切換次數(shù)少,這種操縱特點(diǎn)有利于舒適節(jié)能,故控車過程應(yīng)盡量惰行且減少控制次數(shù),本文算法很好地反映了這種趨勢(shì).
圖3 輸出加速度對(duì)比Fig.3 Comparison of output accelerations
圖4 本文算法和人類司機(jī)輸出制動(dòng)級(jí)位對(duì)比Fig.4 Comparison of the proposed algorithm and the output braking level of a human driver
表4所示為人類司機(jī)、PID控制算法和本文算法在各指標(biāo)下的對(duì)比結(jié)果.沖擊率的計(jì)算公式為
(2)
式中:ai為控制器第i次的輸出加速度;n為總控制次數(shù).可以看到,人類司機(jī)、本文算法相比PID控制算法調(diào)整次數(shù)明顯較少,同時(shí)沖擊率也更低,顯然舒適度更高.停車精度人類高速列車司機(jī)最好,其次為本文算法,PID控制算法最低.人類司機(jī)、本文算法和PID控制算法在平均加減速度、運(yùn)行時(shí)間上沒有太大差異,本文算法比規(guī)定運(yùn)營時(shí)間早1.8 s,PID控制算法要晚0.1 s,這種時(shí)間誤差是實(shí)際運(yùn)營中能夠接受的.綜合上述指標(biāo)差異,人類司機(jī)在最少的控制次數(shù)下實(shí)現(xiàn)了舒適度最高、停車精度最高的駕駛績效,本文算法取得了接近人類司機(jī)的駕駛績效,而PID控制算法的控制績效相對(duì)較差.
表4 人類司機(jī)、本文算法以及PID控制 算法性能指標(biāo)對(duì)比Tab.4 Comparison of performance indicators for human driver, the proposed algorithm, and the PID control algorithm
圖5 不同初始條件下本文算法的運(yùn)行速度曲線對(duì)比Fig.5 Comparison of running speed curves of the proposed algorithm under different initial conditions
為進(jìn)一步驗(yàn)證本文算法在不同初始條件下的控制效果,設(shè)置了幾組不同的初始速度、目標(biāo)距離條件.如圖 5所示為在不同的初始速度與走行距離條件下本文算法控制的列車運(yùn)行速度曲線,可以看到在不同的初始條件下本文算法均能實(shí)現(xiàn)良好的停車控制.由表5也可以看到不同初始條件下調(diào)整次數(shù)、平均加速度以及沖擊率也相對(duì)穩(wěn)定,保持在合理的范圍內(nèi).停車精度均滿足規(guī)定的停車誤差范圍,且大多在30 cm范圍內(nèi),少數(shù)部分停車精度超過30 cm,但是沒有超過50 cm的標(biāo)準(zhǔn),停車精度出現(xiàn)較大變化的原因可能與特定條件下對(duì)應(yīng)的陳述性知識(shí)模塊中的“駕駛經(jīng)驗(yàn)”知識(shí)不完善有關(guān),由于本文算法控制列車的過程中,對(duì)級(jí)位的決策首先依賴陳述性知識(shí)模塊中的相關(guān)組塊,其次根據(jù)邏輯決策來對(duì)級(jí)位做出進(jìn)一步修正,而不同的初始條件可能由于陳述性知識(shí)模塊中無法匹配到更好的“駕駛經(jīng)驗(yàn)”組塊,會(huì)導(dǎo)致出現(xiàn)一定偏差.
表5 不同初始條件下本文算法的性能指標(biāo)Tab.5 Performance indicators of the proposed algorithm under different initial conditions
1)本文算法模擬了人類司機(jī)在停車對(duì)標(biāo)這一階段的認(rèn)知信息處理過程,表現(xiàn)出了人類司機(jī)的駕駛特征.
2)本文算法在調(diào)整次數(shù)、舒適度以及停車精度上均優(yōu)于PID控制算法,綜合駕駛績效好于PID控制績效,在不同的初始條件下也能實(shí)現(xiàn)良好的控制效果,具有較好的適用性.
需要更進(jìn)一步的研究司機(jī)駕駛作業(yè)的工作機(jī)制,采用腦成像等技術(shù)手段從機(jī)理層面優(yōu)化高速列車對(duì)標(biāo)停車駕駛認(rèn)知結(jié)構(gòu).在本文的算法實(shí)現(xiàn)中,陳述性知識(shí)模塊中的駕駛經(jīng)驗(yàn)是一直保持不變,只能適用于較少的駕駛場(chǎng)景,后續(xù)需要考慮引入自學(xué)習(xí)方法,建立駕駛經(jīng)驗(yàn)的動(dòng)態(tài)更新及優(yōu)化機(jī)制.針對(duì)本研究存在的不足,如輸出的級(jí)位存在少數(shù)突變,導(dǎo)致加速度存在一些尖峰,未來研究可繼續(xù)對(duì)決策過程進(jìn)行優(yōu)化,使輸出級(jí)位及加速度的變化更加平滑.