羅錦才,劉暾東
(廈門大學(xué)航空航天學(xué)院,福建 廈門 361102)
近幾十年,汽車行業(yè)得到了大規(guī)模的發(fā)展,私家車保有量也大幅度提升,道路交通壓力逐漸增大,交通事故頻發(fā),引起了人們對于私家車安全性能的高度重視。根據(jù)交通事故發(fā)生前后的時間不同,將車輛的制動控制分為多種情況,其中車輛轉(zhuǎn)彎是一個十分常見的問題。根據(jù)相關(guān)數(shù)據(jù)統(tǒng)計,發(fā)生的交通事故中有79%是由于車輛轉(zhuǎn)彎制動問題所導(dǎo)致的,此類交通事故往往都會造成非常嚴(yán)重的后果,重則會影響駕駛員的生命安全[1-2]。
根據(jù)上述方法存在的問題,本文提出基于增強學(xué)習(xí)的車輛轉(zhuǎn)彎制動橫向軌跡控制方法,并對其進行仿真測試,驗證此控制方法的可行性與科學(xué)性。
在此次研究中,將通過構(gòu)建車輛動力學(xué)模型的形式為車輛轉(zhuǎn)彎制動橫向軌跡控制方法提供數(shù)據(jù)基礎(chǔ)。根據(jù)車輛動力學(xué)原理與特性,采用ADAMS軟件[5-6]作為模型構(gòu)建平臺。在此軟件中,根據(jù)動力學(xué)原理將車輛劃分為多個剛體,并對剛體的質(zhì)量與各個方向的動力慣性進行定義與賦值。在車輛模型的構(gòu)建與計算過程中,采用分析法與試驗法相結(jié)合的形式得到車輛運動微分方程組,具體計算過程如下。
為了更加客觀的體現(xiàn)輪胎的力學(xué)特性與參數(shù),構(gòu)建對應(yīng)的SAE坐標(biāo)系[7],此坐標(biāo)系為右手坐標(biāo)系,將垂直于車輪旋轉(zhuǎn)軸線的輪胎中分面設(shè)定為車輪平面。設(shè)定坐標(biāo)系的原點O為車輪與地平線的交線與車輪旋轉(zhuǎn)軸線的交點。車輪平面與地平面的交線為X軸,設(shè)定方向向前為正向。Z軸與地平線垂直,正方向向上。Y軸為地平面,車輪前進方向向左為正。在車輛行進的過程中,車輪分別受到X軸、Y軸與Z軸的三個方向的力與繞這3個軸力矩的作用,根據(jù)原有研究結(jié)果,將此部分力稱為輪胎的六分力,分別為:縱向力Fx、側(cè)向力Fy、法向力Fz、側(cè)傾力矩Rx、轉(zhuǎn)動力矩Ry以及回正力矩Rz。根據(jù)上述設(shè)定,使用三角函數(shù)得到輪胎六分力的聯(lián)合作用情況,通過擬合計算的形式,獲取水平方向漂移數(shù)據(jù)及其側(cè)向力,具體計算過程如下:
Fy0(β)=Sysin(Cyarctan(Byβ-Uy(Syβ-arctan(Syβ))))
(1)
式中,F(xiàn)y0(β)表示純滑移條件下計算得到的橫向力的值;β表示車輪偏轉(zhuǎn)角;S表示上述兩公式的峰值因子,即動力曲線的最大值;B表示剛度因子,且B=BCS/(CS);x表示輪胎的側(cè)向力、縱向力與回正力矩;y表示車輛輪胎的偏轉(zhuǎn)角;C表示曲線形狀因子,決定著曲線的形態(tài)特征。在上述參數(shù)中,除形狀因子C外,全部參數(shù)與輪胎的垂直負(fù)荷具有函數(shù)關(guān)系。將車輛數(shù)據(jù)帶入此公式中,進行擬合可得到相應(yīng)的車輪輪胎模型在純滑移條件下的變動系數(shù)。根據(jù)變動系數(shù),構(gòu)建車輛動力模型,具體公式如下
φ=(1-P)(X+Wl)Fy0(β)+(P/B)arctan(B(X+Wj))
(2)
在上式中,P表示曲線曲率因子,即動力學(xué)曲線最大值附近的形狀;Wl表示車輛垂直方向漂移;Wj表示車輛水平方向漂移。在此次研究中,將此部分?jǐn)?shù)據(jù)作為控制方法的數(shù)據(jù)來源。
車輛轉(zhuǎn)彎制動是一種更為復(fù)雜的工況,它不同于直線制動工況,轉(zhuǎn)彎制動時的載荷轉(zhuǎn)移和大側(cè)向滑動對制動穩(wěn)定性動力學(xué)控制提出了更高的要求,而車輛蔽障過程伴隨制動,由于實際車輛轉(zhuǎn)向制動作業(yè)工況下不穩(wěn)態(tài)的橫擺角速度和最佳滑移率不確定性導(dǎo)致車輛整車側(cè)傾,車輛極易失去控制,因此對車輛轉(zhuǎn)彎制動橫向軌跡進行控制。根據(jù)上述部分中設(shè)定的車輛動力模型,將其簡化為線性的二自由度系統(tǒng)[8-9],將車輛的滑移率作為優(yōu)化的參數(shù),其中滑移率與附著系數(shù)作為目標(biāo)函數(shù)的組成部分,考慮到制動過程中的減速情況與車輛的穩(wěn)定性,將此次控制參數(shù)的優(yōu)化目標(biāo)函數(shù)設(shè)定如下
mine=(χ-χdes)2+(v-vmax)2φ
(3)
在上式中,x表示轉(zhuǎn)彎制動過程中的車輛輪胎橫擺動角;χdes表示前輪轉(zhuǎn)角和車速穩(wěn)定的情況下穩(wěn)態(tài)的橫擺角速度;v表示車輛的減速度;vmax為地面所能提供的最大減速度。當(dāng)上述公式取值為最小值時,所得到的滑移率為控制過程中的最佳目標(biāo)滑移率。通過對式(3)的推導(dǎo)可知
(4)
式中,μ表示輪胎的附著系數(shù)[10]。
金融開放度與經(jīng)濟增長之間是否存在非線性關(guān)系是本文的研究假設(shè)1同時也是后文的研究基礎(chǔ)。對此我們依據(jù)模型(1),對各國金融開放程度與其經(jīng)濟增長之間的相關(guān)關(guān)系進行檢驗。估計結(jié)果可見表4。
對上述公式進行整合可得到滑移率與附著系數(shù)之間的轉(zhuǎn)換關(guān)系
(5)
式中,L表示車輛滑移長度,hr、hf表示車輛輪胎的轉(zhuǎn)動系數(shù),kr、kf表示車輛的滑移計算常數(shù)。通過此公式可得到最優(yōu)橫擺角速度χdes,具體公式如下所示
(6)
穩(wěn)定轉(zhuǎn)向下的橫擺角速度會低于其物理極限值,因此,χdes可簡化為
(7)
將此公式代入到式(3)中,即可得到需要優(yōu)化的車輛控制參數(shù)。
由上文可知,車輛橫擺角速度目標(biāo)函數(shù)的取值為最優(yōu)解時為車輛的理想狀態(tài)。鑒于車輛制動過程中的穩(wěn)定性,使用增強學(xué)習(xí)算法對其運動軌跡進行控制。此次設(shè)計的控制方法需要構(gòu)建相應(yīng)的控制器作為方法的實施平臺。將控制策略通過參數(shù)的形式體現(xiàn)如下
πα(s,a)=P[a|s,α]
(8)
式中,α表示策略權(quán)重,π表示控制策略內(nèi)容。πα(s,a)表示使用函數(shù)α后進行函數(shù)擬合所得策略函數(shù)[11-12]。使用增強學(xué)習(xí)技術(shù)對上述問題進行求解,可獲取車輛動作為α?xí)r的概率。在此計算環(huán)節(jié)中需要設(shè)定對應(yīng)的數(shù)據(jù)量對多種控制策略進行衡量,此數(shù)據(jù)量為控制目標(biāo)策略函數(shù)。無論何種目標(biāo)策略函數(shù)K(α)對于何種πα(s,a),都符合下述約束要求。
?αK(α)=Eπ[?αlgπα(s,a)Qπ(s,a)]
(9)
式中,?αK(α)表示目標(biāo)控制策略函數(shù)K(α)的梯度。同時,梯度?αlgπα(s,a)可以通過高斯策略獲取。Qπ(s,a)表示計算過程中的動作值函數(shù),使用策略梯度算法可得到計算結(jié)果。由于此部分計算過程具有一定的連續(xù)性,因而采用連續(xù)型增強學(xué)習(xí)算法得到最佳控制策略。設(shè)定在測量集合Z中具有控制狀態(tài)z,此策略參數(shù)為γ,使用γ與z求取不同動作c下的概率函數(shù),具體公式如下
fα(z)=η(z)Tγ
(10)
式中,η(z)表示特征向量,fα(z)表示控制策略的特征函數(shù)。使用高斯函數(shù)對其進行求解,則有
(11)
通過此公式,可得到最終的控制策略對數(shù)梯度,具體如下
(12)
使用此公式可對已獲得的控制策略展開處理,并得到適用于車輛轉(zhuǎn)彎制動橫向軌跡控制的最佳控制策略。將控制策略集合中的全部策略代入上述公式中,對比對數(shù)梯度計算結(jié)果,得到最優(yōu)解,并使用此策略完成車輛橫向軌跡控制過程。至此,基于增強學(xué)習(xí)的車輛轉(zhuǎn)彎制動橫向軌跡控制方法設(shè)計完成。
為了證實本文提出的基于增強學(xué)習(xí)的車輛轉(zhuǎn)彎制動橫向軌跡控制方法在日常的使用中具有相應(yīng)的優(yōu)越性與可靠性。在此次實驗中,將采用其與目前使用方法對比的方式,深入研究此方法的使用效果。為了體現(xiàn)不同初始車速對于車輛控制效果影響,在此次實驗中使用仿真的形式,并將仿真條件設(shè)定如下:前輪轉(zhuǎn)速由0到0.5s逐漸上升到0.05rad;制動從1s開始,即轉(zhuǎn)彎開始后0.5s開始制動;仿真道路附著系數(shù)為0.70;控制目標(biāo)車輛滑移率為0.20??刂普`差與誤差變化量的量化因子以及輸出變化量比例為15:2。根據(jù)上述設(shè)定的仿真參數(shù)與車輛情況,使用文中設(shè)計方法與文獻[3]提出的轉(zhuǎn)向制動工況下平衡重叉車橫向穩(wěn)定性控制方法和文獻[4]提出的基于可拓優(yōu)度評價的智能汽車橫向軌跡跟蹤控制方法對車輛轉(zhuǎn)彎制動橫向軌跡進行控制,對比控制效果。
在此次實驗中,將實驗指標(biāo)設(shè)定為車輛滑行時間、車輛位移長度以及車輛整體滑移率。通過上述實驗指標(biāo)對比文中設(shè)計方法與文獻[3]方法、文獻[4]方法的應(yīng)用效果。為使實驗結(jié)果更加逼真,將車輛的初始車速設(shè)定為15m/s以及30m/s,制動過程中車輛速度變化均勻,控制力矩穩(wěn)定,車輪載荷一致。仿真共進行5次,通過數(shù)據(jù)與圖像的形式,完成文中設(shè)計方法與文獻方法的對比過程。
表1 控制后車輛滑行時間對比結(jié)果
通過以上實驗結(jié)果可以看出,文中設(shè)計方法的使用效果明顯優(yōu)于文獻[3]方法和文獻[4]方法。通過數(shù)據(jù)對比可以看出,文中設(shè)計方法在兩種初始速度下均可較好的控制車輛滑行時間。同時,通過實驗數(shù)據(jù)也可以看出文中設(shè)計方法的車輛滑行時間區(qū)間較短,由此可知此方法在使用的過程中可在較短的時間內(nèi)完成。相較于文中設(shè)計方法,文獻[3]方法和文獻[4]方法雖然對于車輛具有一定的控制能力,但其控制響應(yīng)時間較長,在實際使用中易造成交通事故。由此可判定,在此指標(biāo)對比中,文中設(shè)計方法的使用效果更佳。
表2 控制后車輛滑行長度對比結(jié)果
根據(jù)以上表格中數(shù)據(jù)可以看出,文中設(shè)計方法在此實驗環(huán)節(jié)中所得實驗結(jié)果優(yōu)于文獻[3]方法和文獻[4]方法的實驗結(jié)果。根據(jù)多次實驗與測算,在不同車輛初始速度下,文中設(shè)計方法的使用效果一直維持在較為平穩(wěn)的狀態(tài)下。但通過數(shù)據(jù)可以看出,文獻[3]方法和文獻[4]方法使用效果并未達到文中設(shè)計方法的高度,兩種方法在使用后會造成車輛滑行路程較長,加大了車輛交通事故的發(fā)生幾率,導(dǎo)致駕駛員的安全出現(xiàn)問題,不利于交通安全管理。因此,在此部分實驗中可知,文中設(shè)計方法的使用效果優(yōu)于文獻[3]方法和文獻[4]方法。
通過以上實驗結(jié)果可以看出,在兩種不同的初始速度下,文中設(shè)計方法控制下的車輛整體滑移率較低,同時不同的初始速度對于車輛整體滑移率的影響較低,文中設(shè)計方法的使用效果較為穩(wěn)定。相較于文中設(shè)計方法,文獻[3]方法和文獻[4]方法對于車輛的整體滑移率控制效果較差,車輛的初始速度很容易對控制方法的使用效果造成影響。在不同的車輛初始速度下,文獻[3]方法和文獻[4]方法的控制差異較大,直接影響了車輛的橫向軌跡控制效果。由此可知,文獻[3]方法和文獻[4]方法不如文中設(shè)計方法的使用效果穩(wěn)定。
圖1 不同情況下的車輛整體滑移率對比結(jié)果
將以上實驗結(jié)果進行綜合分析可以看出,文中設(shè)計方法的使用效果明顯優(yōu)于目前使用中的控制方法。在日后的研究中,可使用此方法作為車輛的最佳控制方法。
針對傳統(tǒng)的車輛轉(zhuǎn)彎制動橫向軌跡控制方法存在車輛整體滑移率較高、控制后的車輛滑行時間較長、滑行路程較遠(yuǎn)的問題,本文提出基于增強學(xué)習(xí)的車輛轉(zhuǎn)彎制動橫向軌跡控制方法。通過仿真驗證了本文方法的有效性,解決了傳統(tǒng)方法存在的問題。但在此設(shè)計中,由于時間與技術(shù)的約束,存在部分的不足。在日后的研究中,將根據(jù)應(yīng)用中的不足進行合理優(yōu)化,以此保證車輛的控制效果,提升交通安全性。