劉明春 付皓 黃菊花 史鴻楓
(南昌大學(xué),南昌330031)
主題詞:自動駕駛車輛 駕駛行為分析 車輛控制 神經(jīng)網(wǎng)絡(luò)
自動駕駛汽車的安全性和乘坐舒適性與其彎道轉(zhuǎn)向控制密切相關(guān)。熟練駕駛員的操縱行為是保證車輛安全性和舒適性的重要因素,也是自動駕駛車輛“擬人化”控制的重要學(xué)習(xí)對象。因此,基于“人-車”系統(tǒng)數(shù)據(jù)的分析和學(xué)習(xí)是評價和提高自動駕駛車輛性能的重要途徑。
人-車系統(tǒng)主要分為駕駛員操縱行為與車輛動態(tài)響應(yīng)。駕駛員操縱行為包括對踏板與轉(zhuǎn)向盤的操作[1],通過這些操作數(shù)據(jù)可以分析駕駛員的行為特性[2-4]。另外,駕駛員還存在一些不良習(xí)慣[5],如東張西望等[6]。車輛動態(tài)響應(yīng)主要指車輛動力學(xué)特性,包括燃油經(jīng)濟性[7]、操縱穩(wěn)定性[8-9]、安全性[10]、乘坐舒適性[11]等。
車輛控制經(jīng)歷了從經(jīng)典控制理論到智能控制的過渡。經(jīng)典控制理論所采用的傳遞函數(shù)法是較早的車輛控制算法,郭孔輝基于傳遞函數(shù)提出了預(yù)瞄-跟隨理論[12],實現(xiàn)了車輛控制[13],該算法簡單易行,但控制效果有待提高。PID 算法常應(yīng)用于路徑跟隨控制[14],通過計算系統(tǒng)實際值與期望值的誤差進行反饋校正。模型預(yù)測控制算法基于現(xiàn)代控制理論將人-車-路閉環(huán)系統(tǒng)表示為狀態(tài)空間[15],以已知模型、當(dāng)前狀態(tài)量和未來控制量預(yù)測未來輸出。上述方法都需要事先得到預(yù)期軌跡。在智能控制理論中被廣泛應(yīng)用于車輛控制的算法有模糊控制算法[16]和神經(jīng)網(wǎng)絡(luò)算法[17],前者需要得到預(yù)期軌跡,而后者需要大量數(shù)據(jù)來提高其有效性。
本文基于對熟練駕駛員操縱數(shù)據(jù)的分析提出一種針對彎道的轉(zhuǎn)向控制方法。首先,在PreScan+Simulink環(huán)境中建立車-路模型[18],采集多位熟練駕駛員在虛擬場景下的轉(zhuǎn)向盤角度、軌跡、橫擺角速度與質(zhì)心側(cè)偏角。然后,通過對比駕駛員數(shù)據(jù)和期望數(shù)據(jù),對駕駛員數(shù)據(jù)進行分析和評價,篩選出訓(xùn)練樣本,以道路曲率、車速、車輛橫擺角速度為輸入,以轉(zhuǎn)向盤轉(zhuǎn)角為輸出,建立基于BP 神經(jīng)網(wǎng)絡(luò)的彎道轉(zhuǎn)向控制器。最后,對該控制器進行仿真和實車測試,以驗證其有效性。
本文的模擬駕駛平臺軟硬件構(gòu)架如圖1所示:在PreScan 軟件中建立場景模型與傳感器模型;羅技G29操縱裝置提供轉(zhuǎn)向盤和油門踏板、制動踏板、離合器踏板,駕駛員操縱該裝置實現(xiàn)車輛的轉(zhuǎn)向、驅(qū)動和制動控制,其數(shù)據(jù)通過電信號傳輸至執(zhí)行機構(gòu);在MATLAB/Simulink 中建立車輛動力學(xué)模型作為控制對象,Simulink 中的羅技G29 信號接收模塊將電信號轉(zhuǎn)化為Simulink信號輸入;由PC端獲取PreScan軟件輸出的3D場景作為駕駛員視角,同時獲取MATLAB/Simulink反饋的信息進行數(shù)據(jù)監(jiān)控和采集??刂破髡w框架如圖2所示。
圖1 模擬駕駛平臺軟硬件構(gòu)架
圖2 控制器設(shè)計框架
本文采用3自由度車輛模型作為控制對象,模型的輸入為轉(zhuǎn)向盤轉(zhuǎn)角和速度,輸出為車輛動力學(xué)參數(shù)。3自由度車輛模型如圖3所示。
圖3 3自由度車輛動力學(xué)模型
根據(jù)牛頓第二定律,建立如下方程:
式中,m為車輛的整備質(zhì)量;?分別為車輛在x軸方向的速度和加速度?分別為車輛在y軸方向的速度和加速度;Iz為車輛繞z軸的轉(zhuǎn)動慣量;a、b分別為車輛質(zhì)心到前、后軸的距離;φ為車輛橫擺角;δf為前輪轉(zhuǎn)角;Flf、Flr分別為地面對前、后輪胎的縱向作用力;Fcf、Fcr分別為地面對前、后輪胎的側(cè)向作用力。
根據(jù)線性的輪胎理論模型[19],F(xiàn)lf、Flr、Fcf、Fcr的表達式分別為:
式中,Cxf、Cxr分別為前、后輪胎的縱向剛度;Cyf、Cyr分別為前、后輪胎的側(cè)偏剛度;sf、sr分別為前、后輪胎在地面上的滑移率;αf、αr分別為前、后輪胎的側(cè)偏角。
基于前輪轉(zhuǎn)角較小情況,并考慮車身坐標(biāo)系與慣性坐標(biāo)系之間的轉(zhuǎn)換關(guān)系,整理得到3自由度車輛動力學(xué)系統(tǒng)方程為:
2.3.1 場景設(shè)計與數(shù)據(jù)采集
在設(shè)計的模擬駕駛平臺中,PreScan軟件提供場景、道路和車輛信息,羅技G29裝置模擬真實駕駛員的操縱行為,MATLAB/Simulink軟件采集并存儲駕駛員的操縱數(shù)據(jù)和車輛狀態(tài)數(shù)據(jù)。
為了提高模型的有效性,本文設(shè)定了11 個彎道場景,其中10個作為訓(xùn)練場景,1個作為測試場景。同時,按照城市道路規(guī)劃規(guī)范[20],對這些彎道場景進行速度限制。訓(xùn)練場景設(shè)計參數(shù)如表1所示。
表1 訓(xùn)練場景設(shè)計參數(shù)
每個訓(xùn)練場景有2 條道路,分別為左轉(zhuǎn)向與右轉(zhuǎn)向,除方向外其他設(shè)定完全相同。規(guī)定道路曲率圓的圓心在駕駛員左側(cè)時曲率為正,反之為負(fù)。
邀請8 位熟悉操縱平臺特性的熟練駕駛員在10 個場景共計20 條道路進行一次有效駕駛(順利從起點行駛至終點),保證每位駕駛員起始位置和終點位置相同,且駕駛過程中速度保持不變。采集駕駛員數(shù)據(jù)、車輛數(shù)據(jù)與道路數(shù)據(jù),包括轉(zhuǎn)向盤轉(zhuǎn)角、車速、橫擺角速度、質(zhì)心側(cè)偏角以及道路曲率,采樣周期為20 ms。
2.3.2 數(shù)據(jù)處理與分析
為了保證車輛彎道轉(zhuǎn)向過程中的安全性、穩(wěn)定性和舒適性,選取駕駛員車道保持能力、駕駛員轉(zhuǎn)向平穩(wěn)性以及車輛穩(wěn)定性作為控制效果的評價指標(biāo)。
2.3.2.1 駕駛員車道保持能力
本文用車輛質(zhì)心與中心線的橫向距離來描述駕駛員的車道保持能力:假定期望軌跡為車道中心線,將實際軌跡與期望軌跡進行相似性比較,將該指標(biāo)進行量化處理,本文采用基于歐式距離的相似度算法對期望軌跡和實際軌跡進行比較[17]。具體方法如圖4所示,在每個場景的道路邊界均勻選取n個點(P1,…,Pi-1,Pi,Pi+1,…,Pn),每相鄰2 個點的距離為1 m,用來確定車輛在道路上的位置。在大地坐標(biāo)系內(nèi),駕駛軌跡和期望軌跡在Pi處對應(yīng)的軌跡上的點分別為Di和Qi,Di和Qi對應(yīng)的瞬時轉(zhuǎn)向盤轉(zhuǎn)角為δdriver和δexp。根據(jù)2 條軌跡在每個選取點對應(yīng)的位置,計算2個點間的歐氏距離:
圖4 車輛位置計算
式中,||Di-Qi||為Di和Qi的二范數(shù)歐氏距離。
則2條軌跡的累計距離偏差、平均距離偏差可分別表示為:
道路曲率為1/35 m-1的彎道常見于城市環(huán)島,選用該曲率的訓(xùn)練場景進行說明。在該訓(xùn)練場景的左轉(zhuǎn)向道路中,期望軌跡和8 位駕駛員的實際駕駛軌跡如圖5所示,其中前、后各有60 m的速度控制直道和30 m的方向回正直道,直道不參與計算過程。
圖5 駕駛軌跡與期望軌跡
計算各駕駛員的駕駛軌跡與期望軌跡的平均距離偏差,該指標(biāo)反映了駕駛員駕駛過程中車輛與車道中心線的偏離程度,其結(jié)果如表2所示。
表2 軌跡平均距離偏差 m
2.3.2.2 駕駛員轉(zhuǎn)向平穩(wěn)性
駕駛員的轉(zhuǎn)向平穩(wěn)性為駕駛員操作轉(zhuǎn)向盤的穩(wěn)定性,表現(xiàn)為駕駛員控制轉(zhuǎn)向盤的振蕩程度。為了將該指標(biāo)量化,引入變異系數(shù)cv[21]:
式中,σ、分別為所測量的轉(zhuǎn)向盤轉(zhuǎn)角的標(biāo)準(zhǔn)差和均值。
變異系數(shù)體現(xiàn)了轉(zhuǎn)向盤轉(zhuǎn)角的離散化程度,變異系數(shù)越大,離散化程度越大。采集到的8位駕駛員的轉(zhuǎn)向盤轉(zhuǎn)角如圖6所示。
圖6 駕駛員轉(zhuǎn)向盤轉(zhuǎn)角
在計算變異系數(shù)時,需要剔除前、后2 段直線道路的數(shù)據(jù),計算得到8位駕駛員的轉(zhuǎn)向盤轉(zhuǎn)角變異系數(shù)如表3所示。
表3 轉(zhuǎn)向盤轉(zhuǎn)角變異系數(shù)
2.3.2.3 車輛穩(wěn)定性
車輛的穩(wěn)定性主要體現(xiàn)在車輛的橫擺角速度和質(zhì)心側(cè)偏角上。一方面可直接通過其數(shù)值評價車輛的穩(wěn)定性,另一方面,可將二者的實際值與期望值進行對比分析來評價車輛的穩(wěn)定性。
基于二自由度車輛模型計算出期望橫擺角速度,其表達式為[22]:
式中,ωdes=Gωzss·δ為穩(wěn)態(tài)轉(zhuǎn)向下的橫擺角速度;ωd=0.85μg/x?為橫擺角速度上限;Gωzss為橫擺角速度的穩(wěn)態(tài)增益;δ為轉(zhuǎn)向盤轉(zhuǎn)角;μ為道路附著系數(shù);g為重力加速度。
同樣可得期望質(zhì)心側(cè)偏角,其表達式為[22]:
式中,βdes=Gβzss·δ為穩(wěn)態(tài)轉(zhuǎn)向下的質(zhì)心側(cè)偏角;βd=arctan(0.02μg)為質(zhì)心側(cè)偏角的上限;Gβzss為期望質(zhì)心側(cè)偏角增益。
根據(jù)式(11)和式(12)計算該場景下的期望橫擺角速度和期望質(zhì)心側(cè)偏角,得到橫擺角速度、質(zhì)心側(cè)偏角的期望值與8位駕駛員的測量值如圖7、圖8所示。
圖7 橫擺角速度期望值與實際值
圖8 質(zhì)心側(cè)偏角期望值與實際值
擬合優(yōu)度作為一種用于非線性回歸方程擬合程度判定的指標(biāo),常用于曲線擬合。本文引入度量擬合優(yōu)度的統(tǒng)計量可決系數(shù)R2[23],將期望值作為擬合后的曲線,進行擬合優(yōu)度分析??蓻Q系數(shù)的計算公式為:
式中,yij為編號為j的駕駛員數(shù)據(jù)的實測值;為期望值;為編號為j的駕駛員數(shù)據(jù)的平均值;n為每個駕駛員數(shù)據(jù)的總數(shù)量。
可決系數(shù)體現(xiàn)了車輛的穩(wěn)定性指標(biāo)與期望值的擬合程度,R2越接近1,表明擬合度越高。
分別計算8 位駕駛員的駕駛員數(shù)據(jù)與期望數(shù)據(jù)的可決系數(shù),橫擺角速度和質(zhì)心側(cè)偏角的擬合優(yōu)度分析結(jié)果分別如表4、表5所示。
表4 橫擺角速度擬合優(yōu)度
表5 質(zhì)心側(cè)偏角擬合優(yōu)度
2.3.3 評價模型
為了對駕駛員數(shù)據(jù)進行評價,建立如表6所示的駕駛員轉(zhuǎn)向行為評價體系。
表6 駕駛員轉(zhuǎn)向行為評價體系
選用層次分析法計算指標(biāo)權(quán)重,參考國內(nèi)外駕駛行為評價研究及成果,綜合運用各項研究中的專家經(jīng)驗和數(shù)據(jù),基于各項評價指標(biāo)的相對重要性,以主觀判斷法對各項指標(biāo)進行評判[24],得到一級指標(biāo)和車輛穩(wěn)定性的判斷矩陣分別如表7、表8所示。
表7 一級指標(biāo)判斷矩陣
表8 車輛的穩(wěn)定性判斷矩陣
計算各判斷矩陣的行指標(biāo)乘積:
計算各行的歸一化權(quán)重作為判斷矩陣各指標(biāo)權(quán)重:
最后得到權(quán)重分配結(jié)果如圖9所示。
圖9 權(quán)重分配結(jié)果
采用模糊評價法進行打分[25]:設(shè)置評價集為V={優(yōu)秀,良好,中等,合格,差},其分值為v={100,90,80,70,60}。選取18 名從事自動駕駛行業(yè)的人員,并參考各項指標(biāo)的平均值對各項指標(biāo)進行評價。根據(jù)評價結(jié)果及其權(quán)重分配計算得到駕駛員轉(zhuǎn)向行為評分結(jié)果如表9所示。
表9 駕駛員轉(zhuǎn)向行為評分 分
用相同的評價系統(tǒng)評價8 位駕駛員的所有駕駛行為,得到160組駕駛數(shù)據(jù)的評分如表10所示。
表10 駕駛員轉(zhuǎn)向行為評分
為提升神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度和控制器的有效性,剔除得分75 分以下的駕駛員數(shù)據(jù),其余數(shù)據(jù)作為訓(xùn)練樣本。
本文設(shè)計一種基于BP神經(jīng)網(wǎng)絡(luò)的自動駕駛彎道轉(zhuǎn)向控制器,控制流程如圖10所示。
圖10 橫向控制流程
設(shè)計BP 神經(jīng)網(wǎng)絡(luò)為3 層結(jié)構(gòu),輸入節(jié)點分別為車速、道路曲率、橫擺角速度,輸出節(jié)點為轉(zhuǎn)向盤轉(zhuǎn)角。采用試湊法確定隱藏層單元數(shù)[26],最后確定神經(jīng)網(wǎng)絡(luò)構(gòu)造為3-8-1,如圖11所示。
圖11 神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)
神經(jīng)網(wǎng)絡(luò)隱藏層與輸出層的激活函數(shù)采用sigmoid函數(shù),正向傳播過程為:
神經(jīng)網(wǎng)絡(luò)的反向傳播使用萊文伯格-馬夸特(Lev?enberg-Marquard,LM)算法來修正模型的權(quán)值和閾值[27]:
式中,w(k)和b(k)分別為為第k次迭代的權(quán)值和閾值所組成的向量;J為雅克比矩陣;I為單位矩陣;μ為學(xué)習(xí)率;e為輸出誤差矩陣。
測試道路選用江西省上饒市的一處高速匝道入口,在PreScan軟件中建立1∶1的道路模型,測試道路如圖12所示。
圖12 測試道路
設(shè)定車輛行駛速度為40 km/h,且駕駛員參考車道中心線駕駛車輛,仿真測試結(jié)果如圖13所示。
結(jié)合圖13a中數(shù)據(jù)和2.3.2.1節(jié)中計算公式,計算得到駕駛員、控制器控制下軌跡和期望軌跡的平均距離偏差分別為0.832 1 m、0.418 7 m。由圖13b 可知,控制器能夠模擬駕駛員的轉(zhuǎn)向行為。結(jié)合圖13c和圖13d中數(shù)據(jù)和2.3.2.3 節(jié)中計算公式,分別計算駕駛員數(shù)據(jù)、自動駕駛控制結(jié)果、期望值之間可決系數(shù),結(jié)果如表11所示。綜合以上仿真結(jié)果分析,可以得出該控制器能夠有效模擬熟練駕駛員的轉(zhuǎn)向行為,且能夠保證自動駕駛車輛的安全性和穩(wěn)定性。
圖13 仿真測試結(jié)果
表11 仿真測試車輛響應(yīng)擬合優(yōu)度
測試平臺為某自動駕駛車輛,如圖14所示,該車配備了1個前視攝像頭和6個毫米波雷達,傳感器的檢測距離如圖15所示。本文利用前視攝像頭檢測車道線并通過內(nèi)置算法計算車道線的曲率。
圖14 測試車輛
圖15 車載傳感器配置
測試車輛的整車通訊架構(gòu)如圖16所示。以MicroAutoBox硬件作為控制器,車輛傳感器向控制器提供交通信息。主機車輛的速度和加速度通過CAN總線提供??刂破骰谒岢龅目刂扑惴ㄓ嬎闫谕铀俣?,并將其作用于測試車。主計算機中可直觀地顯示主機車輛的控制信息和運動狀態(tài)。
圖16 實車驗證方案
本次測試選用園區(qū)內(nèi)的一條有車道線的彎道作為測試場景,速度設(shè)定為20 km/h。車輛狀態(tài)可通過車身CAN總線獲取,前車運動狀態(tài)通過毫米波雷達獲取,道路信息通過前視攝像頭獲取。測試結(jié)果如圖17所示。
圖17 實車驗證結(jié)果
結(jié)合圖17b數(shù)據(jù)和2.3.2.1節(jié)計算公式,得到駕駛員和控制器控制下軌跡的平均距離偏差為0.127 2 m。圖17c表明,控制器可模擬駕駛員的轉(zhuǎn)向行為。結(jié)合圖17d和圖17e數(shù)據(jù)和2.3.2.3節(jié)計算公式,分別計算駕駛員數(shù)據(jù)、自動駕駛控制結(jié)果、期望值間的可決系數(shù),結(jié)果如表12所示。綜合分析可得,彎道轉(zhuǎn)向控制器在實車應(yīng)用中可模擬熟練駕駛員轉(zhuǎn)向行為,且能保證安全性和穩(wěn)定性。
表12 實車驗證車輛響應(yīng)擬合優(yōu)度
本文提出了一種基于駕駛員操縱數(shù)據(jù)分析和學(xué)習(xí)的自動駕駛車輛彎道轉(zhuǎn)向控制器,用于模擬熟練駕駛員在彎道上的駕駛行為。基于3自由度車輛模型搭建人-車-路模擬駕駛平臺,采集多位熟練駕駛員的操縱數(shù)據(jù),并進行離散分析和相似分析,建立模糊綜合評價系統(tǒng)對駕駛員轉(zhuǎn)向行為進行評分,篩選出訓(xùn)練樣本,基于LMBP神經(jīng)網(wǎng)絡(luò)建立彎道轉(zhuǎn)向控制器,控制器以車速、道路曲率、橫擺角速度為輸入,以轉(zhuǎn)向盤轉(zhuǎn)角為輸出。仿真測試和實車驗證結(jié)果表明,該控制器能夠模擬熟練駕駛員的彎道駕駛特性,并能保證行駛安全性和穩(wěn)定性。