劉慶霄, 唐澤月, 張超朋, 劉海鷗, 陳慧巖
(北京理工大學(xué) 機(jī)械與車輛學(xué)院, 北京 100081)
無人駕駛車輛是多領(lǐng)域科學(xué)技術(shù)的集成運(yùn)用平臺,在眾多方面有著潛在的應(yīng)用價(jià)值。同時(shí),基于雙側(cè)獨(dú)立電機(jī)的分布式電驅(qū)動(dòng)技術(shù)依靠其結(jié)構(gòu)緊湊、動(dòng)力性強(qiáng)等優(yōu)勢,加速了履帶機(jī)動(dòng)平臺電動(dòng)化、無人化的發(fā)展進(jìn)程。其中,縱向速度決策是電驅(qū)動(dòng)無人履帶機(jī)動(dòng)平臺研究領(lǐng)域的關(guān)鍵問題之一。以車輛直駛過程中遇見障礙物并低速靠近障礙物的行駛工況為例,在加速過程中,縱向決策系統(tǒng)需要根據(jù)平臺加速度特性將加速度平衡在高效、安全的區(qū)間內(nèi),以提高車輛的靈活性;在制動(dòng)過程中,縱向決策系統(tǒng)需要根據(jù)制動(dòng)需求設(shè)計(jì)合理的制動(dòng)行為,保障平臺的安全。同時(shí),地面條件與平臺驅(qū)動(dòng)電機(jī)響應(yīng)的不確定性也大大增加了縱向決策系統(tǒng)的設(shè)計(jì)難度。
為了獲得履帶機(jī)動(dòng)平臺在縱向行駛過程中的行駛特性,一些學(xué)者在平臺運(yùn)動(dòng)學(xué)與動(dòng)力學(xué)模型構(gòu)建方面展開了大量的研究工作。孫逢春等建立了履帶平臺行動(dòng)部分動(dòng)力學(xué)模型,并提出牽引電機(jī)控制方法,在實(shí)車試驗(yàn)和仿真中驗(yàn)證了其加速特性。陳朝萌等在電驅(qū)動(dòng)履帶平臺動(dòng)力學(xué)模型基礎(chǔ)上,提出基于滑膜魯棒控制、制動(dòng)扭矩預(yù)分配規(guī)則的機(jī)- 電- 液聯(lián)合制動(dòng)防抱死策略,將平臺滑移率控制在合理范圍內(nèi)。針對4個(gè)以上驅(qū)動(dòng)電機(jī)的過驅(qū)動(dòng)系統(tǒng),曾慶含等結(jié)合履帶平臺運(yùn)動(dòng)學(xué)與動(dòng)力學(xué)分析,制定電機(jī)轉(zhuǎn)矩優(yōu)化分配策略,提高了動(dòng)力輸出穩(wěn)定裕度。文獻(xiàn)[2-4]均建立了完備的電驅(qū)動(dòng)履帶平臺動(dòng)力學(xué)模型,并對電機(jī)控制特性進(jìn)行了深入的研究工作,但這些研究缺乏在真實(shí)越野環(huán)境中的試驗(yàn)驗(yàn)證,且忽視了駕駛員操控平臺縱向性能的影響。劉瑞等利用龐大的駕駛數(shù)據(jù)庫探討了駕駛員加速度分布的收斂性與分布特性。沈沛鴻等利用基于自適應(yīng)網(wǎng)絡(luò)的模糊推理系統(tǒng)設(shè)計(jì)縱向駕駛員模型,試驗(yàn)結(jié)果表明其決策得到的油門踏板行程、擋位和需求轉(zhuǎn)矩接近于實(shí)車試驗(yàn)結(jié)果。在Qu等對駕駛員行為的研究中,為反映駕駛員對車輛運(yùn)動(dòng)特征的感知,在決策模塊中基于車輛動(dòng)力學(xué)生成期望最優(yōu)加速度。Qu等提出一種適用于輪式車輛的基于模型預(yù)測控制(MPC)的多模式切換縱向自動(dòng)駕駛系統(tǒng)。為提高縱向運(yùn)動(dòng)平順性,Seina等在試驗(yàn)車輛制動(dòng)模型的基礎(chǔ)上采用線性二次型(LQ)最優(yōu)控制方法建立了駕駛員制動(dòng)模型,仿真試驗(yàn)驗(yàn)證了駕駛員模型對提高平順性的作用。為提取影響駕駛安全的變量因子,Peng等基于改進(jìn)后的變精度粗糙集模型建立車- 路- 人閉環(huán)系統(tǒng)的數(shù)據(jù)挖掘模型,為預(yù)警系統(tǒng)提供了更精確的評估結(jié)果。為了提高駕駛員模型在公路上與其他車輛的交互性,Tian等建立了基于車輛- 道路交互行為的交互多模型(IMM),該方法在仿真實(shí)驗(yàn)中表現(xiàn)出了對周圍動(dòng)態(tài)環(huán)境良好的適應(yīng)能力。
隨著機(jī)器學(xué)習(xí)方法在自動(dòng)駕駛領(lǐng)域的廣泛應(yīng)用,具有學(xué)習(xí)能力的駕駛員模型得到了廣泛的研究。Dimitrios等通過大量的駕駛數(shù)據(jù)訓(xùn)練了6種線性回歸模型,用于預(yù)測不同行駛條件下的平均行駛速度,有利于構(gòu)建精細(xì)的駕駛員速度模型。為提高學(xué)習(xí)型駕駛員縱向模型的適應(yīng)能力,Lu等提出基于強(qiáng)化學(xué)習(xí)算法的類人速度決策系統(tǒng),該系統(tǒng)在仿真環(huán)境和實(shí)車試驗(yàn)中得到了驗(yàn)證。針對重型車輛駕駛員,Mumcuoglu等提出基于長- 短時(shí)記憶(LSTM)的縱向駕駛行為模型,用于評估駕駛員的危險(xiǎn)加速和制動(dòng)行為。Wang等使用高斯混合模型(GMM)和隱馬爾可夫模型(HMM)對駕駛員跟車行為進(jìn)行建模,該方法有效地辨識出了駕駛員的制動(dòng)意圖。Liu等提出隱半馬爾可夫模型(HSMM),對基于GMM-HMM的駕駛員模型進(jìn)行了優(yōu)化?;贕MM-HMM的駕駛員模型同樣適用于履帶車輛駕駛員建模。王博洋等基于GMM-HMM駕駛員模型實(shí)現(xiàn)了履帶平臺橫縱向協(xié)同跟蹤控制,有效地利用駕駛員的經(jīng)驗(yàn)解決了橫縱向控制的強(qiáng)耦合性和不確定性。文獻(xiàn)[5-16]中的研究對象均為城市環(huán)境中的輪式車輛及其駕駛員,環(huán)境不確定性以及干擾較少。文獻(xiàn)[17]驗(yàn)證了基于GMM-HMM的駕駛員模型在越野環(huán)境及履帶平臺上的有效性,但研究內(nèi)容沒有突出駕駛員縱向操控過程。
綜上所述,各國學(xué)者在電驅(qū)動(dòng)履帶機(jī)動(dòng)平臺行動(dòng)部分動(dòng)力學(xué)建模與輪式車輛駕駛員縱向行為建模領(lǐng)域均取得了豐富的研究成果。但是針對雙側(cè)獨(dú)立電驅(qū)動(dòng)的履帶機(jī)動(dòng)平臺類人縱向決策的研究還較少,如何結(jié)合電驅(qū)動(dòng)履帶車輛的行駛特性與駕駛員決策行為,設(shè)計(jì)不依賴精確地面參數(shù)與車輛參數(shù)的縱向決策系統(tǒng)是本文研究的關(guān)鍵問題。
本文基于駕駛員模型對雙側(cè)獨(dú)立電驅(qū)動(dòng)無人履帶機(jī)動(dòng)平臺縱向決策過程展開研究工作。采集駕駛員在真實(shí)越野環(huán)境中直駛的操控?cái)?shù)據(jù)與車輛狀態(tài),并在道路末端設(shè)置垂直墻模擬制動(dòng)工況。通過GMM從當(dāng)前車速和與障礙物間距中得到駕駛員的行駛意圖,并利用高斯分布學(xué)習(xí)駕駛員在某一期望速度上的持續(xù)時(shí)間,在此基礎(chǔ)上基于HSMM生成駕駛員的縱向決策結(jié)果。該系統(tǒng)在不同地面條件(干燥土路與泥濘土路)上均通過了實(shí)車驗(yàn)證。試驗(yàn)結(jié)果表明,通過控制狀態(tài)持續(xù)時(shí)間可以有效地模擬熟練駕駛員依靠體感進(jìn)行縱向決策的駕駛行為特性,同時(shí)不依靠于準(zhǔn)確地面參數(shù)與車輛參數(shù)將平臺加速度控制在合理區(qū)間內(nèi)。
圖1 電驅(qū)動(dòng)無人履帶機(jī)動(dòng)平臺感知定位系統(tǒng)Fig.1 The perception and location system of the electric unmanned tracked platform
為了實(shí)現(xiàn)無人履帶機(jī)動(dòng)平臺類人縱向決策系統(tǒng)驗(yàn)證,搭建了如圖1所示的雙側(cè)獨(dú)立電驅(qū)動(dòng)履帶機(jī)動(dòng)平臺無人系統(tǒng),其中激光雷達(dá)、相機(jī)構(gòu)成了環(huán)境感知系統(tǒng),慣導(dǎo)、GPS構(gòu)成了組合導(dǎo)航定位系統(tǒng),以及車載計(jì)算單元構(gòu)成了運(yùn)算處理系統(tǒng)。如圖2所示,裝置在兩側(cè)的獨(dú)立驅(qū)動(dòng)電機(jī)為履帶機(jī)動(dòng)平臺提供車輛驅(qū)動(dòng)動(dòng)力,驅(qū)動(dòng)電機(jī)與主減速器之間裝備了兩擋行星自動(dòng)變速器。車輛的動(dòng)力能源來自車載高壓電池組和增程式發(fā)動(dòng)機(jī)發(fā)電機(jī)組。雙側(cè)獨(dú)立電驅(qū)動(dòng)無人履帶機(jī)動(dòng)平臺的具體車輛參數(shù)如表1所示。
圖2 無人履帶機(jī)動(dòng)平臺電驅(qū)動(dòng)系統(tǒng)Fig.2 The electric drive system of the unmanned tracked platform
表1 無人履帶機(jī)動(dòng)平臺重要參數(shù)
由于履帶機(jī)動(dòng)平臺在越野環(huán)境中面臨多種任務(wù)需求,駕駛員需要在加速或制動(dòng)過程中充分保證平臺靈活性與安全性,以及滿足基本的舒適性要求,即控制平臺縱向加速度在合理的區(qū)間內(nèi)。過大的縱向加速度值增大了無人平臺轉(zhuǎn)向的難度,而過小的縱向加速度值則降低了平臺行駛效率與制動(dòng)過程的安全。本文從駕駛員縱向操控行為出發(fā),通過模擬駕駛員在不同地面條件下的操控行為,實(shí)現(xiàn)雙側(cè)獨(dú)立電驅(qū)動(dòng)無人履帶類人平臺縱向速度決策。
駕駛?cè)蝿?wù)主要分為4個(gè)部分,分別是加速至最大期望速度、恒速行駛、發(fā)現(xiàn)障礙物后開始制動(dòng)以及緩速接近障礙物。試驗(yàn)路面包括平坦的干燥土路和平坦的泥濘土路兩種。研究流程框圖如圖3所示,首先將車載傳感器采集到的駕駛員操控?cái)?shù)據(jù)、平臺狀態(tài)和環(huán)境信息處理成可用駕駛數(shù)據(jù)集,該數(shù)據(jù)集用于訓(xùn)練駕駛員縱向決策模型參數(shù)。在訓(xùn)練后的縱向決策模型基礎(chǔ)上,利用障礙物識別與測距算法獲得模型輸入,基于GMM方法辨識4種駕駛意圖(駕駛子任務(wù))。該意圖作為隱藏狀態(tài)參量輸入HSMM,根據(jù)持續(xù)時(shí)間和轉(zhuǎn)移規(guī)律模擬駕駛員的決策轉(zhuǎn)移過程,從而生成具有駕駛員操控特性的平臺期望速度。下面將詳細(xì)闡述駕駛員縱向決策模型建模與學(xué)習(xí)方法。
圖3 電驅(qū)動(dòng)無人履帶平臺類人縱向決策系統(tǒng)研究框圖Fig.3 Research block diagram of human-like longitudinal decision-making system for electric unmanned tracked platform
在典型的有障礙物的直駛?cè)蝿?wù)中,駕駛?cè)蝿?wù)可以大致分解為如圖3所示的4個(gè)部分,駕駛員的決策行為主要體現(xiàn)在根據(jù)當(dāng)前車速、與障礙物間距產(chǎn)生適當(dāng)?shù)鸟{駛意圖。為學(xué)習(xí)駕駛員的縱向行為意圖變化過程,主要需要解決的問題有:
1)研究某一駕駛意圖存在時(shí)的觀測狀態(tài)分布規(guī)律;
2)研究駕駛員在加速與制動(dòng)過程中的期望速度變化量分布規(guī)律。
問題1主要反映了駕駛員在當(dāng)前工況下產(chǎn)生某種駕駛意圖的概率,問題2則期望量化駕駛員的加速與制動(dòng)行為,因?yàn)樵谕获{駛意圖的不同階段駕駛員可能具有不同的操控習(xí)慣。假設(shè)駕駛意圖、期望速度變化量大小與當(dāng)前車速、與障礙物間距、最大期望車速有關(guān),因此建立GMM對不同駕駛意圖、期望速度變化量分別進(jìn)行聚類分析,得到其在全區(qū)間的連續(xù)概率密度函數(shù)。對整個(gè)區(qū)間內(nèi)的常見觀測區(qū)域進(jìn)行統(tǒng)計(jì)概率描述,以GMM的最佳擬合個(gè)數(shù)作為行駛策略的劃分依據(jù)。通過人工標(biāo)注的方法標(biāo)注出駕駛數(shù)據(jù)對應(yīng)的駕駛意圖。
假設(shè)在一次行駛過程中,時(shí)刻的觀測向量=[,],和分別為時(shí)刻平臺的縱向車速(km/h)和與障礙物的相對距離(m),長度為的連續(xù)觀測向量構(gòu)成了單次行駛的觀測序列={,,…,||},令該次行駛中的最大速度為,滿足=max(),∈(0,||]。因此次行駛構(gòu)成的數(shù)據(jù)集可以寫為={,,…,}。為了簡化GMM中高斯核與駕駛意圖的對應(yīng)關(guān)系,從經(jīng)驗(yàn)上利用最大行駛速度將數(shù)據(jù)集劃分為3個(gè)子集,分別滿足∈(0 km/h,10 km/h],∈(10 km/h, 20 km/h]和∈(20 km/h,30 km/h]。針對每一個(gè)觀測序列子集,利用GMM對其在整個(gè)區(qū)間內(nèi)的概率密度函數(shù)進(jìn)行建模。多變量GMM如(1)式和(2)式所示:
(1)
(2)
式中:(|,)為第個(gè)高斯分布;為觀測向量的維度;和分別為第個(gè)高斯模型的均值矩陣和協(xié)方差矩陣;為第個(gè)高斯模型的先驗(yàn)概率值;(|)為觀測序列的混合高斯模型;={,,…,}為混合高斯模型的參數(shù)集合,其中={,,};為高斯模型的個(gè)數(shù)。
使用最大似然法估算GMM的參數(shù),其最大似然函數(shù)如(3)式所示:
(3)
因?yàn)閷τ贕MM無法使用求導(dǎo)方法得到使得(3)式最大的參數(shù),所以需要利用一種迭代方法,即期望最大化(EM)算法求解。使用貝葉斯信息判據(jù)得到高斯模型的最佳數(shù)目,貝葉斯信息判據(jù)如(4)式所示:
(4)
式中:BIC數(shù)值與模型擬合能力正相關(guān);為所選GMM。實(shí)際上,一種駕駛意圖可能對應(yīng)多個(gè)高斯核,針對具有語義歧義的高斯核或聚類效果不滿足要求的情況,通過調(diào)整值或在EM算法中設(shè)置高斯核均值和方差的初始值獲得更好的學(xué)習(xí)結(jié)果。
在得到較好的聚類結(jié)果后,令()為時(shí)刻觀測向量屬于第個(gè)高斯模型的后驗(yàn)概率,計(jì)算方法如(5)式所示:
(5)
對于時(shí)刻觀測狀態(tài)向量的后驗(yàn)概率最高的高斯核求解方法為
(6)
則認(rèn)為該高斯核對應(yīng)的駕駛意圖即為時(shí)刻的駕駛意圖。
在操控行為聚類過程中,(|)是第種駕駛意圖下操控行為觀測序列的混合高斯模型,根據(jù)履帶車輛駕駛員存在普通和謹(jǐn)慎兩種駕駛風(fēng)格,令高斯核個(gè)數(shù)=2,為混合高斯模型的參數(shù)集合。使用EM算法估計(jì)得到GMM中的參數(shù),實(shí)現(xiàn)對駕駛員期望速度變化量的聚類。聚類結(jié)果決定了HSMM算法中顯式狀態(tài)集合中元素的大小。
圖4 基于GMM-HSMM的縱向速度規(guī)劃系統(tǒng)Fig.4 Longitudinal speed planning system based on the GMM-HSMM
初始狀態(tài)和持續(xù)時(shí)間的聯(lián)合概率定義為(,)=()(|),一個(gè)狀態(tài)的初始概率用=()表示,而持續(xù)時(shí)間的概率用,=(|)表示,狀態(tài)轉(zhuǎn)移概率矩陣只作用于狀態(tài)轉(zhuǎn)移的邊界。
在HSMM中,隱藏狀態(tài)(,|-1,-1)的轉(zhuǎn)移概率可以分解為
(,|-1,-1)=
(|-1,-1)(|-1,-1)
(7)
其中對應(yīng)的定義為
(8)
(9)
當(dāng)=時(shí),==1,否則==0。
狀態(tài)持續(xù)時(shí)間參量是HSMM區(qū)別于傳統(tǒng)HMM的關(guān)鍵點(diǎn),參考人類行為建模研究,參數(shù)化分布模型更適用于狀態(tài)持續(xù)時(shí)間建模。在本文中使用高斯分布擬合持續(xù)時(shí)間分布規(guī)律,對于持續(xù)時(shí)間的概率密度公式為
(10)
式中:和分別為高斯分布的方差和均值;為描述當(dāng)前地面類型、期望車速與駕駛意圖的參量。通過統(tǒng)計(jì)方法估計(jì)得到參數(shù)和,并將每種工況下的期望值視為最優(yōu)值。
假設(shè)已知狀態(tài)參量=,此時(shí)的觀測向量概率服從多元高斯分布,為了便于實(shí)現(xiàn)這一點(diǎn),觀測向量在隱藏狀態(tài)下的發(fā)射概率可以定義為
(11)
(12)
(13)
之后,HSMM可以由參數(shù)集={,,,}確定,給定訓(xùn)練駕駛數(shù)據(jù)集,使用迭代算法EM通過最大化似然對數(shù)lg(|)來獲得最優(yōu)參數(shù)集合。學(xué)習(xí)獲得模型參數(shù)后,使用前向算法估計(jì)當(dāng)前狀態(tài)=,將前向遞歸變量定義為
(14)
因此,基于前向算法的狀態(tài)的估計(jì)值可以由(15)式計(jì)算而得:
(15)
為了全面采集駕駛員在直駛接近障礙物過程中的駕駛數(shù)據(jù),實(shí)車進(jìn)行了共計(jì)40余次實(shí)車駕駛試驗(yàn),試驗(yàn)中履帶機(jī)動(dòng)平臺最大期望速度在5~30 km/h之間,對應(yīng)初始距離在10~100 m范圍內(nèi),車輛在行駛過程中加速、恒速行駛、制動(dòng)和緩速接近4個(gè)階段依次出現(xiàn),且距離障礙物1 m時(shí)速度不高于2 km/h。共有3名駕駛員參與試驗(yàn),包括2名初級駕駛員和1名持有特種車輛駕駛證的駕駛員,2名初級駕駛員在試驗(yàn)前在該平臺上的駕駛時(shí)長均超過500 h。為了驗(yàn)證類人縱向決策模型的適應(yīng)能力,在干燥土路和泥濘土路工況下進(jìn)行了相同的試驗(yàn)。
試驗(yàn)履帶平臺的操控駕駛儀如圖5所示,該駕駛儀為北京理工大學(xué)智能車研究所自主設(shè)計(jì)研制,駕駛員通過推動(dòng)速度控制推桿向平臺控制器下發(fā)期望車速,且期望車速為0~80的整數(shù)。在整車通信網(wǎng)絡(luò)中,全局時(shí)間戳由組合導(dǎo)航模塊發(fā)出,其余傳感器和運(yùn)算設(shè)備以此為基準(zhǔn)進(jìn)行時(shí)間校正從而實(shí)現(xiàn)同步存儲。整車控制器和能量控制器負(fù)責(zé)底層執(zhí)行單元并將數(shù)據(jù)發(fā)送到規(guī)劃控制工控機(jī),同時(shí)接收上層無人系統(tǒng)發(fā)送的控制指令,實(shí)現(xiàn)車輛控制。針對車輛行駛速度在30 km/h及以下的通信實(shí)時(shí)性問題,設(shè)計(jì)上層無人系統(tǒng)的數(shù)據(jù)處理周期、激光雷達(dá)和相機(jī)的采樣周期為10 Hz,組合導(dǎo)航系統(tǒng)的數(shù)據(jù)發(fā)送周期為50 Hz,底層控制器CAN網(wǎng)絡(luò)通信周期為100 Hz。
圖5 電驅(qū)動(dòng)履帶平臺遙控駕駛儀Fig.5 Remote driving controller of electric tracked platform
GMM對駕駛行的聚類分析結(jié)果主要包含駕駛意圖在車輛速度、與障礙物間距下的聯(lián)合分布概率,以及駕駛員在不同階段下的操控行為量化。針對駕駛意圖辨識,該部分分析了初始距離小于等于30 m下的加速過程以及全部的制動(dòng)過程和接近過程。圖6顯示了當(dāng)駕駛員分別處于加速、恒速行駛、制動(dòng)和緩速接近意圖時(shí)的車輛速度、與障礙物間距的概率密度分布。由此在已知平臺觀測狀態(tài)的條件下,可以估計(jì)得到HSMM中的隱藏狀態(tài)參量,從而得到在某種隱藏狀態(tài)下基于統(tǒng)計(jì)結(jié)果的期望縱向速度的轉(zhuǎn)移概率矩陣。由圖6(a)可見,駕駛員在加速階段最大期望速度和與障礙物間距直接相關(guān),當(dāng)距離大于20 m時(shí)更傾向于加速到15 km/h以上。在圖6(b)的恒速行駛過程中,駕駛員恒速行駛距離隨行駛速度而減少,即在高速時(shí)傾向于遠(yuǎn)距離制動(dòng)。在圖6(c)的制動(dòng)過程中,駕駛員表現(xiàn)出3種制動(dòng)策略,分別集中在低速近距離、寬速寬距離范圍和低速遠(yuǎn)距離,其中寬速寬距離范圍覆蓋面積最大,反映了駕駛員在該速度范圍內(nèi)的制動(dòng)習(xí)慣和履帶平臺本身的制動(dòng)響應(yīng)特性。圖6(d)反映了駕駛員在緩速接近階段將速度盡可能地控制在2~3 km/h左右,且行駛距離控制在3~4 m左右,普遍采取了較為保守的駕駛行為。
圖6 基于GMM的駕駛意圖聚類Fig.6 Cluster of driving intention based on GMM
在4個(gè)駕駛意圖中,駕駛員通過操作遙控駕駛儀將離散的期望速度下發(fā)給車輛的執(zhí)行機(jī)構(gòu)?;贕MM方法對期望速度的階躍信號差值進(jìn)行聚類,獲得駕駛員分別在加速、恒速接近、制動(dòng)和緩速靠近意圖下期望速度變化量的概率密度。由2.3節(jié)中對HSMM狀態(tài)集合Z的定義可知,Z包括了5種操控方式,但在某一駕駛意圖下并非所有操控方式均會出現(xiàn),例如加速過程中幾乎不會出現(xiàn)減速和換減速。并且在同一種意圖中,同一種操控方式可能對應(yīng)不同的控制變化量,例如在制動(dòng)過程中駕駛員傾向于使用較大的減速變化量以保障平臺安全性,然后通過較小的減速變化量縮短與障礙物之間的距離,從而提高行駛效率。
因此,使用GMM對駕駛員縱向操控行為進(jìn)行聚類,并將聚類結(jié)果賦值給對應(yīng)的HSMM顯式狀態(tài)集合Z。如圖7所示:可以得到駕駛員在加速階段的狀態(tài)集合為{2 km/h,3 km/h,4 km/h,5 km/h,0 km/h};得到駕駛員在恒速階段的狀態(tài)集合為{1 km/h,0 km/h,0 km/h,-1 km/h,0 km/h};得到駕駛員在制動(dòng)階段的狀態(tài)集合為{0 km/h, -2 km/h, -3 km/h,-4 km/h,-6 km/h};得到駕駛員在緩速接近階段的速度控制量為{0 km/h,1 km/h,0 km/h,-2 km/h,-1 km/h},以及集合中元素對應(yīng)的概率分布。駕駛員的控制行為將作為HSMM中顯式狀態(tài)參量,是量化駕駛員決策行為的重要依據(jù)。
圖7 基于GMM的駕駛員控制行為聚類Fig.7 Cluster of driver’s control behavior based on GMM
在GMM-HSMM駕駛員模型中,通過GMM對觀測向量進(jìn)行駕駛意圖辨識得到了HSMM中隱藏狀態(tài)參量,以及駕駛員在全區(qū)間縱向速度控制量的分布規(guī)律,構(gòu)成了HSMM中的顯式狀態(tài)層。為了估計(jì)HSMM中狀態(tài)的持續(xù)時(shí)間,使用高斯分布對不同速度變化量下的持續(xù)時(shí)間進(jìn)行擬合。
駕駛數(shù)據(jù)表明,熟練駕駛員在無法獲得精確環(huán)境信息與車輛狀態(tài)的情況下,依舊可以依靠對縱向加速度(推背感)的感知靈活、安全地駕駛電驅(qū)動(dòng)履帶機(jī)動(dòng)平臺。以圖8中駕駛員在加速與制動(dòng)過程中的操控結(jié)果、平臺速度與加速度變化曲線為例,從虛線標(biāo)記處可以直觀發(fā)現(xiàn),雖然駕駛員無法精確地知道平臺是否已經(jīng)達(dá)到期望速度,但是駕駛員可以通過感知加速度變化軌跡,在加速度接近零點(diǎn)時(shí)認(rèn)為平臺接近或達(dá)到期望速度,并習(xí)慣于在該狀態(tài)時(shí)進(jìn)行升速或降速操作。
圖8 平臺加速度對駕駛員縱向決策影響Fig.8 Effect of platform acceleration on the driver’s longitudinal decision-making
因此,可以利用駕駛員基于加速度感知進(jìn)行決策的這一駕駛特性,對駕駛員在某一期望速度上的持續(xù)時(shí)間進(jìn)行參數(shù)化建模,從而將該特性引入到基于GMM-HSMM的類人縱向決策系統(tǒng)中。本文使用了高斯分布擬合駕駛員在不同地面條件下的決策持續(xù)時(shí)間特征,另一方面通過擬合駕駛員在不同地面條件下的決策持續(xù)時(shí)間,使得系統(tǒng)具備了不依靠精確參數(shù)而適應(yīng)環(huán)境的能力,擬合結(jié)果如表2所示。在地面條件和速度增量均相同的情況下,初始速度越大,決策持續(xù)時(shí)間的均值和方差越低,反映了駕駛員在高速工況下對加速度變化的感知更敏銳。對于兩種地面條件,由于履帶平臺在泥濘土路上的行駛阻力增大,平臺加速性能降低,因此在泥濘土路工況下加速?zèng)Q策的持續(xù)時(shí)間的均值和方差都相對較大,而制動(dòng)決策的持續(xù)時(shí)間的均值和方差則相對較小。對于制動(dòng)過程,在泥濘土路上的持續(xù)時(shí)間只在初始速度較低的區(qū)間內(nèi)縮短比較明顯。擬合結(jié)果表明,通過駕駛員的體感特性可以有效地結(jié)合機(jī)動(dòng)平臺在多種工況下的動(dòng)力特性與決策經(jīng)驗(yàn)。該方法基于離線駕駛數(shù)據(jù),利用結(jié)構(gòu)簡練的統(tǒng)計(jì)學(xué)模型避免了對精確地面參數(shù)的需求,具有增強(qiáng)學(xué)習(xí)型模型適應(yīng)能力的巨大潛力。當(dāng)加減速變化量等于0 km/h,即當(dāng)前狀態(tài)為恒速時(shí),令恒速狀態(tài)的持續(xù)時(shí)間均值等于上一狀態(tài)持續(xù)時(shí)間的二分之一,方差與上一狀態(tài)持續(xù)時(shí)間的方差相同。
表2 持續(xù)時(shí)間高斯分布擬合結(jié)果
在學(xué)習(xí)得到GMM-HSMM類人縱向決策系統(tǒng)的參數(shù)集合后,將該方法應(yīng)用于真實(shí)越野環(huán)境進(jìn)行實(shí)車試驗(yàn)。因?yàn)樵揭碍h(huán)境的不確定性以及駕駛過程的隨機(jī)性,很難完全模仿訓(xùn)練數(shù)據(jù)集中的駕駛員操控過程。因此,選取決策時(shí)的平臺加速度值以及決策時(shí)的相對速度誤差作為評價(jià)指標(biāo),以此評估系統(tǒng)的類人屬性。圖9舉例展示了平臺在兩種地面條件且期望速度不大于20 km/h和30 km/h下的試驗(yàn)結(jié)果,可以直觀地看出,通過控制狀態(tài)持續(xù)時(shí)間大小,可以將狀態(tài)轉(zhuǎn)移時(shí)平臺加速度的絕對值限制在一個(gè)較小范圍內(nèi),同時(shí)兼顧決策發(fā)生時(shí)實(shí)際速度與期望速度的相對誤差。表3顯示了基于GMM-HSMM的類人縱向決策系統(tǒng)和熟練駕駛員在產(chǎn)生新的期望速度時(shí)加速度大小和相對速度誤差,其中相對速度誤差為當(dāng)前車速與期望速度的差值占期望速度的比例。由表3可以看出,基于GMM-HSMM的駕駛員模型可以良好地模擬駕駛員的加速度感知駕駛特性,并不依靠精確地面參數(shù)而具備對環(huán)境的適應(yīng)能力。
圖9 基于GMM-HSMM的類人縱向決策系統(tǒng)在不同地面條件下的典型試驗(yàn)結(jié)果Fig.9 The typical experimental results of GMM-HSMM-based human-like longitudinal decision-making system with different road conditions
表3 基于GMM-HSMM的類人縱向決策系統(tǒng)評估
本文基于搭建的雙側(cè)獨(dú)立電驅(qū)動(dòng)無人履帶平臺,通過采集包含駕駛員操控行為的真實(shí)駕駛數(shù)據(jù),基于電驅(qū)動(dòng)履帶平臺駕駛員對加速度的感知特性,在傳統(tǒng)的HMM中引入了持續(xù)時(shí)間特征,并利用GMM模型學(xué)習(xí)了直駛過程中的駕駛意圖與操控行為,實(shí)現(xiàn)了基于GMM-HSMM的類人縱向決策,并通過實(shí)車在不同地面條件下進(jìn)行了驗(yàn)證。得出以下主要結(jié)論:
1)針對有障礙物的直駛的過程,基于GMM對駕駛員的意圖和操控行為分別進(jìn)行聚類,得到了駕駛意圖和車速、與障礙物間距的統(tǒng)計(jì)學(xué)關(guān)系;聚類結(jié)果劃分了駕駛員在不同階段的加減速大小,為決策行為的量化提供了理論基礎(chǔ)。
2)基于GMM-HSMM的類人縱向決策模型,克服了傳統(tǒng)HMM模型對狀態(tài)觀測參量變化敏感的問題,還原了駕駛員的體感駕駛特性,從而將決策產(chǎn)生時(shí)的平臺加速度限制在一個(gè)合理的范圍內(nèi)。
3)使用高斯分布擬合了持續(xù)時(shí)間特征,通過學(xué)習(xí)在不同地面條件下的駕駛數(shù)據(jù),在不依靠精確地面參數(shù)的情況下使模型具備良好的適應(yīng)能力。