李 立,李仕琪,徐志剛,李光澤,汪貴平
(1.長(zhǎng)安大學(xué) 電子與控制工程學(xué)院,西安 710064; 2.長(zhǎng)安大學(xué) 信息工程學(xué)院,西安 710064)
車輛跟馳模型描述了單車道上相鄰兩車之間的運(yùn)動(dòng)關(guān)系,是微觀交通流仿真、道路通行能力分析、自動(dòng)駕駛算法等方面研究的基礎(chǔ)模型之一,在交通工程學(xué)理論體系中占據(jù)重要地位[1]?,F(xiàn)有跟馳模型可以分為理論驅(qū)動(dòng)模型和數(shù)據(jù)驅(qū)動(dòng)模型兩大類[2]。理論驅(qū)動(dòng)模型采用嚴(yán)格的數(shù)學(xué)表達(dá)式描述跟馳車輛的動(dòng)力學(xué)機(jī)制,具有精確的物理意義,能夠確保在合理的參數(shù)設(shè)定下具有明確穩(wěn)定的輸出,代表模型包括GM(general motor)模型、Gipps模型和IDM(intelligent driver model)模型。實(shí)際交通流中,車輛跟馳行為受駕駛風(fēng)格、交通環(huán)境、車輛類型等因素的影響呈現(xiàn)一定的隨機(jī)性和非線性。理論驅(qū)動(dòng)模型結(jié)構(gòu)相對(duì)簡(jiǎn)單,模型參數(shù)較少,使其難以描述實(shí)際復(fù)雜交通流中的車輛跟馳行為,從而導(dǎo)致對(duì)跟馳行為的預(yù)測(cè)失準(zhǔn)或仿真失真。針對(duì)這種情況,一種常見的解決方法是采用不同交通流狀態(tài)下的實(shí)測(cè)數(shù)據(jù)標(biāo)定跟馳模型,并為其設(shè)置分類應(yīng)用條件,但是交通流狀態(tài)劃分方法、跟馳模型參數(shù)標(biāo)定方法、預(yù)測(cè)結(jié)果評(píng)價(jià)指標(biāo)等因素均可能影響跟馳模型的應(yīng)用效果,提高模型應(yīng)用的復(fù)雜度。
與理論驅(qū)動(dòng)跟馳模型相比,近年來有較多研究采用數(shù)據(jù)驅(qū)動(dòng)的方法構(gòu)建跟馳模型。數(shù)據(jù)驅(qū)動(dòng)跟馳模型利用數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)等理論和方法,從真實(shí)車輛行駛數(shù)據(jù)中挖掘跟馳行為特征,利用模型參數(shù)多、非線性規(guī)律擬合能力強(qiáng)的特點(diǎn),學(xué)習(xí)數(shù)據(jù)中存在的復(fù)雜行為規(guī)律,使其經(jīng)常獲得比理論驅(qū)動(dòng)模型更好的跟馳行為預(yù)測(cè)效果。文獻(xiàn)[2]從模糊邏輯、人工神經(jīng)網(wǎng)絡(luò)、實(shí)例學(xué)習(xí)、支持向量回歸、深度學(xué)習(xí)等5個(gè)方面對(duì)數(shù)據(jù)驅(qū)動(dòng)跟馳模型的研究進(jìn)行了綜述。文獻(xiàn)[3]將數(shù)據(jù)驅(qū)動(dòng)跟馳模型分為基于神經(jīng)網(wǎng)絡(luò)、支持向量回歸和K近鄰等傳統(tǒng)機(jī)器學(xué)習(xí)方法的模型和基于深度學(xué)習(xí)的模型。但是,數(shù)據(jù)驅(qū)動(dòng)跟馳模型的參數(shù)連接關(guān)系缺乏明確的交通物理含義,且難以判斷模型輸入是否超出了安全駕駛閾值,這些缺陷可能影響模型預(yù)測(cè)結(jié)果可靠性并危及行車安全。通過近年來多次出現(xiàn)自動(dòng)駕駛車輛安全事故[4-5],也說明單純依靠數(shù)據(jù)驅(qū)動(dòng)方式進(jìn)行車輛跟馳行為建模和應(yīng)用存在潛在安全風(fēng)險(xiǎn)。
為了綜合利用上述兩類跟馳模型的優(yōu)點(diǎn),有學(xué)者提出了理論與數(shù)據(jù)混合驅(qū)動(dòng)的跟馳模型。文獻(xiàn)[6]采用線性函數(shù)融合了理論驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)跟馳模型,發(fā)現(xiàn)融合模型比非融合模型具有更高的跟馳行為預(yù)測(cè)精度。文獻(xiàn)[7]采用自適應(yīng)卡爾曼濾波方法組合了多種跟馳模型,找到了預(yù)測(cè)精度高的融合跟馳模型。文獻(xiàn)[8]利用最優(yōu)加權(quán)組合理論,建立IDM模型與徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)融合的跟馳模型。然而,現(xiàn)有理論與數(shù)據(jù)混合驅(qū)動(dòng)跟馳模型所采用的融合方法通常直接對(duì)兩類模型的輸出進(jìn)行線性加和,并未對(duì)兩類模型的參數(shù)和權(quán)重進(jìn)行深度融合,導(dǎo)致兩類模型的優(yōu)勢(shì)未得到充分的發(fā)揮和利用。
除了與理論驅(qū)動(dòng)跟馳模型融合之外,另一種提升數(shù)據(jù)驅(qū)動(dòng)跟馳模型表現(xiàn)的途徑在于合理增加模型變量。微觀駕駛行為可能受到周邊車輛行為、道路設(shè)施條件、車內(nèi)外交通信息等因素的影響[2],然而現(xiàn)有多數(shù)數(shù)據(jù)驅(qū)動(dòng)跟馳模型中納入的變量與理論驅(qū)動(dòng)跟馳模型類似,這可能導(dǎo)致模型欠擬合,因此有必要進(jìn)一步從車輛軌跡數(shù)據(jù)中提取更多能夠反映真實(shí)駕駛過程中駕駛?cè)擞^察信息的變量,并將其引入數(shù)據(jù)驅(qū)動(dòng)跟馳模型中[3]。
綜上,本文提出了一種基于集成學(xué)習(xí)框架的理論和數(shù)據(jù)驅(qū)動(dòng)跟馳模型融合方法。利用集成學(xué)習(xí)框架可以綜合應(yīng)用多種同質(zhì)或異質(zhì)基學(xué)習(xí)器的優(yōu)勢(shì),通過構(gòu)建多級(jí)學(xué)習(xí)器對(duì)理論和數(shù)據(jù)驅(qū)動(dòng)跟馳模型進(jìn)行組合、訓(xùn)練和應(yīng)用,提高模型的預(yù)測(cè)精度和泛化能力。同時(shí)將跟馳車輛所在隊(duì)列狀態(tài)及其周邊行駛條件因素引入數(shù)據(jù)驅(qū)動(dòng)跟馳模型中,以進(jìn)一步提升模型學(xué)習(xí)復(fù)雜交通條件下車輛跟馳行為的能力。使用真實(shí)車輛軌跡數(shù)據(jù)集對(duì)所構(gòu)建模型進(jìn)行訓(xùn)練和測(cè)試,來驗(yàn)證所提出方法的有效性。本文為復(fù)雜交通流條件下的車輛跟馳行為建模提供了新的思路,研究成果有助于提升跟馳行為預(yù)測(cè)和微觀交通仿真精度。
本文使用highD自然駕駛軌跡數(shù)據(jù)集[9]作為基礎(chǔ)數(shù)據(jù)。此數(shù)據(jù)集由無人機(jī)在德國(guó)高速公路6個(gè)路段上空拍攝的十余個(gè)小時(shí)的視頻中提取的車輛軌跡數(shù)據(jù)組成,數(shù)據(jù)字段包括車輛經(jīng)緯度、所在車道、行駛方向、外形尺寸、類型、速度、加速度、周邊車輛編號(hào)等。數(shù)據(jù)采集地點(diǎn)為平直路段,上下游匝道距離較遠(yuǎn),因此車輛換道現(xiàn)象較少,多數(shù)車輛處于跟馳或自由行駛狀態(tài)。本文使用IDM模型作為理論驅(qū)動(dòng)跟馳模型的代表,此模型具有明確的物理意義且參數(shù)相對(duì)較少,廣泛用于多種交通狀態(tài)下的跟馳行為建模,以及網(wǎng)聯(lián)自動(dòng)駕駛控制算法中,具有較強(qiáng)的適用性及可拓展性。IDM模型變量包括跟馳車速度、與前導(dǎo)車的間距以及與前導(dǎo)車的速度差等,這些變量值可從數(shù)據(jù)集中直接計(jì)算獲得,同時(shí)模型參數(shù)將參考數(shù)據(jù)集中特定字段的統(tǒng)計(jì)值設(shè)定。數(shù)據(jù)驅(qū)動(dòng)模型中除了納入上述變量外,其他納入變量的計(jì)算相對(duì)復(fù)雜,詳述如下。
在車流密度較高的條件下,同一車道上密集接續(xù)行駛的多輛車在運(yùn)動(dòng)方式上經(jīng)常表現(xiàn)出一定的相似性,會(huì)從客觀上形成車輛隊(duì)列,如圖1所示。過往有學(xué)者[10-11]將跟馳車輛前后多車的運(yùn)動(dòng)狀態(tài)變量納入跟馳模型中。實(shí)際上,跟馳駕駛員通常難以直接準(zhǔn)確觀察和衡量前后多車運(yùn)動(dòng)參數(shù),更合理的行為模式是跟馳駕駛員根據(jù)非直接相鄰的前后車輛運(yùn)動(dòng)狀態(tài)估計(jì)其所在隊(duì)列整體運(yùn)動(dòng)狀態(tài),并基于此調(diào)整駕駛行為。因此,本文將跟馳車輛所在隊(duì)列的平均運(yùn)動(dòng)狀態(tài)納入數(shù)據(jù)驅(qū)動(dòng)跟馳模型中。本文通過設(shè)置車輛跟馳狀態(tài)判斷條件劃分車輛隊(duì)列。篩選highD數(shù)據(jù)集中換道數(shù)為0、有效跟馳時(shí)長(zhǎng)16 s以上、處于穩(wěn)定跟馳狀態(tài)即跟馳車輛速度與所在車隊(duì)的平均速度平均差值不超過2 m/s的車輛軌跡,然后根據(jù)數(shù)據(jù)字段中的跟馳車輛編號(hào)確定其是否歸入車輛隊(duì)列。一共得到1 241個(gè)車輛隊(duì)列,共7 306條車輛軌跡,所有車隊(duì)中車輛的平均間距和平均車速分別為34.304 m和21.479 m/s,平均車頭時(shí)距為1.6 s,最大加速度為5.02 m/s2,最大減速度為-4.46 m/s2。描述車輛隊(duì)列平均運(yùn)動(dòng)狀態(tài)的變量包括車輛隊(duì)列中的平均間距、平均車頭時(shí)距和平均碰撞時(shí)間(time to collision)。設(shè)定t時(shí)刻第i個(gè)隊(duì)列平均運(yùn)動(dòng)狀態(tài)變量Pi(t)為
(1)
圖1 車輛隊(duì)列及相關(guān)變量
除了本車道前后車輛的影響外,過往實(shí)證和仿真研究[12-13]均發(fā)現(xiàn)跟馳車輛相鄰車道的臨近車輛也可能影響跟馳車輛的駕駛行為,影響因素包括車輛側(cè)向間距、駕駛員換道超車意圖等。為了描述車輛隊(duì)列中跟馳車輛的周邊行駛條件,定義t時(shí)刻隊(duì)列i內(nèi)部第j輛跟馳車周圍行駛條件的變量Fi,j(t)表達(dá)式為
(2)
圖2 周邊車輛及相關(guān)變量
集成學(xué)習(xí)是一種通過構(gòu)建和結(jié)合多個(gè)學(xué)習(xí)器,降低單一學(xué)習(xí)器靈敏度不同帶來的誤差,提高模型泛化能力、魯棒性和預(yù)測(cè)精度的機(jī)器學(xué)習(xí)方法。常見的集成學(xué)習(xí)方法包括自助聚合(bagging)法、提升(boosting)法、堆疊(stacking)法。由于bagging法和boosting法主要用于同質(zhì)學(xué)習(xí)器的集成,而理論和數(shù)據(jù)驅(qū)動(dòng)跟馳模型的建模機(jī)制區(qū)別明顯,因此本文引入面向異質(zhì)學(xué)習(xí)器的stacking法,將跟馳行為建模劃分成兩個(gè)階段,針對(duì)不同階段的建模需求分別構(gòu)建一級(jí)學(xué)習(xí)器和二級(jí)學(xué)習(xí)器,對(duì)理論和數(shù)據(jù)驅(qū)動(dòng)跟馳模型進(jìn)行集成與融合。首先,將數(shù)據(jù)集劃分成3個(gè)子集,分別是訓(xùn)練集、驗(yàn)證集和測(cè)試集。接著,將理論驅(qū)動(dòng)模型和數(shù)據(jù)驅(qū)動(dòng)模型作為兩個(gè)一級(jí)學(xué)習(xí)算法,使用訓(xùn)練集對(duì)其進(jìn)行訓(xùn)練,即標(biāo)定理論驅(qū)動(dòng)模型的參數(shù)和訓(xùn)練數(shù)據(jù)驅(qū)動(dòng)模型的網(wǎng)絡(luò)權(quán)重,構(gòu)成一級(jí)學(xué)習(xí)器。然后,使用驗(yàn)證集作為一級(jí)學(xué)習(xí)器的輸入,將獲得的輸出與驗(yàn)證集中的數(shù)據(jù)標(biāo)簽組合,生成一個(gè)新的數(shù)據(jù)集。接著,使用新數(shù)據(jù)集訓(xùn)練二級(jí)學(xué)習(xí)算法,獲得二級(jí)學(xué)習(xí)器的網(wǎng)絡(luò)權(quán)重和模型參數(shù)。最后,將測(cè)試集作為訓(xùn)練后的一級(jí)和二級(jí)學(xué)習(xí)器的輸入,對(duì)比測(cè)試集成跟馳模型的預(yù)測(cè)效果。此方法的偽代碼如下所示。流程如圖3所示。
圖3 集成學(xué)習(xí)框架下的跟馳行為建模方法
定義:數(shù)據(jù)集Dr={(xr,m,yr,m)}(r=1~3),其中D1、D2和D3分別為訓(xùn)練集、驗(yàn)證集和測(cè)試集,樣本編號(hào)m=1~Mr,其中M1、M2和M3分別為子集D1、D2和D3的樣本數(shù)量,xr,m和yr,m分別為不同子集中樣本的數(shù)值與標(biāo)簽;新的訓(xùn)練集D′2=?;一級(jí)學(xué)習(xí)算法ζ1、ζ2,一級(jí)學(xué)習(xí)器θ1、θ2;二級(jí)學(xué)習(xí)算法μ,二級(jí)學(xué)習(xí)器β。
步驟:
forq=1,2 do:
訓(xùn)練θq:θq=ζq(D1)
end for
form=1,…,M2do:
forq=1,2 do:
end for
end for
訓(xùn)練β:β=μ(D′2)
輸出:集成模型H(x3m):H(x3m)=β(θ1(x3,m),θ2(x3,m))
其中,一級(jí)學(xué)習(xí)算法的設(shè)置詳見2.2節(jié)和2.3節(jié)。為了對(duì)一級(jí)學(xué)習(xí)器的輸出特征進(jìn)行再學(xué)習(xí),在二級(jí)學(xué)習(xí)算法中可以采用線性或非線性方法對(duì)一級(jí)學(xué)習(xí)器的輸出進(jìn)行再學(xué)習(xí)。本文選擇了表1所示的11種線性和非線性方法作為二級(jí)學(xué)習(xí)算法,將通過對(duì)比測(cè)試選擇性能最佳的二級(jí)學(xué)習(xí)算法。
表1 二級(jí)學(xué)習(xí)算法分類
本文選擇IDM模型作為stacking集成學(xué)習(xí)框架下的一級(jí)學(xué)習(xí)算法之一。IDM模型描述了跟馳車的加速度與速度、與前導(dǎo)車的間距以及速度差的關(guān)系。將IDM模型應(yīng)用于本文研究場(chǎng)景中,可得t時(shí)刻隊(duì)列i內(nèi)部第j輛跟馳車的加速度為
(3)
式(3)的前半部分為第j輛跟馳車的自由加速度,其與最大加速度amax、期望速度ve以及t時(shí)刻車速vi,j(t)有關(guān),其中δ為加速度指數(shù)。式(3)的后半部分為跟馳車的減速策略,當(dāng)跟馳車與前導(dǎo)車間距過小時(shí),該策略被觸發(fā),其中di,j,j-1(t)為t時(shí)刻第j輛跟馳車與其前導(dǎo)車之間的距離,d*(t)為t時(shí)刻的期望最小間距,可表示為
(4)
式中:hσ為安全車頭時(shí)距,dmin為擁堵間距,b為駕駛員期望減速度,Δvi,j,j-1(t)為t時(shí)刻第j輛跟馳車與其前導(dǎo)車之間的速度差。參考1.2節(jié)所述所納入車輛運(yùn)動(dòng)狀態(tài)信息。其中,amax為5 m/s2,ve為30 m/s,δ為4,hσ為1.5 s,dmin為2 m,b為4.5 m/s2。
由于跟馳駕駛員往往依賴歷史駕駛行為和過去一段時(shí)間內(nèi)的交通狀態(tài)進(jìn)行行駛決策,即其決策行為存在記憶效應(yīng),因此本文選擇長(zhǎng)短時(shí)記憶(long-short term memory,LSTM)網(wǎng)絡(luò)[24]和門控循環(huán)單元(gate recurrent unit,GRU)網(wǎng)絡(luò)[25]對(duì)跟馳行為進(jìn)行建模,并將其作為stacking集成學(xué)習(xí)框架下的另一種一級(jí)學(xué)習(xí)算法。LSTM網(wǎng)絡(luò)在其單元之間傳遞信息時(shí),分別使用單元狀態(tài)和隱藏狀態(tài)存儲(chǔ)長(zhǎng)期記憶和短期記憶。GRU網(wǎng)絡(luò)可看作是LSTM網(wǎng)絡(luò)的一種變體,其結(jié)構(gòu)比LSTM網(wǎng)絡(luò)簡(jiǎn)單,不包含單元狀態(tài),使用隱藏狀態(tài)傳遞信息。圖4所示為數(shù)據(jù)驅(qū)動(dòng)跟馳模型的結(jié)構(gòu)。模型訓(xùn)練中采用均方誤差(mean-square error,MSE)作為回歸損失函數(shù),Sigmoid作為激活函數(shù),Adam作為優(yōu)化算法。
圖4 數(shù)據(jù)驅(qū)動(dòng)跟馳模型的結(jié)構(gòu)
定義t時(shí)刻影響第i個(gè)車輛隊(duì)列中第j輛跟馳車輛行為的因素組合Wi,j(t)為
Wi,j(t)=[Pi(t),Fi,j(t),Gi,j-1,j(t)]
(5)
式中:Pi(t)為車輛隊(duì)列影響因素(見式(1)),Fi,j(t)為周圍駕駛環(huán)境影響因素(見式(2)),Gi,j-1,j(t)為第j輛車跟馳車與其前導(dǎo)車之間的時(shí)空關(guān)系,定義為
Gi,j-1,j(t)=[di,j-1,j(t),Δvi,j-1,j(t),vi,j(t),ai,j(t)]
(6)
Wi,j(t-NT)]
(7)
式中:N為所分析歷史時(shí)段內(nèi)時(shí)間節(jié)點(diǎn)數(shù)量,T為此時(shí)段內(nèi)相鄰時(shí)間節(jié)點(diǎn)的間隔,s為此時(shí)段內(nèi)第s個(gè)歷史時(shí)刻。
使用3種評(píng)價(jià)指標(biāo)測(cè)試所構(gòu)建跟馳模型的性能,分別是對(duì)稱平均絕對(duì)百分比誤差(symmetric mean absolute percentage error,SMAPE)、平均絕對(duì)誤差(mean absolute error,MAE)和平均絕對(duì)相對(duì)誤差(mean absolute relative error,MARE),這些指標(biāo)常用與評(píng)價(jià)跟馳模型對(duì)實(shí)際車輛軌跡的預(yù)測(cè)精度[3,6,26],分別為
(8)
(9)
(10)
通過兩組試驗(yàn)確定作為一級(jí)學(xué)習(xí)器的數(shù)據(jù)驅(qū)動(dòng)跟馳模型的網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練過程的學(xué)習(xí)率,并采用一組試驗(yàn)對(duì)比理論驅(qū)動(dòng)模型和數(shù)據(jù)驅(qū)動(dòng)模型的性能。
1)網(wǎng)絡(luò)結(jié)構(gòu)。LSTM網(wǎng)絡(luò)和GRU網(wǎng)絡(luò)包含有輸入層、隱藏層和輸出層,其中輸入層和輸出層的維數(shù)分別根據(jù)跟馳模型中所納入的影響因素?cái)?shù)量和模型輸出的預(yù)測(cè)值數(shù)量確定。本文為這兩種網(wǎng)絡(luò)設(shè)置了單一隱藏層,以避免傳統(tǒng)遞歸式結(jié)構(gòu)網(wǎng)絡(luò)可能發(fā)生的梯度彌散問題。表2報(bào)告了采用不同隱藏層神經(jīng)元數(shù)量的數(shù)據(jù)驅(qū)動(dòng)跟馳模型性能,可以發(fā)現(xiàn),采用結(jié)構(gòu)1、2、3的模型隱藏層神經(jīng)元個(gè)數(shù)過少,導(dǎo)致學(xué)習(xí)效果不如采用結(jié)構(gòu)4、5的模型。由于增加隱藏層神經(jīng)元個(gè)數(shù)會(huì)延長(zhǎng)模型解算時(shí)間,綜合對(duì)比采用結(jié)構(gòu)4、5、6的模型性能,最終選定結(jié)構(gòu)5為最優(yōu)模型結(jié)構(gòu)。
表2 不同結(jié)構(gòu)數(shù)據(jù)驅(qū)動(dòng)模型性能
2)學(xué)習(xí)率。學(xué)習(xí)率是訓(xùn)練數(shù)據(jù)驅(qū)動(dòng)模型的重要參數(shù)。表3中報(bào)告了不同學(xué)習(xí)率下具有最優(yōu)結(jié)構(gòu)的模型的性能。可以發(fā)現(xiàn),由于學(xué)習(xí)率過高使得算法很難收斂到最低點(diǎn),采用學(xué)習(xí)率1、2的模型誤差較大。與之相比,采用學(xué)習(xí)率3、4的模型誤差明顯降低。由于采用學(xué)習(xí)率4的模型訓(xùn)練時(shí)間較久,且學(xué)習(xí)效果與采用學(xué)習(xí)率3的模型接近,因此選擇學(xué)習(xí)率3為最優(yōu)學(xué)習(xí)率。
表3 不同學(xué)習(xí)率下數(shù)據(jù)驅(qū)動(dòng)模型性能
3)對(duì)比模型。上述試驗(yàn)結(jié)果表明,使用網(wǎng)絡(luò)結(jié)構(gòu)5且設(shè)置學(xué)習(xí)率為0.001時(shí),數(shù)據(jù)驅(qū)動(dòng)模型能夠獲得最佳跟馳行為預(yù)測(cè)精度。采用相同的數(shù)據(jù)對(duì)IDM模型進(jìn)行標(biāo)定和測(cè)試,發(fā)現(xiàn)IDM模型的跟馳行為預(yù)測(cè)精度為SMAPE=0.740%,MAE=0.427,MARE=0.020。對(duì)比二者模型性能可以發(fā)現(xiàn),具有最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)和學(xué)習(xí)率的數(shù)據(jù)驅(qū)動(dòng)跟馳模型的預(yù)測(cè)精度優(yōu)于IDM模型。
對(duì)于在stacking集成學(xué)習(xí)框架下獲得的兩個(gè)融合跟馳模型IDM-LSTM-stacking和IDM-GRU-stacking,表4給出了采用均值法、泰爾森估算和隨機(jī)采樣一致性線性回歸3種線性二級(jí)學(xué)習(xí)算法后的模型預(yù)測(cè)結(jié)果。為了便于對(duì)比,表中同時(shí)給出了單獨(dú)使用IDM模型和數(shù)據(jù)驅(qū)動(dòng)模型的預(yù)測(cè)結(jié)果??梢园l(fā)現(xiàn),IDM模型的預(yù)測(cè)誤差大于GRU和LSTM模型的預(yù)測(cè)誤差,而IDM-LSTM-stacking和IDM-GRU-stacking模型的誤差在理論驅(qū)動(dòng)模型和數(shù)據(jù)驅(qū)動(dòng)模型之間。這說明采用表中3種線性二級(jí)學(xué)習(xí)算法的模型并未能很好地對(duì)一級(jí)學(xué)習(xí)器的輸出特征進(jìn)行再學(xué)習(xí),而其效果類似于對(duì)理論和數(shù)據(jù)驅(qū)動(dòng)模型的輸出進(jìn)行了折中。
表4 3類跟馳模型性能
表5中給出了采用表1中8種非線性方法作為二級(jí)學(xué)習(xí)算法的融合跟馳模型的預(yù)測(cè)精度。對(duì)比表4中的結(jié)果可以發(fā)現(xiàn),對(duì)于同樣的輸入數(shù)據(jù),采用非線性二級(jí)學(xué)習(xí)算法的模型預(yù)測(cè)精度明顯比IDM模型和采用線性二級(jí)學(xué)習(xí)算法的模型更高,也高于單純的數(shù)據(jù)驅(qū)動(dòng)模型。對(duì)于IDM-LSTM-stacking模型來說,采用非線性方法6即GBRT回歸法的模型預(yù)測(cè)精度最高;對(duì)于IDM-GRU-stacking模型來說,采用非線性方法4即隨機(jī)森林回歸法的模型預(yù)測(cè)精度最高。上述結(jié)果說明,兩種一級(jí)學(xué)習(xí)器即理論驅(qū)動(dòng)跟馳模型和數(shù)據(jù)驅(qū)動(dòng)跟馳模型的輸出特征存在著復(fù)雜的非線性關(guān)系,需要采用非線性二級(jí)學(xué)習(xí)算法才能更好地對(duì)它們的輸出特征進(jìn)行再學(xué)習(xí)。
表5 采用非線性二級(jí)學(xué)習(xí)算法的跟馳模型性能
圖5對(duì)比了IDM模型、GRU模型、LSTM模型、采用隨機(jī)森林回歸方法的IDM-GRU-stacking模型和采用GBRT回歸方法的IDM-LSTM-stacking模型預(yù)測(cè)的車輛軌跡和真實(shí)車輛的軌跡??梢园l(fā)現(xiàn),采用隨機(jī)森林回歸方法的IDM-GRU-stacking模型和采用GBRT回歸方法的IDM-LSTM-stacking模型比IDM模型、GRU模型和LSTM模型的軌跡預(yù)測(cè)精度高。
為了對(duì)比驗(yàn)證所構(gòu)建集成學(xué)習(xí)跟馳模型穩(wěn)定性及其對(duì)宏觀交通流狀態(tài)的影響,設(shè)計(jì)了如下數(shù)值模擬實(shí)驗(yàn)。假定由100輛跟馳車組成的車隊(duì)在長(zhǎng)度為2 000 m的三車道環(huán)路的中間車道上行駛,三車道環(huán)路的左右兩側(cè)車道交通流隨機(jī)生成。跟馳車隊(duì)的初始狀態(tài)為穩(wěn)定均衡狀態(tài),即車輛等間距分布,任意兩車初始車頭間距為20 m,所有車輛的車身長(zhǎng)度為5 m,初始速度21.466 m/s,初始加速度為0 m/s2,其他仿真條件參考文中理論和數(shù)據(jù)驅(qū)動(dòng)跟馳模型設(shè)置。實(shí)驗(yàn)中,在t=300 s時(shí)向第一輛車施加擾動(dòng),令該車速度降為初始速度的一半即10.733 m/s,同時(shí)位置向前移動(dòng)14 m。
圖6為數(shù)值模擬實(shí)驗(yàn)結(jié)果,圖中第一列為各模型輸出的車隊(duì)行駛軌跡,此列各子圖中豎線標(biāo)記出擾動(dòng)的施加時(shí)刻,第二列為各模型輸出的車速變化熱力圖。從圖6中可以看出,施加擾動(dòng)后GRU模型輸出的跟馳車隊(duì)行駛軌跡出現(xiàn)了明顯紊亂,每輛車的速度隨時(shí)間變化出現(xiàn)了顯著波動(dòng),說明此跟馳模型的穩(wěn)定性不佳;與GRU模型相比,IDM模型和LSTM模型輸出的速度值雖然存在周期性波動(dòng),但是各車速度變化幅度相對(duì)較小,說明其穩(wěn)定性優(yōu)于GRU模型;與上述3個(gè)模型相比,施加擾動(dòng)后IDM-LSTM-stacking模型和IDM-GRU-stacking輸出的跟馳車隊(duì)行駛軌跡更為平滑,且每輛車的速度并未呈現(xiàn)出周期性波動(dòng),其中IDM-GRU-stacking模型輸出的各車速度雖然在個(gè)別時(shí)間點(diǎn)上會(huì)發(fā)生較大變化,但是速度波動(dòng)能夠很快平抑,而IDM-LSTM-stacking模型輸出的速度波動(dòng)隨著時(shí)間變化逐步消失,車隊(duì)恢復(fù)到穩(wěn)定跟馳狀態(tài),即車隊(duì)內(nèi)車輛速度與車隊(duì)平均速度的平均差值維持在0.6 m/s以內(nèi)。
圖6 環(huán)路仿真實(shí)驗(yàn)結(jié)果
1)為了提高考慮車輛隊(duì)列和周邊車輛干擾條件下車輛跟馳行為預(yù)測(cè)精度,提出了一種stacking集成學(xué)習(xí)框架下的跟馳模型融合方法,將代表理論驅(qū)動(dòng)的IDM跟馳模型和數(shù)據(jù)驅(qū)動(dòng)的LSTM和GRU跟馳模型作為一級(jí)學(xué)習(xí)算法,再使用特定的二級(jí)學(xué)習(xí)算法對(duì)一級(jí)學(xué)習(xí)器的輸出特征進(jìn)行再學(xué)習(xí),構(gòu)建出融合跟馳模型IDM-LSTM-stacking模型和IDM-GRU-stacking模型。
2)基于實(shí)測(cè)數(shù)據(jù)的模型性能測(cè)試結(jié)果表明,考慮了車輛隊(duì)列和周圍駕駛條件因素的LSTM和GRU跟馳模型比IDM模型的預(yù)測(cè)精度高;采用非線性二級(jí)學(xué)習(xí)算法的融合跟馳模型的預(yù)測(cè)精度高于采用線性二級(jí)學(xué)習(xí)算法的融合模型以及數(shù)據(jù)驅(qū)動(dòng)模型。其中,采用GBRT回歸的IDM-LSTM-stacking模型和采用隨機(jī)森林回歸的IDM-GRU-stacking模型能夠獲得最高的預(yù)測(cè)精度?;跀?shù)值仿真的模型穩(wěn)定性測(cè)試結(jié)果表明,施加擾動(dòng)后IDM模型和LSTM模型的穩(wěn)定性優(yōu)于GRU模型,IDM-LSTM-stacking模型和IDM-GRU-stacking模型的穩(wěn)定性優(yōu)于IDM模型、LSTM模型和GRU模型。
3)除了本文所考慮的因素以外,車輛跟馳行為還可能受到包括駕駛員心理在內(nèi)的其他因素的影響,后續(xù)研究中可進(jìn)一步將其納入跟馳模型中,另外本文所提出的集成學(xué)習(xí)方法也可應(yīng)用于其他微觀駕駛行為建模中,以提高復(fù)雜交通條件下的車輛軌跡預(yù)測(cè)精度和微觀交通流仿真精度。