王 方,王曉原,,劉振雪,王建強(qiáng),孔 棟,王云云
1.山東理工大學(xué) 交通與車(chē)輛工程學(xué)院 智能交通研究所,山東 淄博 255049
2.清華大學(xué) 汽車(chē)安全與節(jié)能?chē)?guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100084
隨著交通運(yùn)輸業(yè)的快速發(fā)展,汽車(chē)保有量迅猛增加,道路系統(tǒng)中的人-車(chē)-環(huán)境矛盾日益突出,交通安全問(wèn)題日趨嚴(yán)重。其中,車(chē)道變換是影響交通安全的主要因素之一,而車(chē)道選擇是車(chē)道變換的重要部分,需要在瞬間內(nèi)綜合分析各種信息、考慮多種因素的影響,車(chē)道選擇的合理性直接關(guān)系到駕駛過(guò)程的安全與否。物聯(lián)網(wǎng)技術(shù)能夠?qū)崿F(xiàn)人-車(chē)-環(huán)境多源信息的采集和共享,使駕駛員充分利用互聯(lián)網(wǎng)技術(shù)了解和掌握其認(rèn)知能力所達(dá)之外有關(guān)周?chē)h(huán)境的有用信息,特別是涉及興趣感應(yīng)區(qū)車(chē)輛編組和交通實(shí)體的重要信息元素,可以為駕駛員的車(chē)道選擇過(guò)程提供決策依據(jù),提高駕駛員及車(chē)輛的主動(dòng)安全。
關(guān)于換道模型的研究,文獻(xiàn)[1]建立了在有交通信號(hào)控制、障礙物或是重型車(chē)輛等交通情況下的換道模型。文獻(xiàn)[2]把車(chē)道變換分成任意性換道和強(qiáng)制性換道兩種類(lèi)型。文獻(xiàn)[3-4]開(kāi)發(fā)了一個(gè)基于模糊邏輯的英國(guó)高速公路交通流仿真模型,并將換道分為向左換道和向右換道兩種情況。文獻(xiàn)[5]提出了一個(gè)基于人車(chē)單元智能仿真的SITRAS模型。文獻(xiàn)[6]通過(guò)分析駕駛員的心理-物理特性,建立了考慮駕駛傾向性時(shí)變規(guī)律的車(chē)道變換模型。汽車(chē)的駕駛過(guò)程本質(zhì)上是一個(gè)動(dòng)態(tài)博弈的過(guò)程,文獻(xiàn)[7]提出了一種基于Stackelberg博弈理論的自主性車(chē)道變換模型,研究了目標(biāo)車(chē)與目標(biāo)車(chē)道后隨車(chē)的換道博弈過(guò)程。文獻(xiàn)[8]運(yùn)用博弈論方法將高速公路駛?cè)朐训缆范螀R入車(chē)輛及直行穿越車(chē)輛的相互作用解析為二人非零和非合作博弈,博弈雙方通過(guò)估計(jì)對(duì)方車(chē)輛駕駛員將要選取的行動(dòng)而采取最優(yōu)行動(dòng)策略。文獻(xiàn)[9]基于對(duì)車(chē)輛換道行為的分析,以速度期望與安全期望的值作為駕駛員不同行為決策的依據(jù),建立了基于動(dòng)態(tài)重復(fù)博弈的車(chē)道變換模型。文獻(xiàn)[10]建立了基于完全信息和不完全信息的二人非零和非合作博弈換道模型,通過(guò)分析目標(biāo)車(chē)與目標(biāo)車(chē)道后車(chē)的戰(zhàn)略空間與收益函數(shù),求解雙方的最優(yōu)反應(yīng)策略。文獻(xiàn)[11]探討了換道臨界沖突點(diǎn)處換道車(chē)與目標(biāo)車(chē)道后車(chē)之間的非合作混合戰(zhàn)略博弈,深入分析了博弈雙方的收益及博弈存在的納什均衡。文獻(xiàn)[12]基于滾動(dòng)時(shí)域的最優(yōu)控制和動(dòng)態(tài)博弈理論提出了一種將車(chē)道變換和車(chē)輛跟馳統(tǒng)一控制的預(yù)測(cè)方法。通過(guò)預(yù)測(cè),確定車(chē)輛的離散期望車(chē)道序列和連續(xù)加速度,最小化其支付函數(shù),以尋求納什均衡解。
以往基于博弈理論的換道模型主要以換道車(chē)輛與目標(biāo)車(chē)道后車(chē)為研究對(duì)象構(gòu)建二人靜態(tài)博弈模型,大多缺乏對(duì)駕駛傾向性及車(chē)輛編組關(guān)系、交通實(shí)體特征等時(shí)變動(dòng)態(tài)因素的考慮,因而不能準(zhǔn)確反映道路上行駛車(chē)輛間的相互作用過(guò)程。為了準(zhǔn)確反映道路上車(chē)輛駕駛員的車(chē)道選擇行為,本文在車(chē)聯(lián)網(wǎng)背景下,以城市快速路基本路段上的集群車(chē)輛為研究對(duì)象,分析博弈各方所組成的車(chē)輛集群態(tài)勢(shì),并基于完全信息構(gòu)建多人動(dòng)態(tài)博弈車(chē)道選擇模型。在此基礎(chǔ)上,計(jì)算各駕駛員在不同車(chē)道選擇策略下的收益,確定集群車(chē)輛在換道博弈過(guò)程中的子博弈精煉納什均衡解,得到駕駛員的最優(yōu)車(chē)道選擇策略。
交通態(tài)勢(shì)指駕駛員興趣感應(yīng)區(qū)(指對(duì)車(chē)輛安全影響較大,駕駛員注意力分配較多的區(qū)域)內(nèi)所有交通實(shí)體部署和行為所構(gòu)成的狀態(tài)和形勢(shì),包含交通實(shí)體所能感知到的所有信息[13-14]。本文重點(diǎn)以駕駛員興趣感應(yīng)區(qū)域內(nèi)的車(chē)輛集群態(tài)勢(shì)(車(chē)輛編組關(guān)系和交通實(shí)體特征)為例,進(jìn)行駕駛員車(chē)道選擇行為的研究。
2.1.1 車(chē)輛集群場(chǎng)景界定
本文以三車(chē)道場(chǎng)景為例,如圖1所示,以目標(biāo)車(chē)n1為研究主體(若不加特殊說(shuō)明,本文以n1位于中間車(chē)道最復(fù)雜的情況為例進(jìn)行說(shuō)明),根據(jù)n1前保險(xiǎn)杠所在的位置將其興趣感應(yīng)區(qū)劃分為左前側(cè)、左后側(cè)、前側(cè)、后側(cè)、右前側(cè)、右后側(cè)各分區(qū)域。相應(yīng)各分區(qū)域內(nèi)的車(chē)輛分別記為左前車(chē)n2、左后車(chē)n3、前車(chē)n4、后車(chē)n5、右前車(chē)n6、右后車(chē)n7。
2.1.2 車(chē)輛集群態(tài)勢(shì)的數(shù)學(xué)表達(dá)
車(chē)輛集群態(tài)勢(shì)客觀存在于整個(gè)交通環(huán)境中,并隨著各交通要素的動(dòng)態(tài)變化而變化。借用物理學(xué)中“力”的定義,可以分析編組關(guān)系中車(chē)輛間的相互作用。故目標(biāo)車(chē)所在的車(chē)輛集群態(tài)勢(shì)可以用力的集合抽象表示,若某一區(qū)域車(chē)輛對(duì)目標(biāo)車(chē)選擇此區(qū)域所在的車(chē)道起到了正面影響,那么該區(qū)域車(chē)輛對(duì)目標(biāo)車(chē)施加的力為引力,反之為斥力。
圖1 三車(chē)道下目標(biāo)車(chē)所處車(chē)輛集群態(tài)勢(shì)圖
表1 不同作用力所對(duì)應(yīng)的作用粒度
綜合考慮編組關(guān)系內(nèi)車(chē)輛的車(chē)型(小、中、大)、相對(duì)距離(危險(xiǎn)、近、中、遠(yuǎn))、相對(duì)速度(負(fù)大、負(fù)小、零、正小、正大)及目標(biāo)車(chē)駕駛員的傾向性類(lèi)型(激進(jìn)型、普通型、保守型),利用模糊邏輯方法獲取各分區(qū)域車(chē)輛對(duì)目標(biāo)車(chē)的作用力,力的大小用作用粒度描述:斥力最大的作用粒度用?1表示,引力最大的作用粒度用1表示。不同力的作用粒度用其所在區(qū)間的一個(gè)實(shí)數(shù)表示,如表1所示。其中一條典型的語(yǔ)言模糊規(guī)則如下:若目標(biāo)車(chē)為小型車(chē)、左后車(chē)為小型車(chē)、目標(biāo)車(chē)與左后車(chē)的相對(duì)距離為遠(yuǎn)且相對(duì)速度為正大,則左后車(chē)對(duì)目標(biāo)車(chē)的作用粒度為1。限于文章篇幅,其他模糊推理規(guī)則不再贅述。
在模糊邏輯方法[15]中,模糊變量及相應(yīng)的模糊集合分別為:(1)目標(biāo)車(chē)與周?chē)?chē)輛的相對(duì)距離Δdi,i=2,3,4,5,6,7,其可能的模糊集合:{危險(xiǎn),近,中,遠(yuǎn)};(2)目標(biāo)車(chē)與周?chē)?chē)輛的相對(duì)速度Δvi,i=2,3,4,5,6,7,其可能的模糊集合:{負(fù)大,負(fù)小,零,正小,正大}。相對(duì)距離及相對(duì)速度的隸屬度分別如圖2和圖3所示。
圖2 相對(duì)距離的三角形隸屬度函數(shù)圖
圖3 相對(duì)速度的隸屬度函數(shù)曲線
圖中,D1、D2、D3、D4以及V1、V2、V3、V4分別是論域中模糊子集的邊界值。由于駕駛員對(duì)距離的感受隨速度的變化而變化,故在相對(duì)距離的隸屬函數(shù)中會(huì)含有相對(duì)速度參數(shù)的項(xiàng)。以目標(biāo)車(chē)與其左后車(chē)為研究對(duì)象對(duì)論域中模糊子集邊界值的計(jì)算進(jìn)行討論。
圖2中,從不安全到安全程度一般的門(mén)限值D1由下式給定:
式(1)中,Bmax為車(chē)輛的最大加速度,τ為左后車(chē)的反應(yīng)時(shí)間,λ0為待定參數(shù)。式(1)是當(dāng)目標(biāo)車(chē)在換道過(guò)程中因前方出現(xiàn)特殊事件而緊急剎車(chē)時(shí)左后車(chē)以相同加速度剎車(chē)而避免碰撞的最小間距。
從安全程度一般到安全的門(mén)限值為:
其中:
式(2)中,a為目標(biāo)車(chē)輛的加速度,λ1、λ2為待定參數(shù)。圖2中,D2和D3是D1和D4的中間值。
為了保證車(chē)輛行駛安全,當(dāng)車(chē)輛間相對(duì)距離為“危險(xiǎn)”邊界值D1時(shí),車(chē)輛間相對(duì)速度應(yīng)在合適的范圍內(nèi)。當(dāng)目標(biāo)車(chē)速度小于左后車(chē)速度時(shí),可以用TTC(Time To Collision)作為評(píng)價(jià)碰撞危險(xiǎn)發(fā)生的指標(biāo),由式(4)表示:
根據(jù)文獻(xiàn)[16-17]中統(tǒng)計(jì)的駕駛員換道數(shù)據(jù)及駕駛員主觀可接受的安全極限,將TTC統(tǒng)計(jì)數(shù)據(jù)的5%分位數(shù)(2.6 s)和25%分位數(shù)(5 s)作為換道安全性的分類(lèi)邊界值。因此,圖3中,相對(duì)速度從“負(fù)大”到“負(fù)小”的門(mén)限值V1可由式(5)給定;相對(duì)速度從“負(fù)小”到“零”的門(mén)限值V2可由式(6)給定:
其中,V3和V4是V2和V1的相反數(shù)。
利用上述方法即可獲得興趣感應(yīng)區(qū)域內(nèi)各車(chē)輛所受的作用力大小。因此,對(duì)位于中間車(chē)道的車(chē)輛,如n1所處的車(chē)輛集群態(tài)勢(shì)可表示為F10=[前車(chē)作用力,后車(chē)作用力,左前車(chē)作用力,左后車(chē)作用力,右前車(chē)作用力,右后車(chē)作用力。對(duì)位于左車(chē)道的車(chē)輛,如n3所處的車(chē)輛集群態(tài)勢(shì)可表示為F30=[前車(chē)作用力,后車(chē)作用力,鄰車(chē)道右前車(chē)作用力,鄰車(chē)道右后車(chē)作用力,隔車(chē)道右前車(chē)作用力,隔車(chē)道右后車(chē)作用力。對(duì)位于右車(chē)道的車(chē)輛,如n7所處的車(chē)輛集群態(tài)勢(shì)可表示為F70=[前車(chē)作用力,后車(chē)作用力,鄰車(chē)道左前車(chē)作用力,鄰車(chē)道左后車(chē)作用力,隔車(chē)道左前車(chē)作用力,隔車(chē)道左后車(chē)作用力
博弈論可以為涉及多個(gè)參與人且各參與人之間的決策會(huì)相互影響的局勢(shì)分析提供數(shù)學(xué)模型。在多車(chē)道道路上行駛時(shí),駕駛員都有保持車(chē)道或者變換車(chē)道(向左換道或向右換道)的選擇,駕駛員通過(guò)分析集群態(tài)勢(shì)中各分區(qū)域車(chē)輛對(duì)自身行車(chē)安全及利益的影響,并根據(jù)當(dāng)前所駕駛車(chē)輛及周?chē)?chē)輛的行駛狀態(tài),選擇最優(yōu)行駛車(chē)道。駕駛員的車(chē)道選擇是一個(gè)利益(如行車(chē)安全、效率、舒適性等)追求的過(guò)程,需要在有相互影響的車(chē)輛集群態(tài)勢(shì)中做出復(fù)雜的思維決策,因而可以借助多人動(dòng)態(tài)博弈的方法描述駕駛員的車(chē)道選擇行為。但是,在應(yīng)用該方法做分析時(shí),由于各駕駛員需要同時(shí)考慮多個(gè)駕駛員行動(dòng)選擇的影響,且隨著參與人數(shù)量的增多,策略組合也增多,致使動(dòng)態(tài)博弈樹(shù)過(guò)于龐大、博弈過(guò)程及求解過(guò)于復(fù)雜。因此,為簡(jiǎn)化博弈過(guò)程及模型求解,本文將多人動(dòng)態(tài)博弈分解為多個(gè)二人動(dòng)態(tài)博弈。
在三車(chē)道場(chǎng)景下(如圖1所示),以n1為研究對(duì)象,構(gòu)建n1分別與 n2、n3、n4、n5、n6、n7的二人動(dòng)態(tài)博弈。根據(jù)車(chē)聯(lián)網(wǎng)條件下得到的車(chē)輛位置、速度、車(chē)型、加減速頻率等信息,參考文獻(xiàn)[18-19]的方法辨識(shí)駕駛員傾向性。博弈中,駕駛員位于不同車(chē)道時(shí)行動(dòng)選擇不同,其中,中間車(chē)道:向左換道(Change Left,CL)、保持車(chē)道(No Changing,NC)和向右換道(Change Right,CR),即分別對(duì)應(yīng)著選擇左側(cè)車(chē)道、選擇當(dāng)前所在車(chē)道和選擇右側(cè)車(chē)道的行動(dòng)選擇;左側(cè)車(chē)道:NC和CR,即分別對(duì)應(yīng)著選擇當(dāng)前所在車(chē)道和選擇右側(cè)車(chē)道的行動(dòng)選擇;右側(cè)車(chē)道:CL和NC,即分別對(duì)應(yīng)著選擇左側(cè)車(chē)道和選擇當(dāng)前所在車(chē)道的行動(dòng)選擇。因此,各博弈方的行動(dòng)空間為,其中,為參與人ni選取的行動(dòng),分別對(duì)應(yīng)CL、NC和CR的行動(dòng)選擇。二人有限戰(zhàn)略動(dòng)態(tài)博弈可以用博弈樹(shù)表述,以n1與n3的車(chē)道選擇博弈為例進(jìn)行說(shuō)明,如圖4所示。
在動(dòng)態(tài)博弈中,參與人的行動(dòng)順序有先后,且后行動(dòng)者可以觀察到先行動(dòng)者的選擇,本文假定目標(biāo)車(chē)駕駛員先于其后方且次于其前方車(chē)輛駕駛員做出行動(dòng)選擇。博弈第一階段,n1首先行動(dòng),且n1行動(dòng)時(shí)會(huì)考慮自身選擇對(duì)n3可能的影響,行動(dòng)空間為S1={ }CL,NC,CR。第二階段,n3觀察到n1的行動(dòng)選擇,并據(jù)此選擇自己的行動(dòng),行動(dòng)空間為S3={ }NC,C R。博弈參與人的策略一旦選定,博弈的局勢(shì)及相應(yīng)策略組合下各參與人的收益也隨之確定。以與分別表示n1選擇、ni選擇時(shí)n1與ni的收益,故n1與n3在相應(yīng)策略組合下的收益分別為與
由于駕駛員對(duì)當(dāng)前行駛狀態(tài)的滿(mǎn)意與否主要取決于駕駛員感知其所在車(chē)道對(duì)車(chē)輛作用力的大小,故各駕駛員的收益可用駕駛員執(zhí)行操作前后車(chē)輛受到其所在車(chē)道作用力的差值衡量。其中,車(chē)道作用力包括博弈車(chē)輛前方兩輛車(chē)的累積作用力(博弈車(chē)輛前車(chē)對(duì)博弈車(chē)輛的作用力及博弈車(chē)輛次前車(chē)對(duì)博弈車(chē)輛前車(chē)的作用力之和)和博弈車(chē)輛后車(chē)的作用力。考慮到位于不同區(qū)域的車(chē)輛對(duì)目標(biāo)車(chē)作用力的貢獻(xiàn)率不同,通過(guò)問(wèn)卷調(diào)查,運(yùn)用層次分析法,得到不同傾向性類(lèi)型的駕駛員感知各分區(qū)域車(chē)輛對(duì)其所受綜合作用力貢獻(xiàn)率的大小,如表2所示。表2中表示位于分區(qū)域t內(nèi)的車(chē)輛對(duì)目標(biāo)車(chē)ni所受綜合作用力的貢獻(xiàn)率,如表示目標(biāo)車(chē)位于左車(chē)道時(shí)前側(cè)區(qū)域車(chē)輛對(duì)其綜合作用力的貢獻(xiàn)率。因此,以n1為例,n1執(zhí)行操作前后所受作用力分別為F1=和故n1的駕駛收益為。其中分別表示各駕駛員執(zhí)行操作前后目標(biāo)車(chē)所在車(chē)道前側(cè)及后側(cè)區(qū)域車(chē)輛對(duì)其所受作用力的貢獻(xiàn)率與分別表示各駕駛員執(zhí)行操作前后n1所受其所在車(chē)道后側(cè)區(qū)域車(chē)輛的作用力,與分別表示各駕駛員執(zhí)行操作后n1所在車(chē)道前車(chē)n1″對(duì)n1及目標(biāo)車(chē)次前車(chē)n4″對(duì)目標(biāo)車(chē)前車(chē)的作用力。同理可計(jì)算其他車(chē)輛駕駛員的收益ΔFi=F′i-Fi。
圖4 目標(biāo)車(chē)與其左后車(chē)的車(chē)道選擇博弈
表2 不同類(lèi)型駕駛員感知各分區(qū)域車(chē)輛對(duì)目標(biāo)車(chē)綜合作用力的貢獻(xiàn)率
限于實(shí)驗(yàn)條件的影響,無(wú)法大量獲取集群車(chē)輛的運(yùn)動(dòng)特征,因此,采用NGSIM(http://ops.fhwa.dot.gov/trafficanalysistools/ngsim.htm)實(shí)測(cè)交通數(shù)據(jù)中I-80下午4:00—4:15的車(chē)輛軌跡數(shù)據(jù)集對(duì)所建模型進(jìn)行標(biāo)定。所研究路段的車(chē)道分布情況如圖5所示,其中,選取該路段中第2、3、4條車(chē)道上且車(chē)輛進(jìn)入數(shù)據(jù)采集區(qū)域時(shí)就行駛在這三條車(chē)道上的汽車(chē)為研究對(duì)象;不考慮HOV車(chē)道及其他輔助車(chē)道上的車(chē)輛(其駕駛行為不同于其他車(chē)道的車(chē)輛);不考慮連續(xù)換道的車(chē)輛(其換道更接近于強(qiáng)制性換道)。
圖5 I-80研究路段的車(chē)道分布示意圖
3.1.1 駕駛員傾向性辨識(shí)
參照文獻(xiàn)[18-19]的方法對(duì)駕駛員傾向性進(jìn)行辨識(shí)。
3.1.2 數(shù)據(jù)處理和模型標(biāo)定
根據(jù)NGSIM軌跡數(shù)據(jù)中的每條記錄并結(jié)合視頻信息,關(guān)聯(lián)查詢(xún)目標(biāo)車(chē)所在編組關(guān)系中周?chē)?chē)輛各個(gè)時(shí)刻的狀態(tài)信息,并對(duì)所得信息進(jìn)行組合,獲取車(chē)輛之間的相對(duì)距離、相對(duì)速度及各自車(chē)型等信息,得到滿(mǎn)足計(jì)算所需的微觀數(shù)據(jù)。對(duì)NGSIM數(shù)據(jù)預(yù)處理后可得的主要數(shù)據(jù)如表3所示,并分別選取激進(jìn)型、普通型和保守型駕駛員換道過(guò)程的實(shí)驗(yàn)數(shù)據(jù)(限于文章篇幅,駕駛員換道的數(shù)據(jù)不再列出),在考慮經(jīng)驗(yàn)值的基礎(chǔ)上,采用反復(fù)循環(huán)訓(xùn)練和專(zhuān)家意見(jiàn)標(biāo)定模型參數(shù)。模型中部分參數(shù)的標(biāo)定情況如表4所示。
表3 預(yù)處理后可得的主要微觀數(shù)據(jù)
表4 車(chē)道選擇模型參數(shù)標(biāo)定
由于動(dòng)態(tài)博弈中先行動(dòng)者都會(huì)考慮自身選擇對(duì)后行動(dòng)者可能的影響,因此,可以采用逆向歸納法求解動(dòng)態(tài)博弈的子博弈精煉納什均衡。該方法的思想是從博弈樹(shù)的最后一個(gè)決策結(jié)往回倒推,根據(jù)效用最大化原則,每一步剔除參與人在該決策結(jié)上的劣選擇,直到博弈開(kāi)始時(shí)參與人的第一個(gè)決策結(jié)。以n1與n3的博弈為例進(jìn)行模型求解方法的說(shuō)明。
n1與n3的博弈是一個(gè)兩階段的動(dòng)態(tài)博弈,第一階段n1行動(dòng),第二階段n3行動(dòng),且n3在行動(dòng)前觀察到n1的選擇,S1和S3分別是n1和n3的行動(dòng)空間。博弈進(jìn)入第二階段,給定n1在第一階段的選擇面臨的問(wèn)題是確定以最大化自身收益顯然n3的最優(yōu)選擇依賴(lài)于n1的選擇,則該問(wèn)題的最優(yōu)解為,即n1行動(dòng)的反應(yīng)函數(shù)。因?yàn)閰⑴c人都是理性的,故n1會(huì)預(yù)測(cè)到n3在博弈第二階段將按照的規(guī)則行動(dòng)。因此,在第一階段,n1面臨的問(wèn)題是確定以最大化自身收益
11求得該問(wèn)題的最優(yōu)解。則該博弈的子博弈精煉納什均衡為
同理,n1與 n2、n4、n5、n6、n7的子博弈精煉納什均衡亦可用逆向歸納法得到。n1最終對(duì)車(chē)道的選擇則需要通過(guò)權(quán)衡其與各分區(qū)域車(chē)輛博弈達(dá)到均衡時(shí)自己選擇不同策略的駕駛收益大小來(lái)確定。假設(shè)n1駕駛員的傾向性類(lèi)型為激進(jìn)型,n1與n2、n3、n4、n5、n6、n7二人動(dòng)態(tài)博弈中的車(chē)道選擇對(duì)策分別為NC、CL、CR、CL、NC、CR,且相應(yīng)的駕駛收益分別為以n1感知各分區(qū)域車(chē)輛貢獻(xiàn)率的大?。ㄒ?jiàn)表2)作為與各區(qū)域車(chē)輛博弈均衡時(shí)其所選策略對(duì)應(yīng)收益的權(quán)重,并對(duì)均衡時(shí)所選相同策略的加權(quán)收益求和,即其中,表示n1與ni博弈時(shí)n1采取最優(yōu)戰(zhàn)略時(shí)所得的駕駛收益。則n1選擇CL、NC、CR對(duì)策時(shí)相應(yīng)的加權(quán)收益分別為n1根據(jù)加權(quán)求和結(jié)果選取數(shù)值最大者(x=1,2,3)對(duì)應(yīng)的策略作為自己最終對(duì)車(chē)道的選擇。集群態(tài)勢(shì)中其他車(chē)輛最終對(duì)車(chē)道的選擇亦可用上述方法得到。
為了驗(yàn)證所建模型的可靠性,需要進(jìn)一步地用實(shí)測(cè)交通數(shù)據(jù)驗(yàn)證模型,用實(shí)地調(diào)查的結(jié)果與模擬程序的運(yùn)行結(jié)果對(duì)比分析,從而判斷模型是否能夠客觀地反映路段交通的真實(shí)情況。由于駕駛員在選擇“向左換道”或“向右換道”的策略時(shí),相應(yīng)的車(chē)輛運(yùn)行狀態(tài)較明顯且容易觀察,故以車(chē)輛換道為指標(biāo),檢驗(yàn)應(yīng)用所建模型對(duì)車(chē)道選擇的預(yù)測(cè)結(jié)果,驗(yàn)證模型的有效性。
4.1.1 基于道路駕駛實(shí)車(chē)實(shí)驗(yàn)的車(chē)道選擇模型驗(yàn)證
選取山東省淄博市原山大道自新村西路交叉口至人民西路交叉口的路段為實(shí)驗(yàn)路線,如圖6所示,在正常工作日的上午7:30至9:30且天氣及道路狀況良好時(shí)進(jìn)行實(shí)驗(yàn),交通流狀態(tài)為非自由流。選取30名具有不同傾向性的駕駛員進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)設(shè)備如圖7所示,采集車(chē)輛所在的道路、交通和環(huán)境信息,存儲(chǔ)實(shí)驗(yàn)數(shù)據(jù)并全程錄像。實(shí)驗(yàn)結(jié)束后,應(yīng)用所建模型對(duì)實(shí)驗(yàn)數(shù)據(jù)分析處理,得到各個(gè)駕駛員選擇的車(chē)道,并與錄像中實(shí)際選擇的車(chē)道對(duì)比核實(shí),結(jié)果如表5所示。
圖6 實(shí)驗(yàn)路線
4.1.2 基于交互式并行駕駛模擬實(shí)驗(yàn)的車(chē)道選擇模型驗(yàn)證
應(yīng)用多通道交互式并行駕駛模擬系統(tǒng)構(gòu)建與實(shí)車(chē)實(shí)驗(yàn)道路環(huán)境相同的虛擬現(xiàn)實(shí)交通場(chǎng)景進(jìn)行虛擬駕駛驗(yàn)證,如圖8所示。實(shí)驗(yàn)前對(duì)參與實(shí)驗(yàn)的20名駕駛員進(jìn)行駕駛模擬器的操作培訓(xùn),實(shí)驗(yàn)過(guò)程中避免對(duì)駕駛員的干擾,存儲(chǔ)實(shí)驗(yàn)數(shù)據(jù)并全程錄像。將所得實(shí)驗(yàn)數(shù)據(jù)輸入所建車(chē)道選擇模型中,輸出所得最優(yōu)對(duì)策結(jié)果,并與實(shí)際的車(chē)道選擇結(jié)果相對(duì)比,結(jié)果分析如圖9所示。
由圖9可以看出所建車(chē)道選擇模型在模擬實(shí)驗(yàn)中的預(yù)測(cè)結(jié)果與實(shí)際情況的契合度較高,預(yù)測(cè)的平均準(zhǔn)確率可達(dá)85.42%。
圖7 道路實(shí)車(chē)實(shí)驗(yàn)信息采集系統(tǒng)
表5 道路實(shí)車(chē)實(shí)驗(yàn)預(yù)測(cè)結(jié)果與實(shí)測(cè)結(jié)果對(duì)比
4.1.3 基于交通流微觀仿真實(shí)驗(yàn)的車(chē)道選擇模型驗(yàn)證
根據(jù)道路實(shí)車(chē)實(shí)驗(yàn),分別基于最優(yōu)控制理論和模糊多目標(biāo)決策理論構(gòu)建車(chē)輛跟馳模型和車(chē)道變換決策模型。將實(shí)驗(yàn)所采集不同類(lèi)型駕駛員的數(shù)據(jù)分別輸入考慮(模擬1)和不考慮(模擬2)駕駛員動(dòng)態(tài)博弈的車(chē)道選擇微觀仿真模型中,將模擬出的交通流微觀規(guī)律(如換道次數(shù))和宏觀規(guī)律(如速度、密度、車(chē)道占用率)與道路實(shí)車(chē)實(shí)驗(yàn)的真實(shí)情況相對(duì)比,驗(yàn)證模型的有效性和可靠性。
圖8 駕駛模擬實(shí)驗(yàn)
圖9 駕駛模擬實(shí)驗(yàn)預(yù)測(cè)結(jié)果與實(shí)測(cè)結(jié)果對(duì)比
交通流微觀方面的驗(yàn)證結(jié)果如圖10所示,該圖描述了三車(chē)道場(chǎng)景中不同交通流量下車(chē)輛換道次數(shù)的分布。
圖10 三車(chē)道道路車(chē)輛換道次數(shù)仿真值與實(shí)測(cè)值對(duì)比圖
交通流宏觀方面的驗(yàn)證主要包括平均速度、平均密度及車(chē)道利用率,驗(yàn)證結(jié)果如表6及圖11所示。
表6 微觀仿真結(jié)果同實(shí)測(cè)數(shù)據(jù)對(duì)比分析表
圖11 三車(chē)道道路流量-車(chē)道利用率關(guān)系模擬結(jié)果
表6是以平均速度及平均密度作為評(píng)價(jià)指標(biāo),利用實(shí)車(chē)實(shí)驗(yàn)相關(guān)結(jié)果同模擬程序運(yùn)行結(jié)果的對(duì)比,其誤差在可接受的范圍內(nèi)。
圖11為三車(chē)道道路中各車(chē)道流量與車(chē)道利用率關(guān)系的模擬結(jié)果。其中,實(shí)線表示二者的實(shí)測(cè)關(guān)系,點(diǎn)表示應(yīng)用考慮駕駛員動(dòng)態(tài)博弈車(chē)道選擇的微觀仿真模型模擬出的關(guān)系。模擬結(jié)果表明本文建立的模型具有較高的準(zhǔn)確性和適用性。
本文建立的動(dòng)態(tài)博弈車(chē)道選擇模型,主要分析了物聯(lián)網(wǎng)技術(shù)高度發(fā)展的理想條件下汽車(chē)駕駛員的車(chē)道選擇行為,有利于交通管理者對(duì)道路上行駛車(chē)輛的指揮調(diào)度和管理。但是,本文仍存在以下不足:
首先,物聯(lián)網(wǎng)技術(shù)發(fā)展程度及信息開(kāi)放程度的不同,駕駛員得到信息的完備程度也將不同,因而有必要研究不完全信息條件下駕駛員的車(chē)道選擇博弈行為。其次,為降低模型建立及求解的復(fù)雜度,本文假定目標(biāo)車(chē)駕駛員先于位于其后且次于位于其前的車(chē)輛駕駛員做出行動(dòng)選擇,且將多人動(dòng)態(tài)博弈分解為多個(gè)二人動(dòng)態(tài)博弈,弱化了其他參與人行動(dòng)選擇的影響。由于駕駛員的行動(dòng)選擇并無(wú)嚴(yán)格的先后順序,且駕駛員一旦執(zhí)行所選行動(dòng)的操作后,車(chē)輛所處的態(tài)勢(shì)也將隨之發(fā)生改變。因此,為了避免行動(dòng)順序?qū)δP徒⒌挠绊懀梢詫④?chē)輛的狀態(tài)和操作歸結(jié)于態(tài)勢(shì)的變化和轉(zhuǎn)移,建立目標(biāo)車(chē)與其所處態(tài)勢(shì)的動(dòng)態(tài)博弈模型。再次,由于中國(guó)與美國(guó)的道路條件、行駛環(huán)境等均存在差異,故應(yīng)用美國(guó)的道路自然駕駛數(shù)據(jù)(NGSIM數(shù)據(jù))對(duì)中國(guó)道路條件下所建模型進(jìn)行標(biāo)定會(huì)使得模型本身存在誤差,影響模型的準(zhǔn)確度。最后,為了更好地適應(yīng)復(fù)雜的交通環(huán)境,需要將模型擴(kuò)展到更多車(chē)道的場(chǎng)景,綜合考慮駕駛員在路段、交叉口、匝道等處的博弈行為。
本文對(duì)城市快速路路段上集群車(chē)輛間的車(chē)道選擇行為進(jìn)行了分析,一體化考慮了駕駛員傾向性及車(chē)輛編組關(guān)系、交通實(shí)體特征等時(shí)變動(dòng)態(tài)因素,建立了基于完全信息多人動(dòng)態(tài)博弈的車(chē)道選擇模型。運(yùn)用逆向歸納法求解模型的子博弈精煉納什均衡,得到博弈中各駕駛員的最優(yōu)車(chē)道選擇策略。運(yùn)用實(shí)車(chē)實(shí)驗(yàn)、模擬駕駛實(shí)驗(yàn)及交通流微觀仿真相結(jié)合的手段驗(yàn)證所建模型,結(jié)果表明,所建模型能夠客觀地反映出路段上的交通運(yùn)行狀況及駕駛員的車(chē)道選擇過(guò)程,可以為物聯(lián)網(wǎng)條件下智能駕駛特別是擬人駕駛指揮系統(tǒng)的車(chē)道選擇決策提供理論基礎(chǔ)。