孫智誠(chéng) 朱 彤▲ 鄧 雷 王曉勇
(1.長(zhǎng)安大學(xué)汽車(chē)學(xué)院 西安 710064;2.長(zhǎng)安大學(xué)汽車(chē)運(yùn)輸安全保障技術(shù)交通行業(yè)重點(diǎn)實(shí)驗(yàn)室 西安 710064)
在自由換道情況中,擁堵?tīng)顟B(tài)的產(chǎn)生往往是由于駕駛?cè)讼嗷ゲ┺亩a(chǎn)生的,是一種自發(fā)形成的狀態(tài)。近年來(lái),研究擁堵時(shí)的換道行為對(duì)于擁堵產(chǎn)生與消散的影響逐漸增多。Gipps首先提出使用模型來(lái)表示換道行為[1],是這一系列研究的奠基石。接著Worrall提出了三階段換道模型,通過(guò)加入人的選擇、判定、執(zhí)行來(lái)表示換道過(guò)程[2]。后來(lái)國(guó)內(nèi)外學(xué)者嘗試各種模型來(lái)研究換道行為對(duì)通行能力的影響,其中有將博弈思想引入交通換道模型中,旨在從駕駛?cè)私煌〒Q道策略方面找出制約通行能力的原因。彭金栓等[3]使用非合作混合戰(zhàn)略博弈理論研究了2車(chē)換道行為的策略和效用,但是對(duì)駕駛員群體的行為未有研究。張?jiān)?、劉小明等[4-5]通過(guò)更復(fù)雜的博弈理論進(jìn)一步研究了具有不同換道意愿和策略的駕駛?cè)说淖灾鲹Q道行為,通過(guò)計(jì)算機(jī)仿真技術(shù),采用元胞自動(dòng)機(jī)、IDM等各種模型模擬2車(chē)在2車(chē)道的換道行為,采用數(shù)學(xué)語(yǔ)言描述模型測(cè)算了不同策略駕駛?cè)说膿Q道行為收益。Li Z[6]等利用線性穩(wěn)定數(shù)學(xué)模型研究了不同換道意愿駕駛?cè)巳后w在2車(chē)道情況下的車(chē)速,并使用計(jì)算機(jī)仿真得出換道意愿與通行能力的關(guān)系,但模型未擴(kuò)展到多車(chē)道以及更長(zhǎng)時(shí)間的仿真。同時(shí)PTV Vissim等交通仿真軟件、元胞自動(dòng)機(jī)模型等產(chǎn)生的交通流無(wú)法展現(xiàn)出在基于人本身的意愿和車(chē)輛之間的交互作用下自發(fā)產(chǎn)生的交通流狀態(tài)。
通過(guò)對(duì)已有模型和軟件的研究發(fā)現(xiàn),對(duì)多車(chē)道中駕駛?cè)巳后w換道博弈模型的研究已經(jīng)逐步展開(kāi)[7-8],但以往多數(shù)研究在于使用精密的數(shù)學(xué)模型來(lái)反映雙車(chē)道少量駕駛?cè)酥g的交互博弈。而鮮有集群化、智能化駕駛?cè)四P汀,F(xiàn)有交通流模型多局限于單車(chē)道、2車(chē)道建模,對(duì)多車(chē)道環(huán)境支持不足?;谌说臎Q策而產(chǎn)生的換道行為模型未應(yīng)用在多車(chē)道交通環(huán)境以及駕駛員群體仿真之中,無(wú)法展現(xiàn)駕駛?cè)藳Q策行為對(duì)交通流產(chǎn)生的影響。
綜上所述,為了改進(jìn)以上交通流仿真中的不足,本文采取多智能體進(jìn)行建模。利用其反應(yīng)性、自治性、主動(dòng)性、移動(dòng)性和社會(huì)性[9],模擬出大量駕駛?cè)酥g相互博弈的行為,通過(guò)重復(fù)博弈行為展現(xiàn)出擁堵自發(fā)的產(chǎn)生和消散的情景。這樣產(chǎn)生的交通流是不斷演化、不具有重復(fù)性的,是完全根據(jù)駕駛?cè)说男袨椴呗宰晕已莼a(chǎn)生的,在足夠長(zhǎng)的時(shí)間內(nèi),其反映出來(lái)的交通流狀態(tài)更加符合現(xiàn)實(shí)實(shí)際??梢詭椭治龀鰮矶?tīng)顟B(tài)交通流的產(chǎn)生原因,為集群化、智能化駕駛?cè)四P吞峁﹨⒖家罁?jù)[10]。同時(shí)通過(guò)仿真數(shù)據(jù)結(jié)合博弈理論得出的結(jié)論可以為城市快速路、高速公路的交通環(huán)境改善提出建議。
以往研究多在于使用數(shù)學(xué)語(yǔ)言描述模型,其模型利用精密的數(shù)學(xué)公式來(lái)反映現(xiàn)實(shí)情況,但是往往關(guān)注短時(shí)微觀的交通流,對(duì)于道路整體的通行能力描述欠佳[3-5,11]。而利用自然語(yǔ)言,邏輯判斷的多智能體系統(tǒng)模型可以感知周邊環(huán)境,根據(jù)已有知識(shí)庫(kù)進(jìn)行判斷,做出決策,更加符合生活實(shí)際。同時(shí)可以仿真出復(fù)雜、多變的交通環(huán)境。利用多智能體系統(tǒng)建立交通仿真模型,其模型演化是自發(fā)而非設(shè)定的,具有不可預(yù)性。短時(shí)間內(nèi)模型的精確程度不及數(shù)學(xué)語(yǔ)言模型,但是在足夠長(zhǎng)的時(shí)間步下,其形成的演化穩(wěn)定狀態(tài)卻能較好的反映現(xiàn)實(shí)情況。
在目前眾多的研究換道行為中,車(chē)輛跟弛模型和車(chē)道變換模型是車(chē)輛行為建模的2個(gè)主要的研究?jī)?nèi)容,相對(duì)專(zhuān)門(mén)研究跟弛與換道的模型來(lái)說(shuō),本文以智能駕駛?cè)四P?Intelligent Driver Model, IDM)[12-13]作為參考,研究換道行為對(duì)通行能力影響的模型。IDM模型是一種簡(jiǎn)潔、完整和無(wú)事故模型,符合經(jīng)驗(yàn)且易于標(biāo)定,能夠描述不同交通流狀態(tài)下,所有單車(chē)道駕駛?cè)说母谛袨閇12]。其無(wú)事故的基本假設(shè)在現(xiàn)實(shí)環(huán)境中普遍存在,所以事故對(duì)交通通行能力的影響在本仿真不考慮。
根據(jù)本文研究的內(nèi)容,基于IDM模型將車(chē)輛多智能體編輯為具有自由行使、跟弛和換道的動(dòng)態(tài)主體[14],具有感知-判斷-決策的能力。
根據(jù)Worrall研究的三階段換道模型,智能體車(chē)輛換道過(guò)程可分為產(chǎn)生換道動(dòng)機(jī),選擇目標(biāo)車(chē)道;判定換道條件;執(zhí)行換道操作3個(gè)步驟。實(shí)際中產(chǎn)生換道動(dòng)機(jī)的誘因多種多樣,但是其表現(xiàn)形式大體相似,即車(chē)輛當(dāng)前的速度顯著低于期望速度,且持續(xù)時(shí)間超過(guò)駕駛?cè)丝扇淌艿某潭?。所以在?chē)輛智能體中設(shè)定1個(gè)變量“patience”(P)表征換道意愿閾值。當(dāng)車(chē)輛車(chē)速低于預(yù)期時(shí),“patience”值減少。當(dāng)“patience”減為0時(shí),車(chē)輛產(chǎn)生換道動(dòng)機(jī)。產(chǎn)生換道動(dòng)機(jī)后車(chē)輛判斷目標(biāo)車(chē)道是否有車(chē)輛阻擋,若無(wú)阻擋則進(jìn)行換道,否則保持當(dāng)前道路行駛,直至換道條件允許。在執(zhí)行換道操作時(shí),車(chē)輛智能體在保持縱向速度同時(shí)產(chǎn)生橫向速度,模擬車(chē)輛換道行為。在完成換道后,車(chē)輛智能體的“patience”恢復(fù)原值,再次遇到阻擋時(shí)減少,由此形成一個(gè)換道決策循環(huán)。
行駛過(guò)程中的換道可以看做是一種重復(fù)博弈。重復(fù)博弈是一種特殊的離散動(dòng)態(tài)博弈。其中每次博弈都稱為“階段博弈”。在重復(fù)博弈情況下,局中人的決策會(huì)產(chǎn)生長(zhǎng)遠(yuǎn)的影響[4-5]。在1個(gè)重復(fù)博弈中,被重復(fù)地進(jìn)行的博弈稱為階段博弈(stage game),在每一個(gè)階段博弈中,其博弈的策略空間與支付函數(shù)都是一樣的。1個(gè)重復(fù)博弈,如果當(dāng)中包含有限個(gè)“階段博弈”,且在重復(fù)博弈的每一個(gè)階段開(kāi)始,每位參與者都能觀察到在過(guò)往所有參與者所采取的行動(dòng),則稱該重復(fù)博弈為有限次重復(fù)博弈。在車(chē)輛行駛的換道中,每個(gè)駕駛?cè)硕济媾R著與采取不同策略的駕駛員博弈。并且在每次換道時(shí),其博弈的對(duì)象也很難確定,具有很大的隨機(jī)性,難以使用數(shù)學(xué)語(yǔ)言描述,但是利用多智能體仿真技術(shù)能夠更好的表現(xiàn)這一過(guò)程。
在仿真換道博弈中,按照換道意愿高低均勻的將駕駛?cè)朔譃?種:OP謹(jǐn)慎型(P為1 patience);O0.5P正常型(0.5P為0.5 patience);O0.25P激進(jìn)型(0.25P為0.25 patience)。按照博弈論的理性人的基本假設(shè):決策主體是理性的,會(huì)最大化自己的利益。所以理性駕駛?cè)酥魂P(guān)注自己的車(chē)速,當(dāng)3類(lèi)駕駛?cè)诵旭倳r(shí),其決策空間為Z=Γ1×Γ2×Γ3;(Γ1,Γ2,Γ3)={H,M,L}。H表示采取積極地?fù)Q道策略,M表示采取正常的換道策略,D表示采取謹(jǐn)慎的換道意愿。vi為Oi在當(dāng)前交通環(huán)境下的效用函數(shù),vlimit為當(dāng)前車(chē)道限速,如式(1)所示,本文用車(chē)速表示。
vi={v|v≤vlimit,P}
(1)
根據(jù)調(diào)查和以往研究,在限速范圍內(nèi),駕駛?cè)诵旭傄欢螘r(shí)間后,會(huì)觀察自己的車(chē)速相對(duì)周?chē)?chē)輛速度的快慢。此時(shí),理性的駕駛員會(huì)根據(jù)自己的觀察來(lái)調(diào)整的換道策略。所以駕駛?cè)藭?huì)根據(jù)式(2)Δvi,調(diào)整自己的策略。
Δvi=max(vi-vj)
(2)
式中:vi為當(dāng)前決策者的車(chē)速;vj為其他局中人的車(chē)速,當(dāng)Δvi≤0 時(shí),表示有其他換道策略的駕駛員能夠在博弈中占優(yōu),決策者會(huì)調(diào)整自己的策略以達(dá)到當(dāng)前交通環(huán)境下的最優(yōu)車(chē)速。Δvi≥0時(shí),表示此時(shí)決策者采取了占優(yōu)策略,所以不會(huì)調(diào)整策略。
參考以往關(guān)于多智能體系統(tǒng)架構(gòu)研究[15-16],構(gòu)建如圖1所示的多智能體系統(tǒng)模型,加入跟弛-換道模型以符合交通實(shí)際,同時(shí)利用系統(tǒng)感知、分類(lèi)、收集系統(tǒng)信息以供分析。多智能體系統(tǒng)模型其本質(zhì)是在知識(shí)庫(kù)中按照設(shè)定的目標(biāo),根據(jù)周?chē)h(huán)境做出自己的判斷和決策,體現(xiàn)出其自主性的特點(diǎn)。仿真設(shè)置3類(lèi)具有不同換道意愿的車(chē)輛智能體。同時(shí)利用車(chē)道多智能體收集車(chē)輛信息,輸出相關(guān)數(shù)據(jù)。
圖1 多智能體系統(tǒng)模型架構(gòu)設(shè)計(jì)Fig.1 Architecture Design of multi agent system model
模型通過(guò)對(duì)西安市二環(huán)南段道路擁堵時(shí)段的觀察測(cè)算,根據(jù)觀測(cè)到的行為進(jìn)行建模仿真,仿真界面如圖2所示。并根據(jù)實(shí)際測(cè)算和以往研究測(cè)算的數(shù)據(jù)[17-18]標(biāo)定智能體的各項(xiàng)屬性。表1為道路智能體的主要屬性,表2為車(chē)輛智能體的主要屬性。
圖2 仿真界面Fig.2 simulation interface
屬性說(shuō)明實(shí)驗(yàn)設(shè)定車(chē)速所有車(chē)輛智能體的行駛速度以及不同換道意愿智能體車(chē)輛的車(chē)速智能體自我調(diào)整車(chē)輛分布每條車(chē)道的車(chē)輛數(shù)根據(jù)仿真統(tǒng)計(jì)總車(chē)數(shù)表示路網(wǎng)智能體系統(tǒng)中所有車(chē)的數(shù)量50
表2 車(chē)輛智能體屬性
注:仿真中時(shí)間單位為tick,車(chē)輛智能體速度單位為patches/tick,即每個(gè)tick時(shí)間段內(nèi)車(chē)輛智能體可行駛過(guò)的瓦片數(shù)。
圖2表示在不同P值(patience)的情況下,3種不同智能體車(chē)輛換道次數(shù)。
圖3 換道意愿閾值與換道次數(shù)統(tǒng)計(jì)圖 Fig.3 Lane changing intention versus changing times
針對(duì)整個(gè)路段的平均車(chē)速和最低車(chē)速進(jìn)行統(tǒng)計(jì)分析,由圖3可知,隨著閾值P的增大,整個(gè)路網(wǎng)的車(chē)輛平均車(chē)速和最低車(chē)速都有明顯減小。當(dāng)P=40時(shí)平均車(chē)速和最低車(chē)速均最大,P值在80~100范圍內(nèi)時(shí)平均車(chē)速最低。路段最小車(chē)速的變化隨著P的增大而減小。由圖4可知,patience越高,平均車(chē)速越低,在P=80的狀態(tài)相比于P=40的狀態(tài)降低了7%達(dá)到最低點(diǎn)。這與Li Z研究的模型推理得出的“積極換道策略有助于提高通行能力”結(jié)論相同[6],說(shuō)明這一結(jié)論在3車(chē)道亦成立。
圖4 換道意愿與車(chē)速統(tǒng)計(jì)圖Fig.4 Lane changing intention versus speed
圖5 不同換道意愿下平均車(chē)速對(duì)比圖Fig.5 Speed distributions under differentlane changing intention
針對(duì)采取不同換道策略的駕駛?cè)巳后w的平均車(chē)速進(jìn)行分析,結(jié)果如圖5所示。在不同交通環(huán)境下不同換道意愿群體車(chē)速變化并不一致,當(dāng)<80時(shí),謹(jǐn)慎型駕駛員(P)平均車(chē)速最高,當(dāng)>80時(shí),謹(jǐn)慎型駕駛?cè)?P)平均車(chē)速明顯低于其他2種駕駛?cè)塑?chē)速(0.5P,0.25P)。
圖6 不同換道意愿下平均車(chē)速對(duì)比圖Fig.6 Average speed under different lane changing intention
由以上的仿真結(jié)果,根據(jù)博弈論的基本假設(shè),推斷理性的駕駛?cè)藶闈M足自己的駕駛意圖[18]會(huì)做出如下策略。
在最大換道意愿閾值P=120 (0.5P=60, 0.25P=30)的交通環(huán)境下,VP>V0.5P、VP>V0.25P,Δv0.5p≤0,Δv0.25p≤0,故采用OP,O0.25P的駕駛?cè)藭?huì)調(diào)整自己的策略(見(jiàn)表3),降低換道意愿,減少換道頻率,以提高本身車(chē)速vi。
表3 P=120時(shí)的仿真結(jié)果Tab.3 Simulation result when the P=120
在最大換道意愿閾值P=100(0.5P=50,0.25P=25)的交通環(huán)境下,VP>V0.5P,VP>V0.25P,Δv0.5p≤0,Δv0.25p≤0,故用OP,O0.25P的駕駛?cè)藭?huì)調(diào)整自己的策略(見(jiàn)表4),降低換道意愿,減少換道頻率,以提高本身車(chē)速vi。
表4 P=100時(shí)的仿真結(jié)果Tab.4 Simulation result when the P=100
在P=80的交通環(huán)境下,3類(lèi)駕駛?cè)说能?chē)速相等。沒(méi)有速度差的驅(qū)動(dòng),駕駛?cè)藭?huì)保持此時(shí)的換道意愿(見(jiàn)表5),此時(shí)達(dá)到了博弈論里中的均衡狀態(tài),即采取不同策略的駕駛?cè)送ㄟ^(guò)周?chē)h(huán)境感知自己與周?chē)说能?chē)速,認(rèn)為自己采用了本次階段博弈的占優(yōu)策略,故不會(huì)調(diào)整策略。
表5 P=80時(shí)的仿真結(jié)果Tab.5 Simulation result when the P=80
在P=60與P=40的情況下,V0.5P的車(chē)輛平均速度最大,采取謹(jǐn)慎型和激進(jìn)型策略的駕駛?cè)藭?huì)向正常型駕駛?cè)瞬呗园l(fā)展(見(jiàn)表6~7),但是考慮P與換道頻率的關(guān)系,激進(jìn)型駕駛?cè)藫Q道次數(shù)減少的頻數(shù)要多于謹(jǐn)慎型駕駛?cè)藫Q道頻數(shù)增加的量,所以最終導(dǎo)致的換道頻率減小。
表6 P=60時(shí)的仿真結(jié)果Tab.6 Simulation result when the P=60
表7 P=40時(shí)的仿真結(jié)果Tab.7 Simulation result when the P=40
當(dāng)P=20時(shí),正常型駕駛?cè)?0.5P)會(huì)采取降低或提高換道意愿的策略,此時(shí)假定有一半的正常型駕駛?cè)诉x擇降低換道意愿,一半選擇提高換道意愿[19]??紤]P與換道頻率的關(guān)系,換道頻率會(huì)增加,見(jiàn)表8。
表8 P=20時(shí)的仿真結(jié)果Tab.8 Simulation result when the P=20
實(shí)際上,當(dāng)換道頻率非常高時(shí),極容易發(fā)生交通事故,提高交通風(fēng)險(xiǎn)。現(xiàn)實(shí)中駕駛?cè)瞬粫?huì)采取增加換道頻率這種冒險(xiǎn)的方式以提高期望車(chē)速,而會(huì)選擇降低換道頻率[20]。故實(shí)際中其策略,見(jiàn)表9。
表9 P=20時(shí)的仿真結(jié)果結(jié)合現(xiàn)實(shí)情況推理Tab.9 Simulation results at P=20 combinedwith real-world reasoning
圖7 駕駛員根據(jù)速度策略調(diào)整圖Fig.7 Driver strategy adjustment according to the speed
通過(guò)以上的分析,如圖7所示,對(duì)于駕駛?cè)巳后w來(lái)說(shuō)換道次數(shù)和換道意愿的均衡點(diǎn)為最大換道意愿閾值P=80。在這種情況下,每種駕駛?cè)颂幱谙嗤乃俣龋?chē)輛速度差近似為0,故沒(méi)有人主動(dòng)會(huì)去調(diào)整自己的策略,所有局中人都自認(rèn)為達(dá)到了在這種交通情況下的最優(yōu)車(chē)速,達(dá)到一種均衡狀態(tài)。但是,根據(jù)圖4所示,在P=80的情況下,道路平均車(chē)速最低。這反應(yīng)出人類(lèi)自私的行為導(dǎo)致整體效率的下降,在交通中,往往因?yàn)樗旭{駛?cè)恕安秸{(diào)不一致”而導(dǎo)致交通環(huán)境的惡化。通過(guò)以上的分析可以一定程度上解釋在車(chē)流量較大的交通環(huán)境下道路整體通行能力下降的原因,即在每次換道階段博弈中,駕駛?cè)藫Q道策略的改進(jìn)都不是帕累托改進(jìn)。
但是因?yàn)槟P偷幕炯僭O(shè)是在無(wú)事故的交通環(huán)境中,所以一切變化都沒(méi)有考慮在增加換道頻數(shù)時(shí),對(duì)增加事故風(fēng)險(xiǎn)的影響。同時(shí),所有駕駛?cè)说鸟{駛技能都假設(shè)相近,沒(méi)有建立新手駕駛?cè)撕推隈{駛?cè)说忍厥饽P?,所以多智能體系仍有可改進(jìn)之處。進(jìn)一步通過(guò)在模型中增加事故等隨機(jī)事件,可以更加真實(shí)的反映現(xiàn)實(shí)交通流的情況。
1) 仿真結(jié)果驗(yàn)證了前人提出的提高換道積極性對(duì)改善通行能力的結(jié)論[6],并將其推廣至3車(chē)道。仿真顯示在不發(fā)生交通事故的情況下,所有車(chē)輛的平均車(chē)速最多可以提高7%。
2) 通過(guò)分析在不同交通環(huán)境下,不同換道意愿的駕駛?cè)巳后w的平均車(chē)速以及道路整體平均車(chē)速,發(fā)現(xiàn)在不同交通環(huán)境中平均車(chē)速最高的駕駛?cè)巳后w并不一致。說(shuō)明在不同換道策略的駕駛員相互博弈中,其占優(yōu)策略并不相同。在低換道意愿的情況下,謹(jǐn)慎型駕駛員的平均車(chē)速更高,但在高換道意愿的情況下,積極地?fù)Q道更能提高自身車(chē)速。
3) 基于博弈論理論[3-5],將不同類(lèi)型駕駛?cè)巳后w劃分三類(lèi)博弈者,并以平均車(chē)速作為效用函數(shù)。基于理性駕駛員在車(chē)速趨于一致的條件下會(huì)停止調(diào)整策略的假設(shè),分析得出每次調(diào)整策略不都是帕累托改進(jìn),達(dá)到均衡狀態(tài)時(shí)道路的通行能力會(huì)降低的結(jié)論。
但仿真研究的是在不發(fā)生交通事故的情況下交通流的變化,實(shí)際情況中換道次數(shù)的增加會(huì)增加交通事故的發(fā)生幾率,從而導(dǎo)致交通堵塞,降低通行能力。同時(shí)不同狀態(tài)下不同換道意愿駕駛?cè)说牟┺那闆r仍值得研究。針對(duì)這些問(wèn)題,模型仍需進(jìn)一步改進(jìn)。