宋 瑋,趙會(huì)奮,蔡文欽,周萬(wàn)強(qiáng)
(廣東工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,廣州 510006)
交通擁堵是現(xiàn)代城市治理中的一個(gè)重要問(wèn)題。目前緩解交通擁堵的方法[1]包括使用智能交通系統(tǒng)中的交通信號(hào)燈和車(chē)輛重路由。其中,固定時(shí)間周期的交通信號(hào)燈無(wú)法適應(yīng)飛速增長(zhǎng)的車(chē)輛導(dǎo)致的擁堵問(wèn)題,現(xiàn)有的優(yōu)化方法將如強(qiáng)化學(xué)習(xí)、遺傳算法、神經(jīng)網(wǎng)絡(luò)、模糊邏輯等應(yīng)用在交通控制領(lǐng)域以減少車(chē)輛的整體等待時(shí)間、提高交通安全、減少能源消耗等,但這些方法需要大量的歷史數(shù)據(jù)及耗費(fèi)大量的計(jì)算時(shí)間。車(chē)輛重路由通過(guò)為車(chē)輛提供可替換的路徑來(lái)減輕擁堵。文獻(xiàn)[2]提出的路徑誘導(dǎo)算法所產(chǎn)生的路徑可提升車(chē)輛準(zhǔn)時(shí)到達(dá)的概率。文獻(xiàn)[3]中的基礎(chǔ)設(shè)施代理使用強(qiáng)化學(xué)習(xí)更新節(jié)點(diǎn)壓力,從而獲得車(chē)輛的最優(yōu)路徑。為了適應(yīng)交通的動(dòng)態(tài)性,基礎(chǔ)設(shè)施代理使用組合拍賣(mài)調(diào)整車(chē)輛路由。文獻(xiàn)[1]充分總結(jié)了車(chē)輛重路由和交通信號(hào)燈緩解交通擁堵問(wèn)題的現(xiàn)狀,利用數(shù)字信息素將兩者結(jié)合起來(lái),路邊設(shè)備代理利用車(chē)輛代理提供的信息素預(yù)測(cè)短期交通狀態(tài),若有擁堵則進(jìn)行車(chē)輛重路由;交通信號(hào)燈代理則利用信息素調(diào)整綠燈時(shí)長(zhǎng)。上述研究均涉及了車(chē)輛代理、路邊設(shè)施代理或交通信號(hào)燈代理以及相互之間的信息交換與協(xié)作。
另一類(lèi)研究?jī)H基于車(chē)車(chē)互聯(lián)(Vehicle to Vehicle,V2V)與協(xié)作,文獻(xiàn)[4]提出在V2V 環(huán)境下的虛擬交通燈(Virtual Traffic Lights,VTL),不需要依賴(lài)任何路邊基礎(chǔ)設(shè)施,僅通過(guò)車(chē)輛間的直接通信協(xié)商路權(quán)分配,使用車(chē)載顯示裝置來(lái)告知司機(jī)交通燈信號(hào),極大節(jié)省了修建和維護(hù)實(shí)體交通信號(hào)燈的費(fèi)用,推廣了交通信號(hào)燈的使用[5]。但目前的研究均基于一個(gè)前提:車(chē)車(chē)間交互的信息能夠被設(shè)備感知,且不考慮存在不可被設(shè)備感知的信息。文獻(xiàn)[6]指出在鼓勵(lì)拼車(chē)的路權(quán)分配規(guī)則下(車(chē)上乘客數(shù)越多,車(chē)輛通行優(yōu)先級(jí)越高),由司機(jī)提供乘客數(shù)量,因此司機(jī)可以通過(guò)謊報(bào)車(chē)輛滿(mǎn)載而獲利。文獻(xiàn)[7]指出不同的駕駛?cè)藢?duì)等待時(shí)間的估值不同,當(dāng)駕駛?cè)酥牢挥谒竺娴鸟{駛?cè)藭?huì)出價(jià)使得該車(chē)道獲得路權(quán),則會(huì)謊報(bào)他真實(shí)的估值。經(jīng)濟(jì)學(xué)領(lǐng)域提出的策略防護(hù)機(jī)制是目前用于激勵(lì)趨利的單個(gè)節(jié)點(diǎn)偏好進(jìn)行有益合作的一種有效手段,描述的是參與的節(jié)點(diǎn)只有在真實(shí)展示其私有信息時(shí)所獲得的效益最大,常被用作激發(fā)節(jié)點(diǎn)的真實(shí)意圖和能力。在合作路口管理中,主要使用第二價(jià)格拍賣(mài)機(jī)制和維克瑞-克拉克-格羅夫斯拍賣(mài)機(jī)制(Vickrey-Clarke-Groves,VCG)對(duì)趨利的單個(gè)車(chē)輛/司機(jī)進(jìn)行激勵(lì),但當(dāng)節(jié)點(diǎn)合謀謊報(bào)時(shí)則激勵(lì)失效。
本文依托于車(chē)車(chē)互聯(lián)和協(xié)作,不考慮使用基礎(chǔ)設(shè)施代理和信號(hào)燈代理。針對(duì)在V2V 環(huán)境下存在設(shè)備不可測(cè)量的信息,如車(chē)輛/司機(jī)對(duì)路權(quán)的偏好、緊急程度、乘客數(shù)量等,本文令車(chē)輛合作通過(guò)路口,并建模為合作博弈模型,設(shè)計(jì)一種使用Shapley 值的組策略防護(hù)拍賣(mài)機(jī)制,該機(jī)制能夠避免車(chē)輛虛報(bào)私有信息,從而保證車(chē)輛評(píng)價(jià)值的真實(shí)性。此外,基于拍賣(mài)結(jié)果集合中真實(shí)的評(píng)價(jià)值控制虛擬交通燈,并進(jìn)行路權(quán)分配,動(dòng)態(tài)設(shè)定綠燈通行的車(chē)輛集合,以改變虛擬交通燈中固定綠燈通行閾值的方式。
文獻(xiàn)[4]指出虛擬交通燈包括3 個(gè)部分:1)選舉算法選出領(lǐng)導(dǎo)車(chē)輛承擔(dān)實(shí)體交通燈的職責(zé);2)領(lǐng)導(dǎo)車(chē)輛制定路權(quán)分配并發(fā)送給車(chē)輛;3)當(dāng)領(lǐng)導(dǎo)車(chē)輛離開(kāi)路口后,領(lǐng)導(dǎo)權(quán)按照轉(zhuǎn)移算法轉(zhuǎn)給其他車(chē)輛,繼續(xù)控制交通。但是該文并未給出詳細(xì)的算法過(guò)程。文獻(xiàn)[8]在文獻(xiàn)[1]的基礎(chǔ)上改進(jìn)了車(chē)輛間的消息傳播方式并給出了詳細(xì)的交互過(guò)程。文獻(xiàn)[5]改變了文獻(xiàn)[8]中通過(guò)設(shè)定綠燈通行車(chē)輛數(shù)量閾值的方式制定通行時(shí)間,提出了獨(dú)立路口虛擬交通燈的相位算法,并利用每個(gè)車(chē)道車(chē)輛的等待時(shí)間、排隊(duì)鏈路長(zhǎng)度及排隊(duì)數(shù)量這3 個(gè)參數(shù)制定優(yōu)先級(jí),節(jié)省了等待時(shí)間。文獻(xiàn)[9]提出的算法可以讓通行方向不沖突的車(chē)輛同時(shí)通行,增加吞吐量,從而減少了車(chē)輛的平均行駛時(shí)間。除了通過(guò)改進(jìn)交通控制邏輯外,研究分別集中在虛擬交通燈的實(shí)施、評(píng)價(jià)和領(lǐng)導(dǎo)車(chē)輛選舉算法。文獻(xiàn)[10]研究了VTL 在車(chē)載系統(tǒng)中用戶(hù)界面的設(shè)計(jì),包括在行駛過(guò)程中虛擬交通燈車(chē)載界面使用的安全性、用戶(hù)的接受程度以及對(duì)主駕駛?cè)蝿?wù)的負(fù)面影響。文獻(xiàn)[11]實(shí)現(xiàn)了基于A(yíng)ndroid 手機(jī)和WiFi 直連的VTL 的原型系統(tǒng),并在Carnegie Mellon大學(xué)進(jìn)行測(cè)試,研究了消息包的延遲問(wèn)題,實(shí)驗(yàn)結(jié)果顯示消息包從一臺(tái)手機(jī)傳到另一臺(tái)手機(jī),車(chē)輛移動(dòng)不超過(guò)1 m,說(shuō)明了VTL 依托手機(jī)實(shí)施的可行性。文獻(xiàn)[12]基于文獻(xiàn)[1]建立了VTL 的原型系統(tǒng),并在美國(guó)匹茲堡的一個(gè)停車(chē)場(chǎng)進(jìn)行了實(shí)際的測(cè)試,實(shí)驗(yàn)結(jié)果表明VTL 在無(wú)信號(hào)燈的路口可以將平均行駛時(shí)間減少20%。文獻(xiàn)[13]提出了3 個(gè)版本的領(lǐng)導(dǎo)車(chē)輛選舉算法用來(lái)減少交互時(shí)傳遞的通信量。文獻(xiàn)[14]將VTL 中的領(lǐng)導(dǎo)車(chē)輛選舉抽象為在無(wú)傳輸失敗次數(shù)限制的系統(tǒng)中,對(duì)一個(gè)值或一組值達(dá)成一致的問(wèn)題,即共識(shí)問(wèn)題。
路口是共享資源,從經(jīng)濟(jì)學(xué)的角度看,道路的使用者對(duì)路口的使用具有不同的估值或評(píng)價(jià),出價(jià)高的將會(huì)優(yōu)先獲得路權(quán)。研究主要集中在基于拍賣(mài)的路口資源預(yù)留[6-7,15]和基于拍賣(mài)的實(shí)體交通信號(hào)燈控制[16-18]。這些研究的區(qū)別在于:1)采用的拍賣(mài)機(jī)制不同,有第1 價(jià)格拍賣(mài)或第2 價(jià)格拍賣(mài)或VCG 拍賣(mài);2)參與人不同,有車(chē)輛或路邊設(shè)備;3)候選人不同,有車(chē)輛或相位或時(shí)空隙。這些研究的共同之處是考慮到參與人對(duì)行駛時(shí)間或等待時(shí)間有不同的態(tài)度,由此產(chǎn)生對(duì)候選實(shí)體的不同出價(jià)。根據(jù)拍賣(mài)的特性,只有第2 價(jià)格拍賣(mài)和VCG 拍賣(mài)可以激勵(lì)參與人真實(shí)出價(jià),達(dá)到策略防護(hù)目的,但是當(dāng)多個(gè)參與人發(fā)現(xiàn)可以通過(guò)虛假報(bào)價(jià)合謀獲利時(shí),第2 價(jià)格拍賣(mài)和VCG 拍賣(mài)就失效,無(wú)法達(dá)到組策略防護(hù)。
為防止參與人通過(guò)虛假報(bào)價(jià)合謀獲利,可采用合作博弈中的機(jī)制來(lái)維持愿意合作的參與人之間的合作,即維持參與人真實(shí)出價(jià)的合作,避免參與人合謀并參與虛假報(bào)價(jià)。合作博弈的正式定義以特征函數(shù)的形式給出,即給定一個(gè)有限的參與人集合A,合作博弈的特征型是有序數(shù)對(duì)(A,ν),其中特征函數(shù)ν是從2A={S|S?A}到實(shí)數(shù)集RA的映射,即ν:2A→RA,且ν(?)=0。ν(S)是聯(lián)盟S中參與人相互合作所對(duì)應(yīng)的效用,可以是得益,也可以是成本??赊D(zhuǎn)移效用博弈(Transferable Utility Games,TU Games)指貨幣可以被用來(lái)在不同的參與人之間轉(zhuǎn)移的效用,滿(mǎn)足≤ν(S),每個(gè)參與人都擁有擬線(xiàn)性的效用函數(shù)ui,價(jià)物(通常為貨幣)在該效用函數(shù)中呈線(xiàn)性關(guān)系[19]。對(duì)于合作博弈(A,ν),若ν(S)是A的每個(gè)聯(lián)盟S?A中參與人相互合作產(chǎn)生的成本,則(A,ν)是成本分?jǐn)偛┺摹O蛄喀痢蔙A稱(chēng)為成本配置,如果滿(mǎn)足下面兩個(gè)條件則α被認(rèn)為屬于核:1)達(dá)到預(yù)算平衡,即=ν(A);2)存在核性質(zhì),即對(duì)于每一個(gè)聯(lián)盟S?A,≤ν(S)。核中的成本配置使任何聯(lián)盟都沒(méi)有能力推翻他[20]。成本分?jǐn)偡桨笧槁?lián)盟S指定的成本配置,定義為函數(shù)ξ:A×2A?R,其中S?A;而對(duì)于每一個(gè)i?S,ξ(i,S)=0。成本分?jǐn)偡桨甫问墙徊鎲握{(diào)的,如果對(duì)于所有的S,T?A和i∈S,則ξ(i,S)≥ξ(i,S∪T)。成本分?jǐn)偛┺模ˋ,ν)是次模博弈,如果函數(shù)ν具有次模性質(zhì),即滿(mǎn)足式(1)所示條件:
Shapley 值是一種成本分?jǐn)偡桨甫?,可為任一個(gè)成本分?jǐn)偛┺模ˋ,ν)指派唯一的成本配置,計(jì)算公式如式(2)所示:
Shapley 值可理解為每個(gè)參與人i以隨機(jī)順序加入聯(lián)盟A的期望邊際成本。若函數(shù)ν具有次模性質(zhì),則Shapley 值是成本分?jǐn)偛┺模ˋ,ν)指派唯一的成本配置并且屬于核[23]。這意味著不存在聯(lián)盟S?A有意愿離開(kāi)A而形成新的聯(lián)盟。成本分?jǐn)倷C(jī)制是一個(gè)算法,能夠接收多個(gè)參與人的出價(jià)向量b,并基于b產(chǎn)生一個(gè)結(jié)果集合Q(b)?A和支付函數(shù)p(b)∈Rn。
在組策略防護(hù)機(jī)制中,設(shè)S?A,b為真實(shí)出價(jià)向量,b′為策略出價(jià)向量。對(duì)于每個(gè)i?S,bi=令(Q,p)和(Q',p')為b、b′下的輸出。ui(bi,Q,p)為i在b出價(jià)向量和(Q,p)輸出下的效用。對(duì)于每一個(gè)S,如果不等式對(duì)于每一個(gè)i∈S成立,則等號(hào)對(duì)于每一個(gè)i∈S成立。也就是說(shuō),不會(huì)存在S中每個(gè)成員在真實(shí)情況下均具有相同效用,同時(shí)至少有一個(gè)成員能獲得更高的效用。這也就意味著這一組成員的策略出價(jià)并不會(huì)帶來(lái)更高的效用[21]。
MOULIN 等[23]指出具有交叉單調(diào)性質(zhì)的成本分?jǐn)偡桨甫慰捎糜谠O(shè)計(jì)組策略防護(hù)機(jī)制,并給出了相關(guān)算法和定理。Shapley 值具有交叉單調(diào)性質(zhì),常被用于組策略防護(hù)機(jī)制的設(shè)計(jì)中[21]。
本文遵循文獻(xiàn)[1]提出的假設(shè):所有的車(chē)輛裝備了DSRC 設(shè)備;所有車(chē)輛共享同一個(gè)數(shù)字地圖;所有車(chē)輛具有GPS 來(lái)保證全局時(shí)間和位置的同步;由現(xiàn)有的無(wú)線(xiàn)傳輸協(xié)議提供和解決安全、可靠性和延遲問(wèn)題。組策略防護(hù)特性的虛擬交通燈基本步驟如下:
步驟1所有車(chē)輛進(jìn)入路口區(qū)域后廣播狀態(tài)信息給路口區(qū)域的其他車(chē)輛。狀態(tài)信息包括車(chē)輛的路線(xiàn)、行駛時(shí)間、離路口的距離、是否通過(guò)路口、對(duì)領(lǐng)導(dǎo)車(chē)輛的投票等。
步驟2每個(gè)車(chē)輛根據(jù)已獲得的信息計(jì)算投票,得票最多的是領(lǐng)導(dǎo)車(chē)輛。領(lǐng)導(dǎo)車(chē)輛的選舉使用文獻(xiàn)[6]中提出的算法,并增加了一個(gè)選舉條件:在相同得票的情況下,等待時(shí)間最短的為領(lǐng)導(dǎo)車(chē)輛。
步驟3一旦確定了領(lǐng)導(dǎo)車(chē)輛,領(lǐng)導(dǎo)車(chē)輛將控制路口完成以下工作:?jiǎn)?dòng)拍賣(mài),使用一個(gè)信號(hào)隊(duì)列記錄每次拍賣(mài)產(chǎn)生的綠燈信號(hào)結(jié)果。路權(quán)分配,從信號(hào)隊(duì)列取出第1 個(gè)綠燈信號(hào),發(fā)送綠燈消息給相應(yīng)的車(chē)輛。當(dāng)收到綠燈信號(hào)的車(chē)輛中最后一輛車(chē)離開(kāi)路口,則領(lǐng)導(dǎo)車(chē)輛取出下一個(gè)綠燈信號(hào)。領(lǐng)導(dǎo)權(quán)的轉(zhuǎn)移,當(dāng)領(lǐng)導(dǎo)車(chē)輛離開(kāi)路口,它會(huì)將信號(hào)隊(duì)列傳遞給新的領(lǐng)導(dǎo)者,新的領(lǐng)導(dǎo)車(chē)輛產(chǎn)生過(guò)程如步驟2 所示。
步驟4當(dāng)車(chē)輛收到綠燈信號(hào)后,使用狀態(tài)信息說(shuō)明其正在通過(guò)路口。
將車(chē)輛合作通過(guò)路口,并建模為合作博弈模型(A,ν),合作行為定義為車(chē)輛真實(shí)展示其不可被設(shè)備測(cè)量的信息。A是參與合作的車(chē)輛集合,令u(A)=1-(1-α)|A|,α是一個(gè)車(chē)輛參與合作后通過(guò)路口的概率,u(A)則是|A|個(gè)車(chē)輛合作后通過(guò)路口的概率。若路口等待的車(chē)輛有L輛,當(dāng)有|A|輛車(chē)合作時(shí),期望通過(guò)的車(chē)輛數(shù)量為ν(A)=L(1-(1-α)|A|)。ν(A)具有次模性質(zhì),不存在S?A有意愿放棄合作并離開(kāi)A形成新的S,Shapley 值的計(jì)算公式如式(3)所示:
定義車(chē)輛i的效用為wi=uiqi-pi,qi是1 個(gè)指示變量,說(shuō)明車(chē)輛i是否入選集合;pi是車(chē)輛i的實(shí)際支付值;評(píng)價(jià)值ui描述了車(chē)輛不可被設(shè)備測(cè)量的信息,如主觀(guān)評(píng)價(jià)、主觀(guān)緊急度、乘客數(shù)量等。車(chē)輛i向領(lǐng)導(dǎo)車(chē)輛的出價(jià)記為bi,車(chē)輛參與到合作中,則顯示其真實(shí)信息,bi=ui。領(lǐng)導(dǎo)車(chē)輛啟動(dòng)拍賣(mài)用以確保bi=ui。結(jié)合文獻(xiàn)[18]提出的機(jī)制設(shè)計(jì)了一個(gè)使用Shapley值的組策略防護(hù)拍賣(mài)機(jī)制。設(shè)參與拍賣(mài)的車(chē)輛集合為路口等待的車(chē)輛且未參與過(guò)拍賣(mài)的車(chē)輛集合,記為L(zhǎng)。Q表示車(chē)輛拍賣(mài)結(jié)果集合,初始時(shí)Q=L。領(lǐng)導(dǎo)車(chē)輛使用式(3)計(jì)算當(dāng)前Q下的Shapley 值,并判斷ξ(i,Q)是否≤bi。如果不等式成立,則領(lǐng)導(dǎo)車(chē)輛將選擇車(chē)輛i進(jìn)入車(chē)輛拍賣(mài)結(jié)果集合,反之則不選入。調(diào)整車(chē)輛集合,即Q={i|ξ(i,Q)≤bi},重復(fù)這一過(guò)程直到Q不發(fā)生變化。最終,Q中的車(chē)輛將支付pi=ξ(i,Q)給領(lǐng)導(dǎo)車(chē)輛,證明該機(jī)制是組策略防護(hù)的機(jī)制,保證bi=ui且車(chē)輛參與合作,并避免車(chē)輛/司機(jī)形成虛報(bào)私有信息的聯(lián)盟來(lái)獲取更大的利益。
領(lǐng)導(dǎo)車(chē)輛根據(jù)固定周期或者當(dāng)信號(hào)隊(duì)列為空時(shí)觸發(fā)2.3 節(jié)中的拍賣(mài)機(jī)制,依據(jù)拍賣(mài)結(jié)果集合建立綠燈信號(hào),使用信號(hào)隊(duì)列記錄每一個(gè)綠燈信號(hào)。
每個(gè)綠燈信號(hào)g的結(jié)構(gòu)為((lg,elg),hg)。lg指獲得綠燈信號(hào)g的車(chē)道號(hào),elg是獲得這個(gè)綠燈信號(hào)g的車(chē)道l的總評(píng)價(jià)值。hg是這個(gè)綠燈信號(hào)g覆蓋的這條車(chē)道上的車(chē)輛集合。信號(hào)隊(duì)列由多個(gè)綠燈信號(hào)組成,記為S={gi},i∈N+。信號(hào)隊(duì)列按照gi中elgi排降序。當(dāng)信號(hào)隊(duì)列形成后,領(lǐng)導(dǎo)車(chē)輛取隊(duì)首綠燈信號(hào),并通知hgi集合中的車(chē)輛為綠燈。當(dāng)hgi中的最后一輛車(chē)駛離路口,領(lǐng)導(dǎo)車(chē)輛刪除當(dāng)前隊(duì)首信號(hào)取下一個(gè)綠燈信號(hào)。
每次拍賣(mài)產(chǎn)生新的綠燈信號(hào)集合后,領(lǐng)導(dǎo)車(chē)輛將其合并到信號(hào)隊(duì)列中,合并算法如下:
算法信號(hào)隊(duì)列合并算法
算法說(shuō)明:將參與拍賣(mài)的車(chē)輛集合L依據(jù)車(chē)道號(hào)劃分為子集合,計(jì)算每個(gè)子集合的車(chē)道總評(píng)價(jià)值,形成綠燈信號(hào)gi,產(chǎn)生的綠燈信號(hào)集合記為S′={gi}。在雙向單車(chē)道下一次拍賣(mài)產(chǎn)生4 個(gè)綠燈信號(hào),一個(gè)車(chē)道對(duì)應(yīng)一個(gè)綠燈信號(hào)。算法第1 行,如果S中綠燈信號(hào)數(shù)量為0 或者為1,則直接將S′連接在S后。否則,對(duì)于每一個(gè)S′中的gi在S中找到具有相同車(chē)道的信號(hào)gj,將這2 個(gè)信號(hào)中的車(chē)道總評(píng)價(jià)值相加,車(chē)輛集合合并形成新的gj。最后對(duì)S按照車(chē)道的總評(píng)價(jià)值排降序。
車(chē)道總評(píng)價(jià)值的計(jì)算:如果只以車(chē)道中車(chē)輛的出價(jià)bi計(jì)算,會(huì)導(dǎo)致等待時(shí)間長(zhǎng)但bi值小的車(chē)輛無(wú)法通行,最終使整體的行駛時(shí)間變長(zhǎng)。用l表示車(chē)道,車(chē)道l的總評(píng)價(jià)值記為el值,計(jì)算如下:
其中:Ql表示l車(chē)道中入選拍賣(mài)結(jié)果Q的車(chē)輛集合;Ll表示參與拍賣(mài)的l車(chē)道上的車(chē)輛集合;wi表示i車(chē)輛的等待時(shí)間。通過(guò)參數(shù)控制的方式,使等待時(shí)間與bi值具有可比性。式(4)可以保證等待時(shí)間過(guò)長(zhǎng)的車(chē)輛盡快離開(kāi)路口的同時(shí),bi值高的車(chē)輛能較快通過(guò)。等待時(shí)間是設(shè)備可測(cè)量的值,可通過(guò)內(nèi)置的車(chē)載系統(tǒng)獲得。
模擬實(shí)驗(yàn)用于驗(yàn)證經(jīng)濟(jì)學(xué)特性和評(píng)價(jià)在交通領(lǐng)域內(nèi)的性能。
采用matlab 軟件驗(yàn)證策略防護(hù)特性和組策略防護(hù)的特性,參數(shù)的設(shè)定如下:
1)L是參與一次拍賣(mài)的車(chē)輛集合,在實(shí)際的運(yùn)行中是變化的。這里主要驗(yàn)證組策略的防護(hù)特性,因此采用固定集合L。
2)α是一輛車(chē)參與合作后通過(guò)路口的概率。
3)β表示駕駛員主觀(guān)或客觀(guān)地認(rèn)為自己的評(píng)價(jià)值ui為0,比如駕駛員對(duì)優(yōu)先行駛權(quán)不感興趣,只是遵循現(xiàn)有的路況和交通信號(hào)行駛。即β表示ui=0 的概率。
4)評(píng)價(jià)值ui以β為0 為基礎(chǔ)進(jìn)行評(píng)估,1-β的概率均勻分布在[1,50]。
5)γ1、γ2控制車(chē)輛出價(jià)bi,并隨機(jī)產(chǎn)生0~1 之間的值,如果這個(gè)值小于γ1,則車(chē)輛虛低報(bào)價(jià)bi<ui;如果高于γ2,車(chē)輛虛高報(bào)價(jià)bi>ui;在其他情況下,車(chē)輛報(bào)告真實(shí)評(píng)價(jià)值bi=ui。
圖1 展現(xiàn)的是當(dāng)|L|=50 時(shí),Shapley 值隨α值以及合作車(chē)輛集合規(guī)模的變化,選取了車(chē)輛規(guī)模為1~20的集合。由圖1 中可知:當(dāng)α變小時(shí),Shapley 值變??;當(dāng)合作車(chē)輛集合規(guī)模越大時(shí),不同α值的Shapley值的差別越小。因此當(dāng)集合夠大時(shí),如果1 個(gè)車(chē)輛的bi值能使它進(jìn)入拍賣(mài)結(jié)果集合,α變化帶來(lái)的Shapley 值變化很小,仍然使該車(chē)輛進(jìn)入拍賣(mài)結(jié)果集合??梢?jiàn)α值不會(huì)給拍賣(mài)結(jié)果集合規(guī)模帶來(lái)很大的影響,但3.3 節(jié)中車(chē)輛的支付值pi將取決于特定α下的Shapley 值。
圖1 不同α 值及合作車(chē)輛集合規(guī)模下的Shapley 值Fig.1 Shapley value under different α and the scale of cooperative vehicle set
實(shí)驗(yàn)1探究α、β和拍賣(mài)結(jié)果集合間的關(guān)系。令|L|=50,ui∈[0,50],如前所述α對(duì)拍賣(mài)結(jié)果集合影響不大但決定支付值;拍賣(mài)結(jié)果集合與β值,即ui為0 的車(chē)輛個(gè)數(shù)相關(guān)。在相同的拍賣(mài)結(jié)果集合下α越大說(shuō)明合作意愿越高,支付值pi越高(見(jiàn)表1,β=0.9),但隨著β的減小,不同α下支付的差別越?。ū?,β=0.1)。
表1 α、β 值與拍賣(mài)結(jié)果集合間的關(guān)系Table 1 Relationship between α,β value and collection auction results
實(shí)驗(yàn)2驗(yàn)證策略防護(hù)特性,即車(chē)輛只有在真實(shí)展示其評(píng)價(jià)值時(shí)獲得的效用最大。參數(shù)設(shè)置:|L|=50;α=0.5;β=0.3;γ1=0.4;γ2=0.6;ui∈[0,50]。執(zhí) 行100 次拍賣(mài)機(jī)制,每次隨機(jī)選擇一輛車(chē)謊報(bào)。從圖2中可見(jiàn)謊報(bào)帶來(lái)的效用與真實(shí)帶來(lái)的效用間的差值均≤0,這意味著車(chē)輛不能從謊報(bào)中獲得更多的效用,作為理性的車(chē)輛只會(huì)選擇bi=ui。
圖2 一輛車(chē)謊報(bào)下的效用差Fig.2 Utility difference when one vehicle misreports
實(shí)驗(yàn)3驗(yàn)證組策略防護(hù)的特性,即避免車(chē)輛形成虛報(bào)評(píng)價(jià)值的聯(lián)盟來(lái)獲取更大的利益。執(zhí)行1次拍賣(mài),隨機(jī)選擇車(chē)輛集合謊報(bào),參數(shù)設(shè)置:|L|=20;α=0.5,β=0.3;γ1=0.3;γ2=0.7;ui∈[0,50]。圖3 中有14 輛車(chē)合謀謊報(bào),顯然有些車(chē)輛,如編號(hào)為1、6、7、12、13、14 的車(chē)輛,并不如在真實(shí)場(chǎng)景下獲得的效用大,這些車(chē)輛將不會(huì)停留在合謀集合中,合謀謊報(bào)的聯(lián)盟無(wú)法形成。
圖3 多輛車(chē)合謀謊報(bào)下的效用差Fig.3 Utility difference when multiple vehicles collude to misreport
場(chǎng)景參數(shù)設(shè)置:實(shí)驗(yàn)建立在文獻(xiàn)[9]搭建的模擬平臺(tái)上,車(chē)輛交互方式、消息格式以及道路和車(chē)輛的設(shè)置與該模擬平臺(tái)一致。采用2 種規(guī)模的十字路口區(qū)域,十字路口由4 條雙向單車(chē)道交匯而成,車(chē)道寬7 m,直行、左轉(zhuǎn)、右轉(zhuǎn)共用1 條道。如圖4 所示,規(guī)模1的十字路口區(qū)域?yàn)?07 m ×107 m,每條車(chē)道長(zhǎng)50 m;規(guī)模2 路口區(qū)域?yàn)?07 m×207 m,每條車(chē)道長(zhǎng)100 m。車(chē)身長(zhǎng)度4.5 m,安全間隙2 m,定義交通密度為每分鐘的車(chē)輛數(shù)(輛/min),運(yùn)行時(shí)車(chē)輛的數(shù)量由交通密度控制,模擬程序產(chǎn)生30 min 的車(chē)輛數(shù)據(jù)。使用平均行駛時(shí)間作為交通領(lǐng)域性能的評(píng)價(jià)指標(biāo),比較文獻(xiàn)[6]中實(shí)現(xiàn)的VTL 與本文提出的組策略防護(hù)的虛擬交通燈(VTLA)。行駛時(shí)間為一輛車(chē)從進(jìn)入十字路口區(qū)域到離開(kāi)該區(qū)域所花費(fèi)的時(shí)間。
圖4 十字路口區(qū)域設(shè)置Fig.4 Intersection area setting
實(shí)驗(yàn)4探究參數(shù)VTL_NF_DEFAULT 對(duì)VTL平均行駛時(shí)間的影響。令文獻(xiàn)[6]中實(shí)現(xiàn)的VTL 通過(guò)設(shè)定綠燈通行車(chē)輛數(shù)量閾值的方式制定通行時(shí)間。模擬平臺(tái)使用參數(shù)VTL_NF_DEFAULT 定義該閾值,即1 個(gè)車(chē)道的首車(chē)獲得綠燈后,該車(chē)道有多少輛車(chē)可以跟隨首車(chē)通過(guò)。設(shè)交通密度為70;α=0.5;β=0.3;ui∈[0,50];bi=ui。由 表2 可 知,當(dāng)VTL_NF_DEFAULT 變大,平均行駛時(shí)間則減小,車(chē)輛出價(jià)的高低與行駛時(shí)間無(wú)關(guān)。
表2 參數(shù)VTL_NF_DEFAULT對(duì)VTL平均行駛時(shí)間的影響Table 2 Effect of VTL_NF_DEFAULT on average duration time of VTL
實(shí)驗(yàn)5比較VTL 和VTLA 在不同交通密度下的車(chē)輛平均行駛時(shí)間(s)和改善度。參數(shù)設(shè)置:α=0.5;β=0.3;ui∈[0,50];bi=ui,拍賣(mài)周期設(shè)置為3 s/次,當(dāng)信號(hào)隊(duì)列為空時(shí)也觸發(fā)拍賣(mài)。VTL 的平均行駛時(shí)間受參數(shù)VTL_NF_DEFAULT 的影響,因此可以通過(guò)計(jì)算VTLA 中綠燈信號(hào)的平均車(chē)輛長(zhǎng)度來(lái)設(shè)置參數(shù)VTL_NF_DEFAULT,參數(shù)設(shè)置如表3 所示。例如,當(dāng)交通密度為50 時(shí),VTLA 中綠燈信號(hào)平均車(chē)輛長(zhǎng)度為3.8,設(shè)置參數(shù)VTL_NF_DEFAULT=3,說(shuō)明VTL 中1 次綠燈通行車(chē)輛數(shù)量的閾值為4。
表3 參數(shù)VTL_NF_DEFAULT 的設(shè)置Table 3 Parameter VTL_NF_DEFAULT setting
改善度W的計(jì)算公式如式(5)所示:
其 中:dVTL表示VTL 的平均行駛時(shí)間;dVTLA表 示VTLA 的平均行駛時(shí)間。
如圖5 和圖6 所示為在規(guī)模2 的十字路口中,組策略防護(hù)的虛擬交通燈(VTLA)相對(duì)于VTL 在平均行駛時(shí)間上有較好的改善。當(dāng)交通密度為30 輛/min~80 輛/min 時(shí),VTLA 的改善度超過(guò)30%;對(duì)于評(píng)價(jià)值高的車(chē)輛ui∈[35,50],改善度會(huì)更好,如交通密度為50 輛/min 時(shí),VTLA 改善度超過(guò)50%。
圖5 不同交通密度下的平均行駛時(shí)間Fig.5 Average travel time under different traffic density
圖6 不同交通密度下的平均行駛時(shí)間改善度Fig.6 Average travel time improvement under different traffic densities
由圖5 中規(guī)模1 的十字路口可知,當(dāng)交通密度為10 輛/min~20 輛/min 時(shí),VTLA 和VTL 的平均行駛時(shí)間差別不大;當(dāng)交通密度為30 輛/min~50 輛/min 時(shí),VTLA 改善度超過(guò)50%,對(duì)于評(píng)價(jià)值高的車(chē)輛ui∈[35,50],改善度接近60%(見(jiàn)圖6);但交通密度為60 輛/min~100 輛/min 時(shí),VTLA 和VTL 的平均行駛時(shí)間差別不大,并且明顯不如規(guī)模2 下的性能。原因在于規(guī)模1 的十字路口區(qū)域只有規(guī)模2 的1/2,交通密度為60 輛/min 時(shí),則意味著0.5 h 內(nèi)有1 800 輛車(chē)進(jìn)入規(guī)模1 的區(qū)域,相比于0.5 h 內(nèi)1 800 輛車(chē)進(jìn)入規(guī)模2 的區(qū)域,明顯產(chǎn)生了近似堵車(chē)的效果,所以VTLA 和VTL 性能相似。因此,圖6 不再展現(xiàn)規(guī)模1的十字路口中交通密度在60 輛/min 以上的改善度。
改善度D的計(jì)算式如式(6)所示:
其中:d1表示所有車(chē)輛(ui∈[0,50])的平均行駛時(shí)間;d2表示評(píng)價(jià)值ui∈[35,50]的車(chē)輛平均行駛時(shí)間。
圖7 比較的是兩種策略中評(píng)價(jià)值高的車(chē)輛,即評(píng)價(jià)值為ui∈[35,50],相對(duì)所有車(chē)輛的平均行駛時(shí)間的改善度。
圖7 評(píng)價(jià)值高的車(chē)輛相對(duì)于所有車(chē)輛平均行駛時(shí)間的改善度Fig.7 Improvement of vehicles with high evaluation value relative to average driving time of all vehicles
由于近似堵車(chē),圖7 不再展現(xiàn)規(guī)模1 中十字路口的交通密度在60 輛/min 以上的改善度。高評(píng)價(jià)值的車(chē)輛已無(wú)優(yōu)勢(shì)。圖7 說(shuō)明VTLA 中出價(jià)高的車(chē)輛能較快地離開(kāi)路口區(qū)域,交通密度為30 輛/min~50 輛/min 時(shí)改善度較好,最高可接近25%;VTL 中平均行駛時(shí)間與出價(jià)高低無(wú)關(guān)。
實(shí)驗(yàn)6比較在少量車(chē)輛具有高評(píng)價(jià)值ui的場(chǎng)景下,VTL 和VTLA 在不同的交通密度下高評(píng)價(jià)值ui車(chē)輛的平均行駛時(shí)間改善度。參數(shù)設(shè)置:α=0.5;β=0.9;bi=ui。該場(chǎng)景適用于某些具有強(qiáng)烈通行意愿的車(chē)輛,由于特殊原因希望快速通過(guò)路口,設(shè)ui=1 000。
圖8 顯示在規(guī)模2 的十字路口中,VTLA 相對(duì)于VTL 在平均行駛時(shí)間上有較好的改善;在規(guī)模1 的十字路口中,交通密度為60 輛/min~100 輛/min 時(shí)VTLA 和VTL 的平均行駛時(shí)間差別不大,這與圖5中表現(xiàn)的性能一致。與圖6 類(lèi)似,圖9 僅顯示規(guī)模1中交通密度為10 輛/min~60 輛/min 的改善度。由圖9 及式(6)可知,對(duì)于少量的具有高評(píng)價(jià)值的車(chē)輛,在平均行駛時(shí)間上的改善度較好,對(duì)于車(chē)輛密度在40 輛/min~70 輛/min 時(shí),改善度能超過(guò)20%。但車(chē)輛密度為100 輛/min 時(shí),由于本身已處于近似堵車(chē)狀態(tài),因此具有高評(píng)價(jià)值ui的車(chē)輛由于前面車(chē)子無(wú)法通行而在通行上沒(méi)有優(yōu)勢(shì)。
圖8 具有少量高評(píng)價(jià)值車(chē)輛時(shí)所有車(chē)輛的平均行駛時(shí)間Fig.8 Average duration time of all the vehicles when there are few high valuation vehicles
圖9 具有少量高評(píng)價(jià)車(chē)輛時(shí)高評(píng)價(jià)值車(chē)輛的平均行駛時(shí)間改善度Fig.9 Improvement ratio of high valuation vehicles when there are few high valuation vehicles.
模擬實(shí)驗(yàn)表明本文提出的虛擬交通燈具有策略防護(hù)和組策略防護(hù)的特性,適用于非可測(cè)量因素控制路權(quán)的場(chǎng)景。車(chē)輛只有在真實(shí)展示其私有信息時(shí)獲得的效用最大,且能夠避免車(chē)輛形成虛報(bào)私有信息的聯(lián)盟來(lái)獲取更大的利益。此外,組策略防護(hù)的虛擬交通燈比設(shè)定綠燈通行數(shù)量閾值的虛擬交通燈,在平均行駛時(shí)間上有良好的改善,同時(shí)高評(píng)價(jià)值的車(chē)輛具有較好的平均行駛時(shí)間的改善。組策略防護(hù)的虛擬交通燈涉及貨幣支付,其意義在于每個(gè)車(chē)輛節(jié)點(diǎn)是理性的且明白該過(guò)程,他們將不會(huì)虛報(bào),這也是納什均衡中一致性預(yù)測(cè)的體現(xiàn)。目前虛擬交通燈的實(shí)現(xiàn)是內(nèi)置在車(chē)載系統(tǒng)或手機(jī)中的一個(gè)應(yīng)用,不管是實(shí)際貨幣支付還是虛擬貨幣支付均可利用和接入現(xiàn)有的車(chē)載或手機(jī)中的支付功能。
關(guān)于評(píng)價(jià)值ui的設(shè)定,文獻(xiàn)[3]中設(shè)定車(chē)輛的偏好值均勻分布在[0,1,2,3,4]中,無(wú)貨幣單位;文獻(xiàn)[13]設(shè)定駕駛員的預(yù)算均勻分布在[0,500]之間,貨幣單位為分(cent);文獻(xiàn)[12]設(shè)定駕駛員的出價(jià)遵循均值為100,方差為25 的正態(tài)分布,貨幣單位為分(cent);文獻(xiàn)[3]設(shè)定駕駛員對(duì)等待時(shí)間縮減的估價(jià)遵循均值為1/λ=0.01 的指數(shù)分布,無(wú)貨幣單位??梢?jiàn)評(píng)價(jià)值的設(shè)定并無(wú)統(tǒng)一模式,只是一種在基于貨幣激勵(lì)的方式下產(chǎn)生的駕駛員偏好的貨幣表現(xiàn)。在同一支付系統(tǒng)中只要保證評(píng)價(jià)值和支付值具有可比性,產(chǎn)生激勵(lì)效果即可。
為適用于非可測(cè)量因素影響路權(quán)的場(chǎng)景,提出一種具有組策略防護(hù)特性的虛擬交通燈。通過(guò)令車(chē)輛合作通過(guò)路口,并建模為合作博弈,讓虛擬交通燈中的領(lǐng)導(dǎo)車(chē)輛發(fā)起拍賣(mài),以保證車(chē)輛/司機(jī)的出價(jià)是真實(shí)的評(píng)價(jià)值。利用拍賣(mài)的結(jié)果建立綠燈信號(hào),使用1 個(gè)信號(hào)合并算法整合多次拍賣(mài)產(chǎn)生的綠燈信號(hào),從而產(chǎn)生合理的路權(quán)分配。實(shí)驗(yàn)結(jié)果表明,組策略防護(hù)的虛擬交通燈在保證車(chē)輛提供真實(shí)私有信息、無(wú)合謀行為的基礎(chǔ)上,既改善了整體的平均行駛時(shí)間又保證了高評(píng)價(jià)值的車(chē)輛能較快通過(guò)路口。在實(shí)際應(yīng)用中,城市道路多為三車(chē)道,存在十字形、T型和多路交叉口,且實(shí)體交通燈與無(wú)交通燈的路口通常并存。下一步將研究具有組策略防護(hù)特性的虛擬交通燈在多路口多車(chē)道中的應(yīng)用,通過(guò)優(yōu)化實(shí)體交通燈和虛擬交通燈在路口的配置比例,提升虛擬交通燈的應(yīng)用效果。