楊 航, 鄭彭軍, 鄒亞杰, 翟 犇, 吳 兵
(1. 寧波大學(xué) 海運學(xué)院,浙江 寧波 315211;2. 同濟(jì)大學(xué) 道路與交通工程教育部重點實驗室,上海 201804)
一個成熟的道路交通系統(tǒng)往往體現(xiàn)為混合路網(wǎng)(mixed network)形式[1],包含快速路路網(wǎng)與普通道路網(wǎng)兩個子路網(wǎng),二者相互影響構(gòu)成有機整體。我國不少城市選擇在一定規(guī)模的城市路網(wǎng)基礎(chǔ)上建設(shè)快速路,這給快速路與周圍普通道路的協(xié)調(diào)帶來了更大的難度[2]。道路交通供需矛盾日益突出的直接表現(xiàn)是連續(xù)流和間斷流在快速路和普通道路間的轉(zhuǎn)換不暢導(dǎo)致混合路網(wǎng)擁擠“瓶頸”形成以及整體通行效率的下降[3]。供需矛盾的日益突出是造成混合路網(wǎng)擁堵的表面因素,深層次原因在于兩個子路網(wǎng)之間缺乏成熟穩(wěn)定的協(xié)同管控機制。由于目前兩個子路網(wǎng)的管控隸屬于不同部門,信息實時性共享的不足導(dǎo)致二者間的管控相對獨立,缺乏整體層面的協(xié)同整合。當(dāng)交通需求波動較大時易導(dǎo)致局部擁堵的快速擴散,從而引發(fā)更大規(guī)模的區(qū)域擁堵[4],由此帶來的交通擁擠對本已不堪重負(fù)的城市交通系統(tǒng)來講是雪上加霜,因此對混合路網(wǎng)進(jìn)行同步協(xié)同研究是非常有必要的。
區(qū)域協(xié)同的研究經(jīng)歷了從單點交叉口、交叉口群、交通通道到區(qū)域路網(wǎng)直至混合路網(wǎng)的過程。現(xiàn)有研究主要集中于快速路與相銜接普通道路交叉口[5]、由快速路與相銜接主干道組成的交通通道(traffic corridor)等的協(xié)同優(yōu)化[6]等。在出行需求日益增長的大背景下,針對交通通道以及一定規(guī)模路網(wǎng)的交通流運行管理的研究引起了學(xué)者們的關(guān)注。研究涉及的最優(yōu)方案一般由快速路與普通道路的最優(yōu)策略組合產(chǎn)生,而二者在優(yōu)化目標(biāo)以及約束條件上存在不小的差異性。路網(wǎng)各自最優(yōu)方案易受到另一個路網(wǎng)的輸出流量影響,使得實際約束條件與假設(shè)約束條件差異過大,由此引起車輛在關(guān)鍵節(jié)點處的排隊溢出或回流[7]。這樣的非集中化管理模式很難在“一張路網(wǎng)”的層面實現(xiàn)同一時空維度下的同步優(yōu)化,從而造成“1+1<2”的結(jié)果[8]。
本文針對混合路網(wǎng)的異質(zhì)性交通流特征,基于同一時空維度剖析混合路網(wǎng)中交通管理者和道路用戶的角色定位,通過構(gòu)建角色交換函數(shù),在優(yōu)化閉環(huán)中增加了用戶對于策略更新的實時反饋,并基于模型預(yù)測控制(model predictive control,MPC)架構(gòu)建立起管理者與用戶角色可變的混合路網(wǎng)集中化協(xié)同優(yōu)化模型,改變了現(xiàn)有優(yōu)化邏輯下管理者與用戶之間單一的領(lǐng)導(dǎo)-跟隨關(guān)系,改善了運行管理中時常出現(xiàn)的“各自為戰(zhàn)”情況,可為城市道路交通制定相關(guān)決策提供理論依據(jù)。
混合路網(wǎng)協(xié)同優(yōu)化過程如圖1 所示,對于道路駕駛者來說,混合路網(wǎng)中存在著多個駕駛行為決策點(圖中虛線框),包含交叉口和匝道口兩類,道路用戶可以根據(jù)個人駕駛經(jīng)驗和交通管理者發(fā)布的最優(yōu)方案等信息決定自己下一步的路徑選擇。當(dāng)用戶選擇新的路徑之后,交通流將會在各條路徑上進(jìn)行重新加載。與此同時,交通管理者每一次更新最優(yōu)策略之后,相關(guān)的管控方案就會對應(yīng)改變進(jìn)而引起交通流重新分布。
圖1 混合路網(wǎng)協(xié)同優(yōu)化過程Fig. 1 Integrated optimization procedure for mixed networks
從協(xié)同優(yōu)化過程中可以看出,路徑選擇和控制策略的協(xié)同是混合路網(wǎng)協(xié)同的核心,因此混合路網(wǎng)協(xié)同管控問題的實質(zhì)是交通分配和信號控制的組合問題[9-11],簡稱CAC(combined traffic assignment =signal control)問題。把協(xié)同問題抽象成優(yōu)化目標(biāo)為混合路網(wǎng)出行成本下降、約束條件為交通流運行管控約束的數(shù)學(xué)問題。CAC問題經(jīng)過多年的研究,已經(jīng)具備了較為成熟的求解思路和建模辦法,對應(yīng)的求解過程見圖2。
圖2 交通控制與交通分配組合問題的求解框架Fig. 2 Regular solving of CAC problem
經(jīng)典CAC問題的求解架構(gòu)包含三個必要成分,分別是路徑選擇方案、路網(wǎng)底層加載模型、控制優(yōu)化策略[12]。對于CAC 問題的求解方法大體上可以分為全局優(yōu)化模型和迭代過程(iterative optimization and assignment procedure,IOA Procedure)兩類[13]。隨著路網(wǎng)范圍的不斷擴大以及優(yōu)化復(fù)雜性的不斷增加,全局優(yōu)化模型在CAC問題求解中的使用比重逐漸上升,采用雙層規(guī)劃模型是其中較為廣泛使用的方法:上層是路網(wǎng)信號優(yōu)化,下層則是交通分配,上下層間存在嚴(yán)格的領(lǐng)導(dǎo)-跟隨關(guān)系,即優(yōu)化過程以管理者發(fā)布的優(yōu)化方案為主導(dǎo),而將用戶的反饋參數(shù)作為上層的衍生變量。這種管控模式下的交通狀態(tài)如若惡化,管理者可能存在以下困惑:是更新后的管控策略不適應(yīng)當(dāng)前的交通需求?還是很多用戶并未采取最優(yōu)方案,進(jìn)而導(dǎo)致交通狀態(tài)沒有往預(yù)期的方向發(fā)展?圖3 對混合路網(wǎng)CAC 問題進(jìn)行進(jìn)一步剖析,混合路網(wǎng)協(xié)同管控的過程是體現(xiàn)用戶利益的用戶均衡與體現(xiàn)管理者策略的系統(tǒng)最優(yōu)間不斷尋找平衡點的過程,因此其本質(zhì)是管理者與用戶間的動態(tài)博弈,需基于二者間角色關(guān)系建立起不局限于絕對領(lǐng)導(dǎo)-跟隨關(guān)系的統(tǒng)一模型。
圖3 混合路網(wǎng)CAC問題求解思路Fig. 3 Resolution idea of CAC problem in mixed networks
Model 中領(lǐng)導(dǎo)者占據(jù)強有力的決策位置,跟隨者要對領(lǐng)導(dǎo)者宣布的策略和方案作對應(yīng)的反應(yīng)和選擇。在有信號控制的路網(wǎng)中,管理者位于上層的雙層規(guī)劃模型[15]的關(guān)鍵變量符號及對應(yīng)含義如下:Lj為出口在交叉口的路段集合;Λ 為上下層的共享變量;xa為路段a 上的流量;qrs為OD 對(r,s)上的總流量需求為OD 對(r,s)上路徑k′的流量;為0-1 變量,路段a 在OD 對(r,s)的路徑上時,,否則為進(jìn)口道的綠信比;分別為進(jìn)口道的最大和最小容許綠信比:
Von Stackelberg[14]提出的Stackelberg Leading
式(1)—(9)中:Tctr為第k 個時間區(qū)段的持續(xù)時長;I為入口匝道數(shù)量,i 為入口匝道編號; J 為出口匝道數(shù)量;j 為出口匝道編號;Z 為混合路網(wǎng)內(nèi)快速路總數(shù); z 為快速路編號; L 為快速路元胞自動機模型(ACTM)劃分出的元胞總量;l 為ACTM 中的元胞序列編號;xl(k)為第k個時間區(qū)段內(nèi)元胞l中的車流量;nz(k)為第k個時間區(qū)段內(nèi)快速路z中的車流量;non,i(k)為第k個時間區(qū)段內(nèi)入口匝道i中的車流量;noff,j(k)為第k個時間區(qū)段內(nèi)出口匝道j中的車流量;nz,0為初始時刻快速路z中的車流量;xl,0為初始時刻元胞l中的車流量;non,i,0為初始時刻出口匝道i中的車流量;noff,i,0為初始時刻出口匝道j 中的車流量。當(dāng)信號控制方案實施一段時間后,一開始作為領(lǐng)導(dǎo)地位的管理者的主觀愿望:路網(wǎng)交通費用總體最小往往會逐漸偏離所設(shè)定的優(yōu)化目標(biāo)。為了描述管理者與用戶在組合問題中的非對稱關(guān)系,建立用戶位于上層的雙層規(guī)劃模型:
本文提出的角色變化是通過不同交通狀態(tài)下系統(tǒng)最優(yōu)與用戶均衡的優(yōu)化模式切換實現(xiàn)管理者與用戶間的動態(tài)博弈過程。采用用戶服從率表征不同OD 對內(nèi)各路徑所承擔(dān)的流量壓力是否處于相對均衡狀態(tài),基于設(shè)定的閾值找出控制策略無法滿足當(dāng)前需求的時刻并在該時刻點改變領(lǐng)導(dǎo)-跟隨關(guān)系,設(shè)計思路如圖4所示。
圖4 基于用戶服從率的管理者與用戶間的信息交互Fig. 4 Communication between authority and users based on compliance rate
如均衡性指標(biāo)超出設(shè)定閾值,則對管理者和用戶的領(lǐng)導(dǎo)-跟隨關(guān)系進(jìn)行轉(zhuǎn)換,否則繼續(xù)采用原有優(yōu)化模型,保持原角色關(guān)系和對應(yīng)的領(lǐng)導(dǎo)-跟隨關(guān)系不變。研究擬采用的角色變化機制設(shè)計如下(圖5):
圖5 混合路網(wǎng)管理者與用戶間的角色變化機制Fig. 5 Level-change mechanism between authority and users in mixed networks
在Yin和Yang[16]提出的logit模型基礎(chǔ)上進(jìn)行改進(jìn),提出新的拓展式計算用戶服從率:
式中:ηr(t)為t時刻從r節(jié)點行駛至對應(yīng)終點的預(yù)測行程時間;τrs(t)為t 時刻路徑r-s 上的出行成本Γ(r)為與節(jié)點r相銜接的節(jié)點集合。為了更好地模擬普通道路間斷流的特征,進(jìn)一步將普通道路上的信號延誤和出行時間的動態(tài)性特征考慮在內(nèi),建立超路徑法(hyper-path)對時刻各路徑的預(yù)測行程時間值進(jìn)行實時更新:
式中:μh′r(t)為t 時刻從上游節(jié)點h′行駛至下游銜接節(jié)點r 在r 上的臨時標(biāo)記值(出行成本);?ωl′r′rs為t 時刻路徑r-s 上交叉口r′處由信號燈引起的延誤大??;ωl′r′為交叉口r′第l′相位的時長;ηrs(t)為t 時刻從r 節(jié)點行駛至下游節(jié)點s的預(yù)測行程時間。
在角色交換函數(shù)基礎(chǔ)上設(shè)計集中化優(yōu)化框架,通過模型預(yù)測控制(MPC)實現(xiàn)角色變化過程及整體優(yōu)化模型的迭代、求解?;旌下肪W(wǎng)集中化協(xié)同管控優(yōu)化模型的MPC運行原則如圖6所示。
圖6 混合路網(wǎng)集中化協(xié)同優(yōu)化模型Fig. 6 Centralized coordinated optimization model for mixed networks
3.1.1 測試路網(wǎng)
算例采用的混合路網(wǎng)網(wǎng)絡(luò)結(jié)構(gòu)如圖7所示。該混合路網(wǎng)是在Van den Berg[18]所采用的路網(wǎng)結(jié)構(gòu)基礎(chǔ)上拓展而來,在原基礎(chǔ)上去掉了無信號控制交叉口,全部改為信號控制交叉口,路網(wǎng)以位于荷蘭首都、歐洲第三大城市阿姆斯特丹市中心的一片同時包含城市快速路(高架形式)、普通道路(均位于地面)的路網(wǎng)為基礎(chǔ),符合大城市要求和混合路網(wǎng)的所有結(jié)構(gòu)特征,因此可以作為算例來說明本文所設(shè)計的角色可變優(yōu)化模型的有效性。
圖7 混合路網(wǎng)測試場景Fig. 7 Testing area of mixed network
路網(wǎng)總共設(shè)置有兩個OD對,每一OD對上可供用戶選擇的出行路徑如表1 所示。算例中,快速路的起點初始用戶流量需求設(shè)置為3 000 veh.h-1,而普通道路的起點初始用戶流量需求設(shè)置為1 000 veh.h-1。在兩個OD 對的起始點O1和O2分別設(shè)置有兩個可變信息板(VMS1和VMS2)用來顯示和傳達(dá)路網(wǎng)管理者給出的當(dāng)前階段的建議最優(yōu)出行路徑信息。
表1 算例不同OD對的路徑集合Tab. 1 Set of OD pair in case study
根據(jù)Papageorgiou等[19]的研究結(jié)論,若用戶對于管理者指示信息的執(zhí)行人數(shù)比例在0.6~0.7之間時,則認(rèn)為路網(wǎng)在該OD對各路徑上的流量分配是均衡的,因此本文將0.65作為角色變化激發(fā)閾值,變化過程如圖8所示。圖中,VMS表示可變信息板。
圖8 算例對應(yīng)的管理者與用戶間的角色變化過程Fig. 8 Level-change procedure of authority and users in case study
3.1.2 對照模型設(shè)計
為充分說明LC-MPC 模型的有效性,通過經(jīng)典模型、相關(guān)額外約束、控制邏輯相組合搭配的模式,構(gòu)建6個對照模型(S1~S6)。本文設(shè)計的模型對應(yīng)表2中的S7。
表2 設(shè)計模型和對照模型Tab. 2 Designed model and its benchmarks
S1 將經(jīng)典ALINEA 控制算法[20]用于兩個入口匝道,匝道控制器決定了能夠駛?cè)肟焖俾返能嚵髁縡on,l(k+1),該值與當(dāng)前元胞l內(nèi)實際累計車流量和預(yù)期累計車流量的差值xl(k)-xexp正相關(guān),計算表達(dá)式如下:
S2 在S1 基礎(chǔ)上引入了入口匝道處的排隊長度約束,以避免入口排隊車流溢出加劇相銜接普通道路和交叉口的擁堵。排隊長度約束如式(24)。通過引入控制參數(shù)ψ,將入口匝道處的排隊長隊與最大排隊長度non,i,max的比值始終控制在一定范圍內(nèi),降低快速路入口匝道的排隊長度溢出至普通道路的概率。Mon,i,l,max為屬于區(qū)域i的入口匝道元胞l中能夠進(jìn)入的最大車輛數(shù),veh。
S3 中匝道控制器采用的控制算法與式(23)相同,S3 中MPC 僅針對地面道路中的流量變量進(jìn)行優(yōu)化迭代,而出入口匝道流量都由式(23)單獨計算決定。S4 在S3 基礎(chǔ)上采用了加入排隊長度約束的式(24)。S5 分別在快速路網(wǎng)和普通道路網(wǎng)內(nèi)采用MPC,但不考慮二者間的協(xié)同,這相當(dāng)于把CAC 問題分解成了兩個獨立的子問題:①僅通過入口匝道控制器降低快速路的總體出行成本;②僅通過路徑選擇模型降低城市普通道路的總體出行成本。S6在S5 的基礎(chǔ)上加入了快速路網(wǎng)與普通道路網(wǎng)間的協(xié)同因素,其中匝道控制器僅通過調(diào)整入口匝道處的匝道控制率法對當(dāng)前目標(biāo)函數(shù)中的快速路部分的出行成本進(jìn)行優(yōu)化,而xa和ta則作為前一個滾動窗口的輸出變量,在當(dāng)前MPC 滾動窗口中成為預(yù)設(shè)常量。
基于式(1)—(24)對算例路網(wǎng)總體出行成本進(jìn)行優(yōu)化,對照組模型和LC-MPC 模型的對比結(jié)果見表3。
表3 算例不同模型的優(yōu)化結(jié)果Tab. 3 Optimization performance of all models
在所有7個模型中,設(shè)計模型LC-MPC的模型表現(xiàn)最優(yōu),將路網(wǎng)的總體出行成本降至8 013.5。而因為同樣加入了快速路與普通道路間的協(xié)同成分,CD-MPC的模型表現(xiàn)是所有模型中次優(yōu)的。在實現(xiàn)了完全集中化的同步協(xié)同優(yōu)化之后,S7比起S6在總出行成本上降低了7 %。S5模型表現(xiàn)最為遜色,比起LC-MPC有著接近四分之一的優(yōu)化差異,非集中化非協(xié)同模式下的優(yōu)化框架在置入集中化的MPC中央控制器之后,在優(yōu)化邏輯上可能存在相互矛盾的情況,因此MPC在這個場景下非但沒有起到優(yōu)化作用,反而產(chǎn)生了負(fù)優(yōu)化,這對于實際運行管理有著很大的提醒和借鑒意義。目前很多城市在路網(wǎng)協(xié)同管控(不局限于大城市混合路網(wǎng))中均采用的類似S5的方案,這種管控模式在某種程度上會加劇路網(wǎng)擁堵,從而進(jìn)一步降低用戶對管理者發(fā)布的誘導(dǎo)信息的信任程度,導(dǎo)致用戶服從率下降,帶來的后果就是管理者無法判斷當(dāng)前路網(wǎng)擁堵究竟是管控策略本身不合理造成的,還是較多用戶不采納建議的出行路徑而造成的,由此形成惡性循環(huán)。此外,添加入口匝道處的排隊長度限制確實可以有效降低總體路網(wǎng)出行成本,即使是在非集中化的優(yōu)化框架中該約束同樣有正優(yōu)化作用。
圖9展示了路網(wǎng)協(xié)同優(yōu)化過程中VMS1和VMS2上的用戶服從率值隨時間的變化過程,初始時刻二者均設(shè)定為0.8。圖10顯示了不同時刻系統(tǒng)根據(jù)用戶需求和均衡閾值所選取的對應(yīng)角色關(guān)系。結(jié)果顯示,在第一次角色變化發(fā)生之前,兩塊可變信息板對應(yīng)的用戶服從率值均從開始的0.8緩慢降至0.6左右,這意味著如果不采取任何措施任由交通狀態(tài)自行演化和發(fā)展,即便是未在高峰時段內(nèi),用戶服從率也是很難維持在一個穩(wěn)定范圍內(nèi)。而在第一次角色變化發(fā)生之后,兩塊可變信息板的用戶服從率各自經(jīng)歷了一小段時間范圍內(nèi)的漲幅,分別在t=8和t=10時刻的末尾達(dá)到了接近0.7的水準(zhǔn),而在這之后一直到混合路網(wǎng)交通總流量在t=15時刻達(dá)到峰值之前,兩塊可變信息板上的用戶服從率值均是逐漸下降。這意味著在進(jìn)入高峰時段之前,相當(dāng)一部分比例的用戶可能更愿意根據(jù)自己以往的經(jīng)驗和感知行程時間來選擇出行線路,而非選擇管理者的建議最優(yōu)路線,這也很可能是現(xiàn)實中造成用戶服從率下降和高峰時段內(nèi)擁堵進(jìn)一步擴散的主要原因之一。當(dāng)進(jìn)入高峰時段之后,MPC中央控制器重新選擇了管理者-用戶的系統(tǒng)最優(yōu)模式,在這一階段中用戶更多地需要根據(jù)管理者發(fā)布的建議最優(yōu)路徑出行。第二次角色變化之后,兩塊可變信息板的用戶服從率均上升至0.75左右,而在這之后一直到第三次角色變化時刻t=24之前,二者的用戶服從率均緩慢下降至0.6左右,這一變化與擁堵消散有關(guān),當(dāng)擁堵程度緩解之后駕駛者對于感知行程時間和駕駛經(jīng)驗的依賴性有所上升,從而造成用戶服從率的降幅。
圖9 VMS1和VMS2的用戶服從率分布Fig. 9 Distribution of compliance rate on VMS1 and VMS2
圖10 管理者與用戶的角色變化過程Fig. 10 Level-change procedure between authority and users
從圖9和圖10可以看出,在加入管理者與用戶的角色變化機制之后,對于提升管理者發(fā)布信息的用戶服從率、進(jìn)而提升整體路網(wǎng)的性能有直接的促進(jìn)作用。角色變化的影響依然體現(xiàn)在接近高峰、高峰以及擁擠消散這三個時段。在這三個時段中,道路交通狀態(tài)變化較快,因此作為均衡性指標(biāo)的用戶服從率在這個時段內(nèi)波動也隨之較大,若不采取主動管控措施,該指標(biāo)對應(yīng)數(shù)值會不可避免地呈現(xiàn)出下降趨勢,而角色變化機制的存在則在很大程度上緩解了這一過程,使得VMS1和VMS2的用戶服從率在下降至0.6左右時均會獲得不小的提升,從而緩解了路網(wǎng)不均衡性的擴散。同時,在加入管理者與用戶的角色可變機制后,路網(wǎng)的總出行成本亦有較大幅度的下降,說明角色可變對于路網(wǎng)運行的效率性和均衡性都有正效應(yīng)。
(1)結(jié)合混合路網(wǎng)的道路網(wǎng)絡(luò)結(jié)構(gòu)以及交通異質(zhì)性特征,將復(fù)雜的大規(guī)模路網(wǎng)的交通流協(xié)同優(yōu)化問題抽象為信號控制-交通分配的組合問題(CAC問題),為建立集中化的混合路網(wǎng)協(xié)同優(yōu)化模型奠定了基礎(chǔ)。
(2)對管理者和用戶在混合路網(wǎng)協(xié)同優(yōu)化活動中的角色關(guān)系進(jìn)行了分析,闡述了二者在協(xié)同過程中的角色對稱性和不對稱性,確立了混合路網(wǎng)環(huán)境下管理者與用戶間的角色變化機制,對新的管控優(yōu)化模式進(jìn)行了探索。
(3)建立了管理者與用戶角色可變的Stackelberg博弈模型組,將用戶服從率作為角色變化的均衡性指標(biāo)并建立對應(yīng)的閾值激發(fā)函數(shù),通過管理者-用戶以及用戶-管理者模式的切換實現(xiàn)雙層規(guī)劃模型上下層關(guān)系的互換,并引入集中化控制平臺MPC,在中央控制器中實現(xiàn)同一時空維度下“一張路網(wǎng)”的同步協(xié)同管控。
(4)考慮了管理者預(yù)測行程時間和用戶感知行程時間差異的角色可變模型能夠?qū)⒂脩舴穆示S持在一定水平范圍內(nèi),使得該均衡指標(biāo)值不會持續(xù)下降從而導(dǎo)致路網(wǎng)管控的優(yōu)化閉環(huán)進(jìn)入一個惡性循環(huán)的模式。同時,設(shè)計的模型相較于對照模型框架,對于降低總體路網(wǎng)成本也有著顯著作用。
(5)角色變換的發(fā)生與交通狀態(tài)的改變有著緊密關(guān)聯(lián),基本發(fā)生在交通狀態(tài)變化(接近高峰、進(jìn)入高峰、擁堵消散)的時刻點附近,因此在實際運行管理中,若無法及時獲取大量用戶反饋的流量模式特征參數(shù)指標(biāo),也可根據(jù)交通狀態(tài)的大致變化來大致確定管理者和用戶的角色變化時刻,從而調(diào)用不同優(yōu)化邏輯的管控模型。
作者貢獻(xiàn)聲明:
楊航:代碼設(shè)計,模型設(shè)計和論文撰寫。
鄭彭軍:數(shù)據(jù)整理,代碼設(shè)計和論文撰寫。
鄒亞杰:數(shù)據(jù)整理,代碼設(shè)計和論文撰寫。
翟犇:數(shù)據(jù)整理,代碼設(shè)計和論文撰寫。
吳兵:方法構(gòu)思,代碼設(shè)計和論文撰寫。