王福建,盧一笑,金盛
(浙江大學(xué),建筑工程學(xué)院,杭州310058)
行程時間及其可靠性是交通運行狀態(tài)評價、交通系統(tǒng)性能評估的重要指標(biāo)之一。從管理者角度來說,通過對行程時間的分析是支撐交通規(guī)劃、設(shè)計與管理政策制定的重要基礎(chǔ);從出行者角度來說,行程時間的信息獲取是制定出行計劃、選擇出發(fā)時刻、規(guī)劃出行路徑的重要依據(jù)。
關(guān)于行程時間分布的研究,最初的觀點認(rèn)為正態(tài)分布是合適的。之后,許多研究觀察到行程時間存在偏態(tài)分布現(xiàn)象,因此對數(shù)正態(tài)分布、Weibull分布、Gamma 分布等被應(yīng)用到擬合行程時間數(shù)據(jù)中。Taylor等[1]對阿德萊德兩條主干道的GPS數(shù)據(jù)進(jìn)行分析得到,雙參數(shù)Burr分布較對數(shù)正態(tài)分布可以更好地表示行程時間右偏的特點,且這種分布還為使用基于百分位值的可靠性評價指標(biāo)提供了計算優(yōu)勢。Susilawati[2]隨后表明,Burr 分布可以擬合大部分觀測到的行程時間變異性。向文凱[3]對比了伽馬、正態(tài)、對數(shù)正態(tài)、Weibull 分布后得到Burr 分布是最為理想的城市行程時間分布擬合模型。Zhen[4]分析了不同時段、不同星期、不同位置及不同天氣條件下的行程時間分布,結(jié)果表明,Burr 分布的擬合效果最佳。城市道路的交通流更為復(fù)雜,由于受到信號交叉口、出入口及行人過街等因素影響,呈現(xiàn)出多峰特性,混合分布模型[5-6]被認(rèn)為可以更好地反映城市間斷流行程時間特征,Peng[7]表明混合概率模型不僅具有較好的統(tǒng)計擬合效果,且能反應(yīng)交叉口信號控制的影響。綜合以上研究,Burr分布相較于其他單峰分布模型的擬合效果更好,在復(fù)雜道路條件下,混合分布模型可以更好地描述行程時間分布特征。
進(jìn)一步,有研究發(fā)現(xiàn)行程時間特性與交叉口數(shù)量或者路段長度之間存在一定的關(guān)系。Taylor等[8]驗證了城市主干道上的車輛行程時間服從雙峰分布,但其進(jìn)一步研究發(fā)現(xiàn),將處于同一信號控制系統(tǒng)下的路段連接起來,其行程時間分布的雙峰性概率降低,在部分長路段上,雙峰性現(xiàn)象被打破。同樣,劉迎[9]通過GPS數(shù)據(jù)擬合發(fā)現(xiàn),隨著距離增大,交叉口數(shù)量增多,行程時間雙峰分布特征減弱,紅燈延誤對行程時間的影響減小。陳明明[10]分析發(fā)現(xiàn),緩沖時間指標(biāo)與路段長度呈負(fù)相關(guān)關(guān)系,即路段越長,可靠性越高。由于數(shù)據(jù)質(zhì)量有限,已有研究大多是研究單個路段或整條路徑的行程時間特性,缺少對行程時間特性與其影響因素之間的定量分析。
本文基于杭州市蕭山區(qū)的車牌識別數(shù)據(jù)獲得不同交叉口數(shù)量、不同路段長度的行程時間數(shù)據(jù),利用Burr 分布和高斯混合分布分別對路段和干線的行程時間分布進(jìn)行擬合和特性分析。進(jìn)一步利用灰色關(guān)聯(lián)方法挖掘交叉口數(shù)量、干線長度和干線流量與行程時間分布特性及可靠性之間的關(guān)系。
杭州市蕭山區(qū)各交叉口布設(shè)了電子警察攝像機(jī),一般布設(shè)在信號交叉口進(jìn)口道停止線上游約20 m的位置,其抓拍系統(tǒng)可以拍攝車輛通過停車線時的視頻信息,自動識別得到車牌數(shù)據(jù),因此可以收集車輛牌照、過車時刻、交叉口點位、進(jìn)口道方向等信息。通過車牌匹配計算得到車輛通過兩個連續(xù)交叉口的時間,從而獲得車輛在目標(biāo)路段上的行程時間。
本文路段行程時間是指車輛從上游交叉口停止線到下游交叉口停止線的運行時間,多信號交叉口干線行程時間是指車輛通過多個連續(xù)信號交叉口的運行時間。
通過上、下游交叉口識別數(shù)據(jù)進(jìn)行車牌匹配,計算得到路段行程時間數(shù)據(jù)。由于紅燈時間停車影響,車牌識別數(shù)據(jù)存在重復(fù)冗余數(shù)據(jù),故需對車牌、卡口名稱等信息一致且相鄰檢測時間差小于閾值的數(shù)據(jù)進(jìn)行去重處理。同時需要去除行程時間異常的數(shù)據(jù),剔除未準(zhǔn)確沿路段行駛且發(fā)生停車的車輛數(shù)據(jù),以避免產(chǎn)生偏差。行程時間異常值的處理過程分為以下幾個步驟[11]。
Step 1 設(shè)定時間窗為10 min。
Step 2 粗過濾,剔除明顯異常值。設(shè)置行程時間上限值,將車輛行車速度為5 km·h-1所產(chǎn)生的行程時間值記為上限值Tu,計算公式為
式中:Li為第i個路段的長度;Vl為該路段車輛行車速度下限值,即5 km·h-1。設(shè)置行程時間下限值,選取行程時間的第10%分位值作為下限值TL。通過設(shè)置行程時間上、下限值,剔除不在此區(qū)間的數(shù)據(jù)。
Step 3 利用萊茵達(dá)(即3σ)準(zhǔn)則對數(shù)據(jù)進(jìn)行過濾,選取第j個時間窗內(nèi)的行程時間樣本集TT, j,計算TT, j中數(shù)據(jù)的平均值Tmean和標(biāo)準(zhǔn)差判別依據(jù)為:若,則該數(shù)據(jù)的誤差較大,屬于異常數(shù)據(jù),應(yīng)剔除;若,則該數(shù)據(jù)在可接受范圍內(nèi),應(yīng)保留。通過萊茵達(dá)準(zhǔn)則過濾掉距均值3 倍標(biāo)準(zhǔn)差以外的行程時間數(shù)據(jù),重復(fù)多次,可以有效去除行程時間異常值。
根據(jù)以上步驟,設(shè)定時間窗為10 min,根據(jù)行程時間上、下限值剔除明顯異常值后,重復(fù)4 次Step 3對行程時間數(shù)據(jù)異常值進(jìn)行過濾使數(shù)據(jù)樣本趨于穩(wěn)定,即完成行程時間數(shù)據(jù)處理,效果如圖1所示。
圖1 數(shù)據(jù)處理效果Fig.1 Effect of data processing
為減弱交叉口信號控制因素的影響,選取蕭山區(qū)內(nèi)3條信號協(xié)調(diào)控制的干線:市心路(山陰路-建設(shè)四路段)、市心路(振寧路-奔競大道路段)、金雞路(金惠路-恒楓路段)為研究對象。編號各交叉口表示研究路段,例如山陰路交叉口-金城路交叉口路段表示為A1-A2。各交叉口名稱及編號如表1所示,位置如圖2所示。
表1 交叉口名稱及編號Table 1 Name and number of intersection
圖2 交叉口示意圖Fig.2 Intersection diagram
選取2019年3月高峰(7:00-9:00)和平峰(13:00-15:00)時段南向北車流的行程時間數(shù)據(jù),統(tǒng)計每條路段長度,以及樣本量、行程時間的均值、中位數(shù)、標(biāo)準(zhǔn)差和變異系數(shù)(標(biāo)準(zhǔn)差/均值),A1-A7路線上各路段的統(tǒng)計結(jié)果如表2所示。
表2 路段統(tǒng)計信息Table 2 Link statistical information
已有研究表明,行程時間分布往往服從正態(tài)、對數(shù)正態(tài)等單峰分布形式,但觀察數(shù)據(jù)發(fā)現(xiàn),所觀察到分布的尾部比正態(tài)分布或?qū)?shù)正態(tài)分布的尾部更大,且部分路段的行程時間分布具有明顯的雙峰分布特征,甚至三峰現(xiàn)象。根據(jù)相關(guān)文獻(xiàn),對單峰分布的行程時間數(shù)據(jù),Burr分布可以較好地擬合行程時間分布的右偏且上尾較長的特征[12],高斯混合分布可以更好地描述多峰現(xiàn)象[5]。
(1)Burr分布
Burr分布作為一種失效模型,廣泛地應(yīng)用于醫(yī)學(xué)、金融和保險等領(lǐng)域,Susilawati[8]將Burr 分布應(yīng)用于行程時間分布擬合,結(jié)果發(fā)現(xiàn),其擬合效果要優(yōu)于正態(tài)分布和對數(shù)正態(tài)分布。三參數(shù)Burr(XII型)分布的概率密度函數(shù)表達(dá)式為
式中:x為隨機(jī)變量;α為尺度參數(shù);k為形狀參數(shù),用于描述曲線的形狀變化;c為位置參數(shù),用于描述曲線位置的變化,特別是曲線峰值的位置。
(2)高斯混合模型
高斯混合模型(Gaussian Mixture Model,GMM)是將一個事物分解為若干基于高斯概率密度函數(shù)形成的模型。設(shè)隨機(jī)變量x,則高斯混合模型的表達(dá)式為
式中:m為高斯混合模型中的成分個數(shù);μm為第m個高斯分布的均值;Σm為第m個高斯分布的協(xié)方差;ωm為第m個模型的權(quán)重系數(shù),0<ωm<1;為第m個高斯成分的分布。
使用Burr 分布和二元混合高斯分布分別對早高峰和平峰共36 組路段行程時間數(shù)據(jù)進(jìn)行擬合,并進(jìn)行K-S 檢驗,P值越大,說明分布擬合效果越顯著。決策值H=0 表示接受通過檢驗的假設(shè),H=1表示拒絕通過檢驗的假設(shè),結(jié)果如表3所示。
表3 各路段行程時間分布擬合結(jié)果Table 3 Fitting results of travel time distribution of each link
根據(jù)擬合結(jié)果可知,在顯著性水平為0.05 時,36 條路段中只有5 條路段使用Burr 分布擬合通過了顯著性檢驗,接受率為13.89%;而有34條路段使用二元高斯混合分布擬合通過了顯著性檢驗,接受率為94.44%,高斯混合分布較Burr 分布有更好的擬合結(jié)果。高峰和平峰時段的路段行程時間分布具有相似特點,車輛由于受到道路線型設(shè)計和交叉口信號控制的影響,部分車輛通過交叉口時可能需要經(jīng)歷兩個甚至更多的信號周期,使車流出現(xiàn)間斷流特征,行程時間分布出現(xiàn)雙峰現(xiàn)象,因此高斯混合分布可以更好地描述路段行程時間分布的特征。
通過相關(guān)性分析,路段長度與行程時間均值、中位數(shù)、標(biāo)準(zhǔn)差及變異系數(shù)之間存在一定的相關(guān)性,其相關(guān)系數(shù)分別為:0.8741、0.8938、0.6034、-0.6076,說明路段長度與行程時間特性之間具有強(qiáng)相關(guān)性,路段長度與行程時間均值、中位數(shù)和標(biāo)準(zhǔn)差呈正相關(guān)關(guān)系,與變異系數(shù)呈負(fù)相關(guān)關(guān)系。
分析路段行程時間分布特征可以發(fā)現(xiàn),路段長度較短時,由信號控制引起的延誤會對路段行程時間造成較大影響,行程時間分布具有明顯的雙峰現(xiàn)象,雖然行程時間較短,但波動性大。隨著路段長度增加,交叉口信號控制延誤對路段行程時間的影響減小,行程時間雙峰現(xiàn)象減弱,呈現(xiàn)出單峰分布特性,波動性減小。
3.1.1 擬合結(jié)果
分別使用Burr 分布模型和二元高斯混合分布模型對36 組不同干線、不同交叉口數(shù)量的數(shù)據(jù)進(jìn)行分布擬合及K-S 檢驗,并通過EM 算法求解二元高斯混合分布擬合參數(shù)結(jié)果,表4為部分行程時間數(shù)據(jù)(分別以A1、B1、C1為干線起點)擬合后的K-S檢驗結(jié)果。
表4 兩種分布模型的K-S檢驗結(jié)果Table 4 K-S test results of two distribution models
3.1.2 結(jié)果分析
K-S檢驗得到的P值越大,說明分布擬合結(jié)果越好。在顯著水平為0.05 時36 組數(shù)據(jù)中:有31 組數(shù)據(jù)利用Burr分布擬合的結(jié)果通過了顯著性檢驗,接受率為86.11%;有36 組數(shù)據(jù)利用高斯混合分布擬合結(jié)果通過了顯著性檢驗,接受率為100%。對于多信號交叉口干線行程時間數(shù)據(jù),無論高峰時段還是平峰時段,高斯混合分布均能通過顯著性檢驗,同時Burr 分布也表現(xiàn)出較好的擬合效果,可以更好地描述行程時間高峰值和右偏的分布特征。
為進(jìn)一步分析干線行程時間的分布特征,通過EM算法求解各路段行程時間分布的二元高斯混合分布參數(shù),以高峰時段行程時間數(shù)據(jù)為例,參數(shù)如圖3所示,圖中,ωij表示干線i的二元高斯混合分布擬合模型中第j個高斯分布的占比。觀察其權(quán)重值可以發(fā)現(xiàn),隨著交叉口數(shù)量增加,第1 個高斯分布占比達(dá)到90%以上,意味著有90%左右的車輛行程時間數(shù)據(jù)屬于第1類,說明該行程時間分布的雙峰現(xiàn)象被打破。
圖3 二元高斯混合模型參數(shù)估計結(jié)果Fig.3 Parameter estimation results of Gaussian mixture model
圖4 為Burr 分布和二元高斯混合分布的擬合效果圖,當(dāng)交叉口數(shù)量較少時,行程時間分布具有不確定性和多峰現(xiàn)象,二元高斯混合分布的擬合效果更佳。隨著交叉口數(shù)量增加,行程時間趨于一個穩(wěn)定的單峰分布,此時Burr分布在顯著水平為0.05時都能通過顯著性檢驗,且P 值逐漸增大,說明擬合效果越顯著。
圖4 Burr分布及二元高斯混合分布擬合圖Fig.4 Burr distribution and Gaussian mixture distribution fitting diagram
根據(jù)分布擬合和參數(shù)估計結(jié)果,隨著交叉口數(shù)量和干線長度的增加,交叉口信號控制對行程時間的影響減弱,行程時間分布的雙峰現(xiàn)象減弱,第1個高斯分布的權(quán)重逐漸增加,行程時間分布表現(xiàn)出長尾右偏形狀,從分布直方圖中也可以清楚得觀察到這一現(xiàn)象。隨著交叉口數(shù)量和干線長度的增加,兩種分布的擬合效果都隨之增加,如圖5所示,當(dāng)交叉口數(shù)量等于5 且當(dāng)干線長度約為2500 m 時,Burr 分布的擬合效果與二元高斯混合分布的擬合效果相當(dāng)。隨著交叉口數(shù)量和干線長度的繼續(xù)增加,Burr分布模型可以更好地描述干線行程時間分布特征。
圖5 干線行程時間分布與交叉口數(shù)量及干線長度關(guān)系Fig.5 Relationship between route travel time distribution and number of intersections and route length
根據(jù)上述分析,交叉口數(shù)量和干線長度是干線行程時間特性的重要影響因素,此外,干線流量也為行程時間分布的關(guān)鍵影響因素。為進(jìn)一步分析其相關(guān)關(guān)系,利用灰色關(guān)聯(lián)分析法分析交叉口數(shù)量、干線長度和干線流量與行程時間分布特性及可靠性之間的關(guān)系。選取Burr 分布和高斯混合分布的擬合優(yōu)度來表示行程時間分布特性,以緩沖指數(shù)(BI)[13]作為可靠性評價指標(biāo)。
灰色關(guān)聯(lián)分析法根據(jù)因素之間發(fā)展趨勢的相似或相異程度來衡量因素之間的關(guān)聯(lián)程度,具體步驟如下:
(1)確定參考序列和比較序列。假設(shè)評價標(biāo)準(zhǔn)有t個,評價因子有l(wèi)個,參考序列反應(yīng)系統(tǒng)行為特征,即,表示第t個評價因子的實測值;比較序列為影響因素數(shù)據(jù)序列,即,表示第l個評價標(biāo)準(zhǔn)下第t個評價因子的值。
(2)原始數(shù)據(jù)標(biāo)準(zhǔn)化處理。分析之前,將數(shù)據(jù)進(jìn)行無量綱規(guī)范化處理,本文采用均值化法,即用各指標(biāo)的每個值除以其相對應(yīng)指標(biāo)的平均值,得到各個指標(biāo)無量綱的新值。
(3)計算關(guān)聯(lián)系數(shù)。即求第l個比較序列與參考序列對應(yīng)的第t個指標(biāo)的相對差,計算公式為
(4)計算灰色關(guān)聯(lián)度,即各因子之間的關(guān)聯(lián)程度Rl,計算公式為
以交叉口數(shù)量、干線長度、干線流量為原始數(shù)據(jù),分別以Burr分布和二元高斯混合分布的擬合優(yōu)度及緩沖指數(shù)為參考序列。利用均值化法對數(shù)據(jù)進(jìn)行無量綱處理,再利用式(4)計算關(guān)聯(lián)系數(shù),式(5)計算灰色關(guān)聯(lián)度,結(jié)果如表5所示。
表5 灰色關(guān)聯(lián)分析結(jié)果Table 5 Results of grey correlation analysis
以Burr 分布擬合后的P值為參考序列進(jìn)行分析后發(fā)現(xiàn),干線長度和干線流量與其關(guān)聯(lián)度較高。在灰色系統(tǒng)理論中分辨系數(shù)取0.5 時,關(guān)聯(lián)度超過0.6 的影響因子對結(jié)果有顯著影響,因此干線長度和干線流量對Burr 分布擬合結(jié)果有著顯著影響。隨著干線長度的增加,行程時間趨于一個穩(wěn)定的單峰分布,Burr 分布可以更好地表示其分布特征,而流量的變化對行程時間的分布特性的影響更為顯著。同樣的,交叉口數(shù)量和干線流量對高斯混合分布的擬合結(jié)果有一定的影響,但干線長度和干線流量對緩沖指數(shù)的影響更為顯著,反映了行程時間可靠性與干線長度呈正比,與干線流量呈反比。
根據(jù)以上分析結(jié)果,干線長度和干線流量對多信號交叉口干線行程時間有著更為顯著的影響,而交叉口數(shù)量的影響不顯著。由于道路條件差異,不同交叉口之間的間距不同,用交叉口數(shù)量來描述行程時間特性時會存在較大的不確定性,特別是當(dāng)干線上的信號交叉口為協(xié)調(diào)控制時,由信號控制引起的延誤影響減小,交叉口數(shù)量與行程時間的相關(guān)性也將減弱。
本文得到主要結(jié)論如下:
(1)單路段行程時間受交叉口信號控制的影響較大,呈現(xiàn)雙峰分布現(xiàn)象,二元高斯混合分布表現(xiàn)出較好的擬合效果。對于信號協(xié)調(diào)控制下的多信號交叉口干線行程時間數(shù)據(jù),隨著交叉口數(shù)量和路線長度的增加,行程時間分布的雙峰現(xiàn)象減弱,且表現(xiàn)出長尾右傾特征,此時Burr分布可以較好地描述干線行程時間分布特征。
(2)針對多信號交叉口干線,隨著干線長度的增加,行程時間趨于一個穩(wěn)定單峰分布,Burr 分布擬合K-S檢驗的P值也逐漸增加,當(dāng)交叉口數(shù)量大于等于6且干線長度大于2500 m時,Burr分布的擬合效果優(yōu)于二元高斯混合分布,并且波動性減小,行程時間可靠性增加。
(3)交叉口數(shù)量、干線長度和干線流量與行程時間特性有著較強(qiáng)的相關(guān)性,交叉口數(shù)量和干線長度與Burr分布擬合優(yōu)度和可靠性呈正相關(guān),干線流量與Burr 分布擬合優(yōu)度和可靠性呈負(fù)相關(guān)。其中干線長度和干線流量的影響更為顯著,而對于信號協(xié)調(diào)控制的干線,交叉口數(shù)量對行程時間特性的影響較弱。
本文分析采用的是信號協(xié)調(diào)控制下的行程時間數(shù)據(jù),尚未對交通信號的影響進(jìn)行定量分析,在后續(xù)研究中將進(jìn)一步分析信號控制方式、信號配時方案等因素對行程時間特性的影響。