李巖,陳姜會,曾明哲,徐金華,汪帆*,3
(1.長安大學(xué),運輸工程學(xué)院,西安 710064;2.湖南省國土資源規(guī)劃院,長沙 410007;3.中交第一公路勘察設(shè)計研究院有限公司,西安 710075)
交通運行狀態(tài)的確定是評價道路通行效率、發(fā)現(xiàn)交通擁堵瓶頸、制定交通管控決策方案的關(guān)鍵前提。傳統(tǒng)交通狀態(tài)以流量、密度、平均車速等交通流基本參數(shù)為評價指標,但在降雨、大霧、強風(fēng)等不利天氣情景下,相同的參數(shù)值運行狀態(tài)同正常天氣相比存在較大差異。不利天氣會影響道路上駕駛員的自由流速度等特性[1],進而導(dǎo)致道路通行能力發(fā)生變化。高速公路交織區(qū)路段車流交織行為集中[2],導(dǎo)致各車道受不利天氣影響存在較大差異。因此,建立考慮天氣、車道等因素影響下高速公路交織區(qū)的運行狀態(tài)識別方法,有助于高速公路管理者在面對不利天氣下做出更合理的管控決策。
對交通運行狀態(tài)的研究考量因素主要包括車流密度、交通量、匝道飽和度[3]等,多集中于分析道路交通流因素。然而雨、霧、雪等不利天氣下駕駛員的行車會受到影響[4],尤其在高速公路交通速度較高的情況下對不利天氣更敏感[5],導(dǎo)致高速公路運行速度、道路最大通行流量等受到影響[6]。因此對高速公路交通運行狀態(tài)識別應(yīng)充分考慮不利天氣的影響。
高速公路交通狀態(tài)劃分主要包括交通基本圖建模方法、交通流視頻圖像識別和基于數(shù)值聚類劃分等方法。交通基本圖建模方法通過基本圖形態(tài)或三相交通流理論劃分交通狀態(tài)[7]。交通流視頻圖像識別方法是通過監(jiān)控視頻提取交通圖像特征參數(shù),建立算法模型實現(xiàn)交通狀態(tài)識別[8]。此方法復(fù)雜度較高,且對海量的交通視頻不便處理?;跀?shù)值聚類劃分方法是從數(shù)據(jù)角度出發(fā)建立聚類算法,利用檢測器獲得的連續(xù)交通流數(shù)據(jù),將交通流劃分為多種狀態(tài)。其中,K-means 聚類方法能獲取與《道路通行能力手冊》(Highway Capacity Manual,HCM)服務(wù)水平標準最接近的狀態(tài)劃分結(jié)果[9]。當數(shù)據(jù)中同時包含數(shù)值型和分類型數(shù)據(jù)時,K-means等運用于數(shù)值型數(shù)據(jù)的聚類方法不再適用。為克服此缺陷,k-prototypes聚類算法集成了K-means和K-modes 算法[10],綜合了對數(shù)值屬性和分類屬性的考量。該算法在考慮兩種屬性上簡單高效,但衡量類別型數(shù)據(jù)只考慮頻率最高的類,忽略了其他類別屬性,在識別狀態(tài)時仍存在偏差。
綜上,本文以高速公路交織區(qū)為研究對象,結(jié)合天氣因素與交通流參數(shù)的考量,探究在不同等級天氣影響下交織區(qū)各車道交通特性的變化情況,并采用改進的k-prototypes算法構(gòu)建高速公路交織區(qū)各車道交通運行狀態(tài)識別的方法。
交通運行狀態(tài)影響因素分析是開展交通狀態(tài)識別工作的基礎(chǔ)及前提。考慮到高速公路交織區(qū)情況復(fù)雜,每條車道的流量、車型比例、車輛換道等情況均存在差異,同一指標體系不能表征所有車道的交通運行狀態(tài),因此對交織區(qū)進行分車道研究。如圖1 所示,在天氣的考量上,通過分析不利天氣對交通流運行的影響狀況確定天氣等級,并篩選對交通運行狀態(tài)影響較高的指標作為天氣指標。
圖1 交通運行狀態(tài)影響因素集構(gòu)建流程Fig.1 Procedures on constructing impact factor set of traffic operation state
考慮到傳統(tǒng)交通流模型中,Van Aerde 模型對實測交通數(shù)據(jù)擬合效果好,同時適用于交通密度大和交通密度小的情況,并能刻畫不同交通設(shè)施下的交通特性[11],因此本文選取該模型探究不利天氣對交通流特性的影響。
為衡量指標對交通運行狀態(tài)的影響程度,將實測點到Van Aerde擬合曲線上的最小距離定義為交通偏離度,用以描述交通流運行狀態(tài)的穩(wěn)定性,其絕對值越小,表明交通流越穩(wěn)定??紤]到數(shù)據(jù)集中各等級天氣樣本數(shù)據(jù)量的不平衡性,以及指標間的相互影響,而隨機森林模型能夠在不平衡數(shù)據(jù)集中檢測到特征指標間的關(guān)系,因此利用該模型以交通偏離度為因變量,其他指標為自變量,對指標進行重要度排序并結(jié)合各車道狀態(tài)分類誤判率與變量數(shù)的變化關(guān)系確定指標的數(shù)量。
1.2.1 改進的k-prototypes交通狀態(tài)聚類算法
交通運行狀態(tài)表征體系中交通流、天氣指標分別為數(shù)值型和類別型數(shù)據(jù)。傳統(tǒng)算法對類別屬性的表示是直接選擇頻率最高的屬性值,在多個類簇出現(xiàn)頻率最高的值相同時,數(shù)據(jù)對象到每個類簇的距離相同,導(dǎo)致不能準確將其劃分到最近的類簇中。為克服此缺陷,引進熵值法對k-prototypes 聚類模型進行改進。熵值反映數(shù)據(jù)的離散程度,越離散熵值越大。分別用r 、c 表數(shù)值型和類別型指標,則第 j 個變量的數(shù)值屬性Xj(1 ≤j ≤mr) ,表示在屬性Xj下對象xi的取值所占的比重,其中,1 到mr為數(shù)值型變量,i為數(shù)據(jù)集中的第i 組數(shù)據(jù),1 ≤i ≤n;對于類別屬性表示在屬性Xj下第t 個屬性所占的比重,其中,mr到m 為類別型變量,ntj表示屬性值為的對象個數(shù),則各屬性的信息熵表示為
在聚類過程中屬性的重要程度與其值構(gòu)成的差異度成正比,熵值越大屬性的權(quán)重越高。屬性Xi權(quán)重值為其中,1 ≤j ≤m ,
聚類中心的映射函數(shù)為
式中:zl為類簇Cl的聚類中心;nj為屬性Xj下的數(shù)值型對象個數(shù)。基于權(quán)重和聚類中心的優(yōu)化,相異性度量公式為
其中,數(shù)值屬性相異度度量采用歐式距離,即
結(jié)合中心點表示方法,類別屬性相異度度量為
1.2.2 聚類效果評價標準與算法流程
為有效評估混合型數(shù)據(jù)的聚類結(jié)果,提出聚類的有效性評價指標CUM。將混合型數(shù)據(jù)集U中的屬性集A,分為數(shù)值型屬性集Ar,類別型屬性集Ac,假設(shè)類別數(shù)據(jù)被劃分為k類Ck={C1,C2,…,Ck},該類別數(shù)據(jù)聚類的效用函數(shù)為
類別效用函數(shù)根據(jù)聚類結(jié)果和每個特征值的二元分布定義,不同于傳統(tǒng)遵循實例之間的相似性和差異性的聚類標準。
在計算數(shù)值型數(shù)據(jù)的聚類時,假設(shè)數(shù)值型數(shù)據(jù)被劃分為k類,Ck={C1,C2,…,Ck},其效用函數(shù)為
基于式(6)和式(7),混合型數(shù)據(jù)聚類結(jié)果的有效性指標為
式中:|A|、|Ar|、|Ac|分別為屬性集中A、Ar、Ac的對象數(shù)量。當CUM越大,聚類結(jié)果越好??赏ㄟ^以CUM最大為目標,來確定最優(yōu)的聚類結(jié)果。
算法步驟如下。
輸入:數(shù)據(jù)集,聚類數(shù)k。
Step 1 隨機選取k個初始中心點。
Step 2 針對數(shù)據(jù)集中的每個樣本點,計算樣本點與k個中心點的距離。
Step 3 將樣本點劃分到離它最近的中心點所對應(yīng)的類別中。
Step 4 重復(fù)Step 3,直到?jīng)]有樣本數(shù)據(jù)需更換簇。
Step 5 計算聚類有效性指標CUMi。
輸出:各類別聚類中心,聚類有效性指標CUM。
最后結(jié)合聚類中心和改進k-prototypes算法計算各類別聚類中心的相異性距離值,用以衡量各類別與理想天氣的貼近度,從而對交通運行狀態(tài)進行等級確定。
數(shù)據(jù)來源于國內(nèi)京昆高速(G5,太原到晉中介休段)、二廣高速(G55,朔州懷仁到山陰段及太原陽曲段)。A型交織區(qū)為最典型的交織區(qū)形式[12],以圖2所示的A型交織區(qū)為例,將高速公路車道編號從中間帶到右路肩依次從1 開始增序編號。數(shù)據(jù)包含:流量(Flow),車輛平均速度(Speed),交織區(qū)合流比(RMerge)與分流比(RDiverge),密度(Density),目標車道與鄰近車道平均速度差值(DSpeed)及流量差值(DFlow),目標車道平均速度與交織區(qū)整體平均速度的比值(RSpeed)及流量占比(RFlow),大車流量占比(RTruck),交織區(qū)內(nèi)檢測器與上游檢測器平均速度差值(UDSpeed)、流量差值(UDFlow)及密度差值(UDensity),交織區(qū)內(nèi)檢測器與下游檢測器平均速度差值(DDSpeed)、流量差值(DDFlow)及密度差值(DDensity)等16 個指標。天氣數(shù)據(jù)來源天氣網(wǎng)、降雨量監(jiān)測站等平臺,包含降雨、能見度、風(fēng)速、風(fēng)向等數(shù)據(jù)信息。
圖2 A型交織區(qū)形式Fig.2 Type A weaving segments
為保證數(shù)據(jù)真實可靠,需對所采用的數(shù)據(jù)進行質(zhì)量檢驗,根據(jù)交通流量、速度、占有率三參數(shù)閾值和相互關(guān)系剔除錯誤數(shù)據(jù),并匹配交通流與天氣數(shù)據(jù),剔除缺失天氣數(shù)據(jù)時段的指標。再驗證所選檢測器數(shù)據(jù)間的可比性,統(tǒng)一20 個A 型交織區(qū)各車道平均速度數(shù)據(jù)的量綱后,分服務(wù)水平等密度間隔進行Kolmogorov-Smirnov(K-S)分布檢驗。結(jié)果如表1所示,各車道平均速度在不同服務(wù)水平下均通過檢驗,即同類型交織區(qū)數(shù)據(jù)不存在顯著差異。
表1 交織區(qū)速度分布K-S檢驗結(jié)果Table 1 K-S test results of velocity distribution in weaving segments
根據(jù)汽車道路試驗方法通則及氣象等級標準確定理想天氣[13]應(yīng)符合以下指標:無降水,地面干燥,風(fēng)速不大于3 m·s-1,能見度良好(大于4 km)。當其中一條不滿足時即為不利天氣。因此本文主要考慮降雨、霧、強風(fēng)因素。降雨量依據(jù)國家氣象局《降雨的等級劃分》劃分為6個等級。風(fēng)速考慮到其對車輛行駛的影響程度以及高等級風(fēng)速樣本量過少原因,將12 級風(fēng)中的0 級無風(fēng)劃為等級0,1級軟風(fēng)和2級輕風(fēng)合并為等級1,3級微風(fēng)和4級和風(fēng)合并為等級2,5級清風(fēng)和6級強風(fēng)合并為等級3,7 級疾風(fēng)和8 級大風(fēng)合并為等級4,9 級烈風(fēng)及以上合并為等級5。能見度參考標準《霧的等級及預(yù)報》并結(jié)合實際情況將其劃分為7個等級,具體劃分如表2所示。
表2 天氣影響因素等級劃分Table 2 Classification of weather impact factors
基于實測數(shù)據(jù)構(gòu)建Van Aerde交通流模型得到不同等級降雨、能見度、風(fēng)速下的流-密-速關(guān)系圖。如圖3所示,交通流三參數(shù)隨降雨和能見度等級的上升而上升;0~2 級風(fēng)速間交通流狀態(tài)無明顯變化,3 級及以上風(fēng)速對交通流的影響顯著。相比正常天氣,各不利天氣下交織區(qū)自由流速度、通行能力、臨界速度下降幅度分別在3.60%~7.82%、11.23%~30.00%、8.41%~26.64%之間,堵塞密度受天氣等級影響變化不明顯。
圖3 不同天氣影響因素等級下Van Aerde交通基本圖Fig.3 Van Aerde traffic fundamental diagram under various weather influence factor levels
考慮到實際環(huán)境中,常同時受多種天氣因素交互影響,故對各天氣因素進行聚集劃分。如圖4所示,定義優(yōu)先等級為惡劣天氣>中度天氣>輕微天氣>正常天氣,以滿足的最高優(yōu)先級對天氣等級進行判定。
圖4 天氣等級劃分Fig.4 Classification of weather level
圖5 為交通偏離度劃分結(jié)果,Van-Aerde 擬合曲線將實測數(shù)據(jù)點分割為兩部分,擬合曲線u方向數(shù)據(jù)點的交通偏離度值為負,v向為正。LA為擬合曲線在擬合點A處的切線,B點的交通偏離度為線段AB的長。分車道計算交通偏離度,結(jié)果分布圖符合標準正態(tài)分布,依據(jù)分布形式將其劃分為3個等級。
圖5 交通偏離度劃分結(jié)果Fig.5 Classification of traffic deviation
指標篩選如圖6所示,特征變量中天氣因素對各車道交通流運行的影響均很大。車道2和車道1的交織區(qū)合流比(RMerge)相差最大為0.079,其次是車道3 和車道1 大車流量占比(RTruck)相差0.077。確定指標數(shù)量如圖6(b)所示,在特征數(shù)從1增加至6 時,分類誤判率從7.8%~8.8%下降到了1.5%~2.5%,說明考慮多指標能增強對交通狀態(tài)劃分的準確性,但在數(shù)量大于6 之后,誤判率出現(xiàn)轉(zhuǎn)折。因此各車道對應(yīng)變量均選擇重要度排序前6的變量。
圖6 特征變量篩選Fig.6 Results of indicator screening
利用改進k-prototypes 算法對4 個車道的交通狀態(tài)進行聚類并計算CUM值。如圖7 所示,當聚類數(shù)為7時,各車道CUM達到最大值,即各車道交通運行狀態(tài)劃分為7類最佳。
圖7 聚類有效性變化Fig.7 Analysis on effectiveness of clustering
各車道運行狀態(tài)類別聚類中心如表3和表4所示。各車道類別3 的天氣狀態(tài)均為0 等級,車流量最高為60 pcu·(5 min·ln)-1,速度在100.1~119.2 km·h-1,密度最高為6.53 pcu·km-1·ln-1,將其定為最佳運行狀態(tài)。
表3 交織區(qū)各車道交通運行狀態(tài)三參數(shù)結(jié)果Table 3 Three traffic parameters for each lane in weaving segments under different status
表4 交織區(qū)各車道交通運行狀態(tài)指標結(jié)果Table 4 Indicators on traffic status for each lane in weaving segments
計算其他狀態(tài)類別與最優(yōu)類別3的貼近度,結(jié)果如表5所示,車道1~車道4的交通運行狀態(tài)從優(yōu)至劣排序分別為:3-6-7-2-5-1-4,3-2-6-7-5-1-4,3-7-2-6-5-4-1,3-7-2-5-6-1-4。
表5 相異性距離計算結(jié)果及交通運行狀態(tài)等級排序Table 5 Results of dissimilarity distance and ranking of traffic operational states levels
HCM 中將高速公路服務(wù)水平(Level of Service,LOS)根據(jù)密度臨界值劃分為A~F 共6 級,對比所提出方法得到交通運行狀態(tài)的最大密度、最小速度范圍,結(jié)果如表6所示。
表6 交通運行狀態(tài)等級比較Table 6 Comparison of traffic operational states levels
從表6可以看出,在惡劣天氣的影響下,車道1和車道3最大密度在A級LOS范圍內(nèi),最小速度分別下降了11.2 km·h-1和17.4 km·h-1,按最小速度在HCM中均降為D級服務(wù)水平;車道2和車道4最大密度在C 級LOS 范圍內(nèi),最小速度分別下降了21.2 km·h-1和27.4 km·h-1,按最小速度LOS均降為E??梢姡诜?wù)水平較低時,車道行駛速度受惡劣天氣的影響下降更明顯,且不同的車道受影響的程度亦不同。
在中度天氣的影響下,車道1 和車道2 的LOS分別從D、E 級下降到F 級,最小速度分別下降了15.6 km·h-1和29.6 km·h-1;車道3 和車道4 的LOS分別從C、B 級降為E 級,最小速度分別下降了24.2 km·h-1和22.3 km·h-1;各車道在服務(wù)水平較低時受天氣影響程度更大。
在輕微天氣的影響下,車道1 和車道2 的LOS均從A下降到C,最小速度分別下降了8.6 km·h-1和9.0 km·h-1;車道3的LOS從C下降到F,車道4從B下降到E。此外,車道4 的各狀態(tài)密度最大為28.98 pcu·km-1·ln-1,而車道1 的最大密度達到54.37 pcu·km-1·ln-1。車道4在低密度狀態(tài)下車輛行駛也會受到換道的干擾。在不利天氣影響下,各車道同一狀態(tài)等級的交通流特性存在明顯差異。
如圖8所示,選擇具有相類似車道設(shè)計的典型B、C型交織區(qū)探討所提出方法的可行性。
圖8 交織區(qū)類型Fig.8 Weaving segment types
應(yīng)用所提出方法識別B、C型交織區(qū)狀態(tài),并與A 型交織區(qū)的結(jié)果對比,如圖9 所示。各交織區(qū)的車道在受到天氣的影響下,狀態(tài)等級均受到影響且車道4的車道最大密度均小于其他車道,本文提出的交通狀態(tài)識別方法對A、B、C型交織區(qū)均適用。
圖9 不同交織區(qū)不同等級狀態(tài)特征分布Fig.9 Distribution of level state characteristics in three types weaving segments
本文得到的主要結(jié)論如下:
(1)分析了雨、霧、風(fēng)速因素對高速公路交織區(qū)交通運行狀態(tài)的影響。結(jié)果表明,相比正常天氣,在不利天氣因素影響下交織區(qū)自由流速度、通行能力、臨界速度下降幅度分別為3.60%~7.82%、 11.23 %~30.00%、8.41%~26.64%。
(2)提出了考量天氣因素的高速公路交織區(qū)車道級交通運行狀態(tài)劃分方法。利用隨機森林算法篩選特征變量,通過構(gòu)建結(jié)合信息熵的改進k-prototypes 算法,劃分高速公路交織區(qū)各車道運行狀態(tài)。應(yīng)用京昆高速及二廣高速的交織區(qū)運行數(shù)據(jù)驗證表明,該方法能夠很好地識別不利天氣影響下的道路運行狀態(tài)。
(3)受惡劣天氣影響下的交織區(qū)服務(wù)水平下降明顯且服務(wù)水平等級越低受天氣影響越大,A級服務(wù)水平受不利天氣影響,下降范圍在C~D 級服務(wù)水平;B、C 級會下降到E 級服務(wù)水平;D、E 級會下降到F 級服務(wù)水平;在考慮天氣因素下,各車道同一狀態(tài)等級的交通流特性存在明顯差異,分車道選取指標更能反映交織區(qū)的交通特性。
(4)研究所使用的交通數(shù)據(jù)僅為高速公路線圈檢測器數(shù)據(jù),未來可利用視頻數(shù)據(jù)進一步獲取交織區(qū)內(nèi)車輛換道及跟馳軌跡等信息,融合多源數(shù)據(jù)對高速公路交織區(qū)進行更精細化的交通運行狀態(tài)識別。