徐進,楊子邈,陳欽,陳正委
(重慶交通大學(xué),a.交通運輸學(xué)院;b.山區(qū)復(fù)雜道路環(huán)境“人車路”協(xié)同與安全重慶重點實驗室,重慶 400074)
近年來,高速公路貨車重型化和轎車大型化趨勢越來越明顯,但汽車性能的迭代速度卻遠滯后于這種趨勢。山區(qū)高速公路因地貌條件限制,駕駛環(huán)境復(fù)雜多變,常見連續(xù)彎道、長大縱坡及線形組合不良等高風(fēng)險路段。不同車型對線形的適應(yīng)性存在差異,尤其是重型化趨勢下貨車在長大縱坡的雙向均表現(xiàn)出明顯的性能衰減,車路協(xié)同矛盾導(dǎo)致山區(qū)高速公路事故頻發(fā)[1]。與此同時,車型分類作為交通理論研究,道路線形設(shè)計以及速度管理方法制定的基礎(chǔ),面對當前山區(qū)高速公路交通組成的新變化,有必要對不同車型的速度特征以及車型分類展開研究。
行駛速度是決定道路安全的重要因素,也是控制道路幾何線形和道路交安設(shè)施的核心指標,因此,一直是國內(nèi)外學(xué)者研究的焦點,例如,LAN等[2]研究了大型卡車在山區(qū)公路不同坡度的速度特征,提出定義明確的卡車速度模型確定臨界坡長;YUE等[3]在分析大小型車輛行駛速度穩(wěn)定性的基礎(chǔ)上,建立了陡坡和急彎組合路段的優(yōu)化設(shè)計方法;徐進等[4]提出一種關(guān)于重載汽車在彎坡組合路段運行速度建模的新思路,在實現(xiàn)任意坡道位置速度預(yù)測的同時,用于確定臨界坡長和道路評價;束海波等[5]測試了6 軸半掛式貨車以不同入坡初速度駛?cè)肷掀碌男旭偺匦裕⒎治銎渥肺彩鹿实奶卣?;許甜等[6]根據(jù)大小型車運行速度的分布特征、協(xié)調(diào)性以及一致性等,提出山區(qū)高速公路縱坡設(shè)計優(yōu)化方法。除了分析速度與線形之間的關(guān)系外,眾多學(xué)者也從車輛速度預(yù)測方面開展研究,例如,DONNELL等[7]在考慮平曲線和縱坡等參數(shù)影響下,建立雙車道公路卡車速度預(yù)測模型;MORRIS 等[8]針對乘用車和卡車開發(fā)了多車道公路彎坡組合路段速度預(yù)測模型;孟祥海等[9]分析了小客車和大貨車運行速度與曲線半徑和縱坡之間的關(guān)系,建立用于預(yù)測平縱組合段運行速度的3種模型。
目前,多從車輛的軸距、比功率及載質(zhì)量等方面對車型進行分類,例如,侯樹展等[10]以軸距作為劃分依據(jù),將高速公路的車型劃分小車、中車及大車這3 類;馬捷等[11]基于車輛比功率等動力性能提出一種在客貨分離道路系統(tǒng)中的車型分類標準。但基于山區(qū)高速公路車輛實際行駛速度的車型分類方法還比較少,ETC 數(shù)據(jù)作為一種新的數(shù)據(jù)來源,具有車型覆蓋全面,記錄連續(xù)及數(shù)據(jù)量大等優(yōu)點,能夠反映道路上車輛最真實的運行狀態(tài),國內(nèi)外學(xué)者鮮有利用高速公路ETC 數(shù)據(jù)進行速度特征研究。
為此,本文通過采集重慶市包茂高速某段的ETC數(shù)據(jù),分析山區(qū)高速公路典型路段不同車型的速度特征,運用k-medoids 聚類算法對山區(qū)高速一般路段和連續(xù)上坡路段車型進行聚類分析,提出基于ETC數(shù)據(jù)的車型分類方法,分類結(jié)果能夠為山區(qū)高速公路安全研究、線形設(shè)計及速度管理等方面提供數(shù)據(jù)支持和理論依據(jù)。
數(shù)據(jù)采集道路為包茂高速水江-南彭段,路段為瀝青鋪裝雙向4車道高速公路,路面凈寬24.5 m,即3.00+7.50+0.75+2.00+0.75+7.50+3.00,設(shè)計速度100 km·h-1,于2007年11月28日建成通車,全路段共有3 座隧道、6處立交互通以及1處服務(wù)區(qū),本文研究路段為南川-水江段和接龍-石龍段主線道路,如圖1所示。路段幾何要素如圖2所示。
圖1 道路平面線位圖Fig.1 Bitmap of road plane line
南川-水江段為平緩路段,全長21.60 km,有19處平曲線,其中,半徑值1000~2000 m 的平曲線有13 處,2000~4000 m 的平曲線有4 處,4000 m 半徑以上的有2 處;縱斷面主要變化特征為上下坡交替,坡度值在-4%~3.5%之間,部分路段出現(xiàn)短距離連續(xù)上下坡,如圖2(a)所示。接龍-石龍段為連續(xù)上坡路段,全長12.82 km,有8處平曲線,其中,半徑值在2000 m 以下有7 處,2000 m 以上有1 處;縱斷面變化特征為連續(xù)上坡,坡度值在-0.3%~4%之間,同時,路段內(nèi)有兩處隧道,隧道占比約33%,如圖2(b)所示。
圖2 路段幾何要素示意圖Fig.2 Schematic diagram of geometric elements of road section
研究數(shù)據(jù)來源于高速公路電子不停車收費系統(tǒng)(ETC 收費系統(tǒng)),系統(tǒng)主要通過安裝在公路主線上的ETC 門架采集通行車輛信息。從重慶市高速集團ETC 收費系統(tǒng)后臺終端采集包茂高速南川-水江段與接龍-石龍段出城方向ETC門架數(shù)據(jù),樣本采集時段為2020年7~8月。獲取的ETC 門架原始數(shù)據(jù)按照1輛車1條信息記錄在Excel表中,數(shù)據(jù)信息包含:門架編號、車牌號+顏色、交易時間、金額及計費車型等,其中通行介質(zhì)OBU 為車載單元,CPC卡為手持車輛通行卡。ETC收費系統(tǒng)中,車型主要分為客車和貨車兩類,其中,根據(jù)車輛軸數(shù)、載客數(shù)以及載質(zhì)量分別將客車劃分為一型~四型,貨車劃分為一型~六型,部分車型如圖3所示。部分ETC門架原始數(shù)據(jù)字段如表1所示。
表1 部分ETC原始數(shù)據(jù)字段Table 1 Partial ETC raw data fields
圖3 ETC門架和部分車型示意圖Fig.3 Schematic diagram of ETC gantry and some vehicle types
ETC 原始數(shù)據(jù)因為復(fù)雜環(huán)境和機器記錄等方面的影響,存在一些無意義的錯誤數(shù)據(jù),該類數(shù)據(jù)將影響速度特征分析結(jié)果的準確性,預(yù)處理是通過篩除和清理等方式提高數(shù)據(jù)質(zhì)量[12]。
本文主要研究天氣晴朗,路面條件良好,車流處于自由流狀態(tài)下的速度特征,數(shù)據(jù)提取時段為8:00-18:00,南川-水江段提取有效數(shù)據(jù)21 d,接龍-石龍段提取有效數(shù)據(jù)13 d,最小采集樣本量為379 個,能夠反映車輛實際運行情況。篩除的數(shù)據(jù)主要為:短時內(nèi)車牌在同一個門架連續(xù)出現(xiàn)2次及以上的數(shù)據(jù);前一門架交易時間晚于后一門架交易時間的數(shù)據(jù);車型無法識別的數(shù)據(jù);速度異常的數(shù)據(jù)。其中,異常速度數(shù)據(jù)主要分為兩類,第一類是異常低的速度值(研究路段未設(shè)服務(wù)區(qū));第二類是超過車輛極限性能的高速值。
速度計算通過比對相鄰門架記錄的車牌,獲取車輛在相鄰門架的出入時間,查閱ETC門架運營里程樁號,計算門架之間的里程,行駛里程與行駛時間的比值即為車輛的行駛速度。一天24 h 換算成以秒為單位,即為86400 s,將ETC門架原始時間格式轉(zhuǎn)換為以秒為單位的數(shù)值格式后相減得到車輛的行駛時間。
式中:Tij為通過i門架與j門架的時間差(s);ti和tj分別為車輛通過ETC門架的時刻;Vij為i門架與j門架之間的行駛速度(km·h-1);Lij為i門架與j門架之間的里程(km)。
高速公路行駛速度存在不確定性和隨機性,行駛速度受路段線形條件和駕駛環(huán)境等因素影響會產(chǎn)生不同程度的差異;另外,不同駕駛?cè)藛T的駕駛年齡、駕駛風(fēng)格以及駕駛技能存在差異。統(tǒng)計學(xué)原理表明,在基于大量統(tǒng)計數(shù)據(jù)的分析下,隨機現(xiàn)象會呈現(xiàn)出一定的規(guī)律性,通過研究山區(qū)高速公路大樣本ETC行車數(shù)據(jù),可以總結(jié)不同車型的速度分布特征。
將路段不同車型的行駛速度數(shù)據(jù)從小到大進行排序,按3 km·h-1間隔進行頻數(shù)統(tǒng)計,得到不同路段速度頻數(shù)分布直方圖,部分車型速度頻數(shù)分布如圖4和圖5所示。
圖4 南川-水江段(平緩路段)車型速度分布直方圖Fig.4 Speed distribution histogram of vehicles in Nanchuan-Shuijiang section(gentlesection)
圖5 接龍-石龍段(連續(xù)上坡路段)車型速度分布直方圖Fig.5 Speed distribution histogram of vehicles in Jielong-Shilong section(continuous uphill section)
可以看到其中部分車型的速度分布有明顯的特點,主要發(fā)現(xiàn)如下:
(1)一型客車速度分布在南川-水江段近似正態(tài)分布,在接龍-石龍段為負偏態(tài)分布,產(chǎn)生該現(xiàn)象的原因是接龍-石龍段道路線形為連續(xù)上坡,其中,33%的路段為隧道,一型客車的行車速度受其他車型的車流速度限制,低速行駛的車輛數(shù)明顯增多。
(2)從圖4(b)中可以看到,四型客車速度分布較為集中于最大速度,速度值約為92 km·h-1,超過92 km·h-1的頻數(shù)顯著減少,四型客車為40 座以上營運大巴車,由于營運車輛限速存在,使較少四型客車會超過限速值,而表現(xiàn)為集中于某個最大速度值。圖5(b)中,四型客車速度未超過營運限速,速度分布沒有表現(xiàn)出明顯的集中性。
(3)從圖5(d)可以看到,三型貨車速度分布呈駝峰狀,頻數(shù)分別在51 km·h-1和68 km·h-1附近達到最大,三型貨車是城市近郊貨運的主要車型,空載車輛占比較高,其空載與滿載工況下爬坡性能差異較大[13],因此,與平緩路段不同,連續(xù)上坡路段三型貨車速度分布會出現(xiàn)兩個峰值點。
為便于對比分析不同車型速度分布特征,整理不同車型的速度頻數(shù)數(shù)據(jù),繪制相對頻率直方圖并利用Origin軟件中高斯分布進行單峰或雙峰擬合,全部車型擬合的R2均大于0.9,擬合效果是較為可靠的,部分車型擬合效果如圖6所示。將不同車型的速度相對頻率擬合曲線整理如圖7所示。
圖6 部分車型速度相對頻率擬合圖Fig.6 Fitting diagram of speed relative frequency of some models
圖7(a)和圖7(b)是全部車型的頻率曲線圖,可以看到各車型的速度分布曲線在南川-水江段總體上呈“山”字型分布,而在接龍-石龍段則呈“M”型分布,說明在平緩路段與連續(xù)上坡路段不同車型的速度分布有明顯差異。
圖7 不同車型行駛速度相對頻率分布圖Fig.7 Relative frequency distribution diagram of driving speed of different vehicles
從圖7(c)和圖7(d)中可以看到,在平緩路段一型客車和其他3型客車速度分布是錯峰的,峰值差最大為14.9 km·h-1;在連續(xù)上坡路段4 類客車速度分布峰值相近,峰值差最大為5.9 km·h-1,相比一般路段減小了9 km·h-1。
從圖7(e)和圖7(f)中可知,在平緩路段一型貨車速度分布峰值大于其他5 類貨車車型,二型~六型貨車速度分布峰值相近;在連續(xù)上坡路段不同貨車車型的速度分布呈現(xiàn)出較明顯的階梯化差異,其中,三型貨車(空載)速度分布峰值最大,六型貨車峰值最低。
以上表明,道路線形和車輛性能對速度分布有強烈影響,客車車型速度分布在平緩路段表現(xiàn)為分散,在連續(xù)上坡路段則相對集中;貨車速度分布變化趨勢正好相反,在一般路段集中,在連續(xù)上坡路段分散。
繪制各車型的行駛速度累計頻率曲線如圖8所示。
圖8 不同車型行駛速度累計頻率分布圖Fig.8 Cumulative frequency distribution diagram of driving speed of different vehicles
從圖8(a)和圖8(b)中可以看到,對比平緩路段,在連續(xù)上坡路段一型客車與其他3 型客車的速度差異顯著減小,進一步說明在連續(xù)上坡路段一型客車的速度受到較強的限制;二型客車在低速和高速部分占比較高,二型客車是8~19座中型巴士,含營運和非營運兩類,個體駕駛員駕駛技能和駕駛風(fēng)格的差異是造成該現(xiàn)象的主要原因。從圖8(c)和圖8(d)可以看到,部分貨車車型間的頻率曲線幾乎是重合的,說明部分車型的運行特征有很強的相似性,連續(xù)上坡路段車型大致可以分為3類,第1類是一型貨車和三型貨車,第2類是二型貨車和四型貨車,第3類是五型貨車和六型貨車。
在累計頻率曲線數(shù)據(jù)的基礎(chǔ)上提取路段不同車型的速度特征值,如表2所示。
表2 不同車型速度特征值Table 2 Speed eigenvalues of different vehicles
表2中的數(shù)值可以為山區(qū)高速公路速度管理中限速值的確定提供參考,也能為道路線形設(shè)計中不同車型速度閾值的選擇提供數(shù)據(jù)支撐。
從表2中可以看到,連續(xù)上坡路段各車型的速度特征值明顯下降,但同路段部分車型間多個速度特征值仍較為接近,特別是各車型的速度平均值和標準差并非是連續(xù)值,而是呈現(xiàn)一定的聚集性,可考慮作為車型分類的指標。車速標準差也常用于描述速度的離散性,速度離散性越大,車輛間的縱向干擾越嚴重,連續(xù)上坡路段速度離散性總體上要大于平緩路段,路段發(fā)生追尾事故的風(fēng)險水平更高。
由速度統(tǒng)計分布特征的分析發(fā)現(xiàn),不同線形路段各車型的速度特征并不是按ETC 系統(tǒng)中的車型分類而規(guī)律變化,各車型間的速度特征具有一定的差異性和聚集性?;诖?,從速度特征值分析中選擇分類指標,利用現(xiàn)代統(tǒng)計學(xué)的聚類分析方法對不同車型進行聚類分析,實現(xiàn)基于速度特征的車型再分類。
k-medoids聚類是基于劃分的一種快速聚類算法,通過選取原有樣本中的樣本點作為簇中心點,計算其他樣本點與簇中心點的距離進行簇的劃分,簇中心點的選擇方式使k-medoids 相比k-means 對噪音和孤立點有更強的魯棒性[14]。k-medoids 通常使用距離度量相似性,目前,常用距離度量有歐式距離、曼哈頓距離、切比雪夫距離和明可夫斯基距離等,本文采用曼哈頓距離進行相似判斷,算法通過不斷迭代各簇內(nèi)距離和,當各簇內(nèi)距離和最小時得到最終聚類結(jié)果。
式中:d為樣本點間的曼哈頓距離;(xm,ym)和(xn,yn)為樣本點;E為各簇內(nèi)距離的和,當E=Emin時得到最終結(jié)果;k為聚類簇的個數(shù);Cl為第l個簇;(xc,l,yc,l)為第l個簇的簇中心點。
相關(guān)研究表明,在晴朗白天自由流狀態(tài)下,速度的標準差趨于穩(wěn)定,平均速度輕微下降[15]。不同車型的速度平均值和標準差并非一個連續(xù)值,而是呈現(xiàn)一定的聚集性,兩類特征值能很好地反應(yīng)車輛本身的運行特性,因此,選取這兩類值作為分析樣本的聚類指標。南川-水江段全車型10 d交通量組成如圖9所示。
圖9 南川-水江段交通量組成Fig.9 Traffic composition of Nanchuan-Shuijiang section
由圖9可以看到,高速公路不同車型交通量有顯著差異,為保證單個步長內(nèi)和最終抽取樣本點的數(shù)量,動態(tài)選擇不同車型的分組步長,同時,考慮到二型客車和五型貨車在樣本采集數(shù)量中占比僅為0.49%和0.38%,因此,在聚類中暫不考慮這兩類車型。
將同一車型行駛速度數(shù)據(jù)按照采集時序進行排列并編號(1 ~N),然后,設(shè)定分組步長L進行統(tǒng)計分組,即取l1=1 ~L,l2=L+1 ~2L,l3=2L+1 ~3L,…,直至n=N L為止,分組后計算組內(nèi)的聚類指標用于聚類,不同路段抽樣分組結(jié)果如表3所示。
表3 不同路段抽樣分組結(jié)果Table 3 Sampling and grouping results of different section
根據(jù)分析,初始聚類k值定為2~4,利用Matlab軟件進行聚類,對比聚類結(jié)果發(fā)現(xiàn)南川-水江段和石龍-接龍段分別在k=4 和k=3 獲得較理想的效果,如圖10所示。
圖10 不同車型最終聚類結(jié)果Fig.10 Final clustering results of different vehicles
可以看到,平緩路段各車型聚類點較分散,按指標能夠聚成4類;連續(xù)上坡路段各車型聚類點分布相對集中,但總體上能夠聚成3 類,其中,類別2和類別3都包含較多數(shù)量的三型貨車聚類點,這可能與三型貨車的工況有關(guān),空載三型貨車行駛速度更快,速度離散性相對較大,與一型貨車有較強的相似性,而滿載工況下則與二型、四型及六型貨車相似,車型聚類統(tǒng)計結(jié)果如表4和表5所示。
從表4和表5中可以看到,不同路段聚類后各類別的簇中心點數(shù)值,對比表2中各車型樣本總體的速度平均值和標準差發(fā)現(xiàn),聚類結(jié)果的簇中心點能夠較好地與之對應(yīng)。
表4 南川-水江段(平緩路段)聚類結(jié)果統(tǒng)計表Table 4 Statistical table of clustering results of Nanchuan-Shuijiang section(gentle section)
表5 接龍-石龍段(連續(xù)上坡路段)聚類結(jié)果統(tǒng)計表Table 5 Statistical table of clustering results of Jielong-Shilong section(continuous uphill section)
基于車型聚類的結(jié)果,結(jié)合不同車型的速度分布特征對車型分類表進行優(yōu)化。二型客車的速度特征與三型和四型客車相似,因此,二型客車在平緩路段和連續(xù)上坡路段分別歸為類別2 和類別1;在速度累計頻率曲線的分析中,連續(xù)上坡路段貨車車型能夠分為3類,據(jù)此將表4聚類結(jié)果中的類別3進一步劃分為兩類,其中,五型貨車與六型貨車歸為一類,優(yōu)化后的車型分類結(jié)果如表6所示。同時,在綜合車輛速度特征、交通量組成以及車輛動力等因素,在每一分類中給出了1~2種代表車型。
表6 優(yōu)化后車型分類表Table 6 Optimized vehicle classification table
利用重慶市包茂高速某段ETC數(shù)據(jù),分析了山區(qū)高速公路不同車型在平緩路段和連續(xù)上坡路段的速度分布特征,結(jié)合k-medoids 聚類算法對不同路段的車型進行聚類分析,得到主要結(jié)論如下。
(1)在不同線形路段上部分車型的速度分布有明顯的特點,其中,最顯著的是三型貨車在連續(xù)上坡路段速度分布呈駝峰狀,這是由近郊運輸時滿載與空載工況下的速度差異導(dǎo)致;四型客車因為營運速度的限制,在平緩路段速度分布較為集中于最大速度92 km·h-1。
(2)不同車型在相同線形路段速度分布顯著不同,客車車型在平緩路段速度分布表現(xiàn)為分散,在連續(xù)上坡路段相對集中,貨車車型速度分布在平緩路段集中,在連續(xù)上坡路段分散,變化趨勢正好相反,因此,在山區(qū)高速公路采取分路段和分車型的速度管理方式是有必要的。
(3)相比平緩路段,連續(xù)上坡路段各車型的速度特征值明顯下降,但相同路段上部分車型間的多個速度特征值仍較為接近;在車速離散性方面,連續(xù)上坡路段速度離散性大于平緩路段,發(fā)生追尾事故的風(fēng)險水平更高,需要加強速度管理。
(4)運用k-medoids 算法對山區(qū)高速平緩路段和連續(xù)上坡路段不同車型進行聚類分析,并在此基礎(chǔ)上根據(jù)車型的速度特征進行優(yōu)化。優(yōu)化后分類結(jié)果如下:平緩路段車型分為4 類,1 類為一型客車,2 類為二型~四型客車,3 類為一型貨車,4 類為二型~六型貨車;連續(xù)上坡路段車型分為4 類,1 類為一型~四型客車,2類為一型和三型(空載)貨車,3類為二型~四型貨車(三型為滿載),4類為五型和六型貨車。在相應(yīng)分類中給出了1~2種代表車型,該車型分類結(jié)果能夠為山區(qū)高速公路速度管理和道路線形設(shè)計提供數(shù)據(jù)支持和理論依據(jù)。