高悅爾,闞小溪,胥 川,崔紫薇
(1. 華僑大學(xué)建筑學(xué)院,福建 廈門 361021; 2. 西南交通大學(xué)交通運(yùn)輸與物流學(xué)院,四川 成都 610031; 3. 華僑大學(xué)數(shù)學(xué)科學(xué)學(xué)院,福建 泉州 362021)
?
基于“兩客一?!睌?shù)據(jù)的高速公路服務(wù)區(qū)路段車輛行駛模式研究
高悅爾1,闞小溪1,胥 川2,崔紫薇3
(1. 華僑大學(xué)建筑學(xué)院,福建 廈門 361021; 2. 西南交通大學(xué)交通運(yùn)輸與物流學(xué)院,四川 成都 610031; 3. 華僑大學(xué)數(shù)學(xué)科學(xué)學(xué)院,福建 泉州 362021)
基于“兩客一?!睌?shù)據(jù),以沈海高速公路廈門段為例,通過浮動車的GPS時空圖發(fā)現(xiàn)高速公路服務(wù)區(qū)路段車輛行駛特征,同時選取車輛的平均速度、 最低速度、 速度方差等車輛運(yùn)行特征指標(biāo)進(jìn)行層次聚類,得到服務(wù)區(qū)路段車輛的行駛模式. 研究結(jié)果表明,高速公路服務(wù)區(qū)路段存在3種行駛模式,即進(jìn)出服務(wù)區(qū)、 正常行駛和交織減速,基本可以代表車輛在服務(wù)區(qū)路段的實際運(yùn)行狀態(tài).
“兩客一?!睌?shù)據(jù); 高速公路; 服務(wù)區(qū)路段; 行駛模式; 層次聚類
隨著社會經(jīng)濟(jì)的發(fā)展,人們生活水平提高,機(jī)動車保有量呈現(xiàn)逐年遞增的趨勢,但道路基礎(chǔ)設(shè)施建設(shè)卻遠(yuǎn)遠(yuǎn)無法滿足機(jī)動車增長的需求. 因此,人們著眼于運(yùn)用新的智能交通手段來監(jiān)測道路交通狀態(tài),為駕駛員提供準(zhǔn)確的預(yù)報,以提高道路的使用效率. 根據(jù)國家相關(guān)規(guī)定,要求“兩客一危”(“兩客一?!避囕v,是指從事旅游的包車、 三類以上班線客車和運(yùn)輸危險化學(xué)品、 煙花爆竹、 民用爆炸物品的道路專用車輛)重點(diǎn)營運(yùn)車輛必須全部納入企業(yè)監(jiān)控和政府監(jiān)管平臺,因此,“兩客一危”數(shù)據(jù)具有一定的權(quán)威性和可靠性. 由于高速公路服務(wù)區(qū)路段與一般路段之間存在不同的車輛運(yùn)行狀態(tài),通過建立“兩客一?!避囕v數(shù)據(jù)分析模型,識別高速公路服務(wù)區(qū)路段不同車輛的行駛模式,可以剔除非正常行駛車輛數(shù)據(jù),例如進(jìn)出服務(wù)區(qū)車輛數(shù)據(jù),對高速公路交通狀態(tài)進(jìn)行判別.
國內(nèi)外學(xué)者對高速公路交通展開了大量的研究與實踐. 在數(shù)據(jù)方面,主要包括收費(fèi)數(shù)據(jù)[1]、 出租車數(shù)據(jù)[2]和“兩客一?!睌?shù)據(jù)[3]等; 在研究對象上,已有的研究主要從路段來展開,包含對高速公路路段平均速度估計[4]、 路段行程時間預(yù)測方法[5]和行程時間可靠度模型[6]等方面的研究; 在研究內(nèi)容上,已有研究主要是對高速公路交通狀況進(jìn)行判別. 李琦[7]以專用車輛檢測器、 感應(yīng)式交通控制系統(tǒng)、 道路收費(fèi)系統(tǒng)、 車輛跟蹤定位系統(tǒng)等多種數(shù)據(jù)源為基礎(chǔ),對交通數(shù)據(jù)的多模式獲取以及交通狀態(tài)監(jiān)測與預(yù)測等方法進(jìn)行了創(chuàng)新性研究; 尹春娥等[8]在宏觀交通流模型和狀態(tài)空間模型的基礎(chǔ)上,基于貝葉斯理論,提出了一種基于混合粒子濾波的交通參數(shù)估計方法; Pascale等[9]提出了一項利用重型車輛數(shù)據(jù)識別典型速度模式的研究,通過探測數(shù)據(jù)識別的速度模式與先前識別的歷史速度模式的對比,對異常事件進(jìn)行了檢測.
綜上所述,國內(nèi)外學(xué)者在高速公路交通流及狀態(tài)判別方面取得了諸多研究成果. 但大多是從高速公路的整體層面進(jìn)行研究,對于高速公路上重要服務(wù)設(shè)施的研究較少. 由于高速公路服務(wù)區(qū)的特殊職能,即為駕駛員提供休息、 就餐,為車輛提供加油、 維護(hù)和修理等服務(wù)的場所,導(dǎo)致了服務(wù)區(qū)路段車輛的行駛模式呈現(xiàn)出不同于一般高速公路路段的特征,影響了高速公路交通狀態(tài)的判別. 為了實現(xiàn)更加準(zhǔn)確的高速公路交通狀態(tài)判別,文章基于“兩客一?!睌?shù)據(jù)對服務(wù)區(qū)路段的車輛行駛模式進(jìn)行研究,以進(jìn)一步挖掘服務(wù)區(qū)路段非正常行駛的車輛數(shù)據(jù),為高速公路交通狀態(tài)判別提供數(shù)據(jù)基礎(chǔ).
考慮到服務(wù)區(qū)路段車輛可能存在不同的行駛模式,研究采用聚類方法對其進(jìn)行分析. 聚類方法是一個將數(shù)據(jù)集劃分為若干組或類的過程,并使得同一個組內(nèi)的數(shù)據(jù)對象具有較高的相似度,而不同組中的數(shù)據(jù)對象則是不相似的. 相似或不相似的度量是基于數(shù)據(jù)對象描述的取值來確定的,通常是利用各對象間距離來進(jìn)行描述[10].
研究采用層次聚類分析法,層次聚類分析法包括單連鎖法、 全連鎖法、 平均連鎖法、 質(zhì)心連鎖法、 中值連鎖法和Ward法,已有研究通常采用的是Ward法. Ward法又稱離差平方和法[11],即以平方歐式距離作為兩類之間的距離,先將集合中每個樣本自成一類,在進(jìn)行類別合并時,計算類重心間方差,通過合并離差平方和增加幅度最小的兩類,再依次將所有類別逐級合并[12]. 具體算法如下:
圖1 數(shù)據(jù)處理流程圖Fig.1 Data processing flow chart
則k個類的類內(nèi)離差平方和為:
為了對車輛的行駛模式進(jìn)行判別,在對高速公路服務(wù)區(qū)路段車速進(jìn)行聚類之前,對服務(wù)區(qū)路段車輛行駛特征進(jìn)行分析. 研究通過浮動車的GPS時空圖對車輛的運(yùn)行軌跡進(jìn)行分析,得到高速公路服務(wù)區(qū)路段的車輛行駛特征. 同時,通過已有數(shù)據(jù)的分析,參考倪捷等[13]關(guān)于車速分布指標(biāo)與線性一致性關(guān)系的研究,選取車速的均值、 方差、 標(biāo)準(zhǔn)差、 偏度、 峰值、 最大值、 最小值進(jìn)行多次分析,發(fā)現(xiàn)車速的最小值、 平均值、 標(biāo)準(zhǔn)差較適合作為聚類分析的特征指標(biāo)進(jìn)行聚類分析,最終對二者結(jié)果進(jìn)行對比驗證,得到高速公路服務(wù)區(qū)路段車輛行駛模式. 具體流程圖見圖1.
2.1 研究對象
選取沈海高速廈門段作為研究路段,如圖2所示. 該路段主要位于廈門市境內(nèi),全長約44.9 km,為雙向8車道. 小汽車最高限速為120 km·h-1,大客車、 貨車最高限速100 km·h-1,最低限速60 km·h-1. 其中共包含2個服務(wù)區(qū),5個互通出入口. 該研究路段建成通車后,車流量逐年增長,經(jīng)濟(jì)效益十分明顯,是閩南各地區(qū)交通聯(lián)系的重要紐帶之一.
數(shù)據(jù)主要涵蓋沈海高速公路廈門段范圍內(nèi)的“兩客一?!睌?shù)據(jù). 隨機(jī)選取了2016年4月18—19日共兩個工作日的數(shù)據(jù)文件,共約101 352條,每條數(shù)據(jù)包括車輛編號、 車輛類型、 當(dāng)前日期、 當(dāng)前時間、 里程數(shù)、 行程車速、 瞬時車速等. 由于“兩客一危”數(shù)據(jù)來源于不同業(yè)務(wù)系統(tǒng),容易出現(xiàn)數(shù)據(jù)的無效和缺失,在開展研究之前,對數(shù)據(jù)進(jìn)行了清洗.
2.2 研究范圍的確定
對于選取多少基本單元來進(jìn)行服務(wù)區(qū)路段運(yùn)行模式的研究沒有一個明確的范圍和控制,因此需要分析服務(wù)區(qū)對車輛的影響范圍. 考慮到東孚服務(wù)區(qū)周邊有海滄樞紐,對車輛的運(yùn)行狀態(tài)會產(chǎn)生一定的影響,因此選取龍掘服務(wù)區(qū)附近的“兩客一危”數(shù)據(jù),對其運(yùn)行軌跡進(jìn)行分析,如圖3所示.
由圖3可知,車輛一般在里程32~35 km內(nèi)呈現(xiàn)出減速再加速的運(yùn)行狀態(tài),并且較多車輛運(yùn)行速度的最低點(diǎn)在33.5 km附近出現(xiàn),此處恰好是龍掘服務(wù)區(qū)的位置所在. 當(dāng)進(jìn)出服務(wù)區(qū)車輛較多的時候,可能會產(chǎn)生交通流的交織,從而使得一部分在高速公路上正常行駛的車輛在服務(wù)區(qū)附近也出現(xiàn)了減速再加速的運(yùn)行狀態(tài). 但與進(jìn)出服務(wù)區(qū)的車輛速度相比,其速度并未為零. 因此,可以判定龍掘服務(wù)區(qū)對周邊車輛的影響范圍大致是3 km左右,即32~35 km之間.
圖2 研究路段示意圖Fig.2 Research expressway section
圖3 服務(wù)區(qū)路段車輛速度-里程圖Fig.3 Vehicle speed-mileage diagram in service section
3.1 基于GPS時空圖的車輛運(yùn)行特征分析
為分析服務(wù)區(qū)路段車輛運(yùn)行特征,選取服務(wù)區(qū)路段“兩客一?!睌?shù)據(jù)進(jìn)行GPS時空圖分析,發(fā)現(xiàn)其運(yùn)行軌跡差異. 根據(jù)服務(wù)區(qū)的影響范圍分析,結(jié)合課題已有的研究成果,選取龍掘服務(wù)區(qū)影響范圍里程32~35 km,30 min內(nèi)的車輛GPS數(shù)據(jù),即選取3×3時空單元格內(nèi)的車輛樣本點(diǎn)進(jìn)行分析.
3.1.1 駛?cè)敕?wù)區(qū)車輛的運(yùn)行特征
選取相應(yīng)的“兩客一危”數(shù)據(jù),繪制相應(yīng)的GPS時空圖,如圖4所示,紅色表示未進(jìn)入服務(wù)區(qū)的車輛,綠色表示進(jìn)出服務(wù)區(qū)的車輛,藍(lán)色表示在該時間段內(nèi)僅進(jìn)入服務(wù)區(qū)的車輛,后續(xù)運(yùn)行軌跡不包括在該時空范圍內(nèi). 由圖4可知,駛?cè)敕?wù)區(qū)的車輛在進(jìn)入服務(wù)區(qū)之前,會有一個明顯的減速趨勢. 但與路段擁堵時車輛的減速不同,駛?cè)敕?wù)區(qū)的車輛速度將減速到0.
圖4 駛?cè)敕?wù)區(qū)車輛GPS時空圖Fig.4 GPS space-time diagram of vehicle entering the service area
3.1.2 駛離服務(wù)區(qū)車輛的運(yùn)行特征
選取相應(yīng)的車輛數(shù)據(jù),繪制相應(yīng)的GPS時空圖,如圖5所示,其中紫色表示在該時間段內(nèi)僅駛出服務(wù)區(qū)的車輛,前面的運(yùn)行軌跡不包括在該時空范圍內(nèi). 由圖5可知,駛離服務(wù)區(qū)的車輛在離開服務(wù)區(qū)時會有一個明顯的加速趨勢. 其在匝道上達(dá)到了規(guī)定車速后,匯入高速公路主線. 與此同時,車輛在服務(wù)區(qū)的停留時間是隨機(jī)的,但進(jìn)出服務(wù)區(qū)車輛的加減速特征都比較明顯.
圖5 駛離服務(wù)區(qū)車輛GPS時空圖Fig.5 GPS space-time diagram of vehicle leaving the service area
3.2 基于聚類分析的車輛行駛模式研究
由于所采用的是“兩客一?!避囕vGPS數(shù)據(jù),不同車輛的GPS數(shù)據(jù)記錄時間和里程等數(shù)據(jù)均不相同,導(dǎo)致車輛的GPS數(shù)據(jù)變化趨勢不明顯,進(jìn)而影響后續(xù)的聚類分析和速度-里程變化曲線圖的繪制. 因此在聚類分析之前,對服務(wù)區(qū)路段車輛數(shù)據(jù)進(jìn)行了預(yù)處理,即在GPS原始數(shù)據(jù)的基礎(chǔ)上進(jìn)行曲線擬合,得到指定里程點(diǎn)車輛的速度信息.
3.2.1 聚類分析對象的選取
根據(jù)服務(wù)區(qū)的影響范圍分析,同時考慮到車輛進(jìn)出服務(wù)區(qū)是隨機(jī)的,因此進(jìn)出服務(wù)區(qū)的車輛數(shù)量適中即可,將工作日2 d內(nèi)經(jīng)過該路段的“兩客一?!避囕v作為聚類分析的樣本數(shù)據(jù),隨機(jī)選取30輛車的速度-里程數(shù)據(jù),對其速度的最小值、 均值、 標(biāo)準(zhǔn)差進(jìn)行分析,作為每輛車的特征指標(biāo)進(jìn)行聚類. 在聚類完成之后,聚類結(jié)果已經(jīng)收斂,同一類別內(nèi)的數(shù)據(jù)對象具有較高的相似度,選取各聚類變量中心即這組數(shù)的平均數(shù)進(jìn)行對比,以便更清晰直觀地反映出各類別之間的差異.
3.2.2 聚類分析結(jié)果
采用Ward法進(jìn)行層次聚類. 在聚類過程中,選擇聚類冰柱圖與樹狀圖顯示出整個聚類的過程. 其中冰柱圖橫軸為個案,縱軸為聚類個數(shù). 冰柱圖中最長的冰柱長度表示當(dāng)前的聚類步數(shù),畫一條橫線在縱軸,即可直觀看出將這些數(shù)據(jù)聚成的類數(shù). 樹狀圖則是展現(xiàn)了聚類分析中每一次類合并的情況. 在橫軸上畫一條垂直線與圖中橫線相交,根據(jù)相交的線段即可判斷分類個數(shù)[14].
通過SPSS軟件分析得到層次聚類冰柱圖與樹狀圖,如圖6所示.
圖6 層次聚類圖Fig.6 Hierarchical clustering diagram
由圖6可知,車輛被分為了3類. 依據(jù)聚類的結(jié)果再分別做出各類車輛的速度-里程變化曲線圖和各類車輛聚類中心對比圖,其中各類中心用各個特征指標(biāo)的均值表示,如圖7、 8所示.
圖7 服務(wù)區(qū)路段各類車輛的速度-里程變化Fig.7 Speed-mileage changes of various types of vehicles in the service section
3.3 各類車輛運(yùn)行模式特征
圖8 各類聚類中心對比圖Fig.8 Comparison of the center of clustering
與其他類型的浮動車相比,“兩客一?!避囕v的速度較低,但由以上各曲線圖可知,“兩客一?!避囕v的3類運(yùn)行特征仍呈現(xiàn)出較大的差異.
1) 類別一表示較為異常的運(yùn)行特征. 由圖8可知,此類運(yùn)行車輛的平均速度低,最小速度值均小于20 km·h-1,而且速度標(biāo)準(zhǔn)差偏大,主要車速區(qū)間為[0, 30]. 同時,由圖7(a)可知,此類車輛的運(yùn)行特征呈現(xiàn)出明顯的減速后又加速的行駛狀態(tài),且行駛速度的最低點(diǎn)在33.5 km附近出現(xiàn),此處恰好是龍掘服務(wù)區(qū)的位置所在. 此類車輛的運(yùn)行特征與GPS時空圖中車輛進(jìn)出服務(wù)區(qū)時駛?cè)牒婉傠x的行駛特征相似. 因此,可以確認(rèn)第一類車輛為進(jìn)出服務(wù)區(qū)的車輛.
2) 類別二表示較為通暢的運(yùn)行特征. 由圖8可知,此類運(yùn)行車輛的平均速度高,最小速度值大,速度標(biāo)準(zhǔn)差小,主要車速區(qū)間為[60, 80]. 同時,由圖7(b)可知,此類車輛的運(yùn)行特征呈現(xiàn)出勻速的行駛狀態(tài),車輛運(yùn)行平穩(wěn),無明顯減速和加速的趨勢. 因此可以確定第二類車輛為高速公路上正常行駛的車輛.
3) 類別三表示較為擁堵的運(yùn)行特征. 由圖8可知,此類運(yùn)行車輛的平均速度較高,最小速度值較小,速度標(biāo)準(zhǔn)差較大,主要車速區(qū)間為[40, 80]. 同時,由圖7(c)可知,第三類車輛的運(yùn)行特征呈現(xiàn)出明顯的減速再加速的行駛狀態(tài). 但不同于類別一的是,其最小速度均大于40 km·h-1,且車速在33.5 km(龍掘服務(wù)區(qū)位置所在)之后會有明顯的提升. 考慮到高速公路服務(wù)區(qū)路段進(jìn)出服務(wù)區(qū)的車輛過多時,會出現(xiàn)交通流互相干擾的情況,從而導(dǎo)致服務(wù)區(qū)附近的后續(xù)車輛行駛車速較低,直至駛過服務(wù)區(qū)后交通流順暢,車速才會迅速提升,恢復(fù)到高速公路路段的正常行駛車速. 因此可以確定第三類車輛為服務(wù)區(qū)路段附近車輛較多時發(fā)生擁堵行駛的車輛.
通過GPS時空圖繪制得到車輛在服務(wù)區(qū)路段的停車及駛離特征,再通過層次聚類分析車輛經(jīng)過服務(wù)區(qū)的不同行駛模式,最后挖掘非正常行駛的車輛數(shù)據(jù). 利用“兩客一?!睌?shù)據(jù)對高速公路服務(wù)區(qū)路段車輛的行駛模式進(jìn)行分析, 得到以下3點(diǎn)結(jié)論.
1) 高速公路服務(wù)區(qū)路段與正常路段的行駛模式不同,存在著進(jìn)出服務(wù)區(qū)、 正常行駛和交織減速的行駛模式.
2) 車輛進(jìn)出服務(wù)區(qū)時,大致需要經(jīng)過減速再加速的行駛過程. 未進(jìn)入服務(wù)區(qū)的車輛則以勻速狀態(tài)平穩(wěn)行駛. 同時在服務(wù)區(qū)路段車輛較多時,還可能會產(chǎn)生交通流的交織,造成路段的擁堵.
3) 通過GPS時空圖以及聚類分析可以看出,聚類分析在高速公路車輛行駛模式的分析中,具有一定的可行性. 對于今后利用高速公路海量GPS數(shù)據(jù)判別車輛在不同路段的運(yùn)行模式研究具有重要的指導(dǎo)作用.
高速公路服務(wù)區(qū)路段的行駛模式分析需要大量且全面的數(shù)據(jù)支持,本研究只選取了服務(wù)區(qū)路段的“兩客一?!睌?shù)據(jù), 且樣本數(shù)量有限. 未來可以增加高速公路服務(wù)區(qū)路段的其他數(shù)據(jù)(例如出租車數(shù)據(jù)、 收費(fèi)數(shù)據(jù)),同時增加研究的樣本量做進(jìn)一步深入研究,通過對車輛GPS大數(shù)據(jù)的處理,以期為出行者提供更加準(zhǔn)確的高速公路交通狀態(tài)信息.
[1] 楊慶芳, 馬明輝, 梁士棟, 等. 基于收費(fèi)數(shù)據(jù)的高速公路交通狀態(tài)判別方法[J]. 華南理工大學(xué)學(xué)報(自然科學(xué)版), 2014, 42(12): 51-57; 76.
[2] 汪帆, 李巖, 劉建蓓, 等. 基于GPS車速數(shù)據(jù)驅(qū)動模型的高速公路極限匝道間距識別[J]. 公路交通科技, 2016, 33(9): 127-135.
[3] 劉凇男. 基于浮動車技術(shù)的高速公路地圖匹配算法研究[D]. 長春: 吉林大學(xué), 2013.
[4] 何兆成, 盧瑞琪, 聶佩林. 基于浮動車定位數(shù)據(jù)的高速公路區(qū)間平均速度估計[J]. 公路交通科技, 2011, 28(6): 128-135.
[5] 唐俊. 基于浮動車數(shù)據(jù)的高速公路路段行程時間預(yù)測方法研究及系統(tǒng)實現(xiàn)[D]. 廣州: 中山大學(xué),2011.
[6] 張嵐嵐. 高速公路行程時間可靠度計量方法研究[D]. 長春: 吉林大學(xué), 2015.
[7] 李琦. 基于多源數(shù)據(jù)的交通狀態(tài)監(jiān)測與預(yù)測方法研究[D]. 長春: 吉林大學(xué), 2013.
[8] 尹春娥, 宋小娜, 劉海朝. 基于混合粒子濾波的高速公路交通參數(shù)自適應(yīng)估計方法[J]. 公路交通科技, 2015, 32(5): 141-146.
[9] PASCALE A, DEFLORIO F, NICOLI M,etal. Motorway speed pattern identification from floating vehicle data for freight applications[J]. Transportation Research Part C, 2015, 51(51):104-119.
[10] 郭軍華. 數(shù)據(jù)挖掘中聚類分析的研究[D]. 武漢: 武漢理工大學(xué), 2003.
[11] 趙驊, 朱莉華, 劉丹. Ward 系統(tǒng)聚類法在多變量分層抽樣技術(shù)中的運(yùn)用[J]. 統(tǒng)計與決策, 2006(23): 67-68.
[12] 楊志恒. 基于 Ward 法的區(qū)域空間聚類分析[J]. 中國人口·資源與環(huán)境, 2010, 20(3): 382-386.
[13] 倪捷, 劉志強(qiáng), 王運(yùn)霞. 雙車道公路線形一致性分析及評價[J]. 中外公路, 2009(1): 4-7.
[14] 李昕, 張明明. SPSS 22.0 統(tǒng)計分析從入門到精通[M]. 北京: 電子工業(yè)出版社, 2015.
(責(zé)任編輯: 洪江星)
Research on vehicle driving pattern in expressway service section based on “l(fā)ong-distance bus and truck” data
GAO Yueer1, KAN Xiaoxi1, XU Chuan2, CUI Ziwei3
(1. School of Architecture, Huaqiao University, Xiamen, Fujian 361021, China; 2. School of Transportation and Logistics, Southwest Jiaotong University, Chengdu, Sichuan 610031, China; 3. School of Mathematical Sciences, Huaqiao University, Quanzhou, Fujian 362021, China)
Based on the data of “l(fā)ong-distance bus and truck” data, taking the Xiamen section of Shen Hai expressway as an example, the vehicle driving characteristics in expressway service section are found by means of the GPS spatial- temporal diagrams of the floating car. At the same time, the average velocity, the minimum velocity and the velocity variance of the vehicle are selected to carry out hierarchical clustering to get the vehicle driving pattern in the service section. The results show that there are three kinds of driving pattern in expressway service section, namely, in and out of service areas, normal driving and weaving deceleration, which can represent the actual running state of the vehicle in service section.
“l(fā)ong-distance bus and truck” data; expressway; service section; driving pattern; hierarchical clustering
10.7631/issn.1000-2243.2017.03.0398
1000-2243(2017)03-0398-06
2017-03-27
高悅爾(1983-),博士,講師,主要從事交通運(yùn)輸規(guī)劃與管理方面的研究,gaoyueer123@gmail.com
國家自然科學(xué)基金資助項目(51608209); 華僑大學(xué)高層次人才科研啟動項目(600005-Z15Y0035)
U491
A