李 銳
(安徽省高速公路聯(lián)網(wǎng)運營有限公司,安徽 合肥 230000)
高速公路車輛行駛路徑預測的結(jié)果可用于運輸組織優(yōu)化、異常行駛路徑分析、交通狀況預測、交通熱點分布分析等,對高速公路交通管控有著十分重要的意義。[1]在高速公路門架系統(tǒng)建設(shè)前,對于環(huán)網(wǎng)造成的多義路徑問題,采用在入口和出口中間建設(shè)標識點的方式來精確識別和預測行駛路徑。2019年啟動取消高速公路省界收費站工程后,通過路網(wǎng)增設(shè)的近29 000 套ETC 門架系統(tǒng),可以更加精確地實現(xiàn)路徑識別,并從ETC 收費系統(tǒng)中的入口、出口、門架、車道、時間、車牌、車型等數(shù)據(jù)中,挖掘出具有一定特征的車輛在一定行駛行為和行駛狀態(tài)下的行駛規(guī)律,從而預測出車輛后續(xù)的行經(jīng)門架,分析異常行駛路徑。[2]該文通過對ETC 門架數(shù)據(jù)的挖掘,構(gòu)建了ETC 門架序列數(shù)據(jù)庫,并在此基礎(chǔ)上實現(xiàn)了單一馬爾可夫鏈,并給出了轉(zhuǎn)移概率的計算方法。針對單一馬爾可夫鏈在預測上準確率和覆蓋率不足的缺點,提出了多維融合的馬爾可夫路徑預測模型,該模型在單一馬爾可夫鏈的基礎(chǔ)上,將門架系統(tǒng)數(shù)據(jù)中得到的時間維、路網(wǎng)維、車輛維數(shù)據(jù)進行多維融合和信息下鉆,預測出車輛的在途后續(xù)行駛路徑。
自1959年車輛行駛路徑問題被提出以來,很多算法和數(shù)據(jù)模型用于解決行駛路徑計算和預測問題。啟發(fā)式算法中的禁忌搜索算法、遺傳算法和模擬退火算法實現(xiàn)了全局最優(yōu)解的功能,多用于解決最短路徑問題;蟻群算法雖然用于解決旅行商問題,但是容易陷入局部優(yōu)化的缺陷,不適用路網(wǎng)規(guī)模較大的情況;卡爾曼濾波法基于車輛運動模式,對車輛未來行駛路徑進行預測,也用于道路交通量的預測;固定階馬爾可夫模型則可用于短距離路徑預測。
根據(jù)《高速公路ETC 門架系統(tǒng)技術(shù)要求》布設(shè)原則,ETC 門架與互通立交、入/出口匝道端部、被交道路直線距離1.5~3 km,相鄰兩個實體門架間的平均里程約為15 km。如果能夠通過車輛數(shù)據(jù)、路網(wǎng)數(shù)據(jù)、時間數(shù)據(jù)的融合挖掘,預測車輛即將行駛的下一個或下幾個門架,則實現(xiàn)了動態(tài)預測車輛行駛路徑的目的。因此,在當前被ETC 門架全覆蓋的路網(wǎng)環(huán)境下,更適宜采用馬爾可夫模型進行短距離路徑預測。
馬爾可夫模型是基于當前狀態(tài)僅僅依賴于前幾個狀態(tài)的馬爾可夫假設(shè)來實現(xiàn)的。n階馬爾可夫模型的意思表示是:狀態(tài)間的轉(zhuǎn)移僅依賴于前n個狀態(tài)的過程。將車輛從某個門架開往下一個門架的動作表示為該門架的狀態(tài)轉(zhuǎn)移,該門架到達下一個門架的概率為轉(zhuǎn)移概率。則根據(jù)一階馬爾可夫鏈,車輛經(jīng)過某個門架序列的N次觀測序列的聯(lián)合概率分布為:
式中,p(xi)——車輛開往門架i的觀測概率;——車輛開往門架n的概率觀測值,該值僅依賴于車輛經(jīng)過門架n-1 的觀測概率。由此可知,由前n個狀態(tài)決定的n階馬爾可夫鏈公式表示如下:
為了能夠基于馬爾可夫模型計算出車輛經(jīng)過某個門架序列的概率,需要建立ETC 門架序列數(shù)據(jù)庫,實現(xiàn)對路網(wǎng)中所有路徑的數(shù)據(jù)化表示,并供路徑預測模型調(diào)用。門架序列可以是單個門架,也可以是多個轉(zhuǎn)移概率為100%所組成的序列。
假設(shè)ETC 車輛在高速公路上所經(jīng)過的門架為一個門架序列,則車輛所經(jīng)過的門架序列構(gòu)成ETC 門架序列數(shù)據(jù)庫GSDB,表示為:
GSDB={x1,x2, …,xm},其中xi(i=1…m)表示車輛行經(jīng)的門架序列。
GSDB 馬爾可夫鏈表示為:M=
X是GSDB 的集合,可表示為{x1,x2, …,xn},每個xi對應一個門架序列{x1,x2, …,xm},稱為模型的一個狀態(tài);
P為轉(zhuǎn)移概率矩陣,P=pij=p(Xt=xi|Xt-1=xi)表示由狀態(tài)xi轉(zhuǎn)移到狀態(tài)xj的概率。
P滿足以下條件:
假設(shè)某輛車在t時刻生成的車輛路徑序列為x,狀態(tài)用xt表示,則t時刻處于狀態(tài)xi的第i維等于1, 其余各維都為0。則基于GSDB 單一馬爾可夫鏈的未來路徑預測概率為:
可以從矩陣結(jié)果中取概率值最大的前n個狀態(tài)的集合或者取大于規(guī)定閾值的狀態(tài)集合作為模型的預測結(jié)果。
在采用單一馬爾可夫鏈預測t時刻車輛的未來路徑序列時,只采用了門架序列數(shù)據(jù)庫這一路網(wǎng)維度特征對所有車輛的行駛路徑進行預測。但是車輛的行駛行為是一個復雜的過程,會受到多種因素的影響,采用多維數(shù)據(jù)融合技術(shù),將車輛類別、行駛時間等維度的數(shù)據(jù)融合至預測模型,從細致的維度來描述車輛的通行特征,預測結(jié)果將會更加精準[3-4]。
ETC 門架數(shù)據(jù)融合經(jīng)歷了數(shù)據(jù)獲取、數(shù)據(jù)預處理、特征提取、維度分類、融合決策的過程。如圖1 所示,從ETC 門架系統(tǒng)中獲取ETC 門架數(shù)據(jù)后,根據(jù)應用方向選取樣本數(shù)據(jù),從樣本數(shù)據(jù)中提取應用特征,如車輛特征、門架特征、時間特征、路網(wǎng)特征等,將特征進行維度分類,將分類后的各個維度及下鉆維度輸入融合決策模型,最終得到?jīng)Q策結(jié)果。
圖1 數(shù)據(jù)融合過程
(1)門架數(shù)據(jù)及相關(guān)樣本數(shù)據(jù)。ETC 門架系統(tǒng)產(chǎn)生的數(shù)據(jù)包括:ETC 門架交易流水、ETC 通行記錄、牌識流水記錄、CPC 卡通行記錄、原始收費數(shù)據(jù)、異常交易數(shù)據(jù)、抓拍圖片、視頻、日志數(shù)據(jù)和主要設(shè)備設(shè)施狀態(tài)數(shù)據(jù)等。需要采用這些原始數(shù)據(jù)的數(shù)據(jù)庫表生成新的用于構(gòu)建GSDB 和實現(xiàn)路徑預測的表,并采集樣本數(shù)據(jù)進行概率計算。部分核心信息如表1 所列。
表1 ETC 門架部分核心信息
(2)門架數(shù)據(jù)維度處理?!熬S”讓觀察者能夠從某個特定的角度觀察到事物比較顯而易見的屬性,不同的角度所觀察到的屬性是割裂的,但是利用“維”之間的交匯點實現(xiàn)多個“維”的融合后,能夠從全局的角度生成新的事物屬性。
將用于行駛路徑預測的門架樣本數(shù)據(jù)特征值分成時間維、路網(wǎng)維、車輛維。通過時間維能夠觀測到車輛行駛?cè)肟?、出口、各個門架以及門架區(qū)間的具體時間和通行耗時;通過路網(wǎng)維能夠觀測到高速公路的門架分布、路網(wǎng)分布,生成門架序列數(shù)據(jù)庫GSDB;通過車輛維能夠觀測到車輛車牌、車型、類別、顏色、速度等車輛的動態(tài)和靜態(tài)特征。在進行維度融合并采用預測模型實現(xiàn)決策處理后,就能夠推算出新的行駛特征結(jié)論,如圖2所示。
圖2 ETC 門架三維數(shù)據(jù)立方圖
如果僅采用該文2.3 節(jié)描述的基于ETC 門架序列的單一馬爾可夫鏈進行決策處理,得到的行駛特征結(jié)論只能是:從A 入口駛?cè)敫咚俟?,行?jīng)某門架序列的車輛,從B 出口駛出的概率為pj。這一結(jié)論過于粗糙,存在較大誤差。因此,該文進一步提出了多維數(shù)據(jù)融合的馬爾可夫路徑預測模型,目的是將車輛特征、行駛時間等維度的數(shù)據(jù)融合至預測模型,從更加細致的維度來描述車輛的通行特征,得到更加精準的預測結(jié)果。[5]如:某種車型的車輛在某個時間段內(nèi)通過A 入口進入高速公路,以平均時速80 km/h 行經(jīng)某門架序列的概率為pj,滿足以上條件的車輛,從B 出口駛出的概率為pj。
基于車輛通行行為特征實現(xiàn)車輛維度分類,通行行為包括入/出口組合、GSDB 中的門架序列組合、平均時速、通行車道等。車輛類別的統(tǒng)計歸類采用聚類算法實現(xiàn),使得同一類車輛之間的通行行為特征相似度最高。設(shè)C={c1,c2, …,ck}表示車輛的類別,任意車輛屬于類別的概率為PC,則:
基于車輛通行時間實現(xiàn)車輛時間維度分類,通行時間包括行經(jīng)入/出口時間、行經(jīng)門架時間。設(shè)T={t1,t2, …,tm}表示時間類別,假設(shè)某輛車t時刻的時間類別為t1,表達的意思是某輛車在t時刻經(jīng)過了某入口/出口/門架,或在t時間段經(jīng)過了某門架序列,該車輛時間類別為ti的概率為Pti,則:
多維數(shù)據(jù)融合的馬爾可夫鏈表示為:M=
假設(shè)某輛車在t時刻生成的車輛路徑序列為x,狀態(tài)用xt表示,則t時刻處于狀態(tài)xi的第i維等于1, 其余各維都為0。則多維數(shù)據(jù)融合的馬爾可夫鏈的未來路徑預測概率為:
可以從矩陣結(jié)果中取概率值最大的前n個狀態(tài)的集合或者取大于規(guī)定閾值的狀態(tài)集合作為模型的預測結(jié)果。
該文在對目前成熟的路徑預測模型進行比較后,針對當前已經(jīng)被門架覆蓋全網(wǎng)的高速公路路網(wǎng)環(huán)境,采用馬爾可夫鏈實現(xiàn)未來行駛路徑預測。通過建立ETC 門架序列數(shù)據(jù)庫(GSDB),實現(xiàn)了對路網(wǎng)維的數(shù)據(jù)表示,基于GSDB 的單一馬爾可夫鏈的路徑預測結(jié)果可以是經(jīng)過下一個門架的概率、經(jīng)過下一個出口的概率、經(jīng)過下一個門架序列的概率等。但是單一馬爾可夫鏈的預測準確率不高,因此我們提出了多維融合的馬爾可夫路徑預測模型,該模型引入了車輛維度和時間維度進行更加細致的特征分類,能夠更加明確地對車輛行為特征進行描述和劃分,預測結(jié)果更具有參考性。