桑美英
(交通運(yùn)輸部科學(xué)研究院,北京,100029)
?
高速公路車輛行駛路徑模糊匹配分析
桑美英
(交通運(yùn)輸部科學(xué)研究院,北京,100029)
摘要:高速公路車輛行駛路徑在省界站處被自然分隔為兩段,不能真實(shí)反映行駛車輛在高速公路上的路徑信息。本文選取收費(fèi)系統(tǒng)中車牌號(hào)、出入口時(shí)間、軸型、車貨總重等字段信息,利用貝葉斯方法對(duì)分隔路徑進(jìn)行模糊匹配,從而得出行駛車輛在高速公路的全路徑信息。
關(guān)鍵詞:高速公路;行駛路徑;貝葉斯;模糊匹配
隨著高速公路的快速發(fā)展,全國(guó)各省高速公路聯(lián)網(wǎng)收費(fèi)系統(tǒng)也逐漸建立起來(lái)。目前高速公路聯(lián)網(wǎng)收費(fèi)系統(tǒng)仍為省內(nèi)聯(lián)網(wǎng)、省內(nèi)統(tǒng)一清分結(jié)算,高速公路行駛車輛在通過(guò)各省省界站時(shí)對(duì)出省進(jìn)省分別進(jìn)行通行費(fèi)結(jié)算,因此車輛行駛路徑也同時(shí)被自然分隔為兩段,不能真實(shí)反映行駛車輛在高速公路上的路徑信息。高速公路的路徑信息依托于聯(lián)網(wǎng)收費(fèi)系統(tǒng)中的車牌號(hào)、出入口時(shí)間、車型、軸型、車貨總重等字段信息。為了能更加真實(shí)的反應(yīng)區(qū)域間的經(jīng)濟(jì)往來(lái),本文基于行駛字段信息來(lái)還原出入省界車輛在高速公路上的行駛路徑。
1.1高速公路省界收費(fèi)站基本情況
由于各省(市)實(shí)行?。ㄊ校﹥?nèi)聯(lián)網(wǎng)收費(fèi),跨不同聯(lián)網(wǎng)收費(fèi)區(qū)域的高速公路行駛車輛的全路徑在省界站被分隔,行駛車輛在省界站完成在行駛省份的交易額結(jié)算并領(lǐng)鄰省卡在鄰省行駛,從而在各省聯(lián)網(wǎng)收費(fèi)系統(tǒng)中分別生成一條收費(fèi)記錄。不同的省份省界站設(shè)置不同,具體分類見表1.
1.2高速公路字段指標(biāo)基本情況
表1 省界站情況分類
高速公路原始收費(fèi)系統(tǒng)里蘊(yùn)含了大量的字段信息、卡口視頻圖像、車牌識(shí)別圖片,其中包括出入口收費(fèi)站編號(hào)、出入口日期及時(shí)間、出入口車道編號(hào)、出入口車牌號(hào)及顏色、出入口車型車種信息、收費(fèi)金額、收費(fèi)員信息、行駛里程、貨重等近100個(gè)字段。在海量高速公路收費(fèi)記錄中,車牌號(hào)是一輛車的唯一標(biāo)識(shí),因此從邏輯上講,車牌號(hào)、出入口時(shí)間、出入口站點(diǎn)編碼的組合即可判斷兩條記錄是否屬于同一輛車的一次出行。但由于關(guān)鍵字段“車牌號(hào)”在各省收費(fèi)系統(tǒng)中的質(zhì)量參差不齊,存在缺失、識(shí)別錯(cuò)誤、識(shí)別不完整等情況,需結(jié)合其他屬性字段進(jìn)行模糊判別。
2.1行駛路徑模糊匹配指標(biāo)分析
由于各省收費(fèi)系統(tǒng)中“車牌”數(shù)據(jù)表現(xiàn)會(huì)有差異,不能作為唯一識(shí)別指標(biāo),需要關(guān)聯(lián)其他指標(biāo)。例如,車牌為豫A 12345的貨車在從河南到湖北跨省行駛時(shí),其行駛軌跡被分割為河南省內(nèi)和湖北省內(nèi)兩段:在河南高速公路收費(fèi)系統(tǒng)中,其行駛記錄包含如車牌號(hào)、軸數(shù)、車貨總重等指標(biāo),根據(jù)識(shí)別情況,各項(xiàng)指標(biāo)數(shù)據(jù)為車牌豫A 1**4*、軸數(shù)6軸、車貨總重20000千克;在湖北高速公路收費(fèi)系統(tǒng)中,相應(yīng)識(shí)別為車牌*A ***45、軸數(shù)6軸、車貨總重21000千克,客觀上無(wú)法直接通過(guò)車牌確認(rèn)兩條行駛記錄為同一輛車跨省行駛記錄,因此,需結(jié)合其他相關(guān)指標(biāo),如軸數(shù)、車貨總重、進(jìn)出收費(fèi)站時(shí)間等指標(biāo),且這些指標(biāo)能夠共同識(shí)別唯一車輛。
2.2行駛路徑模糊匹配思路
所謂路徑匹配,即對(duì)于A、B兩省的相鄰省界收費(fèi)站,判別A省省界收費(fèi)站的某條收費(fèi)記錄與B省省界收費(fèi)站的某條收費(fèi)記錄,屬于同一輛車的同一次出行。將屬于同一輛車的同一次出行的兩條記錄進(jìn)行串接,還原其真實(shí)路徑。如圖一所示。
圖1 按?。ㄊ校┞?lián)網(wǎng)收費(fèi)收費(fèi)路徑示意圖
本文利用貝葉斯的方法對(duì)行駛車輛進(jìn)行模糊匹配。在車輛匹配中,選取“車牌號(hào)”、出入口時(shí)間、軸數(shù)、車貨總重等指標(biāo);即在分別讀取A省出口收費(fèi)站和B省入口收費(fèi)站數(shù)據(jù)后,在合理的時(shí)間范圍T內(nèi),匹配車牌完整且完全相同的記錄,將成功匹配記錄記入新文件,同時(shí)將不匹配記錄記回原文件;通過(guò)對(duì)匹配記錄的數(shù)據(jù)分析,分別得到匹配車輛的相關(guān)屬性指標(biāo)(時(shí)間、軸數(shù)、重量等)差異的分布特征,記匹配車輛進(jìn)出站時(shí)間差的最大可能分布范圍為t;同時(shí)運(yùn)用統(tǒng)計(jì)模擬的方法計(jì)算出不匹配車輛的相關(guān)屬性指標(biāo)分布特征;對(duì)于每一個(gè)入口收費(fèi)站車輛,以其入口記錄時(shí)間為基準(zhǔn),選擇t范圍內(nèi)的所有出口記錄,運(yùn)用貝葉斯定律計(jì)算彼此車輛間的貝葉斯匹配概率P,統(tǒng)計(jì)車輛間的貝葉斯匹配概率與車牌相似度M加權(quán)之和,將得分最高的出口車輛作為與該入口車輛匹配;由于可能存在多個(gè)入口車輛匹配同一輛出口車輛的情況,還需要在所有匹配記錄中選擇得分最高的那對(duì)匹配記錄作為最終的匹配結(jié)果。
圖2 京港澳豫鄂站(河南)和鄂北站(湖北)位置圖
本文選取京港澳豫鄂界(河南)和鄂北站(湖北)2015年9月份某一天貨車的數(shù)據(jù)量為例,該兩站是一對(duì)共建省界站,分省管理,分別位于河南省信陽(yáng)市羅山縣和湖北省孝感市大悟縣,兩站站距約為26.2公里,正常通過(guò)時(shí)間間隔為17-19分鐘。其位置如下圖1所示。兩站站編碼和車流量總體情況如下表2所示。
表2 京港澳豫鄂界(河南)和鄂北站(湖北)總數(shù)據(jù)量情況
3.1車牌號(hào)數(shù)據(jù)質(zhì)量分析
京港澳豫鄂界(河南)和鄂北站(湖北)的的車牌號(hào)數(shù)據(jù)質(zhì)量如表3所示??梢钥闯?,兩站的車牌號(hào)質(zhì)量差異較大,湖北的鄂北站車牌號(hào)數(shù)據(jù)質(zhì)量相當(dāng)好,雙方向完整車牌比例(不含車牌顏色)達(dá)到了96%以上;河南的京港澳豫鄂界數(shù)據(jù)質(zhì)量相對(duì)較差,尤其出站方向,完整車牌比例不足50%。
表3 京港澳豫鄂界(河南)和鄂北站(湖北)車牌號(hào)數(shù)據(jù)質(zhì)量
由于無(wú)車牌和不完整車牌數(shù)據(jù)的大量存在,導(dǎo)致利用車牌號(hào)直接實(shí)現(xiàn)匹配的成功率不高,如下表4所示。為此,本文引入了貝葉斯方法對(duì)貨車車輛通過(guò)模糊匹配提高車輛的匹配率。
表4 京港澳豫鄂界(河南)和鄂北站(湖北)車牌直接匹配情況
3.2貨車匹配過(guò)程及結(jié)果分析
考慮到車牌匹配的準(zhǔn)確度更高和貝葉斯方法在干擾數(shù)據(jù)少的情況下準(zhǔn)確度更高,貨車匹配分為如下步驟:
1. 在讀取2015年9月某一天京港澳豫鄂站、鄂北站出口收費(fèi)站和入口收費(fèi)站貨車數(shù)據(jù)后,先在時(shí)間范圍T(1000秒)內(nèi),匹配車牌完整且完全相同的記錄。將成功匹配記錄寫入新文件,同時(shí)將不匹配記錄寫回原文件。
2. 利用構(gòu)建的樣例集數(shù)據(jù),比較不同備選屬性指標(biāo)組合下的貝葉斯計(jì)算精度,最終獲得車輛匹配效果最好的屬性指標(biāo)組合:“進(jìn)出站時(shí)間差”、“進(jìn)出站車貨總重變化比”和“進(jìn)出站軸差”三個(gè)指標(biāo)。
3. 讀取直接匹配的貨車屬性,計(jì)算車輛對(duì)的特征指標(biāo)。在t時(shí)間窗(-150,50)秒內(nèi),計(jì)算得出每對(duì)車輛的“進(jìn)出站時(shí)間差”、“進(jìn)出站車貨總重變化比”和“進(jìn)出站軸差”上述三個(gè)指標(biāo)后,再計(jì)算配對(duì)車輛這三個(gè)指標(biāo)的分布特征。如下圖3所示。
圖3 京港澳豫鄂站(河南)和鄂北站(湖北)貨車特征概率分布
4. 對(duì)于每一個(gè)入口貨車,以其入口記錄時(shí)間為基準(zhǔn),選擇進(jìn)出站時(shí)間差窗口(-150,50)秒范圍內(nèi)的所有出口車輛記錄,計(jì)算三個(gè)指標(biāo)取值,在此基礎(chǔ)上運(yùn)用貝葉斯定律計(jì)算彼此車輛間的貝葉斯得分。計(jì)算車輛間的貝葉斯得分與車牌相似度加權(quán)之和,將得分最高的出口車輛作為和該入口車輛匹配的車輛記錄,并將匹配好的車輛從原數(shù)據(jù)集中刪掉。匹配結(jié)果如下表5所示。
5. 從剩下的未配對(duì)車輛中(大部分是無(wú)車牌記錄),重復(fù)上述貝葉斯計(jì)算,對(duì)于每一個(gè)入口貨車,從滿足進(jìn)出站時(shí)間差窗口(-150,50)秒要求和貝葉斯得分閾值要求(P>=0.57)的車輛中,選擇貝葉斯得分最高的車輛作為配對(duì)車輛。匹配結(jié)果示例如下表6。
通過(guò)這一方法,車牌號(hào)可以直接匹配的有2489條記錄;運(yùn)用“貝葉斯匹配+車牌相似度”找到197條記錄;運(yùn)用單純貝葉斯匹配也找到了275條記錄,從測(cè)試數(shù)據(jù)看具有較高的準(zhǔn)確度。該方法既充分利用了車牌信息,又減少了在無(wú)車牌數(shù)據(jù)配對(duì)時(shí)的干擾源,從而提高了數(shù)據(jù)配對(duì)的準(zhǔn)確度,高效串接了在省界站處被分隔的行駛車輛,進(jìn)一步摸清了行駛車輛在高速公路上的軌跡路徑。
參考文獻(xiàn)
[1] 盧楨. 高速公路路徑識(shí)別設(shè)計(jì)及應(yīng)用[J].科技與創(chuàng)新,2014 (12).
[2] 許永存. 基于車牌的高速公路路徑識(shí)別技術(shù)應(yīng)用研究[J].技術(shù),2015(10).
表5 京港澳豫鄂界(河南)和鄂北站(湖北)部分貨車綜合匹配結(jié)果
表6 京港澳豫鄂界(河南)和鄂北站(湖北)部分貨車貝葉斯匹配結(jié)果
表7 貨車路徑模糊匹配結(jié)果
Analysis on the fuzzy matching of highway vehicle routing path
Sang Meiying
(China Academy of Transportation Sciences,Beijing,100029)
Abstract:Vehicle highway route in provincial boundary station is naturally separated into two segments,wh ich can not reflect the real route information of vehicle traveling on the highway. This paper selected lic ense plate number,a time portal,axle,truck weight from the charging system ,use Bayesian methods to separat e path for fuzzy matching,thus obtains full path information of the vehicles on the expressway.
Keywords:highway;travel path;Bayesian;fuzzy matching