楊奎軍 李玉寶 陳翠嬌
摘 要:通過神經(jīng)網(wǎng)絡(luò)模型對固定檢測器采集的地點車速數(shù)據(jù)、交通流量數(shù)據(jù)和手機切換技術(shù)提取的路段行程時間數(shù)據(jù)進行時間、空間和語義的一致化處理,最后用路段平均車速對道路交通狀態(tài)進行評估,以山東省濟樂高速南延段為例,采用該多源數(shù)據(jù)融合模型相較于固定檢測數(shù)據(jù)融合模型,得出的路段平均車速誤差值減小。
關(guān)鍵詞:交通狀態(tài);神經(jīng)網(wǎng)絡(luò);異構(gòu)數(shù)據(jù)
中圖分類號:U491 文獻標識碼:A
0 引言
行駛在高速公路的車輛受車輛速度、時間占有率、車流量以及天氣狀況等客觀條件的影響,極易造成高速公路的交通擁堵以及二次事故的引發(fā),目前高速公路交通狀態(tài)預(yù)測所使用的微波檢測器雖然固定,但在路網(wǎng)分布上相對稀疏。史巖[1]采用神經(jīng)網(wǎng)絡(luò)模型對微波檢測器、牌照識別檢測器采集的交通流速度數(shù)據(jù)和浮動車數(shù)據(jù)進行融合。姚午開選用收費站刷卡數(shù)據(jù)和浮動車數(shù)據(jù)進行數(shù)據(jù)融合,采用極限學習機算法對高度公路交通狀態(tài)進行評估。
出行者對于規(guī)劃路線的選擇比較注重行程時間,而行程時間的長短受多種因素的影響,手機活動數(shù)據(jù)覆蓋的時空范圍相對較廣,可以彌補固定檢測數(shù)據(jù)的不足,基于固定檢測器采集的數(shù)據(jù)和手機活動數(shù)據(jù),提出基于神經(jīng)網(wǎng)絡(luò)的高速公路異構(gòu)數(shù)據(jù)融合方法。
1 數(shù)據(jù)獲取及預(yù)處理
1.1 原始數(shù)據(jù)獲取
以山東省濟樂高速南延段的固定檢測數(shù)據(jù)、手機活動數(shù)據(jù)作為研究對象。
1.2 微波檢測數(shù)據(jù)預(yù)處理
1.2.1 剔除錯誤數(shù)據(jù)
(1)閾值法。1)地點速度為一瞬時值,是指車輛通過道路某一個斷面的行駛速度,瞬時值不確定性較大,需要對速度區(qū)間加以彈性系數(shù)如式1所示:
式中:表示點速度;表示道路速度上限;視為彈性系數(shù),一般取1.3~1.5之間。
濟樂高速南延段的最高設(shè)計速度為100 km/h,所以超過150 km/h的數(shù)據(jù)即可視為錯誤數(shù)據(jù)。
2)交通量是對所經(jīng)過車輛進行統(tǒng)計的最終結(jié)果,統(tǒng)計時間將會影響統(tǒng)計結(jié)果,所以加入彈性系數(shù)為,如式2所示:
式中:表示交通量;視為彈性系數(shù),一般取1.3~1.5之間;表示道路通行能力;表示數(shù)據(jù)采集時間。
濟樂高速南延段單車道道路通行能力2 400 h,彈性系數(shù)為1.5,統(tǒng)計時間間隔為5 min,那么在時間間隔內(nèi)最大值為300輛。
(2)交通流邏輯判別法。閾值法剔除的錯誤數(shù)據(jù)是區(qū)間外的,但是不缺乏區(qū)間內(nèi)的數(shù)據(jù)存在錯誤,這是由于數(shù)據(jù)傳輸?shù)榷喾矫嬖蛟斐傻?,這些數(shù)據(jù)也會影響道路交通狀態(tài)的判斷,所以需要將這些數(shù)據(jù)刪除。當?shù)攸c車速和交通量出現(xiàn)兩者不同時為0,可視為錯誤數(shù)據(jù),應(yīng)將其剔除。
1.2.2 修補缺失數(shù)據(jù)
(1)時間序列插補法。本文選用三組歷史數(shù)據(jù),利用時間序列法進行缺失數(shù)據(jù)的插補,方法如3所示:
(3)
式中:表示缺失數(shù)據(jù)值;表示第一組歷史數(shù)據(jù)值;表示第二組歷史數(shù)據(jù)值;表示第三組歷史數(shù)據(jù)值。
(2)空間位置插補法。空間位置插補法是依據(jù)檢測器數(shù)據(jù)在空間特征上具備關(guān)聯(lián)關(guān)系,具體如下:
式中,是在第個時間間隔內(nèi)的時間平均車速;是第個時間間隔內(nèi)的時間平均車速;是第個時間間隔內(nèi)時間平均車速的方差。
1.3 手機活動數(shù)據(jù)
通行車輛載有的持卡手機,在行駛過程中經(jīng)過的相鄰基站可視為道路的固定檢測區(qū)域,當行駛的車輛從一個切換小區(qū)行駛到下一個切換小區(qū)時,通信運營商后臺能夠顯示車輛經(jīng)過兩個切換小區(qū)的時間及位置。通過標定好的切換路段長度L和時間差,對經(jīng)過固定檢測區(qū)域的車輛進行路段平均速度的計算。
1.4 空間匹配
選取固定檢測器采集的數(shù)據(jù)與手機活動數(shù)據(jù)作為數(shù)據(jù)源,數(shù)據(jù)融合過程中數(shù)據(jù)需要對應(yīng)于同一空間,數(shù)據(jù)要保證是同一路段的高速數(shù)據(jù),否則融合達不到目的。選擇山東省濟樂南延高速路段的兩類數(shù)據(jù)進行空間匹配。
1.5 時間匹配
不同檢測器采集數(shù)據(jù)的時間間隔不同,需要將采集的數(shù)據(jù)變換成一致的時間周期,并將同一時刻的數(shù)據(jù)進行匹配。手機活動數(shù)據(jù)的傳輸間隔可自由設(shè)定,固定檢測器采集的數(shù)據(jù)上傳間隔為5 min。
2 基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)融合
論文以建立異構(gòu)數(shù)據(jù)為輸入和路段車速為輸出的三層前饋BP神經(jīng)網(wǎng)絡(luò)融合模型。輸入層主要負責接收不同的輸入信息,隱藏層的神經(jīng)元數(shù)目不固定,但數(shù)量與模型的強健性呈正相關(guān),但同時也會增加模型訓練的迭代次數(shù)。輸出層是前兩層經(jīng)過傳輸、分析后形成的輸出結(jié)果,即路段平均車速。
通常,輸入層至隱藏層的隱節(jié)點采用函數(shù)激活,隱藏層至輸出層選用線性函數(shù)激活。表達式如下:
3 模型結(jié)果對比
將周三下午15:40-16:00的行程時間作為預(yù)測對象,選用之前十周每周三的行程時間作為神經(jīng)網(wǎng)絡(luò)的訓練數(shù)據(jù),將訓練數(shù)據(jù)分為事故發(fā)生事故不發(fā)生兩類分別訓練,將周三下午15:40-16:00的實際數(shù)據(jù)作為驗證數(shù)據(jù)。選擇均方根誤差RMSE作為數(shù)據(jù)融合模型的評價指標,公式如下:
式中,是第k個時間間隔的融合平均速度;是第k個時間間隔的真實平均速度;N是總的時間間隔數(shù)量。
4 結(jié)論
基于神經(jīng)網(wǎng)絡(luò)的固定檢測數(shù)據(jù)和手機活動數(shù)據(jù)的多源融合模型,相比較于單源數(shù)據(jù),多源數(shù)據(jù)融合后選取的行程時間指數(shù)TTI增加了評估的穩(wěn)定性以及準確性,評估結(jié)果更能反應(yīng)目前的道路交通狀況。在以后的研究中,可考慮更多的影響因素,提高預(yù)判系統(tǒng)的整體性能。
參考文獻:
[1]史巖,董宏輝,張瑜,等.多源檢測器的交通數(shù)據(jù)融合研究[J].道路交通與安全,2015,15(03):35-40.