王龐偉,王天任,李振華,劉 虓,孫玉蘭
(1.北方工業(yè)大學(xué)智能交通技術(shù)交通運輸行業(yè)重點實驗室,北京 100144;2.北方工業(yè)大學(xué)城市道路交通智能控制技術(shù)北京市重點實驗室,北京 100144;3.中信科智聯(lián)科技有限公司,北京 100029)
隨著V2X(vehicle to everything,V2X)通信技術(shù)不斷發(fā)展,智能網(wǎng)聯(lián)汽車在網(wǎng)絡(luò)安全、數(shù)據(jù)安全等方面面臨眾多挑戰(zhàn)。各項研究成果表明[1],基于智能網(wǎng)聯(lián)汽車V2X數(shù)據(jù)與多種交通傳感器建立交通數(shù)據(jù)集來短時預(yù)測交通運行狀態(tài),可以大幅提高交叉口的通行效率,提高道路安全性,為智能網(wǎng)聯(lián)汽車提供信息安全保障。
目前的城市路網(wǎng)系統(tǒng)存在復(fù)雜的通信網(wǎng)絡(luò),智能網(wǎng)聯(lián)汽車通信與任務(wù)卸載過程極易受到網(wǎng)絡(luò)干擾或攻擊導(dǎo)致數(shù)據(jù)缺失。利用邊緣計算技術(shù)來解決智能網(wǎng)聯(lián)汽車網(wǎng)絡(luò)傳輸安全與缺失數(shù)據(jù)補全問題成為發(fā)展趨勢。利用V2V(vehicle to vehicle,V2V)與V2I(vehicle to infrastructure,V2I)通信技術(shù)實時獲取的智能網(wǎng)聯(lián)汽車數(shù)據(jù)判斷城市路網(wǎng)的交通事件,并通過對智能網(wǎng)聯(lián)汽車任務(wù)卸載數(shù)據(jù)采樣加密[2]、安全信道決策[3]、異常數(shù)據(jù)剔除[4]與動態(tài)傳輸耦合[5]等方式提高智能網(wǎng)聯(lián)汽車信息安全及道路通行效率。同時,在處理智能網(wǎng)聯(lián)汽車異常數(shù)據(jù)與缺失數(shù)據(jù)的問題上,Grover等人[6]提出疊加長短期記憶(LSTM)模型來補全智能網(wǎng)聯(lián)汽車異常通信數(shù)據(jù)。Wu等人[7]提出處理缺失數(shù)據(jù)的鏈方程多元補全(MICE)方法,利用缺失數(shù)據(jù)和觀測數(shù)據(jù)之間的相關(guān)性補全原始數(shù)據(jù)。Cui等人[8]通過在神經(jīng)網(wǎng)絡(luò)中設(shè)計插補單元來處理卸載缺失值并輔助交通預(yù)測。除上述方法外,生成對抗網(wǎng)絡(luò)(GAN)數(shù)據(jù)插補模型[9]、張量補全模型[10]等方法都達到了補全缺失交通數(shù)據(jù)的效果,改善了智能交通系統(tǒng)運行。
在獲得完整交通數(shù)據(jù)集的基礎(chǔ)上,交通狀態(tài)預(yù)測方法對交通流預(yù)測精度的影響也至關(guān)重要。傳統(tǒng)的交通狀態(tài)預(yù)測方法主要是基于交通流的模型以及統(tǒng)計學(xué)模型,如自適應(yīng)回歸綜合移動平均模型[11]、卡爾曼濾波模型[12]及其各種變種模型等[13-15],此類模型通常依賴于固定的假設(shè),不能預(yù)測交通流數(shù)據(jù)的動態(tài)變化。與傳統(tǒng)方法相比,基于變種K最鄰近(K-nearest neighbors,KNN)的時空相關(guān)性預(yù)測[16]、基于張量分解的圖嵌入預(yù)測模型[17]、綜合卷積神經(jīng)網(wǎng)絡(luò)與圖嵌入方法[18-19]等混合交通預(yù)測模型的僅需一定數(shù)量的交通流原始數(shù)據(jù)與智能網(wǎng)聯(lián)汽車數(shù)據(jù),即可自行提取并學(xué)習(xí)其時空特征,從而對交通狀態(tài)進行短時預(yù)測。Wei等人[20]提出了一種根據(jù)相鄰路段信息來預(yù)測道路交通狀態(tài)的預(yù)測模型,該模型首先基于圖嵌入實現(xiàn)路網(wǎng)表示,然后再根據(jù)生成式對抗神經(jīng)網(wǎng)絡(luò)實時產(chǎn)生交通信息預(yù)測交通狀態(tài),取得了較好的預(yù)測精度。Xie等人[21]使用圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)將路段連通性建模為一個圖,將輸入和輸出表示為圖序列,對城市區(qū)域路網(wǎng)道路中的交通流進行預(yù)測。Xu等人[22]根據(jù)城市道路網(wǎng)中SCATS系統(tǒng)下的交通流數(shù)據(jù)時空特性,將交通路網(wǎng)表示為圖,以交叉口為路網(wǎng)節(jié)點,基于圖嵌入網(wǎng)絡(luò)學(xué)習(xí)此系統(tǒng)下路網(wǎng)的時空特征,從而實時預(yù)測區(qū)域路網(wǎng)的整體交通狀態(tài)。
綜上所述,現(xiàn)有理論方法已取得一定研究成果,但仍存在以下問題:一方面,目前對V2X通信獲取的智能網(wǎng)聯(lián)汽車卸載缺失數(shù)據(jù)集的補全問題還有待進一步研究,另一方面,交通狀態(tài)預(yù)測的研究大多采用于歷史交通數(shù)據(jù)或開源數(shù)據(jù)集對交通狀態(tài)進行預(yù)測,存在一定的滯后和冗余,導(dǎo)致預(yù)測結(jié)果實時性差、預(yù)測精度不高。
針對以上問題,通過建立基于智能網(wǎng)聯(lián)汽車V2X數(shù)據(jù)的交通流短時預(yù)測系統(tǒng)獲取智能網(wǎng)聯(lián)汽車任務(wù)卸載數(shù)據(jù)、動態(tài)辨識任務(wù)卸載異常數(shù)據(jù)和感知城市路網(wǎng)的交通狀態(tài)。同時提出考慮智能網(wǎng)聯(lián)汽車數(shù)據(jù)異常的交通狀態(tài)短時預(yù)測方法,應(yīng)用帶有數(shù)據(jù)補全機制的長短期記憶神經(jīng)網(wǎng)絡(luò)模型補全智能網(wǎng)聯(lián)汽車卸載缺失數(shù)據(jù),最終實現(xiàn)對城市交叉口交通流狀態(tài)的短時動態(tài)預(yù)測。
針對城市交叉口場景,交通狀態(tài)通常指交通環(huán)境中交通流各種車輛的運行狀況,具有動態(tài)性、周期性、隨機性等特性[23]。隨著V2X技術(shù)的發(fā)展,智能網(wǎng)聯(lián)汽車V2X數(shù)據(jù)與多源傳感器感知的交通狀態(tài)數(shù)據(jù)可上傳給交通管理系統(tǒng)或智能交通系統(tǒng)的其他子系統(tǒng)[24-26],以此建立較完整的城市路交通狀態(tài)數(shù)據(jù)集。
為提高交通檢測數(shù)據(jù)精度及實時性,設(shè)計了基于智能網(wǎng)聯(lián)汽車V2X數(shù)據(jù)的交通狀態(tài)感知系統(tǒng)。系統(tǒng)主要包括智能路側(cè)傳感器與邊緣計算設(shè)備(mobile edge computing,MEC)、配備車載單元(on board unit,OBU)的智能網(wǎng)聯(lián)汽車,如圖1所示。系統(tǒng)首先對交叉口中所有車輛的狀態(tài)和路側(cè)環(huán)境狀態(tài)的信息進行實時感知,然后發(fā)送信息至部署路側(cè)的智能路側(cè)單元(road side unit,RSU),通過V2X通信發(fā)送數(shù)據(jù)至邊緣計算單元進行多源信息融合。針對復(fù)雜交通網(wǎng)絡(luò)環(huán)境下智能網(wǎng)聯(lián)汽車V2X數(shù)據(jù)卸載過程,系統(tǒng)對缺失數(shù)據(jù)或異常數(shù)據(jù)進行動態(tài)辨識,根據(jù)歷史平均值和觀察值插補智能網(wǎng)聯(lián)汽車任務(wù)卸載的數(shù)據(jù)缺失值,從而得到完整的交通狀態(tài)數(shù)據(jù)集。再基于構(gòu)建的神經(jīng)網(wǎng)絡(luò)預(yù)測下個時間步的交通狀態(tài),最終選擇以交通流量和平均速度容量作為交通狀態(tài)的預(yù)測與評價的特征值,實現(xiàn)對交通流的綜合分析。本系統(tǒng)中各數(shù)據(jù)的類型及來源見表1。
表1 交通狀態(tài)數(shù)據(jù)集的類型及來源Tab.1 Types and sources of traffic perception data sets
圖1 基于智能網(wǎng)聯(lián)汽車V2X數(shù)據(jù)的交通狀態(tài)感知系統(tǒng)總體框架Fig.1 Framework of traffic state perception system based on V2X information for ICVs
根據(jù)建立的基于智能網(wǎng)聯(lián)汽車V2X數(shù)據(jù)的交通狀態(tài)感知系統(tǒng),提出一種帶有數(shù)據(jù)補全機制的圖嵌入長短期記憶神經(jīng)網(wǎng)絡(luò)(graph embedding-long shortterm memory,GE-LSTM)模型用來補全智能網(wǎng)聯(lián)汽車卸載缺失數(shù)據(jù)并短時預(yù)測交叉口的交通狀態(tài)。該模型結(jié)合了復(fù)雜網(wǎng)絡(luò)的特性,通過網(wǎng)絡(luò)表征學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)交通路網(wǎng)數(shù)據(jù)的時空特征,如圖2所示為預(yù)測模型結(jié)構(gòu)。
圖2 交通狀態(tài)預(yù)測模型結(jié)構(gòu)Fig.2 Structure of traffic state prediction model
在數(shù)據(jù)任務(wù)卸載過程中,通信網(wǎng)絡(luò)處在復(fù)雜交通網(wǎng)絡(luò)環(huán)境下極易受到干擾,存在缺失數(shù)據(jù)或者異常數(shù)據(jù)的情況,如圖3所示。首先采用馬爾可夫鏈對智能網(wǎng)聯(lián)汽車任務(wù)卸載過程建模,進一步確定任務(wù)卸載數(shù)據(jù)在通道閾值內(nèi)的概率,通過V2I瑞利衰落信道模型得到任務(wù)卸載數(shù)據(jù)的信息安全概率,再由經(jīng)驗?zāi)B(tài)分解法去除噪聲干擾,最后利用均值法剔除異常數(shù)據(jù)后得到缺失數(shù)據(jù)集,實現(xiàn)智能網(wǎng)聯(lián)汽車任務(wù)卸載異常數(shù)據(jù)的動態(tài)辨識。
采用馬爾可夫鏈對智能網(wǎng)聯(lián)汽車V2I 信道進行建模[27],設(shè)SNRk為時隙k中傳輸信道的SNR 水平。馬爾可夫卸載模型如圖3 所示。假設(shè)V2I 信道的衰落系數(shù)為IV2I,相應(yīng)的衰落方差為σ2,CV2I表示車輛和基礎(chǔ)設(shè)施無線接入點之間的信道容量:
圖3 智能網(wǎng)聯(lián)汽車任務(wù)卸載場景Fig.3 Task offloading scenario for ICVs
同時考慮基于閾值的卸載策略,智能網(wǎng)聯(lián)汽車選擇具有最高信道傳輸增益的最佳信道來進行任務(wù)卸載,可以得到智能網(wǎng)聯(lián)汽車數(shù)據(jù)在信道閾值內(nèi)的概率:
式中:fV2I為智能網(wǎng)聯(lián)汽車當(dāng)前卸載頻率;fmax為信道閾值;mV2I,wV2I分別表示信道的衰落參數(shù)和平均接收功率;Γ(mV2I)為伽瑪函數(shù)。
采用瑞利衰落信道模型進行V2I 通信,其中|IV2I|2是一個隨機變量,遵循參數(shù)σ-2的指數(shù)分布、因此,智能網(wǎng)聯(lián)汽車通過V2I信道在時隙k中卸載αk位數(shù)據(jù)的信息安全概率為
通過經(jīng)驗?zāi)B(tài)分解有效降低卸載過程中產(chǎn)生的噪聲干擾,減少數(shù)據(jù)異常。經(jīng)驗?zāi)B(tài)分解法變化描述如下:
式中:將智能網(wǎng)聯(lián)汽車卸載信號x(t)分解為信號主體分量Ci(t)與剩余分量rn(t)。經(jīng)濾波處理,最后對各處理后的信號主體分量和殘余分量重構(gòu),得到去除噪聲的卸載信號。進一步采用均值法剔除數(shù)據(jù)集中的顯著異常數(shù)據(jù)后得到系統(tǒng)中的RSU覆蓋范圍內(nèi)的智能網(wǎng)聯(lián)汽車的缺失數(shù)據(jù)集合T,表示為T={T1,T2,…,Tn}。
在城市區(qū)域路網(wǎng)圖中,節(jié)點通??梢猿休d一系列交通特征,這些特征通常包括智能網(wǎng)聯(lián)汽車的速度、加速度、經(jīng)緯度位置等信息。根據(jù)第3 節(jié)實驗環(huán)境的設(shè)置,對道路網(wǎng)絡(luò)進行建模,如圖4所示,其中陰影區(qū)域為V2X路側(cè)傳感器所感知的范圍。然后再將其表示為加權(quán)有向圖,描述如下:
圖4 城市交叉口路網(wǎng)圖Fig.4 Graph of urban intersection network
式中:V={v1,v2,...,vn}表示路段網(wǎng)絡(luò)上的節(jié)點的集合,n為節(jié)點的個數(shù);E={eij}表示各個頂點vi和vj之間相互連通的一組邊;x表示基于V2X路側(cè)感知范圍內(nèi)的交通狀態(tài)。
在時間t時,用圖信號Xt∈Rn×c來表示圖G的交通狀態(tài),其中c表示交通狀態(tài)特征的數(shù)量(例如交通流量、交通密度以及交通速度等)。在給定的p個歷史時間步長中,圖G中n個節(jié)點的交通狀態(tài)觀測值表示為X,X=,對于所有節(jié)點的下q個時間步長的交通狀態(tài)預(yù)測值表示為Y,Y=。將交叉口的平均速度容量Mv和實時交通流量Qt作為描述交通狀態(tài)的特征值,其中平均速度容量也可以用來評價交叉口的通行效率情況。對于平均速度容量的定義如下:
時間段k中,交叉口處的平均交通流車速為
則時間k內(nèi)交叉口的平均速度容量表示為
式中:vmax為交叉口處的最大通行車速。
在建立智能網(wǎng)聯(lián)汽車V2X數(shù)據(jù)集與交通傳感器感知數(shù)據(jù)集的基礎(chǔ)上,交通狀態(tài)預(yù)測不僅依賴于交通數(shù)據(jù)集的完整準(zhǔn)確性,同樣也會隨著交叉口的空間特性和時間維度的變化而實時改變,因此對交通數(shù)據(jù)集的補全與道路時空的相關(guān)性分析可以提高預(yù)測的精度。
如圖5 所示為GE-LSTM 模型的算法流程。模型首先基于DeepWalk 從交叉口道路網(wǎng)絡(luò)獲得特征函數(shù)φ(v)來提取交叉口的空間特征。然后,提取多源傳感器融合數(shù)據(jù)集Et與智能網(wǎng)聯(lián)汽車缺失數(shù)據(jù)集T,將數(shù)據(jù)的時間特征與空間特征進行融合,構(gòu)造輸入Xt,并將其輸入至LSTM 中的插補單元補全缺失數(shù)據(jù)并預(yù)測下一個時間步長t的交通狀態(tài),最終輸出的結(jié)果為Yt。
圖5 預(yù)測模型的算法流程圖Fig.5 Algorithm flow chart of prediction model
2.3.1基于圖嵌入提取空間特征
在實際城市交叉口的網(wǎng)絡(luò)空間中,交通流具有一定的方向性,且下游的交通流速度受到上游交通流的影響,因此采用圖嵌入DeepWalk算法來學(xué)習(xí)節(jié)點之間的相互作用以提取空間特征,其原理如圖6所示。
圖6 DeepWalk算法流程Fig.6 Flow chart of DeepWalk algorithm
DeepWalk 在對學(xué)習(xí)網(wǎng)絡(luò)的空間表示時,首先會從中心節(jié)點開始,通過隨機游走(RandomWalk)而生成一系列的隨機游走序列,其次基于Skip-Gram算法對產(chǎn)生的節(jié)點序列進行空間表征學(xué)習(xí),最后將每個節(jié)點序列嵌入到d維向量(d<n)表示中。
其次,在完成對網(wǎng)絡(luò)中的每個節(jié)點的隨機游走后,采用Skip-Gram 算法來更新這些表示,引入映射函數(shù)φ:V→Rd(其中d是嵌入空間的維數(shù),且d≤n)。目的是找出與節(jié)點vi相關(guān)性最大的節(jié)點,對于隨機游走序列W,該優(yōu)化問題可以表示為
式中:P(W|φ())表示在一個隨機游走序列W中,當(dāng)給定一個節(jié)點的時,在長度為l的窗口范圍內(nèi),下一個節(jié)點出現(xiàn)的概率。由于交通流的方向是單向的,因此只考慮右側(cè)窗口內(nèi)的節(jié)點,則優(yōu)化問題表示為
然后,根據(jù)獨立假設(shè)可以對式中的條件概率進行因式分解:
因此,這樣就表示每個節(jié)點vi將映射到其當(dāng)前的特征函數(shù)φ中。通過softmax 函數(shù)來近似概率分布,以減少計算資源的消耗,可得到概率的表示為
2.3.2基于插補單元補全缺失數(shù)據(jù)
如果卸載到路側(cè)端的智能網(wǎng)聯(lián)汽車數(shù)據(jù)包含缺失值,則將使用具有處理缺失值功能的插補單元進行處理,目的是基于歷史平均值和具有可學(xué)習(xí)衰減率的最后觀察值推斷智能網(wǎng)聯(lián)汽車任務(wù)卸載的數(shù)據(jù)缺失值。此外,從插補值補全出的值可進一步提高交通流預(yù)測的精確度。
該插補單元由前向單元輸出狀態(tài)Ct-1和前向輸出值ht-1作為輸入,以推斷后續(xù)觀察值,如圖5 所示。由屏蔽向量mt確定缺失值的位置,缺失的輸入值可以通過插補單元進行插補。
式中:WI和UI是權(quán)重;bI是插補單元中的偏差;σ(x)表示在等式中定義的sigmoid函數(shù)。
然后,輸入向量的每個缺失元素由推斷元素更新:
2.3.3基于神經(jīng)網(wǎng)絡(luò)捕獲時間特征
原始的V2X 多源信息融合數(shù)據(jù)經(jīng)過DeepWalk算法的空間特征提取,得到了一個具有更高階特征的網(wǎng)絡(luò)嵌入,然后再將其作為LSTM 神經(jīng)網(wǎng)絡(luò)模型的輸入,可以實現(xiàn)動態(tài)預(yù)測下一m個時間步長的交通狀態(tài){yt+1,yt+2,...,yt+m}。在路網(wǎng)圖G中,指定的滑動窗口l內(nèi)其交通狀態(tài)表示為Xt={xt-l+1,xt-l+2,...,xt}。令Xt作為LSTM神經(jīng)網(wǎng)絡(luò)模型的輸入,其維度為d。
圖5 右側(cè)的LSTM 單元中,對于三個輸入來說,分別設(shè)有輸入門、遺忘門和輸出門作為約束控制來對這些輸入進行選擇性處理。
在時間t,LSTM單元有3個輸入:當(dāng)前交通狀態(tài)Xt,前一隱藏層輸出值ht-1以及輸出狀態(tài)ct-1;同時包含3 個輸出分別是此時隱藏層輸出值ht以及輸出狀態(tài)ct,產(chǎn)生的預(yù)測結(jié)果為Yt。3 個門的狀態(tài)分別為it、ft、ot,為0到1之間的數(shù)值。其中,在此網(wǎng)絡(luò)單元中,ct和ht會傳遞到下一個網(wǎng)絡(luò),其運算過程如下:
式中:用Wxc、Wxi、Wxf、Wxo分別表示交通狀態(tài)的輸入Xt的權(quán)重矩陣;Whc、Whi、Whf、Who表示隱藏層ht的權(quán)重矩陣;Wci、Wcf、Wco分別表示輸出狀態(tài)ct的權(quán)重矩陣;bi、bc、bf、bo表示偏置向量;其中激活函數(shù)tanh可將變量一一映射在[0,1]的范圍中。σ(x)表示在等式中定義的sigmoid 函數(shù),如式(19);tanh(x)表示等式中定義的雙曲正切函數(shù),如式(20)。
通過上述LSTM 計算,得到ct和ht,此時網(wǎng)絡(luò)預(yù)測輸出可計算為
式中:Wy表示交通預(yù)測值隱藏層ht的權(quán)重矩陣;by表示預(yù)測值的偏置向量。
為了驗證提出的交通狀態(tài)預(yù)測模型,針對典型的城市交叉口場景,搭建了智能路側(cè)設(shè)備與智能網(wǎng)聯(lián)汽車聯(lián)合實驗平臺。實驗以智能網(wǎng)聯(lián)汽車V2X數(shù)據(jù)與多源交通傳感器融合數(shù)據(jù)作為模型輸入,對數(shù)據(jù)補全與預(yù)測模型進行驗證。
實驗選取了北京市石景山區(qū)阜石路一處典型交叉口作為實驗路段。該交叉口為由東向西的單向行駛4車道,其中最右側(cè)車道為專用的右轉(zhuǎn)車道。如圖7所示,實驗自主搭建了智能路側(cè)設(shè)備與智能網(wǎng)聯(lián)汽車聯(lián)合實驗平臺,用于智能網(wǎng)聯(lián)汽車V2X 任務(wù)卸載數(shù)據(jù)與交通狀態(tài)數(shù)據(jù)的采集及實時處理,平臺主要包括智能路側(cè)設(shè)備RSU、智能網(wǎng)聯(lián)汽車及通信設(shè)備。配備有車載單元OBU的智能網(wǎng)聯(lián)汽車通過V2I通信將車輛數(shù)據(jù)與任務(wù)數(shù)據(jù)卸載至智能路側(cè)設(shè)備,智能路側(cè)設(shè)備搭載的邊緣計算平臺對智能網(wǎng)聯(lián)汽車的任務(wù)卸載數(shù)據(jù)、道路的實時交通狀態(tài)與路側(cè)多源傳感器的數(shù)據(jù)融合處理,最終生成實際交叉口場景下帶有缺失數(shù)據(jù)的交通狀態(tài)數(shù)據(jù)集。實驗平臺參數(shù)如表2所示。
圖7 智能路側(cè)設(shè)備與智能網(wǎng)聯(lián)汽車聯(lián)合實驗平臺Fig.7 Experimental platform of intelligent roadside devices and ICVs
表2 實驗平臺參數(shù)Tab.2 Parameters of experimental platform
實驗數(shù)據(jù)采集的過程為30min,獲取到整個交叉口智能網(wǎng)聯(lián)汽車以及其他交通狀態(tài)的實時數(shù)據(jù),共約60 000 條,數(shù)據(jù)集包含的具體內(nèi)容如表3、表4 所示。數(shù)據(jù)集包含的多源交通傳感器能獲得的車流量等信息,再結(jié)合V2I任務(wù)卸載數(shù)據(jù)可大幅提高對整個路段或交叉口的交通狀態(tài)的實時感知能力,提高短時預(yù)測精度。由于V2X 通信環(huán)境中網(wǎng)絡(luò)狀態(tài)復(fù)雜,極易因干擾或攻擊導(dǎo)致任務(wù)卸載過程出現(xiàn)數(shù)據(jù)丟包或異常的情況。因此,智能網(wǎng)聯(lián)汽車任務(wù)卸載數(shù)據(jù)集中包含一定數(shù)量的異常與缺失數(shù)據(jù)。
表3 智能網(wǎng)聯(lián)汽車任務(wù)卸載數(shù)據(jù)集Tab.3 Task offloading data sets for ICVs
表4 交通狀態(tài)數(shù)據(jù)集Tab.4 Data sets of traffic state
實驗使用了兩種常用的預(yù)測評價指標(biāo)均方根誤差(RMSE)和平均絕對誤差(MAE)分析所提出的模型和對比模型的性能[28]。RMSE 和MAE 能反映真實觀測值和預(yù)測值之間差異,其取值在[0,+∞]之間。評價結(jié)果與預(yù)測效果呈負相關(guān),當(dāng)數(shù)值越大,說明模型的預(yù)測效果越遠離真實情況,反之則說明越接近真實情況。
式中:yt為真實觀測值為預(yù)測值。
實驗根據(jù)時間序列把實驗數(shù)據(jù)集分成了兩組:第一組將70%作為訓(xùn)練組(train data),用于模型的訓(xùn)練;第二組將30%作為測試組(test data),用于模型的測試。此外,手動調(diào)整和設(shè)置模型的最優(yōu)參數(shù),結(jié)果如表5所示。
表5 模型參數(shù)設(shè)置Tab.5 Model parameters
從實驗采集的數(shù)據(jù)集中選取10min 包含智能網(wǎng)聯(lián)汽車任務(wù)卸載異常值與缺失值的車速數(shù)據(jù)進行異常數(shù)據(jù)動態(tài)辨識與補全效果實驗。如圖8a 所示,數(shù)據(jù)集中存在顯著異常值,并在相應(yīng)時段內(nèi)存在一定缺失數(shù)據(jù)。圖8b 為經(jīng)動態(tài)辨識與數(shù)據(jù)補全后的效果,異常值被有效剔除且相應(yīng)時段的車速數(shù)據(jù)得到補全。圖8c為去除異常值與補全數(shù)據(jù)前后的對比結(jié)果,證明智能網(wǎng)聯(lián)汽車動態(tài)辨識與數(shù)據(jù)補全效果良好。
圖8 異常數(shù)據(jù)動態(tài)辨識與數(shù)據(jù)補全結(jié)果Fig.8 Results of abnormal data dynamic identification and data imputation
實驗基于路側(cè)感知平臺采集的實時交通狀態(tài)數(shù)據(jù),通過GE-LSTM預(yù)測模型對城市交叉口的交通流量以及平均速度容量分別進行不同時段的短時預(yù)測,主要包含10min、15min 和30min 的交通預(yù)測,其中各預(yù)測對象的誤差值如表6所示,具體的分析結(jié)果如下。
將10min、15min、30min 時長的實驗數(shù)據(jù)按7:3比例劃分為420s、720s、1 530s 時長的訓(xùn)練集數(shù)據(jù)與180s、270s、540s 時長的測試集數(shù)據(jù)。其中圖9a、9b、9c分別為3個時段交通流量測試集的真實值、數(shù)據(jù)補全后預(yù)測值與數(shù)據(jù)異常時預(yù)測值的對比結(jié)果,并得到數(shù)據(jù)補全后預(yù)測值與真實觀測值之間的誤差。
由圖9可知,模型的預(yù)測結(jié)果能夠準(zhǔn)確的反映并預(yù)測出交通流量隨交叉口信號燈進行周期性變化的趨勢。同時,預(yù)測結(jié)果表明當(dāng)智能網(wǎng)聯(lián)汽車任務(wù)卸載數(shù)據(jù)存在缺失異常時,預(yù)測值曲線出現(xiàn)明顯誤差。依據(jù)表6 可知,在交通流量的10min、15min 和30min預(yù)測中,其數(shù)據(jù)補全后預(yù)測誤差RMSE和MAE值穩(wěn)定在1和0.8上下,且浮動不超過0.1,證明數(shù)據(jù)補全后預(yù)測效果良好[29]。
圖9 不同時段下交通流量預(yù)測結(jié)果Fig.9 Prediction results of average traffic flow in different time
表6 預(yù)測模型的誤差值Tab.6 Error values of predicted model
如圖10所示,圖10a、10b、10c分別為預(yù)測3個時段平均速度容量測試集的真實值、數(shù)據(jù)補全后預(yù)測值與數(shù)據(jù)異常時預(yù)測值的對比結(jié)果,并得到數(shù)據(jù)補全后預(yù)測值與真實觀測值之間的誤差。
平均速度容量(Mv)通常被用來評價和分析道路交通狀態(tài)的表現(xiàn)情況,Mv越大,則說明當(dāng)前交叉口的表現(xiàn)良好,反之則說明當(dāng)前交叉口的交通狀態(tài)表現(xiàn)越差,發(fā)生交通事故的概率會大幅增加。實驗根據(jù)通過交叉口的最大行程時間[30]將Mv的閾值設(shè)置為0.6,即Mv大于0.6則說明交通狀態(tài)表現(xiàn)良好。如圖10 所示,在平均速度容量未來時間步長平均速度容量超過閾值0.6所對應(yīng)的時間點,由此可實時感知并判斷交叉口的交通運行狀況,也為交通管理者對交叉口進行交通實時誘導(dǎo)及疏解交叉口排隊壓力提供了數(shù)據(jù)支持。
圖10 不同時段下平均速度容量預(yù)測結(jié)果Fig.10 Prediction results of mean speed capacity in different time
為了直觀體現(xiàn)所提預(yù)測模型(GE-LSTM)的準(zhǔn)確性,在實驗結(jié)果中引入其他神經(jīng)網(wǎng)絡(luò)預(yù)測模型進行對比[20-22],主要包括SVM、LSTM、KNN、CNN 和RNN模型,參數(shù)設(shè)置方面,上述模型與所提預(yù)測模型具有相同的隱藏單元的數(shù)量、訓(xùn)練批次大小、訓(xùn)練周期以及學(xué)習(xí)率,如表5所示。
在對比實驗中,將上述模型分別對交通流量和平均速度容量進行分時段預(yù)測,最終各模型對比結(jié)果如圖11、12所示。
圖11 交通流量的對比結(jié)果Fig.11 Comparison results of average traffic flow
圖12 平均速度容量的對比結(jié)果Fig.12 Comparison results of mean speed capacity
在10min、15min和30min的3個時段的交通流量和平均速度容量預(yù)測中,各模型預(yù)測誤差RMSE 和MAE值隨預(yù)測時間的增大而減小。相比其他5類模型,GE-LSTM 模型RMSE 和MAE 值最小,其中交通流量的預(yù)測誤差RMSE 和MAE 值分別減少了74.6%、71.7%,平均速度容量分別減少了86.5%、87.4%。此外,根據(jù)GE-LSTM 與LSTM 模型對比可知,GE-LSTM 模型的預(yù)測誤差值最小,證明在交通狀態(tài)預(yù)測的過程中,通過引入圖嵌入(GE)模型學(xué)習(xí)道路交通網(wǎng)絡(luò)中的空間特征,對于基于LSTM 進行時間上的動態(tài)預(yù)測有促進作用,進一步證明了GELSTM模型預(yù)測的準(zhǔn)確性。
(1)將智能網(wǎng)聯(lián)汽車V2X 數(shù)據(jù)與路側(cè)交通傳感器實時感知數(shù)據(jù)引入城市道路交通流狀態(tài)短時預(yù)測方法。通過動態(tài)辨識智能網(wǎng)聯(lián)汽車異常缺失數(shù)據(jù)與分析交通狀態(tài)數(shù)據(jù)的時空特征,在傳統(tǒng)長短期記憶神經(jīng)網(wǎng)絡(luò)上加入插補單元,實現(xiàn)交通狀態(tài)的實時感知、補全與預(yù)測,并通過實驗對比給出數(shù)據(jù)補全后的預(yù)測效果。
(2)通過對智能網(wǎng)聯(lián)汽車數(shù)據(jù)異常缺失時與補全后的交通流預(yù)測結(jié)果對比分析,顯示所提補全與預(yù)測方法的有效性,并引入其他神經(jīng)網(wǎng)絡(luò)預(yù)測模型作對比實驗,實驗結(jié)果表明所提模型的預(yù)測誤差值最小,證明了模型預(yù)測的準(zhǔn)確性。
(3)所提方法與實驗平臺能夠達到有效解決智能網(wǎng)聯(lián)汽車任務(wù)卸載信息安全問題的目的,后續(xù)將所研究的交叉口場景擴展至城市區(qū)域路網(wǎng)內(nèi)的交通流狀態(tài)預(yù)測,為智能網(wǎng)聯(lián)汽車信息安全與交通資源合理調(diào)度提供理論支持和技術(shù)方案。
作者貢獻聲明:
王龐偉:提出論文選題,設(shè)計論文架構(gòu),指導(dǎo)實驗開展,論文審閱與修改;
王天任:理論方法實現(xiàn)及實驗方案實施,數(shù)據(jù)整理與處理,論文撰寫與修改;
李振華:技術(shù)指導(dǎo)與論文修改;
劉虓:文獻整理,實驗結(jié)果驗證,論文撰寫與繪圖;
孫玉蘭:技術(shù)指導(dǎo)與論文修改。