徐先峰, 宋亞囡, 黃劉洋, 夏振, 潘卓毅
(長(zhǎng)安大學(xué) 電子與控制工程學(xué)院,陜西 西安 710064)
經(jīng)濟(jì)社會(huì)發(fā)展,交通運(yùn)輸先行。隨著我國(guó)居民汽車(chē)保有量的不斷增加,給道路交通系統(tǒng)帶來(lái)的壓力也越來(lái)越大,交通事故和能源短缺等問(wèn)題日益嚴(yán)重,對(duì)居民的出行造成了許多不便[1]。
早期的交通流預(yù)測(cè)研究主要都是基于參數(shù)化模型展開(kāi)的。在具有噪聲和干擾的環(huán)境中,參數(shù)化模型的預(yù)測(cè)結(jié)果往往不盡人意。因此人們逐漸將重心從參數(shù)化模型轉(zhuǎn)移到非參數(shù)化模型的研究上[2-4]。但單一的預(yù)測(cè)模型預(yù)測(cè)精度很難達(dá)到要求,組合預(yù)測(cè)模型的思路是將多種預(yù)測(cè)模型進(jìn)行融合,提高預(yù)測(cè)精度。Chen等人構(gòu)建多個(gè)非線(xiàn)性L(fǎng)SSVR基本模型進(jìn)行預(yù)測(cè)[5]。Cai等人提出了一種使用GSA搜索最佳SVR參數(shù)的混合交通流量預(yù)測(cè)模型[6]。Zhang等人研究應(yīng)用門(mén)控遞歸神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)考慮天氣條件下的城市交通流量[7]。
本文在充分利用交通流時(shí)空信息的基礎(chǔ)上,利用KNN算法完成待測(cè)觀測(cè)點(diǎn)的上下游觀測(cè)點(diǎn)空間相關(guān)性的遴選,在完成二維輸入數(shù)據(jù)矩陣的構(gòu)造后,研究了基于卷積神經(jīng)網(wǎng)絡(luò)的交通流空間特征的提?。唤Y(jié)合Bi-LSTM對(duì)時(shí)間特征的提取,完成了KNN-CNN-BiLSTM預(yù)測(cè)模型的搭建;分析了用于交通流空間特征優(yōu)化的最佳K值以及預(yù)測(cè)模型的超參數(shù)設(shè)置。與其他的主流預(yù)測(cè)模型進(jìn)行性能對(duì)比可以得出,本文提出的KNN-CNN-BiLSTM模型預(yù)測(cè)精度高,是一種精準(zhǔn)有效的交通流預(yù)測(cè)模型。
組合預(yù)測(cè)模型的輸入是從觀測(cè)點(diǎn)實(shí)測(cè)并經(jīng)過(guò)預(yù)處理和KNN算法遴選后的交通流量數(shù)據(jù),輸入為二維矩陣的數(shù)據(jù)形式。預(yù)測(cè)模型的前半部分是卷積神經(jīng)網(wǎng)絡(luò)層,用于交通流數(shù)據(jù)的空間特征提取,預(yù)測(cè)模型的后半部分是雙向LSTM網(wǎng)絡(luò),用于提取交通流數(shù)據(jù)的時(shí)間特征,模型使用全連接層來(lái)輸出最后的預(yù)測(cè)交通流量值。KNN-CNN-BiLSTM組合預(yù)測(cè)模型的體系結(jié)構(gòu)如圖1所示。
圖1 KNN-CNN-BiLSTM組合預(yù)測(cè)模型示意圖
通常在KNN算法中使用較多距離,包括曼哈頓距離、歐式距離和最大距離等。在這三種距離計(jì)算方法中,歐氏距離通過(guò)計(jì)算兩組序列的差值平方和來(lái)衡量數(shù)據(jù)之間的距離,考慮了各個(gè)時(shí)間段之間序列的相似程度。本文選用歐氏距離用于計(jì)算序列之間的距離,運(yùn)用KNN 算法對(duì)相關(guān)監(jiān)測(cè)站點(diǎn)的交通流進(jìn)行篩選,達(dá)到優(yōu)化數(shù)據(jù)集的作用。
在交通流預(yù)測(cè)問(wèn)題中,CNN常常用于預(yù)測(cè)模型的底端部分,對(duì)歷史數(shù)據(jù)的空間特征進(jìn)行捕捉并以特征向量的形式傳送給時(shí)間序列預(yù)測(cè)部分。雙向LSTM模型可以同時(shí)考慮兩個(gè)方向的歷史數(shù)據(jù),可以更好地利用時(shí)間序列數(shù)據(jù)中包含的所有信息。雙向LSTM的結(jié)構(gòu)如圖2所示。
圖2 雙向LSTM結(jié)構(gòu)示意圖
本文的交通流試驗(yàn)樣本數(shù)據(jù)來(lái)自美國(guó)交通研究數(shù)據(jù)實(shí)驗(yàn)室(TRDL),其編號(hào)包括了I35E、 I394和TH62等高速公路,由美國(guó)交管部門(mén)在各個(gè)高速公路上布置的檢測(cè)器來(lái)獲取全年的交通流量。本文以2016年2月1日至2016年5月31日共四個(gè)月的交通流量數(shù)據(jù)作為試驗(yàn)樣本,采用間隔為15 min的交通流量作為樣本數(shù)據(jù)。
本文采用KNN算法對(duì)預(yù)測(cè)節(jié)點(diǎn)與上下游的觀測(cè)點(diǎn)進(jìn)行重要程度的排序,實(shí)現(xiàn)有效觀測(cè)點(diǎn)信息的提煉析取和對(duì)無(wú)效信息的過(guò)濾清洗。通過(guò)模型提取時(shí)空特征來(lái)預(yù)測(cè)出下一個(gè)時(shí)間點(diǎn)的交通流,從而實(shí)現(xiàn)短時(shí)交通流預(yù)測(cè)。
由表1可知,當(dāng)K值取6時(shí),模型可以獲得最佳的預(yù)測(cè)性能。此時(shí),選取的空間相關(guān)性最大的監(jiān)測(cè)節(jié)點(diǎn)編號(hào)分別為S896、S898、S894、S895、S893和S899,均位于待測(cè)節(jié)點(diǎn)的上下游路段。
表1 不同組合情況下遴選的觀測(cè)點(diǎn)編號(hào)
圖3、圖4分別展示了不同預(yù)測(cè)模型的周內(nèi)、周末預(yù)測(cè)效果,其中SVR模型的預(yù)測(cè)效果最差,而本文利用時(shí)空信息的KNN-CNN-BiLSTM模型預(yù)測(cè)效果最佳。
圖3 不同模型周內(nèi)預(yù)測(cè)
圖4 不同模型周末預(yù)測(cè)
將本文提出的KNN-CNN-BiLSTM模型與目前主流的預(yù)測(cè)模型對(duì)比分析可以得出,本文提出的KNN-CNN-BiLSTM模型相比于目前主流的交通流預(yù)測(cè)模型,其預(yù)測(cè)精度提升明顯,對(duì)比結(jié)果如表2所示。
表2 各種算法預(yù)測(cè)性能對(duì)比表
最后,本文將經(jīng)過(guò)KNN篩選后的數(shù)據(jù)集和未經(jīng)過(guò)篩選的數(shù)據(jù)集分別送入預(yù)測(cè)模型的輸入。由表3可知,經(jīng)過(guò)KNN算法篩選后的數(shù)據(jù)集可以更好地利用待測(cè)節(jié)點(diǎn)上下游節(jié)點(diǎn)的時(shí)空相關(guān)性,經(jīng)過(guò)優(yōu)化后的輸入數(shù)據(jù)集可以改善模型的預(yù)測(cè)精度,大幅縮短預(yù)測(cè)模型的運(yùn)行時(shí)間。預(yù)測(cè)的具體結(jié)果如表3所示。
表3 KNN篩選對(duì)試驗(yàn)結(jié)果的影響
本文提出了利用交通流時(shí)空信息的KNN-CNN-BiLSTM交通流量預(yù)測(cè)模型,并結(jié)合美國(guó)交通實(shí)驗(yàn)室的實(shí)測(cè)交通流數(shù)據(jù)完成了模型搭建和精細(xì)調(diào)參。結(jié)果表明:KNN算法可以有效地對(duì)上下游觀測(cè)點(diǎn)進(jìn)行遴選,經(jīng)過(guò)遴選優(yōu)化后的數(shù)據(jù)集可以改善模型的預(yù)測(cè)精度;在考慮交通流時(shí)空信息的情況下,將交通流的時(shí)空二維數(shù)據(jù)一起作為預(yù)測(cè)模型的輸入,根據(jù)交通流的空間相關(guān)性改變輸入數(shù)據(jù)的形式,提高了預(yù)測(cè)結(jié)果的準(zhǔn)確性。因此,本文提出的基于KNN-CNN-BiLSTM的交通流預(yù)測(cè)模型是一種精準(zhǔn)有效的模型,具有實(shí)際推廣應(yīng)用價(jià)值。