曹 潔 沈鈞珥 張 紅 侯 亮 陳作漢
1(蘭州理工大學計算機與通信學院 甘肅 蘭州 730050)2(甘肅省制造業(yè)信息化工程研究中心 甘肅 蘭州 730050)
隨著城市化進程飛速發(fā)展,交通擁堵已成為阻礙城市發(fā)展的瓶頸,且困擾著市民的出行。有效、合理的短時交通流預測可以為交通管理者和交通參與者提供實時、準確的交通信息,為交通管理和出行選擇提供依據(jù)。短時交通流預測是交通流預測的一個重要組成部分,是城市交通智能化的重要依據(jù)。近年來,國內(nèi)外眾多學者對提高交通流的預測精度展開了深入研究。文獻[1]中通過思維進化算法中的“群體尋優(yōu)”取代“個體尋優(yōu)”對BP神經(jīng)網(wǎng)絡(luò)中的權(quán)值和閾值進行優(yōu)化,對交通流預測精度提高。文獻[2]中運用傳統(tǒng)的小波固定閾值降噪法對交通流進行降噪處理,再用小波神經(jīng)網(wǎng)絡(luò)進行預測,獲得較好的預測效果。文獻[4]中通過選取一個小波基函數(shù)替換BP神經(jīng)網(wǎng)絡(luò)中隱含層結(jié)點的傳遞函數(shù)來提高預測精度。文獻[5]中運用BP神經(jīng)網(wǎng)絡(luò)對高速公路進行預測研究。以上研究表明,BP神經(jīng)網(wǎng)絡(luò)在識別復雜非線性交通流問題中有著巨大的優(yōu)越性,但也存在穩(wěn)定性差、精度容易受到訓練數(shù)據(jù)中噪聲影響的缺點。
基于上述分析,本文提出了一種基于小波和多維重構(gòu)的BP神經(jīng)網(wǎng)絡(luò)預測方法。首先選取啟發(fā)式小波閾值降噪法對交通流數(shù)據(jù)進行分析、處理,提高交通流數(shù)據(jù)質(zhì)量;其次采用C-C方法對交通流數(shù)據(jù)進行相空間重構(gòu),獲取多維交通流信息;最后構(gòu)建多維度BP神經(jīng)網(wǎng)絡(luò)模型對短時交通流進行研究分析。
由于交通流數(shù)據(jù)在采集的過程中容易受到各種噪聲的影響,導致后期進行預測預測精度較低。小波閾值降噪法能夠有效去除數(shù)據(jù)中的噪聲,保留原始特征,且計算簡單高效。因此,選用小波閾值降噪法對采集到的交通流數(shù)據(jù)進行降噪處理。小波閾值降噪是一種建立在小波變換多分辨分析基礎(chǔ)上的算法,根據(jù)噪聲與信號在不同頻帶上的小波分解系數(shù)具有不同強度分布的特點,去除各頻帶上的噪聲信號所對應(yīng)的小波系數(shù),進而保留原交通流信號中的小波分解系數(shù),然后對降噪后的系數(shù)進行小波重構(gòu),獲取純凈信號。為了能更好的反映出交通流數(shù)據(jù)特性,本文采用啟發(fā)式小波閾值降噪法,將有用信號和噪聲信號分離,進而提高交通流數(shù)據(jù)質(zhì)量。
對于含有噪聲的一維信號可表示為:
f(t)=s(t)+δe(t)t=1,2,…,n-1
(1)
式中:f(t)為噪聲信號,s(t)為實際數(shù)據(jù)信號,e(t)為噪聲,δ為噪聲相關(guān)系數(shù),n為信號長度。
具體小波分析運用中,通常近似顯示為低頻信號或為相對平穩(wěn)的信號;細節(jié)則表現(xiàn)為高頻信號,噪聲分量一般集中于高頻信號中。小波降噪的基本過程為:先對含有噪聲信號小波變換的分解,選擇分解層數(shù)為4層進行闡述,經(jīng)分解后的信號其噪聲部分分量通常在cD1、cD2、cD3、cD4中,cD及cA分別為信號經(jīng)小波變換分解后的細節(jié)系數(shù)和近似系數(shù),接著對細節(jié)系數(shù)cD分量采取適當?shù)拈撝祵嵭薪翟?,最后通過將降噪后的近似系數(shù)cA以及各層細節(jié)系數(shù)cD進行重構(gòu),從而得到降噪后的信號。
小波降噪閾值的選取是提高小波降噪能力的關(guān)鍵,目前常見的小波閾值選擇方法有:固定閾值估計(Sqtwolog)、極值閾值估計(Minimaxi)、無偏似然估計(Rigrsure)以及啟發(fā)式估計(Hesusure)等。極值閾值估計和無偏似然估計方法只能對低頻段的噪聲信號有著較好的降噪效果,且極值閾值估計降噪時間較長。而啟發(fā)式閾值估計是將固定閾值估計和無偏似然估計相結(jié)合起來,能夠獲取最佳的預測效果,其步驟為:
Step1一維信號的小波分解。選擇合適小波基函數(shù),對一維信號f(t)進行N層分解。
Step2高頻系數(shù)cD的閾值量化。設(shè)定閾值標準,對分解后得到的cD進行量化處理,閾值量化的效果直接影響降噪的效果。固定閾值為:
(2)
無偏風險閾值方法主要是由Stein無偏似然估計原理所估計出的最小風險量所對應(yīng)的小波系數(shù)確定自適應(yīng)閾值。其原理為:
通過將信號f(t)中各個元素取絕對值后平方,再由小到大排列,進而得到以下新的信號序列,即:
f(k)=(sort(|f|))2k=0,1,…,N-1
(3)
取閾值f(k)的第k個元素的平方根,即:
(4)
則該閾值產(chǎn)生的風險:
(5)
根據(jù)R(k),尋找最小風險點所對應(yīng)的kmin值,其Rigrsure的閾值則定義為:
(6)
假設(shè)信號f(t)長度為N,通過無偏似然估計和固定閾值方法分別得到的閾值,令:
(7)
(8)
若eta Step3一維信號的恢復。將啟發(fā)式閾值量化后的高頻系數(shù)cD與小波分解的第N層低頻系數(shù)cA進行重構(gòu),獲取降噪后的信號。 交通流作為典型的混沌時間序列,具有較強的非線性。本文運用C-C法對所用交通數(shù)據(jù)進行重構(gòu),映射出交通數(shù)據(jù)中的多維信息。為了體現(xiàn)交通流是否具有短期預測性,本文在相空間重構(gòu)的基礎(chǔ)上,選用小數(shù)據(jù)量法計算得到交通流的最大李雅普諾夫(Lyapunov)指數(shù),進一步對具有混沌特性的短時交通流進行特定分析。 運用檢測器、攝像頭等所采集的實時交通流數(shù)據(jù)呈現(xiàn)一維時間序列,無法準確地反映出交通流復雜特性。因此,將一維交通流時間序列擴展為多維交通流時間序列顯得極為重要。對一維交通流時間序列x(t1),x(t2),…,x(tn)進行相空間重構(gòu),得到多維時間序列: x(ti) = [x(ti),x(ti + τ),…,x(ti + (m-1)τ)] (9) 式中:時間延遲為τ,嵌入維數(shù)為m,以及相點數(shù)為x(ti),i=1,2,…n-(m-1)τ。 由式(9)可得,時間延遲τ以及嵌入維數(shù)m的確定是相空間重構(gòu)的關(guān)鍵。經(jīng)研究表明,時間延遲τ、嵌入維數(shù)m以及相空間重構(gòu)中的時間窗寬τw這三者之間存在一定的聯(lián)系,Kugiumtzis曾提出延遲時間τ嵌入維數(shù)m以及時間窗寬τw它們都不是獨立地存在,三者存在一定的相互關(guān)系tw=(m-1)τ[8]。本文運用C-C法來實現(xiàn)多維交通流時間序列的提取,其具體步驟如下: Step1獲取一維時間序列數(shù)據(jù),計算時間序列的標準差δ,將交通流數(shù)據(jù)重新分解為t個不相交的時間序列,確定N。 Step2當N→∞時,計算s(m,r,t)和ΔS(m,t),其中時間變量t?[1,200] : (10) m=[2,5] ΔS(m,t)=max{S(m,r,t)}-min{S(m,r,t)} (11) Step3計算下列三式: (12) (13) (14) Lyapunov指數(shù)是檢驗系統(tǒng)是否存在混濁現(xiàn)象的重要特征量,文獻[9]等研究表明,最大Lyapunov指數(shù)可用來描述系統(tǒng)運動對初始條件的敏感性。若獲取的最大Lyapunov指數(shù)大于零時,則表明該交通流時間序列具有混沌特性,可以進行短時交通流預測。 通常計算最大Lyapunov指數(shù)有很多的方法,如:Wolf法、Jacobian法、P-范數(shù)法以及小數(shù)據(jù)量法等。小數(shù)據(jù)量方法計算量小、計算精度高、相對容易操作,在識別混沌特性方面具有一定的優(yōu)越性。其具體步驟: Step1對時間序列{x(ti),i=1,2,…,N}進行FFT變化,獲取時間序列平均周期。 Step2運用C-C法獲取時間延遲τ和時間窗寬τw,計算得到嵌入維數(shù)m,并進行相空間重構(gòu){Yj,j=1,2,…,M}。 Step3尋求相空間中每個點Yj所對應(yīng)的最近鄰近點Yj′并進行相分離,即: (15) Step4計算相空間中最近鄰近點Yj′所對應(yīng)的i個離散時間步間的距離dj(i): dj(i)=|Yj+i-Yj′+i| (16) 式中:i=1,2,…,min(M-j,M-j′)。每個i求出所有j的Indj(i)的平均y(i),即: (17) 式中:q表示dj(i)不為零的個數(shù),運用最小二乘法做出回歸直線的斜率就是最大Lyapunov指數(shù)。 BP神經(jīng)網(wǎng)絡(luò)是由信號向前傳遞、誤差反向傳播的一種雙向傳遞的多層前饋神經(jīng)網(wǎng)絡(luò)。它具有強大的適應(yīng)能力,能夠自行的挖掘出數(shù)據(jù)中的潛在規(guī)律,其主要由輸入層,隱含層以及輸出層構(gòu)成,基本結(jié)構(gòu)圖如圖1所示。 圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖 信號前向傳播和誤差反向傳播是BP神經(jīng)網(wǎng)絡(luò)最基本的兩個部分。具體如下: Step1前向傳播:獲取BP神經(jīng)網(wǎng)絡(luò)隱含層輸入xj的所有輸入個數(shù)的加權(quán)和,即: (18) Step2誤差反向傳播:反饋誤差按梯度下降學習方式對各層權(quán)值及閾值進行修正,使網(wǎng)絡(luò)預測輸出不斷逼近期望輸出。 (19) BP網(wǎng)絡(luò)誤差性能指標函數(shù)為: (20) 輸出層與隱含層之間的權(quán)值為: (21) 式中:η為學習率,η?[0,1]。 更新輸出層與隱含層間的權(quán)值: (22) 輸入層與隱含層間的權(quán)值wij的學習算法: (23) 更新輸入層與隱含層間的權(quán)值: (24) BP神經(jīng)網(wǎng)絡(luò)主要是通過不斷的迭代進行參數(shù)擇優(yōu),一次完成的訓練包括信號的前向傳播以及誤差反向傳播。通過參數(shù)調(diào)整達到最優(yōu)的訓練網(wǎng)絡(luò),輸入測試數(shù)據(jù),獲得相應(yīng)的結(jié)果。 本文研究所用數(shù)據(jù)源于明尼蘇達大學交通實驗室平臺所公布的交通流數(shù)據(jù)。通過100個檢測器獲取2016年1月1日-2016年1月5日的數(shù)據(jù),如圖2所示,數(shù)據(jù)采樣周期以3分鐘為準,每天獲取480個數(shù)據(jù),5天總獲取2 400個數(shù)據(jù)。為了能使預測誤差減小,采用函數(shù)mapminmax將預測數(shù)據(jù)處于[0,1]之間。 圖2 原始交通流量 為了能更好地消除交通流數(shù)據(jù)中產(chǎn)生的高斯白噪聲,選用啟發(fā)式閾值進行降噪處理。通過實驗發(fā)現(xiàn)5層小波分解使得數(shù)據(jù)過于平滑,不能反映出交通數(shù)據(jù)中所隱藏的信息。因此,為了能更好地反映交通流數(shù)據(jù)的原有特征,則使用小波工具箱中的sym8小波函數(shù)進行4層分解、降噪、重構(gòu)。降噪效果如圖3所示。通過對比可得降噪后的數(shù)據(jù)顯得更加平滑。 圖3 小波降噪交通流量 實驗獲取交通流時間序列的長度為2 400,計算交通流量時間序列的標準差:取2≤m≤5,0.5σ≤r≤2σ,1≤t≤200。通過C-C法得到3個統(tǒng)計量分別為s(t)、delt_s(t)、s_cor(t),其中s(t)為所有子序列的統(tǒng)計量S(m,N,r,t)的均值。時間延遲τ由delt_s(t)的第一個局域極小值點所對應(yīng)的時間所決定;τw是通過s_cor(t)的全局最小值所對應(yīng)的時間來確定。通過圖4所示,當t=34時,delt_s(t)取得第一個局域極小值,因此可以得到τ=34。從s_cor(t)曲線中可得,當t=128時取得全局最小值,則τw=128。通過公式τw=(m-1)×τ可得m=4.764 7,本文進行相空間重構(gòu)時取整數(shù)m=5,通過公式M=N-(m-1)×τ可以得出相空間點為2 264。運用小數(shù)據(jù)量方法獲得的最大Lyapunov指數(shù)λ=0.016 83,反映出重構(gòu)后的交通流時間序列具有混沌特性,因此交通流具有較好的短時預測性。 圖4 多維交通數(shù)據(jù)參數(shù)關(guān)系圖 通過檢測器獲得2 400組數(shù)據(jù),根據(jù)C-C方法估算得到嵌入維數(shù)和延遲時間。經(jīng)相空間重構(gòu)后,任意選取相空間點中75%相點進行BP神經(jīng)網(wǎng)絡(luò)模型訓練,25%相點作為BP神經(jīng)網(wǎng)絡(luò)預測。 圖5顯示未經(jīng)啟發(fā)式小波降噪的BP神經(jīng)網(wǎng)絡(luò)預測結(jié)果;圖6顯示 Elman神經(jīng)網(wǎng)絡(luò)預測結(jié)果;圖7顯示小波降噪+多維BP神經(jīng)網(wǎng)絡(luò)預測。通過對比顯示,本文的預測方法結(jié)果能更好的反映出交通流變換特性。 圖5 BP神經(jīng)網(wǎng)絡(luò)預測結(jié)果 圖6 Elman神經(jīng)網(wǎng)絡(luò)預測結(jié)果 圖7 小波降噪+多維BP神經(jīng)網(wǎng)絡(luò)預測 為了能更好地顯現(xiàn)出短時交通流模型的優(yōu)越性,本文選用平均相對誤差、均方誤差以及平均絕對誤差等進行預測評估。 平均相對誤差: (25) 均方誤差: (26) 平均絕對誤差: (27) 式中:Yyeat(t)表示在t時刻的交通流量的實測值;Ypred(t)表示預測值,N為樣本個數(shù)。 MAPE的值反映預測值與實際值的偏離程度,MAPE越小,則顯示預測值與實際值偏離程度小且預測效果越好;通過MSE的值來反映誤差分的分布情況,MSE值越小,誤差分布就越集中且預測效果就越好。表1為誤差對比。 表1 實驗誤差對比 通過以上對比分析可得:運用Elman神經(jīng)網(wǎng)絡(luò)、支持向量機(SVM)以及本文所提出的方法,在所預測的時間段歷史數(shù)據(jù)庫有著較好的相似度,但運用本文的方法均方誤差最低,達到2.509 6,且隨著交通流數(shù)據(jù)中噪聲的降低,以及交通流的突變性減弱,預測精度得到了進一步的提高。 通過啟發(fā)式閾值降噪實現(xiàn)交通流數(shù)據(jù)分層降噪有利用充分去除交通流數(shù)據(jù)中的噪聲,大幅度提高數(shù)據(jù)質(zhì)量,進而提高預測精度;選用C-C法實現(xiàn)交通流多維信息的獲取,更加充分反映交通流變化軌跡,并進一步確定了BP神經(jīng)網(wǎng)絡(luò)輸入層個數(shù);最后通過BP神經(jīng)網(wǎng)絡(luò)模型預測。通過實驗誤差對比,文中所運用的方法使均方誤差從40.349 1降低到13.641 9,能更好地反映出交通流非線性。但由于單個BP神經(jīng)網(wǎng)絡(luò)模型泛化能力低,具有一定的隨機誤差性,下一步結(jié)合Bagging集成算法對短時交通流預測展開更加進一步的研究。2 交通流多維度信息提取
2.1 交通流相空間重構(gòu)
2.2 交通流可預測性分析
3 多維BP神經(jīng)網(wǎng)絡(luò)預測模型
4 實驗與分析
4.1 交通流數(shù)據(jù)預處理
4.2 交通流數(shù)據(jù)空間重構(gòu)
4.3 多維BP神經(jīng)網(wǎng)絡(luò)預測
4.4 交通流預測模型評價
5 結(jié) 語