曹渝
(廣州杰賽通信規(guī)劃設(shè)計(jì)院有限公司,廣東 廣州 510310)
交通狀態(tài)短時(shí)預(yù)測是指基于動態(tài)獲取的道路交通參數(shù)-道路狀態(tài)數(shù)據(jù)的時(shí)間序列推測未來短時(shí)間段的交通流狀態(tài)[1]。交通預(yù)測技術(shù)基于先進(jìn)的交通狀態(tài)監(jiān)測手段,通過實(shí)時(shí)提取現(xiàn)有交通道路的交通參數(shù),結(jié)合具有實(shí)時(shí)性的預(yù)測模型,實(shí)現(xiàn)未來時(shí)間段交通道路的短時(shí)預(yù)測。交通狀態(tài)的預(yù)測研究已經(jīng)有不少的理論和方法,既有根據(jù)規(guī)則進(jìn)行相關(guān)統(tǒng)計(jì)分析的預(yù)測模型,也有采用人工智能技術(shù)的智能分析方法。
典型的統(tǒng)計(jì)分析模型有:孫曉亮[2]采用熵的方法實(shí)現(xiàn)短時(shí)交通狀態(tài)的預(yù)測;王新穎[3]利用非參數(shù)回歸模型實(shí)現(xiàn)交通狀態(tài)的回歸預(yù)測;鄭建湖[4]則采用馬爾科夫鏈,結(jié)合車輛的初始交通狀態(tài)、轉(zhuǎn)移概率以及下一時(shí)刻車輛的交通狀態(tài)構(gòu)建短時(shí)交通狀態(tài)預(yù)測模型。
人工智能分析模型有:盛春陽[5]等人采用貝葉斯網(wǎng)絡(luò)計(jì)算交通參數(shù)之間的條件概率來預(yù)測各種交通狀態(tài)發(fā)生的概率;錢民[6]采用定性動態(tài)概率網(wǎng)絡(luò)構(gòu)建的交通狀態(tài)預(yù)測模型,計(jì)算各路口發(fā)生擁堵的可能性;陶麗[7]利用改進(jìn)小波神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)交通狀態(tài)的預(yù)測。
統(tǒng)計(jì)的分析方法相對簡單,卻無法反映動態(tài)的交通狀態(tài)變化的特征;人工智能分析的方法具有學(xué)習(xí)特征,能夠反映動態(tài)的交通狀態(tài)變化的特點(diǎn),但是其需要龐大的訓(xùn)練庫以保證算法的精度??紤]到現(xiàn)在多種終端數(shù)據(jù)融合遇到的各種困難,本文采用通信移動用戶的數(shù)據(jù)作為交通參數(shù)提取的數(shù)據(jù)源,通過分析移動用戶的出行特征提取其實(shí)時(shí)的交通參數(shù),然后再利用小波神經(jīng)網(wǎng)絡(luò)的方法構(gòu)建交通狀態(tài)預(yù)測模型,實(shí)現(xiàn)交通狀態(tài)的短時(shí)預(yù)測。
小波分析克服了傅里葉處理非平穩(wěn)信號的缺陷,它不僅能夠獲取一段信號包含的頻率成分,還能采用有限長的會衰減的小波基構(gòu)建靈活可變的時(shí)間-頻率窗,實(shí)現(xiàn)了信號的時(shí)頻分析,也就是信號在各個(gè)時(shí)刻的瞬時(shí)頻率及其幅值[8]。
小波分析的基本思想是伸縮和平移。其公式為:
其中,尺度a控制小波函數(shù)的伸縮,平移量τ控制小波函數(shù)的平移。尺度對應(yīng)于頻率,而平移量對應(yīng)于時(shí)間。
小波分析作為一種新的時(shí)頻信息方法,它可以采用小波基,將不同頻率和尺度的信號通過不同的伸縮和平移分離出來,因此可高效分離不同類型的信號,且在信息轉(zhuǎn)換的過程中無信息的損失和扭曲。
前饋型神經(jīng)網(wǎng)絡(luò)用于處理復(fù)雜的非線性分類情況。復(fù)雜的非線性分類會出現(xiàn)組合爆炸式高階輸入,而前饋式神經(jīng)網(wǎng)絡(luò)采用參數(shù)矩陣確定方法對樣本進(jìn)行預(yù)測,得出樣本的分類結(jié)果。
前饋神經(jīng)網(wǎng)絡(luò)是一種單向神經(jīng)網(wǎng)絡(luò),各神經(jīng)元從輸入層開始,接收上一級輸入,并輸出至下一級,直到輸出層。同一層的神經(jīng)元之間沒有任何聯(lián)系,層間信息的傳遞只沿一個(gè)方向進(jìn)行。因此,前饋式神經(jīng)網(wǎng)絡(luò)的前饋僅僅用于計(jì)算網(wǎng)絡(luò)的輸出,并不對網(wǎng)絡(luò)的參數(shù)矩陣進(jìn)行調(diào)整。
典型的前饋神經(jīng)網(wǎng)絡(luò)是BP神經(jīng)網(wǎng)絡(luò),BP神經(jīng)網(wǎng)絡(luò)又稱為連接權(quán)調(diào)整采用反向傳播學(xué)習(xí)算法的前饋神經(jīng)網(wǎng)絡(luò)。其權(quán)值和閾值的調(diào)整恰恰是通過誤差反向計(jì)算方式實(shí)現(xiàn)的。在模型的訓(xùn)練階段,采用多層網(wǎng)絡(luò)的方法計(jì)算出整個(gè)樣本數(shù)據(jù)的總誤差,然后從輸出層網(wǎng)向前推,一般采用梯度下降法逐層求出每一層神經(jīng)元的閾值和權(quán)值的調(diào)整量,循環(huán)迭代,當(dāng)網(wǎng)絡(luò)參數(shù)滿足算法設(shè)定的要求則停止運(yùn)算。
圖1直觀展示了典型的三層神經(jīng)網(wǎng)絡(luò)模型向前傳播的例子。左邊的Layer L1代表網(wǎng)絡(luò)的輸入層,“+1”表示輸入層的偏置節(jié)點(diǎn),第二層Layer L2代表網(wǎng)絡(luò)的隱含層,第三層Layer L3代表網(wǎng)絡(luò)的輸出層。
最典型的神經(jīng)網(wǎng)絡(luò)是BP神經(jīng)網(wǎng)絡(luò),其輸入輸出的
圖1 典型的神經(jīng)網(wǎng)絡(luò)模型
映射關(guān)系為:
反向計(jì)算的本質(zhì)是根據(jù)輸出層與實(shí)際結(jié)果的總誤差,通過隱含層的神經(jīng)元調(diào)整神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值。因此反向計(jì)算的算法流程:
(1)進(jìn)行前饋傳播計(jì)算,利用前向傳播公式,得到各Layer L2,Layer L3,…,Layer Ln(輸出層)的激活值。
為了簡化模型,以下僅介紹具有一層隱含層的前向傳播計(jì)算方式。隱含層中n個(gè)神經(jīng)元的表達(dá)式為:
輸出層的神經(jīng)元表達(dá)式為:
那么,如果存在多層隱含層的神經(jīng)網(wǎng)絡(luò),前饋傳播的步驟為:
(2)設(shè)定目標(biāo)函數(shù),給定一個(gè)包含樣本的訓(xùn)練集,目標(biāo)函數(shù)為:
(3)采用梯度下降方法最小化J(W,b),參數(shù)更新方式為:
反向計(jì)算的權(quán)值和閾值更新關(guān)鍵在于
根據(jù)鏈?zhǔn)椒▌t可得:
其中,
定義殘差為:
同理:
(4)經(jīng)過權(quán)值和閾值的更新,得到的輸出層與實(shí)際結(jié)果的總誤差小于設(shè)定的條件,則停止計(jì)算,否則,繼續(xù)返回第二步進(jìn)行參數(shù)更新,直到滿足條件為止。
通過上述的分析可知,BP網(wǎng)絡(luò)的誤差空間是一個(gè)形狀極為復(fù)雜的N維曲面,該曲面上的每個(gè)點(diǎn)的“高度”對應(yīng)于神經(jīng)網(wǎng)絡(luò)的總誤差,每個(gè)點(diǎn)的坐標(biāo)向量對應(yīng)著N個(gè)神經(jīng)元的權(quán)值。圖2為一個(gè)神經(jīng)網(wǎng)絡(luò)二維誤差空間的示意圖,從圖2可知,當(dāng)權(quán)值在誤差空間的平坦區(qū)域時(shí),誤差下降緩慢,影響收斂速度。除此以外,由于引進(jìn)了sigmoid函數(shù),誤差對權(quán)值的梯度變化小(接近于零),這種情況使得訓(xùn)練經(jīng)常陷入某個(gè)局部極小點(diǎn),從而使訓(xùn)練無法收斂于給定誤差。
針對上述神經(jīng)網(wǎng)絡(luò)存在的缺點(diǎn),采用小波基函數(shù)取代sigmoid函數(shù)來優(yōu)化網(wǎng)絡(luò)參數(shù)和誤差空間,這種以小波基作為模式識別的特征函數(shù),采用小波基以及輸入向量的內(nèi)積進(jìn)行加權(quán)實(shí)現(xiàn)輸入層的特征提取,結(jié)合了小波特有的時(shí)頻局域化的特征以及神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)功能,實(shí)現(xiàn)了具有較強(qiáng)的非線性擬合能力和較好的收斂速度。
因此,小波神經(jīng)網(wǎng)絡(luò)的輸入-輸出映射可以表現(xiàn)為:
圖2 神經(jīng)網(wǎng)絡(luò)二維誤差空間
其中,ψ(.)為函數(shù)的母小波基函數(shù),尺度ai控制小波函數(shù)的伸縮,平移量bi控制小波函數(shù)的平移,wi是網(wǎng)絡(luò)神經(jīng)元的連接權(quán)值,N為母小波的數(shù)目。
本文采用保定某運(yùn)營商提供的2015年3月1日至2015年12月30日移動用戶的通話和流量詳單數(shù)據(jù),該數(shù)據(jù)大小為300 G,包含50多萬用戶發(fā)生業(yè)務(wù)的位置切換及位置更新的相關(guān)信息,選擇實(shí)驗(yàn)范圍為主城區(qū)某一條主干道總長15 km的道路。
首先,根據(jù)移動用戶發(fā)生業(yè)務(wù)的通信信號特征,把移動用戶的軌跡定位到10 m×10 m的網(wǎng)格中;然后根據(jù)出行數(shù)據(jù)的時(shí)間戳算出移動用戶在一段位移中的速度和加速度。由于移動通信的信號有不穩(wěn)定的特點(diǎn),很可能剛切換過來的基站的信號又變?nèi)酰謾C(jī)又開始往回切換,從而造成“乒乓效應(yīng)”。這兩個(gè)值相差越大,“乒乓效應(yīng)”發(fā)生的可能性就越小。但太大又可能造成手機(jī)在合適的時(shí)候無法使用下一基站通話。因此,針對移動用戶的出行數(shù)據(jù),本文需要對“兵乓切換”的數(shù)據(jù)進(jìn)行剔除。
移動用戶的位置數(shù)據(jù)、速度數(shù)據(jù)以及加速度數(shù)據(jù)如表1所示。
針對表1采集的速度、加速度數(shù)據(jù),把疑似發(fā)生“兵乓切換”效應(yīng)的數(shù)據(jù)進(jìn)行剔除。如:該用戶在起始時(shí)間為201501082153發(fā)生的速度為41.6 m/s,相當(dāng)于150 km/h,該速度已經(jīng)超過主干道的合理速度,因此需要剔除該類異常數(shù)據(jù)。
基于交通流數(shù)據(jù)的短時(shí)預(yù)測就是充分借助各種交通流采集設(shè)備提供的源數(shù)據(jù),采用相關(guān)的模型,從源數(shù)據(jù)中發(fā)現(xiàn)各種交通狀態(tài)發(fā)生的規(guī)律。因此,要實(shí)現(xiàn)交通狀態(tài)預(yù)測,首先需要對采集到的數(shù)據(jù)進(jìn)行預(yù)處理,并提取能夠反映交通流特征的交通參數(shù);然后選用合適的模型,在模型中輸入預(yù)測的樣本數(shù)據(jù),預(yù)測下一個(gè)時(shí)間段的交通狀態(tài)。交通狀態(tài)預(yù)測的基本流程如圖3所示:
圖3 交通狀態(tài)預(yù)測的基本流程
本文選取交通流的參數(shù)-速度和加速度作為輸出對象,交通狀態(tài)(擁堵、擁擠、輕度擁擠、暢通)為預(yù)測對象。隨機(jī)抽取移動用戶出行樣本1 872個(gè)作為訓(xùn)練樣本,剩下1 873個(gè)作為預(yù)測檢驗(yàn)樣本。本文分別采用小波神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)兩個(gè)模型進(jìn)行實(shí)驗(yàn),模型的相關(guān)參數(shù)如表2所示:
表2 小波神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)模型的參數(shù)
本次實(shí)驗(yàn)采用matlab工具進(jìn)行仿真,第一次實(shí)驗(yàn)采用學(xué)習(xí)速率(又稱為修正權(quán)值的學(xué)習(xí)速率)為0.07,隱形節(jié)點(diǎn)和迭代次數(shù)可參照表2,本文隨機(jī)抽取訓(xùn)練數(shù)據(jù)10遍,小波神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測的總時(shí)間平均為107 s;BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測的總時(shí)間平均為178 s,均滿足交通狀態(tài)5分鐘更新一次的要求。每一遍的訓(xùn)練集和測試集的正確率如圖4、圖5所示:
表1 移動用戶出行數(shù)據(jù)的采集和交通參數(shù)提取
圖4 小波神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)仿真結(jié)果的準(zhǔn)確率示意圖(學(xué)習(xí)速率0.07)
第二次實(shí)驗(yàn)采用學(xué)習(xí)速率是第一次的10倍,為0.7,隱含層節(jié)點(diǎn)和迭代次數(shù)與第一次的一致,同樣抽取訓(xùn)練數(shù)據(jù)10次,小波神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測的總時(shí)間約為38 s,BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)測的總時(shí)間約為46 s,小波神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)時(shí)間基本滿足5分鐘更新一次的要求。其訓(xùn)練集和測試集的正確率如圖6、圖7所示:
圖5 BP神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)仿真結(jié)果的準(zhǔn)確率示意圖(學(xué)習(xí)速率0.07)
圖6 小波神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)仿真結(jié)果的準(zhǔn)確率示意圖(學(xué)習(xí)速率0.7)
通過本實(shí)驗(yàn)的仿真可知,在最大迭代次數(shù)設(shè)定的情況下,無論是神經(jīng)網(wǎng)絡(luò)還是BP神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)速率跟收斂時(shí)間成反比,與精度成正比,反之亦然。該實(shí)驗(yàn)更能夠說明,如果循環(huán)次數(shù)設(shè)定,學(xué)習(xí)速率過小,神經(jīng)網(wǎng)絡(luò)sigmoid函數(shù)在計(jì)算的過程誤差對權(quán)值的梯度變化小,容易陷入某個(gè)局部極小點(diǎn)使得擬合能力降低。
本文通過對比得知,在參數(shù)一致情況下,小波神經(jīng)網(wǎng)絡(luò)無論在非線性擬合能力還是在收斂速度上都優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。因此,小波神經(jīng)網(wǎng)絡(luò)在預(yù)測交通狀態(tài)的性能以及拓展性比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)更佳。
本文利用移動用戶的出行數(shù)據(jù)提取交通參數(shù),分別采用小波神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行交通狀態(tài)的預(yù)測。實(shí)驗(yàn)表明,在參數(shù)一致的情況下,小波神經(jīng)網(wǎng)絡(luò)采用小波基取代sigmoid函數(shù)來優(yōu)化神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性擬合能力和較好的收斂速度,而且隨著數(shù)據(jù)量的擴(kuò)展,小波神經(jīng)網(wǎng)絡(luò)具有更大擴(kuò)展性的優(yōu)勢。智能交通系統(tǒng)擁有海量的交通參數(shù),可借助小波神經(jīng)網(wǎng)絡(luò)進(jìn)行交通狀態(tài)的短時(shí)預(yù)測,以實(shí)現(xiàn)整個(gè)城市范圍的交通狀態(tài)的短時(shí)預(yù)測。
[1] Fangce Guo, Polak J W. Comparison of modeling approaches for short term traffic prediction under normal and abnormal condition[C]//13th Intelligent Transportation Systems(ITSC) International IEEE Conference 2010. IEEE, 2010: 1209-1214.
[2] 孫曉亮. 面向城市快速路的道路交通狀態(tài)預(yù)測方法的研究[D]. 北京: 北京交通大學(xué), 2009.
[3] 王新穎. 基于網(wǎng)格的短時(shí)交通狀態(tài)預(yù)測研究[D]. 長春:吉林大學(xué), 2010.
[4] 鄭建湖,林小惠,鄭禮席,等. 基于馬爾可夫鏈模型的交通擁擠狀態(tài)預(yù)測[J]. 交通標(biāo)準(zhǔn)化, 2012(22): 76-79.
[5] 盛春陽,張?jiān)? 基于貝葉斯網(wǎng)絡(luò)模型的交通狀態(tài)預(yù)測[J].公路與汽運(yùn), 2008(1): 29-31.
[6] 錢民,唐克生. 基于定性動態(tài)概率網(wǎng)絡(luò)的交通狀態(tài)預(yù)測及改進(jìn)[J]. 云南大學(xué)學(xué)報(bào): 自然科學(xué)版, 2012,34(2):165-168.
[7] 陶麗. 基于改進(jìn)小波神經(jīng)網(wǎng)絡(luò)模型的交通流預(yù)測研究[D]. 上海: 上海工程技術(shù)大學(xué), 2015.
[8] 章文俊. 小波神經(jīng)網(wǎng)絡(luò)算法及其船舶運(yùn)動控制應(yīng)用研究[D]. 大連: 大連海事大學(xué), 2014.
[9] 趙娜,袁家斌,徐晗. 智能交通系統(tǒng)綜述[J]. 計(jì)算機(jī)科學(xué),2014,41(11): 7-11.
[10] 吳忠金. 基于車聯(lián)網(wǎng)的城市道路交通狀態(tài)識別算法研究[D]. 廣州: 華南理工大學(xué), 2012. ★