單麗萍,蘭時(shí)勇+,張建偉
(1.四川大學(xué) 計(jì)算機(jī)學(xué)院,四川 成都610065;2.四川大學(xué) 視覺合成重點(diǎn)學(xué)科實(shí)驗(yàn)室,四川 成都610045)
多源異構(gòu)交通信息融合是智能交通系統(tǒng)(ITS)關(guān)鍵技術(shù)之一,實(shí)時(shí)、全面、準(zhǔn)確的交通信息是ITS 重要的基礎(chǔ)。國(guó)內(nèi)外學(xué)者圍繞多種交通檢測(cè)器信息融合開展了大量的研究工作,文獻(xiàn)[1,2]研究了神經(jīng)網(wǎng)絡(luò)、卡爾曼濾波、模糊理論等多種融合方法,文獻(xiàn)[3-7]討論了BP 神經(jīng)網(wǎng)絡(luò)融合方法;文獻(xiàn)[8,9]討論了粗糙集的融合方法;文獻(xiàn)[10,11]分別分析了行程時(shí)間預(yù)測(cè)的可靠性及浮動(dòng)車可靠性,但這些文獻(xiàn)大多缺乏對(duì)數(shù)據(jù)融合的可靠性分析。
為了解決數(shù)據(jù)融合的可靠性分析問題,文章借鑒GARCH 思想,分別采用兩種融合算法融合以空間序列為特點(diǎn)的浮動(dòng)車數(shù)據(jù)和以時(shí)間序列為特點(diǎn)的視頻傳感器數(shù)據(jù),通過分析并比較誤差的標(biāo)準(zhǔn)差判斷融合的可靠性。
GARCH 模型的基本思想是指在歷史信息集下,某時(shí)刻的噪聲服從均值為零、方差為過去有限項(xiàng)噪聲值平方的線性組合的正態(tài)分布。
GARCH(p,q)模型為
式中:常數(shù)α0,αi,βj 均為非負(fù)數(shù),——t-i時(shí)刻的誤差平方,為t-j時(shí)刻的GARCH誤差方差,p 是GARCH 項(xiàng)的階數(shù),且p≥1,為ARCH 項(xiàng)的階數(shù),q≥0。
構(gòu)建GARCH 模型的主要步驟包括:①建立均值方程,得到誤差序列;②檢驗(yàn)?zāi)P偷恼`差是否含有ARCH 效應(yīng);③如果存在ARCH 效應(yīng),構(gòu)建GARCH 模型。
(1)建立均值方程,得到殘差序列:均值方程可以為BP神經(jīng)網(wǎng)絡(luò)方法、平均值法、時(shí)間序列方法等,最小二乘法等,分別建立真值與融合速度、浮動(dòng)車速度、視頻傳感器采集的車輛速度的均值方程,得到誤差序列。
(2)ARCH 效應(yīng)檢驗(yàn):采用拉格朗日乘數(shù)檢驗(yàn)即ARCH LM 檢驗(yàn)方法檢驗(yàn)?zāi)U`差序列是否含有ARCH 模型效應(yīng)。
ARCH LM 檢驗(yàn)的具體步驟如下:
構(gòu)建誤差平方序列
假設(shè)檢驗(yàn)
原假設(shè):誤差平方序列中直到r階都不存在ARCH 效應(yīng),即
對(duì)立假設(shè):誤差平方序列中直到r階都不存在ARCH效應(yīng),即
檢驗(yàn)統(tǒng)計(jì)量:LM=T*R2,即觀測(cè)值個(gè)數(shù)T 乘以回歸檢驗(yàn)的R2。
如果假設(shè)檢驗(yàn)p∈[0,0.05],即小于顯著水平0.05,則拒絕原假設(shè),存在ARCH 效應(yīng);相反,接受原假設(shè),不存在ARCH 效應(yīng)。
(3)建立GARCH 模型:GARCH 模型的階數(shù)通過ARCH LM 檢驗(yàn)結(jié)果確定。如果ARCH LM 檢驗(yàn)顯示誤差平方序列存在低階ARCH 效應(yīng),則相應(yīng)的低階GARCH 模型被采用。相反,則相應(yīng)的高階ARCH 模型被采用。采用極大似然法求解GARCH 模型的參數(shù)。
模型驗(yàn)證數(shù)據(jù)來源于成都市紅星路二段2012年3月27日7:30-11:30期間、分析周期為1 min 的240組浮動(dòng)車速度和視頻傳感器采集的車輛速度。
在數(shù)據(jù)預(yù)處理方面,修改錯(cuò)誤數(shù)據(jù)、刪除重復(fù)數(shù)據(jù)、彌補(bǔ)缺失數(shù)據(jù)等預(yù)處理方法處理冗余數(shù)據(jù),為數(shù)據(jù)融合提供精確數(shù)據(jù),提高數(shù)據(jù)融合算法的精度。
其中,采用主元分析(principal component analysis,PCA)與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法依據(jù)歷史數(shù)據(jù)和交通數(shù)據(jù)彌補(bǔ)缺失數(shù)據(jù)。核心思想:相鄰路段的數(shù)據(jù)作為輸入,輸出結(jié)果作為彌補(bǔ)的數(shù)據(jù)。即利用PCA 在保持主要信息的情況下減少數(shù)據(jù)維數(shù),避免復(fù)雜的計(jì)算的情況下,將PCA得到的數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入,使用3層神經(jīng)元,輸出即為彌補(bǔ)的缺失數(shù)據(jù)。
在時(shí)間匹配方面,根據(jù)視頻傳感器數(shù)據(jù)的時(shí)間段選擇浮動(dòng)車數(shù)據(jù);在空間方面,確定兩種數(shù)據(jù)來源于同一路段。
2.2.1 聯(lián)合卡爾曼濾波算法
聯(lián)合卡爾曼濾波算法具有兩級(jí)濾波結(jié)構(gòu),即若干個(gè)子濾波器和主濾波器。各個(gè)子濾波器獨(dú)立進(jìn)行時(shí)間更新和測(cè)量更新,同時(shí)采用方差上界思想消除子濾波器間的相關(guān)性[12];主濾波器進(jìn)行時(shí)間更新和融合各子濾波器的結(jié)果,依據(jù)統(tǒng)一的信息分配原則,將全局狀態(tài)估計(jì)信息和系統(tǒng)噪聲信息反饋給各子濾波器。根據(jù)上一時(shí)刻的最優(yōu)估計(jì)狀態(tài)值和此時(shí)刻的測(cè)量狀態(tài)值估計(jì)此時(shí)刻的最優(yōu)狀態(tài)值。
2.2.2 多源異構(gòu)速度融合
采用3個(gè)子濾波和1個(gè)主濾波的聯(lián)合卡爾曼濾波融合浮動(dòng)車速度和視頻傳感器速度,其中,110個(gè)浮動(dòng)車速度、浮動(dòng)車樣本量、視頻傳感器速度作為輸入,融合后的速度作為輸出。融合后的速度、浮動(dòng)車速度、視頻傳感器速度如圖1所示。
圖1 融合、浮動(dòng)車、視頻傳感器速度
2.2.3 融合可靠性分析
融合速度與浮動(dòng)車速度、融合速度與視頻傳感器速度之間的誤差序列分別如圖2、圖3所示。從圖中可以看出,誤差序列存在波動(dòng)現(xiàn)象,在某段時(shí)期內(nèi)波動(dòng)較小,另一段時(shí)期內(nèi)波動(dòng)相對(duì)較大,這說明誤差序列可能存在異方差性。
接下來進(jìn)行融合速度與浮動(dòng)車速度間誤差序列的ARCH LM 檢驗(yàn),如式(2)所示,經(jīng)計(jì)算得,當(dāng)r=1 時(shí),相應(yīng)的p值為0.035,小于顯著性水平0.05,拒絕原假設(shè),存在一階ARCH 效應(yīng)。當(dāng)r取值從2到10變化時(shí),相應(yīng)的p值均大于顯著性水平0.05,接受原假設(shè),不存在ARCH效應(yīng)。經(jīng)ARCH LM 檢驗(yàn)可知,融合速度與目標(biāo)樣本速度的誤差序列存在一階ARCH 效應(yīng)。且q=1,p=1,采用GARCH(1,1)模型,經(jīng)計(jì)算得到如下方程
圖2 融合速度與浮動(dòng)車速度誤差序列
圖3 融合速度與視頻傳感器速度誤差序列
同理,融合速度與視頻傳感器速度間誤差的GARCH(1,1)模型為
分別計(jì)算方程(3)、方程(4),可得到誤差的標(biāo)準(zhǔn)差,如圖4、圖5所示。從圖中可以看出,標(biāo)準(zhǔn)差的取值以及誤差值偏離誤差平均值的程度。圖4的標(biāo)準(zhǔn)差的取值大部分落在[2.3,3.4]之內(nèi),圖5的標(biāo)準(zhǔn)差的取值大部分落在[2.8,3.5]之內(nèi)。
圖4 融合速度與浮動(dòng)車速度的誤差標(biāo)準(zhǔn)差
圖5 融合速度與視頻傳感器速度的誤差標(biāo)準(zhǔn)差
2.3.1 BP神經(jīng)網(wǎng)絡(luò)
BP(back propagation)神經(jīng)網(wǎng)絡(luò),是基于誤差反向傳播的多層前饋網(wǎng)絡(luò),包括三部分:輸入層、隱含層和輸出層。其中,輸入層負(fù)責(zé)接收輸入信息,并將信息傳遞給隱含層;隱含層通過激勵(lì)函數(shù)進(jìn)行信息變換,將變換后的信息傳遞給輸出層;輸出層處理來自隱含層的信息,并將處理后的信息作為結(jié)果進(jìn)行輸出。
BP神經(jīng)網(wǎng)絡(luò)包括前向傳播和后向傳播兩個(gè)過程,前向傳播主要計(jì)算隱含層和輸出層的輸入和輸出;當(dāng)實(shí)際輸出和期望輸出不相符合時(shí),進(jìn)入后向傳播,逐層修正權(quán)值和閾值,直至學(xué)習(xí)次數(shù)達(dá)到預(yù)先設(shè)定的為止或輸出的結(jié)果可以接受為止。
2.3.2 多源異構(gòu)速度融合
采用三層BP神經(jīng)網(wǎng)絡(luò)融合浮動(dòng)車速度和視頻傳感器速度,隱含層神經(jīng)元的個(gè)數(shù)為7,其中,浮動(dòng)車數(shù)據(jù)中110個(gè)滿足文獻(xiàn)[7]中給出的成都市主干道最小浮動(dòng)車樣本量是數(shù)據(jù)作為目標(biāo)樣本,剩余數(shù)據(jù)中的110個(gè)浮動(dòng)車數(shù)據(jù)、浮動(dòng)車樣本量、視頻數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入。融合速度、浮動(dòng)車速度與視頻傳感器速度如圖6所示。
圖6 BP融合、浮動(dòng)車、視頻傳感器的速度
2.3.3 融合可靠性分析
如3.2.2構(gòu)建GARCH 模型過程類似,構(gòu)建融合速度、浮動(dòng)車速度與誤差序列,進(jìn)行ARCH LM 檢驗(yàn)、構(gòu)建GARCH 模型。經(jīng)ARCH LM 檢驗(yàn),只有當(dāng)r=1 時(shí),p=0.0025,小于顯著性水平0.05,拒絕原假設(shè),存在一階AECH 效應(yīng)。且q=1,p=1,采用GARCH(1,1)模型,具體方程為
同理,融合速度與視頻傳感器速度間誤差的GARCH(1,1)模型為
圖7至圖10分別為融合速度與浮動(dòng)車速度、視頻傳感器速度間的誤差序列及誤差的標(biāo)準(zhǔn)差圖,從圖9、10中可以看出,圖9的標(biāo)準(zhǔn)差的取值大部分落在[3.2,4.0]之內(nèi),圖10的標(biāo)準(zhǔn)差的取值大部分落在[3.0,6.0]之內(nèi)。
圖7 融合速度與浮動(dòng)車速度誤差序列
圖8 融合速度與視頻傳感器速度誤差序列
比較分析圖4、圖5、圖9、圖10,可得,聯(lián)合卡爾曼濾波融合算法得到相關(guān)標(biāo)準(zhǔn)差大部分取值落在[2.3,3.4]、[2.8,3.5]之內(nèi),BP 神經(jīng)網(wǎng)絡(luò)融合算法得到的相關(guān)標(biāo)準(zhǔn)差大部分取之落在[3.2,4.0]、[3.0,6.0]之內(nèi)。前者的標(biāo)準(zhǔn)差明顯小于后者的標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差越小,誤差值偏離其平均值就越小,數(shù)據(jù)越接近真值,即數(shù)據(jù)越可靠。與BP神經(jīng)網(wǎng)絡(luò)方法相比,基于聯(lián)合卡爾曼濾波算法融合的速度更加可靠。
圖9 融合速度與浮動(dòng)車速度的誤差標(biāo)準(zhǔn)差
圖10 融合速度與視頻傳感器速度的誤差標(biāo)準(zhǔn)差
根據(jù)數(shù)據(jù)驗(yàn)證得知,與BP神經(jīng)網(wǎng)絡(luò)方法相比,基于聯(lián)合卡爾曼濾波算法融合的速度更加可靠。聯(lián)合卡爾曼濾波算法采用誤差協(xié)方差和噪聲方差反饋思想,BP神經(jīng)網(wǎng)絡(luò)算法采用誤差反饋思想。由圖6 可知,當(dāng)樣本量大于96 以后,融合速度趨于平穩(wěn)。出現(xiàn)這種情況的原因主要有兩個(gè):陷入局部極小值而得不到全局最優(yōu)和隱含層節(jié)點(diǎn)的選取缺乏相關(guān)理論指導(dǎo)。
BP神經(jīng)網(wǎng)絡(luò)方法的權(quán)值調(diào)整以誤差梯度下降為原則,多數(shù)極小點(diǎn)往往是局部極小并非全局極小,即使是全局極小也并非唯一,訓(xùn)練經(jīng)常陷入某個(gè)局部極小點(diǎn),無法收斂于給定誤差。再次,在訓(xùn)練網(wǎng)絡(luò)時(shí),本文根據(jù)大量試驗(yàn)結(jié)果選取隱含層節(jié)點(diǎn),隱含層節(jié)點(diǎn)的選取缺乏理論指導(dǎo)。此兩種因素影響B(tài)P神經(jīng)網(wǎng)絡(luò)方法的融合效果,導(dǎo)致融合的可靠性降低。
文章借鑒GARCH 思想,以誤差的標(biāo)準(zhǔn)差為融合算法的可靠性評(píng)判依據(jù),為融合算法的可靠性評(píng)估提出了一種依據(jù),具有一定的意義。文章采用BP神經(jīng)網(wǎng)絡(luò)融合算法和聯(lián)合卡爾曼濾波融合算法融合浮動(dòng)車數(shù)據(jù)和視頻傳感器數(shù)據(jù),建立GARCH 模型,進(jìn)行ARCH LM 檢驗(yàn),分別比較融合后的數(shù)據(jù)和單一數(shù)據(jù)源的誤差的標(biāo)準(zhǔn)差的分布及取值范圍,進(jìn)而判斷融合算法的可靠性。經(jīng)實(shí)驗(yàn)驗(yàn)證,基于聯(lián)合卡爾曼濾波融合的交通速度更可靠。此外,文章分析了BP神經(jīng)網(wǎng)絡(luò)融合算法中存在的不足。
[1]Chris Bachmann,Baher Abdulhai,Matthew J Roorda,et al.Acompar-ative asseassment of multi-sensor data fusion techniques for freeway traffic speed estimation using micro simulation modeling [J].Transportation Research Part C:Emerging Technologies,2013,26:33-48.
[2]Peng Depin,Wu Jianping,Wang Chunlu,et al.A robust Kalman filter based on data fusion method for traffic speed estimation [C]//Proceedings of the Conference on Traffic and Transportation Studies,2010:937-947.
[3]Peng Wenglong,Jia Limin,Liu Liangping,et al.The traffic information fusion method based on the multisource detectors[C]//24th Chinese Control and Decision Conference,2012:162-171.
[4]LIU Liangping.Research on the traffic information fusion with the multisource detectors [D].Beijing:Beijing Jiaotong University,2012 (in Chinese).[劉亮平.基于多源檢測(cè)器的交通信息融合方法研究 [D].北京:北京交通大學(xué),2012.]
[5]Yang Menglong,Liu Yiguang,You Zhisheng.The reliability of travel time forecasting [J].IEEE Transactions on Intelligent Transportation Systems,2010,11 (1):162-171.
[6]GUAN Yali.Analysis on the reliability of Chengdu taxi floating car date[D].Chengdu:Southwest Jiaotong University,2010(in Chinese).[管亞麗.成都市出租車浮動(dòng)車數(shù)據(jù)可靠性分析[D].成都:西南交通大學(xué),2010.]
[7]ZHANG Xu.Fusion of multisource heterogeneous traffic flow data for the assessment of traffic operational conditions [D].Beijing:Beijing Jiaotong University,2008 (in Chinese). [張旭.面向交通運(yùn)行狀態(tài)評(píng)價(jià)的多源異質(zhì)交通流數(shù)據(jù)融合技術(shù)方法研究 [D].北京:北京交通大學(xué),2008.]
[8]Dong Hongzhao,Zhou Min,Chen Ning.A New traffic datafusion approach based on evidence theory coupled with fuzzy rough sets[J].Communications in Computer and Information Science,2011,86:444-451.
[9]Chen Lin,Wei Shutao,Shi Linxiang.Traffic status estimate based on data fusion [C]//2nd International Conference on Education Technology and Computer,2010:144-146.
[10]Hussein Dia,Kim Thomas.Development and evaluation of arterial incident detection models using fusion of simulated probe vehicle and loop detector data,information fusion [J].Information Fusion,2011,12 (1):20-27.
[11]Kong Qingjie,Li Zhipeng,Chen Yikai.An approach to urban traffic state estimation by fusing multisource information[J].IEEE Transactions on Intelligent Transportation Systems,2009,10 (3):499-511.
[12]HAN Chongzhao,ZHU Hongzhao.Multisource information fusion [M].Beijing:Tsinghua University Press,2006 (in Chinese). [韓崇昭,朱洪燕.多源信息融合 [M].北京:清華大學(xué)出版社,2006.]