黨 升,馮 曉,盧志豪,韋春桃
(1. 重慶交通大學(xué) 測繪與國土信息工程系,重慶 400074; 2. 重慶交通大學(xué) 工程信息與3S研究所,重慶 400074)
監(jiān)測數(shù)據(jù)處理、分析包括數(shù)據(jù)粗差剔除、濾波去噪、建模預(yù)報(bào)等,而建模預(yù)報(bào)是當(dāng)中非常重要的一部分,其采用的方法一般有回歸分析[1]、時(shí)間序列[2]、灰色模型[3]、神經(jīng)網(wǎng)絡(luò)[4]等。由于某些模型在實(shí)際應(yīng)用中存在一定的不足,有些學(xué)者基于原模型提出了相應(yīng)的優(yōu)化改進(jìn)模型,例如穩(wěn)健回歸分析[5]、模糊AR(p)模型[6]、殘差修正ARMA模型、小波神經(jīng)網(wǎng)絡(luò)[7]模型、改進(jìn)灰色模型[8]等。為了進(jìn)一步融合各模型的優(yōu)點(diǎn),提高預(yù)測精度,又有學(xué)者提出建立組合預(yù)測模型,例如改進(jìn)的MEEMD-ARMA殘差修正組合預(yù)測模型[9]、GM-BP組合模型[10]、灰色-回歸組合模型[11]等。
文獻(xiàn)[12]在建立最優(yōu)權(quán)組合預(yù)測模型時(shí),以全部建模樣本的殘差平方和作為目標(biāo)函數(shù),采用最小二乘準(zhǔn)則確定多個(gè)預(yù)測模型的最優(yōu)權(quán)值,從而使組合模型達(dá)到基于整個(gè)樣本數(shù)據(jù)的全局最優(yōu)。但由于不同模型的建模原理、建?;鶞?zhǔn)、擬合精度等不同,采用該方法對各個(gè)模型進(jìn)行分權(quán),可能出現(xiàn)權(quán)重過度偏向于擬合精度較高的模型而忽略其余模型所特有的隱藏信息,使組合模型的預(yù)測精度降低。從系統(tǒng)角度看,隨著系統(tǒng)的發(fā)展,老數(shù)據(jù)刻畫系統(tǒng)演化的作用將逐漸降低[13],以此建立的模型并不一定能較好地反應(yīng)事物發(fā)展的真實(shí)狀況。因此,在對各模型分權(quán)時(shí),若能利用近期數(shù)據(jù)作為權(quán)值劃分的依據(jù),將一定程度上避免老數(shù)據(jù)對模型的不利影響。基于此,本文提出一種改進(jìn)最優(yōu)的權(quán)系數(shù)組合預(yù)測模型,即基于局部最優(yōu)的權(quán)系數(shù)組合預(yù)測模型。
(1)
為了保證模型的無偏性,wj應(yīng)滿足如下約束條件:
誤差統(tǒng)計(jì)量為:
(2)
若以最小二乘準(zhǔn)則將目標(biāo)函數(shù)極小化來求解權(quán)系數(shù)矩陣W,則可設(shè):
(3)
式中,j∈(1,J);t∈(t0,N)且t0∈(1,N)。
組合預(yù)測模型的模型誤差可表示為:
(4)
(5)
式中,WT=(w1,w2,…,wJ);RT=(1,1,…,1);E=(eij)J×J;
若各個(gè)預(yù)測模型的預(yù)測誤差是不相關(guān)的,則E矩陣可逆,按最小二乘法求得最優(yōu)權(quán)向量為:
W0=(RTE-1R)-1E-1R
(6)
如果上述式中t0=1,所求的權(quán)系數(shù)即為文獻(xiàn)[12]中的最優(yōu)組合預(yù)測模型(整個(gè)樣本數(shù)據(jù)的全局最優(yōu))。
為了驗(yàn)證改進(jìn)模型在預(yù)測中的有效性,本文選用下列幾個(gè)誤差指標(biāo)作為單項(xiàng)預(yù)測模型、最優(yōu)權(quán)系數(shù)組合預(yù)測模型、局部最優(yōu)的權(quán)系數(shù)組合預(yù)測模型的精度評價(jià)指標(biāo)[13]:
(4)平均絕對百分比誤差:
(5)均方百分比誤差:
以萬州區(qū)濱江路某項(xiàng)目的水位監(jiān)測數(shù)據(jù)為例,取2018年2月17日~2018年3月16日SW4點(diǎn)的監(jiān)測數(shù)據(jù)(28期),以前22期為建模數(shù)據(jù),后6期為模型預(yù)測驗(yàn)證數(shù)據(jù)。
根據(jù)文獻(xiàn)[14]中記錄的方法,建立均值灰色模型(EGM),得出模型的發(fā)展系數(shù)a=0.001 616 79,灰色作用量b=170.123 795 2。該模型的時(shí)間響應(yīng)式如下:
-105 223.186)e-0.001 616 79(k-1)
通過MATLAB編程計(jì)算,得出基于樣本數(shù)據(jù)的三次多項(xiàng)式模型:
通過建立的EGM(1,1)模型和三次多項(xiàng)式模型,分別計(jì)算出各自模型前22期數(shù)據(jù)的擬合值,經(jīng)計(jì)算,得出EGM(1,1)模型和三次多項(xiàng)式模型擬合值的平均相對誤差分別是0.069%和0.012%;同時(shí)也對第23~28期值進(jìn)行預(yù)測,最終擬合結(jié)果、預(yù)測結(jié)果如表1~表2所示,擬合、預(yù)測值比較圖如圖1所示。
圖1 EGM、三次多項(xiàng)式模型的擬合、預(yù)測值比較
表1 EGM(1,1)模型與三次多項(xiàng)式模型擬合值/m
表2 EGM(1,1)模型與三次多項(xiàng)式模型預(yù)測值/m
從圖1中可以明顯看出EGM(1,1)模型和三次多項(xiàng)式模型后期的預(yù)測值均存在部分時(shí)域偏離真實(shí)值的情況,因此,采用文獻(xiàn)[12]介紹的方法(權(quán)系數(shù)組合預(yù)測模型),對上述兩種模型進(jìn)行分權(quán),得出最優(yōu)權(quán)系數(shù)w1,w2,如表3所示。并將兩個(gè)模型預(yù)測值進(jìn)行分權(quán)組合,得出第23~28期組合預(yù)測模型的預(yù)測值,如表4所示,預(yù)測值對比圖如圖2所示。從上述圖表中可以看出,最優(yōu)權(quán)系數(shù)組合預(yù)測模型的預(yù)測趨勢與三次多項(xiàng)式模型的大致相當(dāng),預(yù)測值存在一定偏差,造成該情況的原因是三次多項(xiàng)式模型對原始建模數(shù)據(jù)的擬合精度遠(yuǎn)遠(yuǎn)高于EGM(1,1),在使用極小化準(zhǔn)則分權(quán)時(shí)過于置信三次多項(xiàng)式模型,導(dǎo)致三次多項(xiàng)式模型權(quán)重過大。但僅由模型的擬合精度就過于忽略了EGM(1,1)模型中蘊(yùn)藏灰色信息,很明顯也是不合理的。
表3 最優(yōu)權(quán)系數(shù)
表4 權(quán)系數(shù)組合模型預(yù)測值/m
基于2.1章節(jié)中所建立的EGM和三次多項(xiàng)式模型,選取第17~22期作為求解局部最優(yōu)權(quán)系數(shù)的范圍區(qū)段。以第17~22期模型擬合值的殘差平方和作為目標(biāo)函數(shù),結(jié)合式(5)、(6)可得出局部最優(yōu)權(quán)系數(shù)值,如表5所示。
圖2 三種模型預(yù)測值比較
表5 局部最優(yōu)權(quán)系數(shù)
應(yīng)用式(1),將EGM和三次多項(xiàng)式模型進(jìn)行加權(quán)組合,經(jīng)計(jì)算可得到第23~28期的局部最優(yōu)權(quán)系數(shù)組合預(yù)測值,如表6所示,各模型預(yù)測值對比圖如圖3所示。根據(jù)預(yù)測精度評價(jià)指標(biāo)體系對單項(xiàng)模型、最優(yōu)權(quán)系數(shù)組合模型、局部最優(yōu)權(quán)系數(shù)組合模型進(jìn)行評價(jià),如表7所示,可以看出最優(yōu)權(quán)系數(shù)組合模型的指標(biāo)均高于單項(xiàng)預(yù)測模型,這也表現(xiàn)了組合模型在預(yù)測中的優(yōu)越性。根據(jù)表7和圖3可以看出局部最優(yōu)的權(quán)系數(shù)組合預(yù)測模型的預(yù)測值較為符合真實(shí)值變化趨勢,預(yù)測評價(jià)指標(biāo)在各方面均優(yōu)于單項(xiàng)預(yù)測模型和原組合模型,預(yù)測精度有了較大的提升。
表6 局部最優(yōu)權(quán)系數(shù)組合模型預(yù)測值/m
本文基于EGM(1,1)和三次多項(xiàng)式模型,針對最優(yōu)權(quán)系數(shù)組合預(yù)測模型存在的問題,提出一種基于局部最優(yōu)的權(quán)系數(shù)組合預(yù)測模型的計(jì)算方法。通過建立最優(yōu)權(quán)系數(shù)組合預(yù)測模型和局部最優(yōu)的權(quán)系數(shù)組合預(yù)測模型,得到第23~28期水位的預(yù)測值,與測量值對比后,分析總結(jié)得出:
圖3 局部最優(yōu)權(quán)系數(shù)組合模型預(yù)測值比較
表7 預(yù)測評價(jià)指標(biāo)
組合模型可以充分考慮各模型的不同特性和優(yōu)點(diǎn),當(dāng)多個(gè)單項(xiàng)預(yù)測模型擬合值的平均相對誤差存在相對較大差異時(shí),采用最優(yōu)組合預(yù)測模型(基于全部樣本數(shù)據(jù)的最優(yōu))進(jìn)行分權(quán)時(shí),會(huì)導(dǎo)致偏權(quán)情況?;诰植孔顑?yōu)的權(quán)系數(shù)組合預(yù)測模型以t0~N時(shí)刻各個(gè)預(yù)測模型的殘差平方和為目標(biāo)函數(shù),通過最小二乘準(zhǔn)則確定模型在t0~N時(shí)刻的最優(yōu)權(quán),并將該權(quán)作為組合模型的權(quán)值,在處理時(shí)很大程度上保護(hù)了擬合精度較低模型的灰色信息,提高組合模型精度。在短期預(yù)測中,改進(jìn)權(quán)系數(shù)組合預(yù)測模型的效果與權(quán)系數(shù)組合預(yù)測模型相當(dāng),但在中長期預(yù)測中,局部最優(yōu)的權(quán)系數(shù)組合預(yù)測模型的預(yù)測精度和趨勢明顯優(yōu)于原模型。