陸杰,梁月吉,徐寧輝,陶健春
(1.南寧勘察測(cè)繪地理信息院,廣西 南寧 530001; 2.桂林理工大學(xué)測(cè)繪地理信息學(xué)院,廣西 桂林 541004; 3.廣西城市建設(shè)學(xué)校,廣西 桂林 541003)
基于EMD的GM-LSSVM在變形預(yù)測(cè)中的應(yīng)用
陸杰1*,梁月吉2,徐寧輝1,陶健春3
(1.南寧勘察測(cè)繪地理信息院,廣西 南寧 530001; 2.桂林理工大學(xué)測(cè)繪地理信息學(xué)院,廣西 桂林 541004; 3.廣西城市建設(shè)學(xué)校,廣西 桂林 541003)
針對(duì)變形呈非線性、隨機(jī)性變化特征,提出了一種基于經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)的灰色最小二乘支持向量機(jī)(GM-LSSVM)變形預(yù)測(cè)模型。該模型首先采用EMD有效分離出隱含在變形序列中的非線性高頻成分和低頻成分;然后根據(jù)各分量特點(diǎn)構(gòu)建了高頻LSSVM預(yù)測(cè)模型和低頻GM(1,1)預(yù)測(cè)模型,最后疊加各分量預(yù)測(cè)值得到預(yù)測(cè)結(jié)果。經(jīng)理論分析和算例表明,并與灰色GM(1,1)、BP神經(jīng)網(wǎng)絡(luò)和LSSVM對(duì)比分析。結(jié)果表明,EMD能夠有效分離變形序列的不同頻率成分,本文方法具有較強(qiáng)的預(yù)測(cè)精度,均方根誤差為 0.40 mm,在變形預(yù)測(cè)中具有一定的實(shí)用價(jià)值。
大壩變形;經(jīng)驗(yàn)?zāi)B(tài)分解;GM(1,1);最小二乘支持向量機(jī);精度評(píng)定
大壩變形往往受水位、溫度等多種因素共同影響,具有一定的非線性和隨機(jī)性變化,為保證大壩以及人類的安全,需要及時(shí)掌握大壩變形狀態(tài)并及時(shí)做出準(zhǔn)確預(yù)測(cè)。目前,常用的預(yù)測(cè)方法主要有時(shí)間序列分析、灰色理論、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等,以上方法均存在一定的局限性?;疑A(yù)測(cè)模型具有所需數(shù)據(jù)少、建模簡(jiǎn)單等特點(diǎn),適合用于解決呈指數(shù)增長(zhǎng)趨勢(shì)的實(shí)際問(wèn)題,而對(duì)于復(fù)雜變化、隨機(jī)變化的序列,預(yù)測(cè)誤差較大[1];人工神經(jīng)網(wǎng)絡(luò)在大壩變形分析中得到了較為廣泛的應(yīng)用[2],但其易陷入局部極小點(diǎn)、模型結(jié)構(gòu)不易確定、泛化能力不強(qiáng)或過(guò)于學(xué)習(xí)等。趙洪波等[3]將支持向量機(jī)引用到變形預(yù)測(cè)中,解決了多因素影響下的復(fù)雜變形預(yù)測(cè)問(wèn)題,預(yù)測(cè)精度得到了進(jìn)一步提高。然而,由于大壩變形受多種因素共同影響,直接通過(guò)建立變形量與影響因素之間的復(fù)雜非線性關(guān)系模型難以保證模型預(yù)測(cè)的準(zhǔn)確性。 Huang等[4]于1998年提出了一種新的信號(hào)處理EMD方法。該方法是一種處理非線性和非平穩(wěn)信號(hào)的自適應(yīng)分解方法,不需要確定任何函數(shù),直接對(duì)信號(hào)進(jìn)行平穩(wěn)化處理,能夠有效提取原信號(hào)的波動(dòng)項(xiàng)和趨勢(shì)項(xiàng)[5]?;谏鲜鲅芯?,本文提出了基于經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)和灰色最小二乘支持向量機(jī)(GM-LSSVM)的大壩變形預(yù)測(cè)方法。通過(guò)算例,證實(shí)其有效性和可行性。
2.1 經(jīng)驗(yàn)?zāi)B(tài)分解法
經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)是一種自適應(yīng)信號(hào)分解方法,能夠?qū)⒋嬖谟谠夹蛄兄胁煌卣鞯内厔?shì)逐級(jí)篩選出來(lái),得到具有相同特征尺度的固有模態(tài)分量(Intrinsic Mode Function,IMF),IMF必須同時(shí)滿足兩個(gè)條件[4,5]:第一,在待分解信號(hào)中,極值點(diǎn)的數(shù)目與過(guò)零點(diǎn)的數(shù)目相等,或最多相差一個(gè);第二,在任一時(shí)間上,由局部極大值和局部極小值定義的包絡(luò)均值為零。具體分解過(guò)程可參考文獻(xiàn)[4,5]。2.2 灰色GM(1,1)
灰色GM(1,1)是一個(gè)單個(gè)變量預(yù)測(cè)的一階微分方程模型,其離散時(shí)間響應(yīng)函數(shù)近似指數(shù)規(guī)律。建模的思路:大壩水平位移變形序列經(jīng)過(guò)一次累加,形成一個(gè)遞增數(shù)列,經(jīng)不斷累加,形成的數(shù)據(jù)點(diǎn)連線后接近于某個(gè)指數(shù)函數(shù),然后通過(guò)這個(gè)指數(shù)函數(shù)外推到下一個(gè)累加和,再累減還原即得到大壩序列預(yù)測(cè)值。
2.3 最小二乘支持向量機(jī)
設(shè)某變形序列的樣本集為{(xi,yi)|xi∈Rn,yi∈R,i=1,2,…,l)},得到LS-SVM的回歸函數(shù)為[6]:
y(x)=wTφ(x)+b
(1)
式中,φ(x)表示能夠滿足Mercer條件的核函數(shù),w表示超平面的權(quán)值向量,b表示偏置頂。
對(duì)于最小二乘支持向量機(jī)的估計(jì)問(wèn)題,將回歸問(wèn)題等價(jià)為最小化得到:
(2)
式中,γ表示正則化參數(shù),ei表示誤差項(xiàng)。構(gòu)建式(2)的Lagrange函數(shù)得到:
(3)
式中,a=[a1,a2,…,al]T。根據(jù) KKT(Karush-Kuhn-Tucker)條件,計(jì)算Lagrange函數(shù)的最優(yōu)解:
(4)
對(duì)式(4)進(jìn)行簡(jiǎn)化,得到的線性方程組為:
(5)
式中,y=[y1,y2,…,yl]T,A=[1,…,1]T,I表示單位矩陣,K(xi,yi)表示滿足Mercer條件的核函數(shù)。
設(shè)B=K(xi,yi)+γ-1I,采用最小二乘運(yùn)算求解式(5)得到:
(6)
得到LSSVM的估計(jì)函數(shù)為:
(7)
2.4 LSSVM參數(shù)的優(yōu)化
由2.3可知,核函數(shù)k()的選擇以及核參數(shù)σ和正則化參數(shù)γ的優(yōu)化直接影響到最小二乘支持向量機(jī)的預(yù)測(cè)精度。因此,本文選取徑向基函數(shù)作為模型的核函數(shù),該核函數(shù)能夠較好地反映模型的復(fù)雜程度,采用網(wǎng)格搜索法對(duì)σ和γ參數(shù)進(jìn)行優(yōu)化。參數(shù)優(yōu)化步驟如下[7]:
(1)設(shè)定參數(shù)σ和γ的選擇范圍、參數(shù)步長(zhǎng)、網(wǎng)格間隔、網(wǎng)格點(diǎn)目標(biāo)函數(shù)值的計(jì)算等。
(2)根據(jù)σ和γ的初始值,選擇第一個(gè)交叉驗(yàn)證網(wǎng)點(diǎn)位置,通過(guò)交叉驗(yàn)證方法獲取訓(xùn)練均方誤差作為網(wǎng)格點(diǎn)計(jì)算的目標(biāo)函數(shù),并計(jì)算所有的網(wǎng)格點(diǎn)。
(3)選取均方誤差最低的一組(σ,γ)為最優(yōu)參數(shù)。若選取的參數(shù)達(dá)不到精度要求,則以選擇的參數(shù)為中心網(wǎng)格點(diǎn),在較小的范圍內(nèi)構(gòu)建新的二維網(wǎng)格平面重新計(jì)算目標(biāo)函數(shù),再次選取均方誤差最低的參數(shù)。如果滿足精度要求,則停止,否則繼續(xù)重復(fù)以上步驟,最終獲取精確的參數(shù)σ和γ作為最優(yōu)值。
2.5 預(yù)測(cè)流程
本文模型預(yù)測(cè)流程如下:
(1)采用EMD對(duì)大壩變形序列進(jìn)行分解,得到n個(gè)IMF高頻分量和1個(gè)低頻分量DF。
(2)針對(duì)各IMF,建立相應(yīng)的LSSVM預(yù)測(cè)模型,同時(shí)建立灰色GM(1,1)預(yù)測(cè)模型對(duì)DF低頻序列進(jìn)行預(yù)測(cè)。
(3)對(duì)各模分量預(yù)測(cè)的殘差進(jìn)行組合即得到最終的預(yù)測(cè)結(jié)果。
圖1 模型預(yù)測(cè)流程圖
本文采用均方根誤差和平均絕對(duì)值誤差來(lái)評(píng)定模型預(yù)測(cè)精度[1]:
(8)
(9)
本文以某大壩水平位移變形監(jiān)測(cè)數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù)[9],監(jiān)測(cè)期為91期,如圖2所示??梢姡摯髩嗡轿灰谱冃巫兓环€(wěn)定,非線性和隨機(jī)性變化較強(qiáng),難以直接建立較為準(zhǔn)確的預(yù)報(bào)模型。因此,為探討大壩變形序列的特征,采用EMD進(jìn)行分解,分解結(jié)果如圖3所示。由圖3可見,EMD將變形序列分解為4個(gè)頻率依次降低的分量,其中IMF1分量具有一定的非線性變化,IMF2和IMF3呈現(xiàn)出周期性和隨機(jī)性成分,DF體現(xiàn)出變形序列的整體變化趨勢(shì)。顯然,根據(jù)各分量建立對(duì)應(yīng)的模型,對(duì)提高預(yù)測(cè)精度具有較大的可能。
為驗(yàn)證本文方法的有效性和可行性,建立4種方案進(jìn)行對(duì)比分析:方案1—灰色GM(1,1)預(yù)測(cè)模型、方案2—BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型、方案3—最小二乘支持向量機(jī)預(yù)測(cè)模型、方案4—基于EMD的GM-LSSVM預(yù)測(cè)模型。各方案采用前71期變形數(shù)據(jù)作為模型訓(xùn)練輸入,后20期作為模型預(yù)測(cè)數(shù)據(jù)。方案1~方案3直接采用原始變形預(yù)測(cè)進(jìn)行建模,方案4采用經(jīng)EMD分解得到的各分量進(jìn)行建模。同時(shí),為了減少建模誤差,本文統(tǒng)一將變形序列歸化到[-1,1]區(qū)間,再進(jìn)行建模預(yù)測(cè)。各分量的預(yù)測(cè)結(jié)果圖4所示。
圖2 大壩變形水平位移序列
圖3 EMD分解結(jié)果
圖4 各分量預(yù)測(cè)值和實(shí)際值對(duì)比
由圖4可得,方案4的預(yù)測(cè)結(jié)果和實(shí)際分量相吻合,預(yù)測(cè)精度較高。各方案預(yù)測(cè)結(jié)果如表1和圖5所示。
由表1可見,方案1、方案2和方案3的預(yù)測(cè)結(jié)果不穩(wěn)定,部分預(yù)測(cè)值和實(shí)際值相差比較大,GM(1,1)的最大殘差為 4.33 mm,BP神經(jīng)網(wǎng)絡(luò)的最大殘差達(dá)到 3.96 mm,LSSVM的最大殘差為 2.73 mm。而方案4的預(yù)測(cè)結(jié)果均優(yōu)于其他方案,殘差最小值為 0.04 mm,最大值僅為 0.81 mm。結(jié)合圖5進(jìn)一步看出:GM(1,1)不能正確反映變形的趨勢(shì),過(guò)于線性擬合預(yù)測(cè);BP神經(jīng)網(wǎng)絡(luò)由于自身的缺陷,預(yù)測(cè)結(jié)果波動(dòng)較大;LSSVM的部分預(yù)測(cè)結(jié)果不穩(wěn)定,而本文方法的預(yù)測(cè)結(jié)果比較穩(wěn)定,接近于大壩實(shí)際值??梢?,采用經(jīng)驗(yàn)?zāi)B(tài)分解離使得變形序列中不同頻率的成分得到有效分離,預(yù)測(cè)模型的自身性能得到充分發(fā)揮。本文方法綜合結(jié)合線性和非線性的擬合能力,預(yù)測(cè)結(jié)果更能顯示大壩變形的趨勢(shì)。
不同方案的預(yù)測(cè)結(jié)果對(duì)比 表1
圖5 各方案的預(yù)測(cè)值和大壩實(shí)際變形值對(duì)比
各方案的預(yù)測(cè)精度統(tǒng)計(jì)如表2所示。
各模型精度對(duì)比(單位/mm) 表2
由表2進(jìn)一步發(fā)現(xiàn),方案4的預(yù)測(cè)精度最高,均方根誤差和平均絕對(duì)誤差分別為 0.40 mm、 0.34 mm。可見,基于EMD的GM-LSSVM預(yù)測(cè)模型保證了較好的全局預(yù)測(cè)精度,更具優(yōu)越性。綜上,采用經(jīng)驗(yàn)?zāi)B(tài)分解能夠有效分離隱含在變形序列中的特征成分,更有利于模型的建立和預(yù)報(bào)。正是本文方法綜合考慮了變形的特征,充分發(fā)揮了模型的線性和非線性預(yù)測(cè)能力,無(wú)論在預(yù)測(cè)結(jié)果還是預(yù)測(cè)精度上均優(yōu)于單一的GM(1,1)、BP神經(jīng)網(wǎng)絡(luò)和最小二乘支持向量機(jī)。
本文提出基于EMD的GM-LSSVM變形預(yù)測(cè)方法,結(jié)果表明:經(jīng)驗(yàn)?zāi)B(tài)分解能夠有效分離隱含在時(shí)序中隱含的非線性和隨機(jī)性高頻成分以及趨勢(shì)低頻成分;各分量更加明顯地表現(xiàn)出時(shí)序中隱含的特征信息,使得GM-LSSVM預(yù)測(cè)模型的自身性能得到充分發(fā)揮。本文方法具有較強(qiáng)的擬合預(yù)測(cè)能力,預(yù)測(cè)精度較高。
[1] 任超,梁月吉,龐光鋒等. 最優(yōu)非負(fù)變權(quán)組合模型在大壩變形中的應(yīng)用[J]. 大地測(cè)量與地球動(dòng)力學(xué),2014,34(6):162~166.
[2] 劉勇健,李彰明,張建龍等. 基于遺傳-神經(jīng)網(wǎng)絡(luò)的深基坑變形實(shí)時(shí)預(yù)報(bào)方法研究[J]. 巖石力學(xué)與工程學(xué)報(bào),2004,23(6):1010~1014.
[3] 趙洪波. 支持向量機(jī)在隧道圍巖變形預(yù)測(cè)中的應(yīng)用[J]. 巖石力學(xué)與工程學(xué)報(bào),2005,24(4):649~653.
[4] Huang N E,Shen Z,Long S R. The Empirical Mode Decomposition and Hilbert Spectrum for Nonlinear and Nonstationary Time Series Analysis[J]. Proceedings of the Royal Society of London SERIESA,1998,903~995.
[5] 戴吾蛟,丁曉利,朱建軍等. 基于經(jīng)驗(yàn)?zāi)J椒纸獾臑V波去噪法及其在 GPS多路徑效應(yīng)中的應(yīng)用[J]. 測(cè)繪學(xué)報(bào),2006,35(4):321~327.[6] Suykens J A K,Vandewalle J. Least Squaresupport Vector Machine Classifiers[J]. Neural Processing Letters,1999,9(3):293~300.
[7] Liu Xianglou,Jia Dongxu,Li Hui. Research on Kernel Parameter Optimization of Support Vector Machine in Speaker Recognition[J]. Science Technology and Engineering,2010,10(7):1669~1673.
[8] 姜成科. 基于遺傳算法的神經(jīng)網(wǎng)絡(luò)在大壩變形預(yù)報(bào)中的應(yīng)用[D]. 大連:大連理工大學(xué),2009.
GM-LSSVM Based on EMD in The Application of the Dam Deformation
Lu Jie1,Liang Yueji2,Xu Ninghui1,Tao Jianchun3
(1.Nanning Exploration & Survey Geoinformation Institute,Guilin 530001,China; 2.College of Geomatics and Geoinformation,Guilin University of Technology,Guilin 541004,China; 3.Guangxi Urban Construction School,Guilin 541003,China)
A new algorithm based on empirical mode decomposition (EMD)and the grey least squares support vector machine (GM-LSSVM)for dam deformation prediction was presented. Firstly,to effectively separate the nonlinear trend of volatility of high frequency component and low frequency one,the algorithm deformation sequence was decomposed by EMD;Then,the LSSVM was applied to build a prediction model for high frequency component,and the GM(1,1)was applied to build a prediction model for low frequency one;Finally,the predicted values of each component in the forecast was overlay. The calculation result was analyzed and compared with the grey GM(1,1)、BP neural network and LSSVM. The results show that the EMD can effectively separate different frequency components of deformation sequence,prediction accuracy of the method is stronger,root mean square error is 0.40mm,which can be applied to dam deformation prediction practically.
dam deformation;empirical mode decomposition;GM (1,1);least squares support vector machine;precision evaluation
1672-8262(2017)01-142-04
P196,TV698.11
B
2016—05—07 作者簡(jiǎn)介:陸杰(1978—),男,工程師,主要從事測(cè)繪工程技術(shù)工作。 基金項(xiàng)目:廣西自然科學(xué)基金項(xiàng)目(2014GXNSFAA118288);廣西“八桂學(xué)者”崗位專項(xiàng)經(jīng)費(fèi)資助項(xiàng)目、廣西空間信息與測(cè)繪重點(diǎn)實(shí)驗(yàn)室資助課題(桂科能130511402,130511407)。