盧獻(xiàn)健,晏紅波,梁月吉
基于集合經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的大壩變形預(yù)測(cè)方法
盧獻(xiàn)健1,2,晏紅波1,2,梁月吉1
(1.桂林理工大學(xué)測(cè)繪地理信息學(xué)院,廣西桂林 541004;2.廣西空間信息與測(cè)繪重點(diǎn)實(shí)驗(yàn)室,廣西桂林541004)
受水位、溫度等諸多因素共同影響,大壩變形具有隨機(jī)性和非線性特征,提出了一種基于集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)和支持向量機(jī)(SVM)的大壩變形預(yù)測(cè)算法。算法先對(duì)大壩位移序列進(jìn)行集合經(jīng)驗(yàn)?zāi)B(tài)分解,有效分離出隱含在時(shí)序中的非線性高頻波動(dòng)成分和低頻趨勢(shì)成分;其次根據(jù)各分量特點(diǎn)構(gòu)造不同的SVM進(jìn)行預(yù)測(cè),最后疊加各分量預(yù)測(cè)值得到預(yù)測(cè)結(jié)果。與BP神經(jīng)網(wǎng)絡(luò)模型及傳統(tǒng)支持向量機(jī)的對(duì)比結(jié)果表明,所提預(yù)測(cè)算法具有較強(qiáng)的自適應(yīng)預(yù)測(cè)能力,預(yù)測(cè)精度較高。
大壩變形預(yù)測(cè);集合經(jīng)驗(yàn)?zāi)B(tài)分解;支持向量機(jī);精度評(píng)定
大壩變形往往受水位、溫度、自身物理變化等諸多因素共同影響,難以建立較為準(zhǔn)確的形變量與影響因素之間的復(fù)雜非線性關(guān)系模型,因此傳統(tǒng)時(shí)間序列法和回歸分析等方法在變形預(yù)測(cè)中的應(yīng)用受到了限制。經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)是一種有效的處理非線性和非平穩(wěn)信號(hào)的自適應(yīng)分解方法[1]。它不需要確定任何基函數(shù),依據(jù)信號(hào)本身的時(shí)間尺度直接對(duì)信號(hào)進(jìn)行平穩(wěn)化處理,“篩選”出原信號(hào)的波動(dòng)項(xiàng)和趨勢(shì)項(xiàng)[2]。目前,EMD算法已在眾多領(lǐng)域得到了有效的驗(yàn)證和應(yīng)用。戴吾蛟[3]將EMD方法應(yīng)用于GPS多路徑效應(yīng)的探測(cè)中并取得較好的效果。羅飛雪等[4]通過(guò)實(shí)驗(yàn)證明了利用EMD將變形序列分解成不同特征尺度的平穩(wěn)窄帶信號(hào)的可行性。張豪[5]將EMD方法成功應(yīng)用于大壩變形預(yù)測(cè)。然而,在信號(hào)分解過(guò)程中,EMD方法根據(jù)信號(hào)的極值點(diǎn)采用三次樣條插值函數(shù)擬合以獲得的上、下包絡(luò)線存在邊界效應(yīng)等問(wèn)題,這使分解得到的各個(gè)分量的精度受到了影響,不利于分析隱含在信號(hào)中的信號(hào)變化特征[6]。集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)[6-7]對(duì)經(jīng)驗(yàn)?zāi)B(tài)分解的尺度混合問(wèn)題進(jìn)行了優(yōu)化,使經(jīng)驗(yàn)?zāi)B(tài)分解的邊界效應(yīng)問(wèn)題得到了有效解決。
另一方面,各種人工智能算法得到快速發(fā)展,其中支持向量機(jī)(Support Vector Machine,SVM)[8]在非線性、高維模式識(shí)別中具有獨(dú)特優(yōu)勢(shì)而得到了廣泛應(yīng)用[9-11]。張衛(wèi)國(guó)等[12-13]將支持向量機(jī)應(yīng)用于變形預(yù)測(cè)中,解決了多因素影響下的復(fù)雜變形預(yù)測(cè)問(wèn)題,取得了較好的預(yù)測(cè)效果。
基于上述研究,本文采用集合經(jīng)驗(yàn)?zāi)B(tài)分解與支持向量機(jī)相結(jié)合的思路,對(duì)大壩變形進(jìn)行分析研究。在利用EEMD對(duì)大壩序列進(jìn)行分解的基礎(chǔ)上,利用SVM對(duì)各個(gè)分量進(jìn)行預(yù)測(cè),最后疊加得到大壩變形的預(yù)測(cè)結(jié)果。
1.1集合經(jīng)驗(yàn)?zāi)B(tài)分解基本原理
設(shè)Y(t)為大壩變形序列,EMD分解首先搜索原始信號(hào)Y(t)的極大值、極小值來(lái)構(gòu)造信號(hào)的上、下包絡(luò)線Vmax(t)和Vmin(t),將原始信號(hào)與包絡(luò)線均值進(jìn)行比較
并判斷D(t)是否滿足構(gòu)成本征模態(tài)分量(Intrinsic Mode Function,IMF)的兩個(gè)條件。滿足則作為第1 個(gè)IMF,否則作為新的Y(t)繼續(xù)進(jìn)行分解。按上述方法從高頻到低頻的順序依次對(duì)信號(hào)進(jìn)行分解,直到分解的余量Bn(t)是一個(gè)單調(diào)函數(shù)時(shí)結(jié)束,最終原信號(hào)可以表示為
式中,Li(t)為第 i次分解得到的本征模態(tài)分量;Bn(t)為經(jīng)n次分解后的剩余分量。
由于變形序列的端點(diǎn)不一定處于極大值或極小值,因此所計(jì)算的上、下包絡(luò)線在兩端有可能偏離實(shí)際值,最終引起IMF模式混淆問(wèn)題,影響EMD分解質(zhì)量。
集合經(jīng)驗(yàn)?zāi)B(tài)分解是EMD方法的改進(jìn),其利用高斯白噪聲具有均勻分布、均值為0的統(tǒng)計(jì)特性,通過(guò)多次向原信號(hào)加入不同的隨機(jī)白噪聲來(lái)改變信號(hào)的極值點(diǎn)特性,把多次分解得到了IMF求取平均來(lái)有效解決EMD的邊界效應(yīng)問(wèn)題[7]。EEMD分解步驟為:①向大壩監(jiān)測(cè)信號(hào)序列Y(t)加入隨機(jī)白噪聲nm(t)得到Y(jié)m(t),其中,nm(t)要服從(0,(αε)2)的正態(tài)分布,α為噪聲的強(qiáng)度參數(shù),ε為信號(hào)的標(biāo)準(zhǔn)差。②使用EMD對(duì)Ym(t)進(jìn)行分解,得到若干個(gè)本征模態(tài)分量Li(t)和一個(gè)剩余分量Bn(t)。③重復(fù)執(zhí)行①、②共m次,其中每一次加入的白噪聲序列的幅值不同。④對(duì)總計(jì)為m次EMD分解得到的每一個(gè)IMF計(jì)算均值,作為EEMD方法得到的大壩原始序列最終分量IMF。
EEMD分解結(jié)果的質(zhì)量主要受EMD分解的重復(fù)次數(shù)與加入噪聲的強(qiáng)度兩因素的綜合影響,但通過(guò)多次分解以及求和取平均后可以使得IMF的模式混淆問(wèn)題得到有效改善。
1.2網(wǎng)格算法優(yōu)化支持向量機(jī)
對(duì)已知訓(xùn)練集M={(x1,y1),…,(xk,yk)},x∈R,y∈R,k為樣本總數(shù),SVM通過(guò)映射z=φ(x)把低維不可分的樣本作非線性變換為線性可分的高維特征空間E,并在空間E中建立學(xué)習(xí)機(jī)對(duì)樣本的非線性特征進(jìn)行線性分析或回歸。其應(yīng)用核函數(shù)的展開(kāi)定理有效避免非線性變換中產(chǎn)生的“維數(shù)災(zāi)難”問(wèn)題。設(shè)u,v分別為原空間D中的兩個(gè)向量,根據(jù)泛函數(shù)有關(guān)理論,定義一個(gè)滿足Mercer條件的對(duì)稱函數(shù)k(u,v),則不難得到k(u,v)=φ(u)φ(v)。這樣,通過(guò)在高維空間計(jì)算內(nèi)積,不考慮高維空間的維數(shù),就可以實(shí)現(xiàn)非線性向高維線性的轉(zhuǎn)變,建立支持向量機(jī)回歸模型[9]
式中,αi、βi均為 Lagrange因子;Δ為常數(shù)項(xiàng);k(xxi)為核函數(shù)。
實(shí)際應(yīng)用中,SVM的性能取決于所選用的核函數(shù)。而多項(xiàng)式核函數(shù)、徑向基核函數(shù)(RBF),和sigmoid核函數(shù)是SVM常采用的3種核函數(shù)。本文以徑向基核函數(shù)為SVM的核函數(shù),其關(guān)鍵是確定核函數(shù)k(xxi)中最優(yōu)的懲罰參數(shù)C和核參數(shù)g,參數(shù)C、g的選擇是否合理直接對(duì)SVM的預(yù)測(cè)精度產(chǎn)生影響。本文利用網(wǎng)格搜索法進(jìn)行參數(shù)尋優(yōu)[15],通過(guò)設(shè)定參數(shù)C、g的取值范圍并格網(wǎng)化,利用交叉驗(yàn)證方法計(jì)算網(wǎng)格內(nèi)各組合參數(shù)的訓(xùn)練均方根誤差,并取最小均方根誤差對(duì)應(yīng)的C和g作為參數(shù)尋優(yōu)結(jié)果。
1.3EEMD-SVM預(yù)測(cè)模型流程
基于EEMD-SVM的大壩預(yù)測(cè)模型,將大壩在各個(gè)時(shí)間點(diǎn)的變形值作為一時(shí)間序列{X(t),t=1,2,…,m},對(duì)序列X(t)進(jìn)行集合經(jīng)驗(yàn)?zāi)B(tài)分解得到n個(gè)本征模態(tài)函數(shù)IMF和1個(gè)殘差項(xiàng)B,即
X(t)=B+IMF1+IMF2+…+IMF(n)(5)對(duì)各個(gè)IMF和B使用網(wǎng)格搜索尋找最優(yōu)的徑向基核函數(shù)參數(shù)C、g,并建立各自的SVM預(yù)測(cè)模型進(jìn)行預(yù)測(cè),通過(guò)預(yù)測(cè)得到各分量的預(yù)測(cè)值YIMF1,YIMF2,…,YIMF(n)和YB,最后將各分量預(yù)測(cè)值疊加得到大壩變形預(yù)測(cè)結(jié)果Y為
綜上所述,建立EEMD-SVM大壩變形預(yù)測(cè)模型的方法與流程見(jiàn)圖1所示。
圖1 模型預(yù)測(cè)流程
為綜合評(píng)定預(yù)測(cè)結(jié)果的精度,本文采用均方根誤差和平均絕對(duì)值誤差作為模型預(yù)測(cè)結(jié)果精度的評(píng)定指標(biāo),即式中,MSE為均方根誤差;MAE為平均絕對(duì)誤差;Yt為大壩實(shí)際變形值;Y^t為大壩預(yù)測(cè)值;n為大壩觀測(cè)期數(shù);t為大壩觀測(cè)第t期。
為了分析驗(yàn)證本文模型的有效性及精度,以某鋼筋混凝土重力壩[16]為例,選擇其具有代表性的第30號(hào)壩段共91期的壩頂水平位移進(jìn)行數(shù)據(jù)分析,其水平位移變形如圖2所示。由圖2可知,該大壩的水平位移變形隨機(jī)性變化較強(qiáng),呈非線性變化趨勢(shì)。
圖2 大壩變形水平位移序列
利用本文的EEMF-SVM預(yù)測(cè)模型對(duì)以上變形序列進(jìn)行預(yù)測(cè)。首先,采用EEMD對(duì)大壩變形序列進(jìn)行分解,其結(jié)果中各分量如圖3所示。
圖3 EEMD分解結(jié)果
圖3表明,EEMD將大壩序列分解為5個(gè)IMF 和1個(gè)余量B,5個(gè)IMF分量的頻率逐級(jí)降低,表示了不同因素影響下的波動(dòng)特征,余量B屬于低頻成分,代表了原變形序列中隨時(shí)間變化的趨勢(shì)。其中,分量IMF1~I(xiàn)MF3的信號(hào)周期性波動(dòng)的特點(diǎn)較明顯,而這個(gè)波動(dòng)的周期并不穩(wěn)定,具有非均勻變化的特性。這種非均勻變化反映了大壩水位、溫度及壩體結(jié)構(gòu)變化等內(nèi)外部因素共同作用的非線性??梢?jiàn),經(jīng)EEMD分解后各IMF分量更加明顯的反映了隱含在時(shí)序中的物理特征,各分量變化曲線比原變形序列曲線(圖2)光滑和平穩(wěn),有利于變形分析與預(yù)報(bào)。
分解后,IMF和B分量序列的數(shù)據(jù)個(gè)數(shù)均為91個(gè),選取第1~71個(gè)樣本作為訓(xùn)練樣本,其余樣本作為測(cè)試樣本。分別使用支持向量機(jī)對(duì)分解得到的各分量進(jìn)行訓(xùn)練和預(yù)測(cè),其中核函數(shù)均選用徑向基核函數(shù),利用網(wǎng)格搜索法對(duì)懲罰參數(shù)C和核參數(shù)g進(jìn)行尋優(yōu),各分量的模型參數(shù)尋優(yōu)結(jié)果見(jiàn)表1。
表1 各個(gè)分量SVM預(yù)測(cè)模型參數(shù)
為了進(jìn)行比較,同時(shí)利用BP神經(jīng)網(wǎng)絡(luò)模型和傳統(tǒng)支持向量機(jī)(SVM)模型進(jìn)行預(yù)測(cè)。3種方法的變形預(yù)測(cè)結(jié)果對(duì)比見(jiàn)表2,圖4直觀地反映了各模型預(yù)測(cè)結(jié)果和大壩實(shí)際變形的對(duì)比。
表2 不同方法的預(yù)測(cè)結(jié)果比較 mm
圖4 各模型的預(yù)測(cè)值和大壩實(shí)際變形值對(duì)比
由表2可見(jiàn):BP神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)支持向量機(jī)的預(yù)測(cè)結(jié)果相近,部分預(yù)測(cè)值和實(shí)際值相差比較大,預(yù)測(cè)結(jié)果的最大殘差分別為3.742、2.933 mm。而本文算法的預(yù)測(cè)值和殘差均優(yōu)于其他預(yù)測(cè)模型,殘差最小值為0.067 mm,最大值僅為0.825 mm。從圖4可進(jìn)一步看出,在大壩變形浮動(dòng)大的第74~84期,BP神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)的支持向量機(jī)在預(yù)測(cè)中都出現(xiàn)了不同程度的偏差,而本文算法的預(yù)測(cè)結(jié)果則比較穩(wěn)定,也更接近于大壩實(shí)際值;在大壩變形較平穩(wěn)的第85~91期,各模型預(yù)測(cè)結(jié)果較好地與實(shí)際值相符合。
為評(píng)定模型預(yù)測(cè)精度,根據(jù)3種方法的預(yù)測(cè)結(jié)果計(jì)算了各自的均方根誤差和平均絕對(duì)誤差兩項(xiàng)精度指標(biāo),其結(jié)果如表3所示??芍?,本文EEMDSVM模型的預(yù)測(cè)精度優(yōu)于傳統(tǒng)SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型,具有較好的全局預(yù)測(cè)精度。
表3 各預(yù)測(cè)模型精度對(duì)比 mm
本文將EEMD和SVM相結(jié)合并應(yīng)用于大壩變形預(yù)測(cè)。算例的分析結(jié)果表明,EEMD能夠?qū)?fù)雜、非線性的大壩變形序列分解為不同特征尺度的平穩(wěn)信號(hào),有效分離出大壩變形序列中不同頻率的波動(dòng)和趨勢(shì)成分;利用SVM對(duì)這些“單純”的平穩(wěn)信號(hào)分別建立SVM預(yù)測(cè)模型,則更有利于支持向量機(jī)性能的充分發(fā)揮,最終提高預(yù)測(cè)結(jié)果的精度。與傳統(tǒng)SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型的比較結(jié)果表明本文EEMD-SVM模型更有優(yōu)勢(shì),對(duì)大壩、邊坡監(jiān)測(cè)等工程領(lǐng)域具有一定的參考意義。
[1]HUANG N E,SHEN Z,LONG S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proceedings of the Royal Society of London A,1998,454(1971):903-995.
[2]張恒璟,程鵬飛.基于經(jīng)驗(yàn)?zāi)B(tài)分解的CORS站高程時(shí)間序列分析[J].大地測(cè)量與地球動(dòng)力學(xué),2012(3):129-134.
[3]戴吾蛟,丁曉利,朱建軍,等.基于經(jīng)驗(yàn)?zāi)B(tài)分解的濾波去噪法及其在GPS多路徑效應(yīng)中的應(yīng)用[J].測(cè)繪學(xué)報(bào),2006,35(4):321-327.
[4]羅飛雪,戴吾蛟.小波分解與EMD在變形檢測(cè)應(yīng)用中的比較[J].大地測(cè)量與地球動(dòng)力學(xué),2010,30(3):137-141.
[5]張豪,許四法.基于經(jīng)驗(yàn)?zāi)B(tài)分解和遺傳支持向量機(jī)的多尺度大壩變形預(yù)測(cè)[J].巖石力學(xué)與工程學(xué)報(bào),2011(S2):3681-3688.
[6]毛玉龍,范虹.經(jīng)驗(yàn)?zāi)J椒纸饣仡櫯c展望[J].計(jì)算機(jī)工程與科學(xué),2014,36(1):155-162.
[7]WU Z,HUANG N E.Ensemble empirical mode decomposition:a noise-assisted data analysis method[J].Advances in Adaptive Data Analysis,2009,1(1):1-41.
[8]MONFARED M,RASTEGAR H,KOJABADI H M.A new strategy for wind speed forecasting using artificial intelligent methods[J].Renewable Energy,2009,34(5):845-848.
[9] CORTES C,VAPNIK V.Support vector networks[J].Machine Learning,1995,20(3):273-297.
[10]張衛(wèi)國(guó),鐘平安,張玉蘭,等.季節(jié)性支持向量機(jī)中長(zhǎng)期徑流預(yù)報(bào)模型[J].水力發(fā)電,2014,40(4):17-21.
[11]姜振翔,徐鎮(zhèn)凱,彭圣軍,等.基于貝葉斯支持向量機(jī)的潰壩生命損失風(fēng)險(xiǎn)評(píng)價(jià)方法[J].水力發(fā)電,2014,40(4):31-34.
[12]章永來(lái),史海波,周曉鋒,等.基干統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)預(yù)測(cè)模型[J].統(tǒng)計(jì)與決策,2014(5):72-74.
[13]肖浩波,谷艷昌.混凝土壩安全監(jiān)控最小二乘支持向量機(jī)模型[J].長(zhǎng)江科學(xué)院院報(bào),2013,30(5):34-37.
[14]王新洲,范千,許承權(quán),等.基于小波變換和支持向量機(jī)的大壩變形預(yù)測(cè)[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2008,3(5):469-471.
[15]LIU Xianglou,JIA Dongxu,LI Hui.Research on Kernel Parameter Optimization of Support Vector Machine in Speaker Recognition[J]. Science Technology and Engineering,2010,10(7):1669-1673.
[16]姜成科.基于遺傳算法的神經(jīng)網(wǎng)絡(luò)在大壩變形預(yù)報(bào)中的應(yīng)用[D].大連:大連理工大學(xué),2009.
(責(zé)任編輯王琪)
Dam Deformation Prediction Method Based on Ensemble Empirical Mode Decomposition and Support Vector Machine
LU Xianjian1,2,YAN Hongbo1,2,LIANG Yueji1
(1.College of Geomatics and Geoinformation,Guilin University of Technology,Guilin 541004,Guangxi,China;2.Guangxi Key Laboratory of Spatial Information and Geomatics,Guilin 541004,Guangxi,China)
Affected by water level,temperature and other factors,the deformation of dam is random and nonlinear.A new algorithm based on Ensemble Empirical Mode Decomposition(EEMD)and Support Vector Machine(SVM)for dam deformation prediction is presented herein.First,the deformation sequence is decomposed by EEMD in order to effectively separate the nonlinear trend of high frequency component volatility and low frequency component.Then,the SVM is applied to build a prediction model for each component.Finally,the predicted values of each component are superimposed.The calculation result is analyzed and compared with the results of BP neural network and traditional SVM.The comparison shows that the new algorithm has stronger ability of adaptive fitting prediction and the prediction accuracy is higher.
dam deformation prediction;empirical mode decomposition;support vector machine;precision evaluation
TV698.11
A
0559-9342(2016)02-0038-04
2015-05-12
國(guó)家自然科學(xué)基金資助項(xiàng)目(41161072);廣西空間信息與測(cè)繪重點(diǎn)實(shí)驗(yàn)室基金項(xiàng)目(13-051-14-09、13-051-14-15)
盧獻(xiàn)?。?982—),男(壯族),廣西南寧人,講師,碩士,主要從事GNSS應(yīng)用、精密工程測(cè)量;晏紅波(通訊作者).