徐肖遙,張鵬飛,蔣 劍
(1.貴州大學(xué)礦業(yè)學(xué)院,貴州 貴陽(yáng) 550025; 2.中國(guó)電建貴陽(yáng)勘測(cè)設(shè)計(jì)研究院工程科研院,貴州 貴陽(yáng) 550081)
大壩結(jié)構(gòu)復(fù)雜,工作狀態(tài)受水位、溫度等多種因素影響,而相較于滲流、應(yīng)力應(yīng)變等效應(yīng)量,變形監(jiān)測(cè)數(shù)據(jù)更能直觀地反映大壩的運(yùn)行狀態(tài)。因此,構(gòu)建大壩的變形預(yù)測(cè)模型對(duì)維護(hù)大壩的安全穩(wěn)定運(yùn)行有重要意義。早在20世紀(jì),國(guó)外學(xué)者已經(jīng)基于多種統(tǒng)計(jì)學(xué)模型,結(jié)合水壓、降雨量、溫度等因素,進(jìn)行大壩變形預(yù)測(cè)模型的研究[1]。但由于大壩的變形是一個(gè)復(fù)雜的非線性問(wèn)題,傳統(tǒng)的多元線性統(tǒng)計(jì)學(xué)預(yù)測(cè)模型泛化能力較差,因此,近年來(lái)國(guó)內(nèi)外學(xué)者應(yīng)用在非線性問(wèn)題上表現(xiàn)更好的人工神經(jīng)網(wǎng)絡(luò)模型構(gòu)建大壩的變形預(yù)測(cè)模型[2-3]。相較于單一算法存在訓(xùn)練時(shí)間長(zhǎng)、穩(wěn)定性不足等缺點(diǎn),GA-BP、PSO-ELM[4]等融合模型在大壩變形預(yù)測(cè)中更具可行性。因此,本文引入Huang等人[5]提出的經(jīng)驗(yàn)?zāi)B(tài)分解,使非平穩(wěn)的變形實(shí)測(cè)值平穩(wěn)化,得到具有物理意義的本征模函數(shù)和殘差;同時(shí)引入由Huang等[6]學(xué)者提出且已在非線性建模中得到廣泛應(yīng)用的具有學(xué)習(xí)效率高、泛化能力強(qiáng)的極限學(xué)習(xí)機(jī)進(jìn)行預(yù)測(cè)模型的構(gòu)建,并用遺傳算法對(duì)極限學(xué)習(xí)機(jī)的輸入權(quán)重和隱含層閾值進(jìn)行全局尋優(yōu),從而減弱隨機(jī)性誤差,提高模型的泛化能力。將預(yù)測(cè)結(jié)果重構(gòu)后,實(shí)測(cè)值仍存在一定誤差,且難以在預(yù)測(cè)方法上進(jìn)行改進(jìn),針對(duì)這一情況,本文引入差分整合移動(dòng)平均自回歸模型(ARIME)算法作為誤差修正模型[7],從而構(gòu)建基于EMD-GAELM-ARIMA的大壩變形預(yù)測(cè)模型,大大提高了變形預(yù)測(cè)精度,強(qiáng)化了模型的泛化能力。
由于大壩變形是一個(gè)復(fù)雜的非線性系統(tǒng),受多種因素的共同影響,其變形監(jiān)測(cè)序列中存在隨機(jī)變化的干擾信號(hào),長(zhǎng)期變化的趨勢(shì)分量和因降雨、水位、溫度等因素影響的周期變化項(xiàng)。若只通過(guò)復(fù)雜的參數(shù)建立單一形變預(yù)測(cè)模型,則很難準(zhǔn)確掌握變形的規(guī)律,導(dǎo)致預(yù)測(cè)的精度和效率難以滿(mǎn)足要求。而經(jīng)驗(yàn)?zāi)B(tài)分解是由Huang等人[5]提出的一種針對(duì)非線性、非平穩(wěn)信號(hào)的自適應(yīng)信號(hào)分解算法。EMD不僅從根本上擺脫了傅里葉變換的約束,具有良好的時(shí)頻分辨率和自適應(yīng)性,而且在不需要考慮預(yù)選小波基函數(shù)的同時(shí)還繼承了小波變換的優(yōu)點(diǎn),能夠完美地重構(gòu)原始信號(hào)。EMD在分解含噪信號(hào)后,將噪聲和有效信號(hào)分離在不同的本征模函數(shù)中,通過(guò)合理利用本征模函數(shù)重構(gòu)信號(hào),可以達(dá)到去除噪聲的目的[8-11]。
對(duì)于一個(gè)給定的信號(hào)x(t)分解步驟如下:首先找到x(t)的所有極值點(diǎn),利用三次樣條差值函數(shù)對(duì)極大值點(diǎn)形成上包絡(luò)線,對(duì)極小值點(diǎn)形成下包絡(luò)線。計(jì)算上、下包絡(luò)線的均值,記為m1(t),則給定信號(hào)x(t)的第一個(gè)理論上的本征模函數(shù)(IMF):
h1(t)=x(t)-m1(t)
(1)
在實(shí)際情況中,由于難以求出理論上的上、下包絡(luò)線,而只能利用三次樣條差值函數(shù)近似擬合。而信號(hào)中的拐點(diǎn)在計(jì)算的過(guò)程中可能會(huì)轉(zhuǎn)換為新的極值點(diǎn),而新的極值點(diǎn)不在第一次篩選的過(guò)程中,因此需要通過(guò)循環(huán)篩選,直至達(dá)到某種停止準(zhǔn)則才完成迭代。即把h1(t)當(dāng)作新的x(t),循環(huán)上述操作n次得到hn(t)。即:
hn(t)=hn-1(t)-mn(t)
(2)
此時(shí),令第一個(gè)本征模函數(shù)d1(t)=hn(t),并將d1(t)從原始信號(hào)x(t)中分離出來(lái),得到殘差r1(t):
r1(t)=x(t)-d1(t)
(3)
最后,將r1(t)視為新的給定信號(hào),重復(fù)上述步驟,即可得到后續(xù)IMF分量,直至rn(t)單調(diào)或小于預(yù)定誤差時(shí),EMD分解結(jié)束。即:
(4)
其中循環(huán)篩選的停止準(zhǔn)則為2次相鄰篩選結(jié)果的標(biāo)準(zhǔn)差SD在0.2~0.3之間,本文取0.2作為停止標(biāo)準(zhǔn)。其中:
(5)
1.2.1 極限學(xué)習(xí)機(jī)
ELM是由輸入層、隱含層和輸出層組成的經(jīng)典單隱含層前饋神經(jīng)網(wǎng)絡(luò)模型,其輸入層與隱含層、隱含層與輸出層的神經(jīng)元間為全連接[12-13]。針對(duì)堆石壩變形,假設(shè)有N個(gè)樣本(xi,yi),其中xi=[xi1,xi2,…,xin]T∈Rn,yi=[yi1,yi2,…,yim]T∈Rm。對(duì)于一個(gè)隱含層節(jié)點(diǎn)個(gè)數(shù)為L(zhǎng)和激勵(lì)函數(shù)為g(x)的極限學(xué)習(xí)機(jī)的公式表現(xiàn)為:
(6)
式中,βi為輸出權(quán)重,g(x)為激勵(lì)函數(shù),wi=[wi1,wi2,…,win]為輸入權(quán)重,bi為第i層隱含節(jié)點(diǎn)的閾值。
(7)
可用矩陣表示為Hβ=T。其中H是隱含層節(jié)點(diǎn)的輸出,β為輸出權(quán)重,T為期望輸出。在極限學(xué)習(xí)機(jī)中隱含層輸出權(quán)值和閾值可隨機(jī)給定,因此在確定激勵(lì)函數(shù)后,隱含層節(jié)點(diǎn)的輸出矩陣H為一確定的常數(shù)矩陣。因此式(7)轉(zhuǎn)換為求解一個(gè)線性函數(shù),通過(guò)最小二乘法求得該函數(shù)的最小范數(shù)為:
β=H+T
(8)
其中,H+為矩陣H的Moore-Penrose廣義逆。
1.2.2 GAELM模型
遺傳算法是一種高度并行的優(yōu)化算法,訓(xùn)練個(gè)體通過(guò)復(fù)制、交叉、變異不斷進(jìn)化,最終收斂到最優(yōu)群體,從而求得問(wèn)題最優(yōu)解。由于極限學(xué)習(xí)機(jī)算法的輸入層與隱含層間的連接權(quán)值和隱含層神經(jīng)元閾值是隨機(jī)給定的,因此存在某些情況下,部分隱含層節(jié)點(diǎn)失效,導(dǎo)致ELM神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度降低,或者隱含層節(jié)點(diǎn)過(guò)多導(dǎo)致模型產(chǎn)生過(guò)擬合現(xiàn)象[14-16]。針對(duì)這一問(wèn)題,將遺傳算法和極限學(xué)習(xí)機(jī)相結(jié)合,利用GA算法對(duì)ELM神經(jīng)網(wǎng)絡(luò)的輸入權(quán)值和隱含層閾值進(jìn)行優(yōu)化,尋求最優(yōu)解,從而構(gòu)建最優(yōu)的ELM模型。具體參數(shù)尋優(yōu)步驟如下[17-18]:
1)確認(rèn)ELM神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),將模型的輸入權(quán)重和隱含層節(jié)點(diǎn)閾值進(jìn)行二進(jìn)制編碼,作為初始種群,個(gè)體的維度由輸入權(quán)重和隱含層閾值決定。
2)將解碼得到的輸入權(quán)重和隱含層閾值代入到ELM神經(jīng)網(wǎng)絡(luò),使用訓(xùn)練數(shù)據(jù)訓(xùn)練模型,并用測(cè)試數(shù)據(jù)進(jìn)行測(cè)試,驗(yàn)證模型精度,使預(yù)測(cè)值和實(shí)際值的殘差盡可能小。
3)確認(rèn)適應(yīng)度函數(shù)和進(jìn)化代數(shù),求解后,對(duì)適應(yīng)度較優(yōu)個(gè)體進(jìn)行交叉、變異、重組,產(chǎn)生新種群,再次計(jì)算新種群的適應(yīng)度值。當(dāng)達(dá)到循環(huán)最大次數(shù),或者殘差低于預(yù)設(shè)閾值時(shí),GAELM算法結(jié)束。
原始變形監(jiān)測(cè)序列經(jīng)EMD分解和GAELM模型預(yù)測(cè)后得到各組IMF及殘差的預(yù)測(cè)值。將預(yù)測(cè)值同實(shí)際值進(jìn)行對(duì)比,得到誤差序列。將各組誤差序列作為ARIMA模型的原始序列,進(jìn)行誤差修正,從而提高模型的預(yù)測(cè)精度。模型表示如下:
(9)
其中,φm(m=1,2,…,p)為自回歸模型系數(shù);p為自回歸階數(shù);ωn(n=1,2,…,q)為均滑動(dòng)模型系數(shù);q為滑動(dòng)平均部分的階數(shù);at為白噪聲序列。
利用ARIMA模型進(jìn)行誤差序列修正時(shí),首先確認(rèn)p、q的值,其次利用最小二乘法確認(rèn)模型其他參數(shù),然后擬合原始序列得到修正后殘差序列z(x),如果z(x)是白噪聲的一個(gè)子序列,則修正結(jié)束;反之,繼續(xù)優(yōu)化參數(shù),直到滿(mǎn)足條件為止[19-20]。
首先利用EMD算法對(duì)原始變形監(jiān)測(cè)序列進(jìn)行處理,使非平穩(wěn)的變形實(shí)測(cè)值平穩(wěn)化,得到具有物理意義的本征模函數(shù)和殘差。然后分別利用GAELM模型對(duì)每組數(shù)據(jù)進(jìn)行訓(xùn)練,在融合算法中,將ELM的輸入權(quán)值和隱含層閾值作為遺傳優(yōu)化算法中的參數(shù)進(jìn)行全局尋優(yōu),減弱隨機(jī)性誤差,提高模型的泛化能力,從而得到各組IMF分量的預(yù)測(cè)值及趨勢(shì)分量的預(yù)測(cè)值。對(duì)各組IMF分量的預(yù)測(cè)值及趨勢(shì)分量的預(yù)測(cè)值進(jìn)行等權(quán)相加,得到預(yù)測(cè)樣本的重構(gòu)預(yù)測(cè)結(jié)果。最后引入差分整合移動(dòng)平均自回歸模型(ARIME)算法作為誤差修正模型,對(duì)重構(gòu)結(jié)果進(jìn)行誤差修正,從而得到融合模型的最終預(yù)測(cè)結(jié)果。
本文以某一鋼筋混凝土面板堆石壩變形監(jiān)測(cè)數(shù)據(jù)為例,驗(yàn)證EMD-GAELM-ARIMA預(yù)測(cè)模型。大壩位于貴州省烏江,最大壩高179.50 m,壩頂長(zhǎng)427.79 m、寬10.95 m。取2005年8月3日—2007年9月5日共110組實(shí)際監(jiān)測(cè)數(shù)據(jù)為樣本,如圖1所示。將這110組數(shù)據(jù)分為2個(gè)大組,前100組為模型的訓(xùn)練樣本,后10組為模型的預(yù)測(cè)樣本。模型的輸入節(jié)點(diǎn)分別為時(shí)效因子、溫度因子和水位因子,輸出節(jié)點(diǎn)為大壩的變形量實(shí)測(cè)值[21-22]。
圖1 大壩變形監(jiān)測(cè)曲線
由圖1可知,變形監(jiān)測(cè)曲線中存在數(shù)處異常突變,因此為“去除”監(jiān)測(cè)數(shù)據(jù)中的噪聲,對(duì)原始數(shù)據(jù)進(jìn)行平穩(wěn)化處理,采用經(jīng)驗(yàn)?zāi)B(tài)分解對(duì)變形實(shí)際監(jiān)測(cè)數(shù)據(jù)進(jìn)行分解、重構(gòu)[23-24],得到3組IMF分量和1組趨勢(shì)分量,如圖2所示。
(a) IMF1分量
(b) IMF2分量
(c) IMF3分量
(d) 趨勢(shì)分量R
從分解結(jié)果可以看出,IMF1頻率高,振幅大,周期性不明顯,平穩(wěn)性弱,可認(rèn)為是原始數(shù)據(jù)中的干擾信號(hào),IMF2和IMF3周期性較為明顯,可認(rèn)為是受溫度和水位這2個(gè)因素影響。R是趨勢(shì)分量,表示大壩的整體變形趨勢(shì)是上升的。分別將分解后的3組IMF和趨勢(shì)分量作為算法的輸出節(jié)點(diǎn),將時(shí)效分量、水位分量、溫度分量作為算法的輸入節(jié)點(diǎn),利用EMD-ELM算法和EMD-GAELM優(yōu)化算法進(jìn)行訓(xùn)練和預(yù)測(cè)。模型算法各參數(shù)取值范圍如表1所示。
表1 模型各參數(shù)取值范圍
利用EMD分解和GAELM模型預(yù)測(cè)得到各組IMF分量的預(yù)測(cè)值及趨勢(shì)分量的預(yù)測(cè)值,通過(guò)將模型預(yù)測(cè)值同實(shí)際測(cè)量值進(jìn)行對(duì)比,得到誤差序列。在此之上,對(duì)各組誤差序列進(jìn)行ARIMA模型誤差修正,進(jìn)一步完善模型預(yù)測(cè)結(jié)果,最后對(duì)修正后的各組IMF分量的預(yù)測(cè)值及趨勢(shì)分量的預(yù)測(cè)值進(jìn)行等權(quán)相加,得到預(yù)測(cè)樣本的最終預(yù)測(cè)結(jié)果。同時(shí)計(jì)算出單一ELM算法和GAELM、PSO-ELM融合算法的預(yù)測(cè)結(jié)果。4種模型的預(yù)測(cè)結(jié)果對(duì)比如表2所示,預(yù)測(cè)效果對(duì)比如圖3所示。
表2 4種算法的預(yù)測(cè)結(jié)果對(duì)比
圖3 4種算法的預(yù)測(cè)效果對(duì)比
由圖3和表2可知,本文提出的EMD-GAELM-ARIMA組合算法的預(yù)測(cè)值殘差總體更小,相較于單一ELM算法和GAELM、PSO-ELM融合算法,預(yù)測(cè)的變化趨勢(shì)更接近實(shí)際監(jiān)測(cè)結(jié)果。針對(duì)表2分別計(jì)算各個(gè)算法的均方根誤差和平均絕對(duì)誤差,進(jìn)行算法的精度評(píng)定,結(jié)果匯總?cè)绫?所示。
表3 各算法預(yù)測(cè)精度對(duì)比
由表3可知,EMD-GAELM-ARIMA算法的均方根誤差和平均絕對(duì)誤差都明顯小于EMD-ELM算法和EMD-GAELM融合算法的均方根誤差和平均絕對(duì)誤差,較近年所提的PSO-ELM融合模型也有一定的精度提升,由此可以看出,EMD-GAELM-ARIMA算法的預(yù)測(cè)精度明顯高于EMD-ELM算法和EMD-GAELM算法,結(jié)果更加穩(wěn)定。相較于PSO-ELM融合模型,EMD-GAELM-ARIMA算法的預(yù)測(cè)趨勢(shì)與大壩實(shí)際變形監(jiān)測(cè)數(shù)據(jù)的變化趨勢(shì)更為接近,模型構(gòu)建更加科學(xué)合理。
由于大壩變形是一個(gè)復(fù)雜的非線性過(guò)程,所以大壩變形監(jiān)測(cè)數(shù)據(jù)具有非平穩(wěn)、非線性的性質(zhì),因此引入經(jīng)驗(yàn)?zāi)B(tài)分解方法,通過(guò)分解重構(gòu),使其平穩(wěn)化,有效提高了模型算法的預(yù)測(cè)精度;并以極限學(xué)習(xí)機(jī)為基礎(chǔ),采用遺傳算法對(duì)ELM的輸入權(quán)重和隱含層閾值進(jìn)行優(yōu)化,構(gòu)建大壩變形預(yù)測(cè)模型,最后針對(duì)預(yù)測(cè)值與實(shí)測(cè)值的殘差,利用ARIMA模型進(jìn)行誤差修正進(jìn)而得到最終模型預(yù)測(cè)結(jié)果。通過(guò)實(shí)例驗(yàn)證,相較于EMD-ELM算法和EMD-GAELM算法,EMD-GAELM-ARIMA算法的均方根誤差和平均絕對(duì)誤差明顯較小,同PSO-ELM融合模型相比,也有一定的精度提升。因此,本文提出的EMD-GAELM-ARIMA算法能夠準(zhǔn)確地進(jìn)行大壩變形預(yù)測(cè),具有更高的預(yù)測(cè)精度和適用性,驗(yàn)證了該模型算法在復(fù)雜的大壩變形預(yù)測(cè)中的可行性。