姜振翔,徐鎮(zhèn)凱,魏博文
(南昌大學(xué) 建筑工程學(xué)院,南昌 330031)
?
基于小波分解和支持向量機(jī)的大壩位移監(jiān)控模型
姜振翔,徐鎮(zhèn)凱,魏博文
(南昌大學(xué) 建筑工程學(xué)院,南昌 330031)
常規(guī)大壩安全監(jiān)控統(tǒng)計(jì)模型未能分別針對(duì)監(jiān)測(cè)序列值內(nèi)系統(tǒng)信號(hào)和隨機(jī)信號(hào)特點(diǎn)進(jìn)行模擬,故預(yù)報(bào)精度存在一定的提升空間?;谛〔ǚ纸饧夹g(shù),利用監(jiān)測(cè)序列值信號(hào)頻率特征分離出系統(tǒng)信號(hào)與隨機(jī)信號(hào),并結(jié)合逐步回歸與支持向量機(jī)(SVM)對(duì)不同信號(hào)的處理優(yōu)勢(shì),在引入網(wǎng)格尋優(yōu)與交叉驗(yàn)證確定SVM敏感參數(shù)的基礎(chǔ)上,提出了一種基于多元統(tǒng)計(jì)結(jié)合小波分解和支持向量機(jī)的大壩位移監(jiān)控模型,同時(shí)編制了其相應(yīng)的計(jì)算程序。工程算例表明,該模型較常規(guī)模型能夠同時(shí)考慮監(jiān)測(cè)序列中的系統(tǒng)信號(hào)和隨機(jī)信號(hào),并且具有較強(qiáng)的模型尋優(yōu)能力和更高的預(yù)報(bào)精度,從而驗(yàn)證了所建模型的有效性,該方法亦可推廣應(yīng)用于高邊坡及大壩其他預(yù)警指標(biāo)的監(jiān)控。
大壩位移;小波分解;參數(shù)尋優(yōu);支持向量機(jī);監(jiān)控模型
建立有效的安全監(jiān)控模型是保障大壩運(yùn)行安全的關(guān)鍵因素之一[1],而現(xiàn)行常規(guī)統(tǒng)計(jì)模型難以區(qū)分原始監(jiān)測(cè)數(shù)據(jù)中同時(shí)存在變化相對(duì)平穩(wěn)的系統(tǒng)信號(hào)與變化相對(duì)劇烈的隨機(jī)信號(hào)[2]。故采用單一的線性方程[3-4]難以表達(dá)出隨機(jī)信號(hào)的不規(guī)則變化,導(dǎo)致欠擬合[5];而采用單一的機(jī)器學(xué)習(xí)[6- 7]算法建模時(shí),則會(huì)忽視水位、溫度、時(shí)效等因素與系統(tǒng)信號(hào)間的線性關(guān)系,導(dǎo)致模型的泛化能力差[8],從而影響預(yù)報(bào)精度。
小波[9]分解是一種重要的頻率分析方法,能夠根據(jù)系統(tǒng)信號(hào)與隨機(jī)信號(hào)頻率的變化特征實(shí)現(xiàn)二者的分離。經(jīng)小波分解后得到的系統(tǒng)信號(hào),其頻率較低,平穩(wěn)性較高,適合采用線性方程表達(dá)[10];而對(duì)于隨機(jī)信號(hào),其頻率較高,具有一定的非線性特征,故可采用非線性方程[11]進(jìn)行模擬。因此,本文首先利用小波分解大壩位移監(jiān)測(cè)原始信號(hào),提出了線性模型與非線性模型疊合的監(jiān)控模型,并結(jié)合逐步回歸與支持向量機(jī)[12](SVM)的算法優(yōu)勢(shì),分別對(duì)其中的系統(tǒng)信號(hào)與隨機(jī)信號(hào)進(jìn)行訓(xùn)練,采用網(wǎng)格搜索算法確定SVM敏感參數(shù),最后得到了基于多元統(tǒng)計(jì)結(jié)合小波分解和支持向量機(jī)的大壩位移監(jiān)控模型。
2.1 位移監(jiān)測(cè)信號(hào)的預(yù)分離
通常認(rèn)為,傳感器采集到的信號(hào)中包含了系統(tǒng)信號(hào)與隨機(jī)信號(hào),其中系統(tǒng)信號(hào)具有明顯的趨勢(shì)性和規(guī)律性,頻率較低;而隨機(jī)信號(hào)的變化特點(diǎn)較為復(fù)雜,往往表現(xiàn)出非線性,頻率較高。大壩位移監(jiān)測(cè)信號(hào)同樣具有這些特征,通常認(rèn)為大壩位移由水壓分量δH、溫度分量δT以及時(shí)效分量δθ等分量組成,分別受水深H、溫度T以及時(shí)效θ等因子的影響。由文獻(xiàn)[1]可知,在對(duì)壩體、壩基模型進(jìn)行適當(dāng)簡(jiǎn)化后可導(dǎo)出δH與H和δT與T間的線性表達(dá)式,其變化規(guī)律明顯,故可認(rèn)為監(jiān)測(cè)信號(hào)中的系統(tǒng)信號(hào)體現(xiàn)了這一線性關(guān)系。但由于簡(jiǎn)化模型、簡(jiǎn)化計(jì)算等因素的存在,可知各分量與各因子之間也存在部分非線性關(guān)系,而該關(guān)系則通過(guò)隨機(jī)信號(hào)表現(xiàn)。因此,在建立大壩位移監(jiān)控模型前,有必要先從原始監(jiān)測(cè)資料中分離出系統(tǒng)信號(hào)與隨機(jī)信號(hào)。
小波分解能夠利用系統(tǒng)信號(hào)與隨機(jī)信號(hào)的頻率特征,通過(guò)用一系列函數(shù)去逼近原始信號(hào)頻率,進(jìn)而實(shí)現(xiàn)對(duì)兩者的分離。大壩位移原始監(jiān)測(cè)信號(hào)δ(H,T,θ)在分解尺度J下的分解表達(dá)式為
(1)
(2)
(3)
式中:φJ(rèn),k(x)為尺度函數(shù);cJ,k為尺度展開系數(shù);ψJ,k(x)為小波函數(shù);dJ,k為小波展開系數(shù);k為分解層數(shù);Z為整數(shù)集。
2.2 疊合系統(tǒng)與隨機(jī)信號(hào)的大壩位移監(jiān)控模型
(4)
上式中,由于隨機(jī)信號(hào)的變化特征,其非線性模型通常難以用顯示方程表達(dá)。對(duì)于運(yùn)行多年的大壩,壩體內(nèi)部已達(dá)到穩(wěn)定溫度場(chǎng),同時(shí)時(shí)效位移的變化也趨于穩(wěn)定,由文獻(xiàn)[1]選擇回歸因子后,監(jiān)控模型可展開為
(5)
式中:am,bq,b1r,b2r,c1和c2為回歸系數(shù),對(duì)于重力壩m可取3,拱壩m可取4或5;當(dāng)λ=0時(shí),表示選用多周期的諧波作為因子,l為周期,l=1為年周期,l=2為半年周期,t為監(jiān)測(cè)值至始測(cè)值累計(jì)天數(shù),當(dāng)λ=1時(shí),表示壩內(nèi)有足夠數(shù)量溫度計(jì),選用各溫度計(jì)的測(cè)值作為溫度分量的因子,Tq為第q支溫度計(jì)的變溫值,p為溫度計(jì)支數(shù);θ=t/100。
對(duì)施工期及蓄水初期的大壩建立位移監(jiān)控模型時(shí)應(yīng)對(duì)式(5)進(jìn)行修正,由于其時(shí)效位移變化較大,故應(yīng)結(jié)合文獻(xiàn)[1],根據(jù)實(shí)測(cè)位移變化趨勢(shì)采用適當(dāng)?shù)臅r(shí)效位移數(shù)學(xué)模型作為回歸因子。
3.1 系統(tǒng)與隨機(jī)信號(hào)的處理方法
大壩位移原始監(jiān)測(cè)資料經(jīng)分解后,可通過(guò)不同的數(shù)據(jù)訓(xùn)練方法得出相應(yīng)的模型。在訓(xùn)練系統(tǒng)信號(hào)、建立線性模型時(shí),可采用逐步回歸方法,與一般的多元回歸方法相比,逐步回歸優(yōu)點(diǎn)在于其剩余標(biāo)準(zhǔn)差較小,方程的穩(wěn)定性較好,能夠保證方程中所有回歸因子都具有顯著性。采用逐步回歸分析時(shí),按對(duì)回歸因子顯著程度的大小,將其逐個(gè)引入回歸方程,同時(shí),已被引入回歸方程的回歸因子也可能會(huì)因?yàn)槭ブ匾远惶蕹Mㄟ^(guò)在訓(xùn)練樣本時(shí)不斷引進(jìn)并檢驗(yàn)、剔除不顯著變量,最終確定回歸方程系數(shù)。
(6)
式中:wT為權(quán)重向量;b為常數(shù)。設(shè)置核函數(shù)參數(shù)g,采用RBF核函數(shù),即
(7)
并設(shè)置懲罰系數(shù)C、松弛系數(shù)ξ,經(jīng)風(fēng)險(xiǎn)最小化原理有
(8)
以及KKT互補(bǔ)條件[12]求解后,可得到擬合函數(shù)為
(9)
式中ai為拉格朗日乘子。
在利用SVM建模時(shí),其擬合精度很大程度上取決于懲罰系數(shù)C值和核函數(shù)參數(shù)g值。在此采用網(wǎng)格搜索與交叉驗(yàn)證的方式對(duì)C和g進(jìn)行優(yōu)選,其方法為:①設(shè)置C和g的搜索范圍以及步長(zhǎng);②將訓(xùn)練樣本隨機(jī)分為M組,將每組數(shù)據(jù)分別做一次訓(xùn)練集,其余的驗(yàn)證集進(jìn)行測(cè)試,得到M個(gè)模型;③對(duì)于任一模型,在C和g的搜索范圍內(nèi),找到使得各驗(yàn)證集均方誤差(MSE)的均值最低的C和g;④將該過(guò)程重復(fù)M次,最終選擇MSE均值最低的模型所對(duì)應(yīng)的C和g作為最佳參數(shù)。
3.2 兩相信號(hào)疊合的數(shù)值流程
結(jié)合上述建模方法,本文提出利用逐步回歸與支持向量機(jī)算法建立大壩位移監(jiān)控組合模型的一般步驟為:
(1) 獲取大壩位移監(jiān)控原始數(shù)據(jù)。
(2) 由式(1)至式(3),小波分解原始數(shù)據(jù),得到系統(tǒng)信號(hào)與隨機(jī)信號(hào)。
(3) 根據(jù)式(5)計(jì)算回歸因子,采用逐步回歸訓(xùn)練系統(tǒng)信號(hào)得到線性模型;回歸因子歸一化后根據(jù)式(6)至式(9),采用SVM訓(xùn)練隨機(jī)信號(hào)。
(4) 設(shè)置懲罰系數(shù)C和核函數(shù)參數(shù)g的搜索范圍。
(5) 通過(guò)網(wǎng)格搜索與交叉驗(yàn)證,找到最佳C和g,確定SVM模型。
(6) 根據(jù)式(4),將線性模型與SVM模型疊加。
根據(jù)上述建模步驟,本文給出組合模型建模流程如圖1所示。
圖1 逐步回歸-支持向量機(jī)模型建模流程Fig.1 Flow chart of constructing stepwise regression-SVM model
某混凝土重力壩的最大壩高113.0 m,壩頂全長(zhǎng)308.5 m,壩頂高程為179.0 m。水庫(kù)正常蓄水位173 m,調(diào)節(jié)庫(kù)容11.22億m3,校核洪水位177.80 m,總庫(kù)容20.35億m3。該壩已服役多年,具有較為完善的監(jiān)測(cè)系統(tǒng),并積累了多年監(jiān)測(cè)序列。其中引張線監(jiān)測(cè)設(shè)備設(shè)在壩頂179.00 m高程處,自壩左到壩右依次布置12個(gè)測(cè)點(diǎn)。本文利用某引張線監(jiān)測(cè)點(diǎn)監(jiān)測(cè)值,通過(guò)小波分解,將分離出的系統(tǒng)信號(hào)與隨機(jī)信號(hào)分別利用逐步回歸、支持向量機(jī)建模,從而建立了大壩位移監(jiān)測(cè)的組合模型。
4.1 樣本的選取與小波變換
本文選取2008年6月1日至2008年11月28日的監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析,由于受環(huán)境、儀器自身精度等復(fù)雜因素的影響,部分測(cè)值存在明顯異常,不應(yīng)納入建模樣本。在剔除了明顯的異常測(cè)值后,共得到165組監(jiān)測(cè)數(shù)據(jù),采用Matlab軟件中的小波工具箱,選擇工程中常用的Db4小波[13]對(duì)位移資料進(jìn)行了3層分解。測(cè)點(diǎn)原始測(cè)值、經(jīng)分解后得到的系統(tǒng)信號(hào)、隨機(jī)信號(hào)如圖2所示,同時(shí)繪出壩前水位變化過(guò)程線。
圖2 位移實(shí)測(cè)值、系統(tǒng)信號(hào)、隨機(jī)信號(hào)以及壩前水位Fig.2 Measured displacement, systematic signal,random signal and water level before dam obtained from monitoring points
由圖2可知,從總體上看大壩位移實(shí)測(cè)值與水位變化具有一定的線性關(guān)系,而經(jīng)過(guò)Db4小波分解得到的系統(tǒng)信號(hào)與位移實(shí)測(cè)值的變化趨勢(shì)具有一致性,并且較原始信號(hào)平滑,有利于使用逐步回歸方法進(jìn)行線性擬合;而隨機(jī)信號(hào)的分布則具有較高的離散性,表明其變化與水位等因素間存在一定的非線性關(guān)系,故更適合于利用SVM建模。
4.2 大壩位移監(jiān)測(cè)組合模型的建立
根據(jù)3.2節(jié)建模流程,選取分解后前157組監(jiān)測(cè)數(shù)據(jù)作為訓(xùn)練樣本,后8組作為測(cè)試樣本。鑒于該壩為運(yùn)行多年的混凝土重力壩,故式(5)中的m值可取3,將其作為水位的回歸因子,并采用諧波因子作為溫度的回歸因子、觀測(cè)累計(jì)天數(shù)的對(duì)數(shù)函數(shù)作為時(shí)效的回歸因子。將系統(tǒng)信號(hào)作為因變量,通過(guò)逐步回歸方法建立了線性回歸方程;同時(shí)將回歸因子歸一化,選擇徑向基核函數(shù),以隨機(jī)信號(hào)作為因變量,建立SVM模型。在選擇SVM參數(shù)時(shí),引入網(wǎng)格搜索算法,設(shè)置懲罰系數(shù)C的搜索范圍為[2-5,25],核函數(shù)參數(shù)g的搜索范圍為[2-5,25],搜索步長(zhǎng)取20.8,并將訓(xùn)練樣本分為5個(gè)部分進(jìn)行交叉驗(yàn)證。由于搜索范圍較大,故采用log2g和log2C作為橫坐標(biāo),得到網(wǎng)格尋優(yōu)過(guò)程如圖3所示。從圖中可知,在相等的MSE下存在多組C和g組合,故MSE具有等高線的性質(zhì)。由于隨機(jī)信號(hào)值偏小,故MSE在較大處等高線稀疏,而在MSE較小處等高線密集。當(dāng)在最低MSE為3×10-4處尋找到多組C和g后,一般選擇最小的C值作為模型最佳參數(shù),以提高SVM的泛化能力,因此選擇最佳C值為0.003 9,最佳g值為256。
表1 測(cè)試樣本下各模型預(yù)測(cè)結(jié)果比較
圖3 網(wǎng)格尋優(yōu)過(guò)程Fig.3 Optimizing process of grid search
4.3 模型精度分析
圖4 各監(jiān)測(cè)模型的計(jì)算值Fig.4 Calculated values of various models
模型建立后,利用其計(jì)算出在157組訓(xùn)練樣本下的擬合值以及在8組測(cè)試樣本下的預(yù)報(bào)值,以考察模型的有效性。為體現(xiàn)組合模型的精度優(yōu)勢(shì),本文還建立了未經(jīng)小波變換、直接利用原始監(jiān)測(cè)信號(hào)建立的逐步回歸模型、SVM模型(采用網(wǎng)格尋優(yōu)算法找到最佳C值為9.18,g值為84.44),各模型的擬合值與預(yù)報(bào)值如圖4所示,同時(shí)列出各模型的預(yù)報(bào)值以及誤差如表1所示。
由圖4可知,各模型的擬合值以及預(yù)報(bào)值變化趨勢(shì)均與實(shí)際觀測(cè)值相近,可用于預(yù)報(bào)分析,而從表1可得,在測(cè)試樣本下,組合模型的誤差指標(biāo)總體上要低于逐步回歸模型與SVM模型。為了更清楚地表現(xiàn)各模型的預(yù)報(bào)精度,本文統(tǒng)計(jì)了3種模型擬合值以及預(yù)報(bào)值的MSE、平均絕對(duì)百分誤差(MAPE)等誤差指標(biāo),其中MSE可以反映計(jì)算值相對(duì)實(shí)測(cè)值的整體變化程度,而MAPE可以從衡量計(jì)算值與實(shí)測(cè)值誤差的整體水平,各模型在不同階段的誤差指標(biāo)如表2所示。
表2 各監(jiān)測(cè)模型誤差指標(biāo)
由表2可知,對(duì)于在訓(xùn)練樣本下得到的擬合值,SVM模型的優(yōu)勢(shì)突出,這體現(xiàn)了SVM良好的學(xué)習(xí)能力,而逐步回歸模型的誤差較大,這主要是由于監(jiān)測(cè)數(shù)據(jù)中系統(tǒng)信號(hào)與隨機(jī)信號(hào)共存,其中隨機(jī)信號(hào)的變化具有非線性特征,故在線性擬合的過(guò)程中,對(duì)線性方程系數(shù)進(jìn)行估計(jì)時(shí),容易產(chǎn)生較大偏差,從而對(duì)模型精度造成影響。但對(duì)于預(yù)報(bào)值,組合模型的誤差指標(biāo)均優(yōu)于其他兩類模型,其中SVM模型的誤差指標(biāo)較高,原因在于大壩位移與水位、溫度、時(shí)效等變量間存在一定的線性關(guān)系,當(dāng)采用SVM進(jìn)行非線性預(yù)報(bào)時(shí),模型的泛化能力受到影響。而組合模型的誤差又低于逐步回歸模型,這是因?yàn)榇髩挝灰婆c上述變量間還存在部分非線性關(guān)系,故采用組合模型中的SVM能夠?qū)ζ溥M(jìn)行較好模擬,有利于精度的提高。
(1) 小波分解技術(shù)能夠?qū)误w位移監(jiān)測(cè)資料中的系統(tǒng)信號(hào)和隨機(jī)信號(hào)有效分離,本文在各信號(hào)變化特征的基礎(chǔ)上,提出了線性模型與非線性模型疊合的大壩位移監(jiān)控模型。
(2) 采用逐步回歸與SVM算法建立的大壩位移監(jiān)控模型,能夠克服常規(guī)統(tǒng)計(jì)模型的不足,工程算例表明,所建模型的預(yù)報(bào)精度明顯提升,從而證明了所建模型的有效性,可推廣應(yīng)用于高邊坡及大壩其他預(yù)警指標(biāo)的監(jiān)控。
(3) SVM在模擬大壩位移信號(hào)時(shí)表現(xiàn)出較強(qiáng)的學(xué)習(xí)能力,采用網(wǎng)格搜索算法優(yōu)化SVM參數(shù),可以避免試算的低效率和盲目性,但在尋優(yōu)過(guò)程中,如何根據(jù)隨機(jī)信號(hào)特點(diǎn)設(shè)置并逐步縮小C和g搜索范圍,以提高建模速度,還可作進(jìn)一步的研究。
[1] 吳中如. 水工建筑物安全監(jiān)控理論及其應(yīng)用[M]. 北京: 高等教育出版社, 2003.
[2] 汪樹玉, 劉國(guó)華, 杜王蓋. 大壩觀測(cè)數(shù)據(jù)序列中的混沌現(xiàn)象[J]. 水利學(xué)報(bào), 1999, (7): 22-26.
[3] STOJANOVIC B, MILIVOJEVIC M, IVANOVIC M,etal. Adaptive System for Dam Behavior Modeling Based on Linear Regression and Genetic Algorithms[J]. Advances in Engineering Software, 2013, 65(10): 182-190.
[4] 許 昌, 岳東杰, 董育煩, 等. 基于主成分和半?yún)?shù)的大壩變形監(jiān)測(cè)回歸模型[J]. 巖土力學(xué), 2011, 32(12): 3738-3742.
[5] 李子陽(yáng), 郭 麗, 顧沖時(shí). 大壩監(jiān)測(cè)資料的時(shí)變Kalman預(yù)測(cè)模型[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2010, 35(8): 991-995.
[6] 王雪紅,劉曉青,陶海龍,等.優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的位移預(yù)測(cè)模型[J].水利水運(yùn)工程學(xué)報(bào),2014,(2):38-42.
[7] 朱鳳林, 韓 衛(wèi). Matlab 仿真平臺(tái)下大壩位移BP神經(jīng)網(wǎng)絡(luò)模型研究[J]. 長(zhǎng)江科學(xué)院院報(bào), 2013, 30(1): 99-101.
[8] 繆新穎, 褚金奎, 杜小文. LM-BP神經(jīng)網(wǎng)絡(luò)在大壩變形預(yù)測(cè)中的應(yīng)用[J]. 計(jì)算機(jī)工程與應(yīng)用, 2011, 47(1): 220-222.
[9] BURRUS C S , GOPINATH R A , GUO H. Introduction to Wavelets and Wavelet Transforms: A Primer[M]. Englewood Cliffs, United States: Prentice Hall, 1997.
[10]李端有, 周元春, 甘孝青. 混凝土拱壩多測(cè)點(diǎn)確定性位移監(jiān)控模型研究[J]. 水利學(xué)報(bào), 2011, 42(8): 981-985,994.
[11]李 波, 顧沖時(shí), 李智錄, 等. 基于偏最小二乘回歸和最小二乘支持向量機(jī)的大壩滲流監(jiān)控模型[J]. 水利學(xué)報(bào), 2008, 39(12): 1390-1394,1400.
[12]丁世飛, 齊丙娟, 譚紅艷. 支持向量機(jī)理論與算法研究綜述[J]. 電子科技大學(xué)學(xué)報(bào), 2011, 40(1): 2-9.
[13]徐洪鐘, 吳中如, 李雪紅, 等. 基于小波分析的大壩變形觀測(cè)數(shù)據(jù)的趨勢(shì)分量提取[J]. 武漢大學(xué)學(xué)報(bào)(工學(xué)版), 2003, 36(6): 5-8.
(編輯:曾小漢)
A Monitoring Model of Dam Displacement Based onWavelet Decomposition and Support Vector Machine
JIANG Zhen-xiang, XU Zhen-kai, WEI Bo-wen
(College of Civil Engineering and Architecture,Nanchang University,Nanchang 330031,China)
The systematic signal and random signal in the monitoring sequence are difficult to distinguish in the conventional monitoring models of the dam, thus the forecasting accuracy of the conventional model can be promoted. In this paper, we separate the systematic signal from random signal by their frequency features based on wavelet decomposition. According to the advantages of managing signals of stepwise regression and Support Vector Machine(SVM), in association with grid search and cross validation methods for determining the sensitive parameters of SVM, we present a monitoring model of dam displacement based on multivariate statistical combined with wavelet decomposition and support vector machine. Then the calculating procedures are compiled. The engineering examples indicate that both the systematic signal and random signal can be separated effectively in the composite model, with high forecasting accuracy and good optimization ability. Finally, the composite model is effective and the method can be applied to high slope monitoring and other warning indicators of dam projects.
dam displacement; wavelet decomposition; parameter optimization; support vector machine; monitoring model
2014-08-09 ;
2014-09-02
國(guó)家自然科學(xué)基金項(xiàng)目(51569014,51409139)
姜振翔(1989-),男,江西南昌人,碩士研究生,從事水工結(jié)構(gòu)安全監(jiān)控及風(fēng)險(xiǎn)分析,(電話)15071264157(電子信箱)jiangzhenxiang89@163.com。
魏博文(1981-),男,江西彭澤人,講師,博士,從事水工結(jié)構(gòu)數(shù)值分析及安全監(jiān)控研究,(電話)13767428612(電子信箱)bwweincu@126.com。
10.11988/ckyyb.20140690
2016,33(01):43-47
TV698.1
A
1001-5485(2016)01-0043-05