沈哲輝 黃 騰 沈月千 鄭 浩
1 河海大學(xué)地球科學(xué)與工程學(xué)院,南京市佛城西路8號,211100
?
遺傳算法優(yōu)化支持向量機(jī)在大壩變形預(yù)測中的應(yīng)用
沈哲輝1黃騰1沈月千1鄭浩1
1河海大學(xué)地球科學(xué)與工程學(xué)院,南京市佛城西路8號,211100
建立大壩變形預(yù)測的支持向量機(jī)模型,并用遺傳算法對支持向量機(jī)模型的核函數(shù)參數(shù)、懲罰參數(shù)和損失參數(shù)進(jìn)行優(yōu)化。將同一優(yōu)化方法不同支持向量機(jī)核函數(shù)、不同優(yōu)化方法同種支持向量機(jī)核函數(shù)進(jìn)行橫向?qū)Ρ龋瑢P神經(jīng)網(wǎng)絡(luò)、自回歸AR(p)模型、多元回歸分析法和周期函數(shù)擬合法進(jìn)行縱向?qū)Ρ?。結(jié)果表明,該GA-SVM(RBF)模型不僅能較好地預(yù)測大壩的變形趨勢,而且能大幅提高預(yù)測精度。
大壩變形因子;支持向量機(jī);遺傳算法;優(yōu)化;預(yù)測
本文用遺傳算法(genetic algorithm,GA)[1]來優(yōu)化支持向量機(jī)(support vector machines,SVM)[2-3]的參數(shù),并建立了大壩變形預(yù)測的GA-SVM模型。通過實(shí)例,對比分析了本文算法、BP神經(jīng)網(wǎng)絡(luò)、自回歸AR(p)模型、多元回歸分析法和周期函數(shù)擬合法。
支持向量機(jī)是一種以結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則為基礎(chǔ)的機(jī)器學(xué)習(xí)算法,通過解一個(gè)線性約束的二次規(guī)劃問題得到全局最優(yōu)解,因而不存在局部極小值的問題,保證了收斂速度[4]。
本文采用徑向基RBF核函數(shù)(高斯核函數(shù))。通過參數(shù)的選擇,其可以適用于任意分布的樣本,是目前支持向量機(jī)中應(yīng)用最廣泛的一種核函數(shù)[5]。選擇合適的損失參數(shù)ε、懲罰參數(shù)C和核函數(shù)參數(shù)σ是支持向量機(jī)能成功為研究對象建模的關(guān)鍵。
為了驗(yàn)證RBF核函數(shù)的優(yōu)勢,本文采用多項(xiàng)式核函數(shù)建模進(jìn)行對比。
2.1建立訓(xùn)練樣本集
結(jié)合文獻(xiàn)[6-7],把水壓分量H(庫水位)、溫度分量T(觀測時(shí)的氣溫)、周期分量t1、t2、t3(為時(shí)間t的函數(shù))、時(shí)效分量t、lnt等7個(gè)影響因子作為大壩變形的影響因素。
周期分量的表達(dá)式為:
(1)
大壩變形的SVM模型表達(dá)式為:
f=x(t,lnt,t1,t2,t3,T,H)
(2)
2.2GA優(yōu)化SVM參數(shù)
采用GA優(yōu)化SVM的3個(gè)參數(shù),其優(yōu)化過程如下。
1)適應(yīng)度函數(shù)的選擇。適應(yīng)度函數(shù)是個(gè)體對環(huán)境的適應(yīng)能力的表達(dá),其與目標(biāo)函數(shù)有關(guān)。本文的目標(biāo)函數(shù)選為均方誤差:
(3)
式中,R0為實(shí)測值,Rm為擬合值。
2)初始化GA參數(shù)。初始化最大進(jìn)化代數(shù)、最大種群數(shù)量、選擇概率、交叉概率和變異概率等。
3)編碼。確定支持向量機(jī)3個(gè)參數(shù)的編碼區(qū)間,設(shè)置參數(shù)C的尋優(yōu)區(qū)間為(0,100],設(shè)參數(shù)ε的尋優(yōu)區(qū)間為[0,1],參數(shù)1/σ的尋優(yōu)區(qū)間為[0,1 000]。對其進(jìn)行二進(jìn)制編碼,產(chǎn)生一組代表這3個(gè)參數(shù)的染色體,即為初始種群。
由滲透率試驗(yàn)結(jié)果可知,煤樣含水量越大,液氮增透效果越好,為了探究液氮影響煤巖滲透率的形式,筆者從微觀角度進(jìn)行了研究,由于篇幅有限,僅分析干燥與飽水煤樣進(jìn)行液氮冷浸前后的掃描電鏡結(jié)果。所用掃描電鏡設(shè)備為JSM-6390LV,其放大倍數(shù)最高可達(dá)300 000。
4)遺傳算子操作。①選擇:是指在群體中選擇生命力強(qiáng)(適應(yīng)度大)的個(gè)體,產(chǎn)生新的群體的過程。②交叉:是指兩隊(duì)相互配對的染色體按照某種方式進(jìn)行部分基因座的交換,從而形成兩個(gè)新的個(gè)體,使種群不斷有新鮮個(gè)體產(chǎn)生,從而對搜索空間中的新區(qū)域進(jìn)行搜索,防止陷入局部最優(yōu)。③變異:將個(gè)體染色體編碼串中的某些基因座上的基因值用改基因座的其他等位基因來替換,從而形成一個(gè)新個(gè)體。它能保證遺傳算法的有效性,決定遺傳算法的局部搜索能力,維持群體的多樣性,防止出現(xiàn)早熟現(xiàn)象。④重插入:為了確保最適應(yīng)個(gè)體在每一次傳播到下一代的數(shù)目保持不變,需要隨機(jī)重插入固定數(shù)量的新個(gè)體。
5)遺傳算法的終止。由于遺傳算法的隨機(jī)搜索性,找到一個(gè)明確的收斂性判別準(zhǔn)則是困難的。本文算法終止條件采用預(yù)先設(shè)定的代數(shù)。
用GA對訓(xùn)練集優(yōu)化,得到最優(yōu)的SVM 3個(gè)參數(shù)。再根據(jù)未來大壩的7個(gè)影響因子,訓(xùn)練SVM模型預(yù)測未來大壩的變形。
以福建省某梯級水電站第三級大壩的表面水平位移引張線測點(diǎn)15在2008-01-01~2012-12-01期間每月1日的60期監(jiān)測數(shù)據(jù)作為歷史數(shù)據(jù)進(jìn)行建模,預(yù)測2013-01-01~2014-08-01的20期數(shù)據(jù)。
以大壩的長周期歷史變形數(shù)據(jù)進(jìn)行建模。7個(gè)影響因子之一的時(shí)效分量t序列較長,例如2008-01-01作為第1天,那么2012-12-01編號則為1 431。若t直接參與建模,其相對于其他6個(gè)影響因子的數(shù)量級較大,導(dǎo)致模型過分?jǐn)M合,預(yù)測能力下降。所以,對樣本數(shù)據(jù)進(jìn)行歸一化處理[7]:
(4)
式中,ξ為原始樣本數(shù)據(jù),ξmin、ξmax分別為樣本集中的最小值、最大值,ξ′為歸一化后的值。
當(dāng)?shù)鷶?shù)為100時(shí),MSE基本達(dá)到收斂,得到最優(yōu)的懲罰參數(shù)C=4.981 6,損失參數(shù)ε=0.174 7,核函數(shù)參數(shù)倒數(shù)1/σ=0.077 2。
為驗(yàn)證遺傳算法具有更好的優(yōu)化能力,采用網(wǎng)格優(yōu)化的方法對支持向量機(jī)(RBF核)參數(shù)進(jìn)行優(yōu)化。
將不同支持向量機(jī)核函數(shù)相同優(yōu)化方法的對比和相同支持向量機(jī)核函數(shù)不同優(yōu)化方法的對比一起并稱為橫向?qū)Ρ?。GA-SVM(多項(xiàng)式核)法得到的最優(yōu)的懲罰參數(shù)C=48.684 6,損失參數(shù)ε=0.425 3,核函數(shù)參數(shù)coef=14.740 9,q=6.765 1;網(wǎng)格-SVM得到的最優(yōu)懲罰參數(shù)C=9.189 6,損失參數(shù)ε=0.148 2,核函數(shù)參數(shù)倒數(shù)1/σ=0.049 0。
將本文的GA-SVM(BRF)模型與BP神經(jīng)網(wǎng)絡(luò)、自回歸AR(p)模型(其中AR(p)模型采用FPE準(zhǔn)則定階,最終定階為p=4)、多元回歸分析法和周期函數(shù)擬合法[9](經(jīng)計(jì)算得a=-0.110 6,b=-0.094 5,c=6.062 8)進(jìn)行縱向?qū)Ρ取?/p>
橫向?qū)Ρ阮A(yù)測曲線見圖1。由圖1看出,各條SVM模型預(yù)測曲線都與原測數(shù)據(jù)變化一致,但顯然使用RBF核函數(shù)的SVM預(yù)測曲線更加貼合原測數(shù)據(jù),說明高斯核函數(shù)優(yōu)于多項(xiàng)式核函數(shù);GA優(yōu)化下的SVM預(yù)測曲線和網(wǎng)格優(yōu)化下的SVM預(yù)測曲線比較接近,但從表1中可以算出,GA-SVM(RBF)預(yù)測相對誤差絕對值的平均值為2.30%,網(wǎng)格-SVM(RBF)預(yù)測相對誤差絕對值的平均值為2.36%,所以GA-SVM(RBF)是優(yōu)于網(wǎng)格-SVM(RBF)的。
圖1 橫向?qū)Ρ阮A(yù)測曲線Fig.1 Horizontal contrasting prediction curve graph
縱向?qū)Ρ阮A(yù)測曲線見圖2。由圖2可以看出,GA-SVM(RBF)模型預(yù)測結(jié)果明顯更加貼合原始監(jiān)測數(shù)據(jù),GA-SVM和BP神經(jīng)網(wǎng)絡(luò)預(yù)測趨勢和原測數(shù)據(jù)基本一致,但AR(p)、多元回歸分析法和周期函數(shù)擬合法幾乎未體現(xiàn)出趨勢性。所以對于大壩來說,通過其變形因子對變形量進(jìn)行建模比用單一變形量建模更加合理。
圖2 縱向?qū)Ρ阮A(yù)測曲線Fig.2 Longitudinal contrasting prediction curve graph
由表1計(jì)算出GA-SVM(RBF)預(yù)測相對誤差絕對值的平均值為2.30%,BP神經(jīng)網(wǎng)絡(luò)預(yù)測相對誤差絕對值的平均值為3.70%,AR(p)預(yù)測相對誤差絕對值的平均值為4.03%,多元回歸分析預(yù)測相對誤差絕對值的平均值為13.88%,周期函數(shù)擬合法預(yù)測相對誤差絕對值的平均值為3.59%。
綜合橫向?qū)Ρ群涂v向?qū)Ρ?,GA-SVM(RBF)模型不僅較好地預(yù)測了變形的趨勢,而且預(yù)測相對誤差也最小??梢?,GA-SVM(RBF)模型是一種比較優(yōu)秀的大壩變形數(shù)據(jù)建模預(yù)測方法。
表1 預(yù)測數(shù)據(jù)對比
1)根據(jù)大壩變形影響因子與大壩變形之間的關(guān)系,用支持向量機(jī)對歷史數(shù)據(jù)進(jìn)行建模,并用具有較好的全局搜索能力以及良好的可擴(kuò)展性等優(yōu)點(diǎn)的遺傳算法優(yōu)化支持向量機(jī)參數(shù),得到最優(yōu)的大壩預(yù)測支持向量機(jī)模型。此優(yōu)化方法避免了憑經(jīng)驗(yàn)或試算法選取支持向量機(jī)的三參數(shù),從而引起欠學(xué)習(xí)或過學(xué)習(xí)的現(xiàn)象。
2)在大壩變形預(yù)測領(lǐng)域,支持向量機(jī)采用的RBF核函數(shù)明顯優(yōu)于多項(xiàng)式核函數(shù)。
3)在大壩變形預(yù)測領(lǐng)域,采用遺傳算法對支持向量機(jī)的三參數(shù)進(jìn)行全局尋優(yōu),比傳統(tǒng)的網(wǎng)格尋優(yōu)有優(yōu)勢。
4)對于大壩長周期數(shù)據(jù)進(jìn)行建模分析,對數(shù)據(jù)進(jìn)行歸一化是極其必要的。
5)對于大壩來說,通過其變形因子對變形量進(jìn)行建模比用單一變形量建模更加合理。
6)對比BP神經(jīng)網(wǎng)絡(luò)、自回歸AR(p)模型、多元回歸分析法和周期函數(shù)擬合法,本文方法不僅更好地預(yù)測了變形趨勢,而且能大幅提高預(yù)測精度。
[1]雷英杰.MATLAB遺傳算法工具箱及應(yīng)用[M]. 西安:西安電子科技大學(xué)出版社,2014(Lei Yingjie. MATLAB Genetic Algorithm Toolbox and Application[M].Xi’an: Xidian University Press, 2014)
[2]呂開云. 黃河小浪底水利樞紐大壩變形預(yù)測方法研究與分析[D]. 北京:中國礦業(yè)大學(xué), 2012(Lü Kaiyun. Research and Analysis about the Deformation Forecasting Methods of Yellow River Xiaolangdi Water Hydropower Dam[D]. Beijing: China University of Mining and Technology, 2012)
[3]翟信德. 基于支持向量機(jī)的大壩變形預(yù)測研究[D]. 合肥:合肥工業(yè)大學(xué), 2007(Zhai Xinde. Research on Dam Displacement Forecasting Model Based on Support Vector Machine[D]. Hefei: Hefei University of Technology, 2007)
[4]唐亮貴,程代杰.基于小波的支持向量機(jī)預(yù)測模型及應(yīng)用[J]. 計(jì)算機(jī)科學(xué),2006,33(3):202-204(Tang Lianggui,Cheng Daijie.A Forecasting Model via Support Vector Machines Based on Wavelets[J]. Computer Science, 2006, 33(3):202-204)
[5]姜慧研,王曉丹,周曉杰, 等.基于SVR的回轉(zhuǎn)窯燒成帶溫度軟測量方法的研究[J]. 系統(tǒng)仿真學(xué)報(bào),2008,20(11):2 951-2 955(Jiang Huiyan,Wang Xiaodan,Zhou Xiaojie,et al.Study on Soft Sensor for Temperature of Burning Zone Based on SVR[J]. Journal of System Simulation, 2008, 20(11): 2 951-2 955)
[6]吳中如.水工建筑物安全監(jiān)控理論及其應(yīng)用[M]. 南京:河海大學(xué)出版,1990(Wu Zhongru. Safety Monitoring Theory & Its Application of Hydraulic Structures[M].Nanjing:Hohai University Press, 1990)
[7]陳偉. 遺傳算法與神經(jīng)網(wǎng)絡(luò)在大壩安全監(jiān)測中的應(yīng)用研究[D]. 西安:長安大學(xué), 2009( Chen Wei. Genetic Algorithms and Artificial Neural Networks Apply in Dam Security Monitoring[D]. Xi’an: Chang’an University, 2009)[8]朱偉,石超峰,李楠.基于遺傳算法優(yōu)化支持向量機(jī)的再生混凝土抗壓強(qiáng)度預(yù)測模型[J]. 中外公路,2014,34(1):311-314(Zhu Wei,Shi Chaofeng,Li Nan.The Recycled Concrete Compressive Strength Prediction Model Based on Support Vector Machine Optimized by Genetic Algorithm[J]. Journal of China & Foreign Highway, 2014, 34(1):311-314)
[9]吳富梅,楊元喜.基于高階AR模型的陀螺隨機(jī)漂移模型[J]. 測繪學(xué)報(bào),2007,36(4):389-394(Wu Fumei,Yang Yuanxi.Gyroscope Random Drift Model Based on the Higher-Order AR Model[J]. Acta Geodaetica et Cartographica Sinica, 2007, 36(4):389-394)
About the first author:SHEN Zhehui, postgraduate, majors in precision engineering measurement and data processing, E-mail:1280381222@qq.com.
Dam Deformation Monitoring Prediction on Support Vector Machine Optimized by Genetic Algorithm
SHENZhehui1HUANGTeng1SHENYueqian1ZHENGHao1
1School of Earth Sciences and Engineering, Hohai University, 8 West-Focheng Road, Nanjing 211100, China
A SVM model is established for predicting dam deformation, and optimizing the kernel function parameter, penalty parameter and loss function parameter through the genetic algorithm. We use this model to analyze the long period deformation monitoring data and make predications. In this paper, we compare horizontally different kernel functions of support vector machine using the same optimization method, and the same kernel function of support vector machine using different optimization methods. The results show that GA-SVM(RBF) not only can well predict the dam deformation trend, but also improves the prediction accuracy over contrasting BP neural networks, AR(p), multiple regression analysis and periodic function fitting longitudinally.
dam deformation factors;support vector machines;genetic algorithm;optimizing;prediction
College Postgraduate Research and Innovation Project of Jiangsu Province, No.KYLX15_0478.
2015-09-22
沈哲輝,碩士生,主要從事精密工程測量與數(shù)據(jù)處理研究,E-mail:1280381222@qq.com。
10.14075/j.jgg.2016.10.018
1671-5942(2016)010-0927-03
P258
A
項(xiàng)目來源:江蘇省普通高校研究生科研創(chuàng)新計(jì)劃(KYLX15_0478)。