陳 磊,王培永
(1. 浙江工業(yè)大學(xué) 土木工程學(xué)院,浙江 杭州 310023;2.柯橋排水有限公司,浙江 紹興 312030)
近年來我國城市給水管網(wǎng)系統(tǒng)平均漏損率達(dá)到15.3%,部分城市超過25%。控制漏損能夠節(jié)約大量的水資源,提高供水的安全性和可靠性。科學(xué)地預(yù)測(cè)管道漏損時(shí)間,將為系統(tǒng)的維護(hù)和更換提供決策支持,能夠一定程度減少漏損的發(fā)生率,增強(qiáng)系統(tǒng)的安全性。
張宏偉等[1]根據(jù)管網(wǎng)漏損的主要影響因素,采用線性回歸分析法建立模型,但是該方法難以反映漏損影響因素和漏損時(shí)間之間復(fù)雜的非線性關(guān)系。覃炫[2]和邵圓媛[3]分析了漏損的主要影響原因,分別采用具有較強(qiáng)非線性映射能力的BP網(wǎng)絡(luò)和改進(jìn)BP網(wǎng)絡(luò)來預(yù)測(cè)管道漏損時(shí)間,但是未提出解決網(wǎng)絡(luò)參數(shù)確定和過學(xué)習(xí)等問題的方法?;诮Y(jié)構(gòu)風(fēng)險(xiǎn)最小化的LSSVM僅需確定兩個(gè)參數(shù),并且具有比神經(jīng)網(wǎng)絡(luò)更強(qiáng)的預(yù)測(cè)性能[4-5]。針對(duì)傳統(tǒng)基于交叉驗(yàn)證的LSSVM建模耗時(shí)長的不足,筆者提出了采用全局尋優(yōu)能力較強(qiáng)的AGA優(yōu)化LSSVM參數(shù)的建模算法,以獲得更好的建模速度和預(yù)測(cè)效果。
眾多因素將對(duì)管道漏損產(chǎn)生影響,比如:管材、施工質(zhì)量、管道腐蝕、地面荷載、管徑、管道埋深和管道壓力等,但是考慮太多因素會(huì)使模型變得復(fù)雜,并且管材、施工質(zhì)量和管道腐蝕等因素很難量化。因此,主要因素取管頂覆土、管徑、管道壓力和管道所在道路等級(jí)。
目標(biāo)函數(shù)為
s.t.yi=wTφ(xi)+b+eii=1,…,N
(1)
式中:μ和ζ為參數(shù);w∈Rnf為權(quán)值;φ(·):Rm→Rnf為映射函數(shù);b為偏置;ei∈R為誤差。
構(gòu)造計(jì)算式,即
(2)
式中αi為乘子。
求偏導(dǎo),即
(3)
去掉w和e,得到
(4)
式中:y=[y1,y2…,yN]T;1v=[1,1,…,1]T;α=[α1,α2…,αN]T;I為N×N的單位陣;Ωil=φ(xi)Tφ(xl)=K(xi,xl),i,l=1,2…,N。
求出α和b,則LSSVM為
(5)
因此,LSSVM僅需確定參數(shù)σ和γ,但傳統(tǒng)基于交叉驗(yàn)證的參數(shù)優(yōu)化方法耗時(shí)較長。
引入全局尋優(yōu)能力較強(qiáng)的AGA[6]優(yōu)化參數(shù),具體過程為
1) 編碼。σ,γ的取值范圍[7]為[0.01,50],各取12 位二進(jìn)制,個(gè)體長度為24 位。
2) 選擇。采用輪盤賭法選擇個(gè)體。
3) 自適應(yīng)交叉和變異。交叉采用兩點(diǎn)法。對(duì)于每對(duì)個(gè)體,從(0, 1)范圍中隨機(jī)產(chǎn)生一個(gè)數(shù):若該數(shù)小于交叉率Pc時(shí),每對(duì)個(gè)體隨機(jī)選兩個(gè)點(diǎn),交叉互換后獲得兩個(gè)新個(gè)體;當(dāng)該數(shù)大于Pc時(shí),則不執(zhí)行交叉。交叉率為
(6)
式中:f′為兩個(gè)體適應(yīng)值中的較大值;favg為每代的平均適應(yīng)值;fmax為每代的最大適應(yīng)值。變異采用單點(diǎn)法。對(duì)于每個(gè)個(gè)體,從(0,1)范圍內(nèi)隨機(jī)產(chǎn)生一個(gè)數(shù),若該數(shù)小于變異率Pm,則在個(gè)體中隨機(jī)選一位數(shù)變異,將1變成0,或者0變成1;否則不變異。變異率為
(7)
式中f為變異個(gè)體的適應(yīng)值。
4) 保留較優(yōu)個(gè)體。父代一半數(shù)目的適應(yīng)值較小個(gè)體將由子代適應(yīng)值較大個(gè)體所替代。
某縣給水干管一般采用球墨鑄鐵管和鋼管,其中球墨鑄鐵管漏損數(shù)據(jù)較齊全,共有數(shù)據(jù)26 組,因此僅針對(duì)球墨鑄鐵管進(jìn)行預(yù)測(cè)。
將前21 組數(shù)據(jù)等分成3 份,以每個(gè)解碼后的個(gè)體為LSSVM的參數(shù),采用3 折交叉驗(yàn)證計(jì)算個(gè)體的適應(yīng)值(即在利用2 份數(shù)據(jù)訓(xùn)練LSSVM后,預(yù)測(cè)剩下的1 份數(shù)據(jù),選取1 份不同數(shù)據(jù)進(jìn)行預(yù)測(cè),得到3 次預(yù)測(cè)結(jié)果),其計(jì)算式為
(8)
式中:yij為第i次預(yù)測(cè)中第j組數(shù)據(jù)對(duì)應(yīng)的實(shí)際漏損時(shí)間;Fij為第i次預(yù)測(cè)中LSSVM對(duì)第j組輸入數(shù)據(jù)的預(yù)測(cè)結(jié)果。
建模及預(yù)測(cè)的過程如下:
1) 采用歸一化的方法預(yù)處理訓(xùn)練數(shù)據(jù)、預(yù)測(cè)的輸入數(shù)據(jù),并且反預(yù)處理預(yù)測(cè)結(jié)果。
2) 最大進(jìn)化代數(shù)Gmax取100,進(jìn)化代數(shù)G取1。隨機(jī)生成并解碼200 個(gè)父代個(gè)體,得到200 組(σ,γ),根據(jù)式(8)計(jì)算各個(gè)體的適應(yīng)值。
3) 若G等于Gmax+1,轉(zhuǎn)到步驟5);若否,則判斷G是否等于1:若是,轉(zhuǎn)到步驟4),若否,解碼,計(jì)算個(gè)體適應(yīng)值,并用100 個(gè)子代較優(yōu)個(gè)體替代父代較差個(gè)體,構(gòu)成新父代。
4) 對(duì)父代執(zhí)行選擇、交叉和變異,得到子代,G=G+1,轉(zhuǎn)步驟3)。
5) 以適應(yīng)值最大個(gè)體對(duì)應(yīng)的參數(shù)為LSSVM模型的最優(yōu)參數(shù),用21 組數(shù)據(jù)訓(xùn)練該模型,模型對(duì)26 組數(shù)據(jù)中最后5 組輸入數(shù)據(jù)(需歸一化)進(jìn)行預(yù)測(cè),反預(yù)處理后,得到實(shí)際預(yù)測(cè)值。
為了驗(yàn)證AGA的優(yōu)化能力,在配置為CPU Intel Core2 Duo E7 400 2.8 G,2 G DDR的筆記本上進(jìn)行10 次測(cè)試,該算法每次都能搜索到如圖1所示的最優(yōu)解,搜索到最優(yōu)解的最短時(shí)間為412 s,最長時(shí)間為465 s,平均時(shí)間為433 s。最短時(shí)間獲得最優(yōu)解的最大適應(yīng)值和平均適應(yīng)值的變化曲線分別見圖1,2(其他測(cè)試的結(jié)果與兩圖類似),計(jì)算得到的最優(yōu)個(gè)體為(11.417,9.404),基于AGA-LSSVM模型(模型1)的預(yù)測(cè)結(jié)果詳見表1。
圖1 最大適應(yīng)值變化曲線Fig.1 Curve of maximum fitness values
表1 兩模型預(yù)測(cè)值和實(shí)際值的對(duì)比Table 1 Comparison of the prediction values and the actual values between two models
由圖1可知:AGA具有較強(qiáng)的全局尋優(yōu)能力,能夠在進(jìn)化中迅速脫離局部最優(yōu),搜索到更優(yōu)個(gè)體,同時(shí)也具有較快的收斂速度,在第21代已找到最優(yōu)解。由圖2可知:46 代后種群的平均適應(yīng)值變化很小,表明個(gè)體基本不變,種群進(jìn)化已基本結(jié)束。
圖2 平均適應(yīng)值變化曲線Fig.2 Curve of average fitness values
為了進(jìn)一步驗(yàn)證AGA的優(yōu)化性能,將其與網(wǎng)格交叉驗(yàn)證法進(jìn)行對(duì)比。交叉驗(yàn)證中,σ和γ的范圍也取[0.01, 50]。網(wǎng)格劃分方法:先對(duì)區(qū)間內(nèi)的σ和γ粗劃網(wǎng)格,各取{0.01,0.025,0.05,0.075,0.1,0.25,0.5,0.75,1,1.5,2,2.5,3,…,49,49.5,50},網(wǎng)格點(diǎn)一共有107×107 個(gè),采用3 折交叉驗(yàn)證計(jì)算各點(diǎn)的適應(yīng)值(數(shù)據(jù)和計(jì)算方法與AGA優(yōu)化相同),然后以適應(yīng)值最大的網(wǎng)格點(diǎn)為中心細(xì)分網(wǎng)格,共得到網(wǎng)格點(diǎn)201×201 個(gè),優(yōu)化后得到最優(yōu)點(diǎn)為(3.17, 4.32),耗時(shí)875 s。采用相同的21 組數(shù)據(jù)訓(xùn)練模型后,得到表1所示的基于交叉驗(yàn)證LSSVM模型(模型2)的預(yù)測(cè)結(jié)果。
綜上,無論是對(duì)于優(yōu)化時(shí)間、單個(gè)預(yù)測(cè)結(jié)果還是平均預(yù)測(cè)結(jié)果,基于AGA-LSSVM模型都全面優(yōu)于基于交叉驗(yàn)證LSSVM模型。采用傳統(tǒng)的網(wǎng)格交叉驗(yàn)證法優(yōu)化LSSVM的參數(shù),不僅耗時(shí),而且優(yōu)化結(jié)果很大程度取決于如何劃分網(wǎng)格。而采用全局尋優(yōu)能力較強(qiáng)的AGA優(yōu)化LSSVM的參數(shù),不僅縮短了建模時(shí)間,而且獲得更高的預(yù)測(cè)精度。
筆者利用AGA優(yōu)化LSSVM參數(shù),建立了基于AGA-LSSVM管道初次漏損時(shí)間預(yù)測(cè)模型。實(shí)例分析結(jié)果驗(yàn)證AGA具有更強(qiáng)的全局尋優(yōu)能力,能夠迅速找到LSSVM模型的最優(yōu)參數(shù),顯著地提高了建模速度,并且基于最優(yōu)參數(shù)的LSSVM模型通過對(duì)訓(xùn)練數(shù)據(jù)的深入學(xué)習(xí),精確掌握了主要影響因素與漏損時(shí)間之間的復(fù)雜非線性關(guān)系,能夠?qū)ο嗤懿墓艿赖某醮温p時(shí)間進(jìn)行高精度預(yù)測(cè)。