張建鋒,劉見寶,崔樹軍,謝玉華
(河南工程學(xué)院 a.資源與環(huán)境學(xué)院;b.鄭州市礦山環(huán)境地質(zhì)災(zāi)害與防治重點實驗室;c.煤礦環(huán)境地質(zhì)災(zāi)害防治河南省高校工程技術(shù)研究中心,鄭州 451191)
?
小波-神經(jīng)網(wǎng)絡(luò)混合模型預(yù)測地下水水位
張建鋒a,b,c,劉見寶a,c,崔樹軍a,b,c,謝玉華a
(河南工程學(xué)院 a.資源與環(huán)境學(xué)院;b.鄭州市礦山環(huán)境地質(zhì)災(zāi)害與防治重點實驗室;c.煤礦環(huán)境地質(zhì)災(zāi)害防治河南省高校工程技術(shù)研究中心,鄭州451191)
由于過量開采地下水,華北平原的許多城市出現(xiàn)地下水水位持續(xù)下降趨勢,由此導(dǎo)致了許多嚴(yán)重的環(huán)境問題,如地下水枯竭、地面沉降和海水入侵等。為了準(zhǔn)確預(yù)測城市地下水水位變化,利用小波變換的多尺度分析特征,建立了小波-神經(jīng)網(wǎng)絡(luò)混合模型(以下簡稱“混合模型”),并研究了其在地下水水位預(yù)測中的精度。利用北京市平谷區(qū)地下水水位觀測資料,分別用BP網(wǎng)絡(luò)和混合模型對該區(qū)地下水水位進(jìn)行了預(yù)測。采用均方根誤差(RMSE)、平均絕對誤差(MAE)和線性相關(guān)系數(shù)(R)對模型預(yù)測的精度進(jìn)行度量。預(yù)測結(jié)果表明:混合模型第1至第3個月的地下水水位平均絕對誤差分別是0.535,0.598和0.634 m;而BP模型的平均絕對誤差分別為0.566,0.824和0.940 m。混合模型的預(yù)測誤差分別為BP模型的95%,73%和67%。使用混合模型能明顯提高預(yù)測的精度,顯著增加有效預(yù)測時段長度。
華北平原;過量開采;地下水水位;離散小波變換;人工神經(jīng)網(wǎng)絡(luò);預(yù)測
北京市是一個嚴(yán)重缺水的城市,1999年人均水資源占有量不足400 m3,是全國人均占有量的1/6,且自20世紀(jì)70年代以來,北京市地下水開采一直呈上升趨勢,地下水水位出現(xiàn)趨勢性下降[1]。隨著地下水的超采以及地下水水位大幅下降,北京地區(qū)發(fā)生地面沉降的區(qū)域在逐漸擴大,累積沉降量也在不斷增加[2]。隨著北京市人口數(shù)量的膨脹和經(jīng)濟的快速發(fā)展,水資源的需求急劇增加。為了滿足生產(chǎn)生活以及社會發(fā)展的用水需要,在北京地下水補給性能較好的地區(qū)開辟了北京應(yīng)急水源地,其中平谷就是其中一個。這些水源地對緩解北京市水資源的緊缺起到了非常積極的作用,但是,自2005年投入使用至今,隨著大量持續(xù)開采,平谷區(qū)的地下水水位出現(xiàn)了明顯的下降,水位下降最多達(dá)10 m。因此,在水資源供需矛盾緊張的大背景下,準(zhǔn)確預(yù)測水源地地下水水位的變化,對北京市水資源的管理意義重大。
預(yù)測地下水水位時,物理模型通常是刻畫含水系統(tǒng)和理解其物理過程的主要手段[3],但在實際應(yīng)用中,該方法需要大量的觀測資料和相關(guān)水文地質(zhì)參數(shù),而且這些資料往往不能滿足要求。在資料不完備的情況下,采用這種物理模型對地下水動態(tài)進(jìn)行精確預(yù)測是非常困難的,此時就需要尋找其它替代方案。另一個選擇是采用隨機模擬的方法,這種方法是利用有限長度的時間序列,通過建立數(shù)學(xué)模型來對地下水動態(tài)進(jìn)行預(yù)測。時間序列模型是經(jīng)常使用的隨機方法之一[4],但是這種模型的主要缺點是,當(dāng)含水系統(tǒng)的水動力條件發(fā)生變化時,已經(jīng)建立的模型將不再適用[5],它僅對穩(wěn)定觀測序列的模擬是有效的,而無法適應(yīng)非穩(wěn)定變量的觀測序列。
最近研究表明,人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN),尤其是前饋網(wǎng)絡(luò),可以成功地應(yīng)用于水資源變量的模擬和預(yù)測。神經(jīng)網(wǎng)絡(luò)的主要優(yōu)勢之一是它能夠模擬非線性系統(tǒng),可以定量表示變量間復(fù)雜的函數(shù)關(guān)系。水文地質(zhì)變量間通常具有復(fù)雜的非線性關(guān)系,神經(jīng)網(wǎng)絡(luò)可以在沒有任何假設(shè)的條件下來模擬這種非線性動力系統(tǒng)。在水文地質(zhì)應(yīng)用中,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)應(yīng)用于水文地質(zhì)參數(shù)分布的刻畫、砂質(zhì)土壤的水分特征曲線的預(yù)測及含水系統(tǒng)相關(guān)參數(shù)的估算等。而小波分析具有很好的時頻定位功能,能夠很好地分析非穩(wěn)定時間序列的特征,被廣泛地用來分析時間序列的頻率成分、趨勢和波動特征等。本文在人工神經(jīng)網(wǎng)絡(luò)和小波分析的基礎(chǔ)上,針對北京市平谷水源地,在地下水水位觀測數(shù)據(jù)較少的條件下,建立小波-神經(jīng)網(wǎng)絡(luò)混合預(yù)測模型,與神經(jīng)網(wǎng)絡(luò)預(yù)測模型對比,考察混合模型的預(yù)測精度。
平谷區(qū)位于北京市西北部,是北京重要水源地之一。本文使用了平谷區(qū)水務(wù)局的實測月平均地下水水位資料,觀測孔(914號孔)位于平谷區(qū)西北部西嶼水庫下游約8 km的泃錯河岸。水位觀測時間為2000年1月至2005年12月,共6 a(72個月)月平均水位;其中,2000—2004年共60個月水位資料用來訓(xùn)練神經(jīng)網(wǎng)絡(luò),2005年共12個月資料用來驗證該網(wǎng)絡(luò)。
誤差反向傳播(Back Propagation,BP)前饋網(wǎng)絡(luò)是前饋網(wǎng)絡(luò)的核心,體現(xiàn)了人工神經(jīng)網(wǎng)絡(luò)最精華的部分,目前,約90%的人工神經(jīng)網(wǎng)絡(luò)模型是采用BP網(wǎng)絡(luò)或者它的變形形式。神經(jīng)網(wǎng)絡(luò)由輸入層、隱層和輸出層組成,每一層都有一定數(shù)量的節(jié)點,不同層的節(jié)點和節(jié)點之間用傳輸函數(shù)連接,同一層的節(jié)點之間沒有信息交換(圖1)。理論證明,3層的前饋網(wǎng)絡(luò)就能以任意精度擬合任何一個函數(shù),因此,本文就采用3層前饋網(wǎng)絡(luò)。隱層和輸出層的傳輸函數(shù)分別取常用的如式(1)所示的雙曲線正切S形函數(shù)和如式(2)所示的線性函數(shù),其中x和y分別代表函數(shù)的輸入和輸出。
(1)
(2)
圖1 BP神經(jīng)網(wǎng)絡(luò)Fig.1 BP artificial neural network
網(wǎng)絡(luò)的初始權(quán)值和閾值在[-1,1]范圍內(nèi)隨機選擇。為了確定模型的參數(shù),在網(wǎng)絡(luò)訓(xùn)練時使用在實踐中具有較好效果的Levenberg-Marquardt算法[6]。
連續(xù)小波變換定義為
(3)
(4)
圖2 離散小波分解Fig.2 Discrete wavelet decomposition
經(jīng)過離散小波變換后,函數(shù)f(t)可以視為經(jīng)過了一個高通濾波器和一個低通濾波器(圖2),從而被分解為不同尺度上的高頻成分(細(xì)節(jié)分量cDi)和低頻成分(趨勢分量cAi)。本文中,就是利用式(4)將時間序列分解為幾個不同尺度上的分量。
小波-神經(jīng)網(wǎng)絡(luò)混合模型(Wavelet-ANN)綜合了離散小波變換和神經(jīng)網(wǎng)絡(luò)2種方法,它將小波變換得到的子序列(cDi和cAi)作為神經(jīng)網(wǎng)絡(luò)的輸入,混合模型的結(jié)構(gòu)見圖3。作為混合模型的輸入,首先需要利用離散平穩(wěn)小波變換[8]將原水位時間序列y(t)進(jìn)行一定尺度的分解,經(jīng)分解后的各子序列代表了原序列中不同因素影響下的組分;然后將對原序列影響明顯的成分(即有效成分)作為神經(jīng)網(wǎng)絡(luò)的輸入,輸出預(yù)測的地下水水位值。
圖3 小波-神經(jīng)網(wǎng)絡(luò)混合模型結(jié)構(gòu)Fig.3 Structure of Wavelet-ANN hybrid model
(5)
(6)
(7)
本次研究中,將原水位序列進(jìn)行3層分解,得到細(xì)節(jié)分量cD1,cD2,cD3和趨勢分量cA3(見圖4),這些子序列與原始序列y(t)的相關(guān)性見表1,其中,yt+1,yt+2和yt+3分別代表t+1,t+2和t+3時刻的地下水水位。
相關(guān)性分析表明,cD1和cD2與原始水位序列的相關(guān)性很差,平均相關(guān)性都<0.1;而細(xì)節(jié)分量cD3和趨勢分量cA3與原序列均具有一定的相關(guān)性,被確定為有效成分,作為BP網(wǎng)絡(luò)的輸入。BP網(wǎng)絡(luò)和小波-BP混合預(yù)測模型的輸入均為y(t-1),y(t-2)和y(t-3),輸出分別為y(t),y(t+1)和y(t+2),即前3個月的水位值分別預(yù)測未來第1、第2和第3個月的水位值,依次遞推,直到第12個月。
BP模型和小波-BP兩種模型的預(yù)測精度分別見表2。對于BP預(yù)測模型,模型預(yù)測第1個月的地下水水位值具有較高的精度,平均絕對誤差(MAE)為0.566 m,與實測值的線性相關(guān)系數(shù)達(dá)到0.845,表現(xiàn)了預(yù)測值與實測值的良好擬合效果。但是隨著預(yù)測時間的增加,模型預(yù)測精度明顯降低,與第1個月預(yù)測值相比,第2個月的精度降低約45%,第3個月降低約66%。
表1 地下水位原始序列與分量的相關(guān)性
表2 不同模型的預(yù)測精度
圖5 不同模型的預(yù)測值-實測值散點圖Fig.5 Scatter diagrams of predicted and measured values in different models
小波-BP混合模型第1個月的預(yù)測精度略高于BP模型,平均絕對誤差為0.535 m,與實測值的線性相關(guān)系數(shù)達(dá)到0.885,預(yù)測值與實測值的擬合效果更好。與BP模型不同,隨著預(yù)測時間的增加,混合模型的預(yù)測精度變化很小,第2、第3個月的預(yù)測值精度遠(yuǎn)遠(yuǎn)高于BP模型,它們的平均絕對誤差僅分別為0.598 m和0.634 m,精度降低幅度分別為約11%和18%。因此,無論是預(yù)測的平均絕對誤差還是預(yù)測精度的降低幅度,混合模型都顯著優(yōu)于BP模型。
為了更詳細(xì)考察2種預(yù)測模型的預(yù)測精度,現(xiàn)分別畫出它們的預(yù)測值和實測值的散點圖,如圖5所示,其中,實線表示零誤差線。另外,散點圖可以清晰地表現(xiàn)出不同取值范圍內(nèi)預(yù)測值的分布特征。BP模型未來第1至第3個月預(yù)測值均存在這樣一個特點(圖5(a)): 在低值區(qū)間,預(yù)測值一般會大于實測值,而在高值區(qū),預(yù)測值又往往小于實測值。在高值區(qū)的幾個點上,未來第1至第3個月預(yù)測值均分布在一個較小的相同區(qū)域內(nèi),說明BP模型對于高水位時期的預(yù)測精度相對穩(wěn)定。但是,在較低水位區(qū)間,模型的預(yù)測精度波動很大,隨著預(yù)測時間的增加,有越來越多的點遠(yuǎn)離零誤差線。與BP模型相似,小波-BP混合模型的預(yù)測值也截然劃分為高、低值區(qū)2部分(圖5(b))。但是,混合模型在低值區(qū)較均勻地分布在零誤差線上下,且第1至第3個月的預(yù)測值有更多的點接近零誤差線,表現(xiàn)了更小的預(yù)測誤差。在高值區(qū),混合模型雖然也有低估水位值的特征,但是誤差要明顯小于BP模型;另外,在此區(qū)間,第2個月的預(yù)測值要明顯優(yōu)于其它2個月。
本文在人工神經(jīng)網(wǎng)絡(luò)和小波分析的基礎(chǔ)上建立了混合模型。經(jīng)過對比發(fā)現(xiàn),混合模型的預(yù)測精度明顯提高;一定精度條件下,混合模型具有更長的預(yù)測時間。因此,在缺少水文地質(zhì)參數(shù)的情況下,小波-神經(jīng)網(wǎng)絡(luò)混合模型是一種具有較高精度的地下水水位預(yù)測方法。
[1]陳培鈞,呂曉儉,謝振華.北京地下水資源與首都持續(xù)發(fā)展[J].北京地質(zhì),1999,(4):1-6.
[2]賀國平,周東,楊忠山,等.北京市平原區(qū)地下水資源開采現(xiàn)狀及評價[J].水文地質(zhì)工程地質(zhì),2005,32(2):45-48.
[3]邢譯心,鮑新華,吳永東,等.基于Visual MODFLOW的尚志市水源地地下水資源預(yù)測與開采利用[J].水電能源科學(xué),2015,33(2):42-45,59.
[4]何薪基,李光輝,任德記.牛頓優(yōu)化法在地下水位曲線擬合中的應(yīng)用[J].長江科學(xué)院院報,1997,14(2):57-59.
[5]BIERKENS M F P.Modeling Water Table Fluctuations by Means of a Stochastic Differential Equation[J].Water Resources Research,1998,34(10):2485-2499.
[6]ANTONIADIS A,OPPENHEIM G.Wavelets and Statistics[M].New York:Springer-Verlag New York,Inc.,1995:281-299.
[7]KARUNANITHI N,GRENNEY W J,WHITLEY D,et al.Neural Networks for River Flow Prediction[J].Journal of Computing in Civil Engineering,1994,8(2):201-220.
[8]張建鋒,崔樹軍,李國敏.常用小波及其時-頻特性[J].地學(xué)前緣,2012, 19(6):248-253.
(編輯:占學(xué)軍)
A Wavelet-ANN Hybrid Model for Groundwater Level Forecasting
ZHANG Jian-feng1,2,3,LIU Jian-bao1,3,CUI Shu-jun1,2,3,XIE Yu-hua1
(1.School of Resources and Environmental Engineering,Henan University of Engineering,Zhengzhou451191, China; 2.Zhengzhou Key Laboratory of Geological Hazard and Prevention of Mine,Zhengzhou451191,China; 3.Research Center of Engineering and Technology for Henan College Geological Hazard and Prevention of Coal Mine,Zhengzhou451191,China)
Due to over-exploitation of groundwater in many cities of North China Plain,there is a tendency of lasting decrease in groundwater level,which results in serious problems,such as groundwater exhaustion,land subsidence and seawater intrusion.In order to accurately predict changes of urban groundwater level,based on artificial neural network (ANN)and analysis of multi-scale of wavelet transform (WT),we established a wavelet-ANN conjugate model and test its accuracy to predict groundwater level.Measured data of groundwater level at Pinggu district of Beijing were taken as research objects.We predicted groundwater levels at the district by back propagation (BP)model and hybrid model.Then,we calculated the prediction accuracy by using statistical parameters including root mean square error (RMSE),mean absolute error (MAE)and correlation coefficient (R).Results showed that the MAE of the hybrid model from the first month to the third month was 0.535,0.598 and 0.634 m,respectively,whereas 0.566,0.824 and 0.940 m for BP model.The MAE of hybrid model from the first month to the third month was 95%,73% and 67% of that of BP model,respectively.Comparison of results reveals that the hybrid model has advantages of better prediction accuracy and longer effective prediction duration.
North China Plain; over-exploitation; groundwater level; discrete wavelet transform; artificial neural network; forecasting
2015-06-04;
2015-08-10
國家自然基金青年基金項目(41206037);河南省教育廳科技攻關(guān)項目(14B170011);鄭州市科技發(fā)展計劃項目(131PPTGG414-7);河南工程學(xué)院博士基金項目(D2012004)
張建鋒(1979-),男 ,河南許昌人,副教授,博士,主要從事應(yīng)用地球物理和水文地質(zhì)方面的研究,(電話)0371-62508218(電子信箱)zjfldp@haue.edu.cn。
10.11988/ckyyb.201504742016,33(08):18-21
P641.8
A
1001-5485(2016)08-0018-04