張志博
(廣西大學(xué)土木建筑工程學(xué)院,廣西 南寧 530004)
水資源是國家穩(wěn)定、社會(huì)發(fā)展、人民幸福的重要基礎(chǔ)。隨著中國深化改革的推進(jìn),國民經(jīng)濟(jì)總產(chǎn)值得到進(jìn)一步的提高,水資源的供需矛盾日益顯著,水資源合理配置顯得尤為重要[1]。在水資源配置的研究中,區(qū)域需水量預(yù)測是重要的前提,所以合理有效的需水量預(yù)測是區(qū)域水資源規(guī)劃的首要任務(wù)。目前國內(nèi)外采用的需水量預(yù)測方法比較多[2],主要包括單一方法和組合方法,單一方法分為傳統(tǒng)的預(yù)測方法和新型預(yù)測方法。傳統(tǒng)的預(yù)測方法有定額法[3]、線性回歸、多元回歸[4]、趨勢預(yù)測法[5]等,新型預(yù)測方法有神經(jīng)網(wǎng)絡(luò)法[6]、灰色預(yù)測法[7]等。單一預(yù)測方法和組合預(yù)測方法得出的需水量預(yù)測結(jié)果都是確定性,不能準(zhǔn)確預(yù)測未來時(shí)段用水量的波動(dòng)性,在實(shí)際供用水過程中會(huì)出現(xiàn)很多影響預(yù)測結(jié)果的不確定性因素,而區(qū)間預(yù)測能夠很好地反映需水量預(yù)測結(jié)果的不確定性[8]。本文在BP預(yù)測模型的基礎(chǔ)上,引入正態(tài)分布區(qū)間估計(jì)方法,以期更加準(zhǔn)確的描述未來柳州市不同時(shí)段需水量的不確定性。
柳州市位于廣西中部偏東北,全市包括五區(qū)五縣,即城中區(qū)、魚峰區(qū)、柳南區(qū)、柳北區(qū)、柳江區(qū)五區(qū),柳城、三江、融安、融水、鹿寨五縣,國土面積18 592 km2。年平均降雨量在1 500~1 600 mm,全年降雨時(shí)空分布不均,在5—8月份降雨較多,地表水是其主要的供水水源。根據(jù)柳州市統(tǒng)計(jì)局統(tǒng)計(jì),柳州市供水量基本維持在23億m3,供水量年際有一定的變化,主要是受降雨量、供水工程調(diào)蓄能力影響。供水結(jié)構(gòu)變化不大,以地表水供水為主。
BP神經(jīng)網(wǎng)絡(luò)[9]是一種應(yīng)用領(lǐng)域廣泛的預(yù)測模型,它通過模擬訓(xùn)練得到輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的關(guān)系,再通過輸入新的數(shù)據(jù)得出模擬預(yù)測結(jié)果,是一種新型智能預(yù)測方法。它的學(xué)習(xí)過程主要包括以下4個(gè)部分,輸入模式順傳播、輸出誤差逆?zhèn)鞑?、循環(huán)記憶訓(xùn)練、學(xué)習(xí)結(jié)果判別[10]。一般情況下,需水預(yù)測應(yīng)用最多的三層BP神經(jīng)網(wǎng)絡(luò),它包括輸入層、隱含層和輸出層3部分[11]。在MATLAB運(yùn)行環(huán)境下,三層BP神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建步驟如下。
a)數(shù)據(jù)的預(yù)處理。如果BP神經(jīng)網(wǎng)絡(luò)輸入、輸出數(shù)據(jù)范圍特別大,會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)收斂速度慢、訓(xùn)練時(shí)間長。因此,在訓(xùn)練神經(jīng)網(wǎng)絡(luò)前需要對原始數(shù)據(jù)進(jìn)行歸一化處理,使得數(shù)據(jù)映射到[0,1]或[-1,1]或更小的范圍。本文選用premnmx函數(shù)對原始數(shù)據(jù)進(jìn)行歸一化處理,使得歸一化后的數(shù)據(jù)映射到[-1,1]。
b)隱含層結(jié)點(diǎn)數(shù)的確定。隱含層結(jié)點(diǎn)數(shù)對BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練效果有很大的影響,如果隱含層結(jié)點(diǎn)數(shù)過多,會(huì)導(dǎo)致網(wǎng)絡(luò)訓(xùn)練過慢且易陷入局部最優(yōu)。若隱含層結(jié)點(diǎn)數(shù)過少,則會(huì)導(dǎo)致網(wǎng)絡(luò)學(xué)習(xí)能力不足、無法實(shí)現(xiàn)輸入和輸出變量的映射關(guān)系[12]。隱含層結(jié)點(diǎn)數(shù)通常按式(1)確定:
(1)
式中n——輸入層節(jié)點(diǎn)數(shù);h——隱含層節(jié)點(diǎn)數(shù);m——輸出層節(jié)點(diǎn)數(shù);a——0~10的常數(shù)。
本文的輸入層結(jié)點(diǎn)數(shù)為5,輸出層結(jié)點(diǎn)數(shù)為1,取a=9,則代入式(1)得隱含層結(jié)點(diǎn)數(shù)h=11。
c)創(chuàng)建新的前向神經(jīng)網(wǎng)絡(luò)。本文選擇輸入層激活函數(shù)為“tansig”、輸出層激活函數(shù)為“purelin”,構(gòu)造了一個(gè)3層BP神經(jīng)網(wǎng)絡(luò)對需水量進(jìn)行預(yù)測。采用梯度自動(dòng)下降動(dòng)量和自適應(yīng)lr算法“traingdx”訓(xùn)練BP網(wǎng)絡(luò),目標(biāo)誤差goal=10-3,學(xué)習(xí)率lr=0.035,最大迭代次數(shù)epochs=2000。函數(shù)構(gòu)造語句如下:
net=newff(minmax(P),[11,1],{‘tansig’,‘purelin’},‘traingdx’);
net.trainParam.show=50;
net.trainParam.lr=0.035;
net.trainParam.epochs=2000;
net.trainParam.goal=1e-3;
d)BP網(wǎng)絡(luò)訓(xùn)練及仿真。調(diào)用TRAINGDM算法訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),并對BP網(wǎng)絡(luò)進(jìn)行仿真,其算法語句如下:
[net,tr]=train(net,P,T);
A=sim(net,P);
a=postmnmx(A,mint,maxt);
(2)
(3)
(4)
可得μ的置信度為1-α的置信區(qū)間[14]為:
(5)
根據(jù)《柳州市水資源公報(bào)》和《柳州市統(tǒng)計(jì)年鑒》統(tǒng)計(jì),柳州市的用水量主要集中在農(nóng)業(yè)、居民生活、工業(yè)等,本文初步選取7個(gè)因子作為柳州市需水量的影響因子,分別是柳州市常住人口、國內(nèi)生產(chǎn)總值、工業(yè)生產(chǎn)總值、農(nóng)業(yè)生產(chǎn)總值、固定資產(chǎn)投資、有效灌溉面積、播種面積(表1)。通過SPSS軟件相關(guān)性分析得出這7個(gè)影響因子對用水量指標(biāo)都有一定的影響(表2)。通過表3成分貢獻(xiàn)率可以發(fā)現(xiàn),前5個(gè)因子累計(jì)貢獻(xiàn)率達(dá)到99.924%。一般情況下,因子累計(jì)貢獻(xiàn)率達(dá)90%就很好的代表相關(guān)因子的影響。由表4的因子荷載矩陣可以看出常住人口、國內(nèi)生產(chǎn)總值、工業(yè)生產(chǎn)總值、農(nóng)業(yè)生產(chǎn)總值、固定資產(chǎn)投資對第一主成分的相關(guān)系數(shù)都達(dá)到了0.95以上,所以選擇這5個(gè)影響因子作為主成分,并以此構(gòu)造BP模型的輸入樣本。
表1 柳州市統(tǒng)計(jì)數(shù)據(jù)
表2 各影響因子的相關(guān)系數(shù)矩陣
表3 主成分特征值和貢獻(xiàn)率
表4 主要因子的荷載矩陣
運(yùn)用SPSS軟件對常住人口、國內(nèi)生產(chǎn)總值、工業(yè)生產(chǎn)總值、農(nóng)業(yè)生產(chǎn)總值、固定資產(chǎn)投資與年份進(jìn)行相關(guān)性分析,結(jié)果見表5??梢园l(fā)現(xiàn),常住人口、國內(nèi)生產(chǎn)總值、工業(yè)生產(chǎn)總值、農(nóng)業(yè)生產(chǎn)總值、固定資產(chǎn)投資均與年份的相關(guān)系數(shù)分別為0.999、0.997、0.978、0.985、0.991,都接近于1,顯著性P值都小于0.01,表明此5個(gè)因子均與年份之間存在顯著線性關(guān)系。于是,繪制5個(gè)因子與年份的散點(diǎn)圖,見圖1—5。
表5 主成分因子與年份的相關(guān)性分析結(jié)果
圖1 常住人口與年份散點(diǎn)擬合
圖2 國內(nèi)生產(chǎn)總值與年份散點(diǎn)擬合
圖3 工業(yè)生產(chǎn)總值與年份散點(diǎn)擬合
圖4 農(nóng)業(yè)生產(chǎn)總值與年份散點(diǎn)擬合
圖5 固定資產(chǎn)投資與年份散點(diǎn)擬合
由散點(diǎn)圖可以看出,各影響指標(biāo)和年份之間有良好的線性擬合關(guān)系。擬合優(yōu)度是回歸分析的決定參數(shù),可以表明自變量與因變量形成的散點(diǎn)與回歸曲線的接近程度[15]。通過SPSS回歸分析:常住人口、國內(nèi)生產(chǎn)總值、工業(yè)生產(chǎn)總值、農(nóng)業(yè)生產(chǎn)總值、固定資產(chǎn)投資在回歸模型中的擬合優(yōu)化度分別為R2=0.998、0.993、0.957、0.969、0.981,調(diào)整后擬合優(yōu)化度R2=0.997、0.993、0.953、0.966、0.979,得出回歸直線對實(shí)際值擬合效果較好。另外,由輸出變異系數(shù)表(ANOVA)可知各模型統(tǒng)計(jì)量F值分別為4 004.230、1 464.204、222.460、315.332、523.761,顯著性P值均小于0.01,表明顯著性效果很好,模型具有統(tǒng)計(jì)學(xué)意義。于是對2020、2025年數(shù)值進(jìn)行回歸預(yù)測分析,結(jié)果見表6。
表6 2020、2025年輸入層各指標(biāo)預(yù)測值
為了盡量減少樣本量少而引起的系統(tǒng)過擬合等隨機(jī)因素導(dǎo)致的誤差對預(yù)測結(jié)果的影響[15],將柳州市2007—2016年統(tǒng)計(jì)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),2017、2018年統(tǒng)計(jì)數(shù)據(jù)作為檢驗(yàn)數(shù)據(jù),檢驗(yàn)BP神經(jīng)網(wǎng)絡(luò)預(yù)測的相對誤差,并挑選相對誤差小于2%的100個(gè)BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,對2020、2025年柳州市需水量進(jìn)行預(yù)測。
由表7和圖6、7可以發(fā)現(xiàn),通過BP模型得出的預(yù)測結(jié)果滿足正態(tài)性。由于2020年預(yù)測結(jié)果的偏度為-0.069、偏度標(biāo)準(zhǔn)差為0.241,偏度值約等于0。2025年的預(yù)測結(jié)果的偏度為0.609,偏度標(biāo)準(zhǔn)差為0.241,偏度值大于0、偏度的絕對值約為其標(biāo)準(zhǔn)差2.53倍。通過查閱相關(guān)資料,偏度大于0為正偏態(tài),偏度小于0為負(fù)偏態(tài),偏度約等于0為正態(tài)。偏度的絕對值為其標(biāo)準(zhǔn)值的2~3倍,偏度大于0,則此為輕度正偏態(tài)分布,反之,偏度值小于0,為輕度負(fù)偏態(tài)分布。偏態(tài)的絕對值為其標(biāo)差的3倍以上,偏度值大于0,為中度正偏態(tài)分布,偏度值小于0,為中度負(fù)偏態(tài)分布。因此,2020年的預(yù)測結(jié)果服從正態(tài)分布,2025年的預(yù)測結(jié)果服從輕度正偏態(tài)分布。
表7 預(yù)測結(jié)果統(tǒng)計(jì)值
圖6 2020年預(yù)測結(jié)果頻率分布
圖7 2025年預(yù)測結(jié)果頻率分布
當(dāng)數(shù)據(jù)的分布服從輕度正偏態(tài)分布時(shí),可以考慮用自然數(shù)對數(shù)(ln)或以10為底的對數(shù)(lg)對其數(shù)據(jù)進(jìn)行轉(zhuǎn)化,使其數(shù)據(jù)服從正態(tài)分布,便于對數(shù)據(jù)進(jìn)行分析。但是,以10為底的對數(shù)(lg)的糾正力度較強(qiáng),2025年預(yù)測數(shù)據(jù)的偏度絕對值為其標(biāo)準(zhǔn)值的2.53倍,所以采用自然對數(shù)(ln)對其進(jìn)行轉(zhuǎn)換。轉(zhuǎn)換的SPSS語句為new_X=LN(Z),轉(zhuǎn)化后的統(tǒng)計(jì)結(jié)果為偏度為0.536,偏度的標(biāo)準(zhǔn)誤差為0.241,峰度為0.235,峰度的標(biāo)準(zhǔn)誤差為0.478。偏度的值小于1,并且轉(zhuǎn)換后的偏度值小于轉(zhuǎn)換前,在一定程度上改善偏態(tài)分布,可近似認(rèn)為轉(zhuǎn)換后2025年預(yù)測數(shù)據(jù)服從正態(tài)分布。頻率分布見圖8。
圖8 正態(tài)變換后2025年預(yù)測結(jié)果頻率分布
通過SPSS軟件對數(shù)據(jù)進(jìn)行分析,得出表8預(yù)測結(jié)果描述統(tǒng)計(jì)值。因?yàn)槌槿〉?00組2020、2025年預(yù)測結(jié)果服從正態(tài)分布,根據(jù)統(tǒng)計(jì)學(xué)以樣本估計(jì)總體知識可知,2020、2025年BP模型預(yù)測結(jié)果服從正態(tài)分布。根據(jù)正態(tài)分布總體均值區(qū)間估計(jì)方法可得:在置信度95%的情況下,柳州市2020、2025年需水量預(yù)測結(jié)果分別為21.478億~21.622億m3、21.813億~22.023億m3。
表8 預(yù)測結(jié)果描述統(tǒng)計(jì)
與傳統(tǒng)的預(yù)測模型相比,本文將確定性方法與不確定性方法相結(jié)合,在滿足預(yù)測方法相對誤差小于2%的前提下,提取100個(gè)抽樣預(yù)測結(jié)果,通過SPSS頻率分布描述統(tǒng)計(jì),發(fā)現(xiàn)預(yù)測結(jié)果服從一定的正態(tài)分布。結(jié)合正態(tài)分布的區(qū)間估計(jì),得出在置信水平95%的情況下2020、2025年柳州市需水量預(yù)測結(jié)果分別為21.478億~21.622億m3、21.813億~22.023億m3。