常浩娟,劉衛(wèi)國,吳 瓊
(1.石河子大學信息科學與技術學院,新疆 石河子 832000;2. 新疆兵團勘測設計院一分院,新疆 石河子 832000)
水資源是人類賴以生存的前提,也是社會和經(jīng)濟發(fā)展的命脈。隨著人口的增長,經(jīng)濟的快速發(fā)展,需水量越來越大,然而由于水資源總量的限制以及科學技術水平的局限,全球水資源供需已經(jīng)嚴重不平衡,水資源短缺問題日益加劇。有效提高水資源的利用效率,合理配置和使用水資源,有助于緩解水資源短缺,保護生態(tài)環(huán)境,促進社會可持續(xù)發(fā)展。
瑪納斯河流域位于新疆天山北坡經(jīng)濟技術開發(fā)區(qū)核心地帶,行政區(qū)劃涵蓋昌吉回族自治州的瑪納斯縣、塔城地區(qū)的沙灣縣、石河子市、兵團第八師及所屬的14個農(nóng)牧團場、克拉瑪依市的小拐鄉(xiāng)、六師的新湖總場及流域內(nèi)的工礦企業(yè),流域總面積為2.655 萬km2,是我國第四大灌區(qū)。流域可用水資源量約30 億m3(地表水、地下水和泉水),是天山北坡綠洲灌區(qū)的重要水源。瑪納斯河流域各地區(qū)在2000年以前只有石河子市的工業(yè)有一定的發(fā)展,其他地區(qū)二三產(chǎn)業(yè)發(fā)展嚴重滯后。隨著西部大開發(fā)、天山北坡經(jīng)濟帶等多項政策的陸續(xù)出臺和實施,近年來流域二三產(chǎn)業(yè)發(fā)展較快,城鎮(zhèn)化進程加速,流域人口密度增高。隨著人口、經(jīng)濟和社會的發(fā)展,生態(tài)環(huán)境的建設和改善等,流域水資源的需求也急劇增加。對于干旱地區(qū)來說,可用水量限制性極強,導致瑪納斯河流域用水矛盾日益突出。
水資源問題長期得到學者和社會的廣泛關注,區(qū)域水資源的需求研究較多。常見的需水量分析方法一般為線性回歸、主成分分析和系統(tǒng)方法等[1,2],隨著人工智能的發(fā)展,學者們[3-8]越來越多的利用神經(jīng)網(wǎng)絡、小波分析、蟻群算法和支持向量機等多種方法結合對部分區(qū)域或部門需水量進行預測和分析。水資源需求影響因素較多,包括經(jīng)濟、社會、氣候變化等多方面,內(nèi)部機理復雜,常規(guī)分析方法不能夠滿足對需水量精確預測要求;智能算法或算法的結合使用可以有效地反映用水體系的復雜性和內(nèi)部灰色關聯(lián)性等,達到較好的需水預測效果。
現(xiàn)有文獻的理論和方法為本文研究的開展提供了參考,目前大多研究還限于方法的探討和改進,缺少流域需水的系統(tǒng)研究,需水因素的分析,以及應對需水急劇增加引起的缺水措施等。本文主要對瑪納斯河流域用水現(xiàn)狀從局部到整體,結合用水效率進行分析和闡述,并利用對小樣本非線性和系統(tǒng)結構不夠清晰等問題有較好模擬和預測效果的支持向量機回歸方法構建流域需水模型,進行流域需水預測,然后利用主成分分析法對影響流域需水的因素進行分析,最后提出優(yōu)化水資源配置,完善用水管理,提高節(jié)水技術等多項措施應對水資源短缺。
本文選取2001-2014年作為研究期,選擇瑪納斯河流域三大主要地區(qū):石河子地區(qū)(包括農(nóng)八師各農(nóng)牧團場)、瑪納斯縣和沙灣縣作為具體研究對象,其他地區(qū)研究指標量非常小,忽略不計。流域及各地區(qū)數(shù)據(jù)主要從多年的《新疆統(tǒng)計年鑒》、《石河子統(tǒng)計年鑒》、《瑪納斯年鑒》、《沙灣年鑒》、《新疆維吾爾自治區(qū)瑪納斯河流域水利志》等進行收集整理。
本文主要運用超效率數(shù)據(jù)包絡(SE-DEA)方法對瑪納斯河流域用水效率進行分析,便于了解流域的用水現(xiàn)狀;采用支持向量機方法對流域需水量進行回歸,然后應用回歸模型做需水預測;最后借助因子分析法中的主成分法分析影響流域需水量的因素。
1.2.1 超效率數(shù)據(jù)包絡
超效率數(shù)據(jù)包絡(SE-DEA)模型中,設有n個決策單元,每個決策單元都有m種類型輸入和s種類型輸出,記第j個決策單元為DMUj,分別以xij、yrj表示DMUj對第i種輸入的投入量、對第r種輸出的產(chǎn)出量,分別以ωi、μr表示對第i種輸入、第r種輸出的一種度量(或稱權),本文中決策單元各輸入指標同等重要,即權重相等。
(1)
在規(guī)模報酬可變情況下,SE-DEA數(shù)學模型[9]如下:
(2)
式中:θ為目標規(guī)劃值,即決策單元效率值;ε為阿基米德無窮小量,即大于零小于任何正數(shù);λj為相對于第j個決策單元重新構造一個有效決策單元組合中第j個決策單元的權重系數(shù);s-、s+分別為松弛變量和剩余變量。
本文中決策單元的輸入指標,參考經(jīng)濟增長理論,同時考慮水資源作為經(jīng)濟發(fā)展的重要投入要素,主要有:勞動力x1,固定資產(chǎn)投資x2,用水總量x3;輸出指標選取流域國民生產(chǎn)總產(chǎn)值作為產(chǎn)出變量,記做Y。
1.2.2 支持向量機
支持向量機(SVM)方法能夠較好的解決小樣本、非線性和高維數(shù)據(jù)等問題。由于樣本為非線性特征,通過非線性函數(shù)φ(x)把訓練樣本映射到高維空間進行線性回歸,得到函數(shù)[10]:
f(x,w)=wφ(x)+b
(3)
式中:w為待定常數(shù)。
根據(jù)支持向量機原理,需水預測模型表達為:
(4)
式中:n為用水量樣本數(shù);ξi,ξ*i為松弛變量;c為懲罰系數(shù)。
采用拉格朗日乘數(shù)法將式(4)轉(zhuǎn)化為凸二次優(yōu)化問題,即:
(5)
式中:αi、α*i為拉格朗日乘子,滿足0≤αi,α*i≤C,γi,γ*i≥0;C為正則化常數(shù),與模型訓練誤差和模型復雜度有關。
方程可寫作:
(6)
K(xi,xj)是構造的核函數(shù),通過試算,文中采用Sigmoid核函數(shù),即:K(x,y)=tanh[k(x·y)+c]。
1.2.3 主成分分析
主成分分析(PCA),是多元統(tǒng)計分析的一種重要方法,通過對原始變量進行線性組合,把多個原始指標簡化為少量指標,從而集中有效地反映研究對象特征。主成分分析法步驟如下。
首先:樣本數(shù)為n,選取指標數(shù)為p,由樣本的原始數(shù)據(jù)可得矩陣X=(xij)m×p,其中xij表示第i年的第j項指標數(shù)據(jù)。
其次:對指標數(shù)據(jù)進行標準化消除量綱和數(shù)量級上的差別。
第三:根據(jù)標準化數(shù)據(jù)矩陣建立協(xié)方差矩陣R。其中,Rij(i,j=1,2,…,p)為原始變量Xi與Xj的相關系數(shù)。R為實對稱矩陣(即Rij=Rji),計算公式為:
(7)
第四:根據(jù)R求特征值、主成分貢獻率和累計方差貢獻率,確定主成分個數(shù)。解特征方程|λE-R|,求特征值λi(i=1,2,…,p),將其按大小順序排列,即λ1≥λ2≥…≥λi≥0,它的大小反映了各個主成分的影響力。
主成分Zi的貢獻率:
(8)
累計貢獻率為:
(9)
式中:整數(shù)m(m≤p)為主成分的個數(shù)。
第五:建立解釋主成分初始因子載荷矩陣。
第六:計算綜合評分函數(shù)Fm,可以進行降序排列:
Fm=W1Z1+W2Z2+…+WiZi
(10)
從用水量總體狀況、部門結構和地區(qū)差異分析瑪納斯河流域用水基本情況?,敿{斯河流域2001-2014年用水總量平均為25 億m3,主要是地表供水,地表供水總量從2001年20 億m3下降到2014年的18 億m3,平均19 億m3,供水比例從84%下降到70%,平均供水比例77%;地下水供水總量從2001年4 億m3上升到2014年的8 億m3,平均供水為6 億m3,占供水總量的23%。隨著經(jīng)濟的發(fā)展,各地區(qū)需水量增多,受地表水量和分配制度的限制,導致近些年地下水開采使用量逐年增加。流域總用水量增長趨勢不明顯,2006-2011年受到農(nóng)業(yè)用水的影響,總用水量有一個明顯的高峰期。
流域主要用水部門有農(nóng)業(yè)、工業(yè)和居民生活,城鎮(zhèn)綠化用水比例非常低。用水總量中農(nóng)業(yè)用水占絕對比例,平均用水量是23.5 億m3,在2006-2011年有一個用水高峰,其他時期變化不明顯,平均占比為95%,用水比例有緩慢下降趨勢,從2001年96.59%下降到2014年的91.62%。隨著流域工業(yè)的發(fā)展,工業(yè)用水量從2001年的0.36 億m3逐漸增長到2014年的1.38 億m3,平均用水量為0.79 億m3,所占比例從2001年1.49%增長到2014年的5.39%,平均占比為3%。隨著城鎮(zhèn)化的發(fā)展和居民生活水平的提高,居民生活用水量緩慢增長,從2001年的0.43 億m3增長到2014年的0.7 億m3,所占比例從2001年的1.77%增長到2014年的2.77%。城鎮(zhèn)綠化用水量最小,2001年為0.038 億m3,2014年為0.05 億m3,所占比例從2001年的0.15%增加到2014年的0.22%(見圖1)。
圖1 瑪納斯河流域2011-2014年用水量Fig.1 Manas river basin water consumption in 2011- 2014
瑪納斯河流域供水主要是地表水,供水河流主要有瑪納斯河、塔西河、寧家河、金溝河以及巴音溝河等,經(jīng)過多年的協(xié)調(diào)和水資源管理,流域水資源分配形成相對固定的分配比例,所以流域三大地區(qū)多年用水量(用水量既包括地表水也包括地下水,《瑪河管理章程》中給各地區(qū)分配比例有明確的規(guī)定,所以統(tǒng)計的用水比例與瑪納斯河分配比例有一定差異)和用水比例變化不大。2001-2014年,石河子平均用水16 億m3,占總用水量的64%,瑪納斯縣平均用水4 億m3,占16%,沙灣縣平均用水5 億m3,占20%。
瑪納斯河流域單位用水量的經(jīng)濟增加值從經(jīng)濟總量、第一產(chǎn)業(yè)和第二產(chǎn)業(yè)進行分析(見圖2)。2001-2014年單位用水經(jīng)濟總量緩慢增加,從2001年4 元/m3逐漸增加到2014年的29 元/m3,第一產(chǎn)業(yè)從2001年1 元/m3逐步增加到2014年的9 元/m3,第二產(chǎn)業(yè)的單位用水量產(chǎn)出比較高,從2001年99 元/m3增加到2014年的200 元/m3,2001-2005年變化不大,有一定的波動,2006年以后明顯的上升趨勢。流域農(nóng)業(yè)雖然用水量最大,但是單位用水量產(chǎn)出非常低,第二產(chǎn)業(yè)平均達到129 元/m3,比第一產(chǎn)業(yè)高出近27倍。各地區(qū)經(jīng)濟總量、一二產(chǎn)單位用水量的產(chǎn)出與流域整體趨勢類似,相比較而言,單位用水經(jīng)濟總產(chǎn)出依次是沙灣、瑪納斯和石河子,一產(chǎn)差異不大,二產(chǎn)單位用水產(chǎn)出依次是沙灣、石河子和瑪納斯。
圖2 瑪納斯河流域2001-2014年單位用水產(chǎn)出Fig.2 Manas river basin water unit of output in 2001-2014
利用數(shù)據(jù)包絡對2001—2014年整個流域和各地區(qū)用水效率分別進行超效率的測算。流域用水效率基本都在0.9以上,有效的年份也比較多(超效率值大于等于1)。各地區(qū)用水效率差異不大,沙灣地區(qū)用水效率相對偏低一點。流域用水效率高的原因是干旱地區(qū)節(jié)水意識強,用水部門節(jié)水技術高。石河子地區(qū)農(nóng)業(yè)節(jié)水技術比較高,建有全國最大的高效農(nóng)業(yè)節(jié)水滴灌示范區(qū)(見表1)。
表1 瑪納斯河流域2001-2014年用水效率Tab.1 Water efficiency of Manas river basin in 2001-2014
從瑪納斯河流域用水量的歷史數(shù)據(jù)分析可以看出,流域用水量受到社會經(jīng)濟的發(fā)展和自然氣候條件的影響。綜合考慮,本文主要從經(jīng)濟社會發(fā)展和自然環(huán)境兩方面選取影響需水的指標。經(jīng)濟社會指標選取過程中,考慮城鎮(zhèn)化的發(fā)展、地區(qū)農(nóng)牧業(yè)特色、產(chǎn)業(yè)結構等,最終確定以下指標:人口總數(shù)X1、城鎮(zhèn)人口X2、固定資產(chǎn)投資X3、總播種面積X4、糧食總產(chǎn)量X5、牲畜總頭數(shù)X6、棉花產(chǎn)量X7、農(nóng)業(yè)產(chǎn)值X8、牧業(yè)產(chǎn)值X9、工業(yè)產(chǎn)值X10、GDPX11、第一產(chǎn)業(yè)比重X12、第二產(chǎn)業(yè)比重X13、第三產(chǎn)業(yè)比重X14,自然環(huán)境指標:降水量X15、氣溫X16、參考作物蒸發(fā)蒸騰量X17。這17個指標作為需水模型的輸入,需水量作為輸出。
收集整理瑪納斯河流域各地區(qū)14 a(2001-2014年)需水影響因素和用水量各指標數(shù)據(jù)資料。部分地區(qū)降水量和氣溫缺失數(shù)據(jù)用平均值補充,然后對各地區(qū)進行綜合處理。對數(shù)據(jù)進行標準化預處理,消除數(shù)據(jù)不同量綱和單位的影響。標準化之后數(shù)據(jù)的最小值和最大值分別為-1和1,通過公式y(tǒng)=2 (x-min )/(max-min )-1將中間數(shù)據(jù)都映射到[-1,1]區(qū)間內(nèi)。
采用SVM方法借助Matlab工具進行數(shù)據(jù)分析。支持向量機回歸模型構建過程中,通過多次驗證和對比分析,選定模型參數(shù)為:Sigmoid核函數(shù),懲罰系數(shù)C為1 000,ε不敏感損失函數(shù)的參數(shù)為0.39。選取2001-2012年數(shù)據(jù)進行訓練學習并擬合,對2013和2014年數(shù)據(jù)進行測試,對模型泛化能力進行檢驗。
計算得到2001-2012年擬合值和實際值繪制圖形如圖3所示,SVM回歸模型均方根誤差RMSE為0.53,平均絕對百分比誤差MAPE為2.6。綜合判斷模型擬合效果較好。應用已構建的SVM回歸模型分析2013和2014年需水量見表2。
圖3 瑪納斯河流域需水量擬合圖Fig.3 Manas river basin water fitting figure
年份實際值/億m3預測值/億m3絕對誤差/億m3相對誤差/%201325.0025.120.120.46201424.8124.410.41.64
借助SPSS工具中專家建模器對17個輸入指標2015-2017年的序列進行預測,輸入指標預測值包括預測值、控制上限和控制下限,把這三類輸入指標預測值分別帶入已構建的SVM回歸模型,預測出瑪納斯河流域2015-2017年需水量見表3。
表3 瑪納斯河流域需水量短期預測 億m3
瑪納斯河流域地表水資源總量約23 億m3,可用水資源量20 億m3,地下水總量約11 億m3,可開采量約8 億m3,可用泉水量約2 億m3,總可供水量約30 億m3。從實際用水量和預測值與總供水量對比來看,近期內(nèi)流域需水量可以得到滿足。
在瑪納斯河流域需水分析過程中,篩選出的17個輸入指標對需水量都有影響,這些指標中有部分指標之間聯(lián)系緊密,本文利用主成分分析法將這些指標組合成相互獨立的少數(shù)幾個綜合指標判斷它們對需水量的影響,進而簡化指標數(shù)據(jù)分析,并提高分析結果的可靠性。
主成分分析得到以下兩個表:特征值及主成分的貢獻率和累計貢獻率(見表4)、進行最大方差旋轉(zhuǎn)后的因子載荷矩陣表(見表5)可以看出影響瑪納斯河流域用水影響因素可以分成4個主成分:第一主成分的貢獻率為46.23%,載荷較大的依次為:糧食產(chǎn)量、大小牲畜、農(nóng)業(yè)產(chǎn)值、棉花產(chǎn)量、總播種面積、總?cè)丝?、城?zhèn)人口、工業(yè)產(chǎn)值、固定資產(chǎn)投資;第二主成分的貢獻率為21.17%,載荷較大的依次為第三產(chǎn)業(yè)比重、第一產(chǎn)業(yè)比重、參考作物蒸發(fā)蒸騰量和降水量;第三主成分的貢獻率是12.74%,主要有第二產(chǎn)業(yè)比重和氣溫;第四主成分的貢獻率是11.30%,主要因素有牧業(yè)產(chǎn)值和GDP,GDP指標在控制因子個數(shù)為3時,可以歸到第一主成分中。4個因子的累計貢獻率達到91.44%。從主成分的分析結果可以看出,人口和經(jīng)濟社會的發(fā)展是流域需水的主因,同時對于干旱地區(qū)來說,氣溫降水等因素對用水量的影響也比較明顯。
表4 特征值和主成分貢獻率Tab.4 Eigenvalues and principal component contribution rate
表5 主成分荷載與主成分得分矩陣Tab.5 Principal component loads and principal component score matrix
通過對近10多年來瑪納斯河流域用水現(xiàn)狀和需水分析,本文得出以下結論:流域供水量較平穩(wěn),主要是地表水資源,受供水量和分配制度的限制,總用水量變化不大;流域總用水量中農(nóng)業(yè)占絕對比重,有下降趨勢;隨著經(jīng)濟結構變化和生活水平的提高,水資源分配在各部門之間有一定的變化,工業(yè)用水、生活用水和綠化用水比例都有上升。地表水資源在石河子、瑪納斯和沙灣各地區(qū)之間經(jīng)過多年的協(xié)調(diào),已經(jīng)形成相對固定比例,由于地下水的開采和使用,水資源的再分配等,石河子地區(qū)占總用水量的60%多,其次是沙灣占比20%多,瑪納斯最低。流域單位用水產(chǎn)出第二產(chǎn)業(yè)增長較快,并且產(chǎn)出最高,單位用水總產(chǎn)出和第一產(chǎn)業(yè)產(chǎn)出都不高,增長緩慢;單位用水產(chǎn)出各地區(qū)與整體趨勢類似,各地區(qū)之間差異不大。流域用水效率較高,各地區(qū)差異不大。支持向量機回歸方法對流域需水量的模擬和預測效果較好,預測出今后幾年流域總用水量略微下降。流域人口和經(jīng)濟社會的發(fā)展是影響需水量的主要因素,其次是氣溫和降水等氣候環(huán)境因素的影響。
分析認為:面對瑪納斯河流域水資源的短缺,各地區(qū)和部門都應該節(jié)約用水,提高用水效率,尤其是用水最多的農(nóng)業(yè)生產(chǎn)部門,雖然石河子地區(qū)農(nóng)業(yè)節(jié)水灌溉水平排全國前列,但是農(nóng)業(yè)節(jié)水潛力還需要進一步挖掘,流域其他地區(qū)應積極參考和學習石河子地區(qū)開展農(nóng)業(yè)節(jié)水;對流域用水首先從行政制度、法律法規(guī)等方面進行規(guī)范和制約,通過用水定額、水價等嚴格需水管理,增強節(jié)水意識和提高生產(chǎn)節(jié)水技術水平等促進用水效率和效益的提高;隨著經(jīng)濟的轉(zhuǎn)型和生活水平的提高,各部門用水需要合理調(diào)節(jié)和配置,增加工業(yè)用水、提高生活和生態(tài)用水;流域現(xiàn)有水資源分配制度形成于20世紀60年代,已經(jīng)不再適用當前各地區(qū)經(jīng)濟社會發(fā)展差異性的需求,所以應該重新調(diào)整和完善水資源分配制度,推動水資源再分配制度;嚴格管理和控制流域水資源污染,提高污水循環(huán)再利用,提高水質(zhì)和水量。流域用水和水資源的管理是一個復雜的系統(tǒng)工程,需要行政、經(jīng)濟、法律和技術等多種手段和措施結合,管理和協(xié)調(diào)水資源的供需,提高流域用水效率和效益,緩解水資源短缺的威脅,推動流域水資源可持續(xù)利用。
[1] 王 煜.灰色系統(tǒng)理論在需水預測中的應用[J]. 系統(tǒng)工程, 1996,(1):60-64.
[2] 劉二敏, 楊 侃, 趙云馳,等.系統(tǒng)動力學和分塊預測結合方法在工業(yè)需水預測中的應用[J]. 中國農(nóng)村水利水電, 2008,(4):63-65.
[3] 李勛貴, 黃 強, 魏 霞,等.基于IGA-GP的BP網(wǎng)絡黃河流域需水預測研究[J]. 西北農(nóng)林科技大學學報(自然科學版), 2005,33(3):116-120.
[4] 羅利民, 方 浩, 仲 躍,等.小波神經(jīng)網(wǎng)絡算法在區(qū)域需水預測中的應用[J]. 計算機工程與應用, 2006,42(3):200-201.
[5] 張 靈, 陳曉宏, 劉丙軍,等.基于AGA的SVM需水預測模型研究[J]. 水文, 2008,28(1):38-42.
[6] 劉俊萍, 暢明琦.基于支持向量機的需水預測研究[J]. 太原理工大學學報, 2008,39(3):299-302.
[7] 郭亞男, 吳澤寧, 高建菊.基于主成分分析的支持向量機需水預測模型及其應用[J]. 中國農(nóng)村水利水電, 2012,(7):76-78.
[8] 趙 晶, 趙一新, 黃 強.基于神經(jīng)網(wǎng)絡方法和支持向量機的西安市水資源需水預測[J]. 西北農(nóng)林科技大學學報(自然科學版), 2013,41(7):217-223.
[9] Andersen P, Petersen N C. A procedure for ranking efficient units in data envelopment analysis[J]. Management Science, 1993,39(10):1 261-1 264.
[10] 苗志剛, 付 強. 基于灰色支持向量機的城市用水量預測研究[J]. 計算機仿真, 2012,29(8):196-199.