周宇茗, 陳恬玥, 郭 青, 宋松柏,2
(1.西北農(nóng)林科技大學 水利與建筑工程學院, 陜西 楊凌 712100; 2.西北農(nóng)林科技大學旱區(qū)農(nóng)業(yè)水土工程教育部重點實驗室, 陜西 楊凌 712100)
近年來,全球氣候變暖影響不斷加劇,各國都在為可持續(xù)發(fā)展而蓄力,我國為實現(xiàn)碳達峰、碳中和的“雙碳”目標也必將向清潔能源高效利用轉(zhuǎn)型。水資源作為重要的綠色能源,在過去經(jīng)濟快速發(fā)展過程中卻普遍存在被污染和浪費的現(xiàn)象,尤其是在用水階段,缺乏節(jié)水意識引導、定量用水制度規(guī)范以及用水現(xiàn)狀實時監(jiān)管等,因而亟需對用水總量進行較為精準的預測,以期為我國水資源規(guī)劃和管理以及調(diào)整用水結(jié)構(gòu)等決策提供支撐。
目前,我國對用水量的研究涉及水量統(tǒng)計調(diào)查的差異分析、用水實時監(jiān)測方法修正、用水結(jié)構(gòu)成因分析等[1-7],而用水量預測一直是研究的熱點,其中包括從用水量變化驅(qū)動因素的角度進行趨勢規(guī)律定性分析[8-9],例如,劉晶等[10]采用Mann-Kendall法揭示了我國10個水資源一級區(qū)的水資源量及用水總量的變化規(guī)律;趙勇等[11]對全國358個地級行政區(qū)的用水總量增長趨勢進行了研究并得到用水極限峰值及發(fā)生時間。其次包括基于不同理論模型的定量估計,較為成熟的方法有定額法、時間序列法、回歸分析法、灰色GM(1,1)模型法、神經(jīng)網(wǎng)絡法及系統(tǒng)動力學法等,各種方法均取得了一定的研究成果[12-13],例如,何靖等[13]通過建立灰色系統(tǒng),對陜西省農(nóng)業(yè)、工業(yè)、生活和生態(tài)用水總量進行了預測。但目前更為常見的是為提高預測精度而對單一模型組合升級后進行用水量預測[14-20],包括分數(shù)階灰色冪次模型、灰色馬爾科夫和非線性灰色貝努利模型等。由于大尺度范圍內(nèi)用水量數(shù)據(jù)匯總的工作量較大,在預測模型的優(yōu)選方面,則較多為小區(qū)域范圍的研究[21-22],例如,白鵬等[23]基于京津冀地區(qū)年用水總量數(shù)據(jù)分別采用自回歸模型法、灰色ANN法和年增長率法3種預測方法進行了預測及對比;楊建強等[24]通過建立ARMA、GM(1,1)、ES-GM(1,1)和ES-ARMA模型對酒泉市用水總量進行了預測。國外對于用水量預測研究起步較早,早期研究內(nèi)容多為中短期用水預測的基礎算法分析和模型建構(gòu)[25-27],在此基礎上隨著技術的發(fā)展不斷提出了新模型并進行對比,例如Antunes等[28]基于葡萄牙兩個水務公司的實測數(shù)據(jù)建立了ANN、ARMA、支持向量機等模型進行預測和結(jié)果對比。當今依托發(fā)達的衛(wèi)星遙感技術,各地區(qū)的水文模型及相關統(tǒng)計參數(shù)日臻完備,氣象、農(nóng)業(yè)、自然資源數(shù)據(jù)庫系統(tǒng)也逐漸成熟,已有研究基于BESS-STAIR數(shù)據(jù)和應用衛(wèi)星數(shù)據(jù)模型可完成對全球農(nóng)業(yè)用水量的精準預測。
目前我國在大尺度用水量預測研究方面,既缺少定量預估,又缺乏不同模型的對比分析。本文基于ARMA、GM(1,1)、BP神經(jīng)網(wǎng)絡3種模型,分別從省級行政區(qū)劃、流域、地理大區(qū)3種尺度建立用水總量預測模型,得到預測值并進行模型優(yōu)選,再統(tǒng)計出中國內(nèi)地各分區(qū)用水量最優(yōu)預測模型種類的數(shù)量,以期尋找出其隨地理空間分布變化是否具有一定區(qū)域普遍適用性的規(guī)律,為各地區(qū)不同用水預測模型的組合創(chuàng)新提供參考,以提高用水預測精度,同時也為我國用水量數(shù)據(jù)的統(tǒng)一規(guī)范和智慧水務互聯(lián)管理提供依據(jù),減少由各地區(qū)用水統(tǒng)計差異而造成的誤差,從而更加精準地制定用水制度,有利于節(jié)水型城市建設和國家能源結(jié)構(gòu)轉(zhuǎn)型。
我國水資源開發(fā)利用工程多樣,供用水結(jié)構(gòu)復雜,水管理部門繁多,在進行水資源用水評價時往往從不同角度出發(fā)進行分區(qū)。本文將在中國內(nèi)地范圍按照省級行政區(qū)、水文地理(流域)大區(qū)和自然地理大區(qū)3種尺度劃分,分別建立年用水總量預測模型。
全國用水總量數(shù)據(jù)主要來源為《中國水資源公報》(不包括香港、澳門地區(qū)和臺灣省的相關數(shù)據(jù)),具有一定的科學性和權(quán)威性。分別選用1998-2017年用水總量數(shù)據(jù)為訓練期,2018-2020年用水總量數(shù)據(jù)為驗證期,建立省級行政區(qū)尺度年用水總量預測模型;流域和地理大區(qū)尺度年用水總量預測模型則選擇1997-2017年用水總量數(shù)據(jù)為訓練期,2018-2020年用水總量數(shù)據(jù)為驗證期。在建立預測模型前,通過序列組分識別和提取處理,滿足序列平穩(wěn)性的要求。
2.2.1 自回歸滑動平均模型ARMA 自回歸滑動平均(autoregressive moving average,ARMA)模型[18]是描述平穩(wěn)隨機水文序列的一類最主要的線性平穩(wěn)模型,可根據(jù)前后數(shù)據(jù)相關關系來建立回歸方程。該模型具有兩個優(yōu)點:(1)能夠揭示平穩(wěn)隨機水文序列的一些主要統(tǒng)計特性(如變差系數(shù)、自相關系數(shù)等)。(2)模型參數(shù)具有一定的物理意義。ARMA模型的一般形式為:
xt=u+φ1(xt-1-u)+φ2(xt-2-u)+…+
φp(xt-p-u)+εt-θ1εt-1-…-θqεt-q
(1)
式中:xt為平穩(wěn)、正態(tài)、零均值的時間序列;u為常數(shù)項;φ1,φ2,…,φp為自回歸系數(shù);p為自回歸階數(shù);θ1,θ2,…,θq為滑動平均系數(shù);q為滑動平均階數(shù);εt為獨立的誤差項。
ARMA模型的建立一般分為以下6個步驟:(1)組分識別。采用相應的方法對序列的趨勢、跳躍及周期成分進行識別并排除,獲得平穩(wěn)隨機序列。(2)選擇模型類型。繪制序列的自相關、偏相關函數(shù)圖,進行截尾性判定分析。(3)識別模型形式。給定p、q的上限值,分別計算AIC(p,q)或BIC(p,q),確定模型階數(shù)。(4)估計模型參數(shù)。依據(jù)Yule-Walker方程、矩法等方法計算模型參數(shù)。(5)模型檢驗。采用綜合自相關系數(shù)法進行檢驗,分析殘差隨機變量的獨立性。(6)模型適用性分析。采用長序列、短序列法分析所建立模型是否能保持實測序列的主要統(tǒng)計特性。
2.2.2 灰色GM(1,1)模型 灰色預測[10]是利用各因素之間的關聯(lián)性估計其趨勢的相異程度,其關鍵在于對原始數(shù)據(jù)做相加、累減或平均形成近似的指數(shù)規(guī)律后再建立灰色GM(1,1)模型?;疑獹M(1,1)模型是指應用于中短序列且僅包含一個變數(shù)的一階變量微分方程模型,在水文預報中作為基于長時間序列的中期或短期預報。一般選擇后驗差檢驗法測試模型的可靠性,并利用最小誤差概率與后驗差的比值C判斷模型的正確性,分別以C=0.35、0.50、0.65為分界點將精度劃分為優(yōu)、良、合格及不合格4個等級。
2.2.3 BP神經(jīng)網(wǎng)絡模型 人工神經(jīng)網(wǎng)絡(artificial neural network,ANN)模型是模仿動物神經(jīng)反饋機制進行信息處理, 能夠自學習、自適應的一種數(shù)學模型。其工作原理是基于人工神經(jīng)元,將輸入數(shù)據(jù)經(jīng)過激活函數(shù)處理得到輸出數(shù)據(jù),常用的激活函數(shù)包括線性函數(shù)、S形函數(shù)、雙極S形函數(shù)等,訓練方法包括梯度下降法、量化共軛梯度法、擬牛頓算法和一步正割算法等。根據(jù)輸出值的檢驗精度調(diào)整激活函數(shù)類型,激活函數(shù)的選擇耗時長、影響深,是神經(jīng)網(wǎng)絡預測過程中的重點。
神經(jīng)網(wǎng)絡由大量神經(jīng)元構(gòu)成,其結(jié)構(gòu)包括前饋、反饋神經(jīng)網(wǎng)絡和自組織網(wǎng)絡3種,工作模式為有、無導師學習兩大類,BP(back propagation)神經(jīng)網(wǎng)絡屬于前饋有導師學習神經(jīng)網(wǎng)絡系統(tǒng)。前饋網(wǎng)絡反饋信號在訓練中產(chǎn)生,進而在分類時向前傳遞到輸出層。有導師學習算法是將樣本原值與真實輸出值之差作為調(diào)整標準,不斷重復操作直到該誤差處于滿足條件的范圍內(nèi)。這種能學習和存貯大量的激勵-響應模式映射關系并不斷學習調(diào)整連接權(quán)的多層前饋網(wǎng)絡,是目前普遍應用的神經(jīng)網(wǎng)絡模型之一。
3.1.1 ARMA模型預測結(jié)果 依據(jù)ARMA自回歸滑動平均模型原理,借助MATLAB進行建模,分別得到省級行政區(qū)劃、流域、地理大區(qū)3種尺度下的ARMA模型系數(shù),見表1、2。3種不同尺度下預測模型結(jié)果表明,ARMA(p,q)模型占比較大,只有少數(shù)省市為ARMA(p)模型。
表1 部分省級行政區(qū)ARMA模型參數(shù)
表2 各流域及地理大區(qū)ARMA模型系數(shù)
3.1.2 灰色GM(1,1)模型預測結(jié)果 根據(jù)灰色GM(1,1)原理,經(jīng)計算分別得到省級行政區(qū)劃、流域、地理大區(qū)3種尺度下的灰色GM(1,1)模型系數(shù)a、b及后驗差比值C,見表3、4。由表3、4可知,在全國內(nèi)地31個省級行政區(qū)中,僅河北省年用水總量的擬合精度達到了優(yōu),后驗差比值恰為0.35;內(nèi)蒙古、安徽、山西、陜西和新疆5個省級行政區(qū)模擬精度為良,后驗差比值分別為0.36,0.43,0.46,0.36,0.38;山東、江西、湖北、湖南等10個省級行政區(qū)模擬精度為合格;云南、河南等15個省級行政區(qū)模擬精度均為不合格。在九大流域中,長江、西北諸河流域的模擬精度為良,后驗差比值分別為0.46、0.36;松遼流域后驗差比值為0.59,模擬精度為合格;其他流域模擬精度均為不合格。南方4區(qū)后驗差比值為0.41,模擬精度為良;北方6區(qū)后驗差比值為0.63,模擬精度為合格。上述結(jié)果表明,雖然灰色GM(1,1)模型能夠?qū)σ恍┑貐^(qū)用水總量序列進行預測,但并不具有普遍適用性,仍然存在大量精度不符合標準的情況,這是由于灰色GM(1,1)模型的適用性和用水總量序列自身規(guī)律難以擬合造成的。
3.1.3 BP神經(jīng)網(wǎng)絡模型預測結(jié)果 依據(jù)BP神經(jīng)網(wǎng)絡模型原理,借助MATLAB軟件,先通過mapminmax函數(shù)將輸入值特征化歸一以便識別處理,再應用newff函數(shù)建立用水總量預測BP神經(jīng)網(wǎng)絡模型,可分別得到省級行政區(qū)劃、流域、地理大區(qū)3種尺度下神經(jīng)網(wǎng)絡模型的預測評價結(jié)果,如表5所示。由表5可以看出,所有尺度下的預測平均相對誤差均在30%以內(nèi);流域尺度下珠江和東南諸河的預測誤差相對較大,分別為11.46%、29.23%,其他流域的預測平均相對誤差則在10%以下;省級行政區(qū)劃尺度下,廣東、四川、江蘇和吉林4個省級行政區(qū)的預測誤差相對較大,分別為9.16%、7.38%、10.33%、8.16%,其他省級行政區(qū)的預測平均相對誤差基本在5%左右??梢夿P神經(jīng)網(wǎng)絡模型對用水總量預測的適用性較好,能夠應用于中長期用水量預測。
表3 各省級行政區(qū)灰色GM(1,1)模型構(gòu)建結(jié)果
表4 流域及地理大區(qū)灰色GM(1,1)模型構(gòu)建結(jié)果
對于上述3種模型,選擇2018-2020年用水總量數(shù)據(jù)進行省級行政區(qū)劃、流域、地理大區(qū)3種尺度的年用水總量預測結(jié)果驗證,用平均絕對百分比誤差(mean absolute percentage error,MAPE)判斷預測精度,擇出最優(yōu)模型。圖1為3個尺度中較為典型的區(qū)域的年用水總量不同模型預測結(jié)果與實際值對比,從圖1中可以看出,不同尺度下的最優(yōu)模型均與實際用水總量的年際波動變化一致;灰色GM(1,1)模型與ARMA模型的擬合差異不明顯,在用水總量變化為單一線性分布時,灰色GM(1,1)模型優(yōu)勢較為明顯,而當變化為非線性時,ARMA模型優(yōu)勢更顯著;BP神經(jīng)網(wǎng)絡模型的擬合程度不太穩(wěn)定,這可能與其激活函數(shù)的選擇有關。模型在訓練期的擬合度較好,而在驗證期則會表現(xiàn)出顯著差異,以云南省為例(圖1(b)),訓練期BP神經(jīng)網(wǎng)絡和ARMA模型的預測效果均明顯優(yōu)于灰色GM(1,1)模型,驗證期ARMA模型優(yōu)勢依舊,BP神經(jīng)網(wǎng)絡模型則表現(xiàn)出偏離。因而訓練期擬合結(jié)果不能反映出模型的真實預測水平,應以驗證期相對誤差作為模型優(yōu)選標準。
表5 省級行政區(qū)劃、流域及地理大區(qū)BP神經(jīng)網(wǎng)絡模型預測結(jié)果平均相對誤差 %
圖1 3種尺度中典型區(qū)域年用水總量的不同模型預測結(jié)果與實際值對比
因數(shù)據(jù)較多,本文選取部分省份、流域及地理大區(qū)2018-2020年3種模型的年用水總量預測結(jié)果列于表6,并計算出預測值與實際值的相對誤差(RE)及平均絕對百分比誤差(MAPE)進行對比。由表6可以看出,省級行政區(qū)劃尺度下,ARMA、灰色GM(1,1)和BP神經(jīng)網(wǎng)絡3種模型對遼寧省年用水總量預測值的MAPE分別為0.52%、9.31%、1.59%,優(yōu)選模型為ARMA模型;對河北省年用水總量預測值的MAPE分別為0.95%、1.42%、0.77%,優(yōu)選模型為BP神經(jīng)網(wǎng)絡模型;對云南省年用水總量預測值的MAPE分別為2.78%、1.88%、3.21%,優(yōu)選模型為灰色GM(1,1)模型。流域尺度下,3種模型對西北諸河年用水總量預測值的MAPE分別為2.06%、4.36%、2.80%,優(yōu)選模型為ARMA模型;對長江流域年用水總量預測值的MAPE分別為3.17%、2.47%、1.05%,優(yōu)選模型為BP神經(jīng)網(wǎng)絡模型;對黃河流域年用水總量預測值的MAPE分別為1.30%、0.73%、2.81%,優(yōu)選模型為灰色GM(1,1)模型。地理大區(qū)尺度下,對北方6區(qū)年用水總量預測值的MAPE分別為2.46%、2.69%、2.03%,優(yōu)選模型為BP神經(jīng)網(wǎng)絡模型;對南方4區(qū)年用水總量預測值的MAPE分別為5.61%、3.63%、3.97%,優(yōu)選模型為灰色GM(1,1)模型。上述結(jié)果表明,3種模型在同一尺度下對不同區(qū)域的年用水總量預測誤差均有所不同。
表6 3種模型對部分省份、流域及地理大區(qū)2018-2020年的年用水總量預測結(jié)果對比
對研究范圍內(nèi)3種尺度下的最優(yōu)預測模型進行數(shù)學統(tǒng)計可知:在省級行政區(qū)劃尺度下,陜西省、北京市、廣東省等9個區(qū)域的年用水總量最優(yōu)預測模型為ARMA模型;云南省、河南省、天津市等6個區(qū)域的最優(yōu)預測模型為灰色GM(1,1)模型;山東省、青海省、安徽省等16個區(qū)域的最優(yōu)預測模型為BP神經(jīng)網(wǎng)絡模型。在流域尺度下,松遼、海河等5個流域的年用水總量最優(yōu)預測模型為ARMA模型;黃河、淮河和珠江3個流域的最優(yōu)預測模型為灰色GM(1,1)模型;長江流域的最優(yōu)預測模型為BP神經(jīng)網(wǎng)絡模型。在地理大區(qū)尺度下,北方6區(qū)的年用水總量最優(yōu)預測模型為BP神經(jīng)網(wǎng)絡模型;南方4區(qū)的最優(yōu)預測模型為灰色GM(1,1)模型。
從省級行政區(qū)劃尺度出發(fā),根據(jù)選取的各行政區(qū)年用水總量最優(yōu)預測模型,分別對2021-2025年的年用水總量進行預測,結(jié)果如圖2所示。
由圖2可見,最優(yōu)模型為ARMA的9個省級行政區(qū)中(圖2(a)),2021-2025年浙江省年用水總量的減少趨勢相對明顯,年用水總量平均減少速率為5.88×108m3/a;遼寧省年用水總量呈小幅增加趨勢,平均增加速率為1.87×108m3/a;其余各省(自治區(qū))年用水規(guī)?;境制健W顑?yōu)模型為灰色GM(1,1)模型的6個省級行政區(qū)中(圖2(b)),江蘇省的年用水總量增加幅度相對較大,平均增大速率為8.27×108m3/a,增速較快,該省2025年年用水總量預測值為653.3×108m3。最優(yōu)模型為BP神經(jīng)網(wǎng)絡模型的16個省級行政區(qū)中(圖2(c)、2(d)),2021-2025年甘肅、安徽、湖南、福建、山西、海南和貴州7個省份的年用水總量基本不變;廣西壯族自治區(qū)、寧夏回族自治區(qū)和黑龍江省3個省份(自治區(qū))年用水總量均呈現(xiàn)先減少后增大的趨勢,由減少到增大變化的轉(zhuǎn)折點年份分別為2023、2022和2024年,特別注意到,黑龍江省2025年的用水總量增幅較大,比2024年增加了62.95×108m3;新疆維吾爾自治區(qū)年用水總量在2021和2022年基本不變, 2023和2024年連續(xù)減少,2025年與2024年又基本持平,2022-2025年的年用水總量平均減少速率為28.11×108m3/a;青海省年用水總量呈連續(xù)小幅波動變化狀態(tài)。
圖2 中國內(nèi)地各省級行政區(qū)2021-2025年年用水總量預測結(jié)果(以最優(yōu)預測模型分類)
本研究對中國內(nèi)地不同尺度區(qū)域年用水總量最優(yōu)預測模型進行分析,可以得到在數(shù)量上的統(tǒng)計值。其中,省級行政區(qū)劃尺度下最優(yōu)預測模型中占比最大的為BP神經(jīng)網(wǎng)絡模型,流域尺度下占比最大的為ARMA模型,地理大區(qū)尺度下北方6區(qū)最優(yōu)預測模型為BP神經(jīng)網(wǎng)絡模型,南方4區(qū)最優(yōu)預測模型為灰色GM(1,1)模型,而最優(yōu)預測模型在地理空間分布上沒有顯示出一定的規(guī)律性,可能是因為本文選取的3種預測模型均為時間序列模型,忽略了除用水量外的其他因素影響。在已有的其他小尺度區(qū)域用水量最優(yōu)預測模型的研究中,同時考慮到了結(jié)構(gòu)分析法,針對特定區(qū)域的用水量與其影響因素進行了相關分析,而大尺度區(qū)域的用水量預測多為農(nóng)業(yè)用水量預測,是基于衛(wèi)星遙感數(shù)據(jù)綜合多種水文要素得到的。
雖然從本研究選用的用水量預測模型中沒有發(fā)現(xiàn)一定的普適規(guī)律,但各尺度下模型預測值的相對誤差均較為合理,具有一定推廣價值。與以往研究相比,如Meng等[30]利用灰色模型對我國內(nèi)地31個省(自治區(qū))的工業(yè)、農(nóng)業(yè)、生活及總用水量進行預測,Meng等[31]考慮區(qū)域GDP、人口與用水量關系建立AGMC(1,N)模型對我國內(nèi)地31個省(自治區(qū))用水量進行預測,本研究還涉及了流域和地理大區(qū)尺度,并選用3種模型進行了優(yōu)選。
綜合以上方面,可考慮結(jié)合其他相關因素(如經(jīng)濟發(fā)展、人口增長等)選擇適當模型,對3種尺度下用水量進行預測,以完善本研究結(jié)果。
(1)依據(jù)自回歸滑動平均模型ARMA、灰色GM(1,1)模型及BP神經(jīng)網(wǎng)絡模型原理,利用各省級行政區(qū)劃、流域、地理大區(qū)尺度1997-2020年的年用水總量,得到各模型的相應參數(shù)。
(2)對3種尺度下3種用水量預測模型進行優(yōu)選并得到數(shù)量統(tǒng)計結(jié)果:在省級行政區(qū)劃尺度下,陜西省、北京市、廣東省等9個區(qū)域的年用水總量最優(yōu)預測模型為ARMA模型,云南省、河南省、天津市等6個區(qū)域的最優(yōu)預測模型為灰色GM(1,1)模型,山東省、青海省、安徽省等16個區(qū)域的最優(yōu)預測模型為BP神經(jīng)網(wǎng)絡模型;在流域尺度下,松遼、海河等5個流域的年用水總量最優(yōu)預測模型為ARMA模型,黃河、淮河和珠江3個流域的最優(yōu)預測模型為灰色GM(1,1)模型,長江流域的最優(yōu)預測模型為BP神經(jīng)網(wǎng)絡模型;在地理大區(qū)尺度下,北方6區(qū)的年用水總量最優(yōu)預測模型為BP神經(jīng)網(wǎng)絡模型,南方4區(qū)的最優(yōu)預測模型為灰色GM(1,1)模型。
(3)應用選出的最優(yōu)模型,預測出2021-2025年各省級行政區(qū)的用水總量及其變化趨勢,預測期內(nèi)各省級行政區(qū)用水總量總體保持穩(wěn)定。