白 鵬,龍秋波
(1.中國(guó)科學(xué)院地理科學(xué)與資源研究所陸地水循環(huán)及地表過(guò)程重點(diǎn)實(shí)驗(yàn)室,北京 100101;2.湖南省水利水電勘測(cè)設(shè)計(jì)研究總院,湖南 長(zhǎng)沙 410007)
用水量預(yù)測(cè)是水資源規(guī)劃及管理的重要基礎(chǔ)和依據(jù),也是保證供水系統(tǒng)安全運(yùn)行和科學(xué)管理的有效手段[1-3]。用水量預(yù)測(cè)的方法有很多,根據(jù)對(duì)數(shù)據(jù)處理方式的差異,用水量預(yù)測(cè)通??煞譃闀r(shí)間序列法、結(jié)構(gòu)分析法和系統(tǒng)分析法3類[4-6]。時(shí)間序列法主要是根據(jù)用水量周期性或規(guī)律性的變化特征進(jìn)行統(tǒng)計(jì)分析,進(jìn)而構(gòu)建預(yù)測(cè)模型[7-9];結(jié)構(gòu)分析法是通過(guò)分析城市用水量與各種相關(guān)因素(如人口、產(chǎn)值、糧食產(chǎn)量和氣候等)之間的聯(lián)系,構(gòu)建用水量和關(guān)聯(lián)因素之間的統(tǒng)計(jì)模型,進(jìn)行用水量預(yù)測(cè)[10];系統(tǒng)分析法不追究個(gè)別因素的作用效果,削弱隨機(jī)因素的影響,力求體現(xiàn)各因素對(duì)用水量規(guī)律的綜合作用[11-12]。上述3種方法各有優(yōu)勢(shì)和不足,目前還無(wú)法建立一個(gè)確定性模型對(duì)區(qū)域用水系統(tǒng)的復(fù)雜性進(jìn)行描述。相比于其他兩種方法,時(shí)間序列法對(duì)用水系統(tǒng)外部復(fù)雜的影響因素進(jìn)行簡(jiǎn)化,不需要對(duì)影響用水量的因素進(jìn)行預(yù)測(cè),只考慮歷史用水量數(shù)據(jù)隨時(shí)間內(nèi)在變化規(guī)律,進(jìn)而對(duì)整個(gè)系統(tǒng)的未來(lái)狀態(tài)做出預(yù)測(cè)[7-9]。該類方法比較符合用水量序列的特點(diǎn),因而在用水量預(yù)測(cè)工作中應(yīng)用較為廣泛。常見(jiàn)的時(shí)間序列預(yù)測(cè)法包括年增長(zhǎng)率法、移動(dòng)平均法、人工神經(jīng)網(wǎng)絡(luò)法和自回歸模型法等[13-14]。多種用水量預(yù)測(cè)方法的比較研究有助于識(shí)別最優(yōu)的方法,減少預(yù)測(cè)結(jié)果的不確定性。本文擬選擇京津冀地區(qū)為對(duì)象,對(duì)3種常用的年用水量時(shí)間序列預(yù)測(cè)方法進(jìn)行比較,分析3種方法在京津冀地區(qū)年用水量預(yù)測(cè)中的適用性,為促進(jìn)京津冀地區(qū)水資源的高效管理和規(guī)劃提供科學(xué)支持。
年增長(zhǎng)率法是通過(guò)分析歷史的城市年用水量增長(zhǎng)情況,計(jì)算出區(qū)域年用水增長(zhǎng)率,從而根據(jù)現(xiàn)狀水平年的用水量預(yù)測(cè)出規(guī)劃年的用水量。該方法計(jì)算簡(jiǎn)單,但需要收集長(zhǎng)系列的歷史用水量數(shù)據(jù),在一些地區(qū)可能存在數(shù)據(jù)缺失、資料不全等問(wèn)題[6]。年增長(zhǎng)率法假定歷史年用水量數(shù)據(jù)序列符合特定的函數(shù)分布(如冪函數(shù)),常用的計(jì)算公式為
Wt+1=W0(1+R)n
(1)
式中:Wt+1為第t+1年的用水量;W0為現(xiàn)狀基準(zhǔn)年用水量;R為城市用水量年平均增長(zhǎng)率,本文中R的取值通過(guò)歷史用水量數(shù)據(jù)進(jìn)行參數(shù)擬合求得;n為間隔年數(shù)。
當(dāng)一個(gè)變量按時(shí)間順序排列的值之間具有依賴關(guān)系或自相關(guān)性時(shí),就可以建立該變量的自回歸模型,并由此對(duì)其發(fā)展變化趨勢(shì)進(jìn)行預(yù)測(cè)[15]。需要指出的是自相關(guān)性是建立自回歸模型的基礎(chǔ),只有具有顯著自相關(guān)性的時(shí)間序列才可以建立自回歸模型。城市年用水量變化一般都比較緩慢,輕易不會(huì)發(fā)生突變,符合自回歸模型的構(gòu)建基礎(chǔ),該方法的優(yōu)點(diǎn)是所需資料少,可用自身變數(shù)數(shù)列進(jìn)行預(yù)測(cè)。自回歸模型的方法有很多,本文選取門限自回歸模型進(jìn)行研究。該模型能有效描述復(fù)雜的非線性動(dòng)態(tài)系統(tǒng),由于門限的控制作用,該模型具有很強(qiáng)的穩(wěn)健性和適用性,常常被應(yīng)用于在經(jīng)濟(jì)、環(huán)境、海洋、氣象等領(lǐng)域[16]。門限自回歸模型的基本思路是在觀測(cè)時(shí)間序列{Xt}的取值范圍內(nèi)引入n個(gè)門限值Tj(j=1,2,…,n),根據(jù)延遲步長(zhǎng)d將{Xt}按{Xt-d}值的大小分配到不同的門限區(qū)域內(nèi),再用自回歸模型對(duì)不同區(qū)間內(nèi)的{Xt}序列進(jìn)行擬合,從而對(duì)時(shí)間序列進(jìn)行非線性動(dòng)態(tài)描述,模型的一般形式[17-18]為
(2)
式中:Tj為門限值;Ztj為第j個(gè)相互獨(dú)立的正態(tài)白噪聲序列;a0j為第j個(gè)門限自回歸區(qū)間的自回歸系數(shù);mj為第j個(gè)門限區(qū)間自回歸模型的階數(shù)。
區(qū)域年用水量變化影響因素眾多,系統(tǒng)內(nèi)部的變化機(jī)理復(fù)雜且各類影響因素之間相互作用。人工神經(jīng)網(wǎng)絡(luò)方法具有自適應(yīng)性、容錯(cuò)性以及強(qiáng)大的映射能力,能夠大規(guī)模處理高度非線性復(fù)雜問(wèn)題,能夠從大量的歷史數(shù)據(jù)中進(jìn)行訓(xùn)練,進(jìn)而找出時(shí)間序列內(nèi)在的變化規(guī)律,因此被廣泛應(yīng)用于區(qū)域的年用水量預(yù)測(cè)[19-20]。但是,人工神經(jīng)網(wǎng)絡(luò)方法內(nèi)部參數(shù)較多,易陷入局部最優(yōu)解,灰色預(yù)測(cè)方法可以很好地解決這些問(wèn)題?;疑碚撌且环N研究既包含已知信息又包含未知信息的系統(tǒng)理論與方法,該理論以“小樣本”、“離散”、“無(wú)規(guī)律”的數(shù)據(jù)為主要研究對(duì)象,將雜亂無(wú)章的原始數(shù)據(jù)序列通過(guò)一定的處理方法,使之變?yōu)楸容^有規(guī)律的時(shí)間序列[21-22],能夠較好地弱化數(shù)據(jù)序列的波動(dòng)性并處理隨機(jī)擾動(dòng)因素。但是,灰色預(yù)測(cè)方法缺乏自學(xué)習(xí)和自組織能力,尤其是在對(duì)復(fù)雜的非線性系統(tǒng)進(jìn)行預(yù)測(cè)時(shí),因非線性系統(tǒng)的數(shù)據(jù)隨機(jī)性變化顯著,會(huì)產(chǎn)生很大的誤差?;疑斯ど窠?jīng)網(wǎng)絡(luò)充分利用了二者之間的差異性和互補(bǔ)性,充分發(fā)揮各自的優(yōu)勢(shì)[23]。二者結(jié)合的方式是利用神經(jīng)網(wǎng)絡(luò)對(duì)灰色模型GM(1,1)預(yù)測(cè)結(jié)果進(jìn)行誤差修正,從而構(gòu)建神經(jīng)網(wǎng)絡(luò)模型和灰色模型GM(1,1)的串聯(lián)式組合模型。本研究用到的神經(jīng)網(wǎng)絡(luò)模型為BP模型,隱含層個(gè)數(shù)為10。具體的計(jì)算步驟如下:①對(duì)時(shí)間序列進(jìn)行歸一化處理,建立GM(1,1)模型;②基于GM(1,1)模型進(jìn)行時(shí)間序列的預(yù)測(cè);③計(jì)算觀測(cè)數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)的誤差;④將模型預(yù)測(cè)誤差序列作為神經(jīng)網(wǎng)絡(luò)模型的輸入項(xiàng),對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,確定網(wǎng)絡(luò)的權(quán)重和閾值,得到能夠反映預(yù)測(cè)值和誤差關(guān)系的網(wǎng)絡(luò)結(jié)構(gòu);⑤分別基于GM(1,1) 模型和神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)下一時(shí)刻(t+1)的預(yù)測(cè)值及其偏差,二者之和即為t+1時(shí)刻的預(yù)測(cè)值;⑥重復(fù)步驟④,得到t+2,t+3,…,t+m時(shí)刻的預(yù)測(cè)值(m是預(yù)測(cè)年數(shù))。
京津冀一體化是黨中央、國(guó)務(wù)院做出的一項(xiàng)重大國(guó)家戰(zhàn)略部署,是實(shí)現(xiàn)京津冀三地優(yōu)勢(shì)互補(bǔ)、促進(jìn)環(huán)渤海經(jīng)濟(jì)圈發(fā)展、帶動(dòng)北方腹地發(fā)展的需要。京津冀地區(qū)可持續(xù)發(fā)展面臨的重大問(wèn)題之一是經(jīng)濟(jì)社會(huì)發(fā)展水平和水資源量不匹配[24]。該地區(qū)是中國(guó)北方經(jīng)濟(jì)規(guī)模最大、最具活力的地區(qū),同時(shí),也是我國(guó)缺水最嚴(yán)重的地區(qū)之一,人均水資源占有量約為全國(guó)平均值的1/9[25]。因此,京津冀地區(qū)的協(xié)調(diào)發(fā)展需要打破行政區(qū)域限制,以京津冀地區(qū)為統(tǒng)一體整體進(jìn)行水資源規(guī)劃和管理,甄別適用于該地區(qū)的年用水量預(yù)測(cè)方法顯得尤為必要。本文的年用水量數(shù)據(jù)來(lái)源于京津冀三地的水資源公報(bào),時(shí)間跨度均為1997—2018年(圖1)。由圖1可知,京津冀三地1997—2018年的用水量變化呈現(xiàn)出明顯不同的趨勢(shì)。北京市和天津市年用水量呈現(xiàn)先減少,而后緩慢增加的趨勢(shì),而河北省年用水量呈波動(dòng)下降趨勢(shì)。本文設(shè)置了不同的模型訓(xùn)練期T(表1),如模型訓(xùn)練年數(shù)為10,表示前10年數(shù)據(jù)用于模型訓(xùn)練,其余年份的數(shù)據(jù)用于模型的驗(yàn)證。預(yù)測(cè)結(jié)果評(píng)估指標(biāo)為相對(duì)偏差,其正值表示模型高估年用水量,負(fù)值表示低估年用水量。不同訓(xùn)練期的條件下基于最小二乘法擬合的京津冀年用水量年平均增長(zhǎng)率見(jiàn)表1。
圖1 京津冀地區(qū)1997—2018年用水量變化
表1 不同訓(xùn)練期下京津冀年用水量平均增長(zhǎng)率
表2 不同訓(xùn)練期下各模型年用水量模擬的相對(duì)誤差
表3 不同訓(xùn)練期條件下各模型驗(yàn)證期年用水量模擬的相對(duì)誤差
模型訓(xùn)練期和驗(yàn)證期,京津冀三地年用水量模擬的相對(duì)誤差見(jiàn)表2、表3。由表2可知,模型的誤差隨訓(xùn)練期的增加而減少。以北京市為例,訓(xùn)練期由10 a增加到18 a時(shí),年增長(zhǎng)率法的相對(duì)誤差由 -1.2%變?yōu)?.6%,自回歸模型法的相對(duì)誤差由3.4%減少到0.9%,灰色神經(jīng)網(wǎng)絡(luò)法的相對(duì)誤差變化最大,由-6.4%變?yōu)?.7%。在模型訓(xùn)練期,年增長(zhǎng)率方法在北京市明顯優(yōu)于其他兩種方法,但在模型驗(yàn)證期,年增長(zhǎng)率方法表現(xiàn)最差,可見(jiàn)訓(xùn)練期的模型模擬結(jié)果并不能反映模型真實(shí)的預(yù)測(cè)能力。因此,本文基于驗(yàn)證期的結(jié)果來(lái)評(píng)判3種模型的年用水量預(yù)測(cè)能力。由表3可見(jiàn),3種模型的預(yù)測(cè)能力表現(xiàn)出明顯的區(qū)域分異性。在北京市和天津市,灰色神經(jīng)網(wǎng)絡(luò)法表現(xiàn)最好,自回歸模型法次之,而年增長(zhǎng)率法表現(xiàn)最差。以18 a訓(xùn)練期模型的預(yù)測(cè)結(jié)果為例,北京市3種模型(灰色神經(jīng)網(wǎng)絡(luò)法、自回歸模型法、年增長(zhǎng)率法)預(yù)測(cè)結(jié)果的相對(duì)誤差分別為 -2.2%、-4.7%和-14.9%;在天津市,3種模型預(yù)測(cè)結(jié)果的相對(duì)誤差分別是-3.1%,-11.6%和-20.4%;在河北省,3種方法的預(yù)測(cè)誤差要明顯小于北京市和天津市。比較而言,灰色神經(jīng)網(wǎng)絡(luò)法略優(yōu)于年增長(zhǎng)率法,二者均優(yōu)于自回歸模型法。
圖2為訓(xùn)練期為18 a(1997—2014年)條件下,京津冀三地年用水量驗(yàn)證結(jié)果。由圖2可見(jiàn),年增長(zhǎng)率法模擬和預(yù)測(cè)的年用水量近乎一條直線,這與真實(shí)的年用水量數(shù)據(jù)變化不一致,實(shí)際的年用水量序列通常呈明顯的年際波動(dòng)。究其原因,可能是因?yàn)槟暝鲩L(zhǎng)率法采用單一的函數(shù)分布,很難有效地模擬年用水量的波動(dòng)變化。自回歸模型法的預(yù)測(cè)誤差較大,而且與實(shí)際年用水量的變化趨勢(shì)不一致。灰色神經(jīng)網(wǎng)絡(luò)法不僅預(yù)測(cè)誤差較小且能夠很好模擬年用水量的年際波動(dòng),在年用水量呈非線性變化的地區(qū)優(yōu)勢(shì)明顯。灰色神經(jīng)網(wǎng)絡(luò)方法優(yōu)于其他兩種方法的原因可能在于其強(qiáng)大的非線性映射能力,使模型能夠快速捕獲時(shí)間序列中隱藏的趨勢(shì)信息,并建立穩(wěn)健的模型結(jié)構(gòu)來(lái)進(jìn)行趨勢(shì)的預(yù)測(cè)。因此,灰色神經(jīng)網(wǎng)絡(luò)法在京津冀三地年用水量預(yù)測(cè)中表現(xiàn)最好,建議將其作為該地區(qū)年用水量預(yù)測(cè)的優(yōu)選方法。
(a) 北京市
利用灰色神經(jīng)網(wǎng)絡(luò)法,對(duì)京津冀三地2019—2025年用水量進(jìn)行預(yù)測(cè)。模型訓(xùn)練數(shù)據(jù)均為1997—2018年的實(shí)際年用水量數(shù)據(jù)。模型預(yù)測(cè)結(jié)果見(jiàn)圖3,可見(jiàn)2019年后北京市年用水量總量趨于平穩(wěn),將維持2018年的用水規(guī)模,年際波動(dòng)很小,平均變化速率為0.06億m3/a,2025年的用水量預(yù)測(cè)值為39.7億m3。天津市的用水量仍維持增加趨勢(shì),但增速明顯放緩,平均速率為0.17億m3/a,2025年的用水量預(yù)測(cè)值為29.6億m3。河北省的用水量則仍維持下降態(tài)勢(shì),平均的下降速率為-0.80億m3/a,2025年的用水量預(yù)測(cè)值為176.8億m3。
圖3 京津冀2019—2025年年用水量預(yù)測(cè)結(jié)果
時(shí)間序列預(yù)測(cè)模型的預(yù)測(cè)結(jié)果往往具有一定的不確定性,這是由時(shí)間序列預(yù)測(cè)模型的計(jì)算原理決定的。時(shí)間序列預(yù)測(cè)法的基本原理是承認(rèn)事物發(fā)展的延續(xù)性,通過(guò)對(duì)過(guò)去的時(shí)間序列進(jìn)行統(tǒng)計(jì)分析,推求出事物發(fā)展的趨勢(shì),并采用數(shù)學(xué)方法消除時(shí)間序列中的隨機(jī)干擾,從而進(jìn)行預(yù)測(cè)?;跁r(shí)間序列的預(yù)測(cè)模型依賴于事件發(fā)生的先后順序,同樣大小的值改變順序后輸入模型產(chǎn)生的結(jié)果是不同的。如果未來(lái)有不可預(yù)測(cè)的突發(fā)事件(如大尺度、持續(xù)性的干旱),預(yù)測(cè)結(jié)果也會(huì)出現(xiàn)很大誤差,即如果各地實(shí)施有別于以往的產(chǎn)業(yè)結(jié)構(gòu)調(diào)整、農(nóng)業(yè)和生活節(jié)水措施,年用水量預(yù)測(cè)的結(jié)果可能有較大誤差。即便如此,它仍然是一種簡(jiǎn)便且有效的年用水量預(yù)測(cè)方法。
a. 京津冀三地1997—2018年的年用水量呈現(xiàn)出不同的變化趨勢(shì),北京和天津地區(qū)的年用水量呈先減后增的非線性變化,而河北省年用水量呈波動(dòng)遞減的趨勢(shì)。
b. 年增長(zhǎng)率法、自回歸模型法和灰色神經(jīng)網(wǎng)絡(luò)法3種年用水量預(yù)測(cè)模型的比較結(jié)果表明,灰色神經(jīng)網(wǎng)絡(luò)方法在京津冀三地表現(xiàn)性最好,可推薦為該地區(qū)年用水量預(yù)測(cè)的首選方法。
c. 基于灰色神經(jīng)網(wǎng)絡(luò)方法的京津冀三地年用水量預(yù)測(cè)結(jié)果表明:2019—2025年,北京市年用水量將保持平穩(wěn),年際變化不大;天津市的年用水量將緩慢增長(zhǎng);河北省的年用水量將繼續(xù)下降。