朱智偉, 閆文晶, 張海濤, 杜軍凱
(1.河南省水利勘測設計研究有限公司,河南 鄭州 450016; 2.華北水利水電大學,河南 鄭州 450046;3.中國水利水電科學研究院,北京 100044)
城市用水量預測是城市規(guī)劃、發(fā)展的基礎。因其受到人口、經(jīng)濟規(guī)模、產(chǎn)業(yè)結構、水源類型等多方面因素制約,主要影響因素的篩選對于用水量預測的準確性起著至關重要的作用。 基于大數(shù)據(jù)分析的用水量預測方法是當前用水量預測研究熱點,主要作用是摸清城市影響用水量主要因素,并對主要影響因素進行有效的篩選,提高模型數(shù)據(jù)的準確度。目前,常用的城市用水量預測方法有時間序列法、灰色模型法、多元線性回歸分析法、神經(jīng)網(wǎng)絡法[1-6]等。黃瀟瑩等采用ARIMA(Autoregressive Integrated Moving Average model)時間序列模型,對成都市洪水量進行了預測[7-8];趙陽等分析了灰色GM(1,1)的適用性,并預測了張家口城市未來20年的用水量[9-10];羅智豐分析了灰色模型的優(yōu)點,并證明了預測效果的可靠性[11];張雅君等建立了多元回歸模型,并證明了該模型預測用水量回歸性顯著[12-13]。
隨著高質量發(fā)展理論的提出,提高城市用水量模型預測精度顯得尤為重要,特別是對于鄭州市這種嚴重缺水的城市。但近幾年對鄭州市城市用水量預測的研究還比較少。鑒于此,本文以鄭州市2011—2019年總用水量為基礎,建立ARIMA模型、灰色GM(1,1)模型、基于大數(shù)據(jù)分析的多元線性回歸分析模型,從模型擬合誤差和相對誤差2個角度對擬合值進行模型評價以及合理性分析,得出擬合效果最佳的用水量預測方法,以期為鄭州市城市用水預測提供參考。
鄭州市地處華中地區(qū)、黃河下游,是中原地區(qū)唯一的國家一線城市。截至2019年底,鄭州市總人口已增加至1 035.2萬人,城鎮(zhèn)化率達74.58%,GDP總額為11 589.7億元,第一、二、三產(chǎn)業(yè)占比為1.2∶39.8∶59.0,人均水資源占有量209 m3,遠遠低于世界公認極度缺水標準值。鄭州市水資源主要表現(xiàn)為人均占有量不足,時空分布不均:年降雨量多集中于汛期(7—9月份)、不同地區(qū)降雨量為293~635 mm。
考慮到2011年水利普查調(diào)整總用水量數(shù)據(jù)等情況,本文選取2011—2019年總用水量數(shù)據(jù)進行預測。因2018年之前鄭州市用水統(tǒng)計數(shù)據(jù)未統(tǒng)計鞏義市用水量,為了確保數(shù)據(jù)準確性,在2011—2017年用水量數(shù)據(jù)中加入鞏義市用水量數(shù)據(jù)。
數(shù)據(jù)來源于2011—2019年《鄭州統(tǒng)計年鑒》《鄭州市水資源公報》,總用水量數(shù)據(jù)見表1。
表1 2012—2019年鄭州總用水量統(tǒng)計 108m3
2.1.1 ARIMA模型
ARIMA模型是時間序列預測方法之一,該模型主要是將非平穩(wěn)時間序列轉化為平穩(wěn)時間序列,并通過確定模型中階數(shù)和參數(shù)進行預測[14]。模型可以表示為:
(1)
2.1.2 灰色GM(1,1)模型
灰色GM(1,1)是一階、一個變量情況下以微分擬合為核心的建模方法,是灰色預測中最常用的一種方法[15]。該模型的實質是對原始數(shù)據(jù)做一次累加生成,使生成數(shù)據(jù)呈一定規(guī)律,通過建立微分方程模型,求得擬合曲線,用以對系統(tǒng)進行預測[16]。模型可以表示為:
(2)
2.1.3 基于大數(shù)據(jù)分析的多元線性回歸分析模型
大數(shù)據(jù)分析處理原則是:①結合現(xiàn)有公開數(shù)據(jù)資料充分考慮影響用水量的相關因素,將所有相關因素進行PCA主成分分析分解,得出適宜用來做預測的影響因子組合指標;②計算每一個適宜用來做預測的影響因子與用水量之間的相關性,通常用相關度來度量,以此評價不同影響因素的重要性。
PCA的數(shù)學表達式可以表示為:
Zm×k=f(Xm×k),k (3) 式中:Zm×k表示降維后的結構;Xm×n表示原始數(shù)據(jù)矩陣,有m個樣本,每個樣本有n個特征值。 在實際中,城市用水量影響因素之間有一定的相關性,回歸過程中自變量間存在近似的線性關系。基于大數(shù)據(jù)分析的多元線性回歸分析法的基本思想是從人口規(guī)模、經(jīng)濟規(guī)模、產(chǎn)業(yè)結構、用水結構、氣象條件等多角度出發(fā),對多個指標進行大數(shù)據(jù)分析處理,剔除多個相互關聯(lián)的影響因素,篩選出主要影響因素,從而確定回歸方程。 其回歸模型可表示為: Y=β0+β1X1+…+βpXp。 (4) 式中:Y為預測對象的歷史觀測向量;Xi(i=1、2、…、p)為自變量已知值,p為自變量的個數(shù);βi(i=1、2、…、p)為未知參數(shù)(回歸系數(shù))。 2.2.1 用水量預測模型的比選 由于影響城市用水量的因素較多,本文從人口規(guī)模、經(jīng)濟規(guī)模、產(chǎn)業(yè)結構、用水結構、氣象條件等多角度出發(fā),對50多個指標進行分析處理,最終篩選出5個指標作為主要影響因素,其相關度見表2。 表2 用水量影響因子相關度 圖1 用水量預測方法比選流程圖 2.2.2 模型評價指標 本文擬從模型擬合優(yōu)度和擬合誤差2個角度來評價模型的擬合結果。 1)模型擬合優(yōu)度。定義模型擬合優(yōu)度R2為: (5) 擬合優(yōu)度R2越接近于1,則模型的擬合效果越好。 (6) 其中N為觀測個數(shù)。 一直到四月一日,孫山才來電話,說:“小說家這樣寫,S決定先離開果城,得擺脫一切可能的盯梢者,吃過大虧了,不能重蹈覆轍。他找了一個清靜之所,閉關修煉——在云南香格里拉的建唐鎮(zhèn)隱居,那時還不叫香格里拉,叫中甸。他購買了十幾本如何成為一位私家偵探的書籍,潛心研讀,甚至旁涉了法學、心理學、刑偵學等相關學科,對擒拿格斗及槍械也略有興趣,還去散打俱樂部訓練了三個月。一年多之后,他自信遠非吳下阿蒙,萌生了開一家私家偵探社的想法。那個年月,以抓小三、討欠薪、刺探商業(yè)機密等為主要業(yè)務的私家偵探社游走于灰色地帶,在大城市像雨后春筍冒出來——” 1)ARIMA模型。對2011—2019年用水總量數(shù)據(jù)進行判斷處理,最終該確定數(shù)據(jù)變化規(guī)律適用于ARIMA模型,并在反復試驗后,最終確定模型為ARIMA(1,1,1),模型公式為: ΔXt=0.251ΔXt-1+εt-0.980εt-1。 (7) 式中:ΔXt為預測值;ΔXt-1為前一時刻的實際值;εt為擾動隨機項。 2)灰色GM(1,1)模型。利用2011—2019年用水總量作為原始數(shù)據(jù),得出灰色預測用水量基本模型,即: x(1)(k+1)=(x0(1)+560.706)e0.029 6k-560.706。 (8) 3)基于大數(shù)據(jù)分析的多元線性回歸分析模型。由篩選出的污水處理量、建成區(qū)面積、總人口、綠化覆蓋面積、生產(chǎn)總值作為影響用水量的主要因子。利用該5項影響因子,建立多元回歸方程。以2011—2019年各影響因子為自變量,用水量為因變量,進行多元回歸分析,得到以下雙對數(shù)形式的回歸方程: lny=50.216 5+0.000 2lnx1-0.000 9lnx2- 0.043 7lnx3+0.000 4lnx4-0.000 5lnx5。 (9) 式中:x1為污水處理量,t;x2為建成區(qū)面積,km3;x3為總人口,萬人;x4為綠化覆蓋面積,hm2;x5為生產(chǎn)總值,億元;y為用水量,108m3。 基于2011—2019年鄭州市用水總量數(shù)據(jù),采用ARIMA法、灰色GM(1,1)模型法、基于大數(shù)據(jù)分析的多元線性回歸分析法進行用水量預測,預測結果如圖2所示。 圖2 3種模型預測結果 將預測結果代入式(5)進行計算,ARIMA模型、灰色GM(1,1)模型和基于大數(shù)據(jù)分析的多元回歸分析模型的擬合優(yōu)度R2分別是0.800、0.867、0.946。由此可知,相較于ARIMA模型和灰色GM(1,1)模型,基于大數(shù)據(jù)分析的多元回歸分析模型的擬合效果最好。 3種模型預測值相對誤差見表3,由表3可知:基于大數(shù)據(jù)分析的多元回歸分析模型擬合值的平均相對誤差為1.758%,小于ARIMA模型和灰色GM(1,1)模型的擬合值相對誤差,且相對誤差均小于5%。因此,基于大數(shù)據(jù)分析的多元回歸分析模型預測精度高于ARIMA模型和灰色GM(1,1)模型,預測結果更準確。 表3 3種模型預測值相對誤差 % 綜上所述,基于大數(shù)據(jù)分析的多元回歸分析模型無論從擬合優(yōu)度結果還是擬合誤差結果來看都優(yōu)于來色GM(1,1)模型和ARIMA模型。 利用基于大數(shù)據(jù)分析的多元回歸分析模型預測出“十四五”(2020—2025年)期間鄭州市用水量分別為22.07億、22.56億、23.06億、23.55億、24.05億、24.54億m3。由預測結果可以看出,鄭州市用水量在未來幾年呈現(xiàn)緩慢增加趨勢。 鄭州市進入國家中心城市的建設行列,經(jīng)濟社會高速發(fā)展、人口急速增加,鄭州市用水總量近幾年呈現(xiàn)逐年遞增趨勢,尤其是生態(tài)用水和生活用水。 ARIMA模型能夠針對城市用水量波動特點和預報要求,將前一時刻的實際值作為下一時刻預測值。本文運用該模型,得出預測值的平均相對誤差2.394%,擬合優(yōu)度0.800,說明該方法可以用于鄭州市城市用水量預測。灰色GM(1,1)模型法適用于數(shù)據(jù)系統(tǒng)呈指數(shù)增長的情況,本文基于2011—2019年鄭州市總用水量數(shù)據(jù),建立灰色模型,得到預測值的平均相對誤差2.062%,擬合優(yōu)度0.867,可用于鄭州市城市用水量預測;基于大數(shù)據(jù)分析的多元線性回歸分析模型得到2011—2019年鄭州市用水量預測值平均相對誤差1.758%,擬合優(yōu)度0.946,證明了該模型在鄭州市用水量預測中的適用性。 從總用水數(shù)據(jù)來看,近幾年鄭州市城市用水總量不斷攀升,其主要原因有:①鄭州市過去大力發(fā)展經(jīng)濟,造成河道污染嚴重、地下水開采過度、形成地下水漏斗,生態(tài)惡化,從而近幾年生態(tài)補水持續(xù)增加;②鄭州市近幾年夏季持續(xù)高溫,日供水持續(xù)攀升;③鄭州市進入國家中心城市的建設行列,經(jīng)濟社會快速發(fā)展、人口急速增加,總用水量逐年攀升。 從生活用水數(shù)據(jù)來看,2019年鄭州市生活用水量突變,主要原因在于多處城鎮(zhèn)居民家中存在管道暗漏,造成城鎮(zhèn)居民用水量陡然增加;生態(tài)用水方面,由于鄭州市過去大力發(fā)展經(jīng)濟,造成河道污染嚴重、地下水開采過度、已形成地下水漏斗,生態(tài)惡化,生態(tài)補水在未來幾年依舊會持續(xù)增加,且根據(jù)“十四五”規(guī)劃鄭州計劃增加建成區(qū)綠地覆蓋率和人均公園面積,生態(tài)用水量勢必持續(xù)增加;近兩年工業(yè)用水和農(nóng)業(yè)用水已開始下降,但隨著鄭州市進入國家中心城市的建設行列,經(jīng)濟社會的快速發(fā)展、人口的急速增加,近幾年農(nóng)業(yè)、工業(yè)用水量下降幅度不會太大。因此,鄭州市未來幾年用水量仍會呈現(xiàn)增加趨勢。 1)采用ARIMA模型、灰色GM(1,1)模型、基于大數(shù)據(jù)分析的多元線性回歸分析3種方法預測鄭州市2011—2019年用水量,從模型擬合優(yōu)度和擬合誤差2個角度對擬合值進行評價以及合理性分析,最終得到基于大數(shù)據(jù)分析的多元線性回歸分析模型在鄭州市用水量預測中明顯優(yōu)于其他2個模型。 2)基于大數(shù)據(jù)分析的用水量預測方法不僅可以結合現(xiàn)有公開數(shù)據(jù)資料充分考慮影響用水量的相關因素,還可以避免因各影響因素間的非獨立性而影響預測精度。 3)預測出“十四五”——2020—2025年鄭州市用水量分別為22.07億、22.56億、23.06億、23.55億、24.05億、24.54億m3。2.2 用水量預測方法的比選方案
3 預測方法的應用
3.1 模型構建
3.2 模型結果及分析
3.3 預測結果合理性分析
4 結語