楊小妮,張凱軒,楊宏剛,于 媛
(1. 西安建筑科技大學華清學院,陜西 西安 710043;2. 西安建筑科技大學環(huán)境與市政工程學院,陜西 西安 710055;3.西安建筑科技大學資源工程學院,陜西 西安 710055)
2004 年起,我國超越美國成為世界第一大廢棄物生產(chǎn)國,城市垃圾的管理已成為城市發(fā)展所要考慮的關(guān)鍵問題,生活垃圾產(chǎn)生量預(yù)測已經(jīng)納入城市環(huán)境衛(wèi)生總體規(guī)劃或城市環(huán)境衛(wèi)生設(shè)施規(guī)劃中。我國學者對城市垃圾產(chǎn)生量的預(yù)測做了大量研究:顧浩欽[1]利用灰色理論對上海市城市生活垃圾產(chǎn)生量進行了預(yù)測。熊蕾蕾[2]運用多元回歸分析方法對徐州市2015—2022 年城市生活垃圾產(chǎn)生量進行預(yù)測。孫昊欣等[3]基于多元回歸對無錫市城市生活垃圾年產(chǎn)生量進行了預(yù)測,但是沒有對優(yōu)選影響因子的過程進行介紹,直接選取了4個相關(guān)系數(shù)大于0.95 的影響因子。章清悅等[4]采用BP 神經(jīng)網(wǎng)絡(luò)對天津市2015—2017 年垃圾產(chǎn)生量進行預(yù)測。何鵬等[5]通過對各項預(yù)測方法特性的分析,選取灰色預(yù)測法,對天水市2017—2027年生活垃圾產(chǎn)生量進行預(yù)測,但是并未對垃圾產(chǎn)生量的影響因素進行定量的分析[5]。張紅玉等[6]運用ARIMA 模型對北京市朝陽區(qū)的建筑垃圾進行了分析和預(yù)測。本研究運用ARIMA 模型預(yù)測已優(yōu)選垃圾產(chǎn)生量影響因素,再利用多元線性回歸模型對未來5 a 西安市城市生活垃圾產(chǎn)生量進行預(yù)測。
西安市2007—2016 年城市生活垃圾清運量見圖1。江村溝是西安市最大的垃圾填埋場,目前90%的西安市城市生活垃圾存放在此,但以目前的垃圾產(chǎn)生量速率,預(yù)計2020 年將達到征地紅線,不得不提前封場,西安市的城市生活垃圾處理問題已迫在眉睫。所以,科學、準確、合理地預(yù)測西安市未來幾年的城市生活垃圾產(chǎn)生量,對做好城市生活垃圾日??刂乒ぷ?、突發(fā)事件情況下的應(yīng)急處置工作,以及城市規(guī)劃管理有著重要意義。
圖1 2007—2016 年西安市生活垃圾清運量
多元線性回歸模型是研究在線性相關(guān)條件下,2 個或2 個以上自變量對一個因變量產(chǎn)生影響。而在城市垃圾產(chǎn)生量的預(yù)測分析中,對生活垃圾的影響因素有多項,受多個變量的影響。回歸分析可以準確地計量各影響因素之間的相關(guān)程度與回歸擬合程度的高低,做出優(yōu)選提高預(yù)測方程的效果。所以多元回歸分析法對生活垃圾產(chǎn)生量的預(yù)測更加方便和準確。
通常,影響城市生活垃圾產(chǎn)生量的主要因素為人口、經(jīng)濟發(fā)展水平、居民生活水平、基礎(chǔ)設(shè)施建設(shè)水平4 個層面[7]。其中人口數(shù)量的增加必然會導致垃圾排放量的增加,隨著西部大開發(fā)以及一帶一路的建設(shè),西安市作為整個西部的核心城市、絲綢之路經(jīng)濟帶的起點,近年來涌入了一大批務(wù)工人員和技術(shù)人才,西安市的人口數(shù)量以及人口密度呈直線上升,同時,旅游接待人數(shù)也是影響城市垃圾產(chǎn)生量的一大重要因素。經(jīng)濟發(fā)展水平包括地區(qū)生產(chǎn)總值和社會商品零售總額。居民生活水平包括居民可支配收入、人均消費性支出和城市氣化率/燃氣率,但是西安市的城市用氣普及率在2010 年已經(jīng)超過99%,其對西安市未來垃圾產(chǎn)生量的影響很小,故本研究不再考慮將該因素作為未來西安市生活垃圾產(chǎn)生量的一個影響因素[8]。基礎(chǔ)設(shè)施建設(shè)水平包括城區(qū)面積、清掃保潔面積、市容環(huán)衛(wèi)專用車輛總數(shù)。表1 為2007—2016 年各影響因子數(shù)據(jù)[9]。
表1 2007—2016 年西安市生活垃圾產(chǎn)生量影響因素統(tǒng)計
為選取合適的影響因素,本研究通過對生活垃圾產(chǎn)生量和影響因子間關(guān)聯(lián)系數(shù)進行計算,將其相關(guān)性進行量化比較從而得到最優(yōu)選,計算方法如下:
式中:rm為y 關(guān)于zm的相關(guān)系數(shù);zmi為第i 個歷史數(shù)據(jù)對應(yīng)的影響因子zm的數(shù)值;yi為第i 個歷史數(shù)據(jù)對應(yīng)的生活垃圾產(chǎn)生量,t;m 為選定影響因子個數(shù);n 為有效歷史數(shù)據(jù)個數(shù),不應(yīng)少于6 a,且應(yīng)滿足n≥m+1,數(shù)據(jù)較為詳實的地區(qū)宜使n≥3(m+1)。
將表1 中各影響因子的數(shù)據(jù)作為建模數(shù)據(jù),帶入相關(guān)系數(shù)計算公式(1),得到表2 中影響因素與城市生活垃圾產(chǎn)生量的相關(guān)系數(shù)。
表2 西安市生活垃圾產(chǎn)生量與影響因素相關(guān)系數(shù)
從表2 可知0.973 1>0.972 6>0.961 2、0.986 0>0.932 8、0.955 0>0.923 0 及0.984 2>0.968 2>0.966 4,因此,在影響因子的選擇中,人口中選擇子因素人口數(shù)量,經(jīng)濟發(fā)展水平中選擇子因素地區(qū)生產(chǎn)總值,居民生活水平中選擇子因素城鎮(zhèn)居民可支配收入,基礎(chǔ)設(shè)施建設(shè)水平中選擇子因素建成區(qū)面積。
選擇影響因素時除參照關(guān)聯(lián)度的分析結(jié)果外,還應(yīng)考慮西安市城市規(guī)劃及發(fā)展對各影響因素產(chǎn)生的影響。2019 年,西安市出臺了最新的落戶政策,不僅在政策上有所放寬,并且在經(jīng)濟上也做出了一定的支持,這讓西安市人才引進計劃得到了進一步發(fā)展,會對人口數(shù)量因素造成一定影響。而目前西安市已建成4 條地鐵線路和1 條機場城際鐵路,共計161.46 km,另有7 條在建項目,致使西安市內(nèi)及其至各大城市間人員流動性大增,對經(jīng)濟狀況有很大的刺激作用。上述情況對地區(qū)生產(chǎn)總值和城鎮(zhèn)居民可支配收入均存在一定影響。同時,2019年,西安市安排棚戶區(qū)改造在建項目30 個,總投資1 423.5 億元,棚戶區(qū)改造前期儲備項目22 個,擬總投資1 173.5 億元,兩者累計棚戶區(qū)改造項目52 個,這對建成區(qū)面積因素有較大影響[10]。綜上所述,本研究中選擇的4 個生活垃圾產(chǎn)生量的影響因素是合理的。
假設(shè)獲得n 組有效的歷史數(shù)據(jù)(z1i,z2i,…,zmi,yi)(i=1,2,...,n),按式(2)構(gòu)建多元線性回歸分析模式對應(yīng)矩陣模型:
式中:Y 為n 組生活垃圾年產(chǎn)生量有效歷史數(shù)據(jù)的矩陣形式,即Y=(y1,y2,y3,…,yn);Z 為n 組選定的影響因子有效歷史數(shù)據(jù)的矩陣形式,
P 為回歸系數(shù)的矩陣形式,即P=(p1,p2,p3,…,pm)。
利用選定的影響因子作為自變量Z,生活垃圾年產(chǎn)生量作為因變量Y,構(gòu)建多元線性回歸分析模型:
式中:P0,P1,P2,…,Pm為回歸系數(shù);Z1,Z2,...,Zm為各影響因子數(shù)據(jù)。
以2007—2014 年所選影響因素和生活垃圾年產(chǎn)生量為基礎(chǔ)數(shù)據(jù),帶入公式(3) 計算得回歸系數(shù)P0、P1、P2、P3、P4,由此可得生活垃圾年產(chǎn)生量的預(yù)測模型:
式中:Z1表示人口數(shù)量,萬人;Z2表示地區(qū)生產(chǎn)總值,億元;Z3表示城鎮(zhèn)居民可支配收入,元;Z4表示建成區(qū)面積,km2。
將已知2015、2016 年所選影響因素數(shù)據(jù)分別帶入公式(4),對2015、2016 年生活垃圾產(chǎn)生量進行預(yù)測并與實際垃圾產(chǎn)生量對比,從而對預(yù)測模型進行檢驗,具體誤差結(jié)果見表3。
表3 西安市生活垃圾產(chǎn)生量多元回歸模型誤差檢驗結(jié)果
由表3 可知,預(yù)測的結(jié)果均大于實際值,且呈放大趨勢,但是2 a 預(yù)測結(jié)果的相對誤差均在20%以內(nèi)。說明已建立的多元線性回歸模型方法具備一定的合理性,但在預(yù)測未來5 a 及以上數(shù)據(jù)時,可能會存在誤差大的缺點,建議該模型在應(yīng)用時只針對未來4 a 內(nèi)的結(jié)果進行預(yù)測。
由于運用多元線性回歸方程對生活垃圾產(chǎn)生量進行預(yù)測,需要所預(yù)測年份的對應(yīng)4 個影響因素的影響數(shù)據(jù),故引入ARIMA 模型對2019 和2020 年各影響因素的數(shù)值進行預(yù)測。
ARIMA 模型,也稱為著名的Box-Jenkins 模型,是由Box 和Jenkins 在70 年代初創(chuàng)立的一種時間序列建模方法。一個ARIMA (p,d,q) 模型就是一個作了d 次差分后的ARIMA (p,q) 模型,而ARIMA (p,q) 是AR(p) 和MA(q) 的組合。針對常見的非平穩(wěn)時間序列,通過差分的方式,變?yōu)橄鄬ζ椒€(wěn)的時間序列。d 為時間序列成為平穩(wěn)時所做的差分次數(shù),代表時序數(shù)據(jù)需要進行幾階差分后才是穩(wěn)定的。AR 是自回歸,p 為自回歸項,一般代表預(yù)測模型中采用的時序數(shù)據(jù)本身的滯后數(shù);MA 為移動平均,q 為移動平均項數(shù),代表預(yù)測模型中采用的預(yù)測誤差的滯后數(shù)[11-12]。
1) 階數(shù)為p 的AR 模型的算法方程如下:
式中:yt表示樣本值;φi(i=1,2,…,p) 表示AR(p) 的參數(shù),αt表示白噪聲序列。
AR 模型反映的是當前t 時刻的樣本值yt,與前t-1 時刻的值yt-1,前t-2 時刻的值yt-2,直到前p 時刻的值yt-p之間的線性關(guān)系。
2) 階數(shù)為q 的MA 算法方程如下:
式中:yt表示樣本值;θi(i=1,2,…,q) 表示MA(q) 的參數(shù);εt表示白噪聲。
MA 體現(xiàn)的是t 時間點的樣本值yt與q+1 個不同時間點的噪聲的關(guān)系。
3) 一個ARMA(p,q) 過程可以視為AR(p)與MA(q) 過程的迭加,模型結(jié)構(gòu)如下:
式中:yt表示樣本值;φi(i=1,2,…,q) 和θi(i=1,2,…,q) 表示ARMA(p,q) 的2 個參數(shù);εt表示白噪聲,且εt~N(0,σ2)。
ARMA 體現(xiàn)的是t 時間點的樣本值yt,和前p個不同時間點的值以及q+1 個不同時間點的噪聲的關(guān)系。
3.4.1 影響因素的ARIMA 預(yù)測
1) 數(shù)據(jù)平穩(wěn)性的檢驗。ARIMA 模型建模的基礎(chǔ)是要確保數(shù)據(jù)的平穩(wěn)性,即數(shù)據(jù)隨時間序列在某一常數(shù)值間隨機在一定范圍內(nèi)波動,本研究采用自相關(guān)圖法進行檢驗。
2) 數(shù)據(jù)平穩(wěn)性處理。采用一階差分法對非平穩(wěn)化數(shù)據(jù)進行平穩(wěn)化處理。
3) 模型定階。以人口數(shù)量這一影響因素為例,利用AIC 準則確定最佳模型階數(shù)為p=2,q=1,d=1。
4) 模型參數(shù)估計。在MATLAB 的庫函數(shù)中調(diào)用最小二乘法對模型參數(shù)進行估計。
5) 殘差白噪聲檢驗。合適的ARIMA 模型盡量擬合線性成分,殘差表現(xiàn)為白噪聲??蓪埐钸M行Q(Ljung-Box) 統(tǒng)計量和自相關(guān)圖分析。檢驗的結(jié)果就是看檢驗概率p 值。本研究中顯著性水平取為0.05。如果檢驗概率p 值大于給定的顯著性水平,就拒絕原假設(shè)(其原假設(shè)是相關(guān)系數(shù)為零),即序列為白噪聲。LB 檢驗結(jié)果見表4,表4 中人口數(shù)量、地區(qū)生產(chǎn)總值、城鎮(zhèn)居民可支配收入、建成區(qū)面積前1~8 階的p 值都顯著大于0.05,說明相關(guān)系數(shù)與零沒有顯著差異,即時間序列中有用的信息已經(jīng)被提取完畢,殘差數(shù)列為白噪聲,故建模成功。
表4 LB 檢驗結(jié)果
6) 數(shù)據(jù)預(yù)測。根據(jù)2007—2016 年人口數(shù)量、地區(qū)生產(chǎn)總值、城鎮(zhèn)居民可支配收入、建成區(qū)面積數(shù)據(jù)分別得到2019、2020 年所選的4 個影響因素預(yù)測數(shù)據(jù),見表5。
表5 西安市城市生活垃圾產(chǎn)生量影響因素預(yù)測
3.4.2 多元回歸預(yù)測
根據(jù)公式(4) 多元線性回歸模型,對西安市2019—2020 年城市生活垃圾產(chǎn)生量加以預(yù)測,其值分別為4.922×106t、5.219×106t??芍跊]有其他不定因素的影響下西安市城市生活垃圾產(chǎn)生量呈逐年快速增長趨勢,在2020 年西安市生活垃圾年產(chǎn)生量將達到5.0×106t以上。
本研究在西安市城市生活垃圾產(chǎn)生量及其影響因素的基礎(chǔ)上,建立了基于多元回歸和ARIMA模型的西安市城市生活垃圾產(chǎn)生量預(yù)測模型,得到以下結(jié)論:
1) 相關(guān)系數(shù)分析表明,西安市城市生活垃圾產(chǎn)生量的主要影響因素為人口數(shù)量、地區(qū)生產(chǎn)總值、城鎮(zhèn)居民可支配收入及建成區(qū)面積;
2) 建立了基于多元線性回歸城市生活垃圾產(chǎn)生量預(yù)測模型,將分析模型的預(yù)測結(jié)果與實際結(jié)果進行對比,相對誤差均在20%以內(nèi),證明多元線性回歸預(yù)測模型的精度在可接受范圍內(nèi),但該模型在預(yù)測未來5 a 及以上的數(shù)據(jù)精度較差;
3) 引入ARIMA 模型,對2019—2020 年各影響因素進行預(yù)測,結(jié)合多元線性回歸模型預(yù)測分析,結(jié)果顯示,2019—2020 年西安市城市生活垃圾產(chǎn)生量將分別達到4.922×106t、5.219×106t,且這2 a 的垃圾產(chǎn)生量增長率將達到6.0%。