許德合,丁 嚴(yán),張 棋,黃會(huì)平
(華北水利水電大學(xué),鄭州450000)
干旱災(zāi)害是常見的自然災(zāi)害之一,其發(fā)生的主要原因是一段時(shí)期內(nèi)降水量的減少,若遇到高溫、大風(fēng)和低溫等異常氣候,則會(huì)進(jìn)一步加重干旱程度[1]。通常情況下,長(zhǎng)時(shí)間的干旱將導(dǎo)致地區(qū)水資源供應(yīng)不足,影響正常的農(nóng)業(yè)生產(chǎn)和經(jīng)濟(jì)發(fā)展,造成不可估量的經(jīng)濟(jì)損失[2]。因此,如何對(duì)干旱的發(fā)生情況進(jìn)行準(zhǔn)確評(píng)估、監(jiān)測(cè)和分析,成為了國內(nèi)外學(xué)者研究的熱門議題[3,4]。在對(duì)干旱進(jìn)行研究的過程中,常使用易于進(jìn)行對(duì)比分析和計(jì)算的干旱指標(biāo)來評(píng)估干旱程度、持續(xù)時(shí)間和影響范圍[5-7]。常用的干旱評(píng)價(jià)指標(biāo)有標(biāo)準(zhǔn)化降水指數(shù)(Standard Precipitation Index,SPI)、標(biāo)準(zhǔn)化降水蒸散指數(shù)(Standard Precipitation Evaporation Index,SPEI)、帕默爾干旱指數(shù)(Plamer Drought Severity Index,PDSI)等[8-13],其中SPI的運(yùn)用最為廣泛。SPI是用來描述一段時(shí)間內(nèi)降水量出現(xiàn)頻率多少的指標(biāo),可應(yīng)用于不同時(shí)間尺度下的計(jì)算,干旱分級(jí)精度相對(duì)較高[14-16]。不同時(shí)間尺度的SPI能夠反映不同類型的干旱,1個(gè)月時(shí)間尺度的SPI適用于季節(jié)干旱的分析,6 個(gè)月時(shí)間尺度的SPI可用于分析農(nóng)業(yè)干旱,長(zhǎng)時(shí)間尺度的SPI適于分析水文干旱。
近幾年,國內(nèi)干旱災(zāi)害時(shí)常發(fā)生,其中以西北地區(qū)最為嚴(yán)重[17]。對(duì)新疆維吾爾自治區(qū)不同地區(qū)的干濕變化進(jìn)行研究,探索不同時(shí)期的降水量對(duì)區(qū)域產(chǎn)生的影響,明確干旱的成因機(jī)制,可為相關(guān)部門在制定有效干旱應(yīng)對(duì)措施時(shí)提供幫助,減少干旱災(zāi)害所帶來的經(jīng)濟(jì)損失[1]。目前,常用的干旱預(yù)測(cè)模型有差分自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average Model,ARIMA)、支持向量機(jī)(Support Vector Machine,SVM)等。其中ARIMA 模型是最常用的數(shù)據(jù)驅(qū)動(dòng)模型,常用于時(shí)間序列數(shù)據(jù)的預(yù)測(cè)。韓萍等利用ARIMA 模型對(duì)多個(gè)時(shí)間尺度的SPI進(jìn)行預(yù)測(cè),并對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析,得出ARIMA 模型較適合SPI3、SPI6、SPI9序列的短期預(yù)測(cè),適合SPI12、SPI24序列長(zhǎng)期預(yù)測(cè)的結(jié)論[18];李佳佳等為識(shí)別長(zhǎng)江流域月降水周期振蕩和長(zhǎng)期趨勢(shì)的顯著影響因子,應(yīng)用集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)方法,分別對(duì)各站點(diǎn)的月降水序列進(jìn)行分解[19];王佳等基于EEMD-ANN(Artificial Neural Network,ANN)預(yù)報(bào)模型預(yù)測(cè)入庫徑流量,結(jié)果表明使用EEMD-ANN 可以較為精準(zhǔn)地進(jìn)行徑流量預(yù)測(cè)[20];李輝等為提取機(jī)組故障特征,將EEMD 與SOM 神經(jīng)網(wǎng)絡(luò)結(jié)合進(jìn)行故障自動(dòng)識(shí)別,結(jié)果表明該方法可以準(zhǔn)確提取機(jī)組故障特征且計(jì)算速度快[21];李勃旭等為確定地鐵門傳動(dòng)系統(tǒng)的退化狀態(tài),采用EMD-ARIMA 模型對(duì)夾緊力峰值的均值和標(biāo)準(zhǔn)差進(jìn)行預(yù)測(cè),結(jié)果表明EMD-ARIMA 模型能夠較好的預(yù)測(cè)夾緊力的峰值[22]。利用氣象站點(diǎn)監(jiān)測(cè)到的降雨量值計(jì)算得到的SPI序列屬于典型的非平穩(wěn)時(shí)間序列,而ARIMA模型能夠更多的提取原始序列的信息,常用于處理非平穩(wěn)的時(shí)間序列,因此可以利用ARIMA模型預(yù)測(cè)SPI序列[23]。EEMD 能夠提取出原始信號(hào)在不同尺度的局部特征信號(hào),精準(zhǔn)地反映出原時(shí)間序列信號(hào)的物理特性,從而為模型預(yù)測(cè)提供穩(wěn)定的前提。EEMD-ARIMA 模型集合了EEMD 和ARIMA 模型的優(yōu)點(diǎn),通過EEMD 分解得到時(shí)間序列平穩(wěn)的局部特征,有利于ARIMA 模型的預(yù)測(cè),可以提高模型的預(yù)測(cè)精度。因此,本文利用EEMD-ARIMA 組合模型對(duì)多尺度SPI序列進(jìn)行預(yù)測(cè),分析模型在干旱預(yù)測(cè)中的應(yīng)用及優(yōu)勢(shì),以期為干旱防控工作提供幫助。
本文通過對(duì)新疆維吾爾自治區(qū)32 個(gè)氣象站點(diǎn)于1960-2019年間收集到的降水量數(shù)據(jù)進(jìn)行計(jì)算,得到不同時(shí)間尺度的SPI,通過ARIMA 模型和EEMD-ARIMA 組合模型,分別對(duì)1、3、6、9、12、24,6個(gè)時(shí)間尺度的SPI進(jìn)行預(yù)測(cè),并采用平均絕對(duì)誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)、決定系數(shù)(R-Square,R2)對(duì)兩種模型的預(yù)測(cè)精度進(jìn)行評(píng)價(jià)。由于計(jì)算處理的數(shù)據(jù)量大,受論文篇幅限制無法展示所有數(shù)據(jù)的處理結(jié)果,加之本文側(cè)重于講述組合模型在干旱預(yù)測(cè)中的優(yōu)勢(shì),故在文中僅以分布在整個(gè)新疆地區(qū)3 個(gè)不同方位上的福海站、巴音布魯克站、莎車站為例,分析組合模型的預(yù)測(cè)結(jié)果,并進(jìn)行兩種模型預(yù)測(cè)結(jié)果的對(duì)比和分析。兩種模型對(duì)32 個(gè)站點(diǎn)多尺度SPI的預(yù)測(cè)結(jié)果,結(jié)合ArcGIS 的經(jīng)驗(yàn)貝葉斯克里金插值法在文末進(jìn)行可視化展示和分析。
新疆維吾爾自治區(qū)地理坐標(biāo)介于34°25'N~48°10'N、73°40'E~96°18'E 之間。省域內(nèi)平均海拔約1 000 m,區(qū)域北部有阿爾泰山,南部有昆侖山系,省域中部的天山以北為準(zhǔn)噶爾盆地,南部為塔里木盆地。新疆維吾爾自治區(qū)遠(yuǎn)離海洋,區(qū)域地形復(fù)雜,四周高山環(huán)繞,海洋氣流不易到達(dá),致使區(qū)域內(nèi)氣候干燥,是典型的干旱、半干旱地區(qū)。區(qū)域年平均降水量在150 mm 左右,區(qū)域北部的降水量高于南部,各地降水量相差很大。受氣候和地理環(huán)境的影響,新疆維吾爾自治區(qū)生態(tài)環(huán)境脆弱,各種自然災(zāi)害頻繁發(fā)生,在全球氣候變暖的形勢(shì)下,干旱災(zāi)害產(chǎn)生的影響呈現(xiàn)出擴(kuò)大化的趨勢(shì)[24,25]。
圖1 研究區(qū)域及氣象站點(diǎn)分布Fig.1 Distribution of meteorological stations in study area
本文所用逐日降水量數(shù)據(jù)來源于國家氣象科學(xué)數(shù)據(jù)中心(http://data.cma.cn/)中新疆維吾爾自治區(qū)氣象站觀測(cè)數(shù)據(jù)。所用新疆維吾爾自治區(qū)地理高程數(shù)據(jù)來源于地理空間數(shù)據(jù)云(http://www.gscloud.cn/search)。表1 為所選3 個(gè)示例站點(diǎn)的信息。
表1 示例氣象站點(diǎn)信息Tab.1 Information of sample meteorological stations
2.2.1 標(biāo)準(zhǔn)化降水指數(shù)(SPI)
近年來,國內(nèi)外學(xué)者常使用SPI指數(shù)進(jìn)行氣象干旱研究。SPI指數(shù)是通過計(jì)算出某時(shí)段內(nèi)降水量的Γ 分布概率,經(jīng)正態(tài)標(biāo)準(zhǔn)化處理后,根據(jù)處理結(jié)果劃分干旱等級(jí)。它可以用來反映一段時(shí)間內(nèi)降水量出現(xiàn)頻率的多少,易于計(jì)算且能直觀反映氣象干旱的程度[26]。SPI的具體計(jì)算過程參見氣象干旱等級(jí)(GB/T20481-2017)。依據(jù)國家標(biāo)準(zhǔn)氣象干旱等級(jí)(GB/T20481-2017)規(guī)定的干旱分級(jí)標(biāo)準(zhǔn)(表2),根據(jù)計(jì)算得到的SPI,確定區(qū)域的干旱類型。
表2 標(biāo)準(zhǔn)化降水指數(shù)干旱分級(jí)Tab.2 Drought classification based on SPI
SPI1、SPI3、SPI6、SPI9、SPI12、SPI24分別對(duì)應(yīng)1、3、6、9、12、24個(gè)月時(shí)間尺度的SPI。短時(shí)間尺度的SPI常用來反映短期內(nèi)的降雨量變化。SPI1適用于氣象干旱,可用于反映短期降水變化情況。3個(gè)月時(shí)間尺度下的SPI用來描述降雨量的季節(jié)變化,計(jì)算出的SPI3中5、8、11、2月數(shù)據(jù)可分別用于描述春、夏、秋、冬的干旱情況。6 個(gè)月時(shí)間尺度下的SPI適用于農(nóng)業(yè)干旱。長(zhǎng)時(shí)間尺度的SPI常用來分析長(zhǎng)期的干旱趨勢(shì)。SPI9可用于表征較長(zhǎng)時(shí)間內(nèi)的地下水位變化。SPI12的時(shí)間周期較長(zhǎng),能較清楚的描述年際降雨量變化情況,24 個(gè)月時(shí)間尺度的SPI序列則用于分析長(zhǎng)期的降水變化所引起的干旱[27-29]。
2.2.2 ARIMA模型
自回歸移動(dòng)平均模型(Auto-Regressive and Moving Average Model,ARMA)的建模思想是將預(yù)測(cè)值假定為一組隨機(jī)序列,確定能夠近似描述這組序列的模型,之后根據(jù)該序列的過去值和現(xiàn)在值,對(duì)未來值進(jìn)行預(yù)測(cè)[30]。ARMA 模型分為自回歸模型(Auto-Regressive,AR)、滑動(dòng)平均模型(Moving-Average,MA)以及ARMA。只要是平穩(wěn)且非白噪聲的時(shí)間序列皆可通過建立ARMA 模型進(jìn)行預(yù)測(cè),但大多數(shù)時(shí)間序列都是非平穩(wěn)時(shí)間序列。因此,在時(shí)間序列具有某種趨勢(shì)時(shí),需要對(duì)時(shí)間序列進(jìn)行d次差分,使其成為平穩(wěn)序列。進(jìn)行d次差分后的ARMA 模型即為ARIMA模型。ARIMA(p,d,q)模型的一般式為:
式中:Ht為時(shí)間序列值;φi(i= 1,2,…,p)和θj(j= 1,2,…,q)分別為自回歸系數(shù)和滑動(dòng)平均系數(shù);ut為白噪聲序列,且ut~N(0,σ2)。
ARIMA模型建模流程為:
(1)平穩(wěn)性檢驗(yàn)。本文使用單位根檢驗(yàn)(Augmented Dickey-Fuller Test,ADF)法進(jìn)行判斷。在ADF 檢驗(yàn)中,原假設(shè)為非平穩(wěn)時(shí)間序列且存在單位根,給定顯著水平α=0.05,若檢驗(yàn)統(tǒng)計(jì)量對(duì)應(yīng)的概率值(P)小于0.05,則拒絕原假設(shè)[31,32]。對(duì)于非平穩(wěn)的時(shí)間序列需要進(jìn)行差分,得到平穩(wěn)序列。
(2)p、q取值范圍確定。根據(jù)數(shù)據(jù)的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)來確定模型階數(shù)p、q的取值范圍。
(3)模型定階。采用赤池信息準(zhǔn)則(Akaike Information Criterion,AIC)、貝葉斯信息準(zhǔn)則(Bayesian Information Criterion,BIC)進(jìn)行模型定階,AIC、BIC公式如下:
式中:N為參數(shù)個(gè)數(shù)。
在不同p和q組合的模型中,選擇AIC、BIC的最小值所對(duì)應(yīng)的參數(shù),從而得到最優(yōu)ARIMA模型。
2.2.3 EEMD分解
1998年N E Huang 等人提出了經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD),EMD 能夠完美地適應(yīng)于全部的非線性、非平穩(wěn)信號(hào)的處理,并且經(jīng)過該方法處理后的結(jié)果具有相當(dāng)高的信噪比[33]。原始序列輸入EMD 后得到有限個(gè)固有模態(tài)函數(shù)(Intrinsic Mode Function,IMF)和余量,各IMF分量包含了原始序列不同時(shí)間尺度的局部特征,盡可能地保留原始數(shù)據(jù)的 特 性[22]。EEMD 是EMD 的 一種改進(jìn)方法,與EMD相比,EEMD在信號(hào)中加入了高斯白噪聲,高斯白噪聲以其均勻分布的特性補(bǔ)償了IMF分量的損失,其步驟算法如下[34]:
(1)在原始數(shù)據(jù)Y(t)中添加正態(tài)分布的白噪聲序列ωi(t),試驗(yàn)次數(shù)為i;
(2)進(jìn)行EMD 分解,將含有白噪聲的原始數(shù)據(jù)分解為IMF的組合;
(3)每次都加入服從同一分布的不同白噪聲序列,重復(fù)步驟1和2,得到一組不同的IMF成分和殘差;
(4)以所有IMF的均值作為最終的IMF組。
最終的分解結(jié)果為:
2.2.4 EEMD-ARIMA模型
通過Python編程語言,將EEMD 與ARIMA 模型結(jié)合為新的預(yù)測(cè)方法EEMD-ARIMA 模型。組合模型先利用EEMD 將有非平穩(wěn)特征的時(shí)間序列SPI分解為N項(xiàng)含有原序列局部特征的序列,再利用ARIMA 模型對(duì)這些序列分別進(jìn)行預(yù)測(cè),最后把各項(xiàng)預(yù)測(cè)結(jié)果求和得到該序列的最終預(yù)測(cè)結(jié)果,這樣的預(yù)測(cè)結(jié)果比直接用ARIMA 模型預(yù)測(cè)的非平穩(wěn)時(shí)間序列SPI的結(jié)果具有更高的精度。使用EEMD-ARIMA模型進(jìn)行預(yù)測(cè)的步驟如下:
(1)EEMD 處理。將降水量數(shù)據(jù)導(dǎo)入EEMD 進(jìn)行分解,原始序列分解為從高頻到低頻的IMF1、IMF2、…、IMFn以及殘差量。殘差量即趨勢(shì),將其記為IMFn+1。
(2)ARIMA 模型處理。將IMF1、IMF2、…、IMFn+1,分別導(dǎo)入ARIMA模型進(jìn)行預(yù)測(cè),對(duì)各個(gè)分量進(jìn)行平穩(wěn)性檢驗(yàn)和模型定階,并將預(yù)測(cè)結(jié)果輸出。預(yù)測(cè)結(jié)果記為P1、P2、…、Pn+1。
(3)對(duì)P1、P2、…、Pn+1進(jìn)行相加求和。
EEMD-ARIMA模型建立流程見圖2。
圖2 EEMD-ARIMA模型建立流程Fig.2 EEMD-ARIMA combined model forecast flow chart
常見的回歸預(yù)測(cè)評(píng)估指標(biāo)有MAE、均方誤差(Mean Square Error,MSE)、RMSE,其中MAE和MSE是基礎(chǔ)的評(píng)估指標(biāo),RMSE是MSE指標(biāo)的擴(kuò)展,相較MSE指標(biāo)更加準(zhǔn)確。為了比較各模型預(yù)測(cè)精度的高低,本文選定了RMSE、MAE和R23 種評(píng)價(jià)指標(biāo)對(duì)ARIMA 模型和EEMD-ARIMA 組合模型的預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià)。RMSE是用來衡量觀測(cè)值與真實(shí)值之間的偏差,MAE是絕對(duì)誤差的平均值,能夠更好地反映預(yù)測(cè)值誤差的實(shí)際情況,RMSE和MAE的值越小,模型效果越好。R2是將預(yù)測(cè)值與均值進(jìn)行對(duì)比,R2越大,表示擬合效果越好,最大值為1。
式中:xi是觀測(cè)值;yi是真實(shí)值;是yi的平均值為預(yù)測(cè)值;N為樣本數(shù)。
依據(jù)國家氣象信息中心提供的中國地面氣候資料月值數(shù)據(jù)集,選擇1960-2019年新疆維吾爾自治區(qū)境內(nèi)32 個(gè)氣象站點(diǎn)持續(xù)測(cè)定的逐月降水量數(shù)據(jù),進(jìn)行多尺度SPI的計(jì)算。由于SPI在不同時(shí)間尺度適用于不同種類的干旱,因此選取了1、3、6、9、12、24 共6 個(gè)時(shí)間尺度[18]。將計(jì)算得到的SPI序列,分別記為SPI1、SPI3、SPI6、SPI9、SPI12、SPI24。
通過Python3.6 對(duì)ARIMA 建模。經(jīng)過ADF 檢驗(yàn),SPI1、SPI3、SPI6、SPI9、SPI12、SPI24的P值均小于0.05,故為平穩(wěn)時(shí)間序列。通過ACF、PACF進(jìn)行模型定階,選擇當(dāng)AIC、BIC值最小時(shí)對(duì)應(yīng)的p、q值[35],各序列的模型定階結(jié)果見表3,即為各時(shí)間尺度的最優(yōu)模型。選取1960-2007年數(shù)據(jù)作為訓(xùn)練集,2008-2019年數(shù)據(jù)作為測(cè)試集。應(yīng)用32個(gè)氣象站點(diǎn)各時(shí)間尺度的ARIMA 最優(yōu)模型對(duì)SPI序列進(jìn)行預(yù)測(cè)。示例站點(diǎn)的預(yù)測(cè)結(jié)果分別見圖4、圖5和圖6。
表3 六尺度SPI序列的ARIMA模型定階Tab.3 Order the ARIMA model based on six scales SPI values
EEMD能夠?qū)⒃夹盘?hào)逐級(jí)分解并提取出其在不同尺度的局部特征信號(hào),從而準(zhǔn)確反映出原時(shí)間序列信號(hào)的物理特性。在分解過程中,需要對(duì)Nstd和NE進(jìn)行設(shè)置。Nstd用于設(shè)置添加高斯白噪聲的標(biāo)準(zhǔn)差,取值范圍一般為0.01~0.4,具體設(shè)置數(shù)值根據(jù)原信號(hào)中的噪聲干擾大小,視具體情況確定。NE是添加噪聲的次數(shù),通常取值為50或100。利用EEMD對(duì)多尺度SPI進(jìn)行分解,經(jīng)過多次參數(shù)修改及其分解結(jié)果的對(duì)比,最終將Nstd設(shè)置為0.2,NE設(shè)置為100。將加入白噪聲序列的原始序列進(jìn)行分解,得到8 個(gè)IMF分量和1 個(gè)殘差數(shù)據(jù),如圖3 所示為對(duì)福海站SPI3序列進(jìn)行EEMD 分解得到的結(jié)果。從圖3 中可以看出,分解出的時(shí)間序列均圍繞0 值上下波動(dòng),趨于平穩(wěn),說明通過EEMD進(jìn)行分解能夠降低原始序列的非平穩(wěn)性。
圖3 EEMD分解結(jié)果Fig.3 EEMD decomposition results
選取1960-2007年數(shù)據(jù)作為訓(xùn)練集,2008-2019年數(shù)據(jù)作為測(cè)試集。將EEMD 分解得到的1960-2007年數(shù)據(jù)輸入ARIMA 模型進(jìn)行預(yù)測(cè),并以ARIMA 模型預(yù)測(cè)結(jié)果之和作為預(yù)測(cè)的最終結(jié)果。將6 個(gè)時(shí)間尺度的SPI實(shí)際計(jì)算值、ARIMA 模型預(yù)測(cè)值、EEMD-ARIMA 模型預(yù)測(cè)值進(jìn)行對(duì)比展示。3 個(gè)示例站點(diǎn)的預(yù)測(cè)對(duì)比圖分別為圖4、圖5和圖6。
圖4 基于ARIMA模型與EEMD-ARIMA組合模型對(duì)福海站多時(shí)間尺度SPI值的預(yù)測(cè)結(jié)果與觀測(cè)值計(jì)算結(jié)果對(duì)比(2008-2019)Fig.4 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Fuhai Station(2008-2019)
圖5 基于ARIMA模型與EEMD-ARIMA組合模型對(duì)巴音布魯克站多時(shí)間尺度SPI值的預(yù)測(cè)結(jié)果與觀測(cè)值計(jì)算結(jié)果對(duì)比(2008-2019)Fig.5 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Bayinbuluke Station(2008-2019)
圖6 基于ARIMA模型與EEMD-ARIMA組合模型對(duì)莎車站多時(shí)間尺度SPI值的預(yù)測(cè)結(jié)果與觀測(cè)值計(jì)算結(jié)果對(duì)比(2008-2019)Fig.6 Comparison of predicted and observed value of multi-time scale SPI of ARIMA model and EEMD-ARIMA combined model in Shache Station(2008-2019)
由圖4(a)可知,2010年、2012年、2018年,福海站旱情最為嚴(yán)重,EEMD-ARIMA 組合模型的計(jì)算結(jié)果與實(shí)際情況最為接近,較為精確的預(yù)測(cè)到了嚴(yán)重干旱的發(fā)生,在這些時(shí)間段中組合模型的預(yù)測(cè)值比ARIMA 模型的預(yù)測(cè)值更接近SPI實(shí)際計(jì)算值。在圖5(a)中2018年,組合模型的預(yù)測(cè)結(jié)果更符合實(shí)際情況,這表明組合模型對(duì)極端天氣預(yù)測(cè)結(jié)果的準(zhǔn)確度要高于單一模型。根據(jù)組合模型的預(yù)測(cè)結(jié)果可知,3 個(gè)站點(diǎn)在2008年和2014年有嚴(yán)重干旱發(fā)生,這與新疆年鑒中對(duì)大范圍干旱的記錄一致。圖4(b)2010-2011年,圖5(a)2016-2017年SPI值異常,在快速增長(zhǎng)后快速下降,對(duì)于這種異常變化,通過組合模型預(yù)測(cè)得到的干旱情況更接近實(shí)際的變化情況。根據(jù)圖4、圖5 和圖6 的(c)、(d)、(e)、(f)圖可以看到,兩種模型的預(yù)測(cè)值均與實(shí)際計(jì)算得到的SPI值接近,但隨著時(shí)間尺度的增大,單一模型預(yù)測(cè)結(jié)果延遲越發(fā)明顯,在24 個(gè)月時(shí)間尺度,與實(shí)際計(jì)算結(jié)果相比有近一個(gè)月的延遲。而組合模型隨著時(shí)間尺度的增大,預(yù)測(cè)結(jié)果與實(shí)際計(jì)算結(jié)果更為接近。從3個(gè)站點(diǎn)的多尺度SPI對(duì)比中可以明顯看到,兩種模型在1 個(gè)月時(shí)間尺度下的預(yù)測(cè)值與實(shí)際值有明顯差異。在各時(shí)間尺度下,組合模型的預(yù)測(cè)值與SPI實(shí)際值之間的差值均小于單一模型預(yù)測(cè)值與SPI實(shí)際值的差值,表明組合模型在6 個(gè)時(shí)間尺度下均能更好的預(yù)測(cè)SPI序列。
為驗(yàn)證EEMD-ARIMA 組合模型和ARIMA 模型在6個(gè)時(shí)間尺度下的預(yù)測(cè)精度,通過MAE、RMSE、R2對(duì)兩種模型在6個(gè)時(shí)間尺度下的預(yù)測(cè)結(jié)果進(jìn)行了評(píng)價(jià),結(jié)果見表4。RMSE和MAE的取值范圍為[0,+∞],取值越小,模型效果越好,當(dāng)值為0 時(shí),說明模型完美。R2取值越大,表示擬合效果越好,最大值為1,當(dāng)值為1 時(shí)表明模型預(yù)測(cè)效果最佳。對(duì)比3 個(gè)站點(diǎn)在不同時(shí)間尺度下的組合模型和單一模型的MAE、RMSE、R2值發(fā)現(xiàn),組合模型在任一時(shí)間尺度下的MAE、RMSE值均小于單一模型的值,且在任一時(shí)間尺度下的R2值均大于單一模型的值,說明EEMDARIMA 組合模型在各個(gè)時(shí)間尺度下的預(yù)測(cè)精度均高于單一模型,表明組合模型更適用于多時(shí)間尺度下的時(shí)間序列預(yù)測(cè)。組合模型在1個(gè)月時(shí)間尺度時(shí),預(yù)測(cè)精度遠(yuǎn)高于單一模型,隨著時(shí)間尺度的增加,兩種模型預(yù)測(cè)精度之間的差距逐漸縮小,在24個(gè)月時(shí)間尺度時(shí)達(dá)到最小,表明組合模型在1、3 個(gè)月時(shí)間尺度下的預(yù)測(cè)結(jié)果遠(yuǎn)優(yōu)于單一模型,在6、9個(gè)月時(shí)間尺度時(shí),優(yōu)于單一模型,在12、24 個(gè)月時(shí)間尺度下略優(yōu)于單一模型。隨著時(shí)間尺度的增加,SPI序列特征趨于平穩(wěn),ARIMA模型對(duì)序列的擬合效果逐漸提升。
表4 ARIMA模型和EEMD-ARIMA組合模型的MAE、RMSE、R2值Tab.4 MAE、RMSE and R2 values for ARIMA and EEMD-ARIMA models
結(jié)合ArcGIS的空間分析功能,利用經(jīng)驗(yàn)貝葉斯克里金插值法對(duì)2019年32 個(gè)站點(diǎn)的SPI實(shí)際觀測(cè)計(jì)算值和預(yù)測(cè)值進(jìn)行可視化(如圖7)。由于不同時(shí)間尺度的SPI適用情況不同,且新疆的春旱威脅最大,其次為夏旱和秋旱[36],故此處選擇能夠進(jìn)行降雨量季節(jié)變化分析的SPI3,對(duì)新疆維吾爾自治區(qū)春、夏、秋、冬的干旱情況進(jìn)行插值可視化。從圖7 中可以看到EEMD-ARIMA 組合模型在四季的預(yù)測(cè)結(jié)果與實(shí)際情況接近,較ARIMA 模型的預(yù)測(cè)結(jié)果更符合實(shí)際。
圖7 基于SPI實(shí)際值、ARIMA模型預(yù)測(cè)值和EEMD-ARIMA模型預(yù)測(cè)值的季尺度干旱空間分布Fig.7 Spatial distributions of seasonal drought levels based on the actual values and the predicted results of models
ARIMA 模型和EEMD-ARIMA 組合模型對(duì)SPI的預(yù)測(cè)精度隨時(shí)間尺度的增加而提高,并在24 個(gè)月時(shí)間尺度時(shí)達(dá)到最高。從SPI的計(jì)算公式來看,隨著時(shí)間尺度的增加,SPI序列中集合了原始數(shù)據(jù)中更多的信息,因此,預(yù)測(cè)值對(duì)實(shí)際計(jì)算值的擬合更為充分。從結(jié)果來看,EEMD-ARIMA 組合模型的預(yù)測(cè)結(jié)果比單一模型的預(yù)測(cè)結(jié)果更接近實(shí)際情況,這是因?yàn)橥ㄟ^ARIMA模型對(duì)多尺度SPI進(jìn)行預(yù)測(cè)存在特征不平穩(wěn)的情況,而EEMD可以通過提取出原始時(shí)序在不同尺度的局部特征,從而將SPI數(shù)據(jù)序列平穩(wěn)化,為ARIMA 預(yù)測(cè)提供穩(wěn)定的前提。因此,EEMD-ARIMA 組合模型優(yōu)于單一模型,能夠用于新疆地區(qū)的干旱預(yù)測(cè)。
新疆四季降水不均,四季的干旱情況不同,以春旱最為嚴(yán)重,秋旱和夏旱次之。因此,文中主要考慮了降水量對(duì)區(qū)域的影響,選取了3 個(gè)月尺度的SPI進(jìn)行可視化展示。在對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析時(shí),也側(cè)重于對(duì)3 個(gè)月尺度的計(jì)算結(jié)果的分析。但河流、植物覆蓋等都會(huì)對(duì)干旱情況產(chǎn)生影響,1978-2008年新疆耕地面積總體呈增加的趨勢(shì),農(nóng)作物的增加對(duì)地區(qū)的水利設(shè)施造成負(fù)擔(dān),減弱了地區(qū)的抗旱能力,造成干旱程度的進(jìn)一步加劇。在之后的干旱研究中,將通過對(duì)長(zhǎng)時(shí)間尺度的SPI值的分析,進(jìn)一步研究地下水位的變化,植被的覆蓋等對(duì)干旱產(chǎn)生的影響。從不同尺度的SPI值進(jìn)行研究得到更加準(zhǔn)確詳細(xì)的結(jié)果。
對(duì)極端干旱的預(yù)測(cè)是目前研究的熱點(diǎn)和干旱預(yù)測(cè)問題的研究重點(diǎn)。本文利用SPI對(duì)新疆地區(qū)的干旱時(shí)空變化情況進(jìn)行分析,基于計(jì)算出的數(shù)據(jù),對(duì)EEMD-ARIMA 模型在新疆地區(qū)的干旱預(yù)測(cè)中的適用性進(jìn)行研究發(fā)現(xiàn),組合模型可以較好的捕獲2008-2019年的干旱事件,適用于新疆地區(qū)的干旱預(yù)測(cè)。北疆和南疆的干旱情況有所不同,南疆大部分地區(qū)以農(nóng)業(yè)為主,水利設(shè)施投入不足;而北疆的抗旱澆灌面積持續(xù)增長(zhǎng)、農(nóng)業(yè)和水利設(shè)施投入程度增加,因此南疆的受旱面積增長(zhǎng)趨勢(shì)大于北疆[37]。在后續(xù)的研究中,針對(duì)不同地區(qū)的實(shí)際情況,進(jìn)一步細(xì)化干旱評(píng)價(jià)指標(biāo)的選取,找出不同地區(qū)最為適合的干旱指數(shù),提高模型在新疆的適用性。
本文基于新疆維吾爾自治區(qū)32個(gè)氣象站點(diǎn)的降水量數(shù)據(jù),計(jì)算出不同時(shí)間尺度下的SPI值,通過對(duì)SPI序列的分析、建模及預(yù)測(cè),得到如下結(jié)論。
(1)單一的ARIMA 模型,在1 個(gè)月尺度下的預(yù)測(cè)精度最低,在24個(gè)月尺度的預(yù)測(cè)精度最高。主要是由兩個(gè)原因造成的,其一,ARIMA 模型是一個(gè)整體線性自回歸模型,隨著預(yù)測(cè)數(shù)據(jù)的增多,精度會(huì)下降。在1 個(gè)月尺度下,通過ARIMA 模型得到的預(yù)測(cè)數(shù)據(jù)多于其他時(shí)間尺度,故精度相較其他時(shí)間尺度而言較低。其二,長(zhǎng)時(shí)間尺度的SPI序列集合了更多原始數(shù)據(jù)的信息,有利于模型的預(yù)測(cè)。在不同時(shí)間尺度下,組合模型的預(yù)測(cè)精度均高于單一模型。
(2)EEMD-ARIMA 組合模型預(yù)測(cè)出的干旱發(fā)生年份與實(shí)際情況近似一致,能夠用于對(duì)新疆地區(qū)干旱的預(yù)測(cè)。通過EEMD對(duì)數(shù)據(jù)進(jìn)行分解,精簡(jiǎn)了模型對(duì)原始數(shù)據(jù)的讀取過程,提高了預(yù)測(cè)精度。利用EEMD 對(duì)各尺度的SPI進(jìn)行分解,得到一組比原始序列特征更加平穩(wěn)的分量,將各分量導(dǎo)入ARIMA進(jìn)行預(yù)測(cè),并將各分量的預(yù)測(cè)結(jié)果累加得到每一時(shí)間尺度下的預(yù)測(cè)數(shù)據(jù),得到的預(yù)測(cè)數(shù)據(jù)的精度均高于單一模型。從預(yù)測(cè)結(jié)果來看,EEMD-ARIMA 組合模型優(yōu)于ARIMA 模型,即EEMDARIMA組合模型能夠更好的擬合不同時(shí)間尺度下的SPI。
氣象干旱能夠?yàn)閰^(qū)域的干旱情況提供預(yù)警,氣象站點(diǎn)監(jiān)測(cè)到的氣溫、降水?dāng)?shù)據(jù)只能近似的反映區(qū)域的情況,粗略的估計(jì)區(qū)域的干旱變化情況,需要研究更加優(yōu)化的干旱評(píng)價(jià)指標(biāo)使其更精確的描述區(qū)域的變化情況。