羅 瑞, 劉金培, 陳華友, 陶志富
(1. 安徽大學(xué) 商學(xué)院,合肥 230601; 2. 安徽大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,合肥 230601)
PM2.5指大氣中空氣動(dòng)力學(xué)當(dāng)量直徑小于等于2.5 μm的顆粒物,它長時(shí)間懸浮于空氣中,會(huì)侵蝕人體免疫力,引發(fā)心血管和呼吸道等疾病[1]。PM2.5的濃度值是連續(xù)變化的,每日最低值和最高值差異大,具有一定的時(shí)間跨度和區(qū)間關(guān)聯(lián)度。因此,PM2.5的日均值時(shí)間序列無法有效反映其濃度值的真實(shí)變化,而以PM2.5日最高和最低濃度值分別作為上下限的區(qū)間型數(shù)據(jù)則包含了更多的真實(shí)信息,不但可以有效反映其日變化趨勢和范圍,并且具有更高的穩(wěn)定性和更強(qiáng)的泛化能力[2]。因此,PM2.5區(qū)間時(shí)間序列預(yù)測具有更重要的理論和現(xiàn)實(shí)意義。
PM2.5濃度值預(yù)測方法主要分為3類:數(shù)值模擬法[3]、統(tǒng)計(jì)預(yù)測法[4-6]和深度學(xué)習(xí)方法[7-10]。數(shù)值模擬法在氣象學(xué)原理的基礎(chǔ)上,通過數(shù)學(xué)方程模擬PM2.5的擴(kuò)散、轉(zhuǎn)化以及消散的過程[2]。此類模型中的參數(shù)存在一定的不確定性,導(dǎo)致其預(yù)測結(jié)果也會(huì)存在一定的偏差。統(tǒng)計(jì)預(yù)測法則是通過回歸或機(jī)器學(xué)習(xí)等建立PM2.5與影響因素之間的關(guān)系[4],實(shí)現(xiàn)對(duì)PM2.5的預(yù)測,主要包括多元線性回歸(MLR)[5]、支持向量機(jī)(SVM)[6]、人工神經(jīng)網(wǎng)絡(luò)(ANN)[4]等預(yù)測方法。統(tǒng)計(jì)類方法雖然能夠?qū)M2.5的變化規(guī)律以及相關(guān)影響因素之間的潛在關(guān)系進(jìn)行擬合,但需要從大量的樣本數(shù)據(jù)中提取時(shí)間序列特征,對(duì)于波動(dòng)程度較大的時(shí)間序列,存在擬合效果不穩(wěn)定的缺點(diǎn)。
深度學(xué)習(xí)方法通過學(xué)習(xí)時(shí)間序列數(shù)據(jù)的內(nèi)在規(guī)律和表現(xiàn)層次,能更好地?cái)M合時(shí)間序列,提高預(yù)測精度[7-10],主要包括循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)和長短期記憶模型(LSTM)等方法。其中,CNN的優(yōu)勢在于可以學(xué)習(xí)和有效提取數(shù)據(jù)的空間特征;RNN則存在梯度消失的問題,不適用于長期時(shí)間序列的預(yù)測;LSTM是對(duì)RNN的改進(jìn),它解決了RNN存在的問題,能夠有效提取數(shù)據(jù)的時(shí)間尺度特征。因此,與RNN和CNN相比,LSTM更適用于時(shí)間序列的預(yù)測[7]。Ong等[8]提出基于RNN的深度學(xué)習(xí)預(yù)測框架,對(duì)城市的PM2.5濃度值進(jìn)行預(yù)測。Wu等[9]提出了基于LSTM的PM2.5預(yù)測方法,對(duì)武漢市PM2.5濃度值進(jìn)行預(yù)測。曲悅等[10]分別利用BP神經(jīng)網(wǎng)絡(luò)、CNN與LSTM對(duì)PM2.5等空氣污染物進(jìn)行預(yù)測。上述基于深度學(xué)習(xí)的預(yù)測模型均能較好提取單一尺度的數(shù)據(jù)特征,相對(duì)于數(shù)值模擬法和統(tǒng)計(jì)預(yù)測法具有更好的預(yù)測效果。但是,對(duì)于多尺度的復(fù)雜時(shí)間序列,存在有效信息提取不完全問題。最新研究表明,針對(duì)非線性、非平穩(wěn)性、波動(dòng)性強(qiáng)的時(shí)間序列,先對(duì)其進(jìn)行多尺度分解,使得各子序列具有更好的波動(dòng)規(guī)律性,再對(duì)分解后的各層序列分別進(jìn)行預(yù)測分析,可有效提高預(yù)測精度[11-12]。為了簡化復(fù)雜數(shù)據(jù),使各子序列平穩(wěn)化和規(guī)律化,從而有效減少預(yù)測誤差,本文將深度學(xué)習(xí)與多尺度分解相結(jié)合,先選取區(qū)間分解方法將PM2.5區(qū)間序列分解為不同波動(dòng)頻率的子序列,進(jìn)而采用深度學(xué)習(xí)方法對(duì)高頻波動(dòng)的子序列進(jìn)行預(yù)測。
綜上所述,現(xiàn)有研究存在以下3個(gè)方面的問題:已有研究主要關(guān)注PM2.5的日均點(diǎn)值時(shí)間序列預(yù)測,而針對(duì)PM2.5區(qū)間預(yù)測的研究較少;如何結(jié)合深度學(xué)習(xí)模型,建立復(fù)雜區(qū)間時(shí)間序列的多尺度分解預(yù)測新方法,仍然需要進(jìn)一步探討;已有區(qū)間時(shí)間序列預(yù)測方法大多僅關(guān)注提高原始序列的預(yù)測性能,而沒有充分利用預(yù)測誤差序列中隱含的有效信息。
針對(duì)以上問題,提出一種新的基于LSTM-HFTS-EC的PM2.5區(qū)間多尺度組合預(yù)測新方法。首先,提出區(qū)間時(shí)間序列經(jīng)驗(yàn)?zāi)B(tài)分解(IEMD)方法,將PM2.5區(qū)間時(shí)間序列依次分解為區(qū)間趨勢序列、低頻波動(dòng)序列和高頻波動(dòng)序列;然后,分別利用Holt-Winters模型、混合模糊時(shí)間序列模型(HFTS)和LSTM模型對(duì)區(qū)間趨勢序列、低頻波動(dòng)序列和高頻波動(dòng)序列進(jìn)行預(yù)測,并將預(yù)測結(jié)果集成為PM2.5的區(qū)間預(yù)測值;為了進(jìn)一步提高區(qū)間預(yù)測的精確度,再利用LSTM模型對(duì)PM2.5區(qū)間預(yù)測值進(jìn)行誤差修正,即得到PM2.5的最終區(qū)間預(yù)測結(jié)果。最后,將本文的預(yù)測方法進(jìn)行實(shí)證預(yù)測分析,通過對(duì)比來檢驗(yàn)本文所提出的組合預(yù)測方法的準(zhǔn)確性和適用性。
PM2.5濃度值的日度區(qū)間數(shù)如圖1所示,區(qū)間下界為每日PM2.5的最低濃度值,區(qū)間上界為每日PM2.5能達(dá)到的最高濃度值,區(qū)間半徑則代表了PM2.5濃度值的日變化范圍。
圖1 PM2.5濃度值日度區(qū)間數(shù)
以合肥市為例,合肥市2018-07-08至2018-07-16共9 d的PM2.5濃度的區(qū)間序列如圖2所示,可見PM2.5濃度值處于連續(xù)變化中,日度區(qū)間序列的上下界差異大,具有較大的變化范圍和較強(qiáng)的波動(dòng)性??梢?,傳統(tǒng)的PM2.5日均值時(shí)間序列預(yù)測的代表性弱,無法充分反映其波動(dòng)規(guī)律。
圖2 合肥市PM2.5日度區(qū)間序列
在經(jīng)驗(yàn)?zāi)B(tài)分解的基礎(chǔ)上,提出IEMD方法。具體步驟如下:
步驟2 分別計(jì)算中心和半徑時(shí)序上下包絡(luò)線的均值mc(t)和mr(t),其中mc(t)=(ecmax(t)+ecmin(t))/2,mr(t)=(ermax(t)+ermin(t))/2。再分別計(jì)算中心和半徑時(shí)序與其平均值之間的差值,記為dc(t)和dr(t),這里dc(t)=c(t)-mc(t),dr(t)=r(t)-mr(t)。
步驟3 分別判斷序列dc(t)和dr(t)是否滿足本征模態(tài)函數(shù)(IMF)的條件[13]。若滿足,則記為1個(gè)IMF,記fcm(t)=dc(t),frn(t)=dr(t),m=1,2,…,M,n=1,2,…,N。將剩余項(xiàng)rc(t)=c(t)-fcm(t)和rr(t)=r(t)-frn(t)分別作為新的c(t)和r(t)。若不滿足,則記c(t)=dc(t),r(t)=dr(t)重復(fù)步驟1~步驟2的過程。
步驟4 重復(fù)步驟1~步驟3,直到無法再從c(t)和r(t)中分解出新的IMF為止。此時(shí),則c(t)和r(t)分別分解為多個(gè)IMF和一個(gè)趨勢項(xiàng),即
本文提出的IEMD分解方法能夠?qū)^(qū)間時(shí)間序列分解為區(qū)間趨勢序列、低頻波動(dòng)序列和高頻波動(dòng)序列,它不僅能夠充分提取區(qū)間時(shí)間序列中所包含的不同尺度的特征信息,而且避免了序列的過度分解,可以進(jìn)一步簡化預(yù)測過程的復(fù)雜性。
2.2.1 LSTM
LSTM為RNN的一種改進(jìn),成功解決了RNN存在的梯度爆炸和梯度消失問題[14]。通過設(shè)置門限控制信息的取舍,解決了長期依賴問題,實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)的遺忘和記憶功能。LSTM有3個(gè)門限,分別為遺忘門(Forget Gate)、輸入門(Input Gate)和輸出門(Output Gate)。LSTM的算法結(jié)構(gòu)如圖3所示。
圖3 長短期記憶神經(jīng)網(wǎng)絡(luò)的算法結(jié)構(gòu)圖
在圖3中,方框內(nèi)上方的水平線即為單元狀態(tài),控制信息傳遞給下一時(shí)刻。LSTM的前饋計(jì)算過程分為3步。
第一步?jīng)Q定歷史信息是否可以通過單元狀態(tài),即遺忘掉不重要的歷史信息,這一步由遺忘門來控制,上一時(shí)刻的輸出信息ht-1和當(dāng)前時(shí)刻的輸入信息xt經(jīng)過sigmoid激活函數(shù)σ得到函數(shù)值ft∈[0,1],決定歷史信息Ct-1通過單元狀態(tài)的程度。
ft=σ(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
(1)
(2)
(3)
第三步?jīng)Q定單元狀態(tài)中有多少信息需要在當(dāng)前時(shí)刻輸出,這一步由輸出門決定。根據(jù)式(4)得到輸出門的值ot,由式(5)計(jì)算LSTM當(dāng)前時(shí)刻的輸出值ht。其中,W、b分別表示各“門限”的權(quán)重矩陣和偏置向量。
ot=σ(Wo·[ht-1,xt]+bo)
(4)
ht=ot*tanh(Ct)
(5)
2.2.2 HFTS預(yù)測
HFTS預(yù)測模型是傳統(tǒng)模糊時(shí)間序列(FTS)預(yù)測[16]的改進(jìn)。模糊集、模糊時(shí)間序列和模糊關(guān)系的定義如下:
定義2[17]令U為給定論域,將論域劃分為n個(gè)子區(qū)間,則U={u1,u2,…,un},定義A為論域U上的模糊集,并記A=fA(u1)/u1+fA(u2)/u2+…+fA(un)/un。其中,fA(·)是定義在模糊集A上的隸屬函數(shù),fA(·):U→[0,1];fA(ui)表示ui在模糊集A上的隸屬度,i=1,2,…,n。
定義3[17]令R中一子集Y(t),(t=1,2,…)為給定論域,fi(t)為定義在其上的模糊集(i=1,2,…),且F(t)={f1(t),f2(t),…},則稱F(t)為定義在Y(t)上的模糊時(shí)間序列。
定義4[17]假設(shè)F(t)由F(t-1)所引起,即F(t-1)→F(t),此關(guān)系可表示為F(t)=F(t-1)°R(t,t-1),則稱F(t)為一階模糊,R(t,t-1)為F(t-1)與F(t)之間的模糊關(guān)系。其中,符號(hào)“°”表示合成運(yùn)算。
HFTS預(yù)測方法的算法步驟如下:
步驟1 利用模糊C均值聚類(FCM)[20]將論域U劃分為n個(gè)區(qū)間,并且確定訓(xùn)練數(shù)據(jù)屬于各區(qū)間的隸屬度。
步驟2 結(jié)合訓(xùn)練數(shù)據(jù)屬于各模糊集的隸屬度,將時(shí)間序列轉(zhuǎn)化為FTS。
步驟3 利用BP神經(jīng)網(wǎng)絡(luò)定義模糊關(guān)系,將前m期數(shù)據(jù)屬于各模糊集的隸屬度作為BP神經(jīng)網(wǎng)絡(luò)的輸入值,將后一期數(shù)據(jù)的實(shí)際值作為BP神經(jīng)網(wǎng)絡(luò)的輸出值。
步驟4 確定BP神經(jīng)網(wǎng)絡(luò)隱含層的神經(jīng)元個(gè)數(shù)、激活函數(shù)以及相關(guān)參數(shù),構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)。
步驟5 利用訓(xùn)練集數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
步驟6 利用訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行預(yù)測。
HFTS能有效地解決FTS存在的3個(gè)問題:在模糊化階段,HFTS利用系統(tǒng)的FCM方法將數(shù)據(jù)集模糊化,以此得到各數(shù)據(jù)更加客觀的隸屬度,從而解決了FTS中隸屬度存在極大主觀性的問題;同時(shí),在建立模糊關(guān)系階段,HFTS通過BP神經(jīng)網(wǎng)絡(luò)消除了模糊關(guān)系的結(jié)構(gòu)性選擇問題,并且避免了復(fù)雜的模糊關(guān)系矩陣計(jì)算[18];另外,HFTS通過將時(shí)間序列的實(shí)際值作為目標(biāo)值,利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,避免了去模糊化階段中可能出現(xiàn)的預(yù)測誤差,從而提高了預(yù)測性能。
2.2.3 Holt-Winters模型
Holt-Winters模型適用于對(duì)含有趨勢變動(dòng)、季節(jié)變動(dòng)和周期變動(dòng)的時(shí)間序列進(jìn)行預(yù)測。本文應(yīng)用的乘法Holt-Winters預(yù)測模型[19],如下:
(6)
針對(duì)PM2.5區(qū)間時(shí)間序列數(shù)據(jù)非線性、非平穩(wěn)性和波動(dòng)幅度較大等特點(diǎn),提出一種新的基于LSTM-HFTS-EC的PM2.5區(qū)間多尺度組合預(yù)測方法,結(jié)構(gòu)框架如圖4所示,具體步驟如下:
圖4 組合預(yù)測模型結(jié)構(gòu)框架
步驟5 模型檢驗(yàn)。利用區(qū)間平均相對(duì)誤差(IARV)、區(qū)間平均絕對(duì)誤差(IMAE)、區(qū)間平均絕對(duì)百分比誤差(IMAPE)和區(qū)間均方根誤差(IRMSE)4種預(yù)測誤差評(píng)價(jià)指標(biāo)對(duì)本模型以及其他預(yù)測模型進(jìn)行對(duì)比分析,以此檢驗(yàn)本文提出模型的預(yù)測效果。
選取合肥市2018-07-01至2020-12-30共計(jì)914 d的PM2.5數(shù)據(jù)進(jìn)行預(yù)測實(shí)證分析,數(shù)據(jù)來源于安徽省生態(tài)環(huán)境廳(http://sthjt.ah.gov.cn)。對(duì)收集的PM2.5實(shí)時(shí)數(shù)據(jù)進(jìn)行預(yù)處理,將日實(shí)時(shí)數(shù)據(jù)的最高值和最低值分別作為區(qū)間的上下限,得到PM2.5區(qū)間時(shí)間序列。其中,選取前822個(gè)區(qū)間數(shù)據(jù)作為訓(xùn)練集,后92個(gè)區(qū)間數(shù)據(jù)作為測試集。
根據(jù)提出的組合預(yù)測模型流程,利用IEMD方法將合肥市PM2.5原始區(qū)間時(shí)間序列依次分解為區(qū)間趨勢序列、低頻波動(dòng)序列和高頻波動(dòng)序列,結(jié)果如圖5所示。其中,IEMD是一種自適應(yīng)分解方法,勿需提前設(shè)置分解函數(shù)和分解層數(shù),該方法可以自行分解成對(duì)應(yīng)的層數(shù)。圖5(a)為分解得到的區(qū)間趨勢序列,它體現(xiàn)了合肥市PM2.5濃度值的整體趨勢,可見受新冠疫情等因素影響,合肥市PM2.5濃度值在一段時(shí)期內(nèi)處于下降趨勢,而隨著工業(yè)生產(chǎn)的全面復(fù)工以及出行的常態(tài)化,其濃度值也逐漸上升。圖5(b)為低頻波動(dòng)序列,反映了合肥市PM2.5濃度值的短期變化規(guī)律,從圖5中可以看出其濃度值具有明顯的季節(jié)性和周期性,說明冬季合肥市PM2.5濃度值會(huì)達(dá)到最高峰,空氣污染比較嚴(yán)重,在夏季合肥市PM2.5濃度值會(huì)處于最低水平,空氣質(zhì)量相對(duì)較好。圖5(c)表示高頻波動(dòng)序列,它體現(xiàn)了在眾多因素影響下合肥市PM2.5濃度值的具體波動(dòng)細(xì)節(jié),可以發(fā)現(xiàn)合肥市PM2.5濃度值的波動(dòng)幅度較大。
圖5 PM2.5原始區(qū)間數(shù)據(jù)分解圖
在上一階段的基礎(chǔ)上,首先采用Holt-Winters對(duì)區(qū)間趨勢序列進(jìn)行預(yù)測,平滑系數(shù)分別設(shè)置為α=0.3、β=0.3和γ=0.4。然后基于HFTS對(duì)低頻波動(dòng)序列進(jìn)行預(yù)測,其中,F(xiàn)CM的類別數(shù)n=5,BP神經(jīng)網(wǎng)絡(luò)的輸入值m=5,隱含層的神經(jīng)元個(gè)數(shù)設(shè)置為16,激活函數(shù)為tansig,迭代次數(shù)為1 000。最后選取LSTM對(duì)高頻波動(dòng)序列進(jìn)行單步預(yù)測,其中,本文設(shè)置1個(gè)輸入層、1個(gè)隱含層和1個(gè)輸出層,隱含層的神經(jīng)元個(gè)數(shù)為128,激活函數(shù)設(shè)置為tanh,時(shí)間步長設(shè)置為1,批處理大小取值為50,迭代次數(shù)設(shè)置為500。同時(shí),將各單項(xiàng)預(yù)測方法的預(yù)測結(jié)果進(jìn)行相加集成,得到合肥市PM2.5組合預(yù)測值如圖6所示??梢钥闯?,雖然組合預(yù)測值整體可以反映PM2.5實(shí)際值的變化趨勢,但是PM2.5區(qū)間濃度值上限和下限的預(yù)測結(jié)果與實(shí)際值之間在波動(dòng)細(xì)節(jié)上仍存在一定的差異。
說明高頻波動(dòng)序列中隱含的一部分復(fù)雜數(shù)據(jù)特征沒有被有效利用,因此,預(yù)測結(jié)果仍然有改進(jìn)的空間。
基于組合預(yù)測的結(jié)果,進(jìn)一步采用誤差修正的方法,從預(yù)測誤差中間接提取隱含的有效信息,進(jìn)一步提高預(yù)測精度。首先,計(jì)算得到原始數(shù)據(jù)與PM2.5組合預(yù)測結(jié)果之間的差值作為誤差序列。然后,采用LSTM對(duì)誤差序列進(jìn)行預(yù)測,在相關(guān)參數(shù)設(shè)置不改變的情況下,將前一期數(shù)據(jù)作為輸入值,后一期數(shù)據(jù)作為輸出值,得到誤差序列的預(yù)測結(jié)果。最后,利用誤差預(yù)測值對(duì)組合預(yù)測的結(jié)果進(jìn)行修正,將兩者相加集成,得到PM2.5區(qū)間濃度值最終預(yù)測結(jié)果,如圖6所示。由此可見,進(jìn)行誤差修正后的預(yù)測結(jié)果更加接近于實(shí)際值,預(yù)測效果得到了較大地提升。說明誤差修正能夠從預(yù)測誤差序列中進(jìn)一步提取有效信息,提高模型的預(yù)測精度。
圖6 預(yù)測結(jié)果對(duì)比圖
為了驗(yàn)證所提出模型的有效性,進(jìn)行了以下3個(gè)方面的對(duì)比,并用散點(diǎn)圖表示。各數(shù)據(jù)點(diǎn)越趨于對(duì)角線表明預(yù)測結(jié)果越接近實(shí)際值,反之,效果越差。對(duì)比分析結(jié)果如下:
(1) 不同分解方法的對(duì)比。在本文方法的基礎(chǔ)上,對(duì)分解方法進(jìn)行變換,采用變分模態(tài)分解(VMD)、集成經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)、奇異譜分解(SSA)對(duì)PM2.5原始區(qū)間數(shù)據(jù)進(jìn)行分解處理,并將其記為VMD-CF-ECM、EEMD-CF-ECM和SSA-CF-ECM。對(duì)比結(jié)果如圖7所示(?、☆、▽、×分別代表IEMD-CF-ECM、VMD-CF-ECM、EEMD-CF-ECM、SSA-CF-ECM),本文模型(IEMD-CF-ECM)的預(yù)測效果明顯優(yōu)于這3種模型,由此可見IEMD非常適用于分析波動(dòng)幅度不規(guī)律、非線性和非平穩(wěn)性的區(qū)間時(shí)間序列,它能根據(jù)數(shù)據(jù)固有的波動(dòng)尺度特征來進(jìn)行時(shí)間序列分解,具有客觀性和自適應(yīng)性。
(a) 下限預(yù)測效果對(duì)比
(b) 上限預(yù)測效果對(duì)比圖7 本模型與采用不同的分解方法比較圖
(2) 不同單項(xiàng)預(yù)測方法的對(duì)比。在本模型基礎(chǔ)上,對(duì)分解后的不同頻率序列分別采用同一單項(xiàng)方法進(jìn)行預(yù)測,如LSTM、HFTS和Holt-Winters,并依次將其設(shè)定為IEMD-LSTM-ECM、IEMD-HFTS-ECM和IEMD-HW-ECM。由圖8可知(?、□、+、▽分別代表IEMD-CF-ECM、IEMD-LSTM-ECM、IEMD-HFTS-ECM、IEMD-HW-ECM),采用單項(xiàng)預(yù)測方法的預(yù)測精度低于本文提出的組合預(yù)測方法,這說明利用IEMD將PM2.5區(qū)間序列分解為不同尺度的子序列,然后根據(jù)不同時(shí)序的數(shù)據(jù)特征,選擇最合適的模型,利用組合預(yù)測方法對(duì)其進(jìn)行預(yù)測,能夠極大程度地提高預(yù)測性能,從而達(dá)到最優(yōu)預(yù)測效果。
(a) 下限預(yù)測效果對(duì)比
(b) 上限預(yù)測效果對(duì)比圖8 本模型與采用單一預(yù)測方法比較圖
(3) 與已有預(yù)測模型的橫向?qū)Ρ?。將本文模型與其他PM2.5預(yù)測模型進(jìn)行對(duì)比,如LSTM模型[10]、ANN模型[21]和Holt-Winters模型[21]。對(duì)比結(jié)果如圖9所示(?、○、☆、×分別代表IEMD-CF-ECM、LSTM、ANN、HW),可見對(duì)比模型的預(yù)測效果遠(yuǎn)低于本文提出模型,由此可見,本模型具有更高的預(yù)測精度。
(a) 下限預(yù)測效果對(duì)比
(b) 上限預(yù)測效果對(duì)比圖9 本模型與其他預(yù)測方法比較圖
另外,本文模型與其他比較模型的預(yù)測誤差評(píng)價(jià)指標(biāo)如表1所示??梢钥闯?,本模型預(yù)測誤差的各評(píng)價(jià)指標(biāo)都低于其他比較模型,進(jìn)一步反映了本文提出模型的預(yù)測精度要高于其他比較模型,具有較好的預(yù)測效果和較強(qiáng)的適應(yīng)性。
表1 10種預(yù)測方法預(yù)測誤差評(píng)價(jià)指標(biāo)對(duì)比
綜上所述,本研究具有以下3方面的優(yōu)勢:第一,本文提出的區(qū)間時(shí)間序列組合預(yù)測模型可以對(duì)PM2.5濃度值變化趨勢和范圍進(jìn)行更好預(yù)測,克服了傳統(tǒng)點(diǎn)值時(shí)間序列預(yù)測波動(dòng)信息損失的缺點(diǎn);第二,本文將深度模型LSTM與區(qū)間多尺度分解等方法相結(jié)合,提出了一種區(qū)間時(shí)間序列組合預(yù)測框架,能夠從大量復(fù)雜的時(shí)間序列數(shù)據(jù)中提取關(guān)鍵性的數(shù)據(jù)特征,克服了傳統(tǒng)預(yù)測模型存在的滯后性問題;第三,本文通過提取組合預(yù)測預(yù)測誤差提供的有效信息,進(jìn)行誤差修正,使預(yù)測精度得到了進(jìn)一步地提升。
PM2.5濃度值是一個(gè)連續(xù)變化、隨機(jī)性強(qiáng)、波動(dòng)頻率不規(guī)律的時(shí)間序列,傳統(tǒng)的日均值分解預(yù)測模型很難準(zhǔn)確地獲取高頻序列中的隨機(jī)性特征,也無法完全體現(xiàn)PM2.5的區(qū)間變化規(guī)律。因此,本文提出了一種新的基于LSTM-HFTS-EC的PM2.5區(qū)間多尺度組合預(yù)測模型方法,首先利用IEMD將PM2.5區(qū)間時(shí)間序列進(jìn)行分解,再基于Holt-Winters模型、HFTS和LSTM模型分別對(duì)分解出的區(qū)間趨勢序列、低頻波動(dòng)序列和高頻波動(dòng)序列進(jìn)行預(yù)測,并將預(yù)測結(jié)果集成為PM2.5的區(qū)間預(yù)測值。進(jìn)而利用LSTM模型對(duì)PM2.5區(qū)間預(yù)測值進(jìn)行誤差修正,得到PM2.5的最終區(qū)間預(yù)測結(jié)果。最后通過實(shí)證預(yù)測分析,說明本文的方法適用于具有較大波動(dòng)的PM2.5區(qū)間預(yù)測,與已有方法相比具有更高的精確度和良好的適用性。此外,本文的研究也為預(yù)測其他具有連續(xù)變化和波動(dòng)范圍大特征的實(shí)際問題提供了一種新的思路。