王梓霖
摘? ?要:為有效地預(yù)測霧霾污染程度的主要評價指標PM2.5質(zhì)量濃度,文章使用Blending集成學習策略并行連接CNN與LSTM,并建立基于CNN-LSTM集成學習的PM2.5質(zhì)量濃度預(yù)測模型。經(jīng)過真實數(shù)據(jù)驗證,該模型對PM2.5質(zhì)量濃度預(yù)測具有有效性,且相較于串聯(lián)CNN-LSTM預(yù)測模型具有優(yōu)越性。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);長短時間記憶網(wǎng)絡(luò);集成學習;PM2.5質(zhì)量濃度預(yù)測
我國霧霾污染問題日益嚴重,對人們健康造成巨大威脅,因此,霧霾質(zhì)量濃度預(yù)測至關(guān)重要。PM2.5是評價霧霾質(zhì)量濃度的首要指標,目前已有研究針對PM2.5質(zhì)量濃度進行預(yù)測。余輝等[1]使用空氣污染物數(shù)據(jù)和氣象數(shù)據(jù),建立了差分整合移動平均自回歸模型預(yù)測PM2.5質(zhì)量濃度。但統(tǒng)計學方法適用于線性關(guān)系問題,不適用于高維非線性問題。Biancofiore等[2]使用帶有和不帶遞歸結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型對PM2.5質(zhì)量濃度進行預(yù)測,并取得了較好結(jié)果。但人工神經(jīng)網(wǎng)絡(luò)無法刻畫PM2.5質(zhì)量濃度在時間維度上的特征。近年來,深度學習快速發(fā)展并被用于PM2.5質(zhì)量濃度預(yù)測中。Chiou-Jye等[3]串聯(lián)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和長短時間記憶網(wǎng)絡(luò)(Long-Short Term Memory,LSTM)預(yù)測PM2.5質(zhì)量濃度,提高了PM2.5質(zhì)量濃度預(yù)測的準確性,但此模型會損失部分時序特征。針對上述問題,本文使用Blending集成學習策略并行結(jié)合CNN和LSTM預(yù)測PM2.5質(zhì)量濃度。
1? ? 基于CNN-LSTM集成學習的PM2.5質(zhì)量濃度預(yù)測
1.1? 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)是受生物的視知覺機制啟發(fā)而發(fā)展出來的一種有卷積運算的前饋神經(jīng)網(wǎng)絡(luò),可提取數(shù)據(jù)之間隱藏的拓撲結(jié)構(gòu)即空間維度上的特征。其核心結(jié)構(gòu)為卷積層、池化層和全連接層,卷積神經(jīng)網(wǎng)絡(luò)通過卷積層對輸入數(shù)據(jù)進行局部特征提取,并使用池化層對提取的特征進行壓縮,隨著卷積層的增加,提取的特征越來越抽象,最后將這些特征進行一維展開,并使用全連接層對其進行學習,最后輸出結(jié)果。
1.2? 長短時間記憶網(wǎng)絡(luò)
長短時間記憶網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)的改進版本[4],核心為記憶細胞結(jié)構(gòu)和3個門結(jié)構(gòu):遺忘門ft、輸入門it和輸出門ot。對于時刻t,ct-1為從上一時刻傳來的記憶細胞信息,at-1為上一時刻的輸出數(shù)據(jù),xt為當前時刻的訓練數(shù)據(jù),其經(jīng)過遺忘門、輸入門、輸出門,更新了記憶細胞信息ct并輸出了當前時刻的輸出at。LSTM模塊中各門結(jié)構(gòu)以及狀態(tài)傳遞過程的計算公式如下:
LSTM的記憶細胞中包含了到當前時刻為止所有歷史時刻中有用的信息,并通過門結(jié)構(gòu)決定多少當前時刻信息被加入到記憶細胞,然后傳遞到下一時刻。
1.3? 基于CNN-LSTM集成學習的PM2.5質(zhì)量濃度預(yù)測模型
PM2.5質(zhì)量濃度影響因素眾多,數(shù)據(jù)之間不僅具有時序關(guān)系,還蘊含空間維度上的特征。CNN可以提取高維數(shù)據(jù)在不同層次上的特征,LSTM能夠很好地刻畫數(shù)據(jù)在時間維度上的特征,但串聯(lián)結(jié)合CNN與LSTM會在一定程度上損失特征因子在時間維度上的特征,因此本文使用Blending集成學習策略并行連接CNN與LSTM,以此構(gòu)建基于CNN-LSTM的PM2.5質(zhì)量濃度預(yù)測模型,其結(jié)構(gòu)和參數(shù)如圖1所示。
2? ? 實驗結(jié)果與分析
2.1? 數(shù)據(jù)集選取
數(shù)據(jù)來源為西安市2015年1月1日0:00~2018年5月31日23:00逐小時PM10,CO,NO2,SO2,O3質(zhì)量濃度以及溫度、濕度、風速、氣壓和露點數(shù)據(jù)。
2.2? 數(shù)據(jù)預(yù)處理
均值補全數(shù)據(jù):獲取到的數(shù)據(jù)會有缺失情況,因此使用均值補全法對缺失數(shù)據(jù)進行補全。其計算表達式為公式(7)所示:
構(gòu)造時間序列特征圖:CNN網(wǎng)絡(luò)模型的輸入數(shù)據(jù)要求為網(wǎng)格數(shù)據(jù),因此,需要構(gòu)造時間序列特征圖。本文將時間步特征數(shù)據(jù)按時間順序依次排列,組成二維數(shù)據(jù)矩陣,以滑動窗口截取方式構(gòu)造時間序列特征圖。
2.3? 實驗結(jié)果分析
本文使用串聯(lián)CNN-LSTM預(yù)測模型進行對比實驗,并使用均方根誤差作為評價標準。表1為兩種模型在測試集上的均方根誤差。
圖2—3分別為串聯(lián)CNN-STM預(yù)測模型和CNN-LSTM集成學習預(yù)測模型預(yù)測結(jié)果。
由均方根誤差以及預(yù)測結(jié)果的對比圖可以看出,基于CNN-LSTM集成學習的PM2.5質(zhì)量濃度預(yù)測模型在真實數(shù)據(jù)集上得到了良好的運行效果,且比基于串聯(lián)CNN-LSTM的PM2.5質(zhì)量濃度預(yù)測模型均方根誤差有所降低,預(yù)測效果有所提高。
3? ? 結(jié)語
本文利用CNN和LSTM各自在空間維度和時間維度上的特征提取能力,使用Blending集成學習策略并行連接CNN和LSTM的PM2.5質(zhì)量濃度預(yù)測模型。并通過實驗表明基于CNN-LSTM集成學習的PM2.5質(zhì)量濃度預(yù)測模型的有效性,為 PM2.5質(zhì)量濃度預(yù)測提供一種更為優(yōu)越的方法。
[參考文獻]
[1]余輝,袁晶,于旭耀,等.基于ARMAX的PM_(2.5)小時濃度跟蹤預(yù)測模型[J].天津大學學報(自然科學與工程技術(shù)版),2017(1):105-111.
[2]BIANCOFIORE F,BUSILACCHIO M,VERDECCHIA M,et al.Recursive neural network model for analysis and forecast of PM10 and PM2.5[J].Atmospheric Pollution Research,2017(S1):30-32.
[3]CHIOU JYE H,PING HUAN K.A deep CNN-LSTM model for particulate matter(PM2.5)forecasting in smart cities[J].Sensors,2018(7):2220.
[4]HOCHREITER S,SCHMIDHUBER,JURGEN.Long short-term memory[J].Neural Computation,1997(8):1735-1780.