李 遙
(重慶市水利電力建筑勘測設(shè)計研究院有限公司,重慶 401121)
近年來,隨著極端氣候的發(fā)生,極端降雨事件在區(qū)域內(nèi)的發(fā)生頻率也逐漸增加,這在很大程度上限制了區(qū)域經(jīng)濟(jì)發(fā)展,嚴(yán)重危害了居民的人身安全[1-2]。為分析極端降雨事件的發(fā)生規(guī)律,國內(nèi)學(xué)者在不同區(qū)域做了相應(yīng)研究,并取得了一定的研究成果。王衛(wèi)平等[3]分析了新疆地區(qū)極端降雨事件的時空分布特征,研究表明,區(qū)域多年極端降雨事件呈增加趨勢;杜穎恩等[4]分析了西安市極端降雨的發(fā)生規(guī)律,同樣指出了西安市極端降雨事件呈現(xiàn)逐漸增加趨勢;苗正偉等[5]研究了京津冀地區(qū)極端降水事件分布特征,也得出了相同的結(jié)論。
為進(jìn)一步分析區(qū)域極端降雨事件的變化規(guī)律,相關(guān)學(xué)者構(gòu)建了區(qū)域極端降雨事件預(yù)測模型。沈黎[6]基于高斯回歸模型、梯度提升樹模型等4種機(jī)器學(xué)習(xí)模型構(gòu)建了浙江省極端降雨事件預(yù)測模型,并得出了精度最高模型;李春宇[7]基于優(yōu)化的支持向量機(jī)模型構(gòu)建了重慶極端降雨事件預(yù)測模型,并取得了較高的精度。截至目前,針對大尺度區(qū)域極端降雨事件的研究仍然較少。因此,本文以西南地區(qū)為研究區(qū)域,基于混合深度學(xué)習(xí)理論構(gòu)建大尺度區(qū)域極端降雨事件預(yù)測模型,為區(qū)域防汛抗旱政策的制定提供參考。
西南地區(qū)主要包括四川、貴州、重慶、云南、廣西5省(自治區(qū)、直轄市),區(qū)域地形復(fù)雜,氣候多變。為尋找區(qū)域極端降雨事件的最優(yōu)預(yù)測模型,本文選擇了西南地區(qū)共計113個氣象站點的逐日氣象數(shù)據(jù)進(jìn)行研究,研究區(qū)域基本情況及站點分布見圖1。
圖1 研究區(qū)域概況
本文共選擇西南地區(qū)113個氣象站點1961—2018年的逐日氣象數(shù)據(jù),包括日降雨量、最高溫度、最低溫度、日照時數(shù)、風(fēng)速和相對濕度等數(shù)據(jù),數(shù)據(jù)均來自國家氣象中心,數(shù)據(jù)序列質(zhì)量良好。為構(gòu)建區(qū)域極端降雨事件預(yù)測模型,本文選擇了中雨日數(shù)R10、大雨日數(shù)R20、濕日降雨量PRCPTOT、1日最大降雨量RX1共4種極端降雨指數(shù)進(jìn)行研究,不同指數(shù)的具體含義可見文獻(xiàn)[8]。
卷積神經(jīng)網(wǎng)絡(luò)模型(CNN)是深度學(xué)習(xí)算法的一種[9],該模型具有卷積層和池化層結(jié)構(gòu),可實現(xiàn)對數(shù)據(jù)的卷積、提取和采樣壓縮。該模型通過對輸入數(shù)據(jù)的逐層卷積和池化,提取數(shù)據(jù)特征,從而提高模型計算精度。
長短期記憶神經(jīng)網(wǎng)絡(luò)模型(LSTM)是一種考慮了時間序列的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,其主要特點可通過門結(jié)構(gòu)實現(xiàn)對數(shù)據(jù)的處理和計算,從而提高模型訓(xùn)練速度[10]。
為綜合運用以上兩種模型的優(yōu)點,本文將CNN模型和LSTM模型進(jìn)行組合,采用CNN模型結(jié)構(gòu)分析訓(xùn)練數(shù)據(jù)的內(nèi)在規(guī)律,采用LSTM模型進(jìn)行極端降水事件預(yù)測,從而進(jìn)一步提高模型精度。
為進(jìn)一步提高算法精度,本文采用孔雀優(yōu)化算法(POA)對CNN-LSTM模型進(jìn)行優(yōu)化。POA算法主要通過模擬雌雄孔雀的求偶、覓食行為來實現(xiàn)種群位置的更新,算法具體步驟可見文獻(xiàn)[11]。
為驗證POA-CNN-LSTM模型的精度,采用粒子群算法(PSO)和遺傳算法(GA)對CNN-LSTM模型進(jìn)行優(yōu)化,同時將模型精度與隨機(jī)森林模型(RF)和廣義回歸神經(jīng)網(wǎng)絡(luò)模型(GRNN)進(jìn)行比較。選擇均方根誤差RMSE、相對均方根誤差RRMSE、納什系數(shù)NS、決定系數(shù)R2來綜合評價模型精度,具體公式如下:
(1)
(2)
(3)
(4)
不同模型模擬R10的精度箱線圖見圖2。由圖2可知,優(yōu)化后的模型和組合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,該模型模擬R10的RMSE和RRMSE分別為1.503d和1.544%,NS和R2分別為0.981和0.973,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未組合的模型精度較組合模型有所降低,但仍高于傳統(tǒng)模型,其中POA-LSTM模型的精度較高,表明POA算法的性能優(yōu)于PSO算法和GA算法,該模型模擬R10的RMSE和RRMSE分別為3.422d和6.931%,NS和R2分別為0.905和0.879。傳統(tǒng)模型中,LSTM模型精度最高。
圖2 R10精度箱線圖
不同模型模擬R20的精度箱線圖見圖3。由圖3可知,優(yōu)化后的模型和組合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,該模型模擬R20的RMSE和RRMSE分別為1.997d和1.867%,NS和R2分別為0.983和0.976,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未組合的模型精度較組合模型有所降低,但仍高于傳統(tǒng)模型,其中POA-LSTM模型的精度較高,表明POA算法的性能優(yōu)于PSO算法和GA算法,該模型模擬R20的RMSE和RRMSE分別為5.548d和8.309%,NS和R2分別為0.910和0.869。傳統(tǒng)模型中LSTM模型精度最高。
圖3 R20精度箱線圖
不同模型模擬RX1的精度箱線圖見圖4。由圖4可知,優(yōu)化后的模型和組合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,該模型模擬RX1的RMSE和RRMSE分別為2.642mm和1.272%,NS和R2分別為0.980和0.978,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未組合的模型精度較組合模型有所降低,但仍高于傳統(tǒng)模型,其中POA-LSTM模型的精度較高,表明POA算法的性能優(yōu)于PSO算法和GA算法,該模型模擬RX1的RMSE和RRMSE分別為5.556mm和5.309%,NS和R2分別為0.865和0.879。傳統(tǒng)模型中,LSTM模型精度最高。
圖4 RX1精度箱線圖
不同模型模擬PRCPTOT的精度箱線圖見圖5。由圖5可知,優(yōu)化后的模型和組合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,該模型模擬RX1的RMSE和RRMSE分別為7.599mm和1.726%,NS和R2分別為0.976和0.975,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未組合的模型精度較組合模型有所降低,但仍高于傳統(tǒng)模型,其中POA-LSTM模型的精度較高,表明POA算法的性能優(yōu)于PSO算法和GA算法,該模型模擬PRCPTOT的RMSE和RRMSE分別為15.746mm和9.145%,NS和R2分別為0.823和0.869。傳統(tǒng)模型中,LSTM模型精度最高。
為進(jìn)一步驗證不同模型精度,本文繪制了4種極端降水指數(shù)不同模型模擬值的泰勒圖,結(jié)果見圖6??芍狿OA-CNN-LSTM模型與標(biāo)準(zhǔn)值最為接近,表明該模型計算結(jié)果的一致性最高,誤差最低,可作為區(qū)域極端降水事件的推薦模型使用。
圖6 不同模型模擬值泰勒圖
為進(jìn)一步驗證POA-CNN-LSTM模型的精度,對該模型的普適性進(jìn)行分析。在模擬4種指標(biāo)時,隨機(jī)選擇四川、貴州、云南、廣西4省(自治區(qū))5個站點,隨機(jī)以其中4個站點為訓(xùn)練站點,第5個站點為預(yù)測站點,模擬的4種極端降水事件精度見表1~表4。從中可知,在模擬4種極端降水事件時,誤差較低,且一致性指標(biāo)均在0.9以上,表明POA-CNN-LSTM模型具備較好的普適性,進(jìn)一步證明了該模型的精度。
表1 POA-CNN-LSTM模型模擬R10普適性分析
表2 POA-CNN-LSTM模型模擬R20普適性分析
表3 POA-CNN-LSTM模型模擬RX1普適性分析
表4 POA-CNN-LSTM模型模擬PRCPTOT普適性分析
本文基于組合模型思想,構(gòu)建了CNN模型和LSTM模型的組合深度學(xué)習(xí)模型,并基于POA算法對CNN-LSTM模型進(jìn)行了優(yōu)化,與其余模型精度進(jìn)行了對比,結(jié)果表明:POA-CNN-LSTM模型在所有模型中精度最高,在泰勒圖中與標(biāo)準(zhǔn)值最為接近;且具備較高的普適性,可推薦其用于估算西南地區(qū)極端降水事件。