• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種區(qū)域降水預(yù)測(cè)的時(shí)空集成模型

      2024-05-15 21:04:29馬宇紅薛生倩王小小路金葉
      關(guān)鍵詞:機(jī)器學(xué)習(xí)

      馬宇紅 薛生倩 王小小 路金葉

      DOI:10.16783/j.cnki.nwnuz.2024.03.012

      收稿日期:2023-12-05;修改稿收到日期:2024-03-12

      基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(51368055)

      作者簡(jiǎn)介:馬宇紅(1971—),男,甘肅天水人,副編審,博士.主要研究方向?yàn)闀r(shí)空序列數(shù)據(jù)建模和預(yù)測(cè).

      E-mail:mayh@nwnu.edu.cn

      摘要:提出了一種融合多種深度學(xué)習(xí)方法的時(shí)空預(yù)測(cè)集成模型LSTM-ARIMA-SARIMA-BP-CNN(簡(jiǎn)稱LASBC模型),其中ARIMA模型捕捉降水時(shí)間序列的近鄰性,SARIMA模型捕捉周期性,BP神經(jīng)網(wǎng)絡(luò)揭示降水分布的時(shí)空相關(guān)性,CNN挖掘氣象、地理因素對(duì)降水的影響,最后通過(guò)LSTM網(wǎng)絡(luò)對(duì)4個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行融合,提高預(yù)測(cè)精度.以中國(guó)西部地區(qū)12個(gè)城市1985年1月至2021年12月的月降水量數(shù)據(jù)為主,應(yīng)用LASBC模型對(duì)12個(gè)城市的月降水量進(jìn)行預(yù)測(cè),結(jié)果顯示:LASBC模型的預(yù)測(cè)精度顯著提高;基于預(yù)測(cè)月降水量,給出了6個(gè)主要城市未來(lái)10年氣候偏干旱或濕潤(rùn)的月份及降水量;未來(lái)10年,我國(guó)西北干旱區(qū)年均降水基本保持穩(wěn)定,高寒凍土區(qū)略有增加,西南濕潤(rùn)區(qū)增長(zhǎng)趨勢(shì)明顯.

      關(guān)鍵詞:降水分布;時(shí)空預(yù)測(cè);機(jī)器學(xué)習(xí);集成模型;時(shí)空相關(guān)性

      中圖分類號(hào):TP 391.42;R 742.5??? 文獻(xiàn)標(biāo)志碼:A??? 文章編號(hào):1001-988Ⅹ(2024)03-0105-10

      A spatiotemporal integrated model for

      regional precipitation prediction

      MA Yu-hong1,2,XUE Sheng-qian1,WANG Xiao-xiao1,LU Jin-ye1

      (1.College of Mathematics and Statistics,Northwest Normal University,Lanzhou 730070,Gansu,China;

      2.Editorial Department of the University Journal,Northwest Normal University,Lanzhou 730070,Gansu,China)

      Abstract:A spatiotemporal prediction model LSTM-ARIMA-SARIMA-BP-CNN(LASBC) for regional precipitation is proposed,which integrates multiple deep learning methods.Among them,ARIMA model captures the time-neighbor correlation of precipitation time series,SARIMA model captures the periodic trend of precipitation time series,BP neural network reveals the spatiotemporal correlation of precipitation distribution,CNN network excavates the influence of meteorological and geographical factors on precipitation,and finally,LSTM network is used to fuses the prediction results of the four models so as to improve the prediction accuracy.Based on the monthly precipitation data of major cities in western China from January 1985 to December 2021,the LASBC model is used to forecast the monthly precipitation of 12 cities in western China.The results show that the prediction accuracy of the LASBC model is greatly improved;the predicting months and precipitations for six major cities with a slightly arid or humid climate in the next 10 years are given

      based on? the predicted monthly precipitation;in the next ten years the annual average precipitation in the northwest

      arid region has remained stable,with a slight increase in the high-altitude permafrost region and a significant growth trend in the southwest humid region.

      Key words:precipitation distribution;spatiotemporal prediction;machine learning;integration model;spatiotemporal correlation

      眾所周知,一個(gè)地區(qū)降水量的時(shí)空分布嚴(yán)重影響著人們生產(chǎn)生活的各個(gè)方面.我國(guó)西部地區(qū)地域遼闊,地形復(fù)雜,屬于典型的溫帶大陸性氣候和高原山地氣候,降水空間分布極不均勻,局地差異大;降水量按季度、按月度分布很不平衡,冬季干旱少雨,夏季水量充沛.降水的時(shí)空不均衡嚴(yán)重影響區(qū)域生態(tài)環(huán)境及經(jīng)濟(jì)發(fā)展,所以挖掘區(qū)域降水?dāng)?shù)據(jù)的時(shí)空分布規(guī)律,準(zhǔn)確預(yù)測(cè)未來(lái)降水的時(shí)空分布對(duì)于高效利用降水改善生態(tài)環(huán)境、發(fā)展區(qū)域經(jīng)濟(jì)及預(yù)防地質(zhì)災(zāi)害都具有重要的現(xiàn)實(shí)意義.

      1? 研究綜述

      降水預(yù)測(cè)模型通常分為5類:物理模型、統(tǒng)計(jì)模型、機(jī)器學(xué)習(xí)模型、深度學(xué)習(xí)模型和集成學(xué)習(xí)模型,物理模型也稱為過(guò)程模型,它需要考慮影響降水的各種氣象因素,通過(guò)模擬降水的物理過(guò)程對(duì)降水進(jìn)行預(yù)測(cè),統(tǒng)計(jì)模型、機(jī)器學(xué)習(xí)模型、深度學(xué)習(xí)模型和集成學(xué)習(xí)模型統(tǒng)稱為數(shù)據(jù)驅(qū)動(dòng)模型,它通過(guò)挖掘蘊(yùn)含在降水歷史數(shù)據(jù)中的內(nèi)在規(guī)律和演化趨勢(shì)對(duì)降水的時(shí)空分布和強(qiáng)度進(jìn)行預(yù)測(cè).

      物理模型根據(jù)空氣動(dòng)力學(xué)和熱力學(xué)原理揭示降水過(guò)程中各種氣象因素對(duì)降水分布及強(qiáng)度的影響.2004年,陳菊英等[1]通過(guò)集成多種降水前兆敏感因子,建立了海河流域汛期降水的多級(jí)預(yù)報(bào)物理模型;馬振鋒等[2]根據(jù)四川盆地固有的三類降水分布特征,建立了一種預(yù)測(cè)川渝地區(qū)汛期降水量的物理模型.物理模型雖然對(duì)降水的物理過(guò)程和各種氣象因素的影響解釋清晰,預(yù)測(cè)精度高,但物理模型的建立需要大量專業(yè)的氣象知識(shí),且很容易受到各種突發(fā)性隨機(jī)因素的干擾.

      統(tǒng)計(jì)模型主要通過(guò)對(duì)歷史降水?dāng)?shù)據(jù)的統(tǒng)計(jì)分析建立回歸方程進(jìn)行預(yù)測(cè),當(dāng)前最流行的統(tǒng)計(jì)模型是差分自回歸移動(dòng)平均(Auto-Regressive Integrated Moving Average, ARIMA)模型.胡盈等[3]利用江西省 16 個(gè)氣象站點(diǎn)逐月降水量數(shù)據(jù)建立 ARIMA 模型,并對(duì) 2020—2021 年的逐月降水量進(jìn)行預(yù)測(cè);Coban等[4]基于ARIMA模型對(duì)土耳其馬爾馬拉地區(qū)的降水進(jìn)行預(yù)測(cè);Nayagam等[5]通過(guò)線性回歸模型對(duì)印度喀拉拉邦夏季降水進(jìn)行預(yù)測(cè);Huang等[6]提出了一種年際增量結(jié)合經(jīng)驗(yàn)正交分解的統(tǒng)計(jì)預(yù)測(cè)方法;Wang等[7]采用經(jīng)驗(yàn)正交函數(shù)和旋轉(zhuǎn)經(jīng)驗(yàn)正交函數(shù)分析了1960—2010年我國(guó)降水的時(shí)空分布特征及演化規(guī)律.統(tǒng)計(jì)模型簡(jiǎn)單直觀,當(dāng)降水時(shí)間序列是線性或接近線性時(shí),統(tǒng)計(jì)模型能產(chǎn)生令人滿意的預(yù)測(cè)結(jié)果,但當(dāng)時(shí)間序列呈現(xiàn)非線性時(shí)預(yù)測(cè)精度往往差強(qiáng)人意.

      機(jī)器學(xué)習(xí)模型通過(guò)模擬人腦的工作方式,自動(dòng)學(xué)習(xí)和提取降水?dāng)?shù)據(jù)的特征進(jìn)行預(yù)測(cè).機(jī)器學(xué)習(xí)模型具有較強(qiáng)的自適應(yīng)性和學(xué)習(xí)能力,能夠處理非線性和非平穩(wěn)的數(shù)據(jù),但需要大量的訓(xùn)練數(shù)據(jù)和計(jì)算資源.近來(lái),Chau等[8]結(jié)合奇異譜分析(Singular Spectrum Analysis, SSA)和支持向量回歸(Support Vector Regression, SVR)實(shí)現(xiàn)了巴基斯坦3類農(nóng)業(yè)帶的月降水預(yù)測(cè);Hartigan等[9]使用隨機(jī)森林(Random Forest, RF)和SVR對(duì)悉尼流域的降水和氣溫進(jìn)行預(yù)測(cè);Xiang 等[10]利用決策樹(Decision Tree, DT)和RF對(duì)重慶市的夏季降水進(jìn)行預(yù)測(cè);Rostam等[11]通過(guò)多層感知器探索伊朗首都德黑蘭大尺度氣候指數(shù)與降水之間的聯(lián)系;Lu等[12]通過(guò)具有不同核函數(shù)的支持向量機(jī)(Support Vector Machine, SVM)預(yù)測(cè)廣西地區(qū)的月降水量;Kisi等[13]結(jié)合離散小波變換(Discrete Wavelet Transform, DWT)和SVM對(duì)土耳其伊茲密爾和阿菲永站的日降水量進(jìn)行預(yù)測(cè).

      深度學(xué)習(xí)模型是神經(jīng)網(wǎng)絡(luò)模型的擴(kuò)展,它通過(guò)增加網(wǎng)絡(luò)深度和寬度處理更為復(fù)雜的數(shù)據(jù).降水?dāng)?shù)據(jù)通常具有時(shí)空依賴性、大規(guī)模和高維度屬性,深度學(xué)習(xí)模型不僅適應(yīng)于大規(guī)模數(shù)據(jù)建模,而且能夠自動(dòng)捕獲數(shù)據(jù)的時(shí)空依賴性,所以廣泛應(yīng)用于時(shí)空數(shù)據(jù)建模與預(yù)測(cè).典型的深度學(xué)習(xí)模型有卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)、深度置信網(wǎng)絡(luò)(Deep Belief Networks, DBN)和堆棧自編碼網(wǎng)絡(luò)(Stacked Auto-Encoder Network, SAEN).Luc等[14]使用多層前饋神經(jīng)網(wǎng)絡(luò)(Multi-Layer Feed-forward Network, MLFN)、偏循環(huán)神經(jīng)網(wǎng)絡(luò)和時(shí)間延遲神經(jīng)網(wǎng)絡(luò)對(duì)悉尼帕拉馬塔河流域10次暴雨事件的降水量進(jìn)行預(yù)測(cè);Baratta等[15]結(jié)合MLFN和SSA對(duì)意大利臺(tái)伯河流域的日降水量進(jìn)行預(yù)測(cè);Nasseri等[16]將遺傳算法與ANN相結(jié)合,對(duì)悉尼帕拉馬塔河流域上游降水進(jìn)行短期預(yù)測(cè);LI等[17]基于BP神經(jīng)網(wǎng)絡(luò)對(duì)浙江北部夏季降水量進(jìn)行預(yù)測(cè);Shi等[18]提出了一種基于CNN的降水預(yù)測(cè)方法;Du等[19]成功地將DBN模型應(yīng)用到天氣降水預(yù)測(cè)研究中;Ha等[20]使用DBN提高了韓國(guó)首爾地區(qū)降水和溫度等的預(yù)測(cè)精度;Tao等[21]結(jié)合Atrous小波變換建立了一個(gè)具有注意機(jī)制的多尺度長(zhǎng)短期記憶(Multiscale Long-Short Term Memory, MLSTM)神經(jīng)網(wǎng)絡(luò),并對(duì)長(zhǎng)江流域129個(gè)監(jiān)測(cè)站月降水量的預(yù)報(bào)精度進(jìn)行改進(jìn);Misra等[22]提出了基于LSTM的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,并利用印度馬哈納迪盆地的降水?dāng)?shù)據(jù)和加拿大坎貝爾河流域的降水?dāng)?shù)據(jù)測(cè)試了模型的可靠性.

      集成學(xué)習(xí)模型可以對(duì)多種預(yù)測(cè)模型進(jìn)行融合,如將統(tǒng)計(jì)模型和物理模型進(jìn)行加權(quán)融合,或?qū)Χ鄠€(gè)深度學(xué)習(xí)模型集成優(yōu)化.多模式集成預(yù)測(cè)是一種信息后處理技術(shù),它通過(guò)綜合不同方面的信息或各有所長(zhǎng)的建模方法有效改善模型的預(yù)測(cè)精度.近來(lái),Wu等[23]建立了一種混和深度學(xué)習(xí)模型預(yù)測(cè)具有時(shí)空依賴的區(qū)域O3和NO2的濃度;Ding等[24]結(jié)合時(shí)空建模和多尺度網(wǎng)絡(luò)預(yù)測(cè)城市出租車的需求;Yu等[25]建立了基于集成深度圖注意強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)的多因素驅(qū)動(dòng)時(shí)空風(fēng)電預(yù)測(cè)模型.

      受集成學(xué)習(xí)方法的啟發(fā),本文根據(jù)降水?dāng)?shù)據(jù)的高度時(shí)空依賴性和外在氣象因素的強(qiáng)關(guān)聯(lián)性,首先通過(guò)ARIMA模型、季節(jié)性ARIMA模型(SARIMA)、BP神經(jīng)網(wǎng)絡(luò)和CNN分別對(duì)某區(qū)域的降水進(jìn)行預(yù)測(cè),然后再通過(guò)LSTM 對(duì)4種模型的預(yù)測(cè)結(jié)果進(jìn)行融合,建立了一種深度學(xué)習(xí)集成預(yù)測(cè)模型LSTM-ARIMA-SARIMA-BP-CNN(簡(jiǎn)稱LASBC模型),其中 ARIMA模型和SARIMA模型分別捕捉降水的時(shí)間近鄰性和周期性,BP神經(jīng)網(wǎng)絡(luò)模型挖掘降水?dāng)?shù)據(jù)的時(shí)空相關(guān)性,CNN模型揭示外在的氣象和地理因素對(duì)降水的影響.以中國(guó)西部地區(qū)12個(gè)城市1985年1月至2021年12月的月降水量數(shù)據(jù)為主,結(jié)合當(dāng)月平均溫度、相對(duì)濕度、日照時(shí)數(shù)等氣象因素以及經(jīng)度、緯度、海拔高度等地理數(shù)據(jù),應(yīng)用LASBC模型對(duì)西部12個(gè)主要城市的月降水量進(jìn)行預(yù)測(cè),結(jié)果顯示:與4個(gè)單一預(yù)測(cè)模型相比,新模型的預(yù)測(cè)精度大幅提高;基于預(yù)測(cè)月降水量,給出了6個(gè)主要城市未來(lái)10年氣候偏干旱或濕潤(rùn)的月份及相應(yīng)的降水量;分析每5年的年均降水量可知,未來(lái)10年我國(guó)西北干旱區(qū)降水量基本穩(wěn)定,高寒凍土區(qū)略有增加,西南濕潤(rùn)區(qū)增長(zhǎng)明顯.

      2? 模型與方法

      2.1? 時(shí)空序列模式

      2.1.1? 時(shí)間的近鄰性和周期性? 一般而言,事物的發(fā)展變化在時(shí)間上具有近鄰相關(guān)性,時(shí)間越接近狀態(tài)越相似,時(shí)間近鄰預(yù)測(cè)就是用時(shí)間序列連續(xù)的前n個(gè)值去預(yù)測(cè)當(dāng)前值;時(shí)間序列的周期性刻畫了事物發(fā)展的周期性變化,如月亮的圓缺和河水潮汐的變化明顯以月為周期,所以第t天的變化不僅與前n天的變化密切相關(guān),而且與其上個(gè)月、上上個(gè)月相鄰日期的變化高度相似.

      時(shí)空序列的時(shí)間近鄰模式和周期模式可以表述為

      TCs,t~(xs,t-n,xs,t-(n-1),…,xs,t-2,xs,t-1),

      TPs,t~(xs,t-n·T,xs,t-(n-1)·T,…,xs,t-2·T,xs,t-1·T),

      其中s為數(shù)據(jù)監(jiān)測(cè)點(diǎn),t為當(dāng)前時(shí)刻,n是歷史時(shí)間滯后期,即用監(jiān)測(cè)站s前n個(gè)時(shí)刻的值預(yù)測(cè)當(dāng)前時(shí)刻的值,T是時(shí)間序列的周期;TC代表時(shí)間近鄰模式,TP代表時(shí)間周期模式.所以時(shí)間近鄰預(yù)測(cè)和時(shí)間周期預(yù)測(cè)分別表達(dá)為

      TCs,t=fTCs(xs,t-n,xs,t-(n-1),…,xs,t-2,xs,t-1),

      TPs,t=fTPs(xs,t-n·T,xs,t-(n-1)·T,…,

      xs,t-2·T,xs,t-1·T).

      2.1.2? 時(shí)空的近鄰性? 根據(jù)地理學(xué)第一定律,任何地理事物在時(shí)間和空間上都是高度依賴的,時(shí)間越接近狀態(tài)越相似,空間越接近屬性越相似.時(shí)空預(yù)測(cè)就是用事物所有近鄰前n個(gè)時(shí)刻的狀態(tài)或?qū)傩匀ネ茢嗥洚?dāng)前的狀態(tài)或?qū)傩?以B(s,r)表示以s為中心、r為半徑的鄰域,記

      Γs={1≤i≤S:i∈B(s,r)}={s1,s2,…,sk}

      為監(jiān)測(cè)點(diǎn)s在其r鄰域內(nèi)所有近鄰點(diǎn)的集合,因?yàn)楸O(jiān)測(cè)點(diǎn)s在t時(shí)刻的預(yù)測(cè)值STs,t與其所有k個(gè)近鄰前n個(gè)時(shí)刻的值相關(guān),所以對(duì)空序列的時(shí)空相關(guān)模式可以表述為

      STs,t~(xs1,t-n,xs1,t-(n-1),…,xs1,t-1,…,

      xsk,t-n,xsk,t-(n-1),…,xsk,t-1),

      其中si(1≤i≤k)為監(jiān)測(cè)點(diǎn)s的第i個(gè)近鄰,ST代表時(shí)空近鄰模式.所以時(shí)空近鄰預(yù)測(cè)表達(dá)為

      STs,t=fSTs(xs1,t-n,xs1,t-(n-1),…,xs1,t-1,…,

      xsk,t-n,xsk,t-(n-1),…,xsk,t-1).

      2.1.3? 外在因素相關(guān)性? 任何事物都不是孤立存在的,其發(fā)展變化必然受環(huán)境因素的影響,當(dāng)前狀態(tài)或?qū)傩耘c許多特定因素具有很強(qiáng)的相關(guān)性,如一地某時(shí)刻的空氣質(zhì)量不僅受到該地前n個(gè)時(shí)刻風(fēng)速、風(fēng)向、溫度、濕度等氣象因素的影響,也受到地形及人類活動(dòng)的影響.所以外在因素相關(guān)性模式可以表述為

      FCs,t~(y1s,t-n,y1s,t-(n-1),…,y1s,t-1…,

      yms,t-n,yms,t-(n-1),…,yms,t-1),

      其中FC代表因素相關(guān),m代表相關(guān)因子數(shù),n代表時(shí)間滯后期.所以外在因素相關(guān)的預(yù)測(cè)可以表述為

      FCs,t=fFCs(y1s,t-n,y1s,t-(n-1),…,y1s,t-1…,

      yms,t-n,yms,t-(n-1),…,yms,t-1).

      2.2? 基礎(chǔ)模型

      2.2.1? ARIMA和SARIMA模型? ARIMA模型是20世紀(jì)70年代Box和Jenkins提出的一種時(shí)間序列預(yù)測(cè)方法[26].在ARIMA(p,d,q)模型中,AR為自回歸項(xiàng),MA為滑動(dòng)平均項(xiàng);p為自回歸階數(shù),q為滑動(dòng)平均階數(shù),d為使時(shí)間序列成為平穩(wěn)序列所做的差分次數(shù)(階數(shù)).一般地,d=0的ARIMA(p,d,q)模型表示為

      t=c+∑pi=1φiXt-i+∑qj=1θjεt-j+εt,

      其中φi(1≤i≤p)和θj(1≤j≤q)為不全為零的待定系數(shù);εt為獨(dú)立的誤差項(xiàng);Xt為平穩(wěn)、正態(tài)、零均值的時(shí)間序列.ARIMA模型簡(jiǎn)單,但缺點(diǎn)是要求時(shí)間序列數(shù)據(jù)是平穩(wěn)的或者差分后是平穩(wěn)的,并且其只能捕捉時(shí)間序列數(shù)據(jù)的線性關(guān)系而不能捕捉非線性關(guān)系.SARIMA模型主要處理具有明顯周期性的時(shí)間序列.如果時(shí)間序列數(shù)據(jù)是一個(gè)非平穩(wěn)時(shí)間序列,并且在大尺度上存在明顯的周期性,則需要先對(duì)時(shí)間序列進(jìn)行周期差分,然后再進(jìn)行若干次趨勢(shì)差分,使之成為平穩(wěn)時(shí)間序列然后才能應(yīng)用ARIMA模型.

      平穩(wěn)時(shí)間序列的均值和協(xié)方差不隨時(shí)間變化,數(shù)據(jù)序列的平穩(wěn)性一般使用ADF檢驗(yàn)和KPSS檢驗(yàn)來(lái)判斷.ADF檢驗(yàn)是一種基于單位根檢驗(yàn)的平穩(wěn)性檢驗(yàn)方法,如果ADF統(tǒng)計(jì)量小于對(duì)應(yīng)的臨界值,且P值小于顯著性水平,則認(rèn)為時(shí)間序列是平穩(wěn)的;KPSS檢驗(yàn)與ADF檢驗(yàn)相反,它假設(shè)時(shí)間序列是平穩(wěn)的,然后通過(guò)KPSS統(tǒng)計(jì)量來(lái)檢驗(yàn)這個(gè)假設(shè),如果KPSS統(tǒng)計(jì)量小于對(duì)應(yīng)的臨界值,且P值小于顯著性水平,則時(shí)間序列是平穩(wěn)的.

      2.2.2? BP神經(jīng)網(wǎng)絡(luò)? BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是1986年Mcclleland等[27]建立的一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),它的基本思想是利用梯度下降法使網(wǎng)絡(luò)的實(shí)際輸出值和期望輸出值之間的均方誤差最小.BP神經(jīng)網(wǎng)絡(luò)在輸入層與輸出層之間增加了若干隱含層神經(jīng)元,神經(jīng)元狀態(tài)的改變影響輸入與輸出之間的關(guān)系.BP神經(jīng)網(wǎng)絡(luò)由正向計(jì)算過(guò)程和反向計(jì)算過(guò)程組成,正向傳播過(guò)程從輸入層經(jīng)過(guò)隱含層逐層處理,并轉(zhuǎn)向輸出層,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài);如果輸出層不能得到預(yù)期輸出,則將誤差沿原路反向傳播,通過(guò)修改各神經(jīng)元的權(quán)值使得輸出誤差最小.

      2.2.3? 卷積神經(jīng)網(wǎng)絡(luò)(CNN)? CNN是一類包含卷積操作且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),其研究始于20世紀(jì)80~90年代,時(shí)間延遲網(wǎng)絡(luò)和LeNet-5是最早出現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò)[28].CNN既具有良好的特征提取能力,又具有較強(qiáng)的辨別能力,因此在機(jī)器學(xué)習(xí)系統(tǒng)中主要用于特征提取和分類.經(jīng)典的CNN結(jié)構(gòu)由卷積層和池化層交替疊加組成,最后由全連接層輸出.首先,數(shù)據(jù)在卷積層和若干個(gè)卷積核進(jìn)行卷積操作,提取輸入特征;然后,池化層對(duì)卷積層提取的特征進(jìn)行選擇,池化操作有助于特征的組合;最后,全連接層進(jìn)行擬合,減少特征信息的損失.

      2.3.4? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)? LSTM網(wǎng)絡(luò)是一種具有獨(dú)特三門結(jié)構(gòu)的循環(huán)神經(jīng)網(wǎng)絡(luò)[29],遺忘門決定網(wǎng)絡(luò)對(duì)上一層輸入的保留程度,輸入門決定網(wǎng)絡(luò)對(duì)新輸入的保留程度,輸出門決定網(wǎng)絡(luò)對(duì)輸出的保留程度.LSTM的這種門結(jié)構(gòu)不僅可以控制信息流的走向,而且可以防止循環(huán)神經(jīng)網(wǎng)絡(luò)長(zhǎng)時(shí)間依賴上的梯度消失或梯度爆炸現(xiàn)象,特別適合處理間隔較長(zhǎng)的時(shí)間序列.

      2.3? 集成模型結(jié)構(gòu)

      一個(gè)地區(qū)所在的海陸位置、地形、氣壓、風(fēng)

      帶、洋流、太陽(yáng)黑子以及人類活動(dòng)對(duì)降水均有很大影響,所以降水序列數(shù)據(jù)具有特殊的時(shí)空結(jié)構(gòu)特征.為了綜合考慮影響降水的各種氣象因素及地理因素,并充分發(fā)掘蘊(yùn)含在歷史降水?dāng)?shù)據(jù)中的內(nèi)在規(guī)律,提高降水預(yù)測(cè)精度,本文建立一個(gè)多模型集成學(xué)習(xí)預(yù)測(cè)模型LASBC,其中ARIMA模型捕捉降水時(shí)間序列的近鄰性特證,SARIMA模型捕捉周期性特征,BP神經(jīng)網(wǎng)絡(luò)模型挖掘時(shí)空相關(guān)性,CNN揭示氣象和地理因素在時(shí)間和空間維度上對(duì)降水的影響,最后,4個(gè)子模型的預(yù)測(cè)結(jié)果再由LSTM模型進(jìn)行融合,得到更高精度的預(yù)測(cè)結(jié)果.

      LASBC集成學(xué)習(xí)模型的基本思想為

      s,t=fs(TCs,t,TPs,t,STs,t,F(xiàn)Cs,t),

      其中TCs,t,TPs,t,STs,t,F(xiàn)Cs,t分別是ARIMA、SARIMA、CP和CNN 模型的預(yù)測(cè)結(jié)果,集成學(xué)習(xí)模型的整體流程與結(jié)構(gòu)如圖1所示.

      2.4? 性能評(píng)估指標(biāo)

      使用平均絕對(duì)誤差(MAE)、均方誤差(MSE)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)4個(gè)指標(biāo)對(duì)模型的預(yù)測(cè)性能進(jìn)行評(píng)價(jià),其定義分別為

      MAE=1n∑ni=1|i-xi|,

      MSE=1n∑ni=1(i-xi)2,

      RMSE=1n∑ni=1(i-xi)2,

      MAPE=1n∑ni=1|(i-xi)/xi|·100%,

      其中,n為數(shù)據(jù)的個(gè)數(shù),xi表示第i個(gè)數(shù)據(jù)的真實(shí)值,i表示所有第i個(gè)數(shù)據(jù)的預(yù)測(cè)值.評(píng)價(jià)指標(biāo)的值越接近于0,模型預(yù)測(cè)精度越高.

      3? 應(yīng)用分析

      3.1? 數(shù)據(jù)集介紹

      我國(guó)西部地區(qū)屬于典型的溫帶大陸性氣候和高原山地氣候,在氣候上可以分為高寒凍土區(qū)、西北干旱區(qū)和西南濕潤(rùn)區(qū)3個(gè)區(qū)域,降水在時(shí)間分布上具有明顯季節(jié)性,夏季降水豐沛,冬季降水稀少;降水量空間分布極為不均,總體表現(xiàn)為從東南向西北逐步減少.西部地區(qū)地域廣闊、城市眾多,我們選取氣象、地理數(shù)據(jù)及降水監(jiān)測(cè)數(shù)據(jù)相對(duì)完整的12個(gè)省會(huì)城市西安、銀川、蘭州、西寧、烏魯木齊、成都、重慶、拉薩、昆明、貴陽(yáng)、南寧、呼和浩特作為研究對(duì)象,數(shù)據(jù)集為12個(gè)城市1985年1月到2021年12月共37年的月降水量數(shù)據(jù),以及每月的平均溫度、相對(duì)濕度、日照時(shí)數(shù)等氣象數(shù)據(jù)和城市經(jīng)度、緯度、海拔高度等地理數(shù)據(jù),數(shù)據(jù)整理自《中國(guó)氣象統(tǒng)計(jì)年鑒》(1985—2021)及中國(guó)氣象網(wǎng).

      為了直觀展示各模型的預(yù)測(cè)精度,我們選取高寒凍土區(qū)的拉薩和西寧、西北干旱區(qū)的烏魯木齊和西安、西南濕潤(rùn)區(qū)的重慶和南寧6個(gè)主要城市進(jìn)行對(duì)比,以1985年1月至2016年12月的數(shù)據(jù)為訓(xùn)練集,2017年1月至2021年12月的數(shù)據(jù)為測(cè)試集,并對(duì)2022年1月至2031年12月各城市的降水進(jìn)行前瞻性預(yù)測(cè).

      3.2? 模型參數(shù)設(shè)置

      6個(gè)主要城市:拉薩、西寧、烏魯木齊、西安、重慶、南寧的降水量數(shù)據(jù)先做一次周期差分,再做一次趨勢(shì)差分后經(jīng)檢驗(yàn)成為平穩(wěn)時(shí)間序列,最后通過(guò)AIC和BIC準(zhǔn)則確定最優(yōu)的自回歸階數(shù)p和滑動(dòng)平均階數(shù)q,得到6個(gè)城市對(duì)應(yīng)的ARIMA模型分別為ARIMA(2,1,4),ARIMA(3,1,4),ARIMA(3,1,2),ARIMA(4,1,4),ARIMA(4,1,4)和ARIMA(3,1,2).BP神經(jīng)網(wǎng)絡(luò)為4層結(jié)構(gòu),輸入層4個(gè)神經(jīng)元(時(shí)間滯后期n=4),第一隱層30個(gè)神經(jīng)元,第二隱層10個(gè)神經(jīng)元,輸出層1個(gè)神經(jīng)元;訓(xùn)練函數(shù)選擇traingd梯度下降法,最大訓(xùn)練次數(shù)為4000,學(xué)習(xí)率為0.02,訓(xùn)練精度10-5.CNN網(wǎng)絡(luò)為L(zhǎng)eNet-5架構(gòu),不同城市近鄰數(shù)可能有所不同,但時(shí)間滯后期統(tǒng)一設(shè)置為3,若城市的近鄰數(shù)為m,則輸入特征為3m,使用adam優(yōu)化器,設(shè)置最小批處理數(shù)為16,梯度閾值為1,初始學(xué)習(xí)率為0.05,迭代次數(shù)為250.LSTM的輸入層特征維度為4,隱含單元數(shù)為100,輸出全連接層特征維度為1,使用adam優(yōu)化器,最大訓(xùn)練輪數(shù)為250,梯度閾值為1,初始學(xué)習(xí)率為0.005.

      3.3? 結(jié)果與分析

      圖2是6個(gè)主要城市測(cè)試集的預(yù)測(cè)結(jié)果,其中紅線代表預(yù)測(cè)值,藍(lán)線代表真實(shí)值.由圖2可知,6個(gè)主要城市的降水量在時(shí)間上具有明顯的周期性,每年豐水期、枯水期特征分明,水量差別大.表1為L(zhǎng)ASBC模型和SARIMA模型、ARIMA模型、BP模型、CNN模型對(duì)6個(gè)主要城市降水預(yù)測(cè)性能的評(píng)價(jià)指標(biāo).結(jié)合圖2和表1可知,LASBC模型對(duì)6個(gè)城市降水量的預(yù)測(cè)與實(shí)際降水量最為接近,誤差最小.以經(jīng)典的RMSE為例,拉薩的RMSE為10.72,比單純的SARIMA模型、ARIMA模型、BP模型和CNN模型分別改進(jìn)了73.4%,62.2%,70.7%和42.9%,平均改進(jìn)率62.3%;西安的RMSE為15.75,比單純的SARIMA模型、ARIMA模型、BP模型和CNN模型分別改進(jìn)了55.6%,58.8%,64.9%和49.4%,平均改進(jìn)率57.2%;LASBC模型對(duì)烏魯木齊、拉薩、西寧和西安的預(yù)測(cè)精度最高,RMSE分別為7.63,10.72,11.21和15.75,而對(duì)重慶和南寧的預(yù)測(cè)精度較低,RMSE分別為46.35和46.57,原因是:一方面,重慶和南寧地處西南濕潤(rùn)區(qū),月降水量的絕對(duì)數(shù)值大導(dǎo)致誤差偏大;另一方面,西南濕潤(rùn)區(qū)受拉尼娜和厄爾尼諾氣候影響明顯,降水分布隨機(jī)性強(qiáng)、強(qiáng)度波動(dòng)性大導(dǎo)致誤差偏大.綜合評(píng)價(jià)可知,本文模型預(yù)測(cè)精度更高,性能更好.

      3.4? 未來(lái)預(yù)測(cè)

      為了探究中國(guó)西部地區(qū)未來(lái)10年降水量的變化,我們應(yīng)用LASBC模型對(duì)西部地區(qū)6個(gè)主要城市:拉薩、西寧、烏魯木齊、西安、重慶、南寧2022年1月至2031年12月共10年的降水分布及強(qiáng)度進(jìn)行前瞻性預(yù)測(cè),結(jié)果見圖3.由圖3可以看出,整個(gè)西部地區(qū)未來(lái)10年的月降水量及分布與前40年相比變化不大,夏季降水集中,水量充沛,冬季降水稀少;西南濕潤(rùn)區(qū)的重慶和南寧,夏季降水量明顯高于西北干旱區(qū)的烏魯木齊和西安,其中南寧市2023年8月降水量會(huì)突破400 mm,2031年8月降水量更是接近500 mm;烏魯木齊和西寧全年降水稀少,烏魯木齊最高月降水量不會(huì)超過(guò)100 mm,西寧更是在50 mm附近徘徊,但烏魯木齊和西寧市夏季和冬季降水量差異最少,原因可能是冬季降雪補(bǔ)償引起的.

      圖4是拉薩、西寧、烏魯木齊、西安、重慶、南寧6個(gè)主要城市1991年1月至2031年12月每5年平均年降水量變化趨勢(shì).從圖4可以看到,高寒凍土區(qū)的拉薩和西寧未來(lái)10年內(nèi)降水量略有增加,2021—2025年年均降水量為479.74 mm和423.79 mm,2026—2030年年均降水量為502.16 mm和470.16 mm,相比上個(gè)5年降水分別增加22.42 mm和46.37 mm;西北干旱區(qū)的烏魯木齊和西安的降水量有波動(dòng),但變化不大,烏魯木齊和西安市2021—2025年的年均降水量分別為423.79和303.27 mm,而2026—2030年的年均降水量為470.16和292.73 mm,烏魯木齊略有增加,而西安則略有減少;西南濕潤(rùn)區(qū)的重慶的降水量在1996年后持續(xù)增加,至2016年后年降水量已經(jīng)超過(guò)1 000 mm,預(yù)測(cè)未來(lái)降水量總體會(huì)波動(dòng)增加,南寧市年均降水量多年保持在1 200~1 400 mm之間,雖然偶爾有所波動(dòng),但總體保持平穩(wěn),變化不大.

      總體來(lái)說(shuō),中國(guó)西部地區(qū)近40年降水量呈現(xiàn)緩慢增加的趨勢(shì),高寒凍土區(qū)與西北干旱區(qū)增長(zhǎng)緩慢,而西南濕潤(rùn)區(qū)降水呈現(xiàn)較明顯的增長(zhǎng)趨勢(shì).未來(lái)10年,中國(guó)西部地區(qū)的年平均降水量總體不會(huì)有明顯增加的趨勢(shì).

      表2是模型預(yù)測(cè)得到的我國(guó)西部6個(gè)城市未來(lái)10年內(nèi)偏干旱和濕潤(rùn)的月份及降水量,降水分布的巨大差異對(duì)西部地區(qū)的工農(nóng)業(yè)生產(chǎn)、生態(tài)保護(hù)和防災(zāi)減災(zāi)工作都提出了新的挑戰(zhàn),針對(duì)降水稀少和豐沛的月份,各地政府部門可提前做好水資源調(diào)配利用和防旱防澇準(zhǔn)備工作.

      4? 總結(jié)

      中國(guó)西部地區(qū)降水量在時(shí)間上呈現(xiàn)出較強(qiáng)的周期性和季節(jié)性,夏秋降水最多,冬春較少;在空間上呈現(xiàn)出南多北少,由南到北遞減的趨勢(shì).本文建立了一種融合多種深度學(xué)習(xí)方法的時(shí)空集成預(yù)測(cè)模型LASBC,利用SARIMA模型捕捉降水時(shí)間序列的周期性,ARIMA模型捕捉時(shí)間近鄰性, BP神經(jīng)網(wǎng)絡(luò)揭示降水量分布的空間相關(guān)性,CNN網(wǎng)絡(luò)捕捉氣象、地理因素對(duì)降水的影響,最后通過(guò)LSTM網(wǎng)絡(luò)對(duì)4個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行融合.選取高寒凍土區(qū)、西北干旱區(qū)和西南濕潤(rùn)區(qū)的6個(gè)主要城市的月降水量進(jìn)行預(yù)測(cè),結(jié)果表明:多模式集成模型的預(yù)測(cè)誤差更低,精度更高;基于預(yù)測(cè)的月降水量,給出了6個(gè)主要城市未來(lái)10年氣候可能趨于干旱或濕潤(rùn)的月份及預(yù)測(cè)降水量;未來(lái)10年,我國(guó)西北干旱區(qū)年均降水量基本保持穩(wěn)定,高寒凍土區(qū)略有增加,西南濕潤(rùn)區(qū)增長(zhǎng)趨勢(shì)明顯.然而,有兩個(gè)方面的因素對(duì)LASBC模型的應(yīng)用帶來(lái)了一定程度的挑戰(zhàn):一是西南濕潤(rùn)區(qū)受厄爾尼諾現(xiàn)象影響,突發(fā)性極端降水事件頻發(fā)影響預(yù)測(cè)精度;二是我國(guó)西部地區(qū)地域廣闊,城市空間相關(guān)性明顯不足影響模型性能.

      參考文獻(xiàn):

      [1]? 陳菊英,齊晶,楊鵬,等.海河流域分區(qū)汛期降水量的多級(jí)預(yù)報(bào)物理模型的應(yīng)用前景[C]//全國(guó)水文學(xué)術(shù)討論會(huì),南京:2004-12-01.

      [2]? 馬振鋒,譚友邦.預(yù)測(cè)川渝地區(qū)汛期降水量的一種物理統(tǒng)計(jì)模型[J].大氣科學(xué),2004,28(1):138.

      [3]? 胡盈,吳靜.基于ARIMA模型的降水空間特征分析及預(yù)測(cè)[J]. 江西科學(xué), 2021,39(1):99.

      [4]? ?COBAN V,GULER E,KILIC T,et al.Precipitation forecasting in Marmara region of Turkey[J].Arab J Geosci,2021,14(2):86.

      [5]? NAYAGAM L R,JANARDANAN R,MOHAN H S R.An empirical model for the seasonal prediction of southwest monsoon rainfall over Kerala,a meteorological subdivision of India[J].Int J Climatol,2010,28(6):823.

      [6]? HUANG Yan-yan,WANG Hui-jun,ZHANG Pei-yi.A skillful method for precipitation prediction over eastern China[J].Atmos Ocean Sci Lett,2022,15:100133.

      [7]? WANG Yan-jiao,CHEN Xian-yan,YAN Feng.Spatial and temporal variations of annual precipitation during 1960—2010 in China[J].Quatern Int,2015,380/381:5.

      [8]? CHAU K W,WU C L.A hybrid model coupled with singular spectrum analysis for daily rainfall prediction[J].J Hydroinform,2010,12(4):458.

      [9]? HARTIGAN,Mac NAMARA S,ESLIE L M,et al.Attribution and prediction of precipitation and temperature trends within the Sydney catchment using machine learning[J].Climate,2020,8(10):120.

      [10]? XIANG B,ZENG C F,DONG X N,et al.The application of a decision tree and stochastic forest model in summer precipitation prediction in Chongqing[J].Atmosphere,2020,11(5):508.

      [11]? ROSTAM M G,SADATINEJAD S J,MALEKIAN A.Precipitation forecasting by large-scale climate indices and machine learning techniques[J].J Arid Land,2020,2(5):854.

      [12]? LU Ke-sheng,WANG Ling-zhi.A novel nonlinear combination model based on support vector machine for rainfall prediction[C]//2011 Fourth International Joint Conference on Computational Sciences and Optimization,Kunming and Lijiang,China,2011:1343.

      [13]? KISI O,CIMEN M.A wavelet-support vector machine conjunction model for monthly streamflow forecasting[J].J Hydrol,2011,399(1/2):132.

      [14]? ?LUC K C,BALL J E,SHARMA A.An application of artificial neural networks for rainfall forecasting[J].Math Comp Model,2001,33(6):683.

      [15]? BARATTA D,MASULLI F,CICIONI G,et al.Application of an ensemble technique based on singular spectrum analysis to daily rainfall forecasting[J].Neural Networks,2003,16(3):375.

      [16]? NASSERI M,ASGHARI K,ABEDINI M J.Optimized scenario for rainfall forecasting using genetic algorithm coupled with artificial neural network[J].Expert Syst Appl,2008,35(3):1415.

      [17]? LI Yue-jun,GUO Pin-wen. Application of downscaling forecast for the north of Zhejiang precipitation in summer based on the BP neural network model[J].Trans Atmos Sci,2017,40(3):425.

      [18]? SHI X J,SHI Z R,WAN H G,et al.Convolutional LSTM network:A machine learning approach for precipitation nowcasting[C]//Neural Information Processing Systems,Cambridge,MA:MIT Press,2015:802.

      [19]? DU J,LIU Y,LIU Z.Study of precipitation forecast based on deep belief networks[J].Algorithms,2018,11(9):132.

      [20]? HA J H,YONG H L,KIM Y H.Forecasting the precipitation of the next day using deep learning[J].Korean Inst Intell Syst,2016,26:93.

      [21]? TAO Li-zhi,HE Xin-guang,LI Jia-jia,et al.A multiscale long short-term memory model with attention mechanism for improving monthly precipitation prediction[J].J Hydrol,2021,602:126815.

      [22]? MISRA S,SARKAR S,MITRA P.Statistical downscaling of precipitation using long short-term memory recurrent neural networks[J].Theor Appl Clim,2018,134(3/4):1179.

      [23]? WU Cui-lin,HE Hong-di,SONG Rui-feng,et al.A hybrid deep learning model for regional O3 and NO2 concentrations prediction based on spatiotemporal dependencies in air quality monitoring network[J].Environ Pollut,2023,320:121075.

      [24]? DING Fei,ZHU Yue,YIN Qi,et al.MS-ResCnet:A combined spatiotemporal modeling and multi-scale network for taxi demand prediction[J].Comput Electr Eng,2023,105:108558.

      [25]? YU Cheng-qing,YAN Guang-xi,YU Cheng-ming,et al.A multi-factor driven spatiotemporal wind power prediction model based on ensemble deep graph attention reinforcement learning network[J].Energy,2023,263:126034.

      [26]? BOX G E P,JENKINS G M.Time Series Analysis:Forecasting and Control[M].San Francisco:Holden-Day,1976.

      [27]? MCCLELLAND J,RUMELHART D.Parallel Distributed Processing:Explorations in the Microstructure of Cognition:Psychological and Biological Models[M].Cambridge,MA:MIT Press,1987.

      [28]? LECUN Y,BOTTOU L,BENGIO Y,et al.Gradient-based learning applied to document recognition[J].P IEEE,1998,86(11):2278.

      [29]? SUNDERMEYER M,SCHLUTER R,NEY H.LSTM neural networks for language modeling[R].Human Language Technology and Pattern Recognition,Computer Science Department,Aachen,Germany:RWTH Aachen University,2012.

      (責(zé)任編輯? 馬宇鴻)

      猜你喜歡
      機(jī)器學(xué)習(xí)
      基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
      基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
      前綴字母為特征在維吾爾語(yǔ)文本情感分類中的研究
      下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
      活力(2016年8期)2016-11-12 17:30:08
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      基于Spark的大數(shù)據(jù)計(jì)算模型
      基于樸素貝葉斯算法的垃圾短信智能識(shí)別系統(tǒng)
      基于圖的半監(jiān)督學(xué)習(xí)方法綜述
      機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
      苏尼特左旗| 洛隆县| 舞阳县| 吴川市| 双柏县| 永修县| 钟祥市| 思南县| 宕昌县| 屯留县| 井冈山市| 昂仁县| 泰宁县| 讷河市| 伊通| 屯门区| 商都县| 哈尔滨市| 文成县| 永州市| 南乐县| 麻城市| 溆浦县| 柳州市| 札达县| 同德县| 卢龙县| 洪洞县| 砚山县| 晋宁县| 集贤县| 浦东新区| 罗平县| 临潭县| 邢台县| 丹寨县| 白玉县| 察雅县| 咸丰县| 林甸县| 枣强县|