張偉 全志偉
摘 要:通過對多普勒天氣雷達(dá)數(shù)據(jù)進(jìn)行預(yù)處理,生成大量的雷達(dá)回波圖像,并構(gòu)造了雷達(dá)回波序列圖像庫,為機(jī)器學(xué)習(xí)提供訓(xùn)練樣本集?;跈C(jī)器學(xué)習(xí)算法時空預(yù)測神經(jīng)網(wǎng)絡(luò)(PredRNN++)建立雷達(dá)估測降水識別模型,實現(xiàn)0~3 h雷達(dá)回波預(yù)測。結(jié)果表明:將時空預(yù)測神經(jīng)網(wǎng)絡(luò)方法應(yīng)用于雷達(dá)回波識別,可突破傳統(tǒng)1 h預(yù)報預(yù)警時效,與傳統(tǒng)的深度學(xué)習(xí)算法相比效果較好。
關(guān)鍵詞:機(jī)器學(xué)習(xí);雷達(dá);估測降水
中圖分類號:P412.25 文獻(xiàn)標(biāo)識碼:A 文章編號:1003-5168(2021)26-0026-03
Research on Radar Precipitation Estimation Technology
Based on Machine Learning Algorithm
ZHANG Wei QUAN Zhiwei
(Lanzhou Central Meteorological Observatory, Lanzhou Gansu 730000)
Abstract: By preprocessing doppler weather radar data, a large number of radar echo images are generated, and a radar echo sequence image library is constructed to provide training sample set for machine learning, the recognition model of radar precipitation estimation is established based on machine learning Algorithm time-space prediction neural network (PredRNN++) to realize 0~3 h radar echo prediction. The results show that the method of time-space prediction neural network applied to radar echo recognition can break through the traditional time-effect of 1 h prediction and has better effect than the traditional depth-learning Algorithm.
Keywords: machine learning;radar;precipitation estimation
隨著研究的深入,很多氣象學(xué)者發(fā)現(xiàn)降水元素之間的關(guān)系大多是非線性的,于是越來越多的研究者開始嘗試用神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行降水外推預(yù)報。國內(nèi)針對基于神經(jīng)網(wǎng)絡(luò)的降水預(yù)報研究起步較晚。朱玲等結(jié)合人工智能技術(shù)在氣象領(lǐng)域的未來發(fā)展,列舉了機(jī)器學(xué)習(xí)、語言處理、計算機(jī)視覺方面的真實案例[1];傅德勝等以多普勒雷達(dá)降水回波資料為數(shù)據(jù)基礎(chǔ),建立雷達(dá)定量估測降水模型[2];張文海等基于多普勒雷達(dá)三維拼圖資料,利用機(jī)器學(xué)習(xí)技術(shù)開發(fā)了一種冰雹識別和臨近預(yù)報的人工智能算法[3];李海峰運(yùn)用10種基于傳統(tǒng)機(jī)器學(xué)習(xí)的雷暴大風(fēng)識別方法,通過提取雷達(dá)組合反射率等特征,對雷暴大風(fēng)區(qū)域進(jìn)行識別[4];關(guān)鵬洲等以多普勒雷達(dá)數(shù)據(jù)為基礎(chǔ),改進(jìn)了傳統(tǒng)機(jī)器學(xué)習(xí)模型及近年來興起的深度學(xué)習(xí)算法[5]。
但神經(jīng)網(wǎng)絡(luò)由于參數(shù)過多使網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,存在易陷入局部極小點和收斂速度慢等缺點。在基于神經(jīng)網(wǎng)絡(luò)的降雨預(yù)報研究中,有些學(xué)者把研究重點放在對神經(jīng)網(wǎng)絡(luò)的改進(jìn)和優(yōu)化上。林開平發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)方法在實際天氣預(yù)報業(yè)務(wù)中存在人工神經(jīng)網(wǎng)絡(luò)的泛化性問題[6]。SHI等[7]提出ConvLSTM,以更好地獲取空間特征,并在ConvLSTM的基礎(chǔ)上又提出了一個新模型——軌跡GRU(TrajGRU)。與ConvLSTM不同,TrajGRU會主動學(xué)習(xí)時空的遞歸連接結(jié)構(gòu)。有研究提出了ST-LSTM結(jié)構(gòu),使得上一時刻高層的信息能被更加充分地利用;有研究提出了PredRNN+,使網(wǎng)絡(luò)可以更快速地回想起遙遠(yuǎn)時刻的信息;有研究提出了通過傳遞誤差來預(yù)測的網(wǎng)絡(luò)Prednet和rgcLSTM,但是如果不能持續(xù)提供真值,這類模型很難進(jìn)行長序列的預(yù)測[8-10]??紤]各模型的特點,本文嘗試改進(jìn)目前效果最好的PredRNN++來解決此類問題。
1 研究內(nèi)容及技術(shù)路線
1.1 研究內(nèi)容及目標(biāo)
以基于機(jī)器學(xué)習(xí)算法的雷達(dá)估測降水技術(shù)為研究目標(biāo),結(jié)合雷達(dá)組合反射率與長短期記憶人工神經(jīng)網(wǎng)絡(luò)(Long-Short Term Memory,LSTM)的機(jī)器學(xué)習(xí)系統(tǒng)構(gòu)建要素,發(fā)展一種基于雷達(dá)組合反射率和機(jī)器學(xué)習(xí)技術(shù)的對流單體識別。
1.2 技術(shù)路線與流程
1.2.1 深度學(xué)習(xí)。學(xué)習(xí)過程由5個關(guān)鍵步驟組成:①對多普勒天氣雷達(dá)2年8個月夏季雷達(dá)回波組合反射率篩選、去噪;②通過切割、卷積等方式降低圖像尺寸;③通過PredRNN++網(wǎng)絡(luò)深度學(xué)習(xí)前向計算,得出未來3 h回波圖;④通過轉(zhuǎn)置卷積、拼接等方式還原圖像尺寸;⑤無監(jiān)督學(xué)習(xí)反向傳播誤差,更新深度學(xué)習(xí)模型參數(shù)。
1.2.2 模型介紹。循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)是一種用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)。與一般的神經(jīng)網(wǎng)絡(luò)相比,循環(huán)神經(jīng)網(wǎng)絡(luò)能夠處理序列變化的數(shù)據(jù)。LSTM內(nèi)部主要有3個階段:一是忘記階段,對上一個節(jié)點傳進(jìn)來的輸入進(jìn)行選擇性忘記;二是選擇記憶階段,將這個階段的輸入有選擇性地進(jìn)行記憶;三是輸出階段,決定哪些數(shù)據(jù)將會被當(dāng)成當(dāng)前狀態(tài)的輸出。
LSTM作為一種特殊的RNN,主要是為了解決長序列訓(xùn)練過程中的梯度消失和梯度爆炸問題。簡單來說,相比普通的RNN,其結(jié)構(gòu)已被證明對序列到序列問題有較好的表現(xiàn)。該模型提出了一種門控結(jié)構(gòu),可以使信息選擇性通過。它由一個全連接層和一個sigmoid函數(shù)組成。門矩陣由當(dāng)前時刻輸入xt和上一時刻隱藏層輸出ht-1決定,值的大小在0和1之間。門控制有多少信息可以通過,0代表“所有的都不能通過”,而1代表“所有的都可以通過”。LSTM共有3個門,分別是輸入門、遺忘門、輸出門。遺忘門控制丟棄多少上一時刻的細(xì)胞狀態(tài);輸入門控制多少新的信息會進(jìn)入當(dāng)前細(xì)胞狀態(tài);輸出門決定細(xì)胞狀態(tài)的哪些部分需要輸出。近些年,有許多基于LSTM或其變體GRU的方法被提出來解決時空預(yù)測問題。
PredRNN++由多層CausalLSTM組成。CausalLSTM中包含2個記憶,時間記憶C沿水平方向更新,空間記憶M沿z字方向更新。CausalLSTM在input-to-state and state-to-state transitions過程中也使用了卷積來代替全連接操作。輸入門、遺忘門依賴于x、h、c,這兩個門控制信息在時間記憶C上的流動,除此之外,輸入門、遺忘門還能夠控制信息在空間記憶M上的流動。CausaLSTM采用了級聯(lián)機(jī)制,c將被和x、M、l-1拼接來計算輸入門、遺忘門。最終,輸出ht可以通過拼接CT、MT輸出門ot得到。
2 預(yù)測結(jié)果展示
通過深度學(xué)習(xí)得到的應(yīng)用模型近300 MB,應(yīng)用時使用圖形處理器(Graphics Processing Unit,GPU)可達(dá)到1 s預(yù)測結(jié)果,不帶GPU約10 s即可。挑選其中兩組測試值進(jìn)行展示,其中g(shù)t為真值,pd為預(yù)測值。0~1 h預(yù)測值具有較高的相似度,隨著預(yù)測時間的增加,預(yù)測值變得較為模糊(見圖1)。
3 檢驗評估
通過臨界成功指數(shù)(Critical Success Index,CSI)指標(biāo)定量評估,CSI代表POD和FAR的綜合效應(yīng),POD代表事件發(fā)生的總次數(shù)中發(fā)出警告次數(shù)的占比,F(xiàn)AR代表發(fā)出警告的次數(shù)中事件未發(fā)生次數(shù)的占比。設(shè)定閾值為20 dBZ,當(dāng)回波強(qiáng)度大于閾值時記為yes,低于閾值時記為no。圖2為當(dāng)閾值為20 dBZ時的CSI指數(shù)。
4 結(jié)語
通過機(jī)器學(xué)習(xí)算法深度學(xué)習(xí)原理和時空預(yù)測神經(jīng)網(wǎng)絡(luò)(PredRNN++),完成了雷達(dá)組合反射率識別降水模型,實現(xiàn)了0~3 h雷達(dá)回波預(yù)測。結(jié)果表明:時空預(yù)測神經(jīng)網(wǎng)絡(luò)(PredRNN++)技術(shù)應(yīng)用于雷達(dá)回波識別,可突破傳統(tǒng)1 h預(yù)報預(yù)警時效,與傳統(tǒng)的機(jī)器學(xué)習(xí)算法相比效果更好。
參考文獻(xiàn):
[1]朱玲,關(guān)心玥.人工智能在氣象領(lǐng)域的應(yīng)用述評[J].廣東氣象,2019(1):35-39.
[2]傅德勝,肖晨,譚暢,等.RBF神經(jīng)網(wǎng)絡(luò)在雷達(dá)定量估測降水中的應(yīng)用研究[J].氣象科學(xué),2015(2):199-203.
[3]張文海,李磊.人工智能在冰雹識別及臨近預(yù)報中的初步應(yīng)用[J].氣象學(xué)報,2019(2):282-291.
[4]李海峰.基于雷達(dá)回波的雷暴大風(fēng)識別算法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2018:36.
[5]關(guān)鵬洲,王夢毫,李倩.基于集成學(xué)習(xí)和深度學(xué)習(xí)的短期降雨預(yù)測模型[C]//2017年(第五屆)全國大學(xué)生統(tǒng)計建模大賽獲獎?wù)撐倪x,2017.
[6]林開平.人工神經(jīng)網(wǎng)絡(luò)的泛化性能與降水預(yù)報的應(yīng)用研究[D].南京:南京信息工程大學(xué),2007:45.
[7]SHI X J,GAO Z H,LAUSEN L,et al.Deep learning for precipitation nowcasting: a benchmark and a new model[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems,2017.
[8]劉雅云.基于機(jī)器學(xué)習(xí)的降水?dāng)?shù)據(jù)分析算法的研究[D].南京:南京信息工程大學(xué),2018:61.
[9]周蕓.基于機(jī)器學(xué)習(xí)的多源氣象觀測與研究[D].南京:南京信息工程大學(xué),2020:61.
[10]沈皓俊.基于機(jī)器學(xué)習(xí)的中國夏季降水預(yù)測預(yù)報[D].北京:清華大學(xué),2019:64.
1296501186394