周佩 黃穎婕 胡冰逸,2 韋駿,3,?
基于 LSTM 深度學(xué)習(xí)的 ENSO 預(yù)測(cè)及其春季預(yù)報(bào)障礙研究
周佩1黃穎婕1胡冰逸1,2韋駿1,3,?
1.熱帶大氣海洋系統(tǒng)科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室, 中山大學(xué)大氣科學(xué)學(xué)院, 廣州 510275; 2.北京大學(xué)匯豐商學(xué)院, 深圳 518055; 3.廣西大學(xué)海洋學(xué)院, 南寧 530004; ?通信作者, E-mail: weijun5@mail.sysu.edu.cn
長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)(LSTM); ENSO; 預(yù)報(bào)誤差; 春季預(yù)報(bào)障礙(SPB); Ni?o3.4指數(shù)
ENSO (El Ni?o-Southern Oscillation)預(yù)測(cè)模型可根據(jù)所依據(jù)的計(jì)算原理分為統(tǒng)計(jì)模型和動(dòng)力學(xué)模型兩大類(lèi)[1?2]。統(tǒng)計(jì)模型主要結(jié)合大量的歷史數(shù)據(jù)和統(tǒng)計(jì)理論(如統(tǒng)計(jì)回歸和神經(jīng)網(wǎng)絡(luò)), 找出大氣與海洋變量之間的函數(shù)關(guān)系。動(dòng)力學(xué)模型主要基于大氣?海洋相互作用的動(dòng)力學(xué)理論, 廣泛應(yīng)用于季節(jié)時(shí)間尺度的 ENSO 預(yù)測(cè)。在過(guò)去的幾十年中, 通過(guò)改進(jìn)初始條件和參數(shù)化方案, 開(kāi)發(fā)新的預(yù)測(cè)方法, ENSO 的預(yù)測(cè)能力得到很大的提升[3]。然而, 如果將預(yù)測(cè)模型的起報(bào)時(shí)間提前 6 個(gè)月以上, 兩類(lèi)模型的預(yù)測(cè)能力都會(huì)因春季預(yù)極障礙(spring predictabi-lity barrier,SPB)現(xiàn)象而大幅度下降[4?6]。
SPB 現(xiàn)象最先由 Webster 等[7]發(fā)現(xiàn), 已成為 ENSO預(yù)報(bào)研究領(lǐng)域非常重要的課題。他們看到, 一旦遇到北半球的春季, 對(duì) ENSO 的預(yù)測(cè)能力將迅速衰減, 且與預(yù)報(bào)起始月份和預(yù)報(bào)提前時(shí)間無(wú)關(guān)。科學(xué)家針對(duì) SPB 展開(kāi)大量研究, 但對(duì)其形成原因沒(méi)有統(tǒng)一的觀點(diǎn)[8]。Webster 等[7]率先提出, 海?氣耦合系統(tǒng)在春季處于最敏感時(shí)期, 有利于誤差增長(zhǎng); 同時(shí), 南亞夏季風(fēng)也處于發(fā)展階段, 很容易誘發(fā) SPB 現(xiàn)象。Webster[9]進(jìn)一步指出, 春季是赤道耦合系統(tǒng)最脆弱的季節(jié), 系統(tǒng)的“信噪比”最低, 最易受外界干擾, 從而導(dǎo)致 SPB 形成。此外, Torrence 等[10]認(rèn)為氣候態(tài)的轉(zhuǎn)換也是SPB 的誘發(fā)因子。然而, Wang 等[11]發(fā)現(xiàn), 當(dāng)模型中海?氣耦合系數(shù)保持不變時(shí), SPB現(xiàn)象仍會(huì)出現(xiàn), 因此弱的海?氣耦合并不能解釋模型中的 SPB 現(xiàn)象。通過(guò)分析模型的擾動(dòng)機(jī)制, 他們認(rèn)為春季最大的垂直溫度梯度和最弱的東西熱力差異有利于耦合系統(tǒng)擾動(dòng)的增長(zhǎng), 進(jìn)而使春季海?氣耦合最不穩(wěn)定, 有利于 SPB 現(xiàn)象的產(chǎn)生。為了驗(yàn)證Wang 等[11]模型中 SPB 的成因, Mu 等[12]將理論模型記為 WF96, 分別計(jì)算處于海?氣耦合強(qiáng)不穩(wěn)定性和弱不穩(wěn)定性背景下的厄爾尼諾事件的條件非線性最優(yōu)擾動(dòng)(conditional nonlinear optimal perturbation, CNOP), 結(jié)果表明, 強(qiáng)不穩(wěn)定性條件下的春季誤差增長(zhǎng)明顯更大, 且初始誤差越大, 差異更明顯, 因此春季海?氣耦合不穩(wěn)定性是 SPB 的成因之一。一些研究者從誤差增長(zhǎng)的角度, 認(rèn)為平均態(tài)的年循環(huán)、厄爾尼諾的結(jié)構(gòu)和某些初始誤差的聯(lián)合作用誘發(fā) SPB[13?14]。最近, Meng 等[15]提出一種基于信息熵理論的全新方法“System Sample Entropy”來(lái)預(yù)測(cè)厄爾尼諾事件, 結(jié)果顯示, 厄爾尼諾區(qū)域前一年的近海平面空氣或海表溫度復(fù)雜度與厄爾尼諾事件強(qiáng)度之間存在非常強(qiáng)的穩(wěn)定的正相關(guān)關(guān)系。該方法克服了困擾 ENSO 長(zhǎng)期預(yù)測(cè)的 SPB 問(wèn)題, 可以提前一年成功地預(yù)測(cè)事件強(qiáng)度。
隨著大數(shù)據(jù)分析和計(jì)算機(jī)科學(xué)的發(fā)展, 人們逐漸意識(shí)到機(jī)器學(xué)習(xí)在分析大數(shù)據(jù)信息和處理非線性問(wèn)題方面的卓越性。很多科學(xué)家試圖將機(jī)器學(xué)習(xí)應(yīng)用于各自領(lǐng)域里未解決的科學(xué)問(wèn)題中, 尋求新的突破。Tangang 等[16]和蔣國(guó)榮等[17]發(fā)現(xiàn), 將神經(jīng)網(wǎng)絡(luò)算法與經(jīng)驗(yàn)正交函數(shù)分析方法相結(jié)合, 對(duì) ENSO 預(yù)報(bào)可以起到意想不到的效果。劉科峰等[18]也發(fā)現(xiàn), 基于支持向量機(jī)與小波分解方法結(jié)合的多步遞階預(yù)測(cè)方法, 可以有效地預(yù)報(bào)海溫距平時(shí)間序列。為了得到更好的預(yù)報(bào)結(jié)果, 許柏寧等[19]設(shè)置 4 種不同的深度學(xué)習(xí)網(wǎng)絡(luò)混合模型, 對(duì)區(qū)域海表溫度異常(sea surface temperature anomaly, SSTA)進(jìn)行預(yù)報(bào), 發(fā)現(xiàn)無(wú)論在訓(xùn)練集還是測(cè)試集上的表現(xiàn), Sequence-to-Sequence (Seq2Seq2)模型都優(yōu)于其他模型。Zhang等[20]為了提升沿海海域海表溫度的預(yù)測(cè)能力, 采用長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)(long-short term memory, LSTM)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)海表溫度(sea surface tempera-ture, SST), 并取得較好的預(yù)報(bào)效果。Ham 等[6]利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)預(yù)測(cè) ENSO 事件, 結(jié)果顯示, 在預(yù)報(bào)提前時(shí)間大于6 個(gè)月時(shí), 模型的預(yù)測(cè)能力優(yōu)于其他預(yù)報(bào)系統(tǒng)。
SPB 現(xiàn)象是 Webster 等[7]在動(dòng)力預(yù)測(cè)模型中發(fā)現(xiàn)的, 后續(xù)的研究大多基于 ENSO 的動(dòng)力學(xué)機(jī)制對(duì)SPB產(chǎn)生的原因進(jìn)行解釋。然而, 統(tǒng)計(jì)模型的構(gòu)建并不依賴(lài)于動(dòng)力學(xué)框架, 而是基于大數(shù)據(jù)的統(tǒng)計(jì)分析和回歸。在過(guò)去的研究中, 大多數(shù)基于機(jī)器學(xué)習(xí)的 ENSO 預(yù)測(cè)模型都獲得較強(qiáng)的預(yù)測(cè)能力, 但都沒(méi)有明確 SPB 現(xiàn)象在機(jī)器學(xué)習(xí)這種新型統(tǒng)計(jì)模型中是否存在以及存在或不存在的原因。本文利用 LSTM神經(jīng)網(wǎng)絡(luò)建立針對(duì) 4 次厄爾尼諾事件的預(yù)測(cè)模型, 并探究模型中的 SPB 現(xiàn)象及其產(chǎn)生的原因。
LSTM 是 Hochreiter 等[21]1997 年提出的, 是循環(huán)神經(jīng)網(wǎng)絡(luò)的一種特殊形式。目前, 在翻譯語(yǔ)言、圖像分析、語(yǔ)音識(shí)別、手寫(xiě)識(shí)別和時(shí)間序列預(yù)測(cè)方面, LSTM 有著廣泛的應(yīng)用。與傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)相比, LSTM 在隱藏層各神經(jīng)元中增加記憶單元, 使得時(shí)間序列上的記憶信息可控, 每次在隱藏層各單元間傳遞時(shí), 可以通過(guò)幾個(gè)可控門(mén)(輸入門(mén)、遺忘門(mén)和輸出門(mén))控制之前信息和當(dāng)前信息的記憶和遺忘程度。因此, LSTM 具備長(zhǎng)期記憶功能, 能有效地應(yīng)用于處理時(shí)間序列的預(yù)測(cè)問(wèn)題。
ENSO 是發(fā)生在熱帶太平洋的年際時(shí)間尺度的海?氣相互作用異常現(xiàn)象。用 Ni?o3.4 指數(shù)表征ENSO 事件, 其定義為 Ni?o3.4 區(qū)(150°E—170°W, 5°S—5°N)海表溫度距平場(chǎng)的空間平均。本文視Ni?o3.4 指數(shù)預(yù)報(bào)問(wèn)題為時(shí)間序列問(wèn)題, 選取逐月Ni?o3.4 指數(shù)時(shí)間序列作為預(yù)報(bào)對(duì)象, 數(shù)據(jù)主要來(lái)源于 Physical Sciences Laboratory 網(wǎng)站 (https://www.esrl.noaa.gov/psd/gcos_wgsp/Timeseries/Ni?o34), 時(shí)間段為 1960 年 1 月到 2018 年 12 月。圖 1 展示 1984年 1 月至 2018 年 12 月的 Ni?o3.4 指數(shù)的變化情況, 其中淺灰色圓圈標(biāo)記本文選取的 4 個(gè)典型的厄爾尼諾事件。
為了提升模型的訓(xùn)練效率, 我們先對(duì)數(shù)據(jù)進(jìn)行歸一化處理, 將數(shù)據(jù)標(biāo)準(zhǔn)化至[0, 1]區(qū)間。計(jì)算公式如下:
其中,original為指數(shù)初始值,max為指數(shù)最大值,min為指數(shù)最小值,scaled為歸一化后的數(shù)據(jù)。
本文選取 4 個(gè)比較典型的厄爾尼諾事件(1991/ 1992, 1997/1998, 2002/2003和2015/2016)為研究對(duì)象, 所選模型皆為三層結(jié)構(gòu), 包括輸入層、LSTM層和全連接層, 預(yù)報(bào)模式為“24-1”, 模型的目標(biāo)函數(shù)為均方誤差。我們將數(shù)據(jù)劃分成訓(xùn)練集、驗(yàn)證集和測(cè)試集 3 個(gè)部分(表 1), 其中訓(xùn)練集用于訓(xùn)練模型的權(quán)重參數(shù), 驗(yàn)證集用于調(diào)整模型的結(jié)構(gòu), 測(cè)試集用于檢驗(yàn)?zāi)P偷淖罱K效果。
為了評(píng)估模型的預(yù)報(bào)能力, 本文選用均方根誤差(root mean square error, RMSE)和距平相關(guān)系數(shù)(anomaly correlation coefficient, ACC)作為評(píng)價(jià)標(biāo)準(zhǔn), 計(jì)算公式如下:
其中,為樣本數(shù),T為實(shí)測(cè)值,T′為預(yù)測(cè)值。我們將預(yù)測(cè)起點(diǎn)之前的24個(gè)Ni?o3.4指數(shù)值作為模型的輸入值, 模式輸出的預(yù)報(bào)值即為第25個(gè)指數(shù)值, 再將預(yù)測(cè)結(jié)果添加進(jìn)輸入序列, 利用第2~25個(gè)指數(shù)值預(yù)報(bào)第26個(gè)指數(shù)值。本文的預(yù)報(bào)時(shí)效定義為預(yù)報(bào)月份與輸入歷史數(shù)據(jù)的最后一個(gè)月份間的差值。
本文規(guī)定0年代表厄爾尼諾事件發(fā)生年, 即Ni?o3.4指數(shù)達(dá)到峰值的年份, ?1年代表事件發(fā)生前一年, 1年代表事件發(fā)生后一年。相應(yīng)地, 我們選取10月、1月和4月作為ENSO事件的預(yù)報(bào)起點(diǎn)。
圖1 1984年1月至2018年12月的Ni?o3.4指數(shù)變化
表1 模型訓(xùn)練集、驗(yàn)證集和測(cè)試集數(shù)據(jù)劃分
對(duì)于預(yù)報(bào)月份, Ni?o3.4指數(shù)預(yù)報(bào)誤差()定義為模型預(yù)報(bào)值與實(shí)測(cè)值之差, 表達(dá)式如下:
預(yù)報(bào)誤差在預(yù)報(bào)月份的誤差增長(zhǎng)率, 則為+ 1月的預(yù)報(bào)誤差與月預(yù)報(bào)誤差之差。值為正(負(fù))代表預(yù)報(bào)誤差增大(減小),的絕對(duì)值越大代表預(yù)報(bào)誤差的變化幅度越大。
根據(jù)張雅樂(lè)[22]和Wei等[23]的定義, 本研究將Ni?o3.4指數(shù)大于?0.5°的月份至峰值月份劃分為厄爾尼諾事件的增長(zhǎng)期, 將峰值月份至指數(shù)低于?0.5°的月份劃分為衰減期。一年可分為4個(gè)季度, 分別為1—3月(JFM)、4—6月(AMJ)、7—9月(JAS)和10—12月(OND)。
Fang等[24]用不同起始月份的SST自相關(guān)系數(shù)(滑動(dòng)窗口為10年)跨越春季時(shí)的減小量平均值表征春季持續(xù)性障礙(spring persistence barrier)的強(qiáng)度。本文在Fang等[24]的定義基礎(chǔ)上, 依據(jù)下式計(jì)算春季持續(xù)性障礙強(qiáng)度指數(shù)。
其中,是滑動(dòng)窗口的起始年份,是起始月份,是滯后時(shí)間。
為了測(cè)試LSTM模型對(duì)ENSO的預(yù)報(bào)能力, 本文首先選取1997/1998強(qiáng)厄爾尼諾事件作為訓(xùn)練案例。圖2給出當(dāng)預(yù)報(bào)時(shí)效為12個(gè)月時(shí), LSTM模型對(duì)1996年10月至2001年10月的Ni?o3.4指數(shù)的預(yù)報(bào)結(jié)果與實(shí)測(cè)值的時(shí)間變化。可以看出, 盡管預(yù)報(bào)時(shí)效為12個(gè)月, LSTM模型的預(yù)測(cè)結(jié)果依然能夠完整地刻畫(huà)Ni?o3.4指數(shù)的變化趨勢(shì)。此次預(yù)測(cè)中, 模型對(duì)1997/1998事件的峰值月份和峰值大小的模擬與實(shí)測(cè)情況基本上吻合, 說(shuō)明LSTM神經(jīng)網(wǎng)絡(luò)在處理時(shí)間序列的非線性預(yù)測(cè)方面具有很好的性能。
圖3展示模型預(yù)測(cè)結(jié)果與實(shí)測(cè)值間距平相關(guān)系數(shù)ACC和均方根誤差RMSE隨不同預(yù)報(bào)時(shí)效的變化, 可以更直觀地反映模型預(yù)測(cè)效果。雖然模型對(duì)Ni?o3.4指數(shù)的預(yù)報(bào)能力隨著預(yù)報(bào)時(shí)效的加長(zhǎng)而有所降低, 但當(dāng)預(yù)報(bào)時(shí)效為12個(gè)月時(shí), 相關(guān)系數(shù)仍然達(dá)到0.93以上。隨著預(yù)報(bào)時(shí)效加長(zhǎng), 當(dāng)預(yù)報(bào)時(shí)效小于6個(gè)月時(shí), 均方根誤差迅速增大; 當(dāng)預(yù)報(bào)時(shí)效在6~11個(gè)月之間時(shí), 均方根誤差變化不大。
圖2 1996 年 10 月至 2001 年 10 月期間預(yù)報(bào)時(shí)效為 12 個(gè)月的Ni?o3.4指數(shù)模型預(yù)測(cè)結(jié)果與實(shí)測(cè)值
圖3 距平相關(guān)系數(shù)和均方根誤差隨預(yù)報(bào)時(shí)效的變化
嚴(yán)軍等[4]基于神經(jīng)網(wǎng)絡(luò)?奇異譜分析, 對(duì)ENSO指數(shù)進(jìn)行預(yù)測(cè), 在預(yù)報(bào)時(shí)效為12個(gè)月時(shí), 相關(guān)系數(shù)為0.49。劉科峰等[18]利用小波分析和支持向量機(jī)預(yù)報(bào)ENSO指數(shù), 預(yù)報(bào)時(shí)效為12個(gè)月時(shí)的相關(guān)系數(shù)為0.89。許柏寧等[19]利用Seq2seq2深度學(xué)習(xí)模型預(yù)報(bào)SSTA, 其12個(gè)月預(yù)報(bào)時(shí)效的相關(guān)系數(shù)在0.5左右。Ham等[6]利用卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)Ni?o3.4指數(shù), 12個(gè)月預(yù)報(bào)時(shí)效的相關(guān)系數(shù)在0.65左右。雖然本文預(yù)報(bào)模型涉及的時(shí)間段、學(xué)習(xí)算法以及參數(shù)選擇與其他模型之間存在不一致性, 但與大多數(shù)模型相比, 本文LSTM時(shí)間序列模型對(duì)Ni?o3.4指數(shù)的預(yù)報(bào)能力具有一定的優(yōu)勢(shì)。
為了進(jìn)一步驗(yàn)證LSTM時(shí)間序列模型對(duì)厄爾尼諾事件的預(yù)報(bào)效果, 我們繼續(xù)對(duì)1991/1992, 2002/ 2003和2015/2016這3個(gè)厄爾尼諾事件進(jìn)行研究。2015/2016厄爾尼諾事件的Ni?o3.4指數(shù)變化規(guī)律與1997/1998事件相似, 都屬于強(qiáng)東部型厄爾尼諾事件; 1991/1992與2002/2003厄爾尼諾事件的變化趨勢(shì)相似, Ni?o3.4指數(shù)峰值相對(duì)偏小, 都屬于中部型厄爾尼諾事件。
圖4對(duì)比LSTM模型在不同預(yù)報(bào)起點(diǎn)往后滾動(dòng)預(yù)報(bào)20個(gè)月的的預(yù)報(bào)結(jié)果與實(shí)測(cè)值, 可見(jiàn)不同起報(bào)時(shí)間的預(yù)報(bào)結(jié)果皆可模擬出各個(gè)事件的發(fā)展趨勢(shì), 隨著起報(bào)時(shí)間向后推移, 模型對(duì)事件的預(yù)測(cè)更為精準(zhǔn)。還可以看出, 模型對(duì)不同類(lèi)型厄爾尼諾事件的預(yù)報(bào)效果不同。對(duì)于強(qiáng)東部型厄爾尼諾事件, Ni?o3.4指數(shù)的發(fā)展和衰減比較快速和平滑, LSTM模型對(duì)Ni?o3.4指數(shù)峰值月份和峰值大小的預(yù)報(bào)效果較好; 對(duì)于中部型厄爾尼諾事件, Ni?o3.4指數(shù)的發(fā)展比較平緩, 但起伏較大, LSTM模型的預(yù)報(bào)效果較差, 尤其是無(wú)法模擬出該厄爾尼諾事件發(fā)展初期短時(shí)間尺度的起伏(圖4(a))。
圖4 模型對(duì)4個(gè)厄爾尼諾事件的預(yù)測(cè)結(jié)果與實(shí)測(cè)值
圖5 4個(gè)事件增長(zhǎng)期和衰減期的預(yù)報(bào)誤差季節(jié)增長(zhǎng)率
為了探究LSTM模型在預(yù)報(bào)過(guò)程中出現(xiàn)春季預(yù)報(bào)障礙的原因, 計(jì)算Ni?o3.4指數(shù)在不同滯后時(shí)間情況下的自相關(guān)系數(shù)。結(jié)果表明, 不論滯后時(shí)間為多久, 自相關(guān)系數(shù)值在第二年的春季都會(huì)大幅度降低, 4月之前在0.4以上, 6月之后基本上為負(fù)數(shù)。這一結(jié)果從側(cè)面反映數(shù)據(jù)信號(hào)在夏、秋、冬三季間可以順利地傳遞, 但春季數(shù)據(jù)信號(hào)的連續(xù)性大幅度下降, 這就是春季持續(xù)性障礙現(xiàn)象。本文構(gòu)建的基于事件發(fā)生前30年歷史數(shù)據(jù)訓(xùn)練的LSTM模型, 也無(wú)法克服春季持續(xù)性障礙產(chǎn)生的春季誤差快速增長(zhǎng)問(wèn)題。機(jī)器學(xué)習(xí)算法是基于訓(xùn)練周期內(nèi)的歷史數(shù)據(jù), 尋找樣本數(shù)據(jù)與驗(yàn)證數(shù)據(jù)的誤差最小值。本文模型訓(xùn)練使用的是月平均數(shù)據(jù), 而春季持續(xù)性障礙僅存在于每年的4—6月(3個(gè)樣本), 相對(duì)于總樣本數(shù)并不大。因此, 追求全局誤差最小化的機(jī)器學(xué)習(xí)算法, 并不能建立起有效的克服春季持續(xù)性障礙的預(yù)測(cè)算法。然而, 盡管仍然存在SPB問(wèn)題, 但LSTM預(yù)報(bào)模型對(duì)強(qiáng)厄爾尼諾事件的整體預(yù)報(bào)效果是非常優(yōu)異的(圖4(b)和(d))。
ENSO穩(wěn)定性的季節(jié)變化是春季持續(xù)性障礙的主要原因, Bjerknes反饋是厄爾尼諾發(fā)展的重要物理機(jī)制, 涉及多種海?氣反饋, 這些海?氣反饋?lái)?xiàng)可綜合量化成BJ(Bjerknes instability)指數(shù)。已經(jīng)證實(shí), BJ指數(shù)也是表征Bjerknes反饋的有效指標(biāo), 能夠有效地診斷ENSO的穩(wěn)定性[9?10,24?25]。Fang等[24]通過(guò)計(jì)算月BJ指數(shù)發(fā)現(xiàn), 在3—5月期間, BJ指數(shù)從最小值迅速增長(zhǎng)到最大值, 說(shuō)明春季是ENSO系統(tǒng)從最穩(wěn)定狀態(tài)轉(zhuǎn)變成最不穩(wěn)定狀態(tài)的過(guò)渡期, 也因此造成春季Ni?o3.4指數(shù)持續(xù)性的降低。依據(jù)式(5)計(jì)算1960—2005年間的春季持續(xù)性障礙強(qiáng)度指數(shù), 結(jié)果如圖6所示。可以看出, 1997/1998事件對(duì)應(yīng)的強(qiáng)度指數(shù)比1991/1992事件和2002/2003事件低。這一點(diǎn)在模型的預(yù)報(bào)結(jié)果中也有所體現(xiàn): 模型對(duì)1997/1998厄爾尼諾事件的預(yù)報(bào)效果整體上優(yōu)于1991/1992事件和2002/2003事件。
1)LSTM模型對(duì)強(qiáng)東部型厄爾尼諾事件(1997/ 1998和2015/2016事件)的預(yù)報(bào)效果優(yōu)于弱中部型厄爾尼諾事件(1991/1992和2002/2003事件), 主要體現(xiàn)為峰值月份和峰值大小的預(yù)報(bào); 在發(fā)展趨勢(shì)方面, 4個(gè)事件的預(yù)報(bào)趨勢(shì)與實(shí)況基本上一致。
2)LSTM模型對(duì)厄爾尼諾事件增長(zhǎng)期Ni?o3.4指數(shù)的預(yù)報(bào)都存在明顯的SPB現(xiàn)象, 而對(duì)衰減期的預(yù)報(bào)表現(xiàn)不同: 弱中部型事件衰減期的預(yù)報(bào)出現(xiàn)明顯SPB現(xiàn)象, 強(qiáng)東部型事件衰減期的預(yù)報(bào)不存在SPB現(xiàn)象, 與Wei等[23]的研究結(jié)論相似。值得注意的是, 盡管LSTM模型中仍然存在明顯的SPB現(xiàn)象, 但對(duì)強(qiáng)厄爾尼諾事件的預(yù)報(bào)效果也非常優(yōu)異, 因?yàn)楸疚腖STM算法是基于大量歷史數(shù)據(jù)樣本集和驗(yàn)證集, 通過(guò)迭代訓(xùn)練, 達(dá)到誤差最小化。對(duì)于預(yù)報(bào)效果優(yōu)異的案例(如1997/1998事件), 除春季外, 其他季節(jié)的誤差增長(zhǎng)率都比較小。對(duì)于預(yù)報(bào)效果相對(duì)較差的案例(如1991/1992事件), 除春季外, 其他季節(jié)的誤差增長(zhǎng)率也較大。
3)LSTM模型在預(yù)報(bào)過(guò)程中出現(xiàn)的SPB現(xiàn)象主要由數(shù)據(jù)中呈現(xiàn)的持續(xù)性障礙和厄爾尼諾事件的性質(zhì)(分布型、強(qiáng)度和鎖相特征等)造成。LSTM模型并不能從物理機(jī)制方面規(guī)避春季預(yù)報(bào)障礙。從統(tǒng)計(jì)學(xué)角度來(lái)說(shuō), 對(duì)于月平均的訓(xùn)練集, 春季持續(xù)性障礙的樣本僅僅存在于每年的4—6月, LSTM模型追求的是訓(xùn)練集的全局最小化, 無(wú)法兼顧短時(shí)間尺度的春季誤差并建立有效的規(guī)避算法。因此, LSTM模型最后呈現(xiàn)的結(jié)果更趨向于對(duì)厄爾尼諾事件發(fā)展趨勢(shì)的預(yù)報(bào), 無(wú)法預(yù)測(cè)短時(shí)間尺度的Ni?o3.4指數(shù)變化, 包括4—6月的春季誤差快速增長(zhǎng)現(xiàn)象。
圖6 1960—2005年的SPB強(qiáng)度指數(shù)
[1]Oldenborgh G J V, Balmaseda M A, Ferranti L, et al.Did the ECMWF seasonal forecast model outperform statistical ENSO forecast models over the last 15 years?.Journal of Climate, 2005, 18(16): 3240?3249
[2]Dijkstra H A, Petersik P, Hernandez-Garcia E, et al.The application of machine learning techniques to improve El Ni?o prediction skill.Frontiers in Physics, 2019, 7: 153
[3]Barnston A G, Tippett M K, L’Heureux M L, et al.Skill of real-time seasonal ENSO model predictions during 2002–11: is our capability increasing?.Bulle-tin of the American Meteorological Society, 2012, 93 (5): 631?651
[4]嚴(yán)軍, 劉健文.基于神經(jīng)網(wǎng)絡(luò)–奇異譜分析的 ENSO指數(shù)預(yù)測(cè).大氣科學(xué), 2005, 29(4): 620?626
[5]Mcphaden M J, Zebiak S E, Glantz M H.ENSO as an integrating concept in earth science.Science, 2006, 314: 1740?1745
[6]Ham Y G, Kim J H, Luo J J.Deep learning for multi-year ENSO forecasts.Nature, 2019, 573: 568?572
[7]Webster P J, Yang S.Monsoon and ENSO: selectively interactive system.Quarterly Journal of the Royal Meteorological Society, 1992, 118: 877?926
[8]楊崧, 鄧開(kāi)強(qiáng), 段晚鎖.季風(fēng)與 ENSO 的選擇性相互作用: 年循環(huán)和春季預(yù)報(bào)障礙的影響.大氣科學(xué), 2018, 42(3): 570–589
[9]Webster P J.The annual cycle and the predictability of the tropical coupled ocean-atmosphere system.Meteorology and Atmospheric Physics, 1995, 56(1): 33?55
[10]Torrence C, Webster P J.The annual cycle of persis-tence in the El Ni?o/Southern Oscillation.Quarterly Journal of the Royal Meteorological Society, 1998, 124: 1985?2004
[11]Wang B, Fang Z.Chaotic oscillations of tropical climate: a dynamic system theory for ENSO.Journal of the Atmospheric Sciences, 1996, 53(19): 2786?802
[12]Mu M, Duan W S.A new approach to studying ENSO predictability: conditional nonlinear optimal perturba-tion.Chinese Science Bulletin, 2003, 48(10): 1045? 1047
[13]Mu M, Duan W S, Wang B.Season-dependent dyna-mics of nonlinear optimal error growth and El Ni?o-Southern Oscillation predictability in a theoretical mo-del.Journal of Geophysical Research: Atmospheres, 2007, 112(D10): 1?10
[14]Duan W S, Wei C.The ‘spring predictability barrier’ for ENSO predictions and its possible mechanism: results from a fully coupled model.International Journal of Climatology, 2012, 33(5): 1280?1292
[15]Meng J, Fan J F, Ludescher J, et al.Complexity-based approach for El Ni?o magnitude forecasting before the spring predictability barrier.Proceedings of the National Academy of Sciences, 2020, 117(1): 177?83
[16]Tangang F T, Tang B Y, Monahan A H, et al.Fore-casting ENSO Events: a neural network-extended EOF approach.Journal of Climate, 1998, 11(1): 29?41
[17]蔣國(guó)榮, 張韌, 沙文鈕.用 EOF 展開(kāi)和人工神經(jīng)網(wǎng)絡(luò)方法預(yù)測(cè) ENSO 的研究.海洋預(yù)報(bào), 2001, 18(3): 1?11
[18]劉科峰, 張軍, 陳奕德, 等.基于小波分解和支持向量機(jī)的 ENSO 預(yù)測(cè)試驗(yàn) .解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2011, 12(5): 531?535
[19]許柏寧, 姜金榮, 郝卉群, 等.一種基于區(qū)域海表面溫度異常預(yù)測(cè)的 ENSO 預(yù)報(bào)深度學(xué)習(xí)模型.科研信息化技術(shù)與應(yīng)用, 2017, 8(6): 65?76
[20]Zhang Q, Wang H, Dong J Y, et al.Prediction of sea surface temperature using long short-term memory.IEEE Geoscience and Remote Sensing Letters, 2017, 14(10): 1745?1749
[21]Hochreiter S, Schmidhuber J.Long short-term me-mory.Neural Computation, 1997, 9(8): 1735?1780
[22]張雅樂(lè), 俞永強(qiáng), 段晚鎖, 等.四個(gè)耦合模式ENSO后報(bào)試驗(yàn)的“春季預(yù)報(bào)障礙”.氣象學(xué)報(bào), 2012, 70(3): 506?519
[23]Wei C, Duan W S.The “Spring Predictability Barrier” phenomenon of ENSO predictions generated with the FGOALS-g model.Atmospheric and Oceanic Science Letters, 2010, 3(2): 87?92
[24]Fang X H, Zheng F, Liu Z Y, et al.Decadal modula-tion of ENSO spring persistence barrier by thermal damping processes in the observation.Geophysical Research Letters, 2019, 46(12): 6892? 6899
[25]Jin Y, Liu Z, Lu Z, et al.Seasonal cycle of back-ground in the tropical pacific as a cause of ENSO sp-ring persistence barrier.Geophysical Research Let-ters, 2019, 46(22): 13371?13378
Spring Predictability Barrier Phenomenon in ENSO Prediction Model Based on LSTM Deep Learning Algorithm
ZHOU Pei1, HUANG Yingjie1, HU Bingyi1,2, WEI Jun1,3,?
1.Key Laboratory of Tropical Atmosphere-Ocean System (MOE), School of Atmospheric Sciences, Sun Yat-Sen University, Guangzhou 510275; 2.HSBC Business School, Peking University, Shenzhen 518055; 3.School of Marine Sciences, Guangxi University, Nanning 530004; ? Corresponding author, E-mail: weijun5@mail.sysu.edu.cn
A LSTM (long-short term memory) model is applied to the prediction of the Ni?o3.4 index, and the spring prediction barrier (SPB) issue has been further investigated in the LSTM model.The results show that the model can predict the trend of the Ni?o3.4 index well, yet revealing different performance in different El Ni?o events.For the 1997/1998 El Ni?o and 2015/2016 El Ni?o, which are strong EP El Ni?o events, the model performes well on the prediction of Ni?o3.4 index trend and peaks, and anomaly correlation coefficient (ACC) reaches more than 0.93.But for the weak CP El Ni?o events, e.g.the 1991/1992 El Ni?o and 2002/2003 El Ni?o, it shows relatively poor performance on the prediction of the peak.In the growing period, the maximum season growth rate of prediction error are in AMJ quarter, which indicates obvious SPB phenomenon.However, in the decaying period, the maximum have similar distribution in the same type of events: for the weak CP El Ni?o events, the maximum are in AMJ quarter, indicating obvious SPB phenomenon; for strong EP El Ni?o events, the maximum are in other quarter, indicating that there is no SPB phenomenon.The differences in the performance among individuals may be related to the development characteristics of the event itself (such as event type and intensity).
LSTM; ENSO; prediction error; SPB; Ni?o3.4 index
10.13209/j.0479-8023.2021.114
2020–12–25;
2021–04–26
廣東省重點(diǎn)領(lǐng)域研發(fā)計(jì)劃(2020B1111020003)、國(guó)家重點(diǎn)研發(fā)計(jì)劃(2016YFA0202704)、廣西壯族自治區(qū)特聘專(zhuān)家經(jīng)費(fèi)(2018B08)和國(guó)家自然科學(xué)基金(41976007, 91958101)資助