雍 星 , 陳 佳 , 賴維肖 , 陳丹妮
(四川省德陽市氣象局,德陽 618000)
近年來,全球氣候變化更加劇烈,在各種氣象災害中,暴雨災害以其突發(fā)性強、成災速度快、季節(jié)性強以及容易引發(fā)山體滑坡、泥石流、城市內澇等破壞性較大的次生災害等特點,加大了對人民生命財產(chǎn)的潛在威脅[1]。據(jù)統(tǒng)計,暴雨洪澇是導致人員傷亡最多和造成直接經(jīng)濟損失最大的災害[1-2],由此對降水的監(jiān)測和預報提出了更高的要求。但長期以來,降水的精準預報都是氣象業(yè)務的難點之一。目前,由于人工智能的迅速發(fā)展,機器學習方法已廣泛應用于氣象領域[3],對于改進氣象預報具有明顯的應用價值。
然而,如何有效利用海量的氣象觀測資料和預報產(chǎn)品,設計更加優(yōu)化的預報模式,改善預報預測結果,在數(shù)據(jù)挖掘、機器學習技術方面還有很多工作要做[4]。尤其是逐步推進氣象業(yè)務與人工智能技術的對接,拓展預報模式的實際能力,滿足多角度氣象專業(yè)服務需求,是實現(xiàn)氣象業(yè)務自動化、智能化以及現(xiàn)代化的重要途徑。其中,利用機器實現(xiàn)自動學習,同時提取天氣過程的特征,是多源數(shù)據(jù)融合的一個新思路[5]。賀圣平等[6]指出,在建立及其學習模型時,充分了解海量氣象數(shù)據(jù)背后的動力學原理至關重要。黃小燕等[7]對廣西熱帶區(qū)域降水預報的研究表明,神經(jīng)網(wǎng)絡方法具有很強的非線性映射和自適應學習能力,可以更好地反映降水的非線性變化特點。雖然國內外有關專家和學者將人工智能方法與多種資料融合,提出了關于中短期降水預報的新算法,并獲得了較好的預報效果[7-15],但是,仍不能滿足社會需求,還需要進一步開發(fā)應用。
因此,本文針對四川省德陽市的降水業(yè)務預報,融合智能網(wǎng)格氣象預報(SPCO、SPZC)及歐洲中期天氣預報中心(ECMWF)降水預報[13],結合動力學因子,采用神經(jīng)網(wǎng)絡方法,建立德陽市基于前饋式神經(jīng)網(wǎng)絡的多源精細化降水數(shù)值預報系統(tǒng)(下文簡稱系統(tǒng)),以期為提升德陽市中短期降水預報水平提供必要的技術支撐。
本文根據(jù)降水天氣的基本原理和預報方法,結合暴雨天氣發(fā)生、發(fā)展的規(guī)律及預報預警產(chǎn)品精度、時效的具體需求,選用以下幾種資料作為神經(jīng)網(wǎng)絡的輸入單元:
(1)兩種智能網(wǎng)格氣象預報產(chǎn)品分別是四川省數(shù)值預報釋用精細化預報指導產(chǎn)品(SPCO)和氣象臺短臨預報產(chǎn)品(SPZC),分辨率均為 0.05°×0.05°;
(2)實況降雨量觀測資料采用德陽市自動觀測站及區(qū)域自動站觀測資料;
(3)ECMWF數(shù)值預報產(chǎn)品中的降水和物理量資料,分辨率為 0.125°×0.125°,并利用 ECMWF 數(shù)值預報進行部分動力物理量的計算;
(4)國家氣象信息中心多源融合降水產(chǎn)品(CMPA),分辨率為 0.05°×0.05°。萬逸波等[16]研究表明,CMPA反映降水多寡的能力較其他產(chǎn)品更高,其數(shù)據(jù)在中海拔地區(qū)的相關性與精度較高,在高海拔和極大坡度地區(qū)的質量降幅較小。由于德陽市位于四川盆地周邊山地,地勢自西北向東南傾斜,西北部屬龍門山脈中段,海拔較高,最高海拔為什邡市九頂山獅子王峰(4984 m),中部為成都平原,東南部為四川盆地中部丘陵,最低海拔在中江縣普興鎮(zhèn)(306 m),故選取CMPA降水數(shù)據(jù)用于降水預報系統(tǒng)的建立和預報效果的檢驗。
1.2.1 前饋神經(jīng)網(wǎng)絡法
本系統(tǒng)采用的前饋神經(jīng)網(wǎng)絡(Feedforward Neural Network,F(xiàn)NN),是人工神經(jīng)網(wǎng)絡的一種。圖1是一個簡單的神經(jīng)網(wǎng)絡模型,圖中每個小圓圈代表一個感知機模型,第一層稱之為輸入層,因為它直接跟輸入數(shù)據(jù)相連,第二和第三層稱之為隱藏層或全連接層,第四層為輸出層。
圖1 前饋式神經(jīng)網(wǎng)絡結構
第一層網(wǎng)絡的各個神經(jīng)元接收了輸入信號,一般會對訓練集進行中心化處理,即每個樣本減去訓練集的均值,當不同維度的連續(xù)特征量級不一樣時,還需要做標準化或歸一化處理[17]。這里,輸入層歸一化處理詳見表1,編制讀取程序并處理輸入數(shù)據(jù)后,根據(jù)格點值,基于各家模式降水量預報進行分級(<10 mm,10~25 mm,25~50 mm,>50 mm),然后將歸一化的資料讀入內存形成輸入層。在隱藏層的相鄰兩層之間,前一層的所有單元都會有一個到下一層所有單元的輸出,這樣的層稱為全連接層,后一層某個單元接受到的輸入就是前一層所有單元值的加權和。輸出層的值即最后一層隱藏層經(jīng)過一個輸出函數(shù)(Output Function)得到的。輸出層可能有一個單元也可能有多個單元,在系統(tǒng)中,輸出層包含一個池化層。按照前饋神經(jīng)網(wǎng)絡的層數(shù)不同,可以將其劃分為單層前饋神經(jīng)網(wǎng)絡和多層前饋神經(jīng)網(wǎng)絡。本系統(tǒng)采用單層前饋神經(jīng)網(wǎng)絡,包含一層隱藏層,輸出層上節(jié)點的值(輸出值)通過輸入值與權重值(ω)相乘后加上偏移值(B)得到。
表1 輸入層數(shù)據(jù)的歸一化處理
1.2.2 激活函數(shù)及資料處理流程
由于神經(jīng)網(wǎng)絡是一個封閉的黑格子計算單元,尚不清楚神經(jīng)網(wǎng)絡的具體工作原理,F(xiàn)NN直接輸出的結果應該是輸入?yún)?shù)線性疊加的結果。然而,暴雨的預報問題往往是非線性的,而“神經(jīng)元”與“激活函數(shù)”的組合可以實現(xiàn)復雜的非線性數(shù)學轉換。為使神經(jīng)網(wǎng)絡可以更好地表達出非線性的降水特征,這里,引入了激活函數(shù)f(n)。它具有激活和抑制兩種狀態(tài),當輸入激活函數(shù)的值到達一定的區(qū)間,激活函數(shù)就會進行輸出,否則將會抑制這些值的輸出。本系統(tǒng)采用的激活函數(shù)為對稱飽和線性函數(shù)(Symmertrical Saturating Linear Transfer Function),表達式為:
資料的處理流程為:神經(jīng)元接受到一個到數(shù)個不等的輸入變數(shù)(x)后,視輸入變量的重要性,賦予一個改變權重的參數(shù),該參數(shù)稱為權重(Weight, ω ),神經(jīng)元將所有輸入變量經(jīng)由配重值的加權累加,然后再與神經(jīng)元中的偏移量(Bias,B)相加,從而產(chǎn)生一個凈值(n),這個凈值將通過轉換函數(shù)的轉換,獲得的數(shù)值即為該神經(jīng)元的輸入變率或是作為輸出值,視網(wǎng)絡結構而定。雖然每個神經(jīng)元可以同時接受一個到多個的變量值,但只有一個輸出值,神經(jīng)元的計算公式如下:
式中:R是神經(jīng)元輸入變量的個數(shù),Ij是輸入特征量,ωj是神經(jīng)元每個輸入變量的權重值,B是該神經(jīng)元的偏移量。雖然同一層的神經(jīng)元具有相同的輸入變量和激活函數(shù),但因為每個神經(jīng)元內具有不同權重和偏移量,導致同一層的神經(jīng)元雖然接受相同的輸入變量,但輸出值卻大不相同。
系統(tǒng)結構如圖2所示,是根據(jù)預報區(qū)域范圍內的多源資料及預報因子,進行匯總處理,由神經(jīng)網(wǎng)絡深度學習模塊進行訓練和預報,最后得到本地的暴雨預報結論。
圖2 FNN降水預報模型
在訓練期內,本系統(tǒng)利用上述預報歷史降水及相關風力、溫度資料形成訓練集,以CMPA格點化實況降水作為目標集,完成對多源數(shù)據(jù)特征的提取。對站點降水資料進行格點化插值處理,與初步篩選出的降水天氣發(fā)生發(fā)展密切相關的動力因子進行相關度檢驗,篩選出與本地暴雨天氣相關度較高的物理量,剔除相關性較低的物理量,實現(xiàn)從高位預報因子數(shù)據(jù)集中提取少數(shù)包含主要信息的變量來預報暴雨災害,進而深度挖掘相關物理量及預報產(chǎn)品與降水天氣的關聯(lián)特征和演變特征。將選出的包含動力因子的物理量與SPCO降水預報、SPZC降水預報及歐洲中心數(shù)值預報產(chǎn)品一同用于建立本地暴雨(降水)預報方程組,構成網(wǎng)絡結構規(guī)模小、有效預報信息量大的非線性集成預報,以此提高預報方程的技巧和穩(wěn)定性。系統(tǒng)使用梯度下降法[6],將輸出層的數(shù)據(jù)再輸入隱藏層的神經(jīng)元函數(shù),利用逐日CMPA融合降水產(chǎn)品對隱藏層輸出的結果進行檢驗,根據(jù)預測值和實際值的區(qū)別,將梯度從網(wǎng)絡輸出層反向傳遞至輸入層,并在此過程中優(yōu)化模型參數(shù),從而降低預報誤差。神經(jīng)網(wǎng)絡對數(shù)據(jù)進行建模的過程,就是尋找最合適的權重 ω 和偏移量B的過程,即對數(shù)據(jù)進行最優(yōu)逼近[6]。通常會設計一個損失函數(shù)來度量逼近效果,最優(yōu)參數(shù)應使得損失函數(shù)最小化。系統(tǒng)反饋最優(yōu)結果到輸入端,尋找到各個神經(jīng)元節(jié)點的最佳權重序號和偏離序號,計算出最佳權重和最佳偏離值并存儲結果,形成精度為0.05°×0.05°的初步格點參數(shù),得到計算結果,最終結果會分級存儲到相應時次、相應降水分級中。根據(jù)上述結果,取最近n次的最佳結果(分量級 ω 、B集合)作為最終模型,將最新的輸入端數(shù)據(jù)代入該模型,通過池化后的數(shù)據(jù)作為德陽市降水預報進行輸出,形成最終的降水預報。
為了進一步了解系統(tǒng)對德陽市及周邊降水過程的預報效果,本節(jié)選取2021年汛期以來(5月1日~8月20 日)德陽市及周邊(103.75°~105.25°E, 30.5°~31.75°N)CMPA 24 h降水量進行格點檢驗分析。
將 24 h降雨量按照 0.1~9.9 mm、10~24.9 mm、25~49.9 mm、≥50 mm共4個標準,對SPCO、ECMWF及本系統(tǒng)預報降水量與相應時段的實況降水量進行分級統(tǒng)計與檢驗。從檢驗結果(表2)可以看出,除了大雨量級以外,所有成員對其他量級降水預報的TS(Threat Score)評分隨預報時效的增加是逐漸降低的。各成員對于小雨量級降水的TS評分均為最高,其中由于ECMWF在0~48 h對小雨漏報率較低,其TS評分(0.516)均高于SPCO和本系統(tǒng)預報。由于各成員對中雨和大雨量級的空報和漏報率均較高,導致對上述量級的預報準確率明顯低于小雨。中雨TS評分為0.151~0.184, ECMWF在 24 h時效最優(yōu),本系統(tǒng)TS評分在48 h時效略高于ECMWF,SPCO在72 h時效的TS評分最高。從中雨的漏報率來看,SPCO在0~48 h時效的漏報率為最高,在72 h時效本系統(tǒng)漏報較多??請舐曙@示,SPCO在24 h時效的空報率較高,ECMWF在24~72 h時效的空報率最高,各成員空報率介于0.674~0.828。大雨的總體TS評分與中雨較接近,ECMWF在24 h和72 h時效為最佳,本系統(tǒng)在上述時段評分僅次于ECMWF,在48 h時效的TS評分最高。當降雨量達50 mm及以上時,SPCO在24 h時效的TS評分最高, ECMWF在48 h時效的TS評分最高,本系統(tǒng)在上述時段的預報評分均為次佳。本系統(tǒng)在48~72 h時效的空報率和漏報率相對較低,TS評分最高,而SPCO對暴雨及以上量級降水的空報、漏報情況最嚴重,導致其TS評分遠低于其他兩個模式。
表2 降水分級檢驗
從預報偏差來看,除暴雨以外,所有產(chǎn)品對其他三個量級的降水范圍預報均較實況偏大,表明上述產(chǎn)品對德陽市及其周邊的降水多存在空報現(xiàn)象。對小雨落區(qū)的預報,在0~24 h和24~48 h時效上,ECMWF對降水落區(qū)的估計嚴重偏大,SPCO與實況最接近,本系統(tǒng)偏差位于兩者之間。對中雨落區(qū)的預報,在0~24 h時效上,ECMWF預報與實況落區(qū)最接近,SPCO偏大最多,本系統(tǒng)預報效果介于兩者之間;在24~72 h時效上,SPCO最接近實況,ECMWF偏大最多,本系統(tǒng)的落區(qū)預報效果同樣介于兩者之間。對大雨落區(qū)的預報,SPCO落區(qū)預報在0~48 h時效上偏大最多而在48~72 h時效上較實況略偏小,ECMWF落區(qū)預報在48~72 h時效上偏大最多,本系統(tǒng)預報落區(qū)在不同時效上均介于兩者之間。對于暴雨及以上量級降水的落區(qū)預報,隨著預報時效的減小,成員的預報落區(qū)較實況偏小逐漸轉為偏大;ECMWF在0~24 h時效上預報偏差最小,本系統(tǒng)偏差與ECMWF接近;SPCO落區(qū)預報在24~48 h時效上偏差最小,本系統(tǒng)略高于SPCO,而ECMWF的預報偏差為最高;3個成員落區(qū)預報在48~72 h時效上均偏小,本系統(tǒng)的預報最接近實況。
從可以表征降水準確率的ETS(Equitable Threat Score)評分可以看出,檢驗成員對各個量級降水的評分都大于0,表現(xiàn)為正技巧,但不同成員在不同的預報時效上對不同量級降水的預報能力存在差異。從不同預報時效檢驗來看,隨著預報時效的增加,各成員對降水的預報能力是逐漸減弱的。從分量級檢驗來看,各成員對小雨量級降水預報的ETS評分均高于其他量級降水;對中雨量級的ETS評分除0~24 h ECMWF和本系統(tǒng)外,其余均降至0.1以下,ECMWF預報能力在0~24 h時效上相對最強,本系統(tǒng)次之,SPCO預報能力在24~72 h時效上最強;對大雨量級,本系統(tǒng)預報在0~48 h時效上較好,ECMWF預報在48~72 h時效上相對較好,本系統(tǒng)僅次于ECMWF;對暴雨及以上量級,SPCO預報技巧在0~24 h時效上最高,ECMWF預報技巧在24~48 h時效上最高,本系統(tǒng)預報技巧在上述時效均為次佳,而在48~72 h時效上ETS評分最高。
綜合來看,針對不同預報時效和不同量級降水,SPCO、ECMWF和本系統(tǒng)對于德陽及周邊降水的預報表現(xiàn)各有優(yōu)勢。本系統(tǒng)的預報能力與作為輸入層相關因子的SPCO與ECMWF預報能力相當,并且在大部分情況下,本系統(tǒng)的預報準確率和預報偏差與預報表現(xiàn)較好的因子更加接近,甚至在部分預報時效上本系統(tǒng)的預報準確率可以超過輸入層因子。其中,本系統(tǒng)在24~72 h時效上對暴雨及以上量級降水的預報TS評分較高、預報偏差表現(xiàn)也較好,對暴雨的提前預報具有重要參考價值。這表明本系統(tǒng)可對輸入層因子的降水及其落區(qū)預報進行有效的智能優(yōu)化,在實際預報中,可以利用本系統(tǒng)與其他的降水預報進行綜合分析,使預報結果更具參考價值。
為了進一步分析系統(tǒng)對德陽市降水的預報情況,選取2020年8月10~17日德陽市罕見大范圍連續(xù)強降水天氣過程(以下簡稱過程1)及2021年9月12~16日德陽區(qū)域暴雨天氣過程(以下簡稱過程2)進行分析。過程1在10日20時~18日08時出現(xiàn)了兩輪連續(xù)性區(qū)域大暴雨天氣,部分地方達到特大暴雨。從14日晚至17日連續(xù)3 d的第二輪區(qū)域暴雨到大暴雨,從系統(tǒng)預報與過程1實況的對比(圖3)可以看到,14日預報的暴雨區(qū)較實況略偏西,但總體預報的暴雨區(qū)、大暴雨區(qū)及特大暴雨區(qū)與實況均較接近,并且系統(tǒng)預報的降水極值與實況極值的量級一致。從系統(tǒng)預報與過程2的實況對比(圖4)可以看出,系統(tǒng)預報的13日20時~14日20時暴雨落區(qū)東部與實況一致、西部較實況偏大,系統(tǒng)預報出了大暴雨量級的降水,雖落區(qū)范圍較實況偏大,但主要落區(qū)與實況一致。
圖3 過程1中24~48 h時效降水預報(a.13日20時,c.14日20時)與降水實況(b.14日20時~15日20時,d.15日20時~16日20時)對比
圖4 過程2中12日20時24~48 h時效降水預報(a)與13日20時~14日20時降水實況(b)對比
總的來看,系統(tǒng)對上述兩次連續(xù)降雨天氣過程的預報效果均較好,提前24 h預報出過程的開始時間,在兩個過程中對暴雨及以上量級的降水和落區(qū)預報都較準確,并對極端降水的量級和位置有一定的預報能力,可為預報員提前預報預警提供依據(jù)。
本文基于降水觀測資料,結合多種模式預報產(chǎn)品,應用前饋式神經(jīng)網(wǎng)絡及最優(yōu)逼近方法對德陽市降雨預報系統(tǒng)進行訓練,并利用多源融合降水資料對預報結果進行檢驗,得到如下主要結論:
(1)本系統(tǒng)在暴雨的短期預報時效中,時效越臨近,對降雨量級和落區(qū)預報的準確率越高,預報員可通過不同起報時間的降水預報結果結合其他降水預報產(chǎn)品,對降水強度和落區(qū)進行調整。
(2)SPCO、ECMWF及本系統(tǒng)對不同量級的降水各有優(yōu)勢,本系統(tǒng)能夠對輸入層因子的降水及其落區(qū)預報進行有效的智能優(yōu)化,在日常預報業(yè)務中充分利用本系統(tǒng)與其他資料進行綜合分析,對降水天氣的提前預報具有重要作用。
(3)FNN方法的優(yōu)勢在于可以改善強降水中心分布及極端降水量的預報效果,使之更加接近降水實況,可以在智能網(wǎng)格預報和模式雨量預報的基礎上,進一步為預報降水極值及降水大值區(qū)的分布提供參考依據(jù)。
此外,本系統(tǒng)還存在一些需要改進的方面,如鑒于人工智能方法學習的固有特性,未來需要收集更多的歷史個例資料,進一步擴大人工智能學習樣本庫;在深度學習模型訓練過程中,考慮降水對地形因子的敏感性等影響,有望獲得更加準確有效的降水預報。