王珊珊 雷彥森 方鴻斌 孟英杰 章翠紅 劉文婷 李康麗
1 武漢中心氣象臺,武漢 430074 2 湖北省荊門市氣象臺,荊門 448124
提 要: 利用2000—2014年地面觀測資料和歐洲中期天氣預(yù)報(bào)中心(ECMWF)ERA5再分析資料,選取表征四類降水相態(tài)(雨、雪、雨夾雪、凍雨)的溫度、濕度、微物理特征的43個(gè)特征量,使用精細(xì)地形高度訂正,利用CatBoost算法開展長江中游降水相態(tài)預(yù)報(bào)方法研究。結(jié)果顯示:此方法對雨、雪、凍雨有較好的分類和預(yù)報(bào)效果。使用精細(xì)地形高度預(yù)處理后的特征量,能夠提高降水相態(tài)判別的準(zhǔn)確率和空間精細(xì)度。雨、雪、凍雨的預(yù)報(bào)準(zhǔn)確率與ECMWF預(yù)報(bào)產(chǎn)品相比分別提高了9.9%、39.1%、11.1%,但對雨夾雪的改進(jìn)不明顯。
長江流域地處中緯度地帶,冬季降水相態(tài)復(fù)雜多變,同樣量級的降水,由于雨、雪、雨夾雪、凍雨等不同的降水相態(tài),其對人類的生產(chǎn)和活動的影響也不同,如2008年初發(fā)生在中國南方的低溫雨雪冰凍災(zāi)害,使得城鄉(xiāng)交通、電力、通信等遭受重創(chuàng),百姓生活受到嚴(yán)重影響,經(jīng)濟(jì)損失巨大。降水相態(tài)預(yù)報(bào)一直是長江流域冬季降水預(yù)報(bào)的難點(diǎn),很多學(xué)者進(jìn)行了大量研究。關(guān)于雨雪的判別,國內(nèi)很多研究針對溫度層結(jié)和特定氣壓層的厚度進(jìn)行了大量統(tǒng)計(jì)和分析,徐輝和宗志平(2014)在2012年11月3—4日華北地區(qū)降水相態(tài)轉(zhuǎn)換過程中溫度垂直結(jié)構(gòu)特征分析中指出,當(dāng)850~1 000 hPa的厚度差<1 300 gpm,且700~850 hPa的厚度差<1 530 gpm時(shí),地面的降水相態(tài)類型以雪或雨夾雪為主,反之,則以雨為主。張琳娜等(2013)通過對近10年北京地區(qū)雨雪轉(zhuǎn)換過程分析,得到了850 hPa溫度、925 hPa 溫度、1 000 hPa溫度、1 000~700 hPa厚度、1 000~850 hPa厚度和地面溫濕條件(2 m溫度、2 m相對濕度的結(jié)合量)與雨、雨夾雪、雪三種降水相態(tài)的關(guān)系。漆梁波和張瑛(2012)考慮溫度和厚度因子提出了中國東部降水相態(tài)的識別判據(jù)。陳雙和符嬌蘭(2021)、陳雷等(2012)、鄭麗娜等(2016)、楊成芳等(2015a;2015b)、許愛華等(2006)基于個(gè)例分析,給出了溫度和厚度的識別指標(biāo)。
另外還有一些學(xué)者通過開展客觀算法研究實(shí)現(xiàn)降水相態(tài)預(yù)報(bào),Dai(2008)通過30年的地面觀測建立了降雪頻率與地面氣溫和氣壓的關(guān)系,Bourgouin(2000)認(rèn)為降水相態(tài)的變化與垂直方向上高于和低于0℃的面積相關(guān),因此利用環(huán)境融化參數(shù)研發(fā)了降水相態(tài)識別算法。陳雙等(2019)通過對我國臨界氣溫條件下降雪的時(shí)空分布特征分析,引入濕球溫度,利用決策樹方法對臨界條件下雪和雨進(jìn)行了判別分析。
近年來機(jī)器學(xué)習(xí)算法在氣象領(lǐng)域廣泛應(yīng)用,朱文剛等(2020)發(fā)現(xiàn)利用DNN法對山東雨、雪、雨夾雪的預(yù)報(bào)較ECMWF預(yù)報(bào)有明顯的提高。董全等(2013)對相同條件下線性回歸法和人工神經(jīng)網(wǎng)絡(luò)的預(yù)報(bào)效果進(jìn)行對比,指出人工神經(jīng)網(wǎng)絡(luò)法要優(yōu)于線性回歸,同時(shí)也指出南方的雨雪分界線沒有北方的預(yù)報(bào)效果好。楊璐等(2021)分別基于XGBoost、SVM、DNN三種機(jī)器學(xué)習(xí)方法建立了降水相態(tài)的高分辨率客觀分類模型,通過對比指出XGBoost和DNN都很好地實(shí)現(xiàn)降水相態(tài)的分類。黃驕文等(2021)應(yīng)用深度學(xué)習(xí)網(wǎng)絡(luò)技術(shù)構(gòu)建雨、雪判識模型,雨雪分界線比ECMWF預(yù)報(bào)更接近實(shí)況。
綜上所述,國內(nèi)外很多判斷降水相態(tài)的判據(jù),不管是人工判斷還是客觀算法判斷,主要是對溫度和厚度的垂直分布的分析,因此降水相態(tài)的轉(zhuǎn)換更加依賴對溫度的分析,對于數(shù)值預(yù)報(bào)而言,看似很小的溫度誤差,也會導(dǎo)致錯(cuò)誤的預(yù)測(Frick and Wernli,2012)。
除溫度外,相對濕度由于能影響降水粒子融化蒸發(fā)等過程,也會影響到達(dá)地面的降水相態(tài)(Kain et al,2000;Stewart et al,2015)。也有研究表明造成降水相態(tài)不同的關(guān)鍵在于云中的成雪機(jī)制以及雪花下落過程中發(fā)生的變化(廖曉農(nóng)等,2013),也就是云微物理機(jī)制。
因此,降水相態(tài)的預(yù)報(bào)需綜合考慮溫度、濕度和云物理等要素。目前在實(shí)際的預(yù)報(bào)業(yè)務(wù)中發(fā)現(xiàn),長江中下游降水相態(tài)精細(xì)化預(yù)報(bào)主要有兩個(gè)難點(diǎn):一是地形復(fù)雜,降水相態(tài)精細(xì)化格點(diǎn)預(yù)報(bào)模型不好建立;二是溫度的預(yù)報(bào)準(zhǔn)確率對降水相態(tài)預(yù)報(bào)影響較大。本文采用5 km分辨率的地形對訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,將降水相態(tài)分為四類(雨、雪、雨夾雪、凍雨)進(jìn)行建模,使用訂正后的地面溫度逐小時(shí)預(yù)報(bào)產(chǎn)品,選用CatBoost(黨存祿等,2020)算法進(jìn)行預(yù)報(bào),提供更加準(zhǔn)確和精細(xì)的格點(diǎn)降水相態(tài)客觀預(yù)報(bào)產(chǎn)品。
所用資料包括2000—2014年冬季(11月至次年2月)范圍為27°~36°N、108°~118°E的地面觀測站逐小時(shí)的2 m氣溫(T2 m)、降水相態(tài)、高空觀測數(shù)據(jù)以及地面觀測站所在高度;ECMWF ERA5再分析資料(以下簡稱ERA5),包括1 000、975、950、925、900、875、850、825、800、775、750、700、650、600、550、500、400、300、200 hPa溫度(T1000、T975、T950、T925、T900、T875、T850、T825、T800、T775、T750、T700、T650、T600、T550、T500、T400、T300、T200)、比濕、云冰和云水混合比,并計(jì)算得到700 hPa以下大于0℃的層數(shù)(以下簡稱暖層層數(shù))和小于0℃的層數(shù)(以下簡稱冷層層數(shù))。ERA5的空間分辨率為0.25°×0.25°,時(shí)間分辨率為1 h。分析時(shí)利用反距離權(quán)重插值法將ERA5逐小時(shí)數(shù)據(jù)插值到上述范圍內(nèi)的自動氣象站數(shù)據(jù),與觀測的降水相態(tài)進(jìn)行時(shí)間匹配。
降水相態(tài)的判斷是個(gè)復(fù)雜的過程,要綜合考慮各層的溫度、濕度的配置,單一的決策樹方法往往難以判斷不同溫濕狀態(tài)下的降水相態(tài)。因此本文采用集成學(xué)習(xí)算法,它使用一系列的學(xué)習(xí)器進(jìn)行學(xué)習(xí),并使用某種規(guī)則將各個(gè)學(xué)習(xí)器的學(xué)習(xí)結(jié)果進(jìn)行整合,從而獲得比單個(gè)學(xué)習(xí)器更好的學(xué)習(xí)效果。集成學(xué)習(xí)模型主要分為Bagging和Boosting?;贐agging模型的方差較小,但偏差較大。Boosting可以降低模型偏差,它通過迭代訓(xùn)練一系列的分類器,每個(gè)分類器采用的樣本分布都和上一輪的學(xué)習(xí)結(jié)果有關(guān),對基分類器的準(zhǔn)確性要求較低?;贐oosting模型的算法主要有AdaBoost,GBDT,XGBoost,LightGBM,CatBoost等算法。CatBoost是基于梯度提升決策樹(GBDT)(劉順祥,2018)的機(jī)器學(xué)習(xí)方法,相對其他Boosting算法的優(yōu)勢是無需調(diào)參即可獲得較高的模型質(zhì)量。降水相態(tài)預(yù)報(bào)中需要尋找各個(gè)要素的聯(lián)系,如溫度和濕度,該算法使用了組合類別特征,可以利用特征之間的聯(lián)系,極大豐富特征的維度。CatBoost通過添加先驗(yàn)分布項(xiàng)的方式減少了噪聲和低頻數(shù)據(jù)對于數(shù)據(jù)分布的影響,對于類別數(shù)較少的特征,先驗(yàn)項(xiàng)的添加有利于噪音數(shù)據(jù)的減少。傳統(tǒng)的Boosting算法計(jì)算的是平均數(shù),而CatBoost在這方面做了優(yōu)化,采用oblivious 樹(黨存祿等,2020)作為基學(xué)習(xí)器,oblivious樹中每個(gè)葉子節(jié)點(diǎn)的索引被編碼為長度與樹深度相等的二進(jìn)制矢量,這種計(jì)算節(jié)點(diǎn)值的方式避免了直接計(jì)算過擬合的問題。
本文將降水相態(tài)劃分為四類:雨、雪、雨夾雪、凍雨,對某一類降水相態(tài)檢驗(yàn)其準(zhǔn)確率、漏報(bào)率和空報(bào)率。以雪為例,當(dāng)觀測為雪、預(yù)報(bào)也是雪時(shí),判別為正確,記為NA;當(dāng)觀測為雪、預(yù)報(bào)為其他相態(tài)時(shí),判別錯(cuò)誤,記為NC;當(dāng)預(yù)報(bào)為雪,觀測為其他相態(tài)時(shí),判別錯(cuò)誤,記為NB。任意一類降水相態(tài)的檢驗(yàn)公式如下:
式中:TS為某一類降水相態(tài)的準(zhǔn)確率,PO為某一類降水相態(tài)的漏報(bào)率,F(xiàn)AR為某一類降水相態(tài)的空報(bào)率。
選取地面觀測中的T2 m和天氣現(xiàn)象(將天氣現(xiàn)象分為四類降水相態(tài)),ERA5的1 000~700 hPa溫度、850 hPa以下的云冰混合比和云水混合比,及利用ERA5各層溫度統(tǒng)計(jì)的冷暖層的層數(shù)作為降水相態(tài)判別的特征量,提取各個(gè)站點(diǎn)海拔高度以上的數(shù)值作統(tǒng)計(jì),以確保數(shù)據(jù)真實(shí)性和可用性。
為了檢驗(yàn)ERA5要素的可用性,首先將實(shí)況探空500、700、850、925 hPa的溫度與ERA5相同層次對比,圖1a~1d分別為2000—2014年長江中游探空站雨、雪、雨夾雪、凍雨相態(tài)對應(yīng)的500、700、850、925 hPa的實(shí)況探空溫度和ERA5相同層次溫度??梢钥闯鲇?、雪、雨夾雪實(shí)況觀測的數(shù)據(jù)與ERA5觀測的數(shù)據(jù)分布基本一致,雨的850 hPa和925 hPa溫度的第50%分位均高于0℃,雪的各層溫度均低于0℃,但是凍雨實(shí)況觀測的各層溫度第50%分位比ERA5低1~2℃。對比發(fā)現(xiàn),除了凍雨觀測與ERA5略有偏差外,其他幾種相態(tài)偏差很小,由于ERA5的垂直層次、水平分辨率以及時(shí)間分辨率更精細(xì),因此可以使用ERA5的數(shù)據(jù)與國家站逐3 h的地面觀測數(shù)據(jù)一一對應(yīng),建立降水相態(tài)數(shù)據(jù)集。
圖2a為2000—2014年不同降水相態(tài)T2 m的箱線圖,粗柱分別代表第25%分位和第75%分位,可以看出,75%以上的降雨樣本T2 m>4℃,降雪樣本T2 m<0.6℃,凍雨樣本T2 m<-0.2℃,雨夾雪樣本T2 m<2℃,可見,四類降水相態(tài)的T2 m有一定的差異,但是也有交叉,特別是雪和凍雨在25%~75%樣本的T2 m分布范圍基本一致。圖2b為各類相態(tài)的925 hPa溫度箱線圖,75%以上的降雨樣本T925>0℃,而75%以上的雨夾雪、雪、凍雨樣本的T925在-7~0℃,交叉范圍大,無法確定閾值分類,但從分布看,凍雨的低層溫度要比雨夾雪更低一些。圖2c為775 hPa溫度箱線圖,75%以上的降雨和凍雨樣本T775>0℃,而75%以上的降雪和雨夾雪樣本T775<0℃。表1為1 000~700 hPa各類降水相態(tài)的第50%分位溫度值,可以看出,低層溫度很難區(qū)分雪和凍雨,但是從875 hPa開始,雪的溫度依然維持在-5℃以下,而凍雨的溫度快速升高,在775 hPa 達(dá)到最高,為1.7℃。雨夾雪不管是低層溫度還是中層溫度一直處于雪和凍雨之間。從以上的分析可以看出,為某一層溫度設(shè)定一個(gè)閾值來判斷降水相態(tài)是不合理的,在判斷降水相態(tài)時(shí),需要綜合各層溫度的配置,因此可選用各層溫度作為機(jī)器學(xué)習(xí)輸入的一個(gè)特征量。
圖1 2000—2014年不同降水相態(tài)(a)雨,(b)雪,(c)雨夾雪,(d)凍雨高空觀測與ERA5數(shù)據(jù)的500、700、850、925 hPa溫度箱線圖Fig.1 Boxplots of temperature at 500, 700, 850, 925 hPa between observation and ERA5 data for (a) rain, (b) snow, (c) sleet, (d) freezing rain during 2000-2014
為了描述溫度在垂直方向的分布對降水相態(tài)的影響,統(tǒng)計(jì)700 hPa以下暖層(≥0℃)和冷層(<0℃)的層數(shù),以反映垂直方向上大氣的冷暖結(jié)構(gòu)。圖3a、3b分別為2000—2014年ERA5資料冬季(11月至次年2月)不同降水相態(tài)對應(yīng)的冷層、暖層層數(shù)箱線圖,可以看出在雨和雪的判斷上,冷層層數(shù)和暖層層數(shù)上基本無交叉,降雪冷層大于10層,降雨有25%樣本冷層大于4層。雨夾雪和凍雨有交叉,凍雨的暖層層數(shù)要比雨夾雪多,第50%分位為5層,而雨夾雪為2層,同時(shí)暖層最高溫度也高于雨夾雪(圖3c)。總體上看,暖層層數(shù)和冷層層數(shù)對降水相態(tài)有較好的指示意義,由于機(jī)器學(xué)習(xí)算法尋找的是特征量與結(jié)果的數(shù)學(xué)關(guān)系,而氣象預(yù)報(bào)關(guān)注的是物理意義,因此該帶有物理意義的特征量可以作為機(jī)器學(xué)習(xí)算法的輸入量。
由于每次過程云冰和云水含量差別比較大,單獨(dú)分析某層云冰或云水的含量,數(shù)值變化范圍很大,并不容易總結(jié)出閾值。因此分析四種相態(tài)各層水或冰所占云中水物質(zhì)的比值,以925 hPa(圖4a)和800 hPa(圖4b)為例,可以看到雨和雪仍然是比較容易區(qū)分的,但是雪和雨夾雪、凍雨和雨則存在很多交叉。越到低層,雪和雨夾雪的含冰量占比分布范圍比較寬,為25%~100%,而雨的含冰量基本為0%,凍雨的含冰量占比主要在0%~25%,而隨著高度的增加,雨夾雪的含冰量占比降到50%以下,而凍雨的含冰量占比降到0%。根據(jù)逐層分析(圖略),可以看出,850 hPa以下的云冰和云水占比對降水相態(tài)有一定的指示意義,特別是利用從低到高云冰和云水占比的變化,可以對四類相態(tài)做區(qū)分。
圖2 2000—2014年不同降水相態(tài)(a)T2 m,(b)ERA5 T925,(c)ERA5 T775的箱線圖Fig.2 Boxplots of (a) T2 m, (b) ERA5 T925, (c) ERA5 T775for different precipitation types during 2000-2014
相態(tài)p/hPa7007507758008258508759009259509751 000雪-5.7-5.5-5.7-5.8-5.9-5.7-5.4-4.9-4.2-3.3-2.0-0.5雨夾雪-3.4-2.8-2.9-3.2-3.4-3.6-3.5-3.0-2.3-1.4-0.31.0凍雨0.21.61.7-1.30.4-0.9-2.5-3.6-3.8-3.1-1.8-0.4雨0.12.43.23.63.73.73.63.74.04.75.87.1
首先需要提取每個(gè)站點(diǎn)相對地面以上的特征量,主要原因在于:(1)對于海拔高度高的站點(diǎn),邊界層(如925 hPa)的特征量在地面以下,該層數(shù)據(jù)對降水相態(tài)沒有指示意義,不能作為訓(xùn)練數(shù)據(jù);(2)由于預(yù)報(bào)的分辨率是5 km×5 km,地形起伏比較大,長江中下游部分地區(qū)海拔高度可達(dá)3 km以上,而用于訓(xùn)練的國家站均在3 km高度以下,建立的模型用于更高海拔高度臺站的降水相態(tài)預(yù)報(bào)誤差會比較大。基于以上兩點(diǎn)原因,首先把特征量在垂直方向上進(jìn)行插值,然后選取每個(gè)站點(diǎn)地面以上固定層數(shù)的特征量,形成訓(xùn)練數(shù)據(jù)集。
通過上文降水相態(tài)與溫度、濕度及微物理特征量的分析,利用不同特征量組合測試,找到最優(yōu)的輸入特征量。選取表征四類降水相態(tài)(雨、雪、雨夾雪、凍雨)的溫度、濕度、微物理特征的43個(gè)特征量,包括地面以上0~3.6 km每300 m間隔高度上的溫度、云冰混合比、云水混合比,600~400 hPa的比濕,0~3 km冷層和暖層的層數(shù)。其中之所以采用600~400 hPa的比濕是由于在預(yù)報(bào)個(gè)例總結(jié)中,高層的比濕反映了水汽伸展的高度,體現(xiàn)了高層冰晶的含量,對降水相態(tài)的判斷也有一定的輔助作用。利用CatBoost算法,建立降水相態(tài)預(yù)報(bào)模型。
圖3 2000—2014年不同降水相態(tài)700 hPa以下(a)冷層層數(shù),(b)暖層層數(shù),(c)暖層最高溫度箱線圖Fig.3 Boxplots of (a) cold layer thickness, (b) warm layer thickness, (c) maximum temperature of warm layer for different precipitation types during 2000-2014
圖4 2000—2014年不同降水相態(tài)(a)925 hPa,(b)800 hPa云冰混合比箱線圖Fig.4 Boxplots of specific cloud ice mixing ratio of (a) 925 hPa and (b) 800 hPa for different precipitation types during 2000-2014
以2000—2014年的數(shù)據(jù)訓(xùn)練模型,經(jīng)統(tǒng)計(jì),2000—2014年區(qū)域內(nèi)雨、雪、雨夾雪、凍雨分別有372 386、70 987、9 849、5 660個(gè)站次。通過分析也發(fā)現(xiàn),雨、雪、雨夾雪、凍雨樣本比例為66∶13∶2∶1,存在明顯的數(shù)據(jù)不平衡現(xiàn)象,因此在訓(xùn)練前首先進(jìn)行數(shù)據(jù)不平衡處理。常見的處理不平衡數(shù)據(jù)多采用SMOTE(synthetic minority oversampling technique)(郝曉紅,2019),該算法的缺點(diǎn)是生成的少數(shù)類樣本容易與周圍的多數(shù)類樣本產(chǎn)生重疊導(dǎo)致難以分類,本文采用SMOTE+ENN(郝曉紅,2019)方法,該算法是SMOTE和k近鄰算法(劉順祥,2018)的結(jié)合。先用SMOTE方法生成新的少數(shù)類樣本,獲得新的數(shù)據(jù)集對其中每一個(gè)樣本使用k近鄰預(yù)測,若預(yù)測結(jié)果和實(shí)際類別標(biāo)簽不同則剔除該樣本,對于屬于多數(shù)類的一個(gè)樣本,如果其k個(gè)近鄰點(diǎn)有超過一半都不屬于多數(shù)類,則這個(gè)樣本會被剔除,以達(dá)到數(shù)據(jù)類別均勻的目的。
為了能夠得到比較理想的結(jié)果,需要不斷嘗試不同的組合參數(shù)值,Python提供了網(wǎng)格搜索法(劉順祥,2018),可以快速進(jìn)行各參數(shù)組合試錯(cuò),最終得到最佳參數(shù)組合值,本文通過該方法選取最優(yōu)參數(shù)組合為:iterations=1 000, depth=10, learning rate=0.3, loss function=‘multiclass’。
為了更加真實(shí)地反映模型的性能,不使用隨機(jī)抽取樣本方式檢驗(yàn),而是采用獨(dú)立樣本方式檢驗(yàn),本文使用2015—2019年的樣本,并將檢驗(yàn)數(shù)據(jù)范圍擴(kuò)大為25°~36°N、105°~118°E,包括湖南和貴州的大部站點(diǎn),以獲取更多的降水相態(tài)數(shù)據(jù)進(jìn)行檢驗(yàn)。共有降雨樣本204 151個(gè)站次,降雪樣本28 627個(gè)站次,雨夾雪樣本5 045個(gè)站次,凍雨樣本2 238個(gè)站次。表2為2015—2019年利用上述方法訓(xùn)練出的模型對降水相態(tài)判別的結(jié)果,可以看出雨、雪的準(zhǔn)確率比較高,分別為95.1%和75.8%,凍雨準(zhǔn)確率為34.1%,最低的雨夾雪僅為12.3 %??傮w來看雨一般以空報(bào)為主,雪、雨夾雪、凍雨均是以漏報(bào)為主。
表2 2015—2019年CatBoost算法識別降水相態(tài)檢驗(yàn)結(jié)果Table 2 The verification results of precipitation type identified by CatBoost algorithm during 2015-2019
將以上模型投入實(shí)時(shí)業(yè)務(wù)運(yùn)行,需要使用數(shù)值模式要素作為特征量輸入模型。由于不同模式預(yù)報(bào)偏差不同,會影響降水相態(tài)的判別,因此在輸入模型前,首先對各個(gè)模式的要素預(yù)報(bào)效果進(jìn)行檢驗(yàn)。通過對幾種業(yè)務(wù)運(yùn)行的數(shù)值模式檢驗(yàn),ECMWF細(xì)網(wǎng)格模式要素預(yù)報(bào)要優(yōu)于其他幾個(gè)業(yè)務(wù)模式,因此,使用ECMWF細(xì)網(wǎng)格模式要素預(yù)報(bào)來驅(qū)動降水相態(tài)預(yù)報(bào)模型。另外,地面2 m氣溫使用武漢中心氣象臺自主研發(fā)融合影響因子及模式偏差訂正的機(jī)器學(xué)習(xí)格點(diǎn)氣溫預(yù)報(bào)產(chǎn)品,該產(chǎn)品在湖北省特別是西部山區(qū)的絕對誤差低于ECMWF細(xì)網(wǎng)格的預(yù)報(bào),因此用該產(chǎn)品代替模型中ECMWF細(xì)網(wǎng)格模式的地面2 m 氣溫。
2020年1月6—10日湖北出現(xiàn)一次大范圍雨、雪、雨夾雪和凍雨天氣過程。表3為2020年1月5日20時(shí)至1月9日20時(shí)起報(bào)的未來12~36 h逐3 h的ECMWF細(xì)網(wǎng)格模式與本方法的降水相態(tài)預(yù)報(bào)準(zhǔn)確率對比,可見,與ECMWF細(xì)網(wǎng)格模式預(yù)報(bào)的降水相態(tài)對比,雨準(zhǔn)確率提高了9.9%,雪提高了39.1%,凍雨提高了11.1%,雨夾雪的準(zhǔn)確率相當(dāng)。圖5為CatBoost算法和ECMWF 2020年1月8日08時(shí)起報(bào)18 h和24 h降水相態(tài)和實(shí)況觀測對比圖,可見,1月9日02時(shí)(18 h)湖北中部一線已經(jīng)轉(zhuǎn)為純雪,CatBoost算法對降雪與降雨的分界線預(yù)報(bào)的比較準(zhǔn)確,特別是孝感和襄陽,而ECMWF對襄陽和孝感的降雪出現(xiàn)了漏報(bào),1月9日08時(shí)(24 h),孝感至宜昌一線均轉(zhuǎn)為純雪,ECMWF的純雪有明顯的漏報(bào),而CatBoost算法預(yù)報(bào)襄陽、孝感、宜昌和荊門的轉(zhuǎn)雪時(shí)間基本與實(shí)況一致。通過對比,可以看出CatBoost算法對相態(tài)的預(yù)報(bào)能力要明顯優(yōu)于ECMWF的預(yù)報(bào)。
圖5 (a,b)CatBoost算法和(c,d)ECMWF在2020年1月8日08時(shí)起報(bào)(a,c)18 h和(b,d)24 h降水相態(tài)預(yù)報(bào)(填色)與實(shí)況觀測(符號)Fig.5 The forecast precipitation types with (a, c) 18 h and (b, d) 24 h leadtimes starting from 08:00 BT 8 January 2020 by (a, b) CatBoost algorithm, (c, d) ECMWF and the observation(colored: forecast, symbol: observation)
表3 2020年1月6—10日CatBoost算法與ECMWF細(xì)網(wǎng)格模式降水相態(tài)準(zhǔn)確率Table 3 Precipitation types identified by CatBoost algorithm and ECMWF during 6-10 January 2020
(1)通過對2000—2014年冬季不同降水相態(tài)的溫度、濕度和微物理特征的統(tǒng)計(jì)分析,得到降水相態(tài)機(jī)器學(xué)習(xí)算法輸入的43個(gè)特征量,利用CatBoost算法,建立湖北省降水相態(tài)格點(diǎn)預(yù)報(bào)模型,可以提供時(shí)間和空間更精細(xì)的降水相態(tài)預(yù)報(bào)。
(2)利用5 km分辨率的地形高度數(shù)據(jù),將要素訂正到相對地形高度以上等高度的層次上,與使用固定層次的特征量訓(xùn)練的模型相比,對降水相態(tài)的判別和預(yù)報(bào)準(zhǔn)確率均有提高,同時(shí)能反映湖北省西部高山和平原相態(tài)的區(qū)別。
(3)由于地面2 m溫度受地形影響偏差較大,利用本地2 m溫度客觀產(chǎn)品代替ECMWF的地面2 m 溫度預(yù)報(bào)產(chǎn)品,能夠更好地反映地形的 2 m溫度的變化,從而提高降水相態(tài)的預(yù)報(bào)準(zhǔn)確率,特別是雨雪分界線也較ECMWF有更好的訂正。
(4)利用建立的模型對2020年1月6—10日大范圍雨雪過程做訂正預(yù)報(bào),并與ECMWF的降水相態(tài)預(yù)報(bào)產(chǎn)品對比,對雨、雪、凍雨的準(zhǔn)確率有明顯的提高,雨夾雪準(zhǔn)確率仍比較低。