劉建國(guó) 謝正輝 趙琳娜 賈炳浩
1 中國(guó)科學(xué)院大氣物理研究所大氣科學(xué)和地球流體力學(xué)數(shù)值模擬國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100029
2 中國(guó)科學(xué)院大學(xué),北京 100049
3 中國(guó)氣象局公共氣象服務(wù)中心,北京 100081
為了減少大氣系統(tǒng)預(yù)報(bào)的不確定性,數(shù)值天氣預(yù)報(bào)已經(jīng)由單一值的確定性預(yù)報(bào)進(jìn)入到集合預(yù)報(bào)時(shí)代(Gneiting and Raftery, 2005)。多模式集合預(yù)報(bào)著眼于捕捉包括初邊界條件以及物理過(guò)程的不確定性以期提高預(yù)報(bào)技巧,已成為多家數(shù)值天氣與氣候預(yù)報(bào)中心進(jìn)行天氣、氣候預(yù)測(cè)的基礎(chǔ)平臺(tái)(Molteni et al., 1996; Grimitt and Mass, 2002; 陳靜和陳德輝, 2002; Barnston et al., 2003; Palmer et al.,2004)。充分展示集合預(yù)報(bào)的潛力需要對(duì)模式輸出進(jìn)行統(tǒng)計(jì)后處理,并通過(guò)率定去除單個(gè)模式偏差、提高預(yù)報(bào)與觀測(cè)的相關(guān)性來(lái)提高預(yù)報(bào)精度。對(duì)某一時(shí)間和地點(diǎn)的多模式集合預(yù)報(bào)是從概率密度函數(shù)(probability density function, PDF)取樣,該P(yáng)DF描述了集合預(yù)報(bào)的不確定性,給出天氣變量的概率預(yù)報(bào)且量化相關(guān)天氣風(fēng)險(xiǎn),比確定性預(yù)報(bào)具有更大的經(jīng)濟(jì)價(jià)值,并廣泛應(yīng)用于電力、航空、氣象導(dǎo)航、天氣風(fēng)險(xiǎn)金融、疾病模擬等(Palmer et al., 2004; 杜鈞和陳靜, 2010; 趙琳娜等, 2010)。
早期概率預(yù)報(bào)大都是基于線性回歸方法(Glahn et al., 1972; Bermowitz, 1975)或Logistic回歸方法(Applequist et al., 2002; Hamill et al.,2004),它們只給出超過(guò)某個(gè)閾值的特定事件發(fā)生概率而不能給出全部預(yù)報(bào)的PDF。近年來(lái),一些能夠充分利用集合預(yù)報(bào)全部信息并獲得完整 PDF的概率預(yù)報(bào)方法研究也已取得進(jìn)展,如分層模型方法(Krzysztofowicz and Maranzano, 2006)、可靠性集合平均方法(Smith et al., 2009)、貝葉斯模型平均方法(Bayesian model averaging, BMA)(Raftery et al., 2005)。BMA能產(chǎn)生率定的、高集中度的預(yù)報(bào)PDF,它對(duì)某一特定變量的概率預(yù)報(bào)(PDF)是經(jīng)過(guò)偏差校正的單個(gè)模型概率預(yù)報(bào)的加權(quán)平均,其權(quán)重是相應(yīng)模型的后驗(yàn)概率,代表著每個(gè)模型在模型訓(xùn)練階段相對(duì)的預(yù)報(bào)技巧。應(yīng)用研究表明基于BMA方法進(jìn)行集合預(yù)報(bào)具有優(yōu)勢(shì)(Wilson et al., 2007;Duan et al., 2007; Sloughter et al., 2007, 2010; 楊赤等, 2009; Fraley et al., 2010)。
BMA方法最初應(yīng)用于集合預(yù)報(bào)系統(tǒng)中服從Gaussian分布的地面氣溫和海平面氣壓等天氣變量(如 Raftery et al., 2005; Wilson et al., 2007),以及后來(lái)應(yīng)用于不服從Gaussian分布的降水和風(fēng)速等天氣變量(Sloughter et al., 2007, 2010)。Fraley et al.(2010) 進(jìn)一步將BMA方法應(yīng)用于集合預(yù)報(bào)成員具有可替換性和缺失的情況。這些研究主要是對(duì)歐美一些典型區(qū)域進(jìn)行多模式集合的BMA概率天氣預(yù)報(bào)試驗(yàn),缺乏針對(duì)中國(guó)區(qū)域基于多模式集合 BMA概率預(yù)報(bào)的率定、評(píng)估及充分發(fā)展概率預(yù)報(bào)潛力的研究。淮河流域水文氣象特點(diǎn)復(fù)雜,極端事件頻發(fā),是水文氣象研究的典型流域。而 TIGGE(The THORPEX Interactive Grand Global Ensemble)收集了全球多個(gè)氣象業(yè)務(wù)中心的全球中期業(yè)務(wù)集合預(yù)報(bào)系統(tǒng)的多成員、多要素、多時(shí)效的預(yù)報(bào)結(jié)果,為評(píng)估多模式集合預(yù)報(bào)系統(tǒng)和概率性預(yù)報(bào)及其拓展應(yīng)用提供了很好的支持。本文以淮河流域?yàn)檠芯繀^(qū)域,利用 TIGGE四個(gè)中心 European Centre for Medium-Range Weather Forecasts (ECMWF)、United Kingdom Meteorological Office (UKMO)、China Meteorological Administration (CMA) 和 United States National Center for Environmental Prediction(NCEP) 的2007年6月1日至2007年8月31日夏季三個(gè)月的 24小時(shí)地面日均氣溫集合預(yù)報(bào)結(jié)果,結(jié)合研究區(qū)域內(nèi) 43個(gè)站點(diǎn)觀測(cè),通過(guò)率定不同中心及多中心超級(jí)集合的BMA模型參數(shù),建立針對(duì)流域內(nèi)各站點(diǎn)的BMA概率預(yù)報(bào)模型,改進(jìn)了地面氣溫的預(yù)報(bào)技巧。并對(duì)BMA概率預(yù)報(bào)效果進(jìn)行評(píng)估,探討各中心及超級(jí)集合預(yù)報(bào)產(chǎn)品在研究區(qū)域的適應(yīng)性。利用已建立的BMA概率預(yù)報(bào)模型做出地面日均氣溫的百分位預(yù)報(bào),提出基于百分位預(yù)報(bào)的高溫預(yù)警方案,展示了多中心模式超級(jí)集合預(yù)報(bào)產(chǎn)品及概率預(yù)報(bào)的應(yīng)用潛力。
下面第二節(jié)介紹BMA方法的基本理論框架,第三節(jié)是研究區(qū)域與數(shù)據(jù),第四節(jié)是試驗(yàn)結(jié)果及分析,最后一節(jié)是小結(jié)和討論。
BMA是一種結(jié)合多個(gè)統(tǒng)計(jì)模型進(jìn)行聯(lián)合推斷和預(yù)測(cè)的統(tǒng)計(jì)后處理方法,Raftery et al.(2005) 將其推廣應(yīng)用到多個(gè)動(dòng)力模型中。令 f=f1,…,fK分別表示K個(gè)不同數(shù)值模式的預(yù)報(bào)結(jié)果,y代表需要預(yù)報(bào)的變量,yT代表培訓(xùn)數(shù)據(jù)。BMA預(yù)報(bào)模型(BMA預(yù)報(bào) PDF)可表示為如下的多模式概率預(yù)報(bào)加權(quán)平均的形式:
這里 pk(y|(fk,yT))是與單個(gè)集合成員預(yù)報(bào) fk相聯(lián)系的條件概率密度函數(shù),可解釋為預(yù)報(bào)變量y在模型訓(xùn)練階段模式預(yù)報(bào)fk為最佳預(yù)報(bào)條件下的概率密度函數(shù),表明 fk在模型訓(xùn)練階段為最優(yōu)預(yù)報(bào)的可能性;wk表示在模型訓(xùn)練階段第k個(gè)成員預(yù)報(bào)為最佳預(yù)報(bào)的后驗(yàn)概率,非負(fù)且滿足,反映的是每個(gè)模型成員在模型訓(xùn)練階段對(duì)預(yù)報(bào)技巧的相對(duì)貢獻(xiàn)程度。當(dāng)預(yù)報(bào)變量服從正態(tài)分布,如地面氣溫和海平面氣壓等,pk(y|(fk,yT))為正態(tài)分布密度函數(shù),其預(yù)報(bào)變量均值或期望為原始預(yù)報(bào)結(jié)果的簡(jiǎn)單線性函數(shù)ak+ bkfk,標(biāo)準(zhǔn)偏差為σ,即:
由此及(1)可知BMA預(yù)報(bào)均值為也即BMA模型的確定性預(yù)報(bào)結(jié)果。若令s,t分別表示空間與時(shí)間指標(biāo),kstf表示預(yù)報(bào)集合中第k個(gè)成員在空間s與時(shí)間t的預(yù)報(bào)結(jié)果,則公式(1)相應(yīng)BMA預(yù)報(bào)方差為
BMA預(yù)報(bào)方差(4)包含兩項(xiàng):第一項(xiàng)表示預(yù)報(bào)集合的離散程度,第二項(xiàng)表示集合內(nèi)的預(yù)報(bào)方差。
BMA預(yù)報(bào)模型參數(shù)包括ak, bk,wk(k=1, 2, …,K) 與σ2。它們的率定參照Raftery et al.(2005) 提出的方法,利用一套培訓(xùn)數(shù)據(jù),ak, bk(k=1, 2, …, K)通過(guò)線性回歸
來(lái)確定,而wk(k =1, 2, …, K)與σ2通過(guò)極大似然原則來(lái)率定。假定預(yù)報(bào)誤差在空間s與時(shí)間t上相互獨(dú)立,則對(duì)數(shù)似然函數(shù)為
方程(6)不存在解析的極大值解,需要進(jìn)行迭代求解。Raftery et al.(2005)提出在預(yù)報(bào)變量服從正態(tài)分布的情形下使用 Expectation-Maximization(EM)算法求解,Vrugt et al.(2008)提出適應(yīng)一般情形的Markov chain Monte Carlo(MCMC)方法,能獲得全局最優(yōu)解,但計(jì)算量較大,田向軍等(2011)提出了使用一種有限記憶擬牛頓優(yōu)化算法求解,并比較了三種算法的優(yōu)缺點(diǎn)。實(shí)際操作中迭代算法的選取取決于預(yù)報(bào)變量的類型以及計(jì)算量的大小。EM 算法雖只能獲得局部最優(yōu)解,但算法簡(jiǎn)單,易于編程實(shí)現(xiàn),計(jì)算速度快,對(duì)于服從正態(tài)分布的預(yù)報(bào)變量更加有效可行。氣溫服從正態(tài)分布,因此本研究在BMA方法中選擇Raftery et al.(2005)采用的 EM 迭代算法求解方程(6)從而獲得參數(shù) wk(k =1, 2, …, K)與σ2。這里引入一個(gè)非觀測(cè)變量 zk,s,t,求解方程(6)的具體EM迭代算法如下:
1)初始化:讓
n是培訓(xùn)期觀測(cè)數(shù)據(jù)總和;
2)計(jì)算初始對(duì)數(shù)似然函數(shù):
3)Expectation(E)步:將j替換為j+1,對(duì)所有的k, s, t,計(jì)算
4)Maximization(M)步:計(jì)算權(quán)重
更新方差
對(duì)于集合預(yù)報(bào)中的一些在統(tǒng)計(jì)上不易區(qū)別的集合成員,比如僅僅是由于隨機(jī)擾動(dòng)形成的不同集合成員,像TIGGE中每個(gè)業(yè)務(wù)中心的擾動(dòng)預(yù)報(bào)成員,我們可認(rèn)為其為可替換的集合成員。對(duì)于可替換的集合成員我們可以考慮他們具有相同的 BMA權(quán)重和BMA參數(shù),從而可以減少計(jì)算量。根據(jù)Fraley et al.(2010) 的研究,修改BMA方法應(yīng)用于具有可替換集合成員的集合預(yù)報(bào)。假設(shè)將m個(gè)集合成員分成I組,每組有im個(gè)可替換集合成員,即讓f,ij描述第i組第j個(gè)集合成員預(yù)報(bào)結(jié)果,y,ij為相應(yīng)的校正結(jié)果,BMA預(yù)報(bào)模型(1)可寫(xiě)為
對(duì)于EM算法,E步(8)可寫(xiě)為
M步(9)~(10)可寫(xiě)為:
對(duì)集合預(yù)報(bào)結(jié)果進(jìn)行BMA概率預(yù)報(bào)可歸結(jié)為以下三步:1)確定培訓(xùn)期長(zhǎng)度;2)采用EM算法及培訓(xùn)數(shù)據(jù)率定 BMA模型參數(shù);3)獲得相應(yīng)的BMA模型。本文采用回歸滾動(dòng)預(yù)報(bào)方式,即培訓(xùn)期是一個(gè)滑動(dòng)窗口,BMA采用先前的N天作為培訓(xùn)期進(jìn)行訓(xùn)練,培訓(xùn)出的BMA系數(shù)應(yīng)用到下一天(24小時(shí)預(yù)報(bào))的BMA模型預(yù)報(bào)中,每一天動(dòng)態(tài)建立研究區(qū)域內(nèi)各站點(diǎn)的BMA模型。試驗(yàn)中驗(yàn)證期的每一天在研究區(qū)域內(nèi)所有站點(diǎn)的BMA概率預(yù)報(bào)可以累積來(lái)驗(yàn)證預(yù)報(bào)技巧。
淮河是我國(guó)南北自然分界線,地處南北氣候過(guò)渡帶,流域內(nèi)水文氣象特點(diǎn)復(fù)雜,極端天氣事件頻發(fā),本研究取淮河流域作為研究區(qū)域(圖1)。
觀測(cè)資料為L(zhǎng)i and Yan (2009) 均一化處理更新的該區(qū)域內(nèi)43個(gè)基準(zhǔn)氣象站2007年6月1日至8月31日地面日均氣溫觀測(cè)。模式結(jié)果為同時(shí)期ECMWF、UKMO、CMA、NCEP四個(gè)TIGGE中心四套全球集合預(yù)報(bào)系統(tǒng)多集合成員的24小時(shí)地面日均氣溫集合預(yù)報(bào)結(jié)果。起報(bào)時(shí)間為世界時(shí)(格林威治時(shí)間)每日00時(shí),各中心集合預(yù)報(bào)的集合成員數(shù)等有關(guān)信息可參見(jiàn)表1。根據(jù)ECMWF、NCEP、UKMO、CMA各成員輸出的地面日均氣溫24小時(shí)集合預(yù)報(bào)結(jié)果,其均為0.5°×0.5°的格點(diǎn)數(shù)據(jù),使用雙線性插值方法獲得流域內(nèi)站點(diǎn)的集合預(yù)報(bào)結(jié)果。
表1 本研究采用的TIGGE四個(gè)單中心集合預(yù)報(bào)系統(tǒng)(ECMWF、NCEP、UKMO、CMA)的比較Table 1 Comparison of four single–center ensemble prediction systems in TIGGE in this study (ECMWF,UKMO, CMA, NCEP)
圖1 淮河流域及43個(gè)基準(zhǔn)氣象觀測(cè)站Fig.1 Illustration of the Huaihe River basin and the location of 43 standard meteorological stations
對(duì)不同時(shí)期、不同研究區(qū)域,BMA模型的培訓(xùn)期長(zhǎng)度也不同。以一個(gè)中心一段時(shí)期的集合預(yù)報(bào)結(jié)果和觀測(cè)作為培訓(xùn)數(shù)據(jù),使用不同的培訓(xùn)期長(zhǎng)度來(lái)建立 BMA概率預(yù)報(bào)模型,通過(guò)平均絕對(duì)誤差(mean absolute error, MAE)、90%預(yù)測(cè)區(qū)間寬度、連續(xù)等級(jí)概率評(píng)分(continuous ranked probability score, CRPS)(Gneiting and Raftery, 2007)三種指標(biāo)檢驗(yàn)BMA模型性能,確定培訓(xùn)期長(zhǎng)度。平均絕對(duì)誤差用來(lái)檢驗(yàn)確定性預(yù)報(bào)精確度,這里原始集合預(yù)報(bào)的確定性預(yù)報(bào)是指其均值。90%預(yù)測(cè)區(qū)間寬度和連續(xù)等級(jí)概率評(píng)分用來(lái)檢驗(yàn)概率預(yù)報(bào)的精確度和集中度。三種指標(biāo)都是負(fù)導(dǎo)向的,值越小模型性能即預(yù)報(bào)效果越好。
考慮UKMO中心10天、15天、20天、25天、30天、35天、40天、45天和50天九種培訓(xùn)期的BMA模型,選取7月21日至8月31日作為驗(yàn)證期,各項(xiàng)檢驗(yàn)指標(biāo)取驗(yàn)證期期間所有站點(diǎn)的均值。表2給出了BMA模型與原始集合預(yù)報(bào)各項(xiàng)檢驗(yàn)指標(biāo)均值,從表2中可看出不同訓(xùn)練期長(zhǎng)度的BMA模型比原始集合預(yù)報(bào)所有的指標(biāo)都要小,這說(shuō)明BMA模型比原始集合預(yù)報(bào)的效果好。圖2 給出了不同長(zhǎng)度培訓(xùn)期的 BMA模型各項(xiàng)檢驗(yàn)指標(biāo)均值的比較,從圖 2a中可以看出, 在30天以前隨著培訓(xùn)期的天數(shù)增加,MAE在不斷變小,30天以后就有較穩(wěn)定的MAE;從圖2b中可以看出,30天以后有較穩(wěn)定的、較小的CRPS,且30天后的CRPS減少的幅度很小;從圖2c中可以看出,在30天以前隨著培訓(xùn)期的天數(shù)增加,90%預(yù)測(cè)區(qū)間寬度在增加,30天以后趨于穩(wěn)定。綜合考慮MAE、CRPS、90%預(yù)測(cè)分布區(qū)間寬度三個(gè)指標(biāo)以及計(jì)算量,培訓(xùn)期為30天時(shí)趨于穩(wěn)定并得到較優(yōu)的預(yù)報(bào)效果,因此選擇培訓(xùn)期為30天。
表2 不同長(zhǎng)度培訓(xùn)期BMA模型和原始集合預(yù)報(bào)(Ens)的檢驗(yàn)指標(biāo)均值Table 2 Verification metric mean of BMA predictive models and raw ensemble forecasts (Ens) of average daily surface air temperature for different training period lengths
4.2.1 BMA概率預(yù)報(bào)實(shí)例
對(duì)于BMA概率預(yù)報(bào),首先描述單個(gè)預(yù)報(bào)變量在一個(gè)站點(diǎn)一天的BMA預(yù)報(bào)PDF實(shí)例,后面將給出多站點(diǎn)多時(shí)間的模型性能結(jié)果。圖3給出了一個(gè)BMA概率預(yù)報(bào)實(shí)例:UKMO中心 54945站 2007年8月1日地面日均氣溫的BMA概率預(yù)報(bào)PDF。圖3中BMA預(yù)報(bào)PDF的主要成分是指主要成員(BMA模型中占主要權(quán)重的成員)預(yù)報(bào)PDF與相應(yīng)權(quán)重的乘積。
4.2.2 模型比較與檢驗(yàn)評(píng)估
考慮不同中心BMA概率預(yù)報(bào)PDF,通過(guò)平均絕對(duì)誤差、90%預(yù)測(cè)區(qū)間寬度、連續(xù)等級(jí)概率評(píng)分三種指標(biāo)檢驗(yàn)和評(píng)估 TIGGE四個(gè)中心集合預(yù)報(bào)產(chǎn)品BMA概率預(yù)報(bào)效果,選取7月1日至8月31日作為驗(yàn)證期,各項(xiàng)檢驗(yàn)指標(biāo)取驗(yàn)證期期間所有站點(diǎn)的均值。表3給出了四個(gè)中心BMA模型與原始集合預(yù)報(bào)的各項(xiàng)檢驗(yàn)指標(biāo)均值,從表3中可以看出各中心的集合預(yù)報(bào)產(chǎn)品的BMA概率預(yù)報(bào)模型都比原始集合預(yù)報(bào)效果好。圖4給出了四個(gè)中心BMA模型各項(xiàng)檢驗(yàn)指標(biāo)均值的比較,可以看出,ECMWF具有較小的 MAE(圖 4a)與 90%預(yù)測(cè)區(qū)間寬度(圖 4c),ECMWF和UKMO有較小的CRPS(圖4b)。綜合考慮,ECMWF具有最好的預(yù)報(bào)效果,UKMO次之。
圖2 不同長(zhǎng)度培訓(xùn)期BMA模型性能檢驗(yàn)指標(biāo)均值比較:(a) BMA確定性預(yù)報(bào)的MAE; (b) CRPS; (c) BMA 90%預(yù)測(cè)區(qū)間寬度Fig.2 Comparison of BMA predictive models of average daily surface air temperature for different training period lengths: (a) MAE of BMA deterministic forecasts; (b) CRPS; (c) average width of 90% prediction interval
圖3 UKMO中心54945站2007年8月1日地面日均氣溫BMA預(yù)報(bào)PDF。實(shí)曲線是BMA預(yù)報(bào)PDF,虛曲線是BMA預(yù)報(bào)PDF的主要成分,粗垂直實(shí)線是觀測(cè),細(xì)垂直實(shí)線是確定性預(yù)報(bào),垂直虛線是BMA預(yù)報(bào)PDF 的第10百分位和第90百分位預(yù)報(bào)Fig.3 BMA predictive PDF of average daily surface air temperature from UKMO at station no.54945 on 1 Aug 2007.The upper solid curve is the BMA predictive PDF; the lower dashed curves are major components of BMA predictive PDF; the thick vertical line is verifying observation, the thin vertical line is the deterministic forecast; the dashed vertical lines indicate the 10th percentile and 90th percentile forecasts from the BMA predictive PDF
表3 TIGGE四個(gè)單中心集合預(yù)報(bào)系統(tǒng)BMA模型和原始集合預(yù)報(bào)(Ens)的檢驗(yàn)指標(biāo)均值Table 3 Verification metric mean of BMA predictive models and raw ensemble forecasts (Ens) of average daily surface air temperature for four single–center ensemble prediction systems
4.3.1 模型比較與檢驗(yàn)評(píng)估
圖4 TIGGE單中心集合預(yù)報(bào)系統(tǒng)BMA模型性能檢驗(yàn)指標(biāo)比較:(a) BMA確定性預(yù)報(bào)的MAE;(b) CRPS;(c)BMA 90% 預(yù)測(cè)區(qū)間寬度Fig.4 Comparison of BMA predictive models of average daily surface air temperature for four single–center ensemble prediction systems: (a) MAE of BMA deterministic forecasts; (b) CRPS; (c) average width of 90% prediction interval
使用 TIGGE四個(gè)中心的擾動(dòng)集合預(yù)報(bào)形成TIGGE多中心模式超級(jí)集合預(yù)報(bào)系統(tǒng),共有107個(gè)成員??紤]到每個(gè)中心采用的是同一個(gè)模型形成的擾動(dòng)集合預(yù)報(bào),認(rèn)為其集合成員為可替換成員,根據(jù)Fraley et al.(2010)的研究,對(duì)于可替換成員在BMA模型中可以給予他們等權(quán)重、同參數(shù)。本節(jié)應(yīng)用考慮、不考慮(普通)可替換成員的BMA模型于TIGGE超級(jí)集合預(yù)報(bào)系統(tǒng),選取7月1日至8月31日作為驗(yàn)證期,利用三種指標(biāo)檢驗(yàn)和評(píng)估各中心及多中心超級(jí)集合預(yù)報(bào)系統(tǒng)BMA模型預(yù)報(bào)效果,各項(xiàng)檢驗(yàn)指標(biāo)取驗(yàn)證期期間所有站點(diǎn)的均值。表 4是可替換原則下 BMA模型各中心成員的權(quán)重均值,從表4可以看出,ECMWF貢獻(xiàn)了大部分的比例,50個(gè)成員均占0.0159,其他幾個(gè)中心集合預(yù)報(bào)系統(tǒng)成員貢獻(xiàn)較少,這也驗(yàn)證了前面試驗(yàn)ECMWF的集合預(yù)報(bào)系統(tǒng)有最佳的區(qū)域適應(yīng)性的結(jié)論。表 5給出了單中心、多中心超級(jí)集合預(yù)報(bào)BMA模型與原始集合預(yù)報(bào)的檢驗(yàn)指標(biāo)均值,從表 5中可以看出,所有的BMA模型預(yù)報(bào)效果比原始集合預(yù)報(bào)好。圖5給出了BMA模型檢驗(yàn)指標(biāo)均值比較,從圖5可以看出超級(jí)集合(grand ensemble,GE)的普通BMA模型比單中心集合預(yù)報(bào)系統(tǒng)的BMA模型有更好的預(yù)報(bào)效果,考慮可替換原則的超級(jí)集合(grand ensemble considering exchangeable members, EGE)BMA模型大大減少計(jì)算量且在所有集合預(yù)報(bào)系統(tǒng)的BMA模型中有最好的預(yù)報(bào)效果,比原始集合預(yù)報(bào)在MAE上減少近7%,在CRPS上提高近10%。
4.3.2 百分位預(yù)報(bào)與極端事件分析
BMA概率預(yù)報(bào)模型給出的完全PDF包含了多中心模式集合預(yù)報(bào)不確定性的定量估計(jì),從中可以分析出高溫等極端天氣事件信息。由上節(jié)的討論,考慮可替換原則的超級(jí)集合BMA概率預(yù)報(bào)具有最佳預(yù)報(bào)效果,根據(jù)BMA預(yù)報(bào)PDF給出百分位預(yù)報(bào),通過(guò)分析百分位預(yù)報(bào)個(gè)例,提出基于集合預(yù)報(bào)的概率分布來(lái)預(yù)警高溫天氣的方案,探討如何捕捉PDF中極端事件信息,并討論其局限性。
表4 考慮可替換原則的TIGGE超級(jí)集合BMA模型中各中心集合成員權(quán)重均值Table 4 Weight mean of BMA predictive models for TIGGE grand ensemble with exchangeable members
表5 集合預(yù)報(bào)系統(tǒng)BMA模型和原始集合預(yù)報(bào)(Ens)的檢驗(yàn)指標(biāo)均值Table 5 Verification matric mean of BMA predictive models and raw ensemble forecasts (Ens) of average daily surface air temperature for different ensemble prediction systems
圖5 TIGGE單中心與超級(jí)集合預(yù)報(bào)系統(tǒng)BMA模型性能檢驗(yàn)比較:(a) BMA確定性預(yù)報(bào)的MAE;(b) CRPS;(c) BMA 90%預(yù)測(cè)區(qū)間寬度Fig.5 Comparison of BMA predictive models of average daily surface air temperature for different ensemble prediction systems: (a) MAE of BMA deterministic forecasts; (b) CRPS; (c) average width of 90% prediction intervals
圖6 淮河流域27個(gè)站點(diǎn)地面日均氣溫百分位預(yù)報(bào)與觀測(cè):(a)2007年7月26日;(b)2007年8月1日Fig.6 Percentile forecasts and observations of average daily surface air temperature at 27 stations in Huaihe River basin on (a) 26 Jul 2007 and (b) 1 Aug 2007
圖6給出了2007年7月26日(圖6a)、8月1日(圖6b)兩天淮河流域無(wú)缺失數(shù)據(jù)的27站點(diǎn)地面日均氣溫百分位預(yù)報(bào)。對(duì)于正常氣溫,BMA確定性預(yù)報(bào)能較好預(yù)報(bào)當(dāng)天地面日均氣溫狀況(圖6a);然而確定性預(yù)報(bào)對(duì)高溫天氣幾乎沒(méi)有預(yù)報(bào)能力(圖6b)。圖7給出了2007年7月9日至8月8日57290站的百分位預(yù)報(bào),同樣表明確定性預(yù)報(bào)能成功預(yù)報(bào)當(dāng)月大部分日期的地面日均氣溫而不能預(yù)報(bào)高溫天氣。由此可知只有概率預(yù)報(bào)才有可能做出高溫預(yù)警,7月11、17、18日與8月1日的四次高溫天氣中,每次觀測(cè)溫度都高于95百分位點(diǎn),其中7月18日和8月1日這兩次的95百分位點(diǎn)明顯高于其他相同百分位點(diǎn)以及高溫點(diǎn)(303.15K)(圖7)。若從更多的歷史集合預(yù)報(bào)和觀測(cè)記錄找到類似規(guī)律,則可提出該區(qū)域預(yù)警高溫天氣的方案:高溫事件對(duì)應(yīng)于概率預(yù)報(bào)的95百分位點(diǎn),若95 百分位點(diǎn)已經(jīng)高于高溫點(diǎn)也明顯高于其他相同百分位點(diǎn),那么就應(yīng)該進(jìn)行高溫預(yù)警,決策者也應(yīng)該考慮采取應(yīng)對(duì)高溫的措施。圖8給出了2007年7月9日至 8月 8日 54916站地面日均氣溫預(yù)報(bào)超過(guò)303.15K(30℃)高溫天氣的概率。從圖 8可以看出預(yù)報(bào)的高溫概率與觀測(cè)氣溫表現(xiàn)出比較好的一致性,特別是這一個(gè)月的兩次高溫事件都能得到較好的預(yù)報(bào),這從另一個(gè)角度說(shuō)明根據(jù)概率預(yù)報(bào)進(jìn)行高溫預(yù)警的可行性。
圖7 2007年7月9日至8月8日57290站地面日均氣溫百分位預(yù)報(bào)與觀測(cè)Fig.7 Percentile forecasts and observations of average daily surface air temperature at station no.57290 from 9 Jul to 8 Aug, 2007
圖8 2007年7月9日至8月8日54916站地面日均氣溫預(yù)報(bào)超過(guò)303.15 K高溫的概率與觀測(cè)Fig.8 Probability of exceeding 303.15 K and observations for average daily surface air temperature at station no.54916 from 9 Jul to 8 Aug, 2007
根據(jù)概率預(yù)報(bào)進(jìn)行高溫預(yù)警也有局限性,存在虛報(bào)、漏報(bào)等預(yù)報(bào)不準(zhǔn)的風(fēng)險(xiǎn),如圖7和圖8中7月21日都屬于高溫高概率預(yù)報(bào),而事實(shí)上該天都屬于夏天的正常溫度,屬于虛報(bào)。因此,如何從概率預(yù)報(bào)中捕捉到更多有用信息以減少虛報(bào)、漏報(bào),增加概率預(yù)報(bào)對(duì)高溫等極端天氣事件預(yù)報(bào)的準(zhǔn)確度,這既是對(duì)概率預(yù)報(bào)的挑戰(zhàn),也是今后努力的方向。
將BMA方法應(yīng)用于淮河流域進(jìn)行地面日均氣溫概率預(yù)報(bào)試驗(yàn),動(dòng)態(tài)建立了流域內(nèi)各站點(diǎn) BMA概率預(yù)報(bào)模型,并對(duì) TIGGE四個(gè)單中心及多中心模式超級(jí)集合預(yù)報(bào)系統(tǒng)在研究區(qū)域的預(yù)報(bào)技巧進(jìn)行評(píng)估。通過(guò)BMA概率預(yù)報(bào)PDF,極大地提高了地面氣溫的預(yù)報(bào)技巧,展示了多中心模式超級(jí)集合產(chǎn)品及BMA概率預(yù)報(bào)的應(yīng)用潛力,特別是在極端事件預(yù)報(bào)方面的潛力。BMA概率預(yù)報(bào)試驗(yàn)結(jié)果顯示:研究區(qū)域的 TIGGE多模式集合的 BMA模型培訓(xùn)期長(zhǎng)度選擇 30天較為合適,且所有 BMA模型比原始集合預(yù)報(bào)有更好的預(yù)報(bào)效果;TIGGE各中心集合預(yù)報(bào)的 BMA模型都有較好的預(yù)報(bào)效果,ECMWF最優(yōu);普通的 TIGGE多中心模式超級(jí)集合BMA模型比單中心集合預(yù)報(bào)的BMA模型有更好的預(yù)報(bào)效果。采用可替換原則的多中心模式超級(jí)集合的 BMA模型,既能節(jié)省計(jì)算量又有最好的預(yù)報(bào)效果,它與原始集合預(yù)報(bào)相比,其MAE有近7%的減少,CRPS有近10%的提高;根據(jù)已建立的BMA預(yù)報(bào)PDF,給出了百分位預(yù)報(bào),提出了基于集合預(yù)報(bào)的概率分布來(lái)預(yù)警高溫天氣的方案。
BMA概率預(yù)報(bào)能向用戶提供完全的 PDF,該P(yáng)DF定量描述了多模式集合預(yù)報(bào)的不確定性,通過(guò)分析研究BMA概率預(yù)報(bào)PDF,可以提高預(yù)報(bào)精度特別是極端事件的預(yù)報(bào)能力,但是任然存在對(duì)極端事件的漏報(bào)和誤報(bào)。我們可以通過(guò)改進(jìn)BMA方法和進(jìn)一步探討從BMA預(yù)報(bào)PDF中挖掘出更多有用信息來(lái)減少漏報(bào)和誤報(bào),提高預(yù)報(bào)精度。比如BMA方法中采用不同的偏差校正方法和參數(shù)率定方法對(duì)概率預(yù)報(bào)效果有一定的影響,特別是對(duì)像降水等其他非正態(tài)分布的天氣預(yù)報(bào)變量(Schmeits and Kok,2010; 田向軍等, 2011)。BMA方法中偏差校正方法以及參數(shù)率定方法的改進(jìn),BMA預(yù)報(bào)PDF中有用信息的挖掘,對(duì)于這些問(wèn)題值得在今后的研究中進(jìn)行深入探討,以期獲得更優(yōu)的BMA概率預(yù)報(bào)效果。
BMA方法本質(zhì)上是一個(gè)模型訓(xùn)練的統(tǒng)計(jì)方法,必須利用觀測(cè)數(shù)據(jù)對(duì)模型集合中的各個(gè)預(yù)報(bào)模型進(jìn)行訓(xùn)練,測(cè)試以確定其系數(shù)。在訓(xùn)練過(guò)程中對(duì)培訓(xùn)數(shù)據(jù)的選取非常重要,培訓(xùn)期的長(zhǎng)度也具有區(qū)域性和時(shí)間性,需要不斷試驗(yàn)以及經(jīng)驗(yàn),才能獲得最佳的預(yù)報(bào)效果。由于該方法對(duì)觀測(cè)資料的依賴性,使得其應(yīng)用也具有一定的局限性。
致謝 感謝中國(guó)科學(xué)院大氣物理研究所嚴(yán)中偉研究員及兩位匿名審稿人的寶貴意見(jiàn)。
(References)
Applequist S, Gahrs G E, Pfeffer R L, et al.2002.Comparison of methodologies for probabilistic quantitative precipitation forecasting [J].Wea.Forecasting, 17 (4): 783–799.
Barnston A G, Mason S J, Goddard L, et al.2003.Multimodel ensembling in seasonal climate forecasting at IRI [J].Bull.Amer.Meteor.Soc., 84 (12):1783–1796.
Bermowitz R J.1975.An application of model output statistics to forecasting quantitative precipitation [J].Mon.Wea.Rev., 103 (2): 149–153.
陳靜, 陳德輝, 顏宏.2002.集合數(shù)值預(yù)報(bào)發(fā)展與研究進(jìn)展 [J].應(yīng)用氣象學(xué)報(bào), 13 (4): 497–507. Chen Jing, Chen Dehui, Yan Hong.2002.A brief review on the development of ensemble prediction system [J].Journal of Applied Meteorological Science (in Chinese), 13 (4): 497–507.
杜鈞, 陳靜.2010.單一值預(yù)報(bào)向概率預(yù)報(bào)轉(zhuǎn)變的基礎(chǔ): 談?wù)劶项A(yù)報(bào)及其帶來(lái)的變革 [J].氣象, 36 (11): 1–11. Du Jun, Chen Jing.2010.The corner stone in facilitating the transition from deterministic to probabilistic forecast-ensemble forecasting and its impact on numerical weather prediction [J].Meteorological Monthly (in Chinese), 36 (11):1–11.
Duan Q, Ajami N K, Gao X, et al.2007.Multi-model ensemble hydrologic prediction using Bayesian model averaging [J].Advances in Water Resources, 30 (5): 1371–1386.
Fraley C, Raftery A E, Gneiting T.2010.Calibrating multimodel forecast ensembles with exchangeable and missing members using Bayesian model averaging [J].Mon.Wea.Rev., 138 (1): 190–202.
Glahn H R, Lowry D A.1972.The use of model output statistics (MOS) in objective weather forecasting [J].J.Appl.Meteor., 11 (8): 1203–1211.
Gneiting T, Raftery A E.2005.Weather forecasting with ensemble methods[J].Science, 310 (5746): 248–249.
Gneiting T, Raftery A E.2007.Strictly proper scoring rules prediction and estimation [J].J.Amer.Stat.Assoc., 102 (477): 359–378.
Grimitt E P, Mass C F.2002.Initial results of a mesoscale short-range ensemble forecasting system over the Pacific Northwest [J].Wea.Forecasting, 17 (2): 192–205.
Hamill T M, Whiltaker J S, Wei X.2004.Ensemble re-forecasting:Improving medium-range forecast skill using retrospective forecasting [J].Mon.Wea.Rev., 132: 1434–1447.
Krzysztofowicz R, Maranzano C J.2006.Bayesian processor of output for probabilistic quantitative precipitation forecasts [D].Ph.D.dissertation,Department of System Engineering and Department of Statistics,University of Virginia.
Li Z, Yan Z W.2009.Homogenized daily mean/maximum/minimum temperature series for China from 1960–2008 [J].Atmospheric Oceanic Science Letters, 2 (4): 237?243.
趙琳娜,吳昊,田付友,等.2010.基于TIGGE資料的流域概率性降水預(yù)報(bào)評(píng)估 [J].氣象, 36 (7): 133–142. Zhao Linna, Wu Hao, Tian Fuyou, et al.2010.Assessment of probabilistic precipitation forecasts for the Huaihe basin using TIGGE data [J].Meteorological Monthly (in Chinese), 36 (7): 133–142.
Molteni F, Buizza R, Palmer T N, et al.1996.The ECWMF ensemble prediction system: Methodology and validation [J].Quart.J.Roy.Meteor.Soc., 122 (529): 73–119.
Palmer T N, Alessandri A, Andersen U, et al.2004.Development of a European multimodel ensemble system for seasonal-to-interannual prediction (DEMETER) [J].Bull.Amer.Meteor.Soc., 85 (6): 853–872.
Raftery A E, Gneiting T, Balabdaoui F, et al.2005.Using Bayesian model averaging to calibrate forecast ensembles [J].Mon.Wea.Rev., 133 (5):1155–1174.
Schmeits M J, Kok K J.2010.A comparison between raw ensemble output,(modified) Bayesian model averaging and extended logistic regression using ECMWF ensemble prediction reforecasts [J].Mon.Wea.Rev., 138(11): 4199–4211.
Smith R L, Tebaldi C, Nychka D, et al.2009.Bayesian modeling of uncertainty in ensembles of climate models [J].Journal of the American Statistical Association, 104 (485): 97–11.
Sloughter J M, Gneiting T, Raftery A E.2010.Probabilistic wind speed forecasting using ensembles and Bayesian model averaging [J].Journal of the American Statistical Association, 105 (489): 25–35.
Sloughter, J M, Raftery A E, Gneiting T, et al.2007.Probabilistic quantitative precipitation forecasting using Bayesian model averaging [J].Mon.Wea.Rev., 135 (9): 3209–3220.
田向軍, 謝正輝, 王愛(ài)慧, 等.2011.一種求解貝葉斯模型平均的新方法[J].中國(guó)科學(xué) (地球科學(xué)), 41 (11): 1679–1687. Tian Xiangjun, Xie Zhenghui, Wang Aihui, et al.2011.A new approach for Bayesian model averaging [J].Science China (Earth Science) (in Chinese), 41 (11): 1679–1687.
Vrugt J A, Diks C G H, Clark M P.2008.Ensemble Bayesian model averaging using Markov chain Monte Carlo sampling [J].Environmental Fluid Mechanics, 8 (5): 579–595.
Wilson L J, Beauregard S, Raftery A E, et al.2007.Calibrated surface temperature forecasts from the Canadian ensemble prediction system using Bayesian model averaging [J].Mon.Wea.Rev., 135: 1364–1385.
楊赤, 嚴(yán)中偉, 邵月紅.2009.基于TIGGE集合預(yù)報(bào)的概率定量降水預(yù)報(bào) [C]// 變化環(huán)境下的水資源響應(yīng)與可持續(xù)利用——中國(guó)水利學(xué)會(huì)水資源專業(yè)委員會(huì)2009學(xué)術(shù)年會(huì)論文集.大連, 117.Yang Chi, Yan Zhongwei, Shao Yuehong.2009.Probabilistic quantitative precipitation forecasts for TIGGE ensemble forecasts [C]// Water Resources Response and Sustainable Utilization under Changing Environment—Documents of 2009 Annual Conference of the Water Resources Professional Committee of Chinese Irrigation Works Society (in Chinese).Dalian, 117.