潘留杰 薛春芳 梁綿 高星星 祁春娟 劉嘉慧敏 王建鵬
(1 陜西省氣象臺(tái),西安 710014;2 秦嶺和黃土高原生態(tài)氣象環(huán)境重點(diǎn)實(shí)驗(yàn)室災(zāi)害性天氣研究與應(yīng)用中心,西安 710044;3 陜西省氣象局,西安 710014)
降水不僅是公眾最為關(guān)心的氣象要素,同時(shí)也是政府、工業(yè)、農(nóng)業(yè)、水文等部門和氣象地質(zhì)災(zāi)害預(yù)警各領(lǐng)域的關(guān)注重點(diǎn)[1]。數(shù)值模式是降水預(yù)報(bào)的基礎(chǔ),然而,所有的數(shù)值天氣預(yù)報(bào)模式都是對(duì)真實(shí)大氣狀態(tài)的抽象表示[2],受初始場(chǎng)、邊界條件、模式框架結(jié)構(gòu)、物理過程和參數(shù)化的影響,從而不可避免的產(chǎn)生各種誤差,就降水預(yù)報(bào)來說,除去隨機(jī)性誤差外,還有強(qiáng)度、位置、形態(tài)以及時(shí)間等各種系統(tǒng)性誤差。因此,模式輸出的降水產(chǎn)品,在很大程度上還不能直接提供給用戶或者公眾使用。
數(shù)值模式釋用或者說數(shù)值模式統(tǒng)計(jì)后處理[3](Model Output Statical)將模式直接輸出的要素預(yù)報(bào)和觀測(cè)資料聯(lián)系起來,在保留模式原始預(yù)報(bào)技巧的基礎(chǔ)上,修正模式中的預(yù)報(bào)偏差和離散性誤差,降尺度輸出適合用戶需求的預(yù)報(bào)產(chǎn)品,是多年來世界各國(guó)廣泛使用的數(shù)值預(yù)報(bào)后處理方法。事實(shí)上,數(shù)值模式釋用包括模式產(chǎn)品檢驗(yàn)和客觀訂正兩部分,盡管檢驗(yàn)對(duì)模式開發(fā)者來說,其目的和意義更多的在于模式框架或參數(shù)化方案的調(diào)整,但客觀檢驗(yàn)是產(chǎn)品使用者監(jiān)控模式預(yù)報(bào)性能,理解預(yù)報(bào)誤差,找出提高預(yù)報(bào)質(zhì)量的訂正方法的前置工作和有效途徑,對(duì)期望通過統(tǒng)計(jì)后處理,提高預(yù)報(bào)表現(xiàn)的用戶來說,檢驗(yàn)和訂正方法密不可分。降水是氣象要素檢驗(yàn)中最為重要的部分,其檢驗(yàn)的復(fù)雜度隨著模式網(wǎng)格分辨率的提高快速上升,這一方面是由于時(shí)空尺度越精細(xì),降水在時(shí)空上的個(gè)體表現(xiàn)差異更加突出[4],另一方面,數(shù)值模式本身的參數(shù)化方案或物理過程對(duì)小尺度刻畫不完善,可能導(dǎo)致更多的相位或隨機(jī)誤差[5],客觀上增加了降水檢驗(yàn)的難度。針對(duì)模式網(wǎng)格降水的時(shí)空分辨率和產(chǎn)品差異化等不同特性,主要發(fā)展了三種檢驗(yàn)技術(shù):一是針對(duì)粗網(wǎng)格數(shù)值預(yù)報(bào)模式的傳統(tǒng)檢驗(yàn)方法或者稱為經(jīng)典檢驗(yàn)方法[6];二是降水空間檢驗(yàn)技術(shù),由于傳統(tǒng)檢驗(yàn)方法不能對(duì)降水系統(tǒng)的位置、形態(tài)的預(yù)報(bào)表現(xiàn)進(jìn)行判定,在降水位置細(xì)微偏離的情況下,可能出現(xiàn)雙重懲罰的現(xiàn)象,因此,隨著高分辨率細(xì)網(wǎng)格模式的快速發(fā)展,基于空間位置、降水空間形態(tài)以及時(shí)間偏差特征的空間檢驗(yàn)方法快速發(fā)展;三是集合預(yù)報(bào)檢驗(yàn)技術(shù),集合預(yù)報(bào)給出不同初始擾動(dòng)條件下的多個(gè)預(yù)報(bào)結(jié)論,其預(yù)報(bào)結(jié)果不唯一,因此可靠性、辨識(shí)度或稱之為解析度是集合預(yù)報(bào)的主要評(píng)估指標(biāo)。此外,針對(duì)極端降水事件,還發(fā)展起來了基于預(yù)報(bào)和觀測(cè)降水依賴性的極端天氣評(píng)分EDS(Eхtreme Dependency Score)、EDI(Eхtreme Dependency Indeх)和SEDS(Symmetric Eхtreme Dependency Score)等極端天氣事件的檢驗(yàn)評(píng)分方法。
從數(shù)值模式原始輸出產(chǎn)品出發(fā)到最終發(fā)布的降水客觀預(yù)報(bào)產(chǎn)品,降水的統(tǒng)計(jì)后處理或者說客觀訂正對(duì)預(yù)報(bào)質(zhì)量至關(guān)重要。生成客觀降水預(yù)報(bào)產(chǎn)品的原始模式產(chǎn)品可以是來自于單模式的統(tǒng)計(jì)后處理,也可以是全球模式、區(qū)域模式和預(yù)報(bào)員主觀訂正降水產(chǎn)品的集成,還可以是集合預(yù)報(bào)產(chǎn)品的融合統(tǒng)計(jì)[7]。針對(duì)單模式的統(tǒng)計(jì)后處理,發(fā)展了基于預(yù)報(bào)因子和觀測(cè)降水的回歸模型的訂正方法[8]、依據(jù)預(yù)報(bào)要素和模式輸出物理量統(tǒng)計(jì)關(guān)系的強(qiáng)降水配料法預(yù)報(bào)[9]、利用觀測(cè)和預(yù)報(bào)的頻率分布特征的降水頻率匹配訂正技術(shù)[10]、人工神經(jīng)網(wǎng)格降水[11]和降水偏差訂正[12]等一系列技術(shù)方法。在多模式集成方面[13],有多模式集合平均、消除偏差集合平均、加權(quán)消除偏差集合和多模式超級(jí)集合等多種方法;也有研究[14]在嶺回歸、隨機(jī)森林、深度學(xué)習(xí)等機(jī)器學(xué)習(xí)基礎(chǔ)上建立多模式集合預(yù)報(bào)后處理模型改進(jìn)預(yù)報(bào)質(zhì)量。
上述的降水預(yù)報(bào)檢驗(yàn)和降水統(tǒng)計(jì)后處理技術(shù),大多數(shù)是基于氣象站點(diǎn)觀測(cè)資料建立起來的檢驗(yàn)和訂正方法,這些方法的檢驗(yàn)結(jié)果和預(yù)報(bào)產(chǎn)品的表現(xiàn)形式也多為站點(diǎn)形式。事實(shí)上,當(dāng)實(shí)況格點(diǎn)再分析滿足用戶需求時(shí),這些方法中的大多數(shù)也適合于網(wǎng)格降水預(yù)報(bào)的檢驗(yàn)和訂正。在實(shí)況格點(diǎn)再分析不能有效獲取的情況下,將站點(diǎn)誤差在預(yù)報(bào)場(chǎng)上合理分配,也是一種有效的釋用方法。本文的主要目的是回顧近年來針對(duì)網(wǎng)格預(yù)報(bào)檢驗(yàn)訂正技術(shù)發(fā)展起來的一些新的方法和新應(yīng)用,文章也展望了網(wǎng)格降水預(yù)報(bào)檢驗(yàn)訂正技術(shù)的可能發(fā)展方向。
經(jīng)典檢驗(yàn)方法是基于二元列聯(lián)表建立的點(diǎn)對(duì)點(diǎn)的檢驗(yàn),也稱之為傳統(tǒng)檢驗(yàn)方法。降水作為離散型變量,可以簡(jiǎn)單將降水分為肯定或否定預(yù)報(bào)的二元事件,也可作為多分類預(yù)報(bào)進(jìn)行檢驗(yàn)。
早在1884年,Donaldson[15]提出兩種性能指標(biāo),一種是臨界成功指數(shù)CSI(Critical Success Indeх),被用來衡量預(yù)測(cè)的準(zhǔn)確性,特別是在罕見事件或不可預(yù)測(cè)、不可觀測(cè)頻率的情況下的稀有事件;第二種是由Schaefer[16]根據(jù)歷史優(yōu)先原則命名的Gilbert評(píng)分(Gilber Skill Score)。到1965年,Brounlee等[17]通過兩變量的列聯(lián)表計(jì)算命中率POD,虛警率FAR,誤警率FOM等。1987年,F(xiàn)lueck[18]在Hanssen-Kuipers評(píng)分的基礎(chǔ)上再次提出了真實(shí)技巧評(píng)分TSS(True Skill Statistic)。1990年,Doswell[19]針對(duì)小概率事件的TSS預(yù)報(bào)評(píng)分常趨于零的極端情況,修改 TSS評(píng)分為HSS評(píng)分,隨后在此基礎(chǔ)上發(fā)展了預(yù)報(bào)偏差Bias[20]、OR[21]指數(shù)、預(yù)報(bào)準(zhǔn)確率 ACC等多個(gè)檢驗(yàn)指標(biāo),并發(fā)展出了預(yù)報(bào)性能評(píng)分綜合圖(圖1)。
圖1 降水預(yù)報(bào)性能傳統(tǒng)評(píng)分綜合示意圖[24]Fig. 1 Rainfall prediction skill score distribution[24]
除了二分類預(yù)報(bào)事件以外,利用 2×K的列聯(lián)表可以用來檢驗(yàn)多分類事件的確定性預(yù)報(bào),也可以用來檢驗(yàn)多分類事件中發(fā)生概率的準(zhǔn)確性。2010年,Rodwell等[22]基于2×K列聯(lián)表設(shè)計(jì)概率空間的穩(wěn)定公平誤差(SEEPS)評(píng)分,用于識(shí)別降水量模式預(yù)報(bào)誤差,適應(yīng)短期內(nèi)降水量的概率分布檢驗(yàn)。
經(jīng)典檢驗(yàn)方法的主要缺陷在于以點(diǎn)對(duì)點(diǎn)的方式進(jìn)行對(duì)比,盡管其檢驗(yàn)結(jié)果最為精確,然而點(diǎn)對(duì)點(diǎn)的檢驗(yàn)物理意義不清晰,在識(shí)別高分辨率模式預(yù)報(bào)性能的小尺度變化方面,經(jīng)典檢驗(yàn)方法無能為力[23]??臻g診斷檢驗(yàn)方法是伴隨著高分辨率模式而產(chǎn)生的,按其對(duì)變量空間結(jié)構(gòu)的描述方式,可以分為濾波和位移法兩大類,在具體的檢驗(yàn)方式上又可以細(xì)分為鄰域法和尺度分離法,以及基于屬性特征的方法和變形場(chǎng)法。
鄰域法是在觀測(cè)樣本稀疏條件下檢驗(yàn)高分辨率網(wǎng)格模式的一種折衷方法。圖2為鄰域法的概念示意圖[24]。鄰域法的預(yù)報(bào)評(píng)分一般會(huì)隨著鄰域尺寸的增大及較小尺度被有效濾除而提高,對(duì)于達(dá)到可接受的水平尺度,將其看做“尺度技巧”[25]。FSS(Fractions Skill Score)是鄰域法的主要檢驗(yàn)指標(biāo)[26],具體方法為利用閾值對(duì)有降雨的網(wǎng)格定義,比較預(yù)報(bào)和觀測(cè)降雨網(wǎng)格降水匹配情況,得到分?jǐn)?shù)技巧評(píng)分(FSS):
圖2 鄰域法示意圖[24]Fig. 2 The diagram of neighborhood section method
式中:Pf和Po分別為選定半徑網(wǎng)格內(nèi)觀測(cè)事件發(fā)生的概率和預(yù)報(bào)事件的頻率,N為域內(nèi)鄰域的數(shù)量。
有研究[27]表明當(dāng)樣本量較大時(shí)TS評(píng)分檢驗(yàn)結(jié)果與FSS評(píng)分類似,但針對(duì)小概率事件,TS評(píng)分不能表現(xiàn)真實(shí)的預(yù)報(bào)技巧,F(xiàn)SS評(píng)分考察鄰域半徑內(nèi)的降水預(yù)報(bào)表現(xiàn),隨著鄰域半徑的增大,表現(xiàn)出穩(wěn)定的變化趨勢(shì),在評(píng)估不同模式對(duì)小概率事件的預(yù)報(bào)能力方面具有優(yōu)勢(shì),不足之處在于模糊了空間范圍,降低了評(píng)估精度。
尺度分離法可評(píng)估由于空間尺度不同導(dǎo)致的誤差問題,按照降水的尺度特性進(jìn)行尺度分離。1997年,Briggs等[28]使用二維小波分解衡量尺度依賴的預(yù)報(bào)誤差,之后Casati等[29]綜合運(yùn)用降水強(qiáng)度和尺度,提出了“強(qiáng)度-尺度檢驗(yàn)方法”,強(qiáng)度-尺度檢驗(yàn)利用強(qiáng)度閾值將預(yù)報(bào)場(chǎng)和觀測(cè)場(chǎng)轉(zhuǎn)為1和0的二進(jìn)制場(chǎng),再使用Haar小波進(jìn)行二維分解,從而得到降水強(qiáng)度在不同尺度上的預(yù)報(bào)評(píng)分SSL:
式中:L為空間尺度,MSEL為在尺度L上預(yù)報(bào)相對(duì)于觀測(cè)的均方根誤差,fobs為觀測(cè)場(chǎng)中第L個(gè)尺度上預(yù)報(bào)相對(duì)于觀測(cè)的預(yù)報(bào)偏差,B為預(yù)報(bào)相對(duì)觀測(cè)的尺度偏移量。
基于特征的方法是最直觀的空間檢驗(yàn)方法,可以診斷預(yù)報(bào)特征屬性如位置、大小、平均強(qiáng)度等誤差。Ebert等[24]提出的CRA(Contiguous Rain Area)方法能夠?qū)⑻卣髯R(shí)別為指定閉合閾值范圍內(nèi),符合最小相連區(qū)域的尺度標(biāo)準(zhǔn)。Wernli等[30]提出通過計(jì)算三個(gè)無量綱誤差衡量指標(biāo)S(結(jié)構(gòu)誤差)、A(振幅誤差)、L(位置誤差)來表征預(yù)報(bào)質(zhì)量,此方法進(jìn)一步證實(shí)高分辨模式對(duì)降雨結(jié)構(gòu)預(yù)測(cè)的有效性。Davis等[31]提出了通過卷積識(shí)別出預(yù)報(bào)場(chǎng)和觀測(cè)場(chǎng)中降水對(duì)象的診斷評(píng)估方法(MODE),近年來廣泛應(yīng)用于模式降水預(yù)報(bào)性能的個(gè)例分析(圖3)[32]、不同空間檢驗(yàn)方法適用性的對(duì)比[33]、強(qiáng)對(duì)流降水對(duì)象的識(shí)別和檢驗(yàn)[34]以及MODE方法相對(duì)傳統(tǒng)檢驗(yàn)的優(yōu)缺點(diǎn)。最近在空間對(duì)象檢驗(yàn)的基礎(chǔ)上,還發(fā)展出了三維空間時(shí)域?qū)ο笞粉櫃z驗(yàn)方法,評(píng)估模式降水的時(shí)間偏差(圖4)[35]。
圖3 MODE檢驗(yàn)個(gè)例[32](a,b)個(gè)例預(yù)報(bào)和觀測(cè)降水;(c,d)預(yù)報(bào)和觀測(cè)場(chǎng)提取的獨(dú)立對(duì)象;(e,f)預(yù)報(bào)和觀測(cè)場(chǎng)中的預(yù)報(bào)組合匹配對(duì)象Fig 3 MODE Test Cases(a) and (b) forecast and observed precipitation, (c) and (d) independent objects extracted from forecast and observation,(e) and (f) forecast combination matching objects in forecast and observation
圖4 時(shí)間三維卷積檢驗(yàn)概念示意圖[35](a)時(shí)間生命周期15 h的降水對(duì)象演變;(b)卷積對(duì)象橢球體Fig. 4 Conceptual scheme of Time 3D convolution test(a) Evolution of precipitation with a time life cycle of 15 h;(b) Ellipsoid of convolution object
變形場(chǎng)方法是通過擬合預(yù)報(bào)場(chǎng)到觀測(cè)場(chǎng)的空間降水強(qiáng)度、位置等變化幅度對(duì)預(yù)報(bào)場(chǎng)進(jìn)行檢驗(yàn)的方法。2009年,Gilleland等[36]將變形場(chǎng)法定義為關(guān)注范圍內(nèi)預(yù)報(bào)場(chǎng)的整體位置誤差。Keil等[37]通過反向處理方法將預(yù)報(bào)場(chǎng)變形為觀測(cè)場(chǎng),再利用位移-振幅評(píng)分變形得到振幅誤差和位移誤差,此外還有圖像變形技術(shù)[38]、優(yōu)化似然函數(shù)變形度方法[39]。
集合預(yù)報(bào)通過為初始場(chǎng)加入擾動(dòng)誤差,增加成員預(yù)報(bào)來把握預(yù)報(bào)結(jié)論的不確定性,從而提高對(duì)降水的預(yù)報(bào)能力。集合預(yù)報(bào)評(píng)估中最通用的方法是計(jì)算Brier評(píng)分,它反映的是預(yù)報(bào)概率與通過給定閾值將觀測(cè)劃分為0或1兩種情況下的平方差。Brier評(píng)分的主要不足在于盡管它能反映概率預(yù)報(bào)系統(tǒng)的優(yōu)劣,但在實(shí)際業(yè)務(wù)中很難提供簡(jiǎn)明的判別標(biāo)準(zhǔn)。1973年,Murphy[40]將Brier評(píng)分分解為可靠性、分辨能力、不確定項(xiàng)三部分,從而使其物理意義更加清晰。在實(shí)際應(yīng)用中,首先是發(fā)展了反映預(yù)報(bào)概率相對(duì)于觀測(cè)頻率的可靠性圖[41];其次是出現(xiàn)了區(qū)分預(yù)報(bào)概率和空?qǐng)?bào)率的ROC分析圖[42],ROC分析是信號(hào)探測(cè)原理在預(yù)報(bào)檢驗(yàn)評(píng)估中的應(yīng)用,它通過計(jì)算預(yù)報(bào)的命中率和空?qǐng)?bào)率來區(qū)分預(yù)報(bào)系統(tǒng)對(duì)事件發(fā)生或者不發(fā)生的分辨能力,從而使用戶能夠定量把握命中率和空?qǐng)?bào)率所占比重。其他還有分級(jí)概率評(píng)分RPS[43]、無知評(píng)分IS[44]、連續(xù)分級(jí)概率評(píng)分CRPS[45]等。
研究適合極端降水的檢驗(yàn)方法,對(duì)于提高高影響災(zāi)害天氣預(yù)報(bào)水平至關(guān)重要,目前這一領(lǐng)域仍處于起步階段,面臨諸多挑戰(zhàn)。以往的經(jīng)典傳統(tǒng)檢驗(yàn)評(píng)分隨著極端事件稀有性的增加會(huì)趨向衰減為一個(gè)極小值,有學(xué)者專家提出解決方法,在計(jì)算估計(jì)預(yù)報(bào)性能衰減率的基礎(chǔ)上,重新校正極端降水預(yù)報(bào)計(jì)算極端依賴指數(shù)EDI[46],具體如下:
式中,H、F為分別為預(yù)報(bào)命中率和空?qǐng)?bào)率。EDI閾值為[-1,1],0為區(qū)分隨機(jī)預(yù)報(bào)好與壞的分界點(diǎn),與基準(zhǔn)率無關(guān),較為合理,相比Stephenson等[47]提出的極端依賴評(píng)分EDS更加客觀。
網(wǎng)格降水客觀釋用技術(shù)主要包括單模式訂正和多模式集成[48]以及數(shù)據(jù)預(yù)處理的降尺度技術(shù)[49]。針對(duì)集合預(yù)報(bào)還有特定的概率預(yù)報(bào)釋用,主要目的是對(duì)集合預(yù)報(bào)進(jìn)行后處理,用來提高預(yù)報(bào)可靠性和概率預(yù)報(bào)的技巧[50]。此外,近年來在降水訂正中,機(jī)器學(xué)習(xí)和人工智能也得到了一些發(fā)展應(yīng)用,文章也做了一些簡(jiǎn)單的歸納和總結(jié)。
MOS方法是1972年Glathn等[51]提出的。經(jīng)典MOS后處理大體上可歸納為兩種,一種是基于數(shù)值模式輸出的各種產(chǎn)品建立統(tǒng)計(jì)模型,得到訂正降水量,即經(jīng)典MOS的間接后處理;另一種是直接訂正模式輸出降水,提高預(yù)報(bào)準(zhǔn)確率,即經(jīng)典MOS的直接后處理[52]。配料法不是簡(jiǎn)單的回歸分析,它根據(jù)不同變量之間的物理聯(lián)系,建立預(yù)報(bào)方程。該方法是Doswell等[53]1996年提出的一種致洪暴雨預(yù)報(bào)方法,在冬季降水預(yù)報(bào)研究[54]、地形降雨預(yù)報(bào)[55]、雷暴和龍卷分析預(yù)報(bào)[56]都有廣泛應(yīng)用。有研究認(rèn)為構(gòu)建配料法的要素對(duì)預(yù)報(bào)效果有關(guān)鍵影響[57]。國(guó)內(nèi)天氣預(yù)報(bào)對(duì)配料法也做了深入研究,張小玲等[58]使用顯著配料要素進(jìn)行暴雨預(yù)報(bào),并在國(guó)家級(jí)降水預(yù)報(bào)業(yè)務(wù)中應(yīng)用。來小芳等[59]基于配料法設(shè)計(jì)趨勢(shì)的強(qiáng)降水指數(shù),并在長(zhǎng)江下游地區(qū)暴雨預(yù)報(bào)中應(yīng)用。張萍萍等[60]提出流型辨識(shí)法與配料法相結(jié)合的暴雨預(yù)報(bào)方法。唐曉文等[61]以中尺度數(shù)值模式MM5的預(yù)報(bào)場(chǎng)作為原始資料計(jì)算配料綜合指數(shù)與強(qiáng)降水之間的關(guān)系,進(jìn)而輸出降水預(yù)報(bào)。劉勇等[62]利用ECMWF高分辨率數(shù)值模式產(chǎn)品,選取相關(guān)要素作為配料因子對(duì)陜西省暴雨進(jìn)行預(yù)報(bào),結(jié)果表明配料法能夠減小模式的暴雨預(yù)報(bào)偏差。其他研究還包括配料法在梅雨鋒暴雨預(yù)報(bào)中的應(yīng)用[63]、東北冷渦暴雨“配料法”的預(yù)報(bào)模型[64]、區(qū)域暴雨配料法研究應(yīng)用[65]等,在實(shí)際暴雨預(yù)報(bào)中取得了較好效果。
頻率匹配方法、邏輯回歸方法、最優(yōu)TS(ETS)評(píng)分訂正法等是經(jīng)典MOS直接后處理的典型方法。頻率匹配方法的出發(fā)點(diǎn)是使預(yù)報(bào)降水頻率與觀測(cè)降水頻率達(dá)到一致,該方法類似于分段訂正函數(shù),對(duì)模式預(yù)報(bào)偏差顯著偏大的降水有較好的預(yù)報(bào)效果。一般時(shí)效較長(zhǎng)的預(yù)報(bào)降水量偏差大于時(shí)效較短的預(yù)報(bào),所以該方法對(duì)時(shí)效較長(zhǎng)降水預(yù)報(bào)的改進(jìn)效果更加顯著,應(yīng)用表明對(duì)模式小量級(jí)降水和暴雨預(yù)報(bào)的訂正效果顯著。在原理上,該方法只能對(duì)模式原有降水預(yù)報(bào)區(qū)域的強(qiáng)度進(jìn)行調(diào)整,并不能憑空增加降水區(qū)域,對(duì)強(qiáng)降水的位置預(yù)報(bào)無訂正能力。目前在T213降水預(yù)報(bào)訂正[66]、AREM模式降水預(yù)報(bào)訂正試驗(yàn)[67]、AREM模式集合成員降水量概率匹配訂正[68]等方面應(yīng)用廣泛。這些研究確定的訂正系數(shù)在整個(gè)研究區(qū)域內(nèi)是相同的,因此合理的區(qū)域劃分是頻率訂正的關(guān)鍵問題,針對(duì)這一缺點(diǎn),對(duì)格點(diǎn)本身進(jìn)行頻率匹配是研究的一個(gè)方向[69]。此外,一些工作還應(yīng)用卡爾曼濾波動(dòng)態(tài)訓(xùn)練[70]、分位數(shù)映射的方法進(jìn)行頻率匹配訂正[71],在保持模式降水空間分布的同時(shí)提高了降水的預(yù)報(bào)技巧。
邏輯回歸方法是針對(duì)二分類相應(yīng)變量建立的一種概率回歸模型,可以將定量降水預(yù)報(bào)看成不同量級(jí)上降水“有”和“無”的分類預(yù)報(bào)問題。該方法模型設(shè)計(jì)相對(duì)簡(jiǎn)單,在雷電、短時(shí)強(qiáng)降水、概率降水預(yù)報(bào)、路面結(jié)冰風(fēng)險(xiǎn)預(yù)警、地質(zhì)災(zāi)害概率預(yù)報(bào)等業(yè)務(wù)中都有應(yīng)用。但在降水預(yù)報(bào)中多用于短時(shí)強(qiáng)降水的“有、無”判斷或是概率降水預(yù)報(bào)[72],開展分等級(jí)定量降水試驗(yàn)的較少。針對(duì)邏輯回歸模型過擬合問題,主成分分析[73]、二元邏輯回歸法和綜合多指標(biāo)疊加法[74]對(duì)降水預(yù)報(bào)有明顯改進(jìn)。但邏輯回歸中仍然存在多元線性回歸的缺點(diǎn),當(dāng)變量之間高度線性相關(guān)時(shí)回歸系數(shù)不穩(wěn)定,且可能存在模型和實(shí)際業(yè)務(wù)預(yù)報(bào)效果不一致的情況。
訓(xùn)練期對(duì)提高預(yù)報(bào)質(zhì)量至關(guān)重要。理想狀態(tài)預(yù)報(bào)和觀測(cè)完全匹配,預(yù)報(bào)偏差為一,事實(shí)上由于位置預(yù)報(bào)偏離,預(yù)報(bào)偏差為一的情況下并不能得到最高的預(yù)報(bào)評(píng)分。一些研究[75]基于TS(ETS)評(píng)分最大化的方法來訂正模式降水預(yù)報(bào)。典型的做法如下:
式中:預(yù)報(bào)值和訂正值分別標(biāo)記為x和y,降水閾值為Ok(k為1,2,…,10),F(xiàn)k為預(yù)報(bào)降水量和觀測(cè)降水量的對(duì)應(yīng)訂正值。x<F1時(shí),y為0,從而消除小量級(jí)降水;y與x比值為訂正系數(shù)。該方法和頻率匹配[70]計(jì)算訂正系數(shù)的思路整體類似,不同點(diǎn)在于獲取訂正系數(shù)的判別指標(biāo)。
與單模式確定性預(yù)報(bào)不同,集合預(yù)報(bào)統(tǒng)計(jì)后處理通過分析預(yù)報(bào)成員統(tǒng)計(jì)量及其概率預(yù)報(bào)與觀測(cè)的對(duì)應(yīng)關(guān)系,來獲取模式最佳預(yù)報(bào)結(jié)果。圖5給出了集合預(yù)報(bào)后處理概念示意圖[76]。代刊等[77]針對(duì)集合模式定量降水預(yù)報(bào)進(jìn)行了系統(tǒng)的總結(jié)和回顧,后處理方法歸納為:不基于統(tǒng)計(jì)模型的非參數(shù)化后處理方法、基于概率分布統(tǒng)計(jì)模型的參數(shù)化后處理方法、考慮變量結(jié)構(gòu)的后處理方法。
圖5 集合預(yù)報(bào)后處理流程[76]Fig. 5 Post-processing outline of ensemble forecast
非參數(shù)化方法即不預(yù)先設(shè)定統(tǒng)計(jì)模型的降水訂正方法,主要通過大量的樣本統(tǒng)計(jì)訓(xùn)練來改善降水預(yù)報(bào)表現(xiàn)。該方法詳細(xì)可以分為三類:集合定量降水預(yù)報(bào)訂正、集合定量降水集成以及空間分析等方法[78]來改善降水的預(yù)報(bào)表現(xiàn)。事實(shí)上,非參數(shù)化方法中的大多數(shù)與單模式確定性降水預(yù)報(bào)訂正方法類似,在定量降水訂正方面,傳統(tǒng)的頻率匹配法、偏差訂正在集合預(yù)報(bào)降水訂正中都有廣泛的應(yīng)用。對(duì)集合預(yù)報(bào)自身來說,由于擁有多個(gè)成員,基于多成員優(yōu)勢(shì)發(fā)展了分位值映射、降水分級(jí)、直方圖排序、概率可靠性曲線以及成員相似分析等多種訂正方法。
集合定量降水集成通常是針對(duì)自身成員開展的預(yù)報(bào)訂正。在確定性單模式降水預(yù)報(bào)中,利用不同的模式預(yù)報(bào)而不擾動(dòng)成員開展集成研究也有廣泛應(yīng)用。廣義上來看,集合預(yù)報(bào)定量降水集成方法可以看做是多模式集成的一個(gè)特例,概率匹配平均法、多模式相似集成法、最優(yōu)百分位法和集合偽偏差校正法是典型的集合定量降水預(yù)報(bào)集成方法。其中,概率匹配平均法在某種程度上平滑掉小尺度預(yù)報(bào)信息[79],對(duì)預(yù)報(bào)來說是一把“雙刃劍”,可能會(huì)提高預(yù)報(bào)評(píng)分,但真實(shí)的預(yù)報(bào)效果,需要更加精細(xì)的評(píng)定。多模式相似集成法是定量降水集成的主要方法,它依據(jù)歷史上成員之間分布和量級(jí)的相似性對(duì)比分析,但大多數(shù)集成結(jié)果都存在小雨的預(yù)報(bào)面積偏大,強(qiáng)降水極值偏低的情況[80]。最優(yōu)百分位法針對(duì)不同等級(jí)降水,利用歷史樣本確定最優(yōu)百分位值進(jìn)行集成,有效提高各等級(jí)降水預(yù)報(bào)評(píng)分[81]。隨著高分辨率模式的發(fā)展,鄰域法、對(duì)象概率預(yù)報(bào)法在降水預(yù)報(bào)訂正中普遍應(yīng)用。但這些方法不特定針對(duì)于集合預(yù)報(bào),確定性降水預(yù)報(bào)中也有廣泛應(yīng)用。總體來說鄰域法主要是在空間尺度上改善預(yù)報(bào)表現(xiàn)[82],在某種程度上是樣本過少的一種替代,通過鄰域法改善預(yù)報(bào)表現(xiàn)也是評(píng)價(jià)標(biāo)準(zhǔn)不同的具體體現(xiàn),真實(shí)的預(yù)報(bào)能力仍然需要檢驗(yàn)。
參數(shù)化后處理方法假定模式成員的預(yù)報(bào)降水滿足某種概率分布,基于概率分布進(jìn)行統(tǒng)計(jì)訂正,概率分布或參數(shù)模型直接影響參數(shù)化后處理方法的預(yù)報(bào)質(zhì)量,主要優(yōu)點(diǎn)在于已有參數(shù)模型不需要進(jìn)行大樣本訓(xùn)練。集合模式統(tǒng)計(jì)輸出法[83]和貝葉斯模型平均[84]是參數(shù)化后處理的典型方法。相對(duì)于貝葉斯模型平均,集合模式輸出統(tǒng)計(jì)方法相對(duì)簡(jiǎn)單,非均勻回歸方法、邏輯回歸方法和分位數(shù)回歸方法是集合模式輸出統(tǒng)計(jì)方法的代表。
動(dòng)態(tài)交叉取優(yōu)[85]和多產(chǎn)品融合降水(圖6)預(yù)報(bào)釋用[86]是在海量模式產(chǎn)品基礎(chǔ)上發(fā)展的類似大數(shù)據(jù)降水訂正釋用方法。網(wǎng)格降水后處理中常用的人工智能機(jī)器學(xué)習(xí)算法有神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)方法和Logistics判別方法等。Yuan等[87]將人工神經(jīng)網(wǎng)絡(luò)(ANN)應(yīng)用于NCEP區(qū)域譜模式集合預(yù)報(bào)系統(tǒng),改善了BS評(píng)分,提高了預(yù)報(bào)技巧。農(nóng)吉夫等[88]基于主成分徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)建立了降水預(yù)報(bào)模型。黃健敏等[89]和吳凡等[90]建立了Logistics回歸的區(qū)域地質(zhì)災(zāi)害和鐵路水害預(yù)報(bào)模型。
圖6 多產(chǎn)品融合降水預(yù)報(bào)釋用方法概念示意圖[86](a~c)分別為模式預(yù)報(bào);(d)、(e)為低閾值消空和高閾值限定后結(jié)果;(f)為融合預(yù)報(bào)結(jié)果Fig. 6 Conceptual scheme of multi-product fusion precipitation forecast and interpretation method [86](a and c) are model forecast; (d) and (e) are the results of low threshold elimination and high threshold restriction; (f)is the fusion forecast results
SVM方法能夠處理非線性特征的要素預(yù)報(bào)[91]。一些研究[92]在多模式集成的基礎(chǔ)上,采用相關(guān)加權(quán)、多元線性回歸以及SVM回歸方法,結(jié)果發(fā)現(xiàn)SVM回歸方法的多模式集成預(yù)報(bào)得到的均方根誤差比多模式集合平均小,有正預(yù)報(bào)效果,但均方根誤差并不能全面表現(xiàn)模式的降水預(yù)報(bào)能力,通常情況下,模式降水預(yù)報(bào)的標(biāo)準(zhǔn)差小于觀測(cè),即降水的量級(jí)分布相對(duì)集中,SVM的效果需要進(jìn)一步分析。孫俊奎等[93]基于概率神經(jīng)網(wǎng)絡(luò)(PNN)、SVM和Logistics判別的3種機(jī)器學(xué)習(xí)算法建立了3 h間隔的累計(jì)降水量預(yù)報(bào)模型,并分別采用遺傳算法優(yōu)化預(yù)報(bào)模型和修正的Logistics判別方法構(gòu)建了3種降水量預(yù)報(bào)模型,經(jīng)過對(duì)比檢驗(yàn)綜合了3種預(yù)報(bào)模型的優(yōu)點(diǎn),在時(shí)間上實(shí)現(xiàn)發(fā)布了逐3 h分辨率的降水量短期預(yù)報(bào)。黃威等[94]基于多模式降水預(yù)報(bào)資料,采用SVM回歸方法構(gòu)建降水預(yù)報(bào)模型,發(fā)現(xiàn)在中期預(yù)報(bào)時(shí)效大雨和暴雨量級(jí)上SVM多模式集成預(yù)報(bào)方法效果最優(yōu)。
機(jī)器學(xué)習(xí)K最近鄰(KNN)模型的主要思想是在特征空間中,如果一個(gè)樣本周圍的k個(gè)最近樣本的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別,這一思想對(duì)不同量級(jí)降水的預(yù)報(bào)有應(yīng)用意義,特別是在晴雨和暴雨預(yù)報(bào)特征清晰的分類中,有明顯的正向效果。已有工作中,王玉丹等[95]通過KNN模型,建立了環(huán)境、氣象因子和日降水量的關(guān)系,訂正了青藏高原的CMORPH日降水?dāng)?shù)據(jù)集,結(jié)果表明,采用KNN模型訂正后的CMORPH降水?dāng)?shù)據(jù)優(yōu)于原始數(shù)據(jù)和采用概率密度函數(shù)匹配法訂正的CMORPH數(shù)據(jù);陳浩等[96]選擇了5種機(jī)器學(xué)習(xí)模型,即KNN、多元自回歸樣條方法(MARS) 、SVM、多項(xiàng)對(duì)數(shù)線性模型( MLM) 和ANN,訂正再分析降水?dāng)?shù)據(jù)集,結(jié)果表明,KNN 的訂正精度最高。
降水是網(wǎng)格天氣預(yù)報(bào)中最為關(guān)鍵和重要的要素,文章系統(tǒng)總結(jié)了降水預(yù)報(bào)中的檢驗(yàn)技術(shù)和統(tǒng)計(jì)后處理訂正方法。在降水預(yù)報(bào)檢驗(yàn)方面可以歸納為經(jīng)典檢驗(yàn)、空間檢驗(yàn)、集合預(yù)報(bào)檢驗(yàn)三類。經(jīng)典檢驗(yàn)通過二分法列聯(lián)表計(jì)算各種預(yù)報(bào)評(píng)分來判別模式預(yù)報(bào)性能的優(yōu)劣,是點(diǎn)對(duì)點(diǎn)的對(duì)比分析,主要優(yōu)點(diǎn)在于定量化、易于比較;不足之處一是部分評(píng)分指標(biāo)物理意義不清晰,難以理解和應(yīng)用,二是經(jīng)典檢驗(yàn)不能從系統(tǒng)的角度判定預(yù)報(bào)場(chǎng)的預(yù)報(bào)表現(xiàn)。相比經(jīng)典檢驗(yàn),空間檢驗(yàn)是伴隨高分辨率模式發(fā)展起來的檢驗(yàn)方法,可以看做是經(jīng)典檢驗(yàn)方法的拓展和延伸,它能夠從多個(gè)視角提供模式性能優(yōu)劣的比較和判定,大多數(shù)空間檢驗(yàn)方法在給出自身獨(dú)特檢驗(yàn)指標(biāo)的同時(shí),也給出經(jīng)典檢驗(yàn)評(píng)分。降水空間檢驗(yàn)有尺度檢驗(yàn)、屬性檢驗(yàn)、變形場(chǎng)等多種檢驗(yàn)形式??臻g檢驗(yàn)方法能夠模擬預(yù)報(bào)員的視角給出天氣預(yù)報(bào)系統(tǒng)的快慢、位置偏差、形態(tài)預(yù)報(bào)偏差等降水的多方面預(yù)報(bào)表現(xiàn)。不足之處在于一些檢驗(yàn)結(jié)果難以轉(zhuǎn)化為實(shí)際的定量指標(biāo)從而改進(jìn)降水場(chǎng)的預(yù)報(bào)表現(xiàn)。與確定性預(yù)報(bào)相比,降水的集合預(yù)報(bào)檢驗(yàn)除了可以在每個(gè)預(yù)報(bào)成員、集合平均、集合預(yù)報(bào)統(tǒng)計(jì)量上應(yīng)用經(jīng)典檢驗(yàn)方法和空間檢驗(yàn)方法之外,還有針對(duì)自身特征的獨(dú)特檢驗(yàn)方法,主要包括集合成員的離散度和概率分布函數(shù)以及Brier評(píng)分、可靠性圖、ROC分析等概率預(yù)報(bào)的檢驗(yàn)方法。
降水產(chǎn)品檢驗(yàn)其目的對(duì)模式開發(fā)者來說是認(rèn)識(shí)模式框架、物理過程、參數(shù)化方案的不足,進(jìn)而加以改進(jìn),但對(duì)大多數(shù)模式產(chǎn)品釋用者來說,通過檢驗(yàn)可以認(rèn)識(shí)到模式產(chǎn)品的系統(tǒng)性偏差,尋找適合的訂正方法,進(jìn)而提高預(yù)報(bào)質(zhì)量,因此模式檢驗(yàn)和釋用訂正密不可分。降水統(tǒng)計(jì)訂正釋用方法主要?dú)w納為三個(gè)方面:
1)MOS方法的本質(zhì)是建立在多元線性回歸基礎(chǔ)上的統(tǒng)計(jì)方法。針對(duì)降水單模式確定性預(yù)報(bào)來說,有直接后處理和間接后處理兩種技術(shù),直接后處理技術(shù)中最有代表性的為降水頻率匹配,其他還有降水偏差訂正、位置訂正等。配料法則是間接后處理技術(shù)中的典型方法。MOS方法不僅可以用在確定性預(yù)報(bào)中,也可以用在集合預(yù)報(bào)中。與單模式統(tǒng)計(jì)后處理不同,多模式集成則是期望吸收多家模式的優(yōu)點(diǎn),提高降水預(yù)報(bào)能力,近年來一些新方法快速發(fā)展,主要包括動(dòng)態(tài)交叉最優(yōu)要素預(yù)報(bào)、多產(chǎn)品融合降水、最優(yōu)TS評(píng)分、邏輯回歸等,一些工作還在單模式統(tǒng)計(jì)后處理后進(jìn)行二次集成,總體來說,這些方法屬于MOS方法的延伸或者拓展。從業(yè)務(wù)適用性來說,直接后處理方法易于實(shí)現(xiàn),諸如降水頻率匹配、多產(chǎn)品降水融合、動(dòng)態(tài)交叉最優(yōu)要素預(yù)報(bào)等,方法物理意義清晰,技術(shù)實(shí)現(xiàn)難度較低,訂正正效果明顯,易于推廣應(yīng)用。特別是降水頻率匹配方法在國(guó)內(nèi)部分省份逐漸開展應(yīng)用,對(duì)改善網(wǎng)格降水預(yù)報(bào)質(zhì)量非常有意義。相對(duì)而言,間接后處理技術(shù)(譬如配料法)推廣應(yīng)用比較困難,這一方面是由于選定的物理量能夠在多大程度上表現(xiàn)降水的特征難以確定,導(dǎo)致不容易獲得有針對(duì)性的計(jì)算指標(biāo);另一方面不同物理量在不同的地區(qū)、不同的時(shí)段有明顯的差異,一個(gè)地區(qū)的可用指標(biāo)不能直接應(yīng)用到另一個(gè)區(qū)域。
2)相對(duì)于確定性預(yù)報(bào)來說,集合預(yù)報(bào)用更多的成員預(yù)報(bào)來考慮模式預(yù)報(bào)的不確定性,事實(shí)上,針對(duì)集合預(yù)報(bào)單成員或者多成員集成后的確定性預(yù)報(bào)來說,MOS統(tǒng)計(jì)訂正方法都可以應(yīng)用,不同的是集合預(yù)報(bào)針對(duì)多成員轉(zhuǎn)換成概率預(yù)報(bào)的過程以及對(duì)概率預(yù)報(bào)結(jié)果的統(tǒng)計(jì)訂正。目前在集合預(yù)報(bào)的基礎(chǔ)上開展的網(wǎng)格預(yù)報(bào)降水訂正相對(duì)少一些,這一方面是由于集合預(yù)報(bào)成員存在優(yōu)選的過程,通過集合預(yù)報(bào)進(jìn)行網(wǎng)格降水訂正更加復(fù)雜,另一方面相對(duì)于確定性預(yù)報(bào),集合預(yù)報(bào)系統(tǒng)的時(shí)空分辨率整體偏低,利用粗分辨率集合預(yù)報(bào)降水進(jìn)行降尺度,進(jìn)而開展網(wǎng)格降水預(yù)報(bào)訂正,不如在高分辨率模式降水預(yù)報(bào)上開展訂正工作直接。
3)釋用訂正技術(shù)很難處理模式固有的缺陷,多模式集成或集合預(yù)報(bào)能夠吸收其他模式的優(yōu)點(diǎn),但同時(shí)也混淆了模式的誤差分布,可以在一定程度上提高預(yù)報(bào)評(píng)分,但是也有增大預(yù)報(bào)員主觀判別預(yù)報(bào)降水缺陷的難度。大數(shù)據(jù)人工智能和機(jī)器學(xué)習(xí)為降水訂正釋用提供新的思路和方向。氣象工作者基于大數(shù)據(jù)人工智能開展了一些有益的探索試驗(yàn),主要包括:神經(jīng)網(wǎng)絡(luò)方法、支持向量機(jī)和邏輯回歸方法,其釋用訂正效果相對(duì)模式輸出產(chǎn)品有不同程度提高,但從改進(jìn)總量上來看,相對(duì)MOS釋用沒有躍變性的改進(jìn)?,F(xiàn)階段,成熟有效和能夠廣泛推廣應(yīng)用的人工智能網(wǎng)格降水訂正算法還不多見,基于大數(shù)據(jù)人工智能提高網(wǎng)格降水的預(yù)報(bào)準(zhǔn)確率還需要進(jìn)行深入的探索和研究。