卓健,廖勝石,蘇傳程,鄧悅,張小瓊
(1.廣西壯族自治區(qū)氣象信息中心,廣西南寧 530022;2.廣西壯族自治區(qū)氣候中心,廣西南寧 530022)
由于天氣雷達(dá)探測(cè)資料高時(shí)空分辨率的特點(diǎn),對(duì)于短臨預(yù)報(bào)、中小尺度天氣監(jiān)測(cè)等氣象業(yè)務(wù)具有重要意義[1-3]。 雷達(dá)定量降水估測(cè)(Quantitative Precipitation Estimation,QPE)是天氣雷達(dá)探測(cè)資料應(yīng)用的重點(diǎn),在國(guó)內(nèi)外有眾多研究和業(yè)務(wù)產(chǎn)品,其分辨率已達(dá)到1 km、分鐘級(jí)。由于Z-I關(guān)系不確定、地形遮擋、距離衰減、探測(cè)高度等原因造成雷達(dá)估測(cè)降水存在明顯的系統(tǒng)性偏差,研究人員在研制定量降水估測(cè)產(chǎn)品時(shí)采用反射率垂直廓線訂正、降水類型分類、雙偏振量質(zhì)量控制、雙偏振量降水估計(jì)、雨量計(jì)偏差訂正等方法提升估測(cè)精度。針對(duì)國(guó)內(nèi)雷達(dá)型號(hào)多、標(biāo)定不均一等具體情況[4-7],研究人員從波束阻擋、融化層及反射率垂直廓線訂正、降水類型分類Z-I關(guān)系、利用雙偏振量估測(cè)降水等技術(shù)方法進(jìn)行深入研究,取得豐碩成果[8-26]。
近年來,大數(shù)據(jù)技術(shù)與人工智能技術(shù)的飛速發(fā)展為氣象領(lǐng)域充分挖掘海量歷史數(shù)據(jù)價(jià)值提供了生機(jī),逐步實(shí)現(xiàn)以數(shù)據(jù)驅(qū)動(dòng)的思路來解決氣象領(lǐng)域的問題。在雷達(dá)定量測(cè)量降水問題上,Xiao等[16]采用人工神經(jīng)網(wǎng)絡(luò)用于雷達(dá)降水估測(cè),通過將雷達(dá)觀測(cè)插值不同的高度層,輸入不同高度層的雷達(dá)反射率來估測(cè)降水,結(jié)果優(yōu)于Z-I等傳統(tǒng)方法;Chen等[17]將地面雷達(dá)和TRMM 雷達(dá)觀測(cè)數(shù)據(jù)相結(jié)合作為深度神經(jīng)網(wǎng)絡(luò)的輸入,證明了該創(chuàng)新的降雨估測(cè)算法的廣闊前景和通用性;Liu 等[18]研究發(fā)現(xiàn)基于人工神經(jīng)網(wǎng)絡(luò)的定量降水估測(cè)比用Z-I關(guān)系更精確;邵月紅等[19]利用BP 神經(jīng)網(wǎng)絡(luò)對(duì)臨沂地區(qū)的降水進(jìn)行估測(cè),取得效果比概率匹配法更好。傅德勝等[20]基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò),建立雷達(dá)定量估測(cè)降水模型,將其用于地面降水估測(cè);殷志遠(yuǎn)等[21]采用遺傳神經(jīng)網(wǎng)絡(luò)進(jìn)行了雷達(dá)定量估測(cè)和預(yù)報(bào)降水的實(shí)驗(yàn),整體上提高了洪水預(yù)報(bào)的精度。陳訓(xùn)來等[22]采用梯度提升決策樹法,結(jié)果要優(yōu)于固定Z-I關(guān)系與動(dòng)態(tài)Z-I關(guān)系。張晨陽(yáng)等[23]將加權(quán)隨機(jī)森林和反射率垂直廓線結(jié)合,并考慮地形特征,效果有了一定提升。
雷達(dá)定量估測(cè)降水研究取得很多成果,但有些研究結(jié)果的計(jì)算效率,估測(cè)精度仍需改進(jìn),在實(shí)際業(yè)務(wù)上推廣困難。由于雷達(dá)回波和降水關(guān)系存在很強(qiáng)的地域性,廣西地處亞熱帶地區(qū),地形復(fù)雜,降雨天氣變化多端,“太陽(yáng)雨”、“牛背雨”、“街區(qū)雨”、“東邊日出西邊雨”的事例比比皆是,目前針對(duì)廣西區(qū)域開展基于深度學(xué)習(xí)的定量降水估測(cè)算法的研究還比較少,國(guó)內(nèi)外現(xiàn)有的經(jīng)驗(yàn)不能直接在廣西應(yīng)用,通過采用深度學(xué)習(xí)等人工智能技術(shù),提升廣西雷達(dá)資料估測(cè)精度是亟需解決的技術(shù)問題。
汪瑛等[24]指出一個(gè)好的定量降水估測(cè)算法關(guān)鍵在于能否實(shí)時(shí)刻畫降水系統(tǒng)的時(shí)間變化,由此提出了動(dòng)態(tài)分級(jí)Z-I關(guān)系法。該方法不依賴氣候統(tǒng)計(jì),改進(jìn)了對(duì)短時(shí)強(qiáng)降水、尤其是大量級(jí)的短時(shí)極強(qiáng)降水低估的問題,計(jì)算速度快,便于移植。卓健等[25]進(jìn)一步改進(jìn)動(dòng)態(tài)分級(jí)Z-I關(guān)系法,提出了快速動(dòng)態(tài)分級(jí)法(Fast Dynamic Categorical method,F(xiàn)DC),指出以偏差為0 且方差最小為條件時(shí)分級(jí)均值是唯一解,使得求解QPE 的計(jì)算速度進(jìn)一步提升。動(dòng)態(tài)分級(jí)Z-I關(guān)系法和快速動(dòng)態(tài)分級(jí)法強(qiáng)調(diào)了時(shí)間相關(guān)性高的數(shù)據(jù)是更合理的選擇,部分解決估測(cè)精度和計(jì)算速度的問題。本文在此基礎(chǔ)上進(jìn)一步提出一個(gè)假設(shè):在同一時(shí)次,回波塊是由多個(gè)不同降水強(qiáng)度特征的小區(qū)域聯(lián)合組成。根據(jù)這個(gè)臨近時(shí)次、臨近空間的降水回波性質(zhì)相似的假設(shè),我們?cè)谠O(shè)計(jì)廣西區(qū)域分鐘級(jí)雷達(dá)定量降水估測(cè)產(chǎn)品算法時(shí),采用AI 結(jié)合快速動(dòng)態(tài)分級(jí)法(FDC)為核心來設(shè)計(jì)降水估測(cè)產(chǎn)品模型;與眾多前人研究不同,本文還嘗試在同一時(shí)次單部雷達(dá)使用超過一個(gè)Z-I關(guān)系,以此進(jìn)行估測(cè)精度提升試驗(yàn)。
本文使用的資料取自2019 年3 月10 日—10月10 日廣西雷達(dá)汛期運(yùn)行模式覆蓋的全時(shí)段資料,包括10 部新一代多普勒雷達(dá)產(chǎn)品和約2 700個(gè)自動(dòng)站(自動(dòng)氣象站)降水量數(shù)據(jù),所有資料均從CIMISS(全國(guó)綜合氣象信息共享系統(tǒng))獲取。雷達(dá)產(chǎn)品使用各雷達(dá)站按業(yè)務(wù)考核要求上傳的PUP組合反射率產(chǎn)品,不做質(zhì)控;自動(dòng)站資料使用分鐘降水量和質(zhì)控后的小時(shí)降水量數(shù)據(jù),對(duì)降水?dāng)?shù)據(jù)進(jìn)行簡(jiǎn)單質(zhì)控:對(duì)于某站的某小時(shí)數(shù)據(jù),若該時(shí)次的分鐘降水量累計(jì)值不等于質(zhì)控后的小時(shí)降水量則剔除該時(shí)次的分鐘和小時(shí)降水?dāng)?shù)據(jù),若某時(shí)次的分鐘雨量有缺,但是累計(jì)值等于質(zhì)控后的小時(shí)降水量,則將所缺分鐘降水量設(shè)置為0,其余分鐘降水量數(shù)據(jù)全部作為正常數(shù)據(jù)使用。分鐘雨量資料與雷達(dá)資料的匹配方式如下:用T-6 min 到T-1 min 累計(jì)雨量與T時(shí)刻雷達(dá)回波相匹配,將這一匹配得到的回波等級(jí)與降水的關(guān)系用于T-6 min 到T-1 min時(shí)間段的降水估測(cè)。
2.2.1 FDC方法及改進(jìn)思路
FDC 方法將某一時(shí)次回波Z劃分為L(zhǎng)v1,Lv2,……,Lvn共n級(jí),使用逐6 min 自動(dòng)站降水?dāng)?shù)據(jù)與對(duì)應(yīng)位置回波求Z-I關(guān)系,限制條件是逐時(shí)次分級(jí)的QPE 值應(yīng)滿足偏差(Bias)為0 且方差(Var)最小,推導(dǎo)出同級(jí)回波的站點(diǎn)降水均值是該時(shí)次該等級(jí)回波Z-I關(guān)系的解。
方差用于描述離散程度,對(duì)于第n級(jí)回波,F(xiàn)DC方法估測(cè)降水的方差如式(1),
圖1 FDC方法流程圖 表示各級(jí)回波的Z-I關(guān)系。
從AI 視角,F(xiàn)DC 方法屬于一種多分類算法,忽略求解Z-I關(guān)系過程細(xì)節(jié),可以將圖1 簡(jiǎn)化成感知器(圖2),輸入的是雷達(dá)回波和自動(dòng)站雨量數(shù)據(jù),輸出的是Z-I關(guān)系。
圖2 FDC方法求Z-I關(guān)系感知器
第一次FDC 方法將回波和自動(dòng)站分成了n類,每類對(duì)應(yīng)一個(gè)強(qiáng)度范圍等級(jí)的雷達(dá)回波并包含一定數(shù)量的自動(dòng)站點(diǎn)(圖3a),每類回波對(duì)應(yīng)一個(gè)QPE 值。要進(jìn)一步提升FDC 方法的QPE 性能,應(yīng)該在保持偏差為0 的前提,使方差盡量趨近0。FDC 方法按照自動(dòng)站點(diǎn)所在位置的回波強(qiáng)度等級(jí)進(jìn)行分類(圖3a),在一個(gè)時(shí)次,每個(gè)強(qiáng)度范圍等級(jí)的雷達(dá)回波為一類,該類回波的QPE 是唯一的(圖3a 中綠色橫線),但是站點(diǎn)觀測(cè)到的降水量可能與這個(gè)值并不一致,這就是FDC 方法方差產(chǎn)生的原因。
圖3 FDC分類示意圖 a.第一次分類;b.第二次分類。豎虛線表示回波分類間隔,圓點(diǎn)表示自動(dòng)站降水量,橫線表示第一次分類小類回波的Z-I關(guān)系,橫虛線表示第二次分類小類回波的Z-I關(guān)系,圖b帶邊框圓點(diǎn)表示第二次分類后同顏色小類的強(qiáng)站點(diǎn)。
進(jìn)一步細(xì)分可達(dá)到偏差為0,方差進(jìn)一步縮小的目的,具體方法如下:首先將自動(dòng)站降水值與該站點(diǎn)位置回波的QPE值進(jìn)行比較,自動(dòng)站降水值≥QPE 值的站點(diǎn)定義為強(qiáng)站點(diǎn)(紅色圓點(diǎn),用AWSS表示),其余則為弱站點(diǎn)(藍(lán)色圓點(diǎn),用AWSW表示);然后對(duì)第一次FDC 方法分出的所有回波和自動(dòng)站類別進(jìn)行類內(nèi)二分類,即一個(gè)強(qiáng)度范圍等級(jí)的雷達(dá)回波,與該量級(jí)回波包含的強(qiáng)站點(diǎn)組成一個(gè)子類,與弱站點(diǎn)組成另一個(gè)子類,各子類分別重新求Z-I關(guān)系,這一方法將回波和自動(dòng)站分成了2n類(圖3b),各類分別使用類內(nèi)站點(diǎn)均值作為新的該類回波Z-I關(guān)系,強(qiáng)站點(diǎn)的Z-I關(guān)系如圖中深紅色虛線表示,弱站點(diǎn)的Z-I關(guān)系如圖中淺綠色虛線表示。設(shè)分類前由自動(dòng)站降水量順序序列{H1,……,Hm,……,Hn}組成,新類是在Hm處截?cái)嘈纬傻膬蓚€(gè)新順序序列{H1,……,Hm-1}和{Hm,……,Hn},由方差公式可知,兩個(gè)新序列的方差之和小于等于原序列,僅當(dāng)一個(gè)新的序列為空集時(shí)兩個(gè)新序列的方差之和才等于原序列,這也可通過圖1直觀看出。理論上,可以根據(jù)誤差再繼續(xù)進(jìn)行分類,從而不斷縮小方差,但是實(shí)際應(yīng)用時(shí)過多分類容易發(fā)生過擬合現(xiàn)象:建模的訓(xùn)練集得到一個(gè)“完美”的公式,在獨(dú)立檢驗(yàn)的驗(yàn)證集里表現(xiàn)不佳。
2.2.2 個(gè) 例
隨意抽取南寧SA 雷達(dá)一個(gè)時(shí)次(2019 年8 月1日03:48(世界時(shí),下同))的雷達(dá)回波(圖4a)。該時(shí)次回波位置對(duì)應(yīng)自動(dòng)站雨量838 個(gè)樣本值空間分布(圖4b),傳統(tǒng)方法[26],如固定關(guān)系法(Z=300I1.4)和最優(yōu)法(Z=3I2.3),擬合得到的Z-I曲線分別對(duì)應(yīng)圖4c的灰、黃點(diǎn)線。若站點(diǎn)觀測(cè)值落在曲線上,則估測(cè)值與觀測(cè)值為0誤差,很多站點(diǎn)的觀測(cè)值并未落在擬合曲線上,這就是估測(cè)值與觀測(cè)值的均方根誤差來源。
圖4 2019年8月1日03:48南寧SA雷達(dá)組合反射率因子產(chǎn)品(a)、回波區(qū)6 min自動(dòng)站降水量(b)、傳統(tǒng)方法數(shù)據(jù)擬合曲線(c)、兩次分類FDC估測(cè)結(jié)果(d) b中縱橫坐標(biāo)為距離雷達(dá)中心經(jīng)緯度度數(shù),c中藍(lán)點(diǎn)表示站點(diǎn)觀測(cè)值(Z表示雷達(dá)回波強(qiáng)度,I表示降水強(qiáng)度),d中紅色表示強(qiáng)站點(diǎn),藍(lán)色表示弱站點(diǎn),用圓圈、方框和三角符號(hào)表示該時(shí)次不同等級(jí)回波對(duì)應(yīng)雨強(qiáng)的樣本數(shù)量。
使用FDC方法進(jìn)行二次分類后,擬合得到強(qiáng)、弱站點(diǎn)的兩類Z-I關(guān)系(圖4d),由于降水雨強(qiáng)為韋伯分布(Weibull distribution),擬合得到的曲線更接近占多數(shù)的小量值,即曲線偏向該類數(shù)據(jù)的下方。值得注意的是這兩條線不同于傳統(tǒng)方法得到的指數(shù)形式曲線,并未呈現(xiàn)單調(diào)遞增的特點(diǎn),體現(xiàn)了動(dòng)態(tài)方法是用實(shí)時(shí)數(shù)據(jù)來擬合Z-I關(guān)系,每個(gè)時(shí)次參與擬合的數(shù)據(jù)不同,得到的Z-I關(guān)系是動(dòng)態(tài)變化的。
通過2.2.1節(jié)的討論可知,經(jīng)過兩次分類后,估測(cè)值與觀測(cè)值的均方根誤差縮小了。如-5~15 dBZ 對(duì)應(yīng)的286 個(gè)站點(diǎn)觀測(cè)值為0 mm,兩次分類FDC 的估測(cè)值也為0 mm,這部分站點(diǎn)估測(cè)誤差為0,圖4d 中的藍(lán)實(shí)線和橫坐標(biāo)基本重合;而圖4c 中可看到,固定關(guān)系法和最優(yōu)法的Z-I曲線均位于橫坐標(biāo)軸上方,即估測(cè)值>0 mm,存在不同程度的估測(cè)誤差,其中最優(yōu)法5~10 dBZ 的6 min 估測(cè)值偏差是最大的。可以預(yù)見,將分好的類再進(jìn)一步分類,會(huì)有更多估測(cè)值落在Z-I關(guān)系曲線上,從而進(jìn)一步縮小均方根誤差。將算法在實(shí)際系統(tǒng)中實(shí)現(xiàn)時(shí),需要考慮可用站點(diǎn)數(shù),避免過擬合現(xiàn)象發(fā)生,為研究方便,本文僅進(jìn)行兩次分類。
2.2.3 人工智能技術(shù)選擇
機(jī)器學(xué)習(xí)算法可分為回歸(Regression)、分類(Classification)和聚類(Clustering),分類或者聚類都比較適合用于區(qū)分任務(wù),聚類和分類的差異在于是否使用標(biāo)簽(label)。本研究將第二次分類結(jié)果作為同級(jí)回波分類的標(biāo)簽,因此從分類算法中選擇算法。
兩次分類的FDC方法從結(jié)構(gòu)上看是一個(gè)多層感知器(Multilayer Perceptron,MLP),F(xiàn)DC 的MLP模型包含兩層感知器(圖5),第一層感知器使用雷達(dá)回波與全部自動(dòng)站觀測(cè)數(shù)據(jù)建立第一次Z-I關(guān)系G1,根據(jù)偏差區(qū)分出強(qiáng)站點(diǎn)和弱站點(diǎn)后,再次使用FDC 方法,第二層感知器將強(qiáng)站點(diǎn)和弱站點(diǎn)分別與雷達(dá)回波建立新的Z-I關(guān)系G2S和G2W。
圖5 MLP模型求Z-I關(guān)系 AWSS表示強(qiáng)站點(diǎn),AWSW表示弱站點(diǎn)。
2.2.4 多部雷達(dá)的QPE拼圖
多部雷達(dá)組合反射率拼圖有平均值法和最大值法,試驗(yàn)本研究多部雷達(dá)定量降水估測(cè)拼圖兩種方法小樣本測(cè)試后,發(fā)現(xiàn)最大值拼圖整體偏強(qiáng),偏強(qiáng)幅度超過40%,平均值拼圖整體偏弱,偏弱幅度很小。分析平均值拼圖整體偏弱的原因:由于有一定比例的樣本處于無回波區(qū)域,這部分樣本的加入,導(dǎo)致整體評(píng)估時(shí)誤差呈負(fù)值,這是可接受的由樣本因素引起的正常偏差,因此取平均值拼圖法做為本研究的拼圖方式。
將各雷達(dá)降水估測(cè)分別作為一個(gè)分支,通過連結(jié)方式得到聯(lián)合雷達(dá)降水定量估測(cè)模型(圖6),本模型的特點(diǎn)。
圖6 多部雷達(dá)QPE簡(jiǎn)圖 輸出層的QPE表示最終計(jì)算結(jié)果。
(1) 模型的核心計(jì)算為FDC是可解釋的,所以這是一種沒有“黑盒子”的AI模型。
(2) 模型將所有雷達(dá)等權(quán)重看待,即對(duì)于任意位置,可觀測(cè)到該位置雷達(dá)回波的這部雷達(dá)對(duì)該位置的降水估測(cè)只由其本身性能決定,不需要考慮其他雷達(dá)從另外觀測(cè)點(diǎn)探測(cè)結(jié)果,也就規(guī)避了雷達(dá)探測(cè)性能均一性差異問題;從觀測(cè)角度,對(duì)于同一個(gè)氣象回波,不同雷達(dá)從不同方位對(duì)其進(jìn)行探測(cè),因?yàn)槔走_(dá)的不一致,觀測(cè)角度不同,這就如同測(cè)量數(shù)據(jù)一樣多次測(cè)量,取其平均值是一個(gè)合理的做法。
(3) 隱藏層2 計(jì)算輸出層的QPE 見公式(2),ki取值1 或0,由站點(diǎn)是否屬于對(duì)應(yīng)的強(qiáng)或弱站點(diǎn)確定,n為kiG2i不為0 值的數(shù)量,由于降水的非負(fù)性,若某區(qū)域某部雷達(dá)被遮擋導(dǎo)致無法觀測(cè),則該雷達(dá)這一位置的站點(diǎn)不進(jìn)行估測(cè)也不納入最后計(jì)算,不影響QPE值。
(4) 模型可適應(yīng)自動(dòng)站和雷達(dá)站數(shù)量的動(dòng)態(tài)變化。
2.2.5 KNN
更多的回波區(qū)域沒有自動(dòng)站點(diǎn),只計(jì)算1次ZI關(guān)系時(shí)一級(jí)回波只對(duì)應(yīng)有一個(gè)QPE 值,使用MLP 模型對(duì)回波強(qiáng)度進(jìn)行二次分類后,一級(jí)回波對(duì)應(yīng)的Z-I關(guān)系存在雙值。以圖4 相同時(shí)次為例,這些站點(diǎn)強(qiáng)站點(diǎn)和弱站點(diǎn)空間分布具有強(qiáng)站點(diǎn)和弱站點(diǎn)有相對(duì)聚攏的趨勢(shì)(圖7a),即同類強(qiáng)弱站點(diǎn)的具有水平空間歐氏距離小,不同類強(qiáng)弱站點(diǎn)水平空間歐氏距離大的特點(diǎn),由此提出假設(shè):“在同一時(shí)次,回波塊是由多個(gè)不同降水強(qiáng)度特征的小區(qū)域聯(lián)合組成”,這種相似性質(zhì)站點(diǎn)空間聚攏特點(diǎn)是解決一級(jí)回波Z-I關(guān)系對(duì)應(yīng)雙值或者多值的依據(jù)。
常見的機(jī)器學(xué)習(xí)分類算法有K 近鄰(KNearest Neighbor,KNN),決策樹(Decision Tree),樸 素 貝 葉 斯(Naive Bayesian,NB),邏 輯 回 歸(Logistic Regression),支持向量機(jī)(Support Vector Machine,SVM),隨機(jī)森林(Random Forest,RF)等。根據(jù)臨近時(shí)次、臨近空間的降水回波性質(zhì)相似假設(shè),選擇KNN 對(duì)無站點(diǎn)區(qū)域回波進(jìn)行分類,以此確定某一無站點(diǎn)回波區(qū)域是強(qiáng)區(qū)(類似強(qiáng)站點(diǎn),圖7b 紅色區(qū)域)或者弱區(qū)(類似弱站點(diǎn),圖7b 藍(lán)色區(qū)域),對(duì)應(yīng)該區(qū)域QPE值應(yīng)該取值G2S還是G2W。
使用K=1 選擇2019 年8 月整月數(shù)據(jù)進(jìn)行小樣本實(shí)驗(yàn),發(fā)現(xiàn)改進(jìn)后的QPE效果存在明顯改進(jìn),對(duì)降水細(xì)節(jié)刻畫得更清晰。FDC方法QPE結(jié)果如圖7c 所示,改進(jìn)后的QPE 結(jié)果如圖7d 所示,可看出兩方法的整體形狀基本一致,但是QPE 結(jié)果比圖8a更能體現(xiàn)較強(qiáng)降水區(qū)的細(xì)節(jié),變化的區(qū)域很多,例如圖7d的淺藍(lán)色區(qū)域遠(yuǎn)大于圖7c的,而圖7d深藍(lán)區(qū)域則小于圖7c的。用箭頭簡(jiǎn)單標(biāo)示出一些明顯改動(dòng)的區(qū)域,紅色箭頭標(biāo)示雷達(dá)回波較強(qiáng),在第一次QPE時(shí)估測(cè)值較高,通過第二次分類,QPE降低,紫色箭頭則相反,第二次分類后QPE 提升,這些變化都更符合自動(dòng)站實(shí)際觀測(cè)值,并且部分虛假回波造成的錯(cuò)誤降水被正確訂正為無降水(圖7c、圖7d黑色空心箭頭)。
圖8 2019年3—10月估測(cè)值與觀測(cè)值逐站累計(jì)值散點(diǎn)圖 a.Train組(2 634站);b.Test組(91站)。
評(píng)估指標(biāo)為常用的相關(guān)系數(shù)(r)、偏差(ME)、均方根誤差(RMSE),
式中Ra(i)為第i點(diǎn)上的估測(cè)值,Rg(i)為第i點(diǎn)上的觀測(cè)值,Rˉa、Rˉg分別為估測(cè)值和觀測(cè)值的均值。
前文從理論角度探討了本文研究方法QPE估測(cè)精度相對(duì)之前方法的改進(jìn)思路,表1 給出圖4 例子的統(tǒng)計(jì)指標(biāo),比較傳統(tǒng)固定關(guān)系法[26]、最優(yōu)法[26]、FDC方法和本文介紹的兩次分類FDC方法在單站雷達(dá)定量降水估測(cè)時(shí)的估測(cè)精度。
表1 幾種單雷達(dá)QPE方法,單時(shí)次統(tǒng)計(jì)指標(biāo)
可看出兩次分類FDC得到的幾個(gè)統(tǒng)計(jì)指標(biāo)在四種方法比較中都是最優(yōu)。FDC 方法強(qiáng)調(diào)整體無偏,所以不管多少次分類,在樣本沒有錯(cuò)誤和缺漏的情況下,ME 都接近0,更多次分類的RMSE 會(huì)減小。
對(duì)本文介紹的MLP 模型+KNN 方法,生成組網(wǎng)雷達(dá)定量降水估測(cè)的精度進(jìn)行檢驗(yàn),檢驗(yàn)時(shí)間段為2019 年3 月10 日—10 月10 日。獨(dú)立樣本檢驗(yàn)方法更能說明產(chǎn)品性能指標(biāo),具體方法為:將質(zhì)控后的自動(dòng)站小時(shí)降水量作為“真值”數(shù)據(jù)(簡(jiǎn)稱為觀測(cè)值,下同);把自動(dòng)站資料分為訓(xùn)練集(Train組)和驗(yàn)證集(Test 組)兩組,分組原則等采用潘旸等[27]的方法,將所有區(qū)域氣象站作為Train 組(2 634 站),所有國(guó)家氣象站作為Test 組(91 站),Test組分鐘數(shù)據(jù)不參與QPE研制。
首先按本研究的方法使用Train 組自動(dòng)站降水分鐘數(shù)據(jù)和全時(shí)段雷達(dá)產(chǎn)品制作出逐6 min 雷達(dá)定量降水估測(cè)產(chǎn)品,再將每一時(shí)次的10 個(gè)逐6 min 產(chǎn)品累加得到小時(shí)產(chǎn)品;采用K 近鄰算法,提取Train 和Test 兩組自動(dòng)站點(diǎn)(共2 725 站)在小時(shí)產(chǎn)品里對(duì)應(yīng)格點(diǎn)的估測(cè)值(簡(jiǎn)稱為估測(cè)值,下同),使用估測(cè)值和觀測(cè)值進(jìn)行檢驗(yàn)評(píng)估。表2 給出估測(cè)產(chǎn)品分組的統(tǒng)計(jì)指標(biāo),整體看各項(xiàng)指標(biāo)Train 組均高于Test組。
表2 Train/Test組統(tǒng)計(jì)指標(biāo)
表3 2019年Train/Test組r站數(shù)分布
對(duì)相關(guān)系數(shù)按等級(jí)分別進(jìn)行劃分(表2)。Train組98.75%的站點(diǎn)r>0.9,該組僅有1站相關(guān)系數(shù)小于0.5,分析該站逐時(shí)降水概率僅為1.7%,觀測(cè)累計(jì)降水量?jī)H為23.8 mm,與同期同組站點(diǎn)平均降水概率11.2%,站點(diǎn)累計(jì)降水量平均值1 065.2 mm差距極大,分析該站因各種因素導(dǎo)致長(zhǎng)時(shí)間雨量數(shù)據(jù)為0,同樣情況出現(xiàn)在r∈(0.6,0.7]區(qū)間的1站;Test 組r主要分布在(0.8,0.9]段,沒有r<0.5 的站點(diǎn),作為獨(dú)立檢驗(yàn)組,相關(guān)系數(shù)屬于較高水準(zhǔn),組成員均為國(guó)家站,與一般認(rèn)為國(guó)家級(jí)站點(diǎn)可靠性強(qiáng)于區(qū)域站的觀點(diǎn)吻合。站點(diǎn)累計(jì)估測(cè)值和觀測(cè)值散點(diǎn)圖有較好聚攏性(圖8),特別是Train組。
對(duì)同時(shí)次所有站點(diǎn)估測(cè)值與觀測(cè)值分別進(jìn)行累加,Train 組各時(shí)次的估測(cè)合計(jì)值與觀測(cè)合計(jì)值基本相等(圖9a),表現(xiàn)在散點(diǎn)圖上就是基本聚攏為一條直線,體現(xiàn)本文方法中作為Z-I關(guān)系的FDC方法強(qiáng)調(diào)整體無偏的特點(diǎn),Test 組則表現(xiàn)稍差(圖9b),說明存在一定量的空估和漏估,這是需要進(jìn)一步改進(jìn)的地方。對(duì)Test 組進(jìn)行不同閾值的降水分級(jí)檢驗(yàn)(表4),發(fā)現(xiàn)除了在[0.1,2)級(jí)別,ME 為正值,其余組ME 均為負(fù)值,說明本方法在低級(jí)別高估多于低估,高級(jí)別低估多于高估,降雨量級(jí)越大,低估越明顯,對(duì)于小于10 mm/h 量級(jí)降水,估測(cè)值和觀測(cè)值還是比較接近的。說明本方法在小量級(jí)降水的估測(cè)精度比較高,對(duì)于強(qiáng)降水則有一定的低估偏差。
表4 Test組分級(jí)檢驗(yàn)統(tǒng)計(jì)指標(biāo)(分級(jí)閾值)
圖9 2019年3—10月逐時(shí)估測(cè)值與觀測(cè)值合計(jì)值散點(diǎn)圖 a.Train組(2 634站);b.Test組(91站)。
在Test組中,相關(guān)系數(shù)最差的站(全州)相關(guān)系數(shù)r=0.539 1,估測(cè)值和觀測(cè)值散點(diǎn)分布如圖10a所示,關(guān)系數(shù)最好的站(德保)相關(guān)系數(shù)r=0.953 4,散點(diǎn)分布如圖10b 所示。德保站的散點(diǎn)更聚攏在估測(cè)值=觀測(cè)值的紅線附近,全州站的散點(diǎn)則呈離散分布狀態(tài)。初步分析這兩個(gè)站估測(cè)性能差異明顯的原因,全州站位于廣西東北角,目前使用的十部組網(wǎng)雷達(dá)僅桂林雷達(dá)可探測(cè)到該區(qū)域,全州站至桂林雷達(dá)直線距離約110 km,該區(qū)域山體較高,遮擋影響大,沒有第二部雷達(dá)參與估測(cè),從而導(dǎo)致估測(cè)精度不足,短時(shí)強(qiáng)降水(超20 mm/h)的估測(cè)準(zhǔn)確率,TS=0%;德保站位于廣西西南角,為百色、崇左兩部SA 波段雷達(dá)探測(cè)覆蓋區(qū)域,短時(shí)強(qiáng)降水估測(cè)準(zhǔn)確率,TS=100%。估測(cè)精度不足的部分區(qū)域,可通過引進(jìn)周邊省份雷達(dá)觀測(cè)數(shù)據(jù),如永州雷達(dá)至全州站直線距離約80 km 且遮擋更少,或者期待廣西用于填補(bǔ)雷達(dá)弱區(qū)、盲區(qū)的新增雷達(dá)建設(shè)成果。
本文提出了一種使用MLP 為框架的QPE 方法,在隱藏層各雷達(dá)分別對(duì)探測(cè)區(qū)域進(jìn)行估測(cè),各時(shí)刻同等級(jí)回波使用超過一個(gè)Z-I關(guān)系,從而達(dá)到在輸出層得到精度較高的估測(cè)結(jié)果,算法關(guān)鍵點(diǎn)如下。
(1) 以FDC方法為核心,根據(jù)單站雷達(dá)各級(jí)回波的降水估測(cè)結(jié)果誤差將回波區(qū)內(nèi)的站點(diǎn)分為強(qiáng)站點(diǎn)和弱站點(diǎn)兩類,比只使用一次FDC 方法對(duì)雷達(dá)降水回波的估測(cè)精度更優(yōu),分好的類可進(jìn)一步繼續(xù)分類。
(2) 使用MLP 技術(shù),將多部雷達(dá)的FDC 兩次分類方法組成一個(gè)深度學(xué)習(xí)QPE框架。隱藏層到輸出層,神經(jīng)元的值為0 時(shí),參與輸出計(jì)算的權(quán)重為0,有效避免被遮擋區(qū)域估測(cè)值為0,導(dǎo)致拉低QPE值。
(3) 提出一個(gè)假設(shè):“同一時(shí)次時(shí),臨近空間的降水回波性質(zhì)相似”。依據(jù)這一假設(shè),采用KNN方法將無自動(dòng)站點(diǎn)區(qū)域劃歸強(qiáng)區(qū)或弱區(qū),確定任意位置回波對(duì)應(yīng)的Z-I關(guān)系。
本文的MLP 模型和FDC 方法都是可解釋的,是一個(gè)沒有“黑盒子”的深度學(xué)習(xí)模型,模型能動(dòng)態(tài)適應(yīng)雷達(dá)和自動(dòng)站的動(dòng)態(tài)增減。對(duì)基于該模型的2019 年3—10 月的廣西新一代天氣雷達(dá)定量估測(cè)降水產(chǎn)品進(jìn)行檢驗(yàn)分析,Train 組相關(guān)系數(shù)達(dá)0.973 7,Test組相關(guān)系數(shù)達(dá)0.825 6,結(jié)果表明該方法有較好的雷達(dá)定量估測(cè)降水能力。
根據(jù)本文方法研制的廣西地面1 km 分鐘級(jí)實(shí)況降水分析產(chǎn)品已于2022 年1 月起通過天擎向廣西區(qū)內(nèi)用戶提供,并在廣西氣象業(yè)務(wù)內(nèi)網(wǎng)展示。