李 超,李明華,周 凱,郝世峰,陳訓(xùn)來,趙春陽
(1.深圳市氣象局,廣東 深圳 518040;2.深圳市南方強(qiáng)天氣研究重點(diǎn)實(shí)驗(yàn)室,廣東 深圳 518040;3.深圳市國家氣候觀象臺(tái),廣東 深圳 518040; 4.浙江省氣象臺(tái),杭州 310056)
隨著社會(huì)經(jīng)濟(jì)發(fā)展和人民生活水平的提高,人們對(duì)更加精細(xì)、準(zhǔn)確的氣象要素預(yù)報(bào)需求日益增加。近年來,數(shù)值模式分辨率提高、同化方案不斷改進(jìn)[1-3]和要素預(yù)報(bào)質(zhì)量不斷提高[4],為精細(xì)化氣象預(yù)報(bào)提供了基礎(chǔ)[5],但現(xiàn)階段數(shù)值模式的要素預(yù)報(bào)還存在不小的誤差[6-8],特別是丘陵和山地為主的地形復(fù)雜地區(qū)預(yù)報(bào)誤差仍較大[9],還無法滿足精準(zhǔn)化預(yù)報(bào)需求。如何基于數(shù)值模式預(yù)報(bào)制作“定時(shí)、定點(diǎn)、定量”的高時(shí)空分辨率的要素預(yù)報(bào),為社會(huì)公眾提供更精準(zhǔn)預(yù)報(bào),是目前天氣預(yù)報(bào)業(yè)務(wù)發(fā)展的重要研究內(nèi)容之一[10]。
溫度是影響人們生產(chǎn)生活最為重要的氣象要素之一,同時(shí)也是舒適度指數(shù)、大氣臭氧污染預(yù)報(bào)和農(nóng)業(yè)氣象條件等研究的基礎(chǔ)[11-14],因而得到人們的廣泛關(guān)注和研究。為了得到精細(xì)化格點(diǎn)溫度預(yù)報(bào),已有相關(guān)人員研究了基于復(fù)雜地形的空間插值方法并取得了較多成果[15-16]?;谟^測站點(diǎn)的溫度預(yù)報(bào)是精細(xì)化格點(diǎn)預(yù)報(bào)的基礎(chǔ)[17]。如何得到準(zhǔn)確率更高的站點(diǎn)溫度預(yù)報(bào)仍是人們關(guān)注的重點(diǎn)和研究難點(diǎn)。目前,溫度站點(diǎn)預(yù)報(bào)訂正方案常見的有MOS方法和卡爾曼濾波等方法。MOS方法是使用數(shù)值模式要素預(yù)報(bào)通過回歸方程等得到改進(jìn)的要素產(chǎn)品[18];楊松等[19]根據(jù)不同物理量建立回歸模型,去除了模式預(yù)報(bào)的隨機(jī)誤差。卡爾曼濾波法則是利用前一時(shí)刻的預(yù)報(bào)誤差反饋到原來的預(yù)報(bào)方程,并及時(shí)修正預(yù)報(bào)方程系數(shù),以提高下一時(shí)刻的預(yù)報(bào)精度??柭鼮V波法較為適合溫度等連續(xù)變化的氣象要素,已有人將卡爾曼濾波法應(yīng)用于溫度預(yù)報(bào)的滾動(dòng)更新中[17]。在此基礎(chǔ)上,美國環(huán)境預(yù)報(bào)中心(NCEP)提出了一種類卡爾曼濾波法的遞減平均法,應(yīng)用于北美集合預(yù)報(bào)系統(tǒng)中多種空間連續(xù)變化的氣象要素[15]。
此外,也有人通過統(tǒng)計(jì)分析模式要素預(yù)報(bào)誤差,使用觀測資料對(duì)溫度預(yù)報(bào)進(jìn)行訂正[20]。李超等[9]通過使用30 d滑動(dòng)平均誤差對(duì)溫度預(yù)報(bào)進(jìn)行訂正后并使用多模式動(dòng)態(tài)集成(OCF方案),減小了浙江中南部地區(qū)溫度預(yù)報(bào)偏差。亦有研究將滑動(dòng)平均誤差用來延伸期溫度預(yù)報(bào)訂正,并取得較好改進(jìn)效果[21]。王婧等[22]使用平均法、雙權(quán)重平均法、滑動(dòng)平均法和滑動(dòng)雙權(quán)重平均法對(duì)溫度預(yù)報(bào)進(jìn)行偏差訂正,并對(duì)不同訂正方案進(jìn)行對(duì)比。有研究表明,不同類型天氣過程的溫度預(yù)報(bào)誤差特征有著明顯差別[23,24];OCF等訂正方案使用滑動(dòng)平均誤差訂正,無法反映不同天氣過程中溫度預(yù)報(bào)誤差的差異。近年來,機(jī)器學(xué)習(xí)等智能算法快速發(fā)展并應(yīng)用在氣象研究中[25,26]。其中,K-近鄰(KNN)算法是一種簡單的機(jī)器學(xué)習(xí)算法,通過構(gòu)建特征向量選取最接近的訓(xùn)練樣本進(jìn)行分類或回歸。涂小萍等[27]將KNN分類方法應(yīng)用于風(fēng)場預(yù)報(bào)改進(jìn),燕東渭等[28]的研究將KNN應(yīng)用于銅川降雹天氣預(yù)報(bào)中。
浙江省原有精細(xì)化溫度未考慮不同天氣個(gè)例溫度預(yù)報(bào)誤差的差異性,在轉(zhuǎn)折性天氣過程預(yù)報(bào)誤差相對(duì)較大。針對(duì)以上問題,本文根據(jù)溫度變化特征構(gòu)建特征量,使用KNN回歸算法選擇的相似天氣過程進(jìn)行誤差訂正,改進(jìn)浙江省1-72 h溫度預(yù)報(bào),和傳統(tǒng)算法進(jìn)行誤差統(tǒng)計(jì)對(duì)比,并選擇冬季冷空氣活動(dòng)和夏季持續(xù)高溫等典型天氣類型,針對(duì)不同地形的杭州、麗水和舟山站進(jìn)行誤差對(duì)比分析。通過改進(jìn)溫度訂正算法,以期對(duì)不同類型天氣過程提高精細(xì)化溫度預(yù)報(bào)精準(zhǔn)度。
本文使用歐洲中期天氣預(yù)報(bào)中心(ECMWF)的全球數(shù)值模式2016-2018年的1-72 h溫度預(yù)報(bào)和浙江省72個(gè)國家基本站溫度觀測資料,72個(gè)國家基本站分布如圖 1所示。ECMWF模式資料每日08時(shí)和20時(shí)更新,時(shí)間分辨率為3 h,空間分辨率為0.5°×0.5°,使用Coons曲面插值方法[29,30]模擬數(shù)據(jù)到觀測資料對(duì)應(yīng)的72個(gè)國家基本站上。
將需要訂正個(gè)例前的365 d溫度資料作為樣本庫,進(jìn)行分析建模,然后將模型應(yīng)用于溫度預(yù)報(bào)訂正,最后使用平均絕對(duì)誤差RMAE評(píng)估改進(jìn)后的溫度預(yù)報(bào)誤差,平均絕對(duì)誤差定義為
(1)
圖1 浙江省地形分布
由2016-2018年ECMWF模式溫度預(yù)報(bào)及對(duì)應(yīng)的溫度觀測,分別計(jì)算了北京時(shí)20時(shí)起報(bào)(圖2a)和08時(shí)起報(bào)(圖2b)的誤差隨預(yù)報(bào)時(shí)效變化。20時(shí)和08時(shí)起報(bào),ECMWF模式和實(shí)際觀測中溫度都存在明顯的日變化特征,日最高溫度均發(fā)生在14時(shí)附近,日最低溫度發(fā)生在05時(shí)附近。從平均角度看,ECMWF溫度預(yù)報(bào)較觀測偏低。14時(shí)附近的日最高溫度和05時(shí)附近的日最低溫度的預(yù)報(bào)偏低最為明顯,而20時(shí)和08時(shí)模式預(yù)報(bào)和觀測較為接近。從氣候平均角度看,溫度日變化曲線中,20時(shí)的起始溫度和日平均溫度較為接近。溫度日變化曲線表現(xiàn)為以20時(shí)溫度或日平均溫度為軸的準(zhǔn)對(duì)稱分布特點(diǎn)。同樣的ECMWF模式08時(shí)起報(bào)的溫度,也呈現(xiàn)了以08時(shí)起報(bào)溫度或日平均溫度為軸的準(zhǔn)對(duì)稱分布的特點(diǎn)(圖2b),白天的升溫幅度大于夜間的降溫幅度,對(duì)稱性較20時(shí)起報(bào)的(圖2a)略偏弱。
圖2 2016-2018年ECMWF模式20時(shí)(a)和08時(shí)(b)起報(bào)的1-72 h溫度(紅線)和對(duì)應(yīng)的溫度觀測(黑線)平均
由上分析可見,溫度變化表現(xiàn)出明顯的以起報(bào)時(shí)刻的溫度為軸的日變化特征。從逐日角度看,溫度日變化曲線差異性很大,這種差異性由不同的起報(bào)溫度或平均溫度及不同天氣過程中溫度日變化的差異引起,因而可以將起報(bào)時(shí)刻的溫度看作溫度日變化曲線的“背景”進(jìn)行處理。如果將ECMWF模式1-72 h的溫度預(yù)報(bào)減去起報(bào)時(shí)刻的溫度進(jìn)行預(yù)處理,則可以得到溫度的日變化曲線。
經(jīng)過預(yù)處理得到溫度的日變化曲線,可以通過KNN回歸方案對(duì)溫度預(yù)報(bào)進(jìn)行誤差訂正。實(shí)現(xiàn)方案中使用不同溫度日變化曲線之間的距離L作為指標(biāo),選擇歷史相似個(gè)例。溫度日變化曲線之間的距離L定義為
(2)
式(2)中,TM和TN分別為兩個(gè)不同溫度日變化曲線中溫度預(yù)報(bào)值或觀測值,k為模式預(yù)報(bào)步長,n為分析時(shí)段1-72 h內(nèi)總步數(shù)。距離L反映了不同溫度變化曲線的接近程度,L愈小說明兩條溫度變化曲線特征愈接近,L愈大說明兩條溫度變化曲線特征差異愈大。
KNN回歸方案中,20時(shí)和08時(shí)起報(bào)的預(yù)報(bào)分別獨(dú)立進(jìn)行誤差分析和訂正。在需要訂正預(yù)報(bào)個(gè)例之前滑動(dòng)365 d的歷史數(shù)據(jù)作為樣本庫,樣本庫不包含訂正個(gè)例本身,每次訂正過程的樣本庫中有365個(gè)樣本。在365個(gè)歷史樣本庫中選取溫度曲線距離L最小的第一四分位,約為91個(gè)樣本作為相似個(gè)例。使用91個(gè)相似樣本的平均預(yù)報(bào)誤差對(duì)預(yù)報(bào)個(gè)例進(jìn)行訂正。最后對(duì)2017年和2018年訂正后的預(yù)報(bào)結(jié)果分別進(jìn)行誤差分析,以檢驗(yàn)上述方案的溫度預(yù)報(bào)改進(jìn)效果。
李超等[9]研究中使用OCF方案,改進(jìn)了浙江省溫度預(yù)報(bào),特別是對(duì)浙西南地形復(fù)雜地區(qū)的溫度預(yù)報(bào)誤差明顯減小,但該方案并沒有考慮天氣過程的差異性。在此研究基礎(chǔ)上,將KNN回歸方案應(yīng)用于2017-2018年浙江省72個(gè)站點(diǎn)1-72 h溫度預(yù)報(bào),并將KNN方案和ECMWF模式及OCF方案的溫度預(yù)報(bào)誤差進(jìn)行對(duì)比分析(圖3)。圖3(a)和圖3(b)分別給出20時(shí)和08時(shí)起報(bào)的平均絕對(duì)誤差對(duì)比。圖中紅線、橙線和綠線分別是ECMWF預(yù)報(bào)、OCF方案和KNN方案的溫度預(yù)報(bào)平均絕對(duì)誤差。不同方案中預(yù)報(bào)誤差存在明顯的日變化特征。其中,08時(shí)起報(bào)的預(yù)報(bào)誤差(圖3b)較20時(shí)的(圖3a)略偏小。ECMWF模式1-72 h預(yù)報(bào)時(shí)效內(nèi)日最大預(yù)報(bào)誤差均發(fā)生在17時(shí),20時(shí)起報(bào)的日最大預(yù)報(bào)誤差分別為1.86 ℃、1.97 ℃和2.07 ℃;08時(shí)起報(bào)的日最大預(yù)報(bào)誤差分別為1.82 ℃、1.94 ℃和2.02 ℃。經(jīng)過滑動(dòng)偏差訂正后,OCF溫度預(yù)報(bào)誤差明顯減小,1-72 h內(nèi)預(yù)報(bào)平均誤差均小于2.0 ℃,17時(shí)預(yù)報(bào)誤差減小更為明顯,日最大預(yù)報(bào)誤差發(fā)生在14時(shí)附近,20時(shí)起報(bào)的日最大誤差分別為1.41 ℃、1.61 ℃和1.81 ℃,08時(shí)起報(bào)的日最大預(yù)報(bào)誤差分別為1.32 ℃、1.56 ℃和1.73 ℃。和OCF方案對(duì)比,KNN方案中預(yù)報(bào)誤差明顯減小。KNN預(yù)報(bào)誤差也呈現(xiàn)明顯日變化特征,日最大預(yù)報(bào)誤差均出現(xiàn)在14時(shí)附近,20時(shí)起報(bào)的日最大誤差分別為1.31 ℃、1.56 ℃和1.77 ℃,08時(shí)起報(bào)的日最大預(yù)報(bào)誤差分別為1.23 ℃、1.48 ℃和1.68 ℃。
地形是影響溫度預(yù)報(bào)誤差的重要因素之一。對(duì)不同地形的溫度預(yù)報(bào)誤差空間分布表現(xiàn)出明顯的不均勻性[9,15]。ECMWF模式溫度預(yù)報(bào)誤差相對(duì)較大,特別是對(duì)浙西南及沿海地區(qū)的預(yù)報(bào)誤差相對(duì)較大(見李超等[9]中圖2a),全省平均絕對(duì)誤差為1.64 ℃。圖4給出了經(jīng)過OCF方案(圖4a)和KNN方案(圖4b)訂正后溫度預(yù)報(bào)的平均絕對(duì)誤差分布,以及KNN方案和OCF方案溫度預(yù)報(bào)平均絕對(duì)誤差的差值分布(圖4c)。OCF方案預(yù)報(bào)浙江省平均絕對(duì)誤差為1.27 ℃,較ECMWF的明顯減小;OCF方案對(duì)杭州灣和浙西南地區(qū)的預(yù)報(bào)誤差有所減小,但和對(duì)浙北平原地區(qū)的預(yù)報(bào)誤差相比仍明顯偏大(圖4a),這可能是和浙西南等復(fù)雜地形地區(qū)在不同天氣過程中溫度預(yù)報(bào)誤差的差異性有關(guān)的。KNN方案的溫度預(yù)報(bào)誤差較OCF的進(jìn)一步減小,KNN方案的預(yù)報(bào)全省平均絕對(duì)誤差為1.21 ℃,較ECMWF和OCF的分別減小26.2%和5.2%。其中,杭州灣和浙西南地區(qū)的溫度預(yù)報(bào)誤差減小最為明顯,誤差減小幅度在0.1 ℃左右。由KNN方案和OCF方案溫度預(yù)報(bào)絕對(duì)誤差差值分布(圖4c)可見,浙北沿海地區(qū)為正值,其他地區(qū)均為負(fù)值,說明除浙北沿海外,KNN方案較OCF方案表現(xiàn)更好。KNN方案中沿海地區(qū)的溫度預(yù)報(bào)誤差較OCF方案的略有增大,可能是由于沿海地區(qū)溫度變化較為穩(wěn)定,OCF方案適用性更高。
圖4 2017-2018年OCF方案(a)、KNN方案(b)預(yù)報(bào)的1-72 h氣溫平均絕對(duì)誤差及二者差值(c)分布
在預(yù)報(bào)業(yè)務(wù)中,日最高最低溫度是人們關(guān)注的重要對(duì)象。在實(shí)際預(yù)報(bào)工作中,通常將日最高溫度和最低溫度誤差絕對(duì)值小于2 ℃的比例作為預(yù)報(bào)準(zhǔn)確率。統(tǒng)計(jì)的2017年ECMWF模式、OCF方案及KNN方案中的1-72 h日最高溫度和最低溫度預(yù)報(bào)誤差絕對(duì)值小于2 ℃的預(yù)報(bào)準(zhǔn)確率見表 1。由表 1可見,ECMWF模式最高溫度和最低溫度預(yù)報(bào)準(zhǔn)確率相對(duì)較低。OCF方案中的1-24 h、24-48 h和48-72 h最高溫度預(yù)報(bào)準(zhǔn)確率較ECMWF的分別提高14.2%、11.7%和9.5%,平均提高達(dá)到11.8%;三個(gè)時(shí)段最低溫度預(yù)報(bào)準(zhǔn)確率分別提高13.6%、13.1%和11.9%,平均提高幅度為12.9%。KNN方案中最高溫度預(yù)報(bào)準(zhǔn)確率提高明顯,與OCF相比,分別提高3.0%、3.4%和2.6%,平均提高3.0%;最低溫度預(yù)報(bào)準(zhǔn)確率提高較少,三個(gè)預(yù)報(bào)時(shí)段分別提高1.4%、1.6%和1.0%,平均提高1.3%,和ECMWF對(duì)比最高溫度和最低溫度則分別提高14.8%和4.3%。
表1 2017年ECMWF模式、OCF方案及KNN方案中浙江省日最高和最低氣溫預(yù)報(bào)誤差絕對(duì)值小于2 ℃的準(zhǔn)確率
表 2為ECMWF模式、OCF方案,以及KNN方案中2018年日最高溫度和最低溫度預(yù)報(bào)準(zhǔn)確率統(tǒng)計(jì)結(jié)果。由表 2可看出,2018年 ECMWF溫度預(yù)報(bào)準(zhǔn)確率較2017年的偏低。OCF 1-24 h、24-48 h和48-72 h最高溫度預(yù)報(bào)準(zhǔn)確率較ECMWF的分別提高15.7%、13.2%和11.3%,平均幅度達(dá)到13.4%;三個(gè)預(yù)報(bào)時(shí)段最低溫度預(yù)報(bào)準(zhǔn)確率較ECMWF的分別提高15.1%、13.7%和12.4%,平均幅度達(dá)到13.7%。在OCF方案基礎(chǔ)上,KNN方案中最高溫度預(yù)報(bào)準(zhǔn)確率較OCF的進(jìn)一步提高3.4%、2.6%和1.3%,平均幅度達(dá)到2.4%;最低溫度預(yù)報(bào)準(zhǔn)確率分別提高2.1%、2.1%和1.4%,平均幅度達(dá)到1.9%。2017年KNN方案日最高溫度預(yù)報(bào)準(zhǔn)確率較ECMWF和OCF預(yù)報(bào)分別提高15.4%和3.6%,最低溫度分別提高14.2%和8.7%。2018年KNN方案日最高溫度預(yù)報(bào)準(zhǔn)確率較ECMWF和OCF預(yù)報(bào)分別提高15.8%和2.4%,最低溫度分別提高15.6%和1.9%。2018年KNN方案中的日高低溫預(yù)報(bào)準(zhǔn)確率提高幅度和2017年的相近,這說明KNN方案的溫度改進(jìn)效果明顯且較為穩(wěn)定。
表2 2018年ECMWF模式、OCF方案及KNN方案中浙江省日最高和最低氣溫預(yù)報(bào)誤差絕對(duì)值小于2 ℃的準(zhǔn)確率
不同季節(jié)的天氣過程特點(diǎn)差異很大,導(dǎo)致不同季節(jié)的溫度日變化特征,以及預(yù)報(bào)誤差存在較大差異。圖5為ECMWF模式和OCF方案,以及KNN方案中1-72 h日最高溫度預(yù)報(bào)(圖5a)和日最低溫度(圖5b)誤差絕對(duì)值小于2 ℃的預(yù)報(bào)準(zhǔn)確率月際變化。ECMWF模式日最高溫度預(yù)報(bào)準(zhǔn)確率存在明顯的季節(jié)變化特征,日最高溫預(yù)報(bào)準(zhǔn)確率夏季的較其他季節(jié)的偏低(圖5a)。所有月份中KNN方案預(yù)報(bào)準(zhǔn)確率較ECMWF模式和OCF方案的均有一定提高,春季2-4月和秋季10月KNN方案日最高溫預(yù)報(bào)準(zhǔn)確率較OCF的提高較為明顯,可能和浙江省春秋季節(jié)降水和冷空氣過程活動(dòng)較為頻繁有關(guān)。KNN方案是使用相似個(gè)例的平均誤差訂正,在天氣過程頻繁時(shí)較OCF方案更有優(yōu)勢。浙江6月受梅雨帶影響,溫度日變化幅度較小,OCF和KNN的最高溫度預(yù)報(bào)準(zhǔn)確率較為接近;7月出梅后,浙江轉(zhuǎn)受副熱帶高壓控制,溫度日變化較梅汛期時(shí)段的明顯增大,日最高溫度預(yù)報(bào)誤差隨日較差明顯增大。出梅前后,浙江的溫度預(yù)報(bào)誤差特點(diǎn)有明顯不同。OCF方案使用30 d滑動(dòng)平均誤差進(jìn)行訂正,無法反映天氣和環(huán)流特點(diǎn)的快速變化;KNN方案使用歷史相似個(gè)例進(jìn)行訂正,更有優(yōu)勢,7月 KNN方案較OCF方案最高溫度預(yù)報(bào)準(zhǔn)確率提高更為明顯。
ECMWF模式日最低溫預(yù)報(bào)準(zhǔn)確率不同季節(jié)變化差異較小(圖5b),OCF方案和KNN方案中日最低溫度預(yù)報(bào)準(zhǔn)確率各月均有所提高,且提高幅度相對(duì)穩(wěn)定,隨季節(jié)變化不明顯。由上分析可見,KNN方案在日最高溫度預(yù)報(bào)改進(jìn)中更加有優(yōu)勢。
圖5 2017-2018年ECMWF模式(紅色)、OCF方案(橙色)和KNN方案(綠色)1-72 h日最高(a)和最低(b)溫度絕對(duì)誤差小于2 ℃的預(yù)報(bào)準(zhǔn)確率月際分布
從統(tǒng)計(jì)角度看,KNN方案較OCF方案的溫度預(yù)報(bào)有一定提高。選取杭州、麗水和舟山站作為代表站點(diǎn),對(duì)比檢驗(yàn)OCF方案和KNN方案對(duì)冷空氣和持續(xù)高溫等天氣過程中不同地形條件下溫度預(yù)報(bào)情況。2018年1月6-8日冷空氣過程影響浙江,全省溫度均有明顯下降。圖 6(a)-(c)分別給出了此次冷空氣過程中杭州、麗水和舟山站的實(shí)況溫度(黑線),以及ECMWF模式(紅線)、OCF方案(橙線)和KNN方案(綠線)預(yù)報(bào)的溫度變化。杭州、麗水和舟山日實(shí)況最低溫度分別降低了5.5 ℃、7.2 ℃和8.4 ℃。模式ECMWF對(duì)杭州和麗水48-72 h降溫幅度預(yù)報(bào)明顯偏大,8日早上預(yù)報(bào)的最低溫度比觀測值偏低2.9 ℃和3.6 ℃,而對(duì)舟山降溫幅度的預(yù)報(bào)值和觀測值較為接近,誤差僅為0.2 ℃。OCF方案訂正后,8日早上對(duì)杭州和麗水的最低溫度預(yù)報(bào)誤差分別減小了1.7 ℃和1.6 ℃;而對(duì)舟山的預(yù)報(bào)誤差增大了1.7 ℃。經(jīng)過KNN方案訂正,8日早上杭州和麗水的最低溫度預(yù)報(bào)誤差較OCF的分別減小0.5 ℃和0.6 ℃,舟山預(yù)報(bào)誤差較OCF的減小1.3 ℃,但仍比ECMWF的預(yù)報(bào)誤差略偏大。這次冷空氣過程中,KNN方案中除改進(jìn)最低溫度預(yù)報(bào)外,溫度預(yù)報(bào)曲線也較ECMWF和OCF的更接近實(shí)況觀測。
圖6 ECMWF模式(紅線)、OCF方案(橙線)、KNN方案(綠線)2018年1月6日20時(shí)起報(bào)的杭州(a)、麗水(b)及舟山(c)的1-72 h溫度和對(duì)應(yīng)的實(shí)況溫度(黑線)
梅汛期之后,浙江省轉(zhuǎn)受副熱帶高壓控制,以持續(xù)性晴熱高溫天氣為主。為檢驗(yàn)不同方案對(duì)夏季持續(xù)高溫過程中溫度預(yù)報(bào)效果,圖 7(a)-(c)分別給出了2017年7月16-18日杭州、麗水和舟山的實(shí)況溫度(黑線),以及ECMWF模式(紅線)、OCF方案(橙線)和KNN方案(綠線)預(yù)報(bào)的溫度。2017年7月19日浙江全省梅汛期結(jié)束,而17-18日杭州(圖 7a)、麗水(圖 7b)和舟山(圖 7c)日最高溫度已迅速升高,均超過36 ℃。ECMWF預(yù)報(bào)的杭州和麗水日最高最低溫度均較觀測實(shí)況明顯偏低,預(yù)報(bào)的最高溫度偏低尤為明顯,偏差在3 ℃以上;預(yù)報(bào)的舟山日最高溫度也明顯偏低,日最低溫度的預(yù)報(bào)則相對(duì)較好。在OCF方案中,對(duì)杭州、麗水和舟山3站的日最高溫度預(yù)報(bào)相對(duì)ECMWF模式有所改進(jìn)和提高,但仍較觀測值偏低,特別是17-18日預(yù)報(bào)的最高溫度和實(shí)況差距仍較為明顯;對(duì)杭州和麗水的日最低溫度預(yù)報(bào)也有一定改進(jìn),但不如對(duì)最高溫度的預(yù)報(bào)改進(jìn)明顯。經(jīng)過KNN方案訂正后,3個(gè)站的溫度預(yù)報(bào)曲線更接近實(shí)況觀測曲線。KNN方案中,對(duì)杭州和麗水日最高最低溫度的預(yù)報(bào)明顯優(yōu)于ECMWF和OCF方案的預(yù)報(bào);對(duì)舟山的日最高溫度預(yù)報(bào)也有一定改進(jìn),但對(duì)最低溫度的預(yù)報(bào)較OCF方案的誤差略偏大。此外,KNN方案中24-48 h和48-72 h日最高溫度預(yù)報(bào)仍比實(shí)況觀測偏低。
圖7 ECMWF模式(紅線)、OCF方案(橙線)、KNN方案(綠線)2017年7月16日20時(shí)起報(bào)的杭州(a)、麗水(b)及舟山(c)的1-72 h溫度和對(duì)應(yīng)的實(shí)況溫度(黑線)
綜上,OCF方案使用30 d滑動(dòng)平均誤差進(jìn)行訂正,無法反映天氣系統(tǒng)快速變化對(duì)溫度預(yù)報(bào)誤差的影響,而KNN方案通過選取歷史相似個(gè)例進(jìn)行誤差分析,在冬季冷空氣活動(dòng)和夏季高溫天氣等轉(zhuǎn)折天氣過程中預(yù)報(bào)效果優(yōu)于ECMWF和OCF方案的預(yù)報(bào)效果。
之前有較多研究表明,使用30 d滑動(dòng)平均誤差訂正(OCF)方案可以有效減小溫度預(yù)報(bào)誤差[9,20,21]。統(tǒng)計(jì)結(jié)果顯示,OCF方案的溫度預(yù)報(bào)誤差明顯減小。由于OCF方案并未考慮不同天氣個(gè)例溫度預(yù)報(bào)誤差的差異性,因而天氣過程中溫度預(yù)報(bào)誤差仍較大。本文在前人研究基礎(chǔ)上,基于KNN回歸算法,使用歷史相似個(gè)例誤差統(tǒng)計(jì)對(duì)溫度預(yù)報(bào)進(jìn)行訂正,改進(jìn)浙江省1-72 h溫度預(yù)報(bào),并和傳統(tǒng)OCF方案進(jìn)行對(duì)比分析,以及選擇冬季冷空氣活動(dòng)和夏季持續(xù)高溫天氣個(gè)例,檢驗(yàn)ECMWF模式、OCF方案和KNN方案針對(duì)不同地形的杭州、麗水和舟山站的預(yù)報(bào)效果。主要結(jié)論如下:
(1)模式ECMWF溫度預(yù)報(bào)和溫度觀測實(shí)況呈現(xiàn)以起報(bào)時(shí)刻溫度為軸的明顯日變化特征,將溫度減去起報(bào)時(shí)刻溫度得到溫度日變化曲線。通過定義的不同溫度日變化曲線間的距離作為個(gè)例的差異指標(biāo),選取歷史相似個(gè)例,由相似個(gè)例的平均誤差進(jìn)行訂正。
(2)KNN方案溫度預(yù)報(bào)平均絕對(duì)誤差較ECMWF和OCF方案的分別減小26.2%和5.2%;對(duì)日最高溫度和最低溫度預(yù)報(bào)誤差小于2 ℃準(zhǔn)確率較ECMWF預(yù)報(bào)的準(zhǔn)確率分別提高15.3%和14.9%,日最高和最低溫預(yù)報(bào)準(zhǔn)確率較OCF的分別提高5.5%和3.2%。對(duì)2017年和2018年KNN預(yù)報(bào)檢驗(yàn)結(jié)果表明,日最高最低溫度預(yù)報(bào)準(zhǔn)確率提高幅度較為一致,說明KNN方案改進(jìn)效果明顯且預(yù)報(bào)質(zhì)量穩(wěn)定。
(3)傳統(tǒng)OCF方案使用滑動(dòng)平均誤差訂正,并未考慮不同個(gè)例之間的差異。KNN使用相似個(gè)例的誤差統(tǒng)計(jì)特征訂正,考慮了天氣變化個(gè)例之間特征的差異。春秋季節(jié)浙江省天氣過程較為頻繁,KNN方案較OCF方案的改進(jìn)效果較為明顯。在出梅前后,KNN方案較OCF方案可以更快適應(yīng)天氣特點(diǎn)的調(diào)整。和OCF方案對(duì)比,KNN方案在浙西南地形復(fù)雜地區(qū)和杭州灣地區(qū)的溫度預(yù)報(bào)改進(jìn)效果比較明顯。KNN方案在冬季冷空氣活動(dòng)和夏季高溫預(yù)報(bào)等天氣個(gè)例中,較ECMWF和OCF方案的溫度預(yù)報(bào)也有一定改進(jìn)。
本文中使用KNN回歸算法對(duì)溫度預(yù)報(bào)進(jìn)行訂正,較為充分考慮天氣個(gè)例之間的差異,在冷空氣等“轉(zhuǎn)折性”天氣過程中預(yù)報(bào)效果較好,同時(shí)在地形復(fù)雜地區(qū)預(yù)報(bào)效果也較好,因而具有一定的應(yīng)用價(jià)值。但上述方案中溫度曲線之間距離的定義中并未考慮最高溫度、最低溫度和風(fēng)場等要素,在相似個(gè)例選擇上仍有不足,未來可以增加日平均溫度和日平均溫度變化等特征,提高選取相似個(gè)例的準(zhǔn)確率,進(jìn)一步減小預(yù)報(bào)誤差。