王瑩 張曉鵬 劉文軍
摘要 利用德國氣象局(German Bureau of Meteorology,GBM)全球中期數(shù)值天氣預報產(chǎn)品、日本氣象廳(Japan Meteorological Agency,JMA)全球中期數(shù)值天氣預報產(chǎn)品和中國國家氣象中心T639數(shù)值預報產(chǎn)品3個子模式,采用偏最小二乘回歸(partiaI least square regression,PLS)方法、超級集成(multi-model superensemble,SUP)方法和消除偏差集成平均(bias-removed ensemble mean,BREM)方法對比試驗,建立2012—2013年冬季東亞區(qū)域(15°~70°N、90°~145°E)的地面氣溫多模式集成預報模型,并進行2014年冬季24~72 h預報時效的地面溫度的多模式集成預報研究。為進一步驗證集成方法的性能是否具備穩(wěn)定性,以2014年2月1—9日發(fā)生的寒潮天氣過程為個例進行檢驗分析。結果表明,多模式集成預報模型能夠綜合子模式優(yōu)點,預報效果明顯好于3個子模式,且PLS方法優(yōu)于SUP、BREM集成方法。
關鍵詞 多模式集成預報;溫度預報;偏最小二乘回歸方法;超級集成方法;消除偏差集成平均方法
中圖分類號 P 457文獻標識碼 A
文章編號 0517-6611(2020)23-0247-04
doi:10.3969/j.issn.0517-6611.2020.23.065
Multimodel Consensus Forecast Test of Temperature Based on Partial Least Square Regression Method in East Asia
WANG Ying1,ZHANG Xiao-peng2,LIU Wen-jun2
(1.Emergency Warning Information Release Center of Haidian District,Beijing 100080;2.Beijing Haidian District Meteorological Bureau, Beijing 100080)
Abstract Based on the consensu forecasting data of German Bureau of Meteorology(GBM),Japan Meteorological Administration(JMA) and the T639 numerical prediction products of China Meteorological Administration(CMA),using the method and comparing which was partial least square regression (PLS) with multi-model superconsensu(SUP) and bias-removed ensemble mean(BREM), the surface air temperature of 2012-2013 consensus forecast system was developed over 15°-70°N,90°-145°E. The multi-model integrated forecast of the ground temperature of the 24-72 h forecast time in the winter of 2014 was studied.In order to further verify whether the performance of the integrated method was stable, the cold wave weather process that occurred on February 1-9, 2014 was taken as an example for verification and analysis.The results showed that the multi-mode integrated forecast model could integrate the advantages of the sub-models, and the forecast effect was significantly better than the three sub-models, and the PLS method was better than the SUP and BREM integrated methods.
Key words Multimodel consensus forecast;Temperature forecast;PLS method;SUP method;BREM method
隨著我國氣象事業(yè)的發(fā)展和業(yè)務預報準確率的提升,預報員逐漸發(fā)現(xiàn)各家產(chǎn)品的初始場都存在著單一性和不確定性,歐洲中心模式、日本模式、德國模式、T639模式等多家產(chǎn)品現(xiàn)已投入業(yè)務釋用,但是對我國天氣形勢以及要素的預報分析存在著較大差異,預報員試圖通過每日檢驗各家模式找距平來訂正預報結果,顯然,模式的多樣性并沒有給預報員帶來可信度,反而增加了原有的工作量;既然各家產(chǎn)品各有優(yōu)點,可以考慮提供一種相對更為穩(wěn)定的客觀預報模式——多模式集成預報。這個方法最初是由Krishnamurti[1]于1999年提出,對其進行了大量的試驗檢驗,表明其預報效果遠優(yōu)于子模式和多模式集合平均[2]方法。杜振彩等[3]給出集成模式的2種收斂方法:一是給各模式相同的權重;二是基于模式貢獻賦模式不同的權重,模擬貢獻越好,賦的權重越高。趙聲蓉[4]利用BP神經(jīng)網(wǎng)絡方法對2 m高溫度進行了多模式集合,集合效果明顯優(yōu)于3個子模式。智協(xié)飛等[5-8]提出滑動訓練期超級集合方法預報北半球地面氣溫,結果表明超級集合預報在短期預報中要優(yōu)于最好的子模式的結果,隨著預報時效的延長,預報準確率下降。
1983年由Wold等[9]提出了偏最小二乘回歸(partiaI least sguare regression,PLS)方法。舒守娟等[10]將PLS方法應用到我國區(qū)域氣溫空間分布的建模中,分析表明,該方法能夠準確地擬合我國實際氣溫的空間分布,具有一定的價值。近年來,PLS方法已應用于氣象要素的預報中,其優(yōu)越性已得到顯現(xiàn)。PLS方法是一種新型的多元統(tǒng)計數(shù)據(jù)分析方法,在解決多重相關性問題上,可很好地達到目的(與嶺回歸法、主成分回歸法一樣),同時,PLS方法可以通過使用比自變量個數(shù)少很多的主成分來降低回歸方程建模的維度。針對3個多重相關性相對嚴重的子模式降水數(shù)據(jù),很多集成方法去掉多重相關變量的做法不可取,常會舍棄本應保留的系統(tǒng)信息,增大模型的解釋誤差,導致作出錯誤決策的風險不斷加大,而PLS方法在回歸建模中提取所有自變量的主成分,通過交叉有效性檢驗,合理地確定引入?yún)⒓咏5闹鞒煞謧€數(shù)以保證PLS模型預報精度。結果表明,在不同預報時效下,PLS集成模型在晴雨預報、不同降水量級的空報率、小雨預報效果上比超級集成(multi-model superensemble,SUP)模型、消除偏差集成平均(bias-removed ensemble mean,BREM)模型和任意子模式均要優(yōu)異,并通過個例驗證,該集成方法給預報員作出確定性預報結果提供一定參考。
該研究對德國氣象局(German Bureau of Meteorology,GBM)全球中期數(shù)值天氣預報產(chǎn)品、日本氣象廳(Japan Meteorological Agency,JMA)全球中期數(shù)值天氣預報產(chǎn)品和中國國家氣象中心T639數(shù)值預報產(chǎn)品3個子模式數(shù)值中心2014年冬季(12月—次年2月)東亞區(qū)域(15°~70°N,90°~145°E)的地面氣溫預報進行多模式集成預報試驗,比較PLS方法與SUP、BREM這2種集成方法、3個子模式的預報效果,PLS集成方法較其他集成模型和任意子模式的優(yōu)異性,并通過個例驗證集成方法的性能是否具備穩(wěn)定性。
1 資料與方法
1.1 數(shù)據(jù)選取 資料選自德國氣象局(GBM)全球中期數(shù)值天氣預報產(chǎn)品(分辨率為1.5°×1.5°)、日本氣象廳(JMA)全球中期數(shù)值天氣預報產(chǎn)品(分辨率為2.5°×2.5°)和中國國家氣象中心T639數(shù)值預報產(chǎn)品(分辨率為0.562 5°×0.562 5°)3個子模式逐日20:00起報的地面氣溫預報資料。資料時間長度為2012—2014年冬季(12月—次年2月),并采用NCEP 再分析觀測資料T62(Gaussian grid with 192×94 points)觀測值進行多模式集成建模與檢驗預報效果。因此,可把資料分成2個階段:訓練集(2012—2013年冬季)和試報集(2014年冬季),其中,寒潮天氣過程試驗數(shù)據(jù)長度為2014年2月1—9日。因子模式和觀測資料的水平分辨率不同,用雙線性插值法將數(shù)據(jù)統(tǒng)一插值到2.5°×2.5°的網(wǎng)格點上。研究范圍為東亞區(qū)域(15°~70°N、90°~145°E);預報時效為24~72 h,時效間隔為24 h。
1.2 分析方法
1.2.1 PLS基本算法[11-12]。第一步:對p個自變量X=(X1,X2,…,Xp)=
xn1…xnp和因變量Y=y1y2yn觀測了n組數(shù)據(jù),然后對原始數(shù)據(jù)進行標準化處理,記F0、E0為因變量Y和自變量X的標準化變量和矩陣。第二步:從X中提取綜合變量t1=Xw1=w11x1+w12x2+…+w1pxp。第三步:實施E0在t1上的回歸以及F0在t1上的回歸,即:E0=t1p1+E1、F0=t1r1+F1,其中,E1、F1分別是E0和F0的殘差矩陣。 第四步:以殘差矩陣E1和F1代替E0和F0,采用提取t1同樣的方法,進行綜合變量t2的提取,如此循環(huán)往復,直到提取了h個綜合變量t1、t2、…、th,并利用交叉有效性檢驗[6]確定h的值。最終得出PLS模型:
1.2.2 SUP方法[2,5-8]。對于在一個給定的格點上,SUP預報某一氣象要素有如下方程:
式中,St為超級集成預報值,O為訓練集實況值的平均,F(xiàn)i,t為第i個子模式的t時刻的預報值,F(xiàn)i為第i個模式在訓練集的預報值平均,t為時間,N為參與超級集成的模式數(shù),ai 為權重系數(shù)(Ni=1ai=1),Ei為各子模式誤差的倒數(shù)。
1.2.3 BREM方法[13-14]。BREM方法的計算公式如下:
式中,St為消除偏差集成預報值,O為訓練集實況值的平均,F(xiàn)i為第i個模式預報值,F(xiàn)i為第i個模式在訓練集的預報值平均,N為參與集成的模式數(shù)。
1.3 預報模型的建立
1.3.1 PLS模型的建立。第一步:選取2012—2013年冬季東亞區(qū)域3個子模式的地面氣溫資料和NCEP數(shù)據(jù)作為建模樣本,選取3個子模式的預報結果作為3個因子。第二步:先對樣本進行標準化處理,再采用PLS方法提取樣本的第一個成分,并求出交叉有效性檢驗Q21。第三步:如果Q21≥0.097 5,引進新的主成分對預報方程的能力有改善作用,則重復第二步運算;反之,求解主成分循環(huán)過程結束。第四步:確定提取主成分的個數(shù)后,求出各子模式的權重系數(shù),確定預報方程。第五步:將2014年冬季數(shù)值預報產(chǎn)品代入預報方程中,得到試報結果,計算預報均方根誤差和距平相關系數(shù)。
該方法聚集了回歸建模、主成分分析以及兩組變量間的典型相關分析于一體。利用模式和NCEP數(shù)據(jù)的標準化時間序列、逐格點求解子模式的權重,其中部分網(wǎng)格點(40°~45°N、115°~120°E區(qū)域內自南向北、自西向東9個格點,分辨率2.5°×2.5°)的權重在表1中給出,對集成結果進行最大程度地優(yōu)化模擬。
1.3.2 SUP模型的建立。在SUP方法中,權重是預估未來天氣的方法可靠性的重要影響因素。該方法分成3步:首先在訓練集樣本的標準化時間序列上求得權重系數(shù);其次檢驗集成方法的擬合效果;最后驗證模型的穩(wěn)定性。其中部分網(wǎng)格點(同表1)的權重系數(shù)在表2中給出。在BREM模型中,由于子模式取相同權重系數(shù)(1/N),故BREM模型的建立不再贅述。
2 2014年冬季東亞區(qū)域地面氣溫集成預報
2.1 集成預報與子模式預報的總體分析
基于GBM、JMA、T639這3個子模式中心地面氣溫數(shù)據(jù)資料,預報時效為24~72 h(間隔24 h),訓練集長度分別為166、166、163 d,試報集長度分別為86、85、86 d,以同期NCEP再分析資料作為觀測值,進行多模式集成預報試驗。
從2014年冬季東亞區(qū)域預報時效為24~72 h(間隔24 h)的 GBM、JMA、T639、BREM、SUP和PLS方法的地面氣溫預報的區(qū)域平均均方根誤差(圖1)可以看出,3個子模式預報結果中,JMA的預報結果較差,其預報的均方根誤差遠大于其余2個子模式的誤差,而T639的預報結果相對較好。在試報集,SUP方法均方根誤差略低于3個子模式的誤差,BREM方法的誤差低于SUP方法,PLS方法效果最好。隨著預報時效的延長,3種集成方法的誤差略變大,但幅度很小。
從2014年冬季東亞區(qū)域各子模式預報結果、集成預報結果與NCEP觀測值的距平相關系數(shù)(圖2)可以看出,對于24~72 h預報,多模式集成的結果均好于子模式的結果,且集成結果相對任何一個中心的模式都要穩(wěn)定,其中PLS效果最優(yōu),BREM較好于SUP;對24 h預報時效的地面氣溫,子模式
2.2 集成預報的誤差區(qū)域分布特征
為進一步分析多模式集成預報方法對地面氣溫地理分布的預報能力,對多模式集成的結果進行了均方根誤差和距平相關系數(shù)的分析。選取
2014年2月1—9日寒潮天氣過程,分析該過程的24 h預報誤差。圖3給出試報集為9 d的地面氣溫24 h平均均方根誤差的地理分布,BREM在東亞區(qū)域的誤差大部分在0.35~5.58? ℃,其誤差分布的大值區(qū)位于鄂霍次克海北部,誤差最大值為11? ℃,區(qū)域平均均方根誤差為2.72? ℃,與NCEP資料的距平相關系數(shù)為0.81;SUP在中國范圍內的誤差大部分在0.5~6.0? ℃,其誤差分布的大值區(qū)位于俄羅斯東北部,誤差大部分在5.0~10.0? ℃,區(qū)域平均均方根誤差為3.62? ℃,與NCEP資料的距平相關系數(shù)為0.52;PLS在整個東亞區(qū)域的均方根誤差范圍明顯縮小,誤差分布大值區(qū)也位于鄂霍次克海北部,最大誤差達11? ℃,其他區(qū)域誤差在1~3? ℃,預報誤差相對較小,東亞區(qū)域平均均方根誤差為2.38? ℃,與NCEP資料的距平相關系數(shù)為0.81。BREM、PLS和SUP方法對不同區(qū)域的預報存在一些差異,但是預報效果均不理想的鄂霍次克海北部地區(qū),預報效果并無明顯改善,SUP方法在該區(qū)域預報效果相對較好,但是在整個東亞區(qū)域的預報效果誤差大于BREM、PLS方法。可見PLS方法預報效果最優(yōu),能明顯降低整個區(qū)域的誤差。
由于誤差大值中心(鄂霍次克海北部地區(qū))的改進效果較差,將3個子模式的結果與圖3進行比較,GBM、JMA模式誤差大值區(qū)在俄羅斯東北部,T639模式誤差大值區(qū)在鄂霍次克海北部地區(qū),不存在數(shù)據(jù)問題,可見,存在誤差具有合理性,分析資料樣本較短可能是引起誤差的一個方面,同時實況觀測資料的直接使用,而沒有進行一定的質量控制是引起誤差的另一個重要方面,還需要針對不同區(qū)域的具體情況進一步分析提高預報效果的有效方法。
2.3 集成預報對寒潮天氣過程預報能力分析
2014年冬季影響我國的冷空氣勢力不強,我國大部分地區(qū)的氣溫較常年同期偏高, 但是從2月2日起,一股冷空氣的到來改變了這種天氣格局,中央氣象臺1日晚間發(fā)布了2014年首個寒潮藍色預警。圖4所選9個格點范圍包括中國的內蒙古自治區(qū)中東部、河北省北部、遼寧省西部以及北京市,由于冷空氣勢力較強,可以看出,2日地面氣溫降幅達9.60? ℃,3日地面氣溫繼續(xù)下降,低至-14.84 ℃,雖然4日氣溫有所回升,但是這股較強冷空氣將繼續(xù)東移南下,伴隨著大風天氣,影響我國其他城市。
基于2012—2013年冬季東亞區(qū)域的24 h預報時效數(shù)據(jù)(166 d)為訓練樣本,選取部分網(wǎng)格點(同表1),得出2014年2月1—9日的地面氣溫集成預報平均值。如圖4所示,PLS預報寒潮效果優(yōu)于BREM和SUP方法,與NCEP觀測數(shù)據(jù)的樣本平均誤差約為1.31 ℃,集成預報結果與NCEP數(shù)據(jù)的均方誤差小于允許的誤差范圍(按氣象評分規(guī)則,溫度誤差在±2 ℃之內為正確),試驗達到了一定的預報精度。
3 結論與討論
利用2012—2013年GBM、JMA和T639 3個子模式數(shù)值預報產(chǎn)品,采用PLS方法、SUP方法和BREM方法,建立了3個東亞區(qū)域的冬季地面氣溫多模式集成模型,并利用2014年冬季資料,對模型的短期預報性能進行了試驗,所得結論如下:
(1)多模式集成子模式里,T639的預報效果最優(yōu),JMA的預報效果較差;在3個集成方法中,PLS方法誤差最小,效果最優(yōu),BREM方法的均方根誤差低于SUP方法,效果次之。隨著預報時效的延長,3種集成方法的誤差略有變大,但是集成結果比任何一個子模式都要穩(wěn)定,集成后的距平相關系數(shù)平均達到0.9以上。
(2)對于24 h地面氣溫預報,3個集成方法對地面氣溫區(qū)域分布的預報能力存在差異,PLS和BREM方法對誤差大值區(qū)(鄂霍次克海北部地區(qū))的改進效果有待提高,但對于東亞大部分區(qū)域的預報結果有一定的改進,具有一定的參考價值。同時, PLS方法對預報結果的改進程度大于BREM和SUP方法。
(3)對于寒潮天氣過程,3種集成方法對于東亞區(qū)域24 h 地面氣溫的預報在允許的誤差范圍內,PLS集成預報寒潮極端天氣過程效果優(yōu)于BREM和SUP集成方法,試驗基本達到了預期的效果。
參考文獻