楊 飛,郭際明,陳 明,章 迪
1. 中國礦業(yè)大學(北京)地球科學與測繪工程學院,北京 100083; 2. 武漢大學測繪學院,湖北 武漢 430079; 3. 國家基礎地理信息中心, 北京 100830
隨著GPS氣象學概念的提出[1],學者們一直致力于開發(fā)和改進基于GNSS反演大氣可降水量的方法,這使得GNSS成為一種高效、可靠的水汽遙感技術,它具有全天時、全天候、連續(xù)運行、低成本、高分辨率及高精度等優(yōu)點[2-5]。在獲取大氣可降水量PWV時,需要將天頂濕延遲乘以轉換因子,它是加權平均溫度Tm的一個函數(shù)[6]。因此,準確計算Tm是GNSS獲取高精度大氣可降水量的關鍵。Tm是測站上空的溫度和濕度廓線沿著天頂方向的數(shù)值積分,可以通過無線電探空、大氣再分析資料精確計算。然而,全球探空測站分布稀疏,空間分辨率難以滿足GNSS氣象學需求;大氣再分析資料的時間分辨率較低且通常每月更新一次;難以滿足實時/近實時Tm計算的要求[7-8]。
文獻[1]收集了位于27°N~65°N之間的13個美國探空測站數(shù)據(jù)并對8718個探空剖面進行分析,發(fā)現(xiàn)Tm與地表溫度Ts存在很好的線性關系,建立了Bevis公式,成為當前使用最為廣泛的Tm線性回歸模型。雖然Ts的地理和季節(jié)變化可以反映出Tm的地理和季節(jié)變化,但基于北美探空數(shù)據(jù)建立的Bevis公式往往存在區(qū)域性的精度差異。因此,學者們進行了大量研究來建立Tm和Ts的區(qū)域線性回歸模型[9-14]。此外,只須測站位置和時間信息的經(jīng)驗模型逐漸成為Tm計算的主要方法。文獻[15]利用2005—2009年全球135個探空測站數(shù)據(jù),基于全球氣壓和溫度(GPT)模型構建了GWMT模型,并通過優(yōu)化建模方法和改善建模源數(shù)據(jù)提出了一系列改善模型,如GTm-Ⅱ、GTm-Ⅲ、GWMT-Ⅳ、GTM-X及GWMT-D[16-20]。文獻[21]考慮了緯度和海拔變化,利用滑動窗口算法建立了GGTm模型。文獻[22]提出了考慮線性趨勢、年變化、半年變化及空間變化的GTrop模型。此外,經(jīng)驗對流層模型GPT3和UNB3m同樣可以提供Tm估值[23-24]。由于開源、易操作、網(wǎng)格分辨率及精度高且可以提供其他對流層參數(shù),GPT3模型成為當前使用最為廣泛的Tm經(jīng)驗模型。
研究表明Tm經(jīng)驗模型精度往往低于Tm回歸模型[25-27]。為了提高經(jīng)驗模型估計Tm的精度,本文提出一種Tm經(jīng)驗模型的精化方法,它引入地面氣溫數(shù)據(jù)并通過最小二乘方法快速獲取精化系數(shù),達到對Tm的誤差補償作用。相較基于機器學習等精化方法,本文方法計算公式簡便,可以快速推廣至任意Tm經(jīng)驗模型,達到模型精化的目的,對改善GNSS水汽反演精度有重要的現(xiàn)實意義。
加權平均溫度Tm是由測站上空的水汽壓和氣溫在天頂方向的數(shù)值積分計算得到的,文獻[28—29]給出了Tm的定義及精確計算Tm的方法
(1)
式中,T是大氣溫度,單位為K;e是水汽壓,單位為hPa;z為測站上空的垂直高度,單位為m。在常規(guī)的探空數(shù)據(jù)資料中,上述氣象參數(shù)及高程信息均不是連續(xù)值,往往以高度分層的形式存儲。因此,式(1)的離散化形式常用于Tm的精確計算
(2)
式中,下標i代表第i層的氣象參數(shù)信息。
Bevis模型是基于美國13個無線電探空站2 a的觀測資料,共8712條探空廓線建立起來的Tm與Ts線性回歸模型
Tm=70.2+0.72·Ts
(3)
基于10 a的ECMWF再分析資料的37個氣壓層月平均數(shù)據(jù),文獻[23]提出了GPT3模型。作為GPT系列模型的最新版本,GPT3模型可以提供全球范圍內(nèi)1°×1°格網(wǎng)點上加權平均溫度的平均值、年周期和半年周期變化。依據(jù)測站位置和時間信息,可以利用式(4)快速獲取其Tm估值
(4)
式中,A0表示模型格網(wǎng)點Tm的平均值;A1和B1表示模型格網(wǎng)點Tm的年振幅;A2和B2表示其半年振幅。
由于GPT3模型的建模源是月平均數(shù)據(jù),其模型只包含年和半年周期項,缺乏表示Tm隨高程變化的Tm遞減率參數(shù),其精度往往受到限制。通過對實測Tm與GPT3估計Tm的差異和實測Ts與GPT3估計Ts的差異進行分析,其線性相關系數(shù)達到了0.62,如圖1所示(使用第2節(jié)試驗中的數(shù)據(jù))。因此,本文提出一種GPT3模型估計Tm的精化方法,它將地面氣溫數(shù)據(jù)引入并利用最小二乘獲取精化系數(shù)。具體地,該精化模型如式(5)所示
Tm=TmGPT3+M·(Ts-TsGPT3)
(5)
式中,Tm和Ts分別為加權平均溫度真值和地表溫度真值;TmGPT3和TsGPT3分別表示由GPT3模型估計得到的加權平均溫度和地表溫度;M表示實測地表溫度和模型估計地表溫度差異的權值,即精化模型的精化系數(shù),可以通過最小二乘擬合得到。
圖1 Tm差異與Ts差異示意圖(實測值與GPT3估值)Fig.1 The diagram of Tm differences and Ts differences (measured values and GPT3 estimates)
本文選擇2011—2015年我國與鄰近區(qū)域的探空站點資料,以及對應的地面氣象資料進行GPT3模型區(qū)域精化。探空數(shù)據(jù)分辨率為12 h,即每天固定在UTC 0:00和UTC 12:00。探空剖面包括了不同高度的氣壓、溫度等氣象信息。為了計算準確的Tm,需對探空剖面信息進行嚴格的質量控制,只有滿足以下條件的剖面數(shù)據(jù)才可以用式(2)計算Tm[26]:①探空數(shù)據(jù)中最后一個有效記錄的高度不低于10 km;②探空數(shù)據(jù)中有效的觀測值數(shù)量不少于20個;③兩個連續(xù)高度層之間的高差應不超過1 km;④任何兩個連續(xù)高度層的氣壓差值不大于200 hPa。
經(jīng)過質量控制,本文選取我國及鄰近區(qū)域180個探空測站,其范圍為0°N~65°N,60°E~145°E,如圖2所示。圖2(a)表示用于模型精化的130個探空測站的分布情況。通過GPT3模型,利用雙線性內(nèi)插算法并考慮測站與模型格網(wǎng)點高程差異,可以獲取這些測站的Tm和Ts估值[23]。聯(lián)合探空測站數(shù)據(jù)獲取的精確加權平均溫度和地表溫度,便可利用式(5)擬合得到本文中模型精化系數(shù)M=0.47,構建基于GPT3的精化模型。圖2(b)表示用于模型精度檢驗的50個探空測站分布。
圖2 研究區(qū)域及測站分布Fig.2 The map of the research area and the distribution of the sites
為了驗證所提精化模型的優(yōu)勢,本文還利用上述130個探空測站的地面氣溫和加權平均溫度信息,基于Beivs模型的思路,構建了上述研究區(qū)域的Tm-Ts線性模型。區(qū)域線性模型表達為Tm=53.45+0.78·Ts。因此,本文比較了4種模型在我國及鄰近區(qū)域估計Tm的精度。它們分別為Bevis模型、區(qū)域線性模型、GPT3模型和基于GPT3的精化模型。本文選取3個統(tǒng)計量,即均方根誤差(RMSE)、平均絕對誤差(MAE)及相關系數(shù)(R)作為標準來比較和評價4種模型估計Tm的精度。
利用上述4種模型,分別計算50個驗證測站2011—2015年不同時刻的Tm,共141 110個數(shù)據(jù)。將探空剖面信息計算的相應時刻Tm作為參考值,繪制了散點圖,如圖3所示。圖中虛線表示1∶1的直線,直線表示模型Tm估值與Tm真值的線性擬合直線。可以發(fā)現(xiàn),基于GPT3的精化模型表現(xiàn)優(yōu)于其他3種模型,其點分布在擬合線附近的密度高于其他模型,且其斜率達到了0.93。相較于Bevis模型,區(qū)域線性模型的點位分布密度沒有明顯差別,但其擬合斜率得到有效改善,說明構建局部區(qū)域Tm-Ts線性模型可以提高Tm估計精度。注意到GPT3模型估計的Tm有明顯的界限(圖中方框位置),即無論真實Tm值變得多小或多大,GPT3估計的Tm值總為243 K或290 K左右。而基于GPT3的精化模型較好地解決了這一問題,使其可以準確估計任何范圍的Tm值。
圖3 4種模型Tm估計值與Tm真值的散點圖Fig.3 The scatter plots of the estimated Tm against the true Tm with four models
此外,利用4種模型估計Tm的殘差計算了它們各自的MAE和RMSE,不同模型估計Tm與Tm真值的相關系數(shù)R也被統(tǒng)計,并列于表1。GPT3模型表現(xiàn)最差,其MAE、RMSE和R分別為3.43 K、4.46 K和0.94。基于GPT3的精化模型不僅有效改善了GPT3模型的精度,也優(yōu)于基于Tm-Ts線性關系的區(qū)域模型的精度。相較于其他3種模型,基于GPT3的精化模型對MAE和RMSE的改善量分別達到了0.53、0.68、0.38 K和0.68、0.94、0.55 K。
表1 4種模型估計Tm殘差的統(tǒng)計
為了分析4種模型在不同區(qū)域估計Tm的表現(xiàn),計算并統(tǒng)計了每種模型在每1個驗證測站估計Tm與Tm真值的殘差。圖4展示了4種模型估計Tm在各個測站RMSE的空間分布。可以看到,4種模型估計Tm的精度都會受到緯度的影響,即隨著緯度的增大精度變差。Bevis模型、GPT3模型和區(qū)域線性模型在中高緯度地區(qū)估計Tm的精度都較差,甚至出現(xiàn)大量RMSE>6 K的測站。受限于GPT3模型本身在中高緯度較差的表現(xiàn)及Tm在中高緯度區(qū)域的變化和波動較大,基于GPT3的精化模型估計Tm的精度也存在緯度上的差異。但是,依然可以看到基于GPT3的精化模型顯著改善了其在中高緯度區(qū)域估計Tm的精度,其對Tm精度的改善率與其他區(qū)域是一致的。另外,基于GPT3的精化模型在其他緯度區(qū)域測站的表現(xiàn)同樣優(yōu)于其他3種模型。
圖4 4種模型估計Tm的RMSE在不同測站空間分布Fig.4 The spatial distribution of RMSE at each site for the four models
表2統(tǒng)計了4種模型在不同測站估計Tm的MAE和RMSE,包括最大值、最小值和平均值??梢钥吹?,MAE和RMSE的最大數(shù)值都出現(xiàn)在Bevis模型,說明Bevis模型難以服務于全球或大區(qū)域的Tm估計,在某些測站會出現(xiàn)較大誤差。注意到GPT3模型RMSE和MAE的最大值和最小值都小于Bevis模型和區(qū)域線性模型的相應統(tǒng)計量。這表明該測站的Tm變化與建立的整個區(qū)域Tm-Ts線性關系不符,需要更加具體、范圍更小的區(qū)域線性模型。而基于GPT3的精化模型的所有統(tǒng)計量都是4種模型中最小的,其中MAE和RMSE的平均值分別為2.71 K和3.44 K,改善量分別達到了17.1%、20.1%、13.1%和16.7%、20.7%、13.4%。
表2 4種模型在不同測站的精度統(tǒng)計
為了分析4種模型估計不同時刻Tm的精度情況,本文計算并統(tǒng)計了2011—2015年不同模型在每天的RMSE,其時間序列如圖5所示??梢钥吹?,4種模型的RMSE表現(xiàn)出明顯的周期性,在冬季總體較大,夏季較小。這是由于Tm本身季節(jié)幅度的差異造成,冬季Tm幅度大,往往會使得Tm建模結果變差,導致較大的RMSE?;贕PT3的精化模型得到的RMSE時間序列明顯優(yōu)于其他3種模型,幾乎每天都可獲得最小的RMSE。進一步,表3詳細給出了不同模型在4個季節(jié)估計Tm的RMSE??梢钥吹剑贕PT3的精化模型在不同季節(jié)的RMSE分別為3.83、3.01、3.69、4.06 K,相較于GPT3模型,不同季節(jié)的改善量分別達到1.07、0.87、0.85、0.85 K。
表3 4種模型在不同季節(jié)估計Tm的RMSE
圖5 4種模型在不同時刻的RMSE序列Fig.5 The RMSE of the four models at different days
為了更好地理解精化模型對于GPT3模型精度改善的原因,圖6繪制了GPT3模型和基于GPT3的精化模型在不同測站估計Tm的時間序列,且將Tm真值的時間序列作為參考。圖6選取了6個不同區(qū)域的測站,這些測站經(jīng)質量控制后Tm觀測值的數(shù)量較多??梢钥吹?,在每1個測站,GPT3模型估計的Tm都是一條平滑的周期曲線,只能表現(xiàn)出Tm的季節(jié)性變化。而基于GPT3的精化模型在這些測站可以模擬出更復雜的Tm變化,表現(xiàn)出Tm在短時間內(nèi)的波動和突變,與探空得到的Tm真值具有更好的一致性。
本文提出一種Tm經(jīng)驗模型精化方法,引入地面氣溫數(shù)據(jù)并通過最小二乘方法快速獲取精化系數(shù),達到對Tm的誤差補償作用。其計算公式簡便,可以快速推廣至任意Tm經(jīng)驗模型。
基于我國及周邊地區(qū)180個探空測站,本文開展了區(qū)域GPT3模型精化試驗和分析。驗證結果表明,所提出的基于GPT3的精化模型估計Tm的MAE、RMSE和R分別為2.75 K、3.52 K、0.97,有效改善了GPT3模型的精度,改善量分別為19.9%、21.1%、3.2%;且比基于Tm-Ts關系的Bevis模型和區(qū)域線性模型精度要高。此外,空間分布分析表明,基于GPT3的精化模型可以改善傳統(tǒng)Tm模型受到緯度的影響,顯著提高高緯度區(qū)域Tm估計精度;時間序列分析表明基于GPT3的精化模型在不同年積日都可以獲得最好的Tm估計,且可以有效解決GPT3模型只能表現(xiàn)Tm季節(jié)性變化的缺陷。因此,本文提出的Tm經(jīng)驗模型精化方法可以應用到GPT3模型估計Tm的快速精化中,也可以進一步推廣至其他Tm經(jīng)驗模型的精化工作中。
圖6 模型估計的Tm和探空Tm在不同測站的時間序列Fig.6 The Tm time series estimated from the two models and radiosonde observations at different sites