丁凱文,張晨晰,陳 宇
(1.山東科技大學(xué)資源學(xué)院,山東 泰安 271019;2.中國礦業(yè)大學(xué)環(huán)境與測繪學(xué)院,江蘇 徐州 221116)
對流層內(nèi)部的水汽約占總大氣含量的4%左右,急劇的三相變化會導(dǎo)致諸如洪澇、臺風(fēng)、寒潮、暴雨等惡劣天氣,對人民生命財產(chǎn)安全造成重大隱患。
傳統(tǒng)探測水汽的方式如無線電探空儀、水汽輻射計等時間分辨率低,無法滿足預(yù)測的時效性。隨著全球衛(wèi)星導(dǎo)航系統(tǒng)(Global Navigation Satellite System,GNSS)應(yīng)用領(lǐng)域的不斷拓展以及其空間分布均勻、全天候、全天時、高精度的優(yōu)勢,利用GNSS預(yù)測地區(qū)可降水量(Precipitable Water Vapor,PWV),對氣象災(zāi)害預(yù)警領(lǐng)域的技術(shù)發(fā)展與研究具有重大推動作用[1]。
對流層延遲(Zenith Tropospheric Delay,ZTD)與大氣加權(quán)平均溫度(Atmospheric Weighted Average Temperature,Tm)是計算大氣可降水量的兩個關(guān)鍵參數(shù),數(shù)十年來,國內(nèi)外許多學(xué)者針對二者進(jìn)行了大量相關(guān)研究[2-3]。ZTD模型根據(jù)是否需要實(shí)測氣象參數(shù)以及建模方法不同,主要劃分為氣象參數(shù)模型與經(jīng)驗(yàn)?zāi)P?;在模型建立方面,繼Bevis等[4]首次提出“GPS(Global Positioning System)氣象學(xué)”的概念,并給出的回歸經(jīng)驗(yàn)?zāi)P秃?,有關(guān)的研究工作大多集中在模型的優(yōu)化上[5-7]。與此同時,國內(nèi)還有學(xué)者在Bevis模型的基礎(chǔ)上建立了區(qū)域模型[8-10],驗(yàn)證精度均較前者有不同程度的提升。
值得關(guān)注的是,以上研究中對流層延遲的獲取大都來自GPS基線解算,且建模方法多基于最小二乘回歸,加之文獻(xiàn)[5]中嚴(yán)密驗(yàn)證了地表溫度與加權(quán)平均溫度存在非線性關(guān)系。綜上,本文主要研究了基于單北斗衛(wèi)星系統(tǒng)(BeiDou Navigation Satellite System,BDS)的精密對流層延遲獲取,并考慮到隨機(jī)森林算法訓(xùn)練速度快、非線性學(xué)習(xí)能力強(qiáng)、不易產(chǎn)生過擬合,以及在缺失某些特征的情況下依舊保證回歸準(zhǔn)確率等優(yōu)勢,建立了香港地區(qū)多因子模型,并在對模型精度進(jìn)行了驗(yàn)證后,預(yù)測了香港地區(qū)2018年7月份可降水量。
地基GNSS反演水汽主要是利用地面上安置好的GNSS接收機(jī),獲取衛(wèi)星信號穿過對流層的延遲量(主要是天頂方向延遲)。ZTD由天頂靜力學(xué)延遲(Zenith Hydrostatic Delay,ZHD)與天頂濕延遲(Zenith Wet Delay,ZWD)兩部分組成,其中ZHD約占對流層總延遲量的90%,性質(zhì)較為穩(wěn)定。本文選擇Saastamoinen模型[11]分離出高精度ZHD分量,其模型計算公式為:
(1)
f(φ,H)=1-0.002 66×cos2φ+0.000 28×H
(2)
式中,δρZHD為天頂靜力學(xué)延遲,Ps為測站壓強(qiáng)(hPa),φ為測站緯度(°),H為測站高程(m)。
天頂濕延遲的影響因素較多,故ZWD的獲取一般由ZTD與ZHD作差得到,即:
ZWD=ZTD-ZHD
(3)
在獲得天頂濕延遲后,該值與氣象轉(zhuǎn)換因子Π相乘即可得到大氣可降水量(PWV),公式表示為:
PWV=ZWD×Π
(4)
其中,轉(zhuǎn)換因子Π為:
(5)
(6)
式中,ei為第i層大氣平均水氣壓(hPa),Ti為第i層大氣平均溫度(K),hi為第i層大氣高度(m)。由于探空數(shù)據(jù)的不連續(xù)性(每天只能獲取兩次),故Tm的計算均采用后一項(xiàng)離散化形式,并視為真值。
使用GAMIT/GLOBK_10.7軟件對吉林長春、北京房山、上海佘山、香港黃石4個IGS站點(diǎn)(測站距離均大于500 km,可減少對流層延遲相關(guān)性,避免引入系統(tǒng)誤差[12])2018年2月5日(年積日036)進(jìn)行基線解算,站點(diǎn)信息如表1所示。
表1 IGS測站及探空站信息
運(yùn)行環(huán)境安裝完成及前期文件準(zhǔn)備就緒后,運(yùn)行解算命令,之后分別對BDS與GPS進(jìn)行單日批處理解算,解算成功后對兩個系統(tǒng)的結(jié)果進(jìn)行3個方面的精度分析。
由于GAMIT/GLOBK軟件采用合網(wǎng)解的方式解算基線向量,所以同步環(huán)閉合差在基線處理完成時已經(jīng)進(jìn)行了分配(同步環(huán)閉合差恒為零)[13]。因此,可將時段基線解算精度指標(biāo)標(biāo)準(zhǔn)化均方根誤差NRMS值作為同步環(huán)優(yōu)劣檢核的指標(biāo),對比結(jié)果如表2所示。
表2 基線解算均方根誤差對比
在8h~12h、12h~16h、16h~20h、20h~24h四個時段BDS基線解算的NRMS值均略低于GPS。一般認(rèn)為,NRMS值在0.12~0.5之間是合理的,在0.25左右為最優(yōu),二者NRMS值均在0.22~0.25之間,符合精度要求。
選擇香港黃石(HKWS)站12h~16h、16h~20h、20h~24h三個時段的衛(wèi)星天空圖進(jìn)行對比,從圖1中可以很明顯的發(fā)現(xiàn),同時段參與解算的BDS衛(wèi)星大致有5~9顆,而GPS衛(wèi)星則均在10顆以上。由于BDS衛(wèi)星數(shù)量受限,空間網(wǎng)型結(jié)構(gòu)稀疏,其基線解算精度在一定程度上受到影響。
圖1 BDS與GPS天空圖對比
由圖2可以看出,BDS衛(wèi)星在高度角45°以下數(shù)據(jù)較GPS衛(wèi)星離散程度較高,前期趨勢線整體略偏離藍(lán)色中線,收斂程度較低,反觀GPS則較為平穩(wěn),這也表明GPS衛(wèi)星數(shù)據(jù)質(zhì)量稍好于BDS衛(wèi)星。
圖2 相位殘差對比
綜上可得,BDS基線解精度與GPS持平,雖參與解算的衛(wèi)星數(shù)量以及相位殘差收斂情況稍遜于GPS,但也保證了利用單一BDS獲取對流層延遲數(shù)據(jù)的可行性與可靠性。
對香港國王公園探空站2016~2018年1、3、5、7、9、11月份探空站數(shù)據(jù)進(jìn)行相關(guān)性分析,驗(yàn)證了Tm與地表溫度Ts、水汽壓es、測站壓強(qiáng)Ps、露點(diǎn)溫度Ds四種氣象因子均高度相關(guān),相關(guān)系數(shù)如表3所示,并在此基礎(chǔ)上建立了Tm單因子與多因子模型。
表3 Tm與Ts、es、Ps、Ds的相關(guān)系數(shù)
3.1.1 基于最小二乘的單因子模型
首先基于最小二乘法建立了香港地區(qū)Tm-Ts、Tm-es、Tm-Ps、Tm-Ds單因子模型,并在此基礎(chǔ)上引入Bevis與LJG經(jīng)驗(yàn)?zāi)P?,模型公式及精度如?所示。
表4 單因子模型分析結(jié)果
由表4可知,基于實(shí)測氣象數(shù)據(jù)的Tm-Ts模型(以下簡稱LTs模型)在所有單因子模型中均方根誤差最小,而對比Bevis與LJG經(jīng)驗(yàn)?zāi)P停進(jìn)AE、RMSE均較大,模型精度稍差。
3.1.2 基于隨機(jī)森林算法的多因子模型
將與Tm具有映射關(guān)系的Ts、es、Ps、Ds作為輸入因子,探空站數(shù)據(jù)離散積分計算得到的Tm視為真值,在Python環(huán)境下構(gòu)建基于隨機(jī)森林算法的RFTm模型,修改模型各參數(shù)配置。其中,樣本數(shù)據(jù)n=1 012,將70%樣本數(shù)據(jù)用于訓(xùn)練,余下30%用于預(yù)測驗(yàn)證;選擇數(shù)據(jù)洗牌,即將樣本數(shù)據(jù)順序打亂再進(jìn)行訓(xùn)練,這樣做可減小數(shù)據(jù)出現(xiàn)過擬合現(xiàn)象。
RFTm模型構(gòu)建結(jié)果如表5所示,模型訓(xùn)練完成后,隨機(jī)取100組Tm預(yù)測值與對應(yīng)真值對比,二者擬合曲線如圖3所示。
表5 隨機(jī)森林多因子模型分析結(jié)果
圖3 數(shù)據(jù)測試預(yù)測圖
結(jié)合表4~5和圖3可以得出,RFTm模型在精度與模型擬合效果上均整體好于單因子模型與經(jīng)驗(yàn)?zāi)P停壕礁`差比LTs模型提升了16.2%,比Bevis模型提升了44.2%,比LJG模型提升了40.9%,并且與Tm的擬合程度超過0.9,進(jìn)一步表明RFTm模型有更為良好的適用性。
利用GAMIT/GLOBK提取得到2018年7月份每日0:00對流層延遲量并采用Bevis模型、LJG模型、LTs模型以及RFTm模型,結(jié)合公式(1)~(5),計算得到PWV預(yù)測值。圖4為各模型預(yù)測PWV對比圖,其中柱狀圖為探空站數(shù)據(jù)計算得到的PWV真值,表6為各模型精度對比。
圖4 RFTm、Bevis、LJG、LTs模型預(yù)測PWV對比分析圖
表6 Bevis、LJG、LTs、RFTm模型預(yù)測PWV精度對比
由表6可知,RFTm模型均方根誤差為1.889 mm,比LTs模型精度提升約20.1%,比Bevis模型提升約25.0%。結(jié)合圖4可以看出,LJG模型出現(xiàn)較大偏差,R2也較低,模型擬合較差。進(jìn)一步對4種模型PWV預(yù)測值的殘差進(jìn)行統(tǒng)計,如圖5所示。
圖5 Bevis、LJG、LTs、RFTm殘差對比圖
由圖5可知,RFTm模型預(yù)測PWV的殘差分布于-3~2 mm之間,最貼近于PWV真值;LTs模型總體在-3~2 mm之間浮動,最小值為-7.402 mm,可能是樣本異常值;Bevis模型殘差總體高于PWV真值,范圍介于-3~7 mm,出現(xiàn)系統(tǒng)偏差;LJG模型精度最低,殘差范圍為-9~13 mm??梢姡趯?shí)測數(shù)據(jù)的本地化LTs模型與基于隨機(jī)森林算法構(gòu)建的RFTm模型皆可穩(wěn)定良好預(yù)測香港地區(qū)大氣可降水量,而傳統(tǒng)的經(jīng)驗(yàn)?zāi)P?Bevis、LJG)則在樣本數(shù)量較少的情況下出現(xiàn)較大誤差。
本文從衛(wèi)星基線解質(zhì)量、衛(wèi)星數(shù)量、信號相位殘差三個維度驗(yàn)證了利用單一北斗衛(wèi)星獲取天頂對流層延遲的精度及進(jìn)行水汽反演的可行性。以地表溫度、水汽壓、測站壓強(qiáng)、露點(diǎn)溫度為輸入?yún)?shù),通過隨機(jī)森林算法構(gòu)建了香港區(qū)域RFTm模型,與各模型精度對比,結(jié)果顯示其精度較本地LTs模型、Bevis經(jīng)驗(yàn)?zāi)P?、LJG模型均有不同程度提升,可以看出Tm預(yù)測精度。利用上述模型分別對香港地區(qū)2018年7月份可降水量進(jìn)行預(yù)測,RFTm模型較LTs模型、Bevis模型與探空站數(shù)據(jù)離散積分得到的Tm真值有更強(qiáng)的一致性。綜上可見,北斗衛(wèi)星系統(tǒng)結(jié)合隨機(jī)森林算法構(gòu)建的RFTm多因子模型具有良好的適用性以及穩(wěn)定性,對預(yù)測大氣可降水量有明顯改善。