王式太,張定紅,殷 敏* ,張博宇,程 波
(1.桂林理工大學(xué) 測(cè)繪地理信息學(xué)院,廣西 桂林 541006;2.廣西空間信息與測(cè)繪重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541006;3.山東省地質(zhì)測(cè)繪院,山東 濟(jì)南 250002)
降雨作為最常見(jiàn)的氣象活動(dòng)之一,對(duì)人們的生產(chǎn)生活產(chǎn)生著重要影響。雖然降雨現(xiàn)象在不同的氣候、區(qū)域和季節(jié)會(huì)表現(xiàn)出一定的差異性[1],但目前一般認(rèn)為降雨是在溫度、氣壓、相對(duì)濕度和大氣可降水量(Precipitable Water Vapor,PWV)等多種要素的綜合影響下發(fā)生,且PWV在很大程度上決定降雨強(qiáng)度[2]。相比探空站、微波輻射計(jì)等傳統(tǒng)PWV測(cè)量手段,全球?qū)Ш蕉ㄎ幌到y(tǒng)(Global Navigation Satellite System,GNSS)反演PWV由于能得到低成本的連續(xù)觀(guān)測(cè)值[3-4],在降雨短臨預(yù)報(bào)中得到了廣泛的應(yīng)用。文獻(xiàn)[5]通過(guò)最小二乘方法擬合GNSS-PWV時(shí)序,通過(guò)分析PWV變化閾值達(dá)到預(yù)報(bào)強(qiáng)降雨的目的,并指出僅使用PWV閾值作為預(yù)報(bào)降雨的方式會(huì)導(dǎo)致誤報(bào)率偏大;文獻(xiàn)[6]通過(guò)對(duì)浙江地區(qū)連續(xù)運(yùn)行參考站數(shù)據(jù)的分析,在不同月份設(shè)定不同PWV閾值作為判斷降雨的條件建立模型,達(dá)到80%降雨準(zhǔn)確預(yù)報(bào)率;神經(jīng)網(wǎng)絡(luò)模型由于能夠擬合復(fù)雜過(guò)程被廣泛應(yīng)用于降雨預(yù)報(bào)[7-9];文獻(xiàn)[10]通過(guò)基于PWV的多種數(shù)據(jù),逐個(gè)月份構(gòu)建多隱層的反向反饋神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)降雨模型,能夠預(yù)報(bào)出95%以上的降雨,并且誤報(bào)率與傳統(tǒng)方法相當(dāng)。
然而在降雨發(fā)生的過(guò)程中,PWV數(shù)值會(huì)產(chǎn)生規(guī)律性變化,基于單個(gè)時(shí)段內(nèi)PWV數(shù)值的降雨預(yù)報(bào)可能會(huì)忽視PWV連續(xù)變化的時(shí)間特性對(duì)于實(shí)際降雨現(xiàn)象的影響。因此,本文提出使用LSTM神經(jīng)網(wǎng)絡(luò)擬合PWV時(shí)序數(shù)據(jù),在顧及時(shí)序變化的基礎(chǔ)上,試圖分析多種氣象要素對(duì)構(gòu)建模型的影響,來(lái)提高模型的預(yù)報(bào)能力;并在不同的時(shí)間尺度下分別構(gòu)建預(yù)報(bào)模型,以評(píng)估模型對(duì)不同時(shí)間尺度降雨信息的敏感性,得到一個(gè)基于局部地區(qū)的最優(yōu)預(yù)報(bào)模型。
由地基GNSS接收文件可解算得到對(duì)流層天頂總延遲(Zenith Total Delay,ZTD),并使用Saastamoinen模型計(jì)算天頂干延遲(Zenith Hydrostatic Delay,ZHD),結(jié)合式(1)、式(2)即可求得天頂濕延遲(Zenith Wet Delay,ZWD)和測(cè)站上空的PWV[11]:
ZWD=ZTD-ZHD,
(1)
(2)
為計(jì)算PWV,還需要得到測(cè)站實(shí)時(shí)的大氣加權(quán)平均溫度(Tm),Tm真實(shí)值是由測(cè)站上空水汽壓和絕對(duì)溫度沿天頂方向積分計(jì)算,整理可以得到如下形式:
(3)
式中,T為地表溫度;e為水氣壓;dH中的H為位勢(shì)高度;Δhi表示第i層大氣的高度差,n表示層數(shù);Ti和ei分別表示第i層大氣的平均溫度和水汽壓數(shù)值[12-14]。
水汽壓為:
(4)
式中,es為飽和水汽壓;Td為大氣溫度;RH為大氣濕度。
使用探空站計(jì)算的Tm時(shí)間間隔為12 h,因此需要擬合Tm模型,用于解算逐小時(shí)觀(guān)測(cè)的GNSS數(shù)據(jù)[15-16]。
由于在實(shí)際的氣象活動(dòng)中降雨發(fā)生的時(shí)刻遠(yuǎn)少于不發(fā)生降雨的時(shí)刻,因此選取降雨較為頻繁的海南省??谑凶鳛檠芯繀^(qū)域,減弱神經(jīng)網(wǎng)絡(luò)訓(xùn)練中過(guò)擬合現(xiàn)象。2015—2017年??谔娇照镜腡s和Tm的如圖1所示。
圖1 ??谡綯s和Tm散點(diǎn)Fig.1 Scatter plot of Ts and Tm at Haikou station
從圖1中的散點(diǎn)分布可知,Ts和Tm存在明顯正相關(guān)的線(xiàn)性關(guān)系,利用最小二乘法擬合Ts和Tm,得到的Tm模型:
Tm=109.24+0.60×Ts。
(5)
將Tm模型應(yīng)用于??陉憫B(tài)網(wǎng)站點(diǎn),結(jié)合式(1)和式(2)即可獲取1 h分辨率的高精度PWV序列。
使用2015—2017年??陉憫B(tài)網(wǎng)站點(diǎn)的觀(guān)測(cè)數(shù)據(jù),分4個(gè)季節(jié)驗(yàn)證單個(gè)PWV數(shù)值對(duì)于降雨的影響。將同一季節(jié)所有降雨發(fā)生時(shí)刻前一小時(shí)PWV的均值作為閾值條件判斷是否降雨,當(dāng)PWV數(shù)值大于閾值時(shí)判定為發(fā)生降雨,使用閾值重新判斷未發(fā)生降雨的歷元,當(dāng)未發(fā)生降雨歷元的PWV大于閾值時(shí),即認(rèn)定為誤報(bào)降雨,以誤報(bào)降雨的歷元和實(shí)際不降雨的歷元的比值作為評(píng)價(jià)標(biāo)準(zhǔn),當(dāng)其數(shù)值越小則表明PWV數(shù)值對(duì)降雨的影響越大。結(jié)果如表1所示。
表1 PWV預(yù)報(bào)降雨方法的錯(cuò)誤預(yù)警率Tab.1 Error warning rate of PWV rainfall forecasting method
由表1可以看出,在不同季節(jié),PWV數(shù)值存在較大差異,如在2—4月中降雨P(guān)WV均值為36.29 mm,在8—10月中降雨P(guān)WV均值為60.34 mm,因此,在分析PWV對(duì)于降雨的影響時(shí)需要分季節(jié)驗(yàn)證。使用PWV閾值方法總體的錯(cuò)誤預(yù)警率為28.3%,此種統(tǒng)計(jì)方法還未算入實(shí)際發(fā)生降雨,但PWV小于閾值被錯(cuò)誤判斷為不降雨的現(xiàn)象,因此僅僅使用單個(gè)PWV數(shù)值作為判斷是否降雨的依據(jù)缺乏可靠性。
通過(guò)構(gòu)建4個(gè)不同季節(jié)降雨過(guò)程中PWV和降雨量的時(shí)序?qū)Ρ龋醪椒治鯬WV變化特征與實(shí)際降雨發(fā)生時(shí)間的關(guān)系,PWV和實(shí)際降雨的時(shí)序?qū)Ρ热鐖D2所示。
由圖2可知,在降雨發(fā)生前一定時(shí)間內(nèi)PWV會(huì)迅速增加,表現(xiàn)出峰值,在峰值出現(xiàn)后的一定時(shí)間內(nèi)發(fā)生降雨,當(dāng)降雨實(shí)際發(fā)生時(shí)PWV會(huì)由于冷凝現(xiàn)象減少,而且PWV的降低會(huì)隨著降雨持續(xù)時(shí)間和降雨強(qiáng)度的增加表現(xiàn)出更大的幅度,如年積日為11的降雨現(xiàn)象中,由于降雨的持續(xù)時(shí)間近36 h,導(dǎo)致PWV數(shù)值在此時(shí)間段內(nèi)表現(xiàn)出持續(xù)的降低。整體而言,PWV在降雨發(fā)生時(shí)伴隨著降低的趨勢(shì),且PWV數(shù)值的減小先于降雨發(fā)生,因此利用PWV與降雨的負(fù)相關(guān)關(guān)系來(lái)預(yù)報(bào)降雨具備可行性。
(a) 年積日
(b) 年積日
(c) 年積日
(d) 年積日?qǐng)D2 2015年P(guān)WV和逐小時(shí)降雨量的時(shí)序?qū)Ρ菷ig.2 Time series comparison of PWV and hourly rainfall in 2015
為了驗(yàn)證PWV出現(xiàn)峰值與發(fā)生降雨的確切關(guān)系,通過(guò)延長(zhǎng)對(duì)比時(shí)間構(gòu)建PWV逐小時(shí)的變化量與實(shí)際降雨量的時(shí)序?qū)Ρ龋鐖D3所示。
(a) 年積日
(b) 年積日
(c) 年積日
(d) 年積日?qǐng)D3 2015年P(guān)WV逐小時(shí)變化值和逐小時(shí)降雨量的時(shí)序?qū)Ρ菷ig.3 Time series comparison of hourly variation of PWV and hourly rainfall in 2015
當(dāng)降雨發(fā)生前一定時(shí)間內(nèi)PWV變化值存在一個(gè)迅速增加,繼而迅速減小的過(guò)程,但是當(dāng)實(shí)際無(wú)降雨發(fā)生時(shí)PWV也會(huì)因?yàn)榇髿饣顒?dòng)(如大氣環(huán)流)而出現(xiàn)類(lèi)似的波狀起伏。雖然無(wú)降雨發(fā)生時(shí)PWV波動(dòng)相比于強(qiáng)降雨時(shí)的PWV波動(dòng)幅度較小,但仍會(huì)對(duì)普通降雨產(chǎn)生干擾。這一結(jié)論表明,降雨現(xiàn)象作為一個(gè)復(fù)雜的大氣演變結(jié)果,PWV單一數(shù)值難以準(zhǔn)確預(yù)報(bào)降雨,因此在LSTM降雨短臨預(yù)報(bào)模型的構(gòu)建中還應(yīng)加入地面溫度、地面氣壓、大氣濕度、PWV變化值等其他參數(shù)輸入,以達(dá)到提高預(yù)報(bào)降雨準(zhǔn)確率的目的。
LSTM是一種計(jì)算時(shí)間序列的神經(jīng)網(wǎng)絡(luò),通過(guò)對(duì)存在時(shí)序特征的數(shù)據(jù)樣本訓(xùn)練,能夠達(dá)到對(duì)數(shù)據(jù)擬合和預(yù)測(cè)的目的[17]。LSTM神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)為一個(gè)指定長(zhǎng)度的時(shí)序信息,相鄰時(shí)間步的隱含層分別計(jì)算權(quán)重,具備前后時(shí)間相連的特點(diǎn);在模型回歸過(guò)程中通過(guò)忘記門(mén)機(jī)制抑制梯度消失,從而更好地收斂;LSTM還具備記憶性,能夠匹配時(shí)序數(shù)據(jù)長(zhǎng)期特征的同時(shí)顧及短周期的變化特征,這一擬合機(jī)理與實(shí)際降雨現(xiàn)象的季節(jié)性周期變化具有類(lèi)似的特點(diǎn)。
實(shí)驗(yàn)中地面溫度、地面氣壓、大氣濕度3種數(shù)據(jù)從氣象站獲取,由于海口氣象站和??陉憫B(tài)網(wǎng)站點(diǎn)高度不同,使用氣溫垂直插值公式和氣壓垂直插值公式[18]將溫度和氣壓歸算至陸態(tài)網(wǎng)站點(diǎn)同一高度,PWV變化值通過(guò)2個(gè)相鄰的時(shí)刻數(shù)值相減得出,逐小時(shí)降雨量采用氣象站觀(guān)測(cè)數(shù)據(jù)。
對(duì)數(shù)據(jù)的預(yù)處理包括剔除存在數(shù)據(jù)缺失的序列,并且由于LSTM模型需要輸入連續(xù)12個(gè)時(shí)刻的觀(guān)測(cè)值,所以對(duì)于存在空缺值的時(shí)序數(shù)據(jù)都需要剔除,避免錯(cuò)誤數(shù)據(jù)對(duì)模型產(chǎn)生干擾。
以??陉憫B(tài)網(wǎng)站點(diǎn)2015—2016年的觀(guān)測(cè)數(shù)據(jù)作為訓(xùn)練樣本,通過(guò)輸入連續(xù)12個(gè)時(shí)序的地面氣壓、地面溫度、大氣濕度、PWV和PWV變化值5種參數(shù)訓(xùn)練模型,用2017年的數(shù)據(jù)作為測(cè)試集,檢驗(yàn)LSTM神經(jīng)網(wǎng)絡(luò)模型短臨預(yù)報(bào)降雨的能力,最終的數(shù)據(jù)樣本數(shù)量如表2所示。
表2 數(shù)據(jù)樣本量Tab.2 Data sample size
用準(zhǔn)確率(True Detection,TD)和誤報(bào)率(False Alarm,FA)兩個(gè)參數(shù)來(lái)評(píng)估LSTM模型預(yù)報(bào)降雨的可靠性、穩(wěn)定性,其計(jì)算方法如式(6)和式(7)所示。其中錯(cuò)誤預(yù)報(bào)降雨次數(shù)指實(shí)際沒(méi)有發(fā)生降雨,但模型預(yù)報(bào)該時(shí)段發(fā)生降雨的次數(shù);錯(cuò)誤預(yù)報(bào)不降雨次數(shù)指實(shí)際發(fā)生降雨,但模型預(yù)報(bào)該時(shí)段不發(fā)生降雨的次數(shù),即:
(6)
(7)
通過(guò)控制變量的方法依次剔除地面溫度、地面氣壓、大氣濕度和PWV變化值訓(xùn)練短臨降雨預(yù)報(bào)模型,以全部5種數(shù)據(jù)輸入的樣本訓(xùn)練作為對(duì)比,比較分別缺失4種數(shù)據(jù)對(duì)于LSTM模型構(gòu)建短臨降雨預(yù)報(bào)的影響,訓(xùn)練中均已1~2 h尺度內(nèi)是否降雨作為預(yù)測(cè)結(jié)果,預(yù)報(bào)降雨的能力如圖4所示。
圖4 不同氣象數(shù)據(jù)對(duì)降雨預(yù)報(bào)的影響Fig.4 Influence of different meteorological data on rainfall forecast
由圖4可知,氣壓、地面溫度、PWV變化值和大氣濕度均能一定程度上提升LSTM模型短臨預(yù)報(bào)降雨的能力。其中地面溫度對(duì)于模型的改善較弱,在準(zhǔn)確率和誤報(bào)率基本相同的情況下僅能略微提升降雨預(yù)報(bào)率;PWV變化值和大氣濕度均能明顯增加準(zhǔn)確率;氣壓的加入能全面提升預(yù)報(bào)能力。因此將地面溫度、地面氣壓、大氣濕度、PWV變化值和PWV五種數(shù)據(jù)作為訓(xùn)練樣本的輸入?yún)?shù)能提高模型的可靠性。
為了探究海口地區(qū)LSTM網(wǎng)絡(luò)模型對(duì)于預(yù)報(bào)降雨的最佳預(yù)警時(shí)間,在以相同的輸入數(shù)據(jù)的前提下,分別以輸入時(shí)序的1~2 h內(nèi)是否降雨、1~3 h內(nèi)是否降雨、1~4 h內(nèi)是否降雨、1~5 h內(nèi)是否降雨、1~6 h內(nèi)是否降雨一共5種時(shí)間尺度的預(yù)報(bào)作為訓(xùn)練結(jié)果,比較不同時(shí)間尺度預(yù)報(bào)對(duì)應(yīng)的準(zhǔn)確率、誤報(bào)率以及準(zhǔn)確預(yù)報(bào)降雨次數(shù),從而得出最佳的預(yù)報(bào)時(shí)間。訓(xùn)練模型的準(zhǔn)確率、誤報(bào)率、準(zhǔn)確預(yù)報(bào)降雨次數(shù)和降雨預(yù)報(bào)率如表3所示。
表3 不同時(shí)間尺度預(yù)報(bào)對(duì)應(yīng)的TD和FATab.3 TD and FA corresponding to different forecast time scales
從表3中可知,使用LSTM預(yù)報(bào)降雨,其平均準(zhǔn)確率為66.8%,略?xún)?yōu)于傳統(tǒng)方法63%的準(zhǔn)確率;平均誤報(bào)率為10.7%,相較于傳統(tǒng)方法36%有較大改善,但總體準(zhǔn)確預(yù)報(bào)目標(biāo)區(qū)域降雨的比例偏低,約37.4%,分析其原因可能為熱帶氣候的水汽變化迅速,具備一定混沌性,LSTM模型在訓(xùn)練過(guò)程中存在部分過(guò)擬合現(xiàn)象。從表中可知針對(duì)??诘貐^(qū)的LSTM神經(jīng)網(wǎng)絡(luò)短臨預(yù)報(bào)降雨模型,當(dāng)預(yù)報(bào)時(shí)間設(shè)為1~6 h的情況下,其總體預(yù)報(bào)能力最優(yōu),準(zhǔn)確率65.8%與傳統(tǒng)方法相當(dāng),誤報(bào)率為7.8%,能夠準(zhǔn)確預(yù)報(bào)47.3%的降雨;設(shè)置預(yù)報(bào)時(shí)間為1~5 h的情況下,預(yù)報(bào)能力次優(yōu),準(zhǔn)確率和誤報(bào)率都有所改善,能夠預(yù)報(bào)31.3%的降雨;當(dāng)設(shè)置預(yù)報(bào)時(shí)間為1~2 h的情況下,準(zhǔn)確率達(dá)到最大值67.5%,同時(shí)維持較低的誤報(bào)率,但只能預(yù)報(bào)25.1%的降雨;1~4 h預(yù)報(bào)時(shí)間到得的模型各項(xiàng)指數(shù)都比較均衡;1~3 h預(yù)報(bào)時(shí)間的模型整體性能最差。
通過(guò)對(duì)比不同時(shí)間尺度對(duì)應(yīng)的準(zhǔn)確率和誤報(bào)率可知,1~6 h預(yù)報(bào)時(shí)間訓(xùn)練得出的模型整體預(yù)報(bào)降雨性能最優(yōu),1~5 h的預(yù)報(bào)模型性能較優(yōu)。
本文構(gòu)建了基于多氣象參數(shù)的連續(xù)12個(gè)時(shí)序數(shù)據(jù)輸入的LSTM神經(jīng)網(wǎng)絡(luò)降雨短臨預(yù)報(bào)模型,結(jié)論如下:
① 通過(guò)分析不同季節(jié)降雨發(fā)生過(guò)程中PWV的變化特性,均發(fā)現(xiàn)PWV在目標(biāo)區(qū)域具有較為明顯的引導(dǎo)降雨作用,在降雨發(fā)生前約1~6 h PWV呈現(xiàn)規(guī)律性升高,表現(xiàn)出峰值,其中峰值突出越明顯則預(yù)示著實(shí)際降雨量越大,使用PWV作為預(yù)報(bào)降雨的參數(shù)具備可行性。并且相比使用單個(gè)時(shí)刻的PWV數(shù)值預(yù)測(cè)降雨,一個(gè)連續(xù)時(shí)序的PWV數(shù)據(jù)預(yù)測(cè)降雨具有更優(yōu)的可靠性。
② 地面溫度、地面氣壓、大氣濕度和PWV變化值均能增加模型可靠性,使用連續(xù)12個(gè)時(shí)間序列的地面溫度、地面氣壓、大氣濕度、PWV和PWV變化值作為L(zhǎng)STM模型輸入?yún)?shù),以預(yù)測(cè)時(shí)段內(nèi)是否發(fā)生降雨作為訓(xùn)練結(jié)果,得到的所有模型的平均準(zhǔn)確率和平均誤報(bào)率2個(gè)參數(shù)分別優(yōu)于傳統(tǒng)閾值方法約5%和25%。通過(guò)設(shè)置不同的預(yù)警時(shí)間進(jìn)行訓(xùn)練,最終得出針對(duì)目標(biāo)區(qū)域1~6 h的預(yù)警的整體預(yù)報(bào)能力最優(yōu),1~5 h預(yù)報(bào)能力次優(yōu),整體誤報(bào)率下降顯著。