殷美祥,羅瑞婷,陳榮泉,劉顯通
(1. 廣東省氣象服務(wù)中心,廣東 廣州 510641;2. 廣東省突發(fā)事件預(yù)警信息發(fā)布中心,廣東 廣州 510641;3. 肇慶市氣象局,廣東 肇慶 526000;4. 中國(guó)氣象局廣州熱帶海洋氣象研究所,廣東 廣州 510641)
大氣能見度是表征大氣透明程度的重要物理量,是基本氣象觀測(cè)項(xiàng)目之一。大氣能見度受到水汽、降水、霧霾、風(fēng)等的影響,其變化具有復(fù)雜的非線性和局地性特征,因此其精細(xì)化預(yù)報(bào)業(yè)務(wù)仍是氣象預(yù)報(bào)業(yè)務(wù)中最具挑戰(zhàn)的領(lǐng)域之一[1-4]。雷州半島地區(qū)三面環(huán)海,是全國(guó)沿海地區(qū)四大海霧高發(fā)區(qū)域之一。湛江港是我國(guó)沿海主要港口之一,是“一帶一路”倡議的戰(zhàn)略支點(diǎn)港和西南沿海港口群的龍頭港。冬春季雷州半島常因低能見度事件導(dǎo)致港口航線停航,甚至導(dǎo)致海上交通事故,對(duì)港口生產(chǎn)和港口經(jīng)濟(jì)造成巨大損失。為了保證海上交通安全,減少低能見度天氣下的災(zāi)害發(fā)生,亟需提高雷州半島沿岸能見度短臨預(yù)報(bào)能力[5-7]。
目前能見度預(yù)報(bào)主要是采用天氣學(xué)診斷方法、傳統(tǒng)統(tǒng)計(jì)方法和數(shù)值預(yù)報(bào)方法[8-11]。孫連強(qiáng)等[12]采用常規(guī)氣象觀測(cè)資料和衛(wèi)星資料,研究了丹東附近海域海霧的變化規(guī)律和條件,研發(fā)了基于天氣學(xué)預(yù)報(bào)方法的海霧預(yù)報(bào)方法。黃輝軍等[13]基于海洋氣象觀測(cè)數(shù)據(jù),分析海霧液態(tài)含水量的演變特征及其同期的天氣學(xué)背景,表明更大范圍的均壓場(chǎng),小的低空和地面風(fēng)速,弱不穩(wěn)定狀態(tài)的低層大氣,高濕度的近地層更容易造成海霧過(guò)程中低能見度的出現(xiàn)。王燕濱等[14]在對(duì)朝連島海區(qū)海霧天氣學(xué)特征總結(jié)后,建立海霧預(yù)報(bào)方程,用主成分分析方法對(duì)霧日數(shù)進(jìn)行外延預(yù)報(bào),其趨勢(shì)預(yù)報(bào)準(zhǔn)確率達(dá)到85%。高榮珍等[15]采用青島地面觀測(cè)資料和FNL 再分析資料,利用分類與回歸樹方法構(gòu)建青島沿海海霧決策樹預(yù)報(bào)模型,結(jié)果表明72 h內(nèi)海霧預(yù)報(bào)準(zhǔn)確率達(dá)到70%~75%,可基本滿足常規(guī)業(yè)務(wù)預(yù)報(bào)需求。黃輝軍等[16]采用NCEP 再分析氣象資料、臺(tái)站觀測(cè)資料和海霧野外試驗(yàn)的觀測(cè)資料建立預(yù)報(bào)變量因子,利用GRAPES 模式得到變量因子,選取湛江、珠海、汕頭3 站為代表,構(gòu)建24 h 的廣東沿海海霧判別預(yù)報(bào),檢驗(yàn)表明該海霧MOS 判別預(yù)報(bào)方法預(yù)報(bào)準(zhǔn)確率為84%~90%。饒莉娟[17]基于WRF(Weather Research and Forecasting)模式,研究其不同邊界層方案對(duì)黃海海霧的模擬效果,選取2次典型的海霧個(gè)例作為研究對(duì)象,利用衛(wèi)星反演數(shù)據(jù)、再分析數(shù)據(jù)與常規(guī)觀測(cè)數(shù)據(jù),詳細(xì)分析海霧演變特征、海霧天氣形勢(shì)與邊界層特征,對(duì)比分析不同參數(shù)方案對(duì)海霧的模擬效果。史得道等[18]采用WRF 中尺度數(shù)值模式,基于循環(huán)三維變分?jǐn)?shù)據(jù)同化方案,構(gòu)建渤海海霧數(shù)值預(yù)報(bào)系統(tǒng),經(jīng)過(guò)20次海霧過(guò)程統(tǒng)計(jì)檢驗(yàn),預(yù)報(bào)準(zhǔn)確率達(dá)到60%。崔馳瀟等[19]利用WRF模式耦合不同閉合方式邊界層參數(shù)化方案,對(duì)江蘇地區(qū)的一次平流霧過(guò)程進(jìn)行數(shù)值模擬,對(duì)比分析模擬結(jié)果與實(shí)測(cè)氣象數(shù)據(jù),評(píng)估了他們對(duì)此次平流霧模擬效果,分析邊界層高度對(duì)此次平流霧的生成和發(fā)展的影響。姜昊宇等[20]利用WRF 模式,利用SLAB 方案與Noah 方案2 種陸面方案,對(duì)一次陸地霧和一次海霧個(gè)例進(jìn)行模擬并進(jìn)行對(duì)比分析,探究模擬效果迥異的原因。但是天氣診斷方法需要大量人力成本,且難以做好精細(xì)化預(yù)報(bào)。線性回歸、逐步回歸等傳統(tǒng)統(tǒng)計(jì)方法對(duì)能見度復(fù)雜非線性特征處理能力不足,難以達(dá)到精度的要求。海霧數(shù)值預(yù)報(bào)模式近年來(lái)取得了良好的業(yè)務(wù)應(yīng)用效果,受到初始場(chǎng)限制和運(yùn)算時(shí)間成本影響,難以根據(jù)實(shí)況進(jìn)行快速運(yùn)行迭代。
近年來(lái),機(jī)器學(xué)習(xí)在霧天氣和大氣能見度預(yù)報(bào)等方面表現(xiàn)出了顯著優(yōu)勢(shì)[21]。機(jī)器學(xué)習(xí)在理論上能以任意小的誤差來(lái)近似任意的連續(xù)函數(shù),能夠根據(jù)大量的氣象觀測(cè)數(shù)據(jù)學(xué)習(xí)出能見度規(guī)律的數(shù)學(xué)表示[22-24],從而實(shí)現(xiàn)對(duì)能見度預(yù)測(cè)。相比傳統(tǒng)的能見度預(yù)報(bào)數(shù)學(xué)模型,基于機(jī)器學(xué)習(xí)技術(shù)的能見度預(yù)測(cè)模型能根據(jù)氣溫、氣壓、風(fēng)力和相對(duì)濕度等氣象觀測(cè)數(shù)據(jù)學(xué)習(xí)出特征表示,并學(xué)出氣象觀測(cè)數(shù)據(jù)與能見度的映射函數(shù),從而應(yīng)對(duì)了天氣的瞬變性。韓婷婷[25]利用卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)結(jié)合構(gòu)建大霧短臨預(yù)測(cè)模型,通過(guò)實(shí)驗(yàn)確定預(yù)測(cè)模型的最優(yōu)參數(shù),并證明了預(yù)測(cè)模型的有效性。鄭成[26]基于時(shí)間卷積網(wǎng)絡(luò)與遷移學(xué)習(xí)提出了一種能見度預(yù)報(bào)方法,先對(duì)源域能見度數(shù)據(jù)進(jìn)行學(xué)習(xí),優(yōu)化模型參數(shù),再對(duì)目標(biāo)域的小數(shù)據(jù)集進(jìn)行學(xué)習(xí),證明了在小數(shù)據(jù)集條件下,遷移學(xué)習(xí)能夠提升模型的預(yù)報(bào)性能。趙亞[27]利用深度學(xué)習(xí)構(gòu)建預(yù)測(cè)能見度模型,并與傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)對(duì)比,證明了深度學(xué)習(xí)模型預(yù)測(cè)能見度的效果要比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)效果更好。
因氣象觀測(cè)數(shù)據(jù)少、能見度局地特征強(qiáng)、氣象條件復(fù)雜多變等問題,目前基于深度學(xué)習(xí)的近海岸能見度預(yù)報(bào)研究不多。李昕蓓等[28]利用福州氣象觀測(cè)站地面觀測(cè)數(shù)據(jù),基于循環(huán)神經(jīng)網(wǎng)絡(luò)建立了福州單站能見度短臨預(yù)報(bào)模型。檢驗(yàn)表明,相比傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)能見度預(yù)報(bào)具有優(yōu)勢(shì),其平均絕對(duì)值誤差比傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)減小12.90%。胡海川等[29]基于BP 神經(jīng)網(wǎng)絡(luò)方法,利用地面常規(guī)氣象觀測(cè)數(shù)據(jù)及NCEP 再分析資料,構(gòu)建環(huán)渤海沿海城市能見度預(yù)報(bào)模型,檢驗(yàn)表明該方法對(duì)低能見度天氣過(guò)程的能見度預(yù)報(bào)具有指示意義。可見,在雷州半島地區(qū)基于深度學(xué)習(xí)的近海岸能見度預(yù)報(bào)研究幾乎是空白的。本文以湛江市國(guó)家基本氣象站作為主要參考站,將GRU神經(jīng)網(wǎng)絡(luò)應(yīng)用于雷州半島近海岸能見度短臨預(yù)報(bào)模型構(gòu)建,研究不同的模型結(jié)構(gòu)對(duì)雷州半島近海岸能見度的短臨預(yù)報(bào)能力。
本研究使用的數(shù)據(jù)包括廣東省湛江、遂溪、吳川、雷州國(guó)家氣象觀測(cè)站(圖1)2017 年1 月1 日—2020 年12 月31 日(北京時(shí)間,下同)氣象觀測(cè)歷史數(shù)據(jù)。以上氣象觀測(cè)站每5 min采集一次數(shù)據(jù),氣象要素包括1 min 平均能見度、5 cm 地溫、草面平均溫度、小時(shí)內(nèi)最高地表溫度、小時(shí)內(nèi)最低地表溫度、氣溫、相對(duì)濕度、海平面氣壓、蒸發(fā)、水汽壓、地表溫度、露點(diǎn)溫度、過(guò)去12 h 極大瞬時(shí)風(fēng)速、過(guò)去3 h降水量、24 h變溫、10 min平均風(fēng)速等。
圖1 雷州半島沿岸代表站點(diǎn)分布
初始數(shù)據(jù)集在部分時(shí)段存在缺失值,本研究利用拉格朗日插值方法[30]對(duì)缺失值進(jìn)行處理,形成完整的能見度實(shí)況數(shù)據(jù)集,共421 091 組數(shù)據(jù)。由于能見度實(shí)況數(shù)據(jù)與各變量的數(shù)據(jù)范圍不同,為了減少誤差,提高深度學(xué)習(xí)訓(xùn)練的速度,對(duì)能見度實(shí)況數(shù)據(jù)集各變量進(jìn)行標(biāo)準(zhǔn)化(公式(1))處理,將各變量的值縮放至0~1區(qū)間內(nèi),
式中,X為某一氣象因子原始值,Xmin表示其最小值,Xmax表示其最大值,X'表示X歸一化后的值。完成歸一標(biāo)準(zhǔn)化后,把能見度實(shí)況數(shù)據(jù)集按照7:3劃分為訓(xùn)練集和測(cè)試集,其中訓(xùn)練集294 763組數(shù)據(jù),測(cè)試集126 328組數(shù)據(jù)。利用前24 h的數(shù)據(jù)預(yù)報(bào)未來(lái)1 h 的能見度,形成適合訓(xùn)練GRU 模型的輸入數(shù)據(jù)。為了保證測(cè)試樣本的獨(dú)立性,將測(cè)試樣本進(jìn)行隨機(jī)排序。
為了保證輸入預(yù)報(bào)模型的因子具有統(tǒng)計(jì)學(xué)意義,對(duì)能見度實(shí)況數(shù)據(jù)集進(jìn)行person 相關(guān)性分析,p值設(shè)為0.05,如公式(2)所示,
其中,Xi為某一氣象因子的第i個(gè)時(shí)間節(jié)點(diǎn)對(duì)應(yīng)的數(shù)值為某一氣象因子的平均值,Yi為第i個(gè)時(shí)間節(jié)點(diǎn)能見度值為能見度平均值,R為計(jì)算得到的相關(guān)系數(shù)。
能見度降低的主要因素是大氣中懸浮粒子對(duì)可見光的散射和吸收造成的。除了大氣污染物外,氣象要素會(huì)通過(guò)直接或間接方式影響能見度的變化。將湛江站能見度與同時(shí)刻的各氣象因子進(jìn)行相關(guān)分析,研究其相互關(guān)系及影響機(jī)理,挑選出相關(guān)系數(shù)較大的22個(gè)因子,其p值都小于0.05,均具有統(tǒng)計(jì)學(xué)意義。
水汽主要是通過(guò)兩種方式來(lái)影響能見度,一是本身對(duì)可見光的散射和吸收,二是使邊界層中吸濕性氣溶膠吸收更多水分,增加氣溶膠的散射截面,改變氣溶膠的光學(xué)性質(zhì),造成能見度降低。上述影響機(jī)理同樣可解釋相對(duì)濕度、水汽壓、溫度露點(diǎn)差等氣象要素和能見度的關(guān)系。
邊界層溫度場(chǎng)通過(guò)影響大氣層結(jié)穩(wěn)定性,影響大氣懸浮粒子的聚集或者散射,從而間接影響能見度的變化。
穩(wěn)定的氣壓場(chǎng),有利于邊界層中氣溶膠和水汽的聚集,從而降低能見度,反之不穩(wěn)定的氣壓場(chǎng)容易提高能見度。
風(fēng)對(duì)能見度的影響比較復(fù)雜,風(fēng)速較低時(shí),大氣顆粒物不容易擴(kuò)散,導(dǎo)致能見度下降;較大的風(fēng)容易稀釋大氣顆粒物,從而提高能見度水平。
氣溫對(duì)能見度的影響是多方面的,由輻射而降溫時(shí),有利于能見度降低,由冷空氣入侵而降溫時(shí),有利于能見度提高。
蒸發(fā)量受風(fēng)、日照、溫度等其它氣象要素影響,表現(xiàn)為多種氣象要素共同對(duì)能見度的影響,一般蒸發(fā)越大,能見度越好。
能見度有日變化特征,霧容易在凌晨形成,導(dǎo)致能見度降低。日出后,氣溫升高,相對(duì)濕度減小,大氣層結(jié)不穩(wěn)定度增加等因素,有利于能見度提升。海霧容易在冬春季生成,夏秋季較少,因此能見度也有月變化特征。
相比本站的氣象要素,周邊上下游的遂溪、雷州、坡頭站能見度與本站的能見度相關(guān)系數(shù)更高,均超過(guò)0.5。因?yàn)橛绊懤字莅雿u近岸沿海能見度的霧主要是平流霧,此類霧特點(diǎn)是水平范圍很廣,這導(dǎo)致湛江站能見度變化與上下游觀測(cè)站的能見度除了時(shí)間維度聯(lián)系,在空間維度上也有聯(lián)系。因此本文將同時(shí)引入周邊上下游自動(dòng)站能見度觀測(cè)資料,包括遂溪、雷州、坡頭站,用于構(gòu)建短臨能見度預(yù)報(bào)模型。
表1 湛江站能見度與各氣象因子相關(guān)關(guān)系
本文分別使用門限循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)和多元逐步回歸方法進(jìn)行模型的構(gòu)建,對(duì)1 h后的能見度進(jìn)行預(yù)報(bào),從而實(shí)現(xiàn)逐5 min更新的高時(shí)間分辨率能見度短臨預(yù)報(bào)。
2.4.1 門限循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)
門限循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)是2014 年提出的全新的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(圖2),它彌補(bǔ)了循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)無(wú)法學(xué)習(xí)長(zhǎng)期依賴關(guān)系的不足,又比長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)參數(shù)更少,結(jié)構(gòu)更簡(jiǎn)單。在對(duì)門限循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)進(jìn)行訓(xùn)練的過(guò)程中,需要計(jì)算更新門、重置門,這兩個(gè)門的值都在0~1之間,代表對(duì)特征信息的過(guò)濾程度。門限循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)的前向傳播如公式(3)~(6)所示,
圖2 GRU神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
其中,Zt為t時(shí)間步時(shí)更新門狀態(tài)值,rt為t時(shí)間步時(shí)重置門狀態(tài)值,σ為Sigmoid 激活函數(shù),ht-1是t-1 時(shí)間步輸出的狀態(tài)信息,xt為當(dāng)前時(shí)刻輸入的能見度特征向量表示t時(shí)間步時(shí)狀態(tài)信息候選值,ht是t時(shí)間步輸出的狀態(tài)信息,tanh為雙曲正切激活函數(shù)。Wz、Wr、Wh?為權(quán)重矩陣參數(shù)。
2.4.2 多元逐步回歸方法
多元逐步回歸預(yù)報(bào)方法是一種建立最優(yōu)多元回歸方程的統(tǒng)計(jì)方法。根據(jù)因子的顯著性程度,從大到小依次逐個(gè)引入回歸方程。每次引入新的因子后,都對(duì)回歸方程中所有的因子逐個(gè)進(jìn)行檢驗(yàn),并剔除方差貢獻(xiàn)變得不顯著的因子,直至既無(wú)顯著變量可引入回歸方程,又無(wú)不顯著的變量留在回歸方程中為止。
本研究采用均方根誤差RMSE、平均絕對(duì)誤差MAE、決定系數(shù)R2來(lái)定量評(píng)價(jià)預(yù)報(bào)模型的精度。其中,RMSE、MAE 越小,說(shuō)明模型精度越高,而R2越大,模型精度越高。各指標(biāo)計(jì)算公式如公式(7)~(9):
式中,n為數(shù)據(jù)的數(shù)量為預(yù)報(bào)值,yj為真實(shí)值為真實(shí)值的平均值。
為了測(cè)試不同建模方法和方案的效果,本研究數(shù)據(jù)資料分別使用單站和多站的氣象觀測(cè)數(shù)據(jù),建模方法分別使用GRU 神經(jīng)網(wǎng)絡(luò)和多元逐步回歸法,建立對(duì)應(yīng)的預(yù)報(bào)模型,進(jìn)行試預(yù)報(bào)檢驗(yàn),分析不同數(shù)據(jù)和方法的預(yù)報(bào)效果。
GRU神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點(diǎn)的設(shè)置會(huì)影響預(yù)報(bào)模型的準(zhǔn)確性。通過(guò)大量的訓(xùn)練,對(duì)比不同變量因子組合方案,不斷優(yōu)化神經(jīng)網(wǎng)絡(luò)各項(xiàng)參數(shù),挑選最優(yōu)GRU 參數(shù)構(gòu)建模型。最終采用兩層GRU 隱藏層,其中,第一層GRU 隱藏層節(jié)點(diǎn)數(shù)為128,第二層GRU 隱藏層節(jié)點(diǎn)數(shù)為96,兩層GRU 隱藏層后都設(shè)計(jì)一個(gè)dropout層,設(shè)置為0.2。在訓(xùn)練過(guò)程中,取訓(xùn)練集和測(cè)試集比例為7:3,采用SGD 更新方式,損失函數(shù)采用均方誤差MSE,訓(xùn)練epoch 為100 次,batch 為32,學(xué)習(xí)率為0.001,采用早停機(jī)制避免過(guò)度擬合,耐心值patience 為20,形成能見度單站GRU 預(yù)報(bào)模型VisNetS 和能見度多站GRU預(yù)報(bào)模型VisNetM。
接著采用多元逐步回歸方法建立預(yù)報(bào)方程。采用資料與神經(jīng)網(wǎng)絡(luò)一致,設(shè)定p值為0.05,經(jīng)過(guò)對(duì)因子進(jìn)行多次的引入和剔除,最后選取16 個(gè)因子參數(shù)建立能見度單站逐步回歸預(yù)報(bào)模型VisMlrS,如公式(10);選取18 個(gè)因子參數(shù)建立能見度多站逐步回歸預(yù)報(bào)模型VisMlrM,如公式(11)。
基于測(cè)試集,采用均方根誤差RMSE、平均絕對(duì)誤差MAE、決定系數(shù)R2對(duì)比四個(gè)預(yù)報(bào)模型的定量化評(píng)價(jià)指標(biāo)(表2)。從模型構(gòu)建方法看,多站GRU 模型VisNetM 和單站GRU 模型VisNetS 平均絕對(duì)誤差分別為4.10 km、4.76 km,均方根誤差RMSE 分別為5.36 km、5.90 km,顯著低于多元線性回歸模型,決定系數(shù)R2評(píng)分分別為0.65、0.57,約為多元逐步回歸模型的兩倍,因此整體上GRU 模型預(yù)報(bào)準(zhǔn)確率顯著高于多元線性回歸模型。
表2 各預(yù)報(bào)模型在測(cè)試樣本中的預(yù)報(bào)效果
相比單站數(shù)據(jù)建模,增加上下游觀測(cè)站數(shù)據(jù),GRU 模型VisNetM 預(yù)報(bào)準(zhǔn)確性得到顯著提升,平均絕對(duì)誤差、均方根誤差數(shù)值分別減小了14%、9%,決定系數(shù)增加了13%。而同樣情況下,基于逐步回歸方法構(gòu)建的模型,各類定量評(píng)價(jià)指標(biāo)并沒有因?yàn)橐肓松舷掠斡^測(cè)站數(shù)據(jù)而得到顯著性提高。可見相比逐步回歸方法,GRU 模型能夠更好地識(shí)別并表達(dá)出能見度在空間維度上變化特征,從而提升預(yù)報(bào)效果。
選取2022年1月2—3日雷州半島地區(qū)持續(xù)性霧天氣作為案例,驗(yàn)證模型預(yù)報(bào)效果。2021 年12月下旬廣東省受到寒潮的影響,2022年1月2日寒潮影響結(jié)束,冷高壓主體逐漸東移入海,雷州半島處于其后部,氣壓梯度較小,2 日晚上到3 日凌晨雷州半島沿海一帶轉(zhuǎn)偏東風(fēng),此時(shí)陸地仍然是弱偏北風(fēng),近地面弱東風(fēng)場(chǎng)將外海暖濕空氣輸送到陸地冷面(圖3)。來(lái)自海上暖濕氣流經(jīng)過(guò)雷州半島溫度較低的陸面,冷卻形成高壓入海型的平流霧,自東向西影響雷州半島。1 月2 日早晨和夜間雷州半島及其沿海主要以輕霧為主。1月3日海霧逐漸加強(qiáng),00 時(shí)50 分遂溪站首先觀測(cè)到能見度為900 m,持續(xù)到1月3日08時(shí)轉(zhuǎn)為輕霧,最低能見度250 m。雷州站于1月3日01時(shí)25分觀測(cè)到霧出現(xiàn)(能見度800 m),并持續(xù)到3日09時(shí)30分才轉(zhuǎn)為輕霧,期間雷州站出現(xiàn)20 m 左右最低能見度。湛江站在1 月2 日21 時(shí)開始出現(xiàn)輕霧,輕霧持續(xù)到3 日10時(shí),期間最低能見度為2.3 km (圖4)。
圖3 2022年1月3日南海北部風(fēng)場(chǎng)和氣溫場(chǎng)
圖4 2022年1月3日雷州半島最小能見度分布
四種預(yù)報(bào)模型都能預(yù)報(bào)出海霧能見度下降趨勢(shì)(圖5),但是擬合效果有顯著區(qū)別。多站GRU模型VisNetM 模擬效果最佳,整個(gè)過(guò)程最契合實(shí)況,平均絕對(duì)誤差MAE 和均方根誤差RMSE 分別為1.83 km、2.44 km,決定系數(shù)R2達(dá)到0.81(表3)。但其對(duì)低能見度預(yù)報(bào)結(jié)果較觀測(cè)偏大,這可能和訓(xùn)練數(shù)據(jù)中低能見度樣本偏少有關(guān)。其次是多站逐步回歸模型VisMlrM,平均絕對(duì)誤差MAE 和均方根誤差RMSE 分別為2.39 km、3.09 km,決定系數(shù)R2達(dá)到0.7,尤其是在低能見度時(shí)期預(yù)報(bào)值更接近實(shí)況,最低能見度出現(xiàn)的時(shí)間也比較接近觀測(cè)情況。單站GRU 模型VisNetS 模擬效果和單站逐步回歸模型VisMlrS效果稍差,二者決定系數(shù)R2均為0.62,但單站GRU模型VisNetS既沒有預(yù)報(bào)出輕霧過(guò)程中能見度最低值出現(xiàn)的時(shí)間,對(duì)最低值的預(yù)報(bào)誤差也是最大的。單站逐步回歸模型VisMlrS對(duì)最低值的預(yù)報(bào)誤差比VisNetS 模型更小。可見,多站GRU模型VisNetM能識(shí)別海霧上下游的氣象時(shí)空特征,以此有效提高了預(yù)報(bào)準(zhǔn)確性。多站逐步回歸模型VisMlrM 也能識(shí)別上下游的海霧氣象時(shí)空特征,但是效果稍弱。而單站GRU 模型VisNetS 和單站逐步回歸模型VisMlrS 沒法識(shí)別上下游的海霧氣象時(shí)空特征,導(dǎo)致預(yù)報(bào)準(zhǔn)確性最弱。另外,并非GRU 預(yù)報(bào)模型效果一定會(huì)比傳統(tǒng)的統(tǒng)計(jì)模型效果更佳,這需要構(gòu)建更加有效的模型結(jié)構(gòu),才能更好地發(fā)揮出GRU模型的擬合潛力。
表3 各預(yù)報(bào)模型在2022年1月2—3日海霧個(gè)例過(guò)程中的預(yù)報(bào)效果
圖5 各預(yù)報(bào)模型在2022年1月2—3日海霧個(gè)例過(guò)程預(yù)報(bào)效果
本文利用GRU 神經(jīng)網(wǎng)絡(luò),采用廣東省湛江市國(guó)家基本氣象站及其上下游站點(diǎn)觀測(cè)資料,構(gòu)建湛江市國(guó)家基本氣象站能見度短臨預(yù)報(bào)的多站GRU 模型,并進(jìn)行了隨機(jī)樣本測(cè)試和個(gè)例預(yù)報(bào)檢驗(yàn)。同時(shí),對(duì)比采用湛江市國(guó)家基本氣象站觀測(cè)數(shù)據(jù)構(gòu)建的單站GRU 預(yù)報(bào)模型,以及采用多站和單站觀測(cè)資料建立的逐步回歸預(yù)報(bào)模型,研究不同的預(yù)報(bào)模型在雷州半島近海岸能見度的短臨預(yù)報(bào)能力,得到以下結(jié)論。
(1) GRU 模型預(yù)報(bào)結(jié)果與實(shí)際觀測(cè)的變化趨勢(shì)一致性較好,整體上預(yù)報(bào)準(zhǔn)確性顯著好于多元線性回歸模型。在隨機(jī)檢驗(yàn)和個(gè)例檢驗(yàn)中,多站GRU 模型平均絕對(duì)誤差、均方根誤差明顯低于多元線性回歸模型,決定系數(shù)評(píng)分明顯高于多元線性回歸模型。
(2) 合理的模型結(jié)構(gòu)對(duì)能見度短臨預(yù)報(bào)效果至關(guān)重要,將上下游的氣象特征引入到能見度短臨預(yù)報(bào)模型可顯著提升預(yù)報(bào)效果。在個(gè)例檢驗(yàn)中,多站GRU 模型較單站GRU 模型平均絕對(duì)誤差、均方根誤差下降了36%和29% ,決定系數(shù)提高了30%。相比傳統(tǒng)的逐步回歸方法,GRU 神經(jīng)網(wǎng)絡(luò)能更好地識(shí)別上下游能見度的時(shí)空變化特征,從而提高沿海近岸能見度臨近預(yù)報(bào)的準(zhǔn)確性。
(3) GRU 模型對(duì)低能見度預(yù)報(bào)結(jié)果較觀測(cè)偏大,這可能和訓(xùn)練數(shù)據(jù)中低能見度樣本偏少,高能見度樣本占大多數(shù)有關(guān)。而傳統(tǒng)的逐步回歸模型并沒有出現(xiàn)類似的不足。
本文只用了小部分代表站進(jìn)行能見度預(yù)報(bào)模型的構(gòu)建,還沒有將基于GRU 神經(jīng)網(wǎng)絡(luò)的能見度的預(yù)報(bào)潛力完全發(fā)揮出來(lái)。為進(jìn)一步提升預(yù)報(bào)模型性能,今后可進(jìn)一步優(yōu)化模型參數(shù)和結(jié)構(gòu),還可增加模型的訓(xùn)練數(shù)據(jù),包括增加更長(zhǎng)年份的歷史數(shù)據(jù),或者加入布設(shè)密度更大的氣象區(qū)域自動(dòng)站數(shù)據(jù)。今后還可將基于GRU 模型的試驗(yàn)結(jié)果與一般的機(jī)器學(xué)習(xí)方法,如隨機(jī)森林、XGBoost 方法進(jìn)行比較,對(duì)比不同的機(jī)器學(xué)習(xí)方法對(duì)近海岸能見度短臨預(yù)報(bào)的能力。本文只使用了一次海霧過(guò)程作為預(yù)報(bào)試驗(yàn),試驗(yàn)評(píng)估數(shù)據(jù)具有一定的局限性。今后將使用更多個(gè)例進(jìn)行預(yù)報(bào)模型的檢驗(yàn)。