方楠 謝國(guó)權(quán) 阮小建 任晨平 姜舒婕 張瑋瑋
(1.浙江省預(yù)警信息發(fā)布中心,浙江杭州 310052;2.浙江省氣象服務(wù)中心,浙江杭州 310052;3.浙江省人工影響天氣中心,浙江杭州 310052)
大氣能見(jiàn)度一般是指近地面水平能見(jiàn)度,表示具有正常視力的人可以識(shí)別到目標(biāo)物輪廓的最大水平距離,度量單位一般為米(m),是氣象觀測(cè)中的一項(xiàng)基本要素,也是反映大氣透明度和空氣質(zhì)量的重要指標(biāo)[1]。當(dāng)能見(jiàn)度過(guò)低時(shí),容易造成航班延誤、交通事故增多以及影響人體呼吸道健康[2-3],因此能見(jiàn)度的變化受到交通、航空、航海、城市大氣環(huán)境等諸多領(lǐng)域的關(guān)注。學(xué)者一直致力于研究能見(jiàn)度的可預(yù)測(cè)性,為交通安全和城市大氣污染治理提供科學(xué)的參考依據(jù)。倪江波等[4]通過(guò)分析華北地區(qū)低能見(jiàn)度的天氣形式,利用NCEP再分析資料構(gòu)建了低能見(jiàn)度天氣自動(dòng)識(shí)別系統(tǒng);魏春璇等[5]利用觀測(cè)數(shù)據(jù)通過(guò)多元線性回歸初步得到了合肥霾日和霾日能見(jiàn)度的預(yù)報(bào)方程。
現(xiàn)階段,用于行業(yè)服務(wù)的大氣能見(jiàn)度預(yù)報(bào)產(chǎn)品往往依賴(lài)于數(shù)值天氣預(yù)報(bào)模式,但數(shù)值天氣預(yù)報(bào)模式對(duì)尺度小、持續(xù)時(shí)間短的天氣過(guò)程很難準(zhǔn)確刻畫(huà)。加之大氣能見(jiàn)度變化受到局地地形、地表特征以及空氣污染等影響較大,而這些參數(shù)目前還難以在數(shù)值天氣預(yù)報(bào)模式中得到良好體現(xiàn)[6],所以在使用數(shù)值模式預(yù)報(bào)大氣能見(jiàn)度時(shí),往往精度不高難以滿足行業(yè)需求,需要人工訂正來(lái)調(diào)整預(yù)報(bào)結(jié)果。對(duì)預(yù)報(bào)產(chǎn)品的人工訂正是依靠預(yù)報(bào)員的經(jīng)驗(yàn)儲(chǔ)備,形成針對(duì)當(dāng)?shù)卮髿饽芤?jiàn)度變化特點(diǎn)的知識(shí)記憶庫(kù),這與機(jī)器學(xué)習(xí)的核心概念類(lèi)似,也就為機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到大氣能見(jiàn)度預(yù)測(cè)提供了思路。此前學(xué)者已在該方面做過(guò)一些嘗試,如王愷等[7]利用風(fēng)險(xiǎn)神經(jīng)網(wǎng)絡(luò)進(jìn)行了逐日能見(jiàn)度的預(yù)測(cè);王勇[8]基于XGBoost算法研發(fā)了上海市能見(jiàn)度預(yù)測(cè)模型。
過(guò)去20 a,隨著觀測(cè)數(shù)據(jù)的擴(kuò)充和計(jì)算資源成本的降低,機(jī)器學(xué)習(xí)方法算法受到廣泛關(guān)注并取得長(zhǎng)足發(fā)展,成為統(tǒng)計(jì)學(xué)中的重要方法[9]。近年來(lái),機(jī)器學(xué)習(xí)方法在各領(lǐng)域中被廣泛應(yīng)用,這些方法都僅依賴(lài)歷史數(shù)據(jù),通過(guò)數(shù)據(jù)間的關(guān)系擬合,得到過(guò)去和未來(lái)數(shù)據(jù)間的關(guān)系,進(jìn)而完成預(yù)測(cè)。在氣象領(lǐng)域也有諸多嘗試。孫全德等[10]利用LASSO回歸、隨機(jī)森林和深度學(xué)習(xí)3種方法對(duì)ECMWF數(shù)值天氣預(yù)報(bào)的風(fēng)速產(chǎn)品進(jìn)行了訂正;毛亞萍和房世峰[11]將支持向量機(jī)方法引入到參考作物蒸散量的估算中。
在時(shí)間序列的預(yù)測(cè)問(wèn)題中,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)因其能夠更好地捕獲時(shí)間序列中的數(shù)據(jù)特征被廣泛運(yùn)用[12]。然而,RNN也有其缺陷:傳統(tǒng)的RNN難以捕獲數(shù)據(jù)時(shí)間序列的長(zhǎng)期關(guān)系,其新的變種模型長(zhǎng)短期記憶模型(Long Short-term Memory Neural Network,LSTM)則能有效克服這些問(wèn)題,如能有效地避免在時(shí)間序列預(yù)測(cè)問(wèn)題計(jì)算中的梯度消失現(xiàn)象[13]。因此,近年來(lái)LSTM模型被有效地應(yīng)用到諸多領(lǐng)域的預(yù)測(cè)問(wèn)題中,如自然語(yǔ)言識(shí)別[14]、氣溫預(yù)測(cè)[15]、風(fēng)功率預(yù)測(cè)[16-17]、降水量預(yù)測(cè)[18]和空氣質(zhì)量預(yù)測(cè)[19]等。
義烏市位于浙江省中部金衢盆地邊緣,氣候濕潤(rùn)多雨,三面環(huán)山,冬春季容易形成霧天。義烏市是中國(guó)小商品生產(chǎn)基地,擁有全球最大的線下市場(chǎng),形成了“海陸空、鐵郵網(wǎng)、義新歐、義甬舟”多位一體的綜合物流服務(wù)體系和全國(guó)最大的零擔(dān)物流中心,對(duì)不利物流運(yùn)輸?shù)臍庀髼l件預(yù)報(bào)信息需求旺盛。義烏在城市化快速發(fā)展的過(guò)程中,建筑揚(yáng)塵、汽車(chē)尾氣、工業(yè)煙塵等大氣污染物排放量快速上升[20]。因此,本研究以義烏地區(qū)作為研究區(qū)域,探索長(zhǎng)短期記憶模型在義烏地區(qū)低能見(jiàn)度預(yù)測(cè)的適用性,為銜接區(qū)域氣象數(shù)值預(yù)報(bào)模式,建立大氣能見(jiàn)度精細(xì)化動(dòng)力統(tǒng)計(jì)模型提供參考。
義烏市位于(119°49′~120°17′E、29°02′~29°33′N(xiāo)),南北寬為58.18 km,城市總面積為1105 km2,占浙江省土地面積的1.2%。義烏市地貌以丘陵為主,東、南、北三面環(huán)山,構(gòu)成一個(gè)南北長(zhǎng),東西短的長(zhǎng)廊式盆地。由于小盆地與外界大氣交換條件差,極易產(chǎn)生逆溫層,大氣污染滯留在低空,不利于義烏地區(qū)大氣污染物的擴(kuò)散。義烏的氣候類(lèi)型是亞熱帶季風(fēng)型氣候,因?yàn)榈靥幣璧貣|部,也具有一定的盆地氣候特點(diǎn)[21]。歷年平均年日照時(shí)數(shù)為1910.7 h,平均無(wú)霜期為249 d(3月13日至11月16日)。年平均氣溫為17.2℃,根據(jù)氣象部門(mén)記載,最高氣溫是1966年8月6日,達(dá)到40.9℃,最低氣溫是1977年1月6日,為-10.7℃。年平均降水量為1403 mm,降水量在年內(nèi)分配不均勻,歷年最大年降水量為1843.2 mm。歷年最多風(fēng)向?yàn)楸毕?,頻率為10%,其次東南風(fēng)、東風(fēng)[22]。
所用氣象數(shù)據(jù)來(lái)源為義烏市國(guó)家基本氣象站。義烏國(guó)家基本氣象站(29°20′N(xiāo),120°05′E),海拔高度為90 m,位于義烏市福田街道聯(lián)平村(圖1),周?chē)? km內(nèi)未有明顯的工業(yè)排放源,用于觀測(cè)常規(guī)氣象要素,如氣溫、地面溫度、相對(duì)濕度、風(fēng)速、能見(jiàn)度和降水等。從2011年1月1日開(kāi)始,能見(jiàn)度由原來(lái)的每日8次整點(diǎn)人工觀測(cè)改為逐小時(shí)整點(diǎn)儀器自動(dòng)觀測(cè),能見(jiàn)度自動(dòng)觀測(cè)儀器的傳感器為HY-35P,屬于前散式能見(jiàn)度儀。其他氣象要素也均為儀器自動(dòng)觀測(cè),數(shù)據(jù)時(shí)間分辨率為小時(shí)。本文選用的氣溫和相對(duì)濕度數(shù)據(jù),觀測(cè)設(shè)備為HMP45D型溫濕度傳感器,該傳感器采用鉑電阻感應(yīng)元件測(cè)氣溫,采用電容式薄膜聚合物感應(yīng)元件測(cè)相對(duì)濕度。風(fēng)速數(shù)據(jù)的觀測(cè)設(shè)備為ZQZ-TFD型測(cè)風(fēng)傳感器,其感應(yīng)元件為三杯式回轉(zhuǎn)架,信號(hào)轉(zhuǎn)換電路為霍爾開(kāi)關(guān)電路。地面溫度數(shù)據(jù)的觀測(cè)設(shè)備為QMT103型溫度傳感器,為Pt100型鉑電阻感應(yīng)元件。
圖1 義烏氣象觀測(cè)站位置Fig.1 Location of Yiwu meteorological station
空氣質(zhì)量指數(shù)AQI(Air Quality Index)數(shù)據(jù)來(lái)源于義烏環(huán)境監(jiān)測(cè)站(29°20′N(xiāo),120°02′E),海拔高度為65 m,位于義烏市北苑街道,與義烏國(guó)家基本氣象站相距2.4 km。義烏市國(guó)家基本氣象和環(huán)境監(jiān)測(cè)站的選址均滿足國(guó)家及行業(yè)相關(guān)標(biāo)準(zhǔn),具有較好的區(qū)域代表性??諝赓|(zhì)量指數(shù)AQI是定量描述空氣質(zhì)量狀況的無(wú)量綱指數(shù)。計(jì)算空氣質(zhì)量指數(shù)通過(guò)5個(gè)主要污染物:地面臭氧、顆粒物污染(也稱(chēng)顆粒物)、一氧化碳、二氧化硫、二氧化氮,AQI是一個(gè)能夠綜合反映當(dāng)?shù)乜諝赓|(zhì)量?jī)?yōu)劣的指標(biāo)[23]。其中,臭氧監(jiān)測(cè)采用TE—49i型臭氧分析儀,監(jiān)測(cè)方法采用紫外光度法;顆粒污染物監(jiān)測(cè)采用5030型顆粒物同步混合監(jiān)測(cè)儀,應(yīng)用β射線吸收法和光散射法對(duì)顆粒物進(jìn)行實(shí)時(shí)監(jiān)測(cè);一氧化碳監(jiān)測(cè)采用TE-48i型一氧化碳分析儀,采用氣體濾光相關(guān)技術(shù)檢測(cè)一氧化碳濃度;二氧化硫監(jiān)測(cè)采用TE-43i型二氧化硫分析儀,應(yīng)用脈沖紫外熒光法;二氧化氮監(jiān)測(cè)采用TE-42i型氮氧化物分析儀,儀器采用化學(xué)發(fā)光法對(duì)氮氧化物濃度進(jìn)行分析。
空氣質(zhì)量指數(shù)AQI的具體計(jì)算方法[24]:首先計(jì)算空氣質(zhì)量分指數(shù)IAQI(Individual Air Quality Index),污染物項(xiàng)目P的空氣質(zhì)量分指數(shù)公式為
式(1)中,IAQIp為污染物項(xiàng)目P的空氣質(zhì)量分指數(shù);Cp為污染物項(xiàng)目P的質(zhì)量濃度;BPHi為表1中與Cp相近的污染物濃度限值的高位值;BPLo為表1中與Cp相近的污染物濃度限值的低位值;IAQIHi為表1中與BPHi對(duì)應(yīng)的空氣質(zhì)量分指數(shù);IAQILo為表1中與BPLo對(duì)應(yīng)的空氣質(zhì)量分指數(shù)。
表1 空氣質(zhì)量分指數(shù)及對(duì)應(yīng)的污染物項(xiàng)目濃度限值Table 1 Individual Air Quality Index(IAQI)and concentration limits of different air pollutants
空氣質(zhì)量指數(shù)AQI公式為
式(2)中,IAQI為空氣質(zhì)量分指數(shù);n為污染物項(xiàng)目。
因?yàn)榱x烏國(guó)家基本氣象站和環(huán)境監(jiān)測(cè)站數(shù)據(jù)質(zhì)量相對(duì)較高,且義烏本地屬于雨霧天氣和灰霾天氣均有發(fā)生,當(dāng)?shù)貙?duì)低能見(jiàn)度預(yù)測(cè)技術(shù)需求旺盛,本研究選取2015—2019年逐小時(shí)觀測(cè)的能見(jiàn)度、常規(guī)氣象要素(氣溫、地面溫度、相對(duì)濕度、風(fēng)速)以及空氣質(zhì)量指數(shù)(AQI)作為模型數(shù)據(jù)。
1.3.1 長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)(LSTM)
LSTM模型是RNN的一個(gè)變種,由Hochreiter和Schmidhuber于1997年提出[25],一方面其保留了神經(jīng)網(wǎng)絡(luò)輸入、隱藏、輸出的三層架構(gòu),并可通過(guò)反向傳播進(jìn)行參數(shù)迭代更新。另一方面其隱藏層結(jié)構(gòu)由一個(gè)或多個(gè)記憶核組成,每個(gè)記憶核包括三個(gè)“門(mén)”,即遺忘門(mén)(forget gate)、輸入門(mén)(input gate)和輸出門(mén)(output gate),使其在繼承了RNN的大部分特性之外,優(yōu)化了RNN在反向傳播時(shí)的梯度消失或梯度爆炸問(wèn)題,更適用于模擬樣本中的時(shí)序特征。
LSTM記憶核結(jié)構(gòu)如圖2所示,ht-1為上一層的輸出;Ct-1為上一個(gè)LSTM記憶核的特征信息;ht為輸出;Ct為當(dāng)前記憶核的特征信息。相關(guān)方程為
圖2 LSTM單元結(jié)構(gòu)Fig.2 Structure of LSTM unit
式(3)~式(8)中,σ為激活函數(shù);通常為tanh或sigmoid函數(shù);U,W為模型權(quán)重矩陣;b為模型偏置項(xiàng)。
在LSTM計(jì)算流程中,每一時(shí)刻LSTM記憶核通過(guò)三個(gè)門(mén)接收當(dāng)前狀態(tài)xt和上一時(shí)刻LSTM的隱藏狀態(tài)ht-1。此外,每個(gè)門(mén)還接收一個(gè)內(nèi)部特征信息Ct-1。接收輸入信息后,每個(gè)門(mén)將對(duì)不同的輸入來(lái)源進(jìn)行運(yùn)算,由其邏輯函數(shù)決定其是否激活。輸入門(mén)的參數(shù)經(jīng)過(guò)激活函數(shù)更新后,與遺忘門(mén)處理過(guò)的記憶核參數(shù)進(jìn)行疊加,形成新的記憶核狀態(tài)Ct。最終,記憶核狀態(tài)Ct通過(guò)激活函數(shù)的運(yùn)算和輸出門(mén)的動(dòng)態(tài)控制形成LSTM的輸出ht。
LSTM模型在訓(xùn)練過(guò)程中權(quán)重矩陣和偏置項(xiàng)的確定是通過(guò)反向傳播不斷更新?lián)p失函數(shù)的最小值來(lái)優(yōu)化的。本文選用Adam作為參數(shù)優(yōu)化方法,因其相較于其他優(yōu)化算法在實(shí)際應(yīng)用中具有更優(yōu)的表現(xiàn)[26]。
1.3.2 對(duì)比試驗(yàn)設(shè)計(jì)
(1)數(shù)據(jù)歸一化
使用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行多變量預(yù)測(cè)時(shí),因?yàn)椴煌兞苛烤V不同,數(shù)值差異大,會(huì)影響模型中激活函數(shù)的輸入輸出范圍,容易造成損失函數(shù)無(wú)法正常工作,所以需要平等考慮各變量對(duì)能見(jiàn)度的影響作用,對(duì)變量和能見(jiàn)度時(shí)間序列進(jìn)行歸一化處理。本研究選用極值歸一化,將各參數(shù)數(shù)值歸算到區(qū)間[0,1]內(nèi),公式為
式(9)中,x′為歸一化后的樣本數(shù)據(jù);x為原始樣本數(shù)據(jù);xmin,xmax分別代表樣本時(shí)間序列的最小值和最大值。
(2)對(duì)比試驗(yàn)
根據(jù)數(shù)據(jù)資料,設(shè)逐小時(shí)能見(jiàn)度序列為vis={vist},t=1,2,3,…,n。其中t為時(shí)間序列長(zhǎng)度或稱(chēng)為神經(jīng)網(wǎng)絡(luò)的窗口長(zhǎng)度。相同的還有相對(duì)濕度序列h,風(fēng)速序列w,空氣質(zhì)量指數(shù)序列a,地氣溫差序列ta-g。第一組對(duì)比試驗(yàn)用于驗(yàn)證歷史能見(jiàn)度作為輸入變量時(shí),對(duì)模擬效果的影響,即對(duì)比LSTMt{h,w,a,ta-g}=vist+1與LSTMt{vis,h,w,a,ta-g}=vist+1。第二組對(duì)比試驗(yàn)通過(guò)劃分不同模擬時(shí)段(11月至翌年2月,3—6月,7—10月)來(lái)訓(xùn)練模型,分析在不同天氣條件主導(dǎo)下LSTM模擬能見(jiàn)度的精度。第三組試驗(yàn)通過(guò)不斷增加預(yù)測(cè)步長(zhǎng),來(lái)評(píng)估模型的模擬性能。
(3)模擬效果評(píng)估
為了能夠客觀準(zhǔn)確地反映模型模擬性能,本研究選用均方根誤差(root mean square error,RMSE)、平均絕對(duì)誤差(Mean Absolute Error,MAE)和擬合優(yōu)度(R2)作為模型性能評(píng)價(jià)指標(biāo)。均方根誤差RMSE和平均絕對(duì)誤差MAE越小,說(shuō)明模型模擬結(jié)果越接近實(shí)際值。擬合優(yōu)度0≤R2≤1,值越接近1說(shuō)明模擬結(jié)果的變化趨勢(shì)越接近實(shí)際。具體計(jì)算公式如下
式(10)~式(12)中,xt為觀測(cè)值;x′t為模擬值;ˉx為觀測(cè)數(shù)據(jù)的平均值;N為觀測(cè)樣本時(shí)間序列長(zhǎng)度。
在能見(jiàn)度分析中,定義能見(jiàn)度小于10 km的為低能見(jiàn)度天氣,為便于分析再將低能見(jiàn)度天氣分為四個(gè)等級(jí):輕微低能見(jiàn)度(5~10 km),輕度低能見(jiàn)度(3~5 km),中度低能見(jiàn)度(2~3 km),重度低能見(jiàn)度(<2 km)。如圖3a所示,義烏地區(qū)低能見(jiàn)度天氣每月都有發(fā)生,冬季(12月至翌年1月)最頻繁,發(fā)生頻率接近80%,1月為79.18%,12月為80.93%,重度低能見(jiàn)度天氣占比分別為12.31%和9.10%;夏季(7—8月)低能見(jiàn)度天氣發(fā)生頻率最小,占比不到30%,重度低能見(jiàn)度天氣占比均為1.36%。2—6月各月情況相似,低能見(jiàn)度發(fā)生頻率在55%~60%,重度低能見(jiàn)度發(fā)生頻率在5%~6%。9—12月低能見(jiàn)度天氣和重度低能見(jiàn)度天氣發(fā)生頻率逐月升高。2015—2019年義烏地區(qū)低能見(jiàn)度天氣總體呈下降趨勢(shì)(圖3b),低能見(jiàn)度天氣發(fā)生頻率分別為62.1%、53.6%、46.6%、44.9%、49.6%。
圖3 義烏地區(qū)2015—2019年月平均(a)和逐年(b)低能見(jiàn)度天氣出現(xiàn)頻率Fig.3 Monthly and annual mean occurrence frequency of low visibility in Yiwu from 2015 to 2019
為了能突顯低能見(jiàn)度天氣過(guò)程的氣象特征,統(tǒng)計(jì)了2015—2019年逐月逐小時(shí)的低能見(jiàn)度天氣出現(xiàn)時(shí)長(zhǎng),以及相對(duì)濕度、風(fēng)速、空氣質(zhì)量指數(shù)(AQI)和地氣溫差(Ta-Tg)的逐月逐小時(shí)平均值。由圖4可以看出,低能見(jiàn)度天氣過(guò)程主要出現(xiàn)在冬春季節(jié)的早晨和晚上,下午時(shí)段(12—18時(shí))以及夏秋季(7—10月)很少出現(xiàn)低能見(jiàn)度天氣(圖4a)。相對(duì)濕度具有明顯的日變化特征,總體呈現(xiàn)為白天干燥夜晚濕潤(rùn)(圖4b)。風(fēng)速的特征主要為下午(12—18時(shí))風(fēng)速較大,其中夏季下午平均風(fēng)速最大,平均風(fēng)速低值區(qū)出現(xiàn)在凌晨(00—06時(shí))(圖4c)??諝赓|(zhì)量指數(shù)(AQI)季節(jié)變化明顯,冬季最高,夏季最低,下午時(shí)段(12—16時(shí))空氣質(zhì)量較好(圖4d)。地氣溫差(Ta-Tg)也有明顯的日變化特征,白天(08—16時(shí))氣溫低于地表溫度,夜晚則相反(圖4e)。通過(guò)對(duì)比可以看出,低能見(jiàn)度天氣總出現(xiàn)在高相對(duì)濕度(>80%),平均風(fēng)速較低(<3 m·s-1)的條件下,這與之前研究結(jié)論一致[27]。此外,氣溫高于地表溫度時(shí)(Ta-Tg>0℃),容易出現(xiàn)低能見(jiàn)度天氣。11月至翌年2月,空氣質(zhì)量較差的時(shí)段往往對(duì)應(yīng)低能見(jiàn)度天氣,但春季(3—6月)清晨即使空氣質(zhì)量較好也會(huì)出現(xiàn)低能見(jiàn)度天氣。因此,冬季(11月至翌年2月)低能見(jiàn)度天氣受空氣質(zhì)量影響較大,春季(3—6月)低能見(jiàn)度天氣受空氣質(zhì)量影響較小,霧天氣占主導(dǎo)。
圖4 義烏地區(qū)低能見(jiàn)度發(fā)生時(shí)長(zhǎng)(a)、相對(duì)濕度(b)、風(fēng)速(c)、AQI(d)和地氣溫差(e)變化Fig.4 Characteristics of monthly and hourly mean duration of low visibility(a),relative humidity(b),wind speed(c),AQI(d),and ground-air temperature difference(e)in Yiwu
綜上所述,義烏地區(qū)低能見(jiàn)度天氣對(duì)應(yīng)的氣象條件是高濕、高污染、氣溫高于地溫和低風(fēng)速。除此之外,6月表現(xiàn)出明顯的高濕、低風(fēng)、低地氣溫差的特征,這與6月為浙江地區(qū)梅雨季節(jié)有關(guān),缺少太陽(yáng)輻射容易在近地面形成上述氣象特征[28]。
設(shè)計(jì)一組對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)方案一:選用相對(duì)濕度、風(fēng)速、空氣質(zhì)量指數(shù)(AQI)和地氣溫差作為固定輸入變量,2015—2018年逐小時(shí)觀測(cè)數(shù)據(jù)作為訓(xùn)練集,2019年逐小時(shí)觀測(cè)數(shù)據(jù)作為模擬集,樣本時(shí)間序列長(zhǎng)度L設(shè)定為12 h,預(yù)測(cè)步長(zhǎng)為1 h。實(shí)驗(yàn)方案二:在方案一的基礎(chǔ)上,輸入變量增加觀測(cè)能見(jiàn)度。為便于展示,對(duì)模擬結(jié)果作日平均處理,如圖5所示。選用均方根誤差RMSE、平均絕對(duì)誤差MAE和擬合優(yōu)度(R2)作為模型性能評(píng)價(jià)指標(biāo),其中方案一RMSE=2.82 km,MAE=2.14 km,R2=0.73(圖5a),方案二RMSE=0.63 km,MAE=0.51 km,R2=0.99(圖5b),模擬結(jié)果明顯優(yōu)于方案一,說(shuō)明當(dāng)訓(xùn)練參數(shù)中加入過(guò)去時(shí)刻觀測(cè)能見(jiàn)度將大幅提升整體模擬水平。
圖5 全時(shí)期兩種方案一(a)和方案二(b)模擬結(jié)果對(duì)比Fig.5 Comparison of visibility simulation during the whole period using Scheme 1(a)and Scheme 2(b)
不同時(shí)期低能見(jiàn)度天氣的形成原因并不相同,所以本研究中設(shè)計(jì)了分時(shí)期模擬實(shí)驗(yàn),將全時(shí)期數(shù)據(jù)分為11月至翌年2月、3—6月、7—10月3個(gè)時(shí)期(圖6)。根據(jù)上文分析,11月至翌年2月出現(xiàn)低能見(jiàn)度天氣概率最大,且受空氣質(zhì)量因素影響明顯。3—6月也有低能見(jiàn)度天氣發(fā)生,但以霧現(xiàn)象為主,這時(shí)期受空氣質(zhì)量影響不大,所以該時(shí)期設(shè)計(jì)兩組實(shí)驗(yàn),一組加入AQI作為輸入變量,另一組則不加入。7—10月屬于能見(jiàn)度普遍較好的時(shí)期。因?yàn)榈湍芤?jiàn)度天氣更受關(guān)注,加入觀測(cè)能見(jiàn)度小于10 km時(shí)的均方根誤差(RMSE_10km)和平均絕對(duì)誤差(MAE_10km)作為評(píng)價(jià)指標(biāo)。由于輸入變量有顯著的日周期性特征,因此選取了4 h、8 h、12 h、24 h、48 h和72 h作為樣本時(shí)間序列長(zhǎng)度來(lái)對(duì)比誤差大小。模擬結(jié)果顯示,在全時(shí)期模擬中(圖6a),當(dāng)樣本時(shí)間序列長(zhǎng)度為12 h時(shí),對(duì)低能見(jiàn)度天氣模擬效果最好,RMSE_10km=2.35 km,MAE_10km=1.41 km,R2=0.85。在樣本時(shí)間序列長(zhǎng)度等于48 h時(shí),對(duì)整體能見(jiàn)度模擬效果較好,RMSE=2.50 km,MAE=1.54 km,R2=0.86。通過(guò)分時(shí)期模擬,在11月至翌年2月模擬期可以得到更好的模擬效果(圖6b)。當(dāng)樣本時(shí)間序列長(zhǎng)度為4 h時(shí),對(duì)低能見(jiàn)度天氣模擬效果最好(圖7),RMSE=2.35 km,MAE=1.46 km,RMSE_10km=1.81 km,MAE_10km=1.13 km,R2=0.83。這說(shuō)明本次研究選用的氣象要素在刻畫(huà)義烏冬季低能見(jiàn)度天氣時(shí)最為有效。3—6月模擬期的兩組對(duì)比試驗(yàn)中(圖6c和圖6d),變量中不加入空氣質(zhì)量指數(shù)(AQI)反而效果會(huì)更好,這說(shuō)明在訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型時(shí),并不是變量越多越好,低影響的變量反而會(huì)導(dǎo)致模型精度下降。7—10月屬于能見(jiàn)度最好的時(shí)期(圖6e),模擬中首次看到RMSE_10km,MAE_10km整體大于RMSE、MAE。一方面是由于這一時(shí)期能見(jiàn)度小于10 km的樣本量不大,模擬異常值會(huì)導(dǎo)致評(píng)價(jià)指標(biāo)變大;另一方面也說(shuō)明該時(shí)期的低能見(jiàn)度可能受到其他因素影響而非本研究選用的要素。
圖6 全時(shí)期(a)、11月至翌年2月(b)、變量中加入(c)和不加入(d)AQI的3—6月以及7—10月(e)模擬結(jié)果評(píng)價(jià)指標(biāo)Fig.6 Evaluation indicators in the whole period(a),from November to February(b),with(c)and without(d)AQI as an input member from March to June,and from July to October(e)
圖7 分時(shí)期(11月至翌年2月)能見(jiàn)度模擬結(jié)果趨勢(shì)圖(a)和散點(diǎn)圖(b)Fig.7 Temporal variation of observed and simulated visibility from November to February(a)and their scatter plot(b)
選定相對(duì)濕度、風(fēng)速、空氣質(zhì)量指數(shù)AQI、地氣溫差、觀測(cè)能見(jiàn)度5參數(shù),樣本時(shí)間序列長(zhǎng)度為12 h,預(yù)測(cè)步長(zhǎng)為1 h的模擬結(jié)果作為參照組,分別對(duì)比預(yù)測(cè)步長(zhǎng)為2—6 h的模擬結(jié)果,如圖8所示。隨著時(shí)間步長(zhǎng)的增加,R2逐步減小,RMSE、MAE、RMSE_10km、MAE_10km逐漸增大。當(dāng)預(yù)測(cè)步長(zhǎng)大于3 h,R2<0.71,預(yù)測(cè)結(jié)果已不具備實(shí)際應(yīng)用的能力。
圖8 不同預(yù)測(cè)步長(zhǎng)模擬結(jié)果Fig.8 Simulation results with different prediction steps
(1)高相對(duì)濕度、高污染、氣溫高于地溫和低風(fēng)速是義烏地區(qū)出現(xiàn)低能見(jiàn)度天氣的主要?dú)庀髼l件。
(2)LSTM模型對(duì)單站點(diǎn)能見(jiàn)度有較好的模擬效果,當(dāng)訓(xùn)練參數(shù)中加入觀測(cè)能見(jiàn)度時(shí),能大幅提高模擬準(zhǔn)確度,日均能見(jiàn)度模擬結(jié)果RMSE=0.63 km,MAE=0.51 km,R2=0.99。
(3)分時(shí)期進(jìn)行模擬能得到更精準(zhǔn)的模擬結(jié)果,本研究中選用的參數(shù)在冬季(11月至翌年2月)模擬效果最好,RMSE=2.35 km,MAE=1.46 km,RMSE_10km=1.81 km,MAE_10km=1.13 km,R2=0.83,這說(shuō)明本次研究選用的氣象要素在刻畫(huà)義烏冬季低能見(jiàn)度天氣時(shí)最為有效。
(4)3—6月的模擬中,變量中不加空氣質(zhì)量序列在低能見(jiàn)度預(yù)測(cè)中效果更好,這意味著3—6月義烏地區(qū)的低能見(jiàn)度天氣以霧天氣為主導(dǎo),加入過(guò)多變量并不能使模型更為準(zhǔn)確。
(5)隨著預(yù)報(bào)步長(zhǎng)增大,模型預(yù)報(bào)效果變差,預(yù)測(cè)步長(zhǎng)等于3 h,擬合優(yōu)度R2=0.71,預(yù)測(cè)結(jié)果已不具備實(shí)際應(yīng)用的能力。