王金虎 肖安虹 陳后財 王昊亮 劉萱 蔡海強
(1.南京信息工程大學 氣象災害預報預警與評估協(xié)同創(chuàng)新中心, 南京 210044;2.中國氣象局 氣溶膠與云降水重點開放實驗室, 南京 210044;3.中國科學院 中層大氣和全球環(huán)境探測重點實驗室, 北京 100029;4.南京信大安全應急管理研究院, 南京 210044;5.中國電波傳播研究所, 青島 266107)
準確預報災害性天氣對減少和避免氣象災害的損失具有重要意義,但由于探測手段有限,人們對中小尺度天氣的發(fā)生機理和規(guī)律還不夠了解[1-2],特別是在大氣廓線的探測方面,往往采用費時費力的人工釋放探空氣球的方式,而地基遙感探測儀器(如地基微波輻射計)在大氣廓線的探測具有無人值守、時間連續(xù)及高精確性的優(yōu)點,已經(jīng)成為遙感大氣溫度、濕度、云液態(tài)水廓線的有力工具[3-6]。
地基微波輻射計在反演溫度、相對濕度、水汽密度以及液態(tài)水含量時主要依賴于亮溫的測量。而亮溫的測量值除了受設備硬性條件影響外,還受到云、降水等復雜天氣現(xiàn)象的影響,同時探空氣球可能因漂移而產(chǎn)生測量誤差。因此許多學者通過對亮溫測量值進行預處理來提升反演精度。如馬麗娜等[7]提出利用多通道亮溫差值閾值法對亮溫進行線性訂正;張雪芬等[8]引入測云儀對微波輻射計的亮溫進行預處理后改進了反演;鮑艷松等[9]通過MONORTM下行輻射傳輸模式,利用本地探空資料模擬出亮溫數(shù)據(jù),對實測亮溫進行修正;楊杰波等[10]利用MPM93模型結(jié)合輻射傳輸方程計算的通道模擬亮溫完成了對實測亮溫結(jié)果的訂正。上述文獻對亮溫預處理的反演結(jié)果相較于未處理數(shù)據(jù)均提升了反演的精度。目前,利用亮溫反演大氣廓線主要采用神經(jīng)網(wǎng)絡算法,相較于之前的正向模型反演算法和回歸法,神經(jīng)網(wǎng)絡具有運算時間快及良好的非線性擬合能力,且不需要單獨設計復雜的反演算法和模型,因此會減少在分析物理正向模型時產(chǎn)生的眾多問題[11-12],相關學者已驗證了神經(jīng)網(wǎng)絡算法在反演大氣溫濕廓線的優(yōu)勢[13-16]。然而,地基微波輻射計僅能獲得亮溫數(shù)據(jù),對云的探測能力卻十分有限[13,17],導致云的存在對大氣廓線尤其是對相對濕度廓線會產(chǎn)生非常大的影響,而溫濕廓線的精度會直接影響到水汽密度與液態(tài)水含量的計算,因此,有學者嘗試在構(gòu)建的神經(jīng)網(wǎng)絡模型中加入對應的云底高度及厚度或者添加雷達反射率因子以提高反演精度[18-19],但在不同神經(jīng)網(wǎng)絡模型的反演效果的對比上卻尚未進行嘗試。
因此,本文構(gòu)建了3種不同云信息的神經(jīng)網(wǎng)絡模型,并將模型反演結(jié)果進行對比,探究提升地基微波輻射計反演濕度廓線精度的神經(jīng)網(wǎng)絡模型。
探空數(shù)據(jù)、毫米波雷達數(shù)據(jù)以及微波輻射計數(shù)據(jù)均由ARM大氣觀測網(wǎng)站提供,測量儀器均位于阿拉斯加北坡(71.32°N, 156.62°W)。其中探空數(shù)據(jù)為DigiCORA-III型數(shù)字探空儀所得,探測高度可達20 km。毫米波測云雷達為Ka波段多普勒天氣雷達,測量最大高度為12 km,垂直分辨率為45 m,有10種時間分辨率,最大發(fā)射功率為100 W。微波輻射計位于同一地點,輸出為47個高度層,0~1 km高度分辨率為100 m,1~10 km高度分辨率為250 m,主要技術參數(shù)如表1所示。
表1 微波輻射計主要技術參數(shù)Tab.1 Main parameters of microwave radiometer
樣本數(shù)據(jù)時間為阿拉斯加北坡2004-04-19—2006-12-31,測試數(shù)據(jù)時間為2008-01-10—2008-02-29。樣本數(shù)據(jù)累計589組毫米波測云雷達反射率因子、1 295條探空廓線,以及對應的微波輻射計數(shù)據(jù);測試數(shù)據(jù)累計51組毫米波測云雷達反射率因子,101條探空廓線。為確保數(shù)據(jù)的可靠性,須提前對樣本進行篩選。
1)有云存在,探空數(shù)據(jù)相對濕度應為100%,但由于凝結(jié)核的影響,往往低于100%[17]。因此在探空廓線上,以相對濕度85%為閾值[18],進行以下劃分:將近地面至任意高度層相對濕度均小于85%的劃分為晴天;相對濕度于近地面處小于85%,高度超過600 m存在相對濕度大于85%的劃分為云天;相對濕度從近地面到600 m都大于85%的劃分為雨天。
2)降水會對毫米波云雷達造成嚴重的衰減,根據(jù)黃興友等[20]對毫米波云雷達回波強度給出的分級,選取反射率因子不超過15 dBZ的樣本作為云雷達數(shù)據(jù)。
3)雨天情況下天線罩上的雨水會使得亮溫探測出現(xiàn)異常,所以必須剔除掉1)和2)判定為雨天的亮溫集,作為微波輻射計數(shù)據(jù)。
完成上述3個步驟的篩選后,須對數(shù)據(jù)進行匹配。如圖1(a)和(b)所示2005-07-23T15:02時的探空相對濕度和雷達反射率因子,有云時所挑選出的樣本必須保證云雷達與探空數(shù)據(jù)云底位置及云的厚度基本相同;如圖1(c)和(d)所示2006-03-28T 20:53時的探空相對濕度和雷達反射率因子,無云時,測云雷達無明顯突變。篩選樣本時發(fā)現(xiàn),無論云是否存在,毫米波測云雷達的反射率因子都會逐漸變大,因為該毫米波測云雷達技術參數(shù)在不同高度層將會接收到不同最小探測雷達反射率因子,且隨著高度升高所能接收的最小探測雷達反射率因子逐漸增大,導致樣本數(shù)據(jù)中很難尋找到高云樣本。為增強無云與有云信號之間的對比,無云時對雷達反射率因子大小統(tǒng)一修改為第一個高度層所能探測的最小探測雷達反射率因(-62 dBZ);有云時,將非云高度層上對應雷達反射率因子大小統(tǒng)一修改為上述值(-62 dBZ),最后完成微波輻射計與云雷達在時間分辨率上的匹配。由于毫米波測云雷達儀器探測到的中高云較少、混合云數(shù)量極少,因此本研究只考慮單層云的情況。用于建模的樣本數(shù)據(jù)共155組,其中晴天樣本85條,有云樣本70條(低云60條,中云9條,高云1條);測試樣本15條,其中晴天樣本9條,有云樣本6條,且全部為低云樣本。因此,本文將數(shù)據(jù)集分為有云和無云兩種情況。
圖1 不同時刻的探空相對濕度和雷達反射率因子Fig.1 Sounding relative humidity and radar reflectivity factor at different times
理論上神經(jīng)網(wǎng)絡算法可以逼近任意復雜的非線性關系,不需要專門設計復雜的反演算法[12]。如圖2所示,采用3層前饋反向傳播神經(jīng)網(wǎng)絡(back propagation neural network, BPNN),其中X為輸入層,Y為輸出層,中間為隱含層。輸入層到隱含層選取雙曲正切S型傳遞函數(shù)tansig,隱含層到輸出層選取線性傳遞函數(shù)purelin,采用貝葉斯正則化trainbr函數(shù)作為學習函數(shù)。
建立如下3種不同的反演模型來探究添加不同云信息對BPNN反演模型的影響:
1)將不添加任何云信息的BPNN模型定義為BPNN0,其中輸入層節(jié)點15個,分別為微波輻射計提供的12個通道亮溫及地面的溫濕壓;輸出層節(jié)點為47個,為地面到10 km高度的47個不同高度層上的相對濕度。
2) 將添加入云和出云高度的BPNN模型定義為C-BPNN,其中輸入層節(jié)點17個,前15個節(jié)點分別為微波輻射計提供的12個通道亮溫及地面的溫濕壓,后2個節(jié)點為入云和出云高度,入云和出云判定方式參照文獻[21];輸出層節(jié)點為47個。
3) 將添加雷達反射率因子的BPNN模型定義為Z-BPNN,文獻[22]對溫度廓線反演的研究中發(fā)現(xiàn),不同的分層對反演結(jié)果有一定的影響,同時考慮到毫米波測云雷達的庫長及BPNN的收斂性,本文以4個庫長即180 m對10 km進行劃分,加上微波輻射計提供的12個信道亮溫及地面溫濕壓共計70個作為輸入層節(jié)點,輸出層節(jié)點為47個。
神經(jīng)網(wǎng)絡性能的好壞易受其隱含層結(jié)點數(shù)的影響,隱含結(jié)點數(shù)太少會導致信息不足,影響整個網(wǎng)絡的反演精度;而隱含節(jié)點數(shù)過多會導致訓練時間過長,影響工作效率。中間隱含層節(jié)點數(shù)N為[23]
式中,NX、NY分別輸入層和輸出層節(jié)點數(shù)。
以探空資料為標準,用平均絕對誤差(mean absolute error, MAE)及均方根誤差(root mean square error, RMSE)檢驗反演精度:
式中:n為高度層數(shù),取值47;Ui為真實探空廓線;Vi為反演得到的探空廓線。
利用BPNN0、C-BPNN和Z-BPNN 3種BPNN模型對15條測試樣本進行反演,結(jié)果如圖3所示??梢钥闯觯築PNN0反演模型的相對濕度廓線誤差波動較大,在2008-01-29T04:42出現(xiàn)最大MAE(38.641 7%)以及RMSE(46.192 6%);C-BPNN模型MAE為15.945 9%,RMSE為18.419 1%,相較于BPNN0模型MAE減小了22.695 8%,RMSE減小了27.773 5%;而Z-BPNN模型的MAE為21.385 8%,RMSE為25.078 2%,MAE減少17.255 9%,RMSE減少21.114 4%。而誤差減少最小的樣本為2008-02-29T05:25,BPNN0模型的MAE為11.213 6%,RMSE為16.007 8%;C-BPNN與Z-BPNN模型MAE值分別為11.582 1%,13.066 8%,RMSE分別為16.007 8%,16.171 9%,誤差變化范圍不大,僅一條樣本(2008-01-28T05:29)出現(xiàn)了誤差變大的情況。綜上所述,添加云信息的神經(jīng)網(wǎng)絡模型(C-BPNN和ZBPNN)的結(jié)果要明顯好于未添加任何云信息的BPNN0模型,且誤差波動范圍相較于BPNN0模型也更加穩(wěn)定。從15條樣本反演結(jié)果上看,C-BPNN模型反演的結(jié)果只有一條樣本(2008-01-28T05:29)誤差大于BPNN0模型的反演結(jié)果,而Z-BPNN模型出現(xiàn)3條樣本(2008-01-28T05:29、02-29T05:25、02-04T18:53),對比可知C-BPNN更具有優(yōu)勢。
圖3 3種模型反演結(jié)果MAE與RMSEFig.3 MAE and RMSE of the inversion results for 3 models when cloudless
利用3種模型分別對無云條件下2008-01-14T18:21、01-15T17:04、01-28T05:29時反演的相對濕度及其RMSE結(jié)果如圖4所示??梢钥闯?,第一條樣本中C-BPNN模型反演結(jié)果相較于其他兩種模型更好,第二條樣本中Z-BPNN反演結(jié)果較好,最后一條樣本中BPNN0模型反演結(jié)果較好。
圖4 無云條件下不同時刻相對濕度及其RMSEFig.4 Relative humidity and its RMSE when cloudless at different times
圖4(a)中探空濕度廓線隨高度的增加而減小,波動范圍也較小,C-BPNN與Z-BPNN模型反演結(jié)果都明顯好于BPNN0,而BPNN0反演的相對濕度廓線大于實際的相對濕度廓線;圖4(d)中,隨高度增加,BPNN0模型反演的相對濕度廓線的RMSE呈增大的趨勢,直至穩(wěn)定在30%左右,而C-BPNN與Z-BPNN的RMSE在4 km的高度上才逐漸分離擴大,最終CBPNN RMSE穩(wěn)定在10%左右,Z-BPNN模型穩(wěn)定在20%左右;圖4(b)中,探空相對濕度廓線變化相對平緩,但3種模型的反演結(jié)果都偏大,BPNN0模型在5 km以下偏離程度最大,5 km以上的反演結(jié)果最符合實際,而C-BPNN與Z-BPNN模型在整個高度層上的反演結(jié)果較為相似;圖4(e) 中, Z-BPNN模型的RMSE反演效果最好;圖4(c)中實際的探空廓線在7 km以下逐漸減小,在7 km時突然發(fā)生躍變,相對濕度接近80%,說明在此高度附近可能有云的形成,但探空氣球并未入云,躍變一直持續(xù)到9 km結(jié)束,只有BPNN0模型識別出了此躍變,而C-BPNN與ZBPNN反演結(jié)果相近,且與實際情況偏離較大,導致該樣本C-BPNN與Z-BPNN模型反演的整體MAE與RMSE大于BPNN0模型,BPNN輸入層的增多導致每個節(jié)點的權重發(fā)生改變,當高空出現(xiàn)較大的躍變但又不滿足入云條件時,添加云信息的模型可能出現(xiàn)無法準確反演出實際變化的情況,因此權值與閾值的選擇尤為重要。
圖5為有云條件下2008-01-29T20:29、01-29T22:05、02-04T18:53的反演的相對濕度及其RMSE,第一條樣本中C-BPNN模型反演結(jié)果相較于其他兩種模型更好,第二條樣本中Z-BPNN反演結(jié)果較好,最后一條樣本中BPNN0模型反演結(jié)果好于Z-BPNN模型。
圖5 有云條件下不同時刻相對濕度及其RMSEFig.5 Relative humidity and RMSE inversion results with clouds at different times
圖5(a)、(b)和(c)中的入云和出云位置分別為1 750~3 890 m、1 345~4 120 m和1 592~2 219 m。圖5(a)中,在有云的高度上,C-BPNN與Z-BPNN模型反演的相對濕度更接近于探空廓線,在無云高度時Z-BPNN出現(xiàn)了較大的躍變;圖5(d)中的RMSE很好地反映出此問題,在出云高度即3 890 m以下Z-BPNN模型反演結(jié)果明顯好于C-BPNN與BPNN0模型,出云之后,在無云區(qū)域C-BPNN要好于另外兩種模型;圖5(b)中,在有云的部分,3種模型反演的相對濕度均較接近真實探空廓線;對應的圖5(e)中RMSE的反演結(jié)果中,有云的高度上BPNN0反演結(jié)果卻好于C-BPNN與Z-BPNN模型,分析認為該樣本探空廓線所反映的云的特征不夠明顯,從2 km開始相對濕度斷斷續(xù)續(xù)小于85%,這可能是探空氣球的漂移導致,而添加云信息的兩個模型相對濕度接近100%,此處云的存在更加明顯,無云高度時Z-BPNN與實際的探空廓線偏差最小,導致ZBPNN反演的RMSE小于另外兩種模型; 圖5(c)中,C-BPNN與Z-BPNN在有云部分更加接近探空廓線,但在無云區(qū)域,BPNN0更接近探空廓線,其次是CBPNN;圖5(f)的結(jié)果表明隨著高度的升高,ZBPNN模型反演結(jié)果最差。由6條樣本的CBPNN模型反演的濕度廓線與探空濕度廓線的RMSE可知,隨著高度的上升,約升高至1 km時RMSE變化范圍始終保持在20附近,而BPNN0與ZBPNN模型或多或少出現(xiàn)了大的波動,故C-BPNN模型的穩(wěn)定性較好。
神經(jīng)網(wǎng)絡初始權值與閾值直接影響反演的效果,由于BPNN是一種局部搜索的優(yōu)化方法,而網(wǎng)絡的權值是通過沿局部改善的方向逐漸進行調(diào)整的,容易陷入局部最小值[24],很難得到最佳的初始權值和閾值。本節(jié)通過遺傳算法(genetic algorithms,GA)尋找BPNN最優(yōu)初始權值與閾值,達到優(yōu)化網(wǎng)絡的目的。
20世紀60年代,Holland提出了一種通過模擬生物界自然選擇和淘汰的繁衍規(guī)律產(chǎn)生的優(yōu)化算法,即GA,該算法具有良好的并行全局搜索的性能。通過GA找出神經(jīng)網(wǎng)絡前期訓練的最優(yōu)解,再通過BPNN的誤差,反向傳遞計算出具有最高精度的網(wǎng)絡權值,用最優(yōu)的權值進行預測結(jié)果,進而改善網(wǎng)絡。本文建立的GA優(yōu)化BPNN模型流程如圖6所示。
圖6 GA優(yōu)化BPNN模型流程Fig.6 Flow of the model optimized by GA
以BPNN0模型為例,首先輸入15個參數(shù)確定BPNN結(jié)構(gòu),然后對BPNN進行編碼操作,得到初始種群。編碼操作又稱種群初代化,種群規(guī)模設置為20,個體采用實數(shù)編碼,通過計算輸入層和隱含層的連接權值、隱含層的閾值與輸出層的連接權值、輸出層閾值個數(shù)進行疊加,組成一個長度為1 728的個體編碼;再通過解碼得到初始權值和閾值,將權值和閾值賦值給構(gòu)建的BPNN,使用樣本訓練網(wǎng)絡;然后將預測輸出與期望輸出之間的誤差絕對值作為個體的最佳適應度,因此適應度越小越好。將最佳適應度對應的染色體進行復制,通過交叉、變異操作產(chǎn)生一個新的種群(交叉和變異率分別設置為0.4、0.1),對比新種群與上一代種群的最佳適應度,擇優(yōu)選取,遺傳代數(shù)設置為50,循環(huán)至迭代結(jié)束,最后通過解碼得到神經(jīng)網(wǎng)絡最佳的權值和閾值,重新賦值給已經(jīng)構(gòu)建好的BPNN中,輸出47個高度層的相對濕度。
基于第3節(jié)中的BPNN,增加了GA,經(jīng)過50輪遺傳迭代,BPNN0模型經(jīng)優(yōu)化后的反演結(jié)果如圖7所示。共15個時刻的樣本數(shù)據(jù),其中前9個為無云天氣,后6個為有云天氣,大部分測試樣本經(jīng)GA優(yōu)化后誤差都呈顯著下降的趨勢,其中2008-01-14T18:21、01-15T17:04、01-29T04:42三條樣本下降幅度在50%左右,但也有兩條無云樣本(01-28T05:29與02-29T05:25)出現(xiàn)明顯增加,其中01-28T05:29樣本的MAE由10.942 5%增大到17.023 1%,RMSE由14.100 8%增大到21.955 7%;02-29T 05:25樣本的MAE由11.213 6%增大到16.067 8%,RMSE由20.204%增大到25.159 2%。
圖7 BPNN0模型經(jīng)GA優(yōu)化后反演結(jié)果的MAE和RMSEFig.7 MAE and RMSE of BPNN0 model inversion result optimized by GA
C-BPNN模型經(jīng)GA優(yōu)化后反演結(jié)果的MAE與RMSE如圖8所示,經(jīng)GA優(yōu)化后的C-BPNN最佳適應度從0.172 2下降至0.167 8,下降了6.3%。圖8(a)反演結(jié)果的MAE對比中有11條樣本具有明顯優(yōu)化效果,圖8(b)RMSE反演結(jié)果對比中有12條樣本具有明顯優(yōu)化效果,最大優(yōu)化樣本(01-19T05:44)較優(yōu)化前MAE由19.870 4%減小至7.704 9%,RMSE由25.797 2%減小至9.978 3%,3條樣本出現(xiàn)小幅度上升(01-14T18:21、02-29T05:25和01-17T05:01),最差優(yōu)化樣本(01-14T18:21)MAE由7.964 6%上升至11.096 9%,RMSE由11.392 5%上升至13.967 7%。
圖8 C-BPNN模型經(jīng)GA優(yōu)化后反演結(jié)果的MAE和RMSEFig.8 MAE and RMSE C-BPNN model inversion result optimized by GA
Z-BPNN模型經(jīng)GA優(yōu)化后反演結(jié)果的MAE與RMSE如圖9所示??梢钥闯觯?jīng)GA優(yōu)化后的ZBPNN最佳適應度由0.127 8下降至0.120 5,下降了5.7%,但優(yōu)化效果卻不明顯,MAE有8條樣本出現(xiàn)上升,RMSE有7條樣本出現(xiàn)上升,可能是其權值與閾值個數(shù)過于龐大,高達5 327個,而BPNN0與CBPNN模型僅有1 711和1 829個。實際上,在有云條件下,雷達反射率因子的強度與相對濕度并不存在正相關,只要有云存在相對濕度就會大于85%,云的強弱對相對濕度影響不大。綜上所述,經(jīng)GA優(yōu)化后的BPNN0與C-BPNN模型反演誤差顯著減小,對Z-BPNN優(yōu)化效果并不明顯,因此在實際應用過程中添加入云和出云的高度,建立C-BPNN模型效果最理想。
圖9 Z-BPNN模型經(jīng)GA優(yōu)化后反演結(jié)果的MAE和RMSEFig.9 MAE and RMSE of Z-BPNN model inversion result optimized by GA
通過ARM大氣觀測網(wǎng)站提供的毫米波測云雷達、微波輻射計以及對應時段的探空數(shù)據(jù),分別建立了添加不同云信息的BPNN反演模型與未添加任何云信息的BPNN模型,并對比分析了3種不同模型的反演情況。在對3種模型反演結(jié)果最好的個例進行時分析發(fā)現(xiàn)神經(jīng)網(wǎng)絡模型對初始權值與閾值較為敏感,因此通過GA對BPNN模型進行優(yōu)化,得到以下結(jié)論:
1)從15條測試樣本反演結(jié)果可知,添加不同云信息的C-BPNN與Z-BPNN模型反演結(jié)果好于未添加云信息的BPNN0反演模型,相較于BPNN0模型,C-BPNN模型最大MAE減小22.695 8%,RMSE減小27.773 5%;Z-BPNN模型MAE減少17.255 9%,RMSE減少21.114 4%。
2)從不同高度層的RMSE反演結(jié)果可知,CBPNN模型在反演相對濕度廓線上具有更好的穩(wěn)定性,RMSE隨著高度的升高,始終保持在20%左右,而Z-BPNN模型與BPNN0模型反演結(jié)果出現(xiàn)不同程度的躍變。
3)從建立的GA優(yōu)化3種BPNN模型反演結(jié)果可知,BPNN0模型得到顯著優(yōu)化,MAE與RMSE有不同程度的減??;C-BPNN模型中有12條樣本呈現(xiàn)不同程度改善,3條誤差變大的樣本,但增加幅度較??;而Z-BPNN模型反演的RMSE既有增大,也有減小,且波動幅度偏大。
反演結(jié)果對后續(xù)的研究具有一定的參考意義,但由于受限于樣本數(shù)量,導致實驗結(jié)果缺乏一定的普適性。下一步工作將繼續(xù)收集樣本,并在后續(xù)工作中加入對地基微波輻射計二次產(chǎn)品的反演。