吳 鵬 李洪輝 于 雷 吳昌哲*
(哈爾濱工程大學(xué),黑龍江 哈爾濱 150001)
目前大氣的探測三種主要手段分別是探空氣球、衛(wèi)星遙感和地基微波輻射計。探空氣球可以獲取較為精準(zhǔn)的大氣溫濕廓線信息,但其每次觀測需要等待氣球升空,耗費時間太長且具有時空不一致性大大局限了探空氣球的應(yīng)用[1]。衛(wèi)星遙感通過星載感知設(shè)備測量上行大氣輻射能量信息(即亮溫譜線),之后將亮溫譜線反演得到大氣溫濕度廓線實現(xiàn)大氣溫濕度廓線遙感觀測。衛(wèi)星遙感的工作原理決定了:所觀測地區(qū)穿越云層越厚所受到的吸收和散射就越強,則大氣溫濕度廓線反演結(jié)果的精度就越低,導(dǎo)致衛(wèi)星遙感技術(shù)在近地面反演的大氣溫濕度廓線誤差較大,無法滿足對溫濕度廓線高精度的需求[2,3]。為滿足對溫濕度廓線高精度的需求,大量專家、學(xué)者將目光投向地基微波遙感技術(shù)。與衛(wèi)星遙感相反,地基微波遙感技術(shù)利用輻射能量觀測設(shè)備測量下行大氣輻射信息,從原理上減少了云層吸收和散射所帶來的誤差,也使得其在低空大氣觀測領(lǐng)域有更好的表現(xiàn)。微波輻射計將輻射信號轉(zhuǎn)化為電信號以實現(xiàn)對不同通道大氣輻射能量的觀測獲得亮溫譜線,再通過算法反演獲得大氣溫濕度廓線[4,5]。
大氣溫濕度廓線反演的算法主要可以分為以下三類:統(tǒng)計回歸法、物理反演法以及神經(jīng)網(wǎng)絡(luò)法[6]。作為最早被使用的方法,統(tǒng)計回歸法建模簡單、容錯性較低、對異常處理能力不足。物理反演算法依托于大氣輻射傳輸方程、從物理規(guī)律出發(fā)具有較強的細節(jié)處理能力,但是算法迭代時間較長不具有實時性。神經(jīng)網(wǎng)絡(luò)是一種模仿生物神經(jīng)系統(tǒng)的機器學(xué)習(xí)算法,該算法目前已經(jīng)廣泛應(yīng)用于氣象處理領(lǐng)域,該算法建立觀測亮溫譜線與大氣溫濕度廓線之間的非線性網(wǎng)絡(luò),利用大量的大氣參數(shù)歷史數(shù)據(jù)對網(wǎng)絡(luò)權(quán)值進行大量訓(xùn)練,最終得到最能體現(xiàn)兩者之間關(guān)系的網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)算法的優(yōu)勢在于容錯性好,高精度、穩(wěn)定性好以及算法效率高[7]。本文主要是對0~10km 低空大氣溫濕度廓線在訓(xùn)練網(wǎng)絡(luò)時不同分層方案進行優(yōu)劣勢分析。
本文采用的是BP(Back-propagation,反向傳播)神經(jīng)網(wǎng)絡(luò)進行網(wǎng)絡(luò)模型訓(xùn)練。BP 神經(jīng)網(wǎng)絡(luò)是傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)是一種監(jiān)督的機器學(xué)習(xí)算法,它包括信號的前向傳播和誤差的反向傳播兩個過程。
計算輸出誤差時按從輸入到輸出的方向進行,而調(diào)整權(quán)值和閾值則反過來從輸出到輸入的方向進行。正向傳播時,輸入信號通過隱藏層作用于輸出節(jié)點,經(jīng)過激活函數(shù)運算求和產(chǎn)生輸出信號,計算實際輸出與期望輸出的誤差值,將誤差傳入反向傳播過程。誤差反向傳播是將輸出誤差通過隱藏層向輸入層逐層反向傳播,以從各層獲得的誤差信號作為調(diào)整各單元權(quán)值的依據(jù)。調(diào)整輸入節(jié)點與隱藏層節(jié)點、隱層節(jié)點與輸出節(jié)點之間兩組聯(lián)接強度和閾值,采用梯度下降法經(jīng)過反復(fù)學(xué)習(xí)訓(xùn)練相對應(yīng)的網(wǎng)絡(luò)權(quán)值和閾值。
多通道地基微波輻射計MP3000A 產(chǎn)自Radiometric 公司研發(fā)的,該地基微波輻射計共包含35 個測量通道,工作時采用掃頻法對大氣微波輻射每個頻點進行測量。設(shè)備集成度高體積相對較小,可進行多角度的大氣參數(shù)觀測[9,10]。
神經(jīng)網(wǎng)絡(luò)輸入端數(shù)據(jù)包括:微波輻射計MP3000A 所測得22.235GHz、22.500 GHz、23.035 GHz、23.835 GHz、25.000 GHz、26.235 GHz、28.000 GHz、30.000 GHz、51.250 GHz、51.760 GHz、52.280 GHz、52.800 GHz、53.340 GHz、53.850 GHz、54.400 GHz、54.940 GHz、55.500 GHz、56.020 GHz、56.660 GHz、57.290 GHz、57.960 GHz、58.800 GHz 共22 個頻點的亮溫數(shù)據(jù)以及地表測得的溫度、氣壓、相對濕度、紅外數(shù)據(jù),總共26 組數(shù)據(jù)。在0-10km的低空想要得到垂直分辨率較高的大氣溫濕度廓線,那么就需要增加輸出層節(jié)點的數(shù)量。方案一中輸出端高度分辨率為100 米一層將0-10km 分成了100 層,這樣就使得輸出節(jié)點數(shù)量過于龐大;方案二將0-10km 分成0-2、2-6、6-10km,各層輸出層節(jié)點分別為20、40、40;方案三將0-10km 分成0-3、3-7、7-10km,各層輸出層節(jié)點分別為30、40、30;方案四將0-10km 分成0-2.5、2.5-5、5-7.5、7.5-10km,各層輸出層節(jié)點分別為25、25、25、25;各神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點數(shù)量的選擇由經(jīng)驗公式確定,表1。
表1 方案分層情況
方案二神經(jīng)網(wǎng)絡(luò)分層示意圖如圖1,分層高層、中層和底層,其他方案的分層形式同理。
圖1 方案二分層示意圖
本文這四個方案神經(jīng)網(wǎng)絡(luò)訓(xùn)練統(tǒng)一使用樣本為臺州地區(qū)2015-2019 年共6 年的大氣參數(shù)歷史數(shù)據(jù),實驗中去除數(shù)據(jù)中的空數(shù)據(jù)和不合格數(shù)據(jù),75%作為訓(xùn)練集,25%作為測試集。然后從臺州地區(qū)2020 年數(shù)據(jù)中選取200 組數(shù)據(jù)來驗證這些網(wǎng)絡(luò)的表現(xiàn)。
神經(jīng)網(wǎng)絡(luò)的預(yù)測性能直接由網(wǎng)絡(luò)訓(xùn)練結(jié)果決定,訓(xùn)練得到網(wǎng)絡(luò)模型后對網(wǎng)絡(luò)訓(xùn)練結(jié)果進行分析。將檢驗樣本代入各方案網(wǎng)絡(luò)進行計算,各方案大氣溫度廓線輸出的平均誤差和均方根誤差結(jié)果如表2 所示。
表2 各方案大氣溫度廓線輸出的統(tǒng)計結(jié)果
從數(shù)據(jù)上來看,分層方案二、三反演得到的大氣溫度廓線的均方根誤差和平均誤差均小于方案一反演結(jié)果,但是方案四的均方根誤差和平均誤差與方案一相差不大。由此說明分層方案在網(wǎng)絡(luò)訓(xùn)練中能一定程度上更為精準(zhǔn)的提取出數(shù)據(jù)特征,但是分層方案四也表明分層時需要有一定考量。
整體來看在4km 以下各方案結(jié)果都比較接近探空真值,誤差波動較小,然而在7km 以上各方案的差距慢慢拉大,方案二和方案三更為接近探空真值,方案四與方案一表現(xiàn)差距不大。方案四說明一味地多分層效果不一定會更好??傮w上分層方案表現(xiàn)優(yōu)于不分層的方案一,特別是在7km 以上的高層。
最后,可以從各個方案訓(xùn)練使用的時間對比直方圖(圖2)可以看出,方案一平均耗時65 小時左右,方案二、方案三、方案四分別為1.53 小時、1.62 小時、1.12 小時。由此可見分層可以極大的縮減網(wǎng)絡(luò)訓(xùn)練所用時間,原因主要是減少隱藏層節(jié)點數(shù)會極大地提升網(wǎng)絡(luò)迭代計算的速度,減少算法執(zhí)行周期的時間。輸出節(jié)點過多會使得網(wǎng)絡(luò)數(shù)據(jù)特征提取困難,導(dǎo)致網(wǎng)絡(luò)迭代速度下降。并且大氣層分層處理并沒有導(dǎo)致分層方案的結(jié)果廓線的不連續(xù)性。
圖2 各方案訓(xùn)練時間對比圖
本文基于MP3000A 進行低空大氣溫度廓線反演,在BP 網(wǎng)絡(luò)的基礎(chǔ)上采用多種方案構(gòu)建網(wǎng)絡(luò),并比較了各分層網(wǎng)絡(luò)反演結(jié)果。方案二和方案三較之不分層的方案一在精度與網(wǎng)絡(luò)訓(xùn)練效率方面都要更具有優(yōu)勢,特別是在高層大氣優(yōu)勢明顯。分層方案反演所需時間的減少,極大地提升了用用的靈活性。同時分層越多并不代表會得到更好的結(jié)果,而且不同的分層方案得到提升效果也不盡相同。由于云層會直接影響輻射傳輸?shù)模酉聛淼难芯糠较蚴侨绾谓Y(jié)合云層特點來分層使得分層網(wǎng)絡(luò)有更好的性能。