關(guān)鍵詞:氣象雷達(dá);氣象目標(biāo)識(shí)別;殘差網(wǎng)絡(luò);輕量級(jí)梯度提升機(jī);融合;深度學(xué)習(xí)
中圖分類號(hào):TN957.5 文獻(xiàn)標(biāo)志碼:A DOI:10.12305/j.issn.1001-506X.2024.12.12
0引言
氣象目標(biāo)識(shí)別對(duì)于保證人類美好生活具有重要意義。氣象雷達(dá)是氣象目標(biāo)識(shí)別的基礎(chǔ)設(shè)施,其依靠發(fā)送和接收電磁波來(lái)獲取大氣中的目標(biāo)相關(guān)信息,通過(guò)雷達(dá)回波對(duì)目標(biāo)位置、特征形態(tài)等信息進(jìn)行判別。常規(guī)多普勒氣象雷達(dá)發(fā)送單一方向電磁波并由回波得到單一方向的反射率因子等參數(shù)。但僅依靠單一方向信息很難反映出氣象目標(biāo)的形態(tài)、空間取向等方面的具體情況,因此無(wú)法實(shí)現(xiàn)對(duì)氣象目標(biāo)的準(zhǔn)確識(shí)別。同時(shí)或交替發(fā)射水平和垂直方向的電磁波代替單一方向回波,可得到兩個(gè)相互垂直極化方向電磁波間的差分反射率、相關(guān)系數(shù)、差分相移率等極化參數(shù),雙極化氣象雷達(dá)由此誕生。雙極化氣象雷達(dá)憑借這些極化參數(shù),能更有效地獲取氣象目標(biāo)相態(tài)、類型等方面的具體情況,彌補(bǔ)常規(guī)多普勒氣象雷達(dá)存在的不足,在氣象目標(biāo)識(shí)別領(lǐng)域具有巨大優(yōu)勢(shì),有力推動(dòng)了氣象目標(biāo)識(shí)別技術(shù)的發(fā)展[1 7]。
在雷達(dá)實(shí)際工作中,雷達(dá)掃描照射到地面物體或者空中生物時(shí),其回波除氣象回波以外,還包含非氣象回波。非氣象回波混雜于氣象回波之中,影響氣象回波數(shù)據(jù)質(zhì)量,并影響氣象目標(biāo)分類。所以,對(duì)氣象目標(biāo)的識(shí)別研究一直以來(lái)都是氣象雷達(dá)數(shù)據(jù)質(zhì)量控制的一個(gè)重要內(nèi)容[811]。多年來(lái),模糊邏輯算法作為氣象目標(biāo)識(shí)別領(lǐng)域的主流算法,在氣象目標(biāo)識(shí)別中做出巨大貢獻(xiàn),但是由于模糊邏輯算法的運(yùn)行需要依靠專家經(jīng)驗(yàn),通用性不佳[12]。
針對(duì)傳統(tǒng)模糊邏輯算法存在的不足,研究者們開始將無(wú)需依靠經(jīng)驗(yàn)值的機(jī)器學(xué)習(xí)算法應(yīng)用至氣象目標(biāo)識(shí)別領(lǐng)域。2019年,Golbon-Haghighi等[13]提出一種新的三維判別函數(shù),作為其所提出的改進(jìn)地雜波識(shí)別算法的一部分,有效區(qū)分天氣信號(hào)與雜波信號(hào)的概率密度函數(shù),再選用一個(gè)簡(jiǎn)單的貝葉斯分類器,最后做出基于三維判別函數(shù)的最佳決策,從天氣信號(hào)中區(qū)分出雜波。2020年,Ma等[14]指出使用貝葉斯方法可有效完成對(duì)融化層與非融化層的判別,進(jìn)而改善干雪和小雨兩類氣象目標(biāo)的相互誤判。2021年,Jatau等[15]利用S波段雷達(dá)的高靈敏度特性,以所提出的鳥類(昆蟲)特征為數(shù)據(jù)驅(qū)動(dòng),訓(xùn)練出成熟的嶺回歸分類器,結(jié)合水凝物分類算法,有效完成鳥類回波、昆蟲回波與氣象目標(biāo)回波之間的分離工作。2022 年,Makinen等[16]提出一種有監(jiān)督的貝葉斯概率方法,得到雷達(dá)回波單個(gè)距離元中非氣象回波的細(xì)粒度識(shí)別,有效區(qū)分出7類氣象目標(biāo)和12類非氣象目標(biāo)。2023年,歐陽(yáng)彤等[17]提出一種基于輕量級(jí)梯度提升機(jī)(lightgradientboosting machine,LightGBM)算法的氣象目標(biāo)分類技術(shù),實(shí)現(xiàn)中小雨、冰雹、濕雪與雜波的4類氣象目標(biāo)的識(shí)別。
此外,一些研究者開始將可根據(jù)數(shù)據(jù)驅(qū)動(dòng)自動(dòng)優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetwork,CNN)應(yīng)用于氣象目標(biāo)識(shí)別工作中。2019 年,Lu 等[18]首先將雷達(dá)極化參數(shù)等效于圖像通道信息,將氣象目標(biāo)識(shí)別類比于圖像識(shí)別,以5個(gè)CNN 為基礎(chǔ)模型,實(shí)現(xiàn)4 種氣象目標(biāo)的分類過(guò)程,之后以其中識(shí)別最準(zhǔn)確的殘差CNN 為最終模型,得到對(duì)4類氣象目標(biāo)的最優(yōu)識(shí)別。2020 年,Yu 等[19]使用基礎(chǔ)CNN 有效解決機(jī)載氣象雷達(dá)回波識(shí)別領(lǐng)域中氣象目標(biāo)與地雜波的判別問(wèn)題。2022 年,高涌荇等[20]采用殘差CNN解決雙極化氣象雷達(dá)天氣信號(hào)檢測(cè)問(wèn)題,得到比CNN、支持向量機(jī)等算法更優(yōu)的識(shí)別結(jié)果,此算法大大提升對(duì)天氣信號(hào)的識(shí)別準(zhǔn)確性。
CNN 算法具有強(qiáng)大的數(shù)據(jù)識(shí)別與分類能力,比如文獻(xiàn)[20]中使用的基于殘差CNN 的氣象目標(biāo)識(shí)別方法,具有極其優(yōu)秀的識(shí)別率,但是這種識(shí)別方法需要類比于圖像分類,通過(guò)把切割分塊的極化參量與圖像通道信息進(jìn)行對(duì)應(yīng),以數(shù)據(jù)樣本粒度單位為塊狀矩陣,識(shí)別結(jié)果也以塊為基本單位并呈塊狀分布,塊內(nèi)占比較少目標(biāo)被忽視,識(shí)別結(jié)果較為粗糙。而在實(shí)際情況中,雷達(dá)獲取信息以雷達(dá)距離單元為基本單位,塊狀樣本單元包含多個(gè)距離單元,且氣象目標(biāo)分類分布往往是離散的、不確定的,導(dǎo)致樣本塊中距離單元類型不唯一。因此,此類算法容易造成塊內(nèi)小區(qū)域的識(shí)別偏差且在分界線上會(huì)出現(xiàn)與實(shí)際天氣分布不符的識(shí)別結(jié)果,識(shí)別精準(zhǔn)度不足。而文獻(xiàn)[17]中給出的基于LightGBM算法的氣象目標(biāo)識(shí)別方法以雷達(dá)采樣單元為數(shù)據(jù)樣本進(jìn)行預(yù)測(cè),能夠有效實(shí)現(xiàn)氣象目標(biāo)細(xì)粒度識(shí)別,但是在識(shí)別準(zhǔn)確度方面仍有較大提升空間。
基于上述分析,本文針對(duì)雙極化雷達(dá)氣象目標(biāo)識(shí)別問(wèn)題,在文獻(xiàn)[17]和文獻(xiàn)[20]的研究基礎(chǔ)上,提出融合Light-GBM 算法細(xì)粒度識(shí)別與CNN 高識(shí)別率特性,將殘差網(wǎng)絡(luò)的殘差網(wǎng)絡(luò)(residualnetworkofresidualnetwork:nextgeneration,ResNeXt)[21]與LightGBM 算法[22]相結(jié)合,提出一種氣象目標(biāo)識(shí)別方法,簡(jiǎn)稱為LightGBM-ResNeXt,實(shí)現(xiàn)對(duì)氣象目標(biāo)高精度且細(xì)粒度的識(shí)別。選用具有快速和準(zhǔn)確選擇能力且性能優(yōu)于殘差網(wǎng)絡(luò)(residualnetwork,Res-Net)的ResNeXt為第一層算法,得到高精度的粗粒度識(shí)別結(jié)果,再將此結(jié)果與實(shí)際標(biāo)簽的差異值輸入第二層Light-GBM 分類器,得到符合實(shí)際要求的細(xì)粒度識(shí)別結(jié)果。實(shí)驗(yàn)結(jié)果表明,相對(duì)于LeNet (Lecun net)和ResNet,ResNeXt對(duì)氣象目標(biāo)識(shí)別有更高的識(shí)別率,融合LightG-BM 算法的分類器之后,識(shí)別粒度得到高度提升,與雷達(dá)采樣單元粒度一致。
1Light GBM-ResNeXt氣象目標(biāo)識(shí)別
CNN氣象目標(biāo)識(shí)別算法,需將雷達(dá)極化參數(shù)等效于圖像通道,將極化參數(shù)制作成塊狀樣本,轉(zhuǎn)換成與圖像分類相似的任務(wù),實(shí)現(xiàn)氣象目標(biāo)識(shí)別。參考分類圖像如圖1所示。此類方法識(shí)別精度高、識(shí)別迅速,但是由于其基于切割后塊狀數(shù)據(jù)樣本進(jìn)行識(shí)別,所以識(shí)別結(jié)果也只能趨向數(shù)據(jù)切割后的參考結(jié)果,如圖1(b)所示。
對(duì)比圖1(a)和圖1(b)可知,美國(guó)國(guó)家海洋和大氣管理局(National Oceanicand Atmospheric Administration,NOAA)的原始參考圖像中氣象目標(biāo)分布比較離散,而切割參考圖像呈塊狀分布,兩者在識(shí)別粒度上存在較大差距。LightGBM 算法通過(guò)離散數(shù)據(jù)生成向量數(shù)據(jù)來(lái)反映特征和目標(biāo)類別的關(guān)系,是一種可以完成以雷達(dá)采樣單元為單位的、點(diǎn)到點(diǎn)識(shí)別的機(jī)器學(xué)習(xí)分類算法。LightGBM 算法的機(jī)器學(xué)習(xí)算法識(shí)別結(jié)果如圖1(c)所示。可見,LightGBM算法的識(shí)別分布與圖1(a)中原始參考數(shù)據(jù)表現(xiàn)相同,誤識(shí)別較多,如圖1(c)紅藍(lán)標(biāo)注所示。
為進(jìn)一步得到高精度且細(xì)粒度的氣象目標(biāo)識(shí)別結(jié)果,本文將具有離散特性的LightGBM 算法的分類器與具有高精度識(shí)別能力的CNN融合使用,建立一種兼并LightGBM算法細(xì)粒度識(shí)別特性與CNN 高精度識(shí)別能力的氣象目標(biāo)識(shí)別方法。CNN 融合LightGBM 算法的細(xì)分類器的整體識(shí)別過(guò)程具體步驟如圖2 所示。首先,制作矩陣塊樣本數(shù)據(jù)集,再根據(jù)數(shù)據(jù)集特性搭建ResNeXt分類模型框架,將矩陣塊數(shù)據(jù)集輸入模型并訓(xùn)練。將ResNeXt氣象目標(biāo)識(shí)別模型輸出的粗粒度識(shí)別結(jié)果CH 與NOAA 原始參考目標(biāo)進(jìn)行點(diǎn)對(duì)點(diǎn)對(duì)比。若識(shí)別正確,則將該點(diǎn)識(shí)別結(jié)果保存為CNN 識(shí)別結(jié)果CH;若判別失誤,則將ResNeXt判別結(jié)果與實(shí)際參考值的差異雷達(dá)距離單元數(shù)據(jù)輸入訓(xùn)練Light-GBM 算法的分類器。再由LightGBM 算法的分類器進(jìn)行細(xì)化識(shí)別,優(yōu)化粗粒度識(shí)別結(jié)果,將差異雷達(dá)距離單元點(diǎn)識(shí)別結(jié)果保存為LightGBM 算法的細(xì)化結(jié)果LH。最后,得到與實(shí)際氣象分布相符的高精度且細(xì)粒度的識(shí)別結(jié)果。
2算法原理
2.1ResNeXt氣象目標(biāo)粗粒度識(shí)別網(wǎng)絡(luò)
隨著計(jì)算機(jī)不斷優(yōu)化,CNN 在圖像分類領(lǐng)域已取得優(yōu)越成果[23]。研究表明,CNN 的深化和拓展可以優(yōu)化傳統(tǒng)模型的準(zhǔn)確性,但是隨著網(wǎng)絡(luò)層數(shù)的加深,會(huì)導(dǎo)致梯度爆炸、梯度消失甚至網(wǎng)絡(luò)退化等問(wèn)題。為解決這些問(wèn)題,ResNet[24]提出以殘差卷積結(jié)構(gòu)取締基礎(chǔ)卷積結(jié)構(gòu),從而解決由網(wǎng)絡(luò)深化產(chǎn)生的網(wǎng)絡(luò)退化問(wèn)題。然后,研究者又提出ResNeXt,ResNeXt 模型將視覺幾何組(visualgeometrygroup,VGG)網(wǎng)絡(luò)[25]的堆疊理念、ResNet的重復(fù)策略和Inception網(wǎng)絡(luò)[26]的拆分轉(zhuǎn)換合并的思想相結(jié)合,不僅解決了由網(wǎng)絡(luò)深化產(chǎn)生的梯度消失等問(wèn)題,而且能保持ResNet的基本網(wǎng)絡(luò)結(jié)構(gòu)。只需要對(duì)殘差卷積模塊進(jìn)行拓寬,即可在不增加參數(shù)復(fù)雜度的基礎(chǔ)上,提高識(shí)別精度,并且在一定程度上削減超參數(shù)的數(shù)目。
ResNeXt模型的主要思想是在ResNet模型基礎(chǔ)上進(jìn)行分組卷積,使得模型精度提升,但復(fù)雜度幾乎不變。圖3為普通卷積網(wǎng)絡(luò)、ResNet、ResNeXt等效變換結(jié)構(gòu)圖。在圖3(a)~圖3(c)的過(guò)程中,殘差卷積結(jié)構(gòu)取締普通卷積結(jié)構(gòu),解決由網(wǎng)絡(luò)深化產(chǎn)生的梯度消失等問(wèn)題。之后,分組殘差結(jié)構(gòu)又取締了殘差卷積結(jié)構(gòu),在保障復(fù)雜度幾乎不變的前提下,進(jìn)一步提高模型精度。
本文將氣象目標(biāo)與雜波(生物雜波與地雜波)的識(shí)別等效于圖像識(shí)別,數(shù)據(jù)集樣本矩陣尺寸大小預(yù)定為4×24×24,以ResNeXt原始網(wǎng)絡(luò)模型為基礎(chǔ),修改網(wǎng)絡(luò)參數(shù),設(shè)計(jì)適用于本文數(shù)據(jù)集的ResNeXt,最終完成氣象目標(biāo)與雜波識(shí)別。本文ResNeXt結(jié)構(gòu)如圖4所示。
3模型訓(xùn)練與驗(yàn)證
3.1數(shù)據(jù)集制作
本文數(shù)據(jù)集來(lái)源于NOAA提供的雙極化雷達(dá)氣象數(shù)據(jù)記錄。選取氣象雷達(dá)站點(diǎn)代碼為KVNX 的雷達(dá)在2021年全年的觀測(cè)數(shù)據(jù),從中提取雷達(dá)仰角為0.5°的4 個(gè)極化參數(shù)(反射率因子、差分反射率、相關(guān)系數(shù)、差分相移率)以及對(duì)應(yīng)的NOAA 分類結(jié)果數(shù)據(jù),將5類數(shù)據(jù)分別記為Zh、Zdr、Kdp、ρhv、Cls。
作為一種信息單向傳播的前饋多層網(wǎng)絡(luò),CNN 以圖片的GRB (green,red,blue)通道信息為數(shù)據(jù)驅(qū)動(dòng),可以通過(guò)層層轉(zhuǎn)化,自動(dòng)學(xué)習(xí)圖像特征,最終達(dá)到分類的目的。本文以反射率因子、差分反射率、相關(guān)系數(shù)、差分相移率這4 個(gè)極化參數(shù)為識(shí)別輸入數(shù)據(jù),結(jié)合NOAA 分類標(biāo)簽制作數(shù)據(jù)集標(biāo)簽。這些極化參數(shù)與圖像通道信息雖有差距,但可以對(duì)極化參數(shù)預(yù)處理,在保證這些極化參數(shù)的通用性的同時(shí),可將這些極化參數(shù)等效于圖像通道信息,堆疊4 個(gè)極化參數(shù)二維數(shù)據(jù)矩陣,形成三維數(shù)據(jù)陣列。最后,以這些三維數(shù)據(jù)陣列為數(shù)據(jù)集,類比于圖像分類,利用CNN,完成氣象目標(biāo)與非氣象目標(biāo)的區(qū)分。
數(shù)據(jù)集的制作過(guò)程如圖5 所示。首先,在網(wǎng)站所提供的數(shù)據(jù)中,Zh 數(shù)據(jù)的大小為360×460,其他數(shù)據(jù)的大小為360×1200。為得到有效可靠的數(shù)據(jù)集,需先對(duì)Zh 進(jìn)行校準(zhǔn),得到與其他數(shù)據(jù)大小對(duì)應(yīng)的Zh。處理后,各數(shù)據(jù)矩陣大小均為360×1200,這與實(shí)際圖像尺寸不符。此外,在單次掃描范圍內(nèi),由于氣象目標(biāo)分類分布往往是離散的、不確定的,導(dǎo)致氣象目標(biāo)中摻雜大量雜波目標(biāo)以及一些無(wú)效值。因此,為保證單個(gè)數(shù)據(jù)矩陣數(shù)據(jù)樣本質(zhì)量,需要盡可能避免混雜回波的干擾,并對(duì)無(wú)效值數(shù)據(jù)進(jìn)行處理。綜上,需要將雷達(dá)極化參數(shù)做如下處理,以生成適配CNN 訓(xùn)練的數(shù)據(jù)集。首先,將原始極化參數(shù)矩陣校準(zhǔn)并堆疊。其次,進(jìn)行切割分塊,將原來(lái)的360×1200大尺寸二維矩陣拆分為750個(gè)24×24的小尺寸二維矩陣塊,再舍棄無(wú)效值點(diǎn)超過(guò)80%的矩陣塊。此時(shí),矩陣塊中依然包含氣象目標(biāo)、雜波以及一些無(wú)效值。因此,將占比超過(guò)50% 的類別記為此矩陣塊類別,將其他數(shù)據(jù)視為無(wú)效數(shù)據(jù)并舍棄。之后,選用各矩陣塊中有效值的均值替代該矩陣塊中包含的無(wú)效值。最后,將極化參數(shù)進(jìn)行歸一化處理,使得網(wǎng)絡(luò)模型與數(shù)據(jù)擬合更加高效。為保障兩類數(shù)據(jù)樣本均衡,選取氣象目標(biāo)與雜波樣本量均為15000,再將此數(shù)據(jù)集隨機(jī)切割為比例為7∶2∶1的訓(xùn)練集、驗(yàn)證集與測(cè)試集。
3.2 ResNeXt訓(xùn)練
本文以Pytorch[30]為深度學(xué)習(xí)框架,完成ResNeXt、LeNet、ResNet氣象目標(biāo)識(shí)別模型以及LightGBM 算法細(xì)分類器的創(chuàng)建。本研究?jī)?nèi)核為分類,故選用交叉熵?fù)p失函數(shù)為模型損失函數(shù),再使用隨機(jī)梯度下降(stochasticgradi-entdescent,SGD)優(yōu)化器,利用梯度下降調(diào)整網(wǎng)絡(luò)權(quán)重,優(yōu)化器參數(shù)設(shè)置如表1 所示。在訓(xùn)練過(guò)程中,設(shè)置批量大小為128,迭代次數(shù)為400,確保模型訓(xùn)練成功。
深度學(xué)習(xí)過(guò)程的一個(gè)重要特性是比較學(xué)習(xí)結(jié)果與樣本標(biāo)簽兩者的差距,兩者差距越小,表示模型學(xué)習(xí)效果越強(qiáng)。深度學(xué)習(xí)普遍以損失函數(shù)來(lái)表示這個(gè)差距,理論上,損失函數(shù)越小越好,但是其不可能為零,只能無(wú)限逼近于零。當(dāng)損失函數(shù)收斂時(shí),可以判斷網(wǎng)絡(luò)模型學(xué)習(xí)成功。此外,分類準(zhǔn)確率在分類問(wèn)題中是描述分類算法性能的有力工具,因此本文以損失函數(shù)和準(zhǔn)確率來(lái)說(shuō)明模型性能。為充分表現(xiàn)ResNeXt模型對(duì)氣象目標(biāo)與非氣象目標(biāo)的識(shí)別能力,本文以相同數(shù)據(jù)集訓(xùn)練LeNet模型[31]和ResNet,對(duì)比二者與ResNeXt的性能表現(xiàn)。圖6~圖9為訓(xùn)練過(guò)程中訓(xùn)練集與驗(yàn)證集的損失函數(shù)、準(zhǔn)確率變換曲線。從圖6 和圖7 可以看出,隨著迭代次數(shù)的增加,ResNeXt、LeNet、ResNet的訓(xùn)練集與驗(yàn)證集損失函數(shù)迅速下降并穩(wěn)定,并且未出現(xiàn)過(guò)擬合現(xiàn)象。由此可見,模型成功完成訓(xùn)練。由圖8和圖9可知,ResNeXt識(shí)別準(zhǔn)確度要強(qiáng)于LeNet和ResNet,這與理論上各模型的性能表現(xiàn)一致。此外,ResNeXt的訓(xùn)練集、驗(yàn)證集訓(xùn)練曲線在穩(wěn)定時(shí)的識(shí)別準(zhǔn)確率均超過(guò)99.6%,這表示ResNeXt在氣象目標(biāo)與非氣象目標(biāo)的判別問(wèn)題上具有良好性能。
為進(jìn)一步證明模型表現(xiàn)力,使用訓(xùn)練獲取的3個(gè)網(wǎng)絡(luò)最優(yōu)模型對(duì)測(cè)試集進(jìn)行初步檢測(cè),圖10~ 圖12 為測(cè)試集在LeNet、ResNet和ResNeXt最優(yōu)模型上的混淆矩陣。由3個(gè)混淆矩陣可以看出,3個(gè)CNN 對(duì)氣象回波與非氣象回波識(shí)別性能都很優(yōu)越,但ResNeXt模型對(duì)氣象回波和非氣象回波的識(shí)別精度均高于LeNet、ResNet模型,整體識(shí)別效果極佳,這與訓(xùn)練過(guò)程中3個(gè)模型的表現(xiàn)相符。
由圖6~圖12可以明顯看出,在訓(xùn)練集、驗(yàn)證集以及測(cè)試集上,ResNeXt模型表現(xiàn)都要優(yōu)于LeNet和ResNet模型,這與理論預(yù)測(cè)結(jié)果相符。
3.3LightGBM算法分類器訓(xùn)練
將CNN 氣象目標(biāo)識(shí)別模型所輸出的粗粒度識(shí)別結(jié)果CH 與NOAA 原始參考目標(biāo)標(biāo)簽進(jìn)行點(diǎn)對(duì)點(diǎn)對(duì)比,將CNN目標(biāo)樣本塊與參考數(shù)據(jù)的差異雷達(dá)距離單元點(diǎn)數(shù)據(jù)作為LightGBM 算法細(xì)化分類器的輸入數(shù)據(jù),訓(xùn)練LightGBM算法分類器,圖13和圖14 為LightGBM 算法分類器訓(xùn)練過(guò)程曲線。如圖13 和圖14 所示,隨著迭代次數(shù)的增加,LightGBM 算法分類器在訓(xùn)練集、驗(yàn)證集的損失函數(shù)和準(zhǔn)確率都迅速趨于穩(wěn)定,未出現(xiàn)過(guò)擬合現(xiàn)象,分類器訓(xùn)練成功。但是,LightGBM 算法分類器對(duì)氣象目標(biāo)與非氣象目標(biāo)的識(shí)別準(zhǔn)確度只超過(guò)98.6%,識(shí)別能力低于CNN。
3.4LightGBM-ResNeXt算法性能驗(yàn)證
為驗(yàn)證模型對(duì)雷達(dá)實(shí)際觀測(cè)數(shù)據(jù)的預(yù)測(cè)能力,本文選取非訓(xùn)練數(shù)據(jù)集數(shù)據(jù),即NOAA網(wǎng)站上KTLX雙極化天氣雷達(dá)2021年4月24日02:56的雷達(dá)0.5°仰角觀測(cè)回波數(shù)據(jù)進(jìn)行測(cè)試。圖15為校準(zhǔn)后Zh、Zdr、Zdp、ρhv原始數(shù)據(jù)圖像,4個(gè)分圖右側(cè)坐標(biāo)軸表示圖中參數(shù)值大小與顏色的對(duì)應(yīng)關(guān)系。
KTLX 雷達(dá)識(shí)別結(jié)果如圖16 所示。LeNet、ResNet和ResNeXt的氣象目標(biāo)識(shí)別結(jié)果如圖16(c)~ 圖16(e)所示。可見,ResNeXt模型將一個(gè)雜波樣本塊識(shí)別為氣象目標(biāo),將兩個(gè)氣象目標(biāo)樣本塊識(shí)別為雜波。LeNet模型將4個(gè)氣象目標(biāo)樣本塊誤識(shí)別為雜波。ResNet模型則將一個(gè)雜波樣本塊識(shí)別為氣象目標(biāo),將3個(gè)氣象目標(biāo)樣本塊識(shí)別為雜波。從誤識(shí)別塊數(shù)以及與圖16(b)的比較可知,數(shù)據(jù)切割后,CNN 對(duì)氣象目標(biāo)識(shí)別在整體上表現(xiàn)十分優(yōu)越,與切割參考圖像基本一致,且ResNeXt模型對(duì)非氣象回波的識(shí)別能力要強(qiáng)于LeNet模型和ResNet模型。此外,三卷積網(wǎng)絡(luò)模型主要的誤識(shí)別在于將氣象目標(biāo)識(shí)別為雜波,這與測(cè)試集混淆矩陣的表現(xiàn)一致。
圖16(f)為采用LightGBM 算法的識(shí)別結(jié)果,與圖16(a)比較可見,LightGBM 算法的識(shí)別結(jié)果與NOAA參考分類在識(shí)別粒度、分布狀態(tài)上表現(xiàn)基本一致,但是LightGBM 算法的識(shí)別結(jié)果存在一定區(qū)域的誤判,如圖16(f)中黑色方框區(qū)域和黑色橢圓區(qū)域所示。
圖16(g)為ResNeXt結(jié)合LigthGBM 算法分類器細(xì)化后的識(shí)別結(jié)果。由圖16比較可知,融合ResNeXt和Light-GBM 算法的LightGBM-ResNeXt氣象目標(biāo)識(shí)別方法能夠有效識(shí)別氣象目標(biāo)與雜波。相對(duì)于單一的ResNeXt識(shí)別結(jié)果而言,識(shí)別粒度有效提升;相對(duì)于單一的LightGBM 算法識(shí)別結(jié)果而言,誤判明顯減少,如圖16(g)中不存在圖16(f)中黑色方框和黑色橢圓區(qū)域所示的誤判;LightGBM-ResNeXt氣象目標(biāo)識(shí)別方法對(duì)氣象目標(biāo)的識(shí)別基本上與NOAA 參考數(shù)據(jù)相同,精確度明顯提高,識(shí)別粒度較細(xì)。
4結(jié)論
為有效區(qū)分氣象目標(biāo)與雜波,本文提出一種基于ResNeXt網(wǎng)絡(luò)并融合LightGBM 算法的氣象目標(biāo)識(shí)別方法。該方法融合LightGBM 算法細(xì)粒度識(shí)別能力與ResNeXt高精度識(shí)別特性,采用氣象雷達(dá)實(shí)測(cè)數(shù)據(jù)對(duì)本文所建立的識(shí)別模型進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,ResNeXt識(shí)別模型性能要優(yōu)于LeNet、ResNet模型,識(shí)別精度可達(dá)99.6%以上,但是識(shí)別單元較大,識(shí)別結(jié)果較粗糙。Light-GBM 算法的分類器雖然可以實(shí)現(xiàn)以雷達(dá)距離單元為識(shí)別單位的氣象目標(biāo)識(shí)別,但是對(duì)兩類目標(biāo)的識(shí)別精度只能達(dá)到98%。而融合LightGBM 算法之后的ResNeXt模型,不僅具有ResNeXt模型的準(zhǔn)確識(shí)別能力,還擁有LightGBM 算法的精細(xì)識(shí)別優(yōu)勢(shì),能精細(xì)且高精度地識(shí)別氣象目標(biāo)與雜波,其結(jié)果相比于CNN 識(shí)別結(jié)果而言更加精細(xì),識(shí)別精度又優(yōu)于LightGBM 算法的分類器,與參考結(jié)果一致性極高。
作者簡(jiǎn)介
歐陽(yáng)彤(1997—),女,碩士研究生,主要研究方向?yàn)闅庀罄走_(dá)目標(biāo)識(shí)別。
汪玲(1977—),女,教授,博士,主要研究方向?yàn)槔走_(dá)信號(hào)處理。
朱岱寅(1974—),男,教授,博士,主要研究方向?yàn)楹铣煽讖嚼走_(dá)/逆合成孔徑雷達(dá)成像、自聚焦算法、干涉合成孔徑雷達(dá)成像、合成孔徑雷達(dá)地面動(dòng)目標(biāo)指示、機(jī)載雷達(dá)動(dòng)目標(biāo)指示。
李勇(1977—),男,副教授,博士,主要研究方向?yàn)槔走_(dá)信號(hào)處理、雷達(dá)系統(tǒng)。