摘要:高光譜遙感圖像具有豐富的光譜信息,但其波段數(shù)量龐大,導(dǎo)致數(shù)據(jù)冗余和計算復(fù)雜度增加,限制了其在實(shí)際應(yīng)用中的效率。針對該問題,本文提出了一種基于ResNet的波段選擇方法BSNET_ResNet,通過深度學(xué)習(xí)技術(shù)挖掘高光譜圖像的光譜和空間信息,同時降低數(shù)據(jù)維度。BSNET_ResNet方法由波段特征提取模塊和波段重構(gòu)模塊組成。在特征提取模塊中,利用卷積神經(jīng)網(wǎng)絡(luò)對高光譜圖像進(jìn)行前置處理,以增強(qiáng)數(shù)據(jù)質(zhì)量并提取關(guān)鍵特征。波段重構(gòu)模塊則基于特征提取模塊的輸出,對提取的特征進(jìn)行放大和還原,以恢復(fù)原始波段數(shù)。通過計算不同波段的權(quán)重,BSNET_ResNet能夠選擇出最具代表性的波段,從而在保證信息完整性的同時降低數(shù)據(jù)冗余。
關(guān)鍵詞:高光譜遙感圖像;波段選擇;ResNet;深度學(xué)習(xí);特征提取
中圖分類號:TP751 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2024)24-0036-04
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID)
0 引言
高光譜遙感圖像往往由數(shù)百個光譜波段組成,為地表描繪提供了豐富且具有價值的光譜信息[1]。然而,高光譜圖像的波段數(shù)量較大,使得數(shù)據(jù)量劇增,不利于存儲與計算。此外,相鄰波段之間間距較短,信息差異較小,從而產(chǎn)生了數(shù)據(jù)冗余。在高光譜圖像中進(jìn)行波段選擇,可以充分挖掘其豐富信息的同時降低數(shù)據(jù)量,因此在實(shí)際應(yīng)用中具有重要意義。
高光譜圖像波段選擇的主要目的是從原始圖像數(shù)據(jù)中剔除冗余的波段,保留有用的波段。對圖像分類任務(wù)而言,分類準(zhǔn)確率很大程度上取決于波段選擇[2]?,F(xiàn)有的波段選擇方法可以分為無監(jiān)督和有監(jiān)督兩種。無監(jiān)督的高光譜波段選擇方法是通過利用電磁波譜的結(jié)構(gòu)信息或統(tǒng)計方法來進(jìn)行波段選擇。然而,與有監(jiān)督方法相比,由于數(shù)據(jù)不可感知特性,無監(jiān)督方法在特定任務(wù)上的表現(xiàn)通常較差。另一個問題是信息基礎(chǔ)與應(yīng)用的相關(guān)性,所選擇的信息標(biāo)準(zhǔn)可能與任務(wù)無關(guān),因此,所選波段的表現(xiàn)可能比全波段要差。同時,波段選擇過程無須漫長的訓(xùn)練過程,可直接應(yīng)用于沒有標(biāo)簽的數(shù)據(jù)集。
無監(jiān)督高光譜圖像波段選擇方法按照選擇原理不同,可分為搜索、稀疏性、聚類、排序等4種?;谒阉鞯牟ǘ芜x擇方法通過尋找波段的最佳子集來達(dá)到優(yōu)化的目的。ZHAO[3]設(shè)計了一種基于fisher score與超像素相結(jié)合的適應(yīng)度函數(shù),用于評估同時考慮光譜和空間信息的波段子集的可區(qū)分性?;谙∈栊缘姆椒▽⑾∈璞磉_(dá)理論應(yīng)用于高光譜圖像波段選擇中,其假設(shè)每個波段可以由其他幾個波段稀疏表示。TANG[4]提出了一種基于稀疏表示的HSI目標(biāo)檢測方法(TD-SRBBS)。在子空間劃分中定義對稱Kullback-Leibler散度,使原始HSI數(shù)據(jù)集成為子集。對每個子集的檢測結(jié)果進(jìn)行稀疏重建,然后根據(jù)所選頻帶與稀疏向量的非零元素之間的一一對應(yīng)關(guān)系進(jìn)行波段選擇?;诰垲惖姆椒ㄏ葘⒉ǘ尉垲?,然后在波段中選擇出最不相關(guān)的作為最終的波段。例如,HUANG[5]提出了一種基于張量的高光譜波段選擇子空間聚類模型,模型中的三個因子矩陣和一個核心張量共同編碼了高光譜多模相關(guān)性,有效避免了破壞張量結(jié)構(gòu)和信息丟失?;谂判虻姆椒ㄉ婕耙环N策略,該策略首先根據(jù)預(yù)先設(shè)定的標(biāo)準(zhǔn)來評估光譜波段的重要性,然后根據(jù)這些重要性評分對波段進(jìn)行排序。排序完成后,會選擇那些排名靠前,即重要性更高的波段進(jìn)行后續(xù)分析或應(yīng)用。簡而言之,排序法是一個基于波段優(yōu)先級評估的篩選過程,目的是挑選出最具信息量的光譜波段。主成分分析(Principal Component Analysis,PCA)是一種常用的無監(jiān)督降維技術(shù),在高光譜圖像的波段選擇中得到了廣泛應(yīng)用,PCA可以通過將原始波段變換為一組互相正交的主成分,實(shí)現(xiàn)了數(shù)據(jù)的精簡和信息的濃縮。最大方差主成分分析法(Maximum Variance PCA,MVPCA)[6]通過改進(jìn)PCA方法對波段的方差進(jìn)行排序,進(jìn)而選擇出主要波段。
基于監(jiān)督的高光譜圖像波段選擇方法使用已有的樣本標(biāo)簽等先驗(yàn)知識進(jìn)行波段選擇。采用監(jiān)督方法進(jìn)行波段選擇的分類精度通常優(yōu)于非監(jiān)督方法。但是有標(biāo)簽高光譜圖像的獲取過程成本高、耗時長。Habermann[7]提出了一種新的基于神經(jīng)網(wǎng)絡(luò)的監(jiān)督模型用于高光譜圖像波段選擇。每個類使用一個單層神經(jīng)網(wǎng)絡(luò)分類器,用于該類與其余數(shù)據(jù)之間的分類。CAO[8]引入了基于高光譜圖像局部空間信息的監(jiān)督模型和包裝方法來選擇最具信息量的光譜波段。
隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,深度學(xué)習(xí)相關(guān)技術(shù)在高光譜圖像波段選擇中也得到了應(yīng)用[9]。CHANG[10]引入了一個合并卷積神經(jīng)網(wǎng)絡(luò)(C-CNN),它由一個三維卷積神經(jīng)網(wǎng)絡(luò)(3D-CNN)和一個二維卷積神經(jīng)網(wǎng)絡(luò)(2D-CNN)合并而成。首先,選擇信息量最大的光譜波段進(jìn)行主成分分析。然后,利用3D-CNN同時提取光譜特征和空間特征,并利用2D-CNN進(jìn)一步學(xué)習(xí)空間特征。ZHOU[11]提出了一種基于數(shù)據(jù)驅(qū)動的迭代圖自動編碼器(IGAEBS)。通過訓(xùn)練圖卷積神經(jīng)網(wǎng)絡(luò)來提取HSI特征。這些特征被用來構(gòu)建一個圖來表示波段之間的結(jié)構(gòu)關(guān)系。利用導(dǎo)出的圖,波段被劃分為若干簇,并從不同的簇中選擇不同的具有代表性的波段。
1 BSNET_ResNet波段選擇方法
本文提出了一種基于ResNet的波段選擇方法BSNET_ResNet(Band Selection ResNet)。該方法由2個模塊組成:1)波段特征提取模塊;2)波段重構(gòu)模塊。波段特征提取模塊的主要任務(wù)是從原始的遙感圖像中提取每個波段的特征,利用卷積神經(jīng)網(wǎng)絡(luò)對原始高光譜數(shù)據(jù)進(jìn)行前置處理和優(yōu)化,以提高其數(shù)據(jù)質(zhì)量。波段重構(gòu)模塊將提取后的圖像數(shù)據(jù)特征進(jìn)行放大和還原,將波段數(shù)恢復(fù)為原始波段數(shù),通過計算不同波段權(quán)重,最終選擇出最佳波段。
1.1 模型結(jié)構(gòu)
1.1.1 波段特征提取模塊
高光譜圖像數(shù)據(jù)作為特征提取網(wǎng)絡(luò)的輸入,用于從中抽取出關(guān)鍵的特征信息。將每個波段的數(shù)據(jù)通過卷積網(wǎng)絡(luò)進(jìn)行特征提取,模型中特征提取部分由卷積模塊、池化層、全連接層組成,通過使用深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)提取高光譜圖像的空間特征。該模塊的結(jié)構(gòu)圖如圖1所示:
其結(jié)構(gòu)特點(diǎn)為對特征圖進(jìn)行平均池化操作,將特征圖的每個通道上的數(shù)值取平均值。這有助于在保留圖像中重要信息的同時,減少特征圖的空間維度。通過對特征圖進(jìn)行平均池化操作,可以有效地降低特征圖的空間維度,同時保留重要信息。最后使用全連接層處理卷積層提取的特征,并將其映射到一個更高維的空間,從而捕獲更多的抽象特征,以提高模型性能。
1.1.2 波段重構(gòu)模塊
殘差塊(Residual Block)是深度神經(jīng)網(wǎng)絡(luò)中的一個重要組件,特別適用于構(gòu)建深層網(wǎng)絡(luò)。這種設(shè)計旨在解決深度網(wǎng)絡(luò)訓(xùn)練過程中可能出現(xiàn)的梯度消失和梯度爆炸問題,同時促進(jìn)更有效的信息傳播和模型訓(xùn)練。殘差塊包含兩個主要部分:主路徑和殘差連接(又稱跳躍連接)。
主路徑主要由兩個或多個卷積層(通常使用3×3大小的卷積核)、批量歸一化層和激活函數(shù)組成。這些卷積層和批量歸一化層的組合旨在學(xué)習(xí)輸入數(shù)據(jù)的非線性特征表示。殘差連接將輸入數(shù)據(jù)直接添加到主路徑的輸出之上,形成殘差連接。這種連接機(jī)制允許梯度更輕松地反向傳播,從而減少梯度消失的影響,并使網(wǎng)絡(luò)能夠更深入、更容易地進(jìn)行訓(xùn)練。
殘差連接允許梯度直接通過跳過層的方式傳播。在反向傳播過程中,該設(shè)計有效地緩解了梯度消失的問題,促進(jìn)了更深層次神經(jīng)網(wǎng)絡(luò)的成功訓(xùn)練。通過堆疊多個殘差塊,可以構(gòu)建非常深的神經(jīng)網(wǎng)絡(luò),而不會出現(xiàn)退化問題(即性能下降)。這使得可以訓(xùn)練非常深的網(wǎng)絡(luò)模型,從而提高模型的表現(xiàn)能力。殘差塊使模型能夠更有效地學(xué)習(xí)特征表示,因?yàn)樗鼈円肓烁唵蔚穆窂剑瑴p輕了學(xué)習(xí)任務(wù),使參數(shù)的優(yōu)化更加容易。
網(wǎng)絡(luò)最終輸出的圖形大小與原始圖像一致。重構(gòu)網(wǎng)絡(luò)部分是整個模型的重要組成部分,它負(fù)責(zé)接收特征提取模塊提取的特征,并將其重構(gòu)為原始圖像或更好的表示。該模塊結(jié)構(gòu)如圖2所示:
2 模型訓(xùn)練
2.1 損失函數(shù)
為了衡量預(yù)測加權(quán)高光譜圖像與實(shí)際高光譜圖像之間的差異,本文選用平均絕對值誤差(MAE)作為損失函數(shù)。設(shè)原始高光譜圖像數(shù)據(jù)為[x=(x1,x2,...,xm,)],[x=(x1,x2,...,xm)],表示經(jīng)過網(wǎng)絡(luò)輸出的圖像塊。損失函數(shù)可以表示如下:
[L=1mxi-xi] (1)
其中,[m]為訓(xùn)練樣本的數(shù)量。
2.2 優(yōu)化器
為了最小化損失函數(shù),選擇合適的優(yōu)化器至關(guān)重要。在訓(xùn)練模型時,本文選擇隨機(jī)梯度下降(Stochastic Gradient Descent, SGD)優(yōu)化器。SGD在每一步只使用一個樣本或一個小批量樣本進(jìn)行參數(shù)更新,因此計算速度相對較快。特別是在大規(guī)模數(shù)據(jù)集上,SGD通常比使用整個數(shù)據(jù)集的批量梯度下降要快得多。
SGD通過在每一步中使用隨機(jī)抽樣的數(shù)據(jù)點(diǎn)來估計梯度,隨后模型參數(shù)根據(jù)梯度的反向方向進(jìn)行更新,以最小化損失函數(shù)。SGD的更新規(guī)則如下:
[θt+1=θt-η?]([θt]) (2)
式中:[θt]為第[t]步的模型參數(shù)向量;[η]為學(xué)習(xí)率,用來控制著每一步更新的幅度;[L]([θt])為損失函數(shù);[?]([θt])為損失函數(shù)相較于參數(shù)的梯度。
2.3 訓(xùn)練數(shù)據(jù)集
本文所使用的數(shù)據(jù)集為Indian Pines數(shù)據(jù)集,該數(shù)據(jù)集由AVIRIS傳感器在美國印第安納州捕獲,涵蓋了400至2 500納米波長范圍內(nèi)的光譜信息。在實(shí)際訓(xùn)練中,選用了其中的200個波段。拍攝到的區(qū)域包含多樣化的地物類型,共計16種,包括玉米、燕麥、小麥以及樹木等。
為了對該數(shù)據(jù)集進(jìn)行可視化,從中選擇了三個代表性的波段來生成一幅彩色圖像。選擇高光譜圖像中的3個維度生成的彩色圖像如圖3所示:
給定高光譜圖像[I∈?W×H×L],式中:[W]、[H]分別為圖像的寬和高;[L]為波段數(shù)。對高光譜圖像[X]進(jìn)行邊緣填充,以像素[pi,j]為中心提取尺寸為[S×S×D]的數(shù)據(jù)塊[Bij],[1≤i≤W],[1≤j≤H]。
2.4 訓(xùn)練策略
對于Indian Pines數(shù)據(jù)集,本文采取如下訓(xùn)練策略:
首先,對原始高光譜圖像進(jìn)行邊緣填充,并提取尺寸為7×7的圖像塊作為輸入。學(xué)習(xí)率設(shè)置為0.01,共進(jìn)行200個epoch。經(jīng)過特征提取部分后,輸出的圖像塊大小為128×5×5。隨后,通過重構(gòu)網(wǎng)絡(luò)處理,最終輸出圖像大小與原圖像塊大小一致,為200×7×7。
3 實(shí)驗(yàn)結(jié)果與分析
為了驗(yàn)證所提出的BSNET_ResNet方法,本研究將其與PCA方法的波段選擇結(jié)果進(jìn)行對比分析,如表1所示。
將上述兩種方法選擇出的波段分別使用SVM和2D-CNN進(jìn)行高光譜圖像分類。
使用SVM對Indian Pines進(jìn)行分類,分類精度如表2所示。
使用2D-CNN進(jìn)行分類,將原圖像的200個波段根據(jù)2種方法選擇出25個波段,并將圖像分為特定大?。╗25×7×7])的圖像塊。圖像總共劃分了10 249個塊,其中20%作為訓(xùn)練集,80%作為測試集,訓(xùn)練輪次(epoch)為200。2種波段選擇方法的分類精度如表3所示。
使用PCA方法選擇出的波段訓(xùn)練2D-CNN網(wǎng)絡(luò)時的損失和精確度如圖4所示。
使用BSNET_ResNet方法選擇出的波段訓(xùn)練2D-CNN網(wǎng)絡(luò)時的損失和精確度如圖5所示。
通過將BSNET_ResNet與PCA進(jìn)行對比實(shí)驗(yàn),驗(yàn)證了所提出方法的有效性。實(shí)驗(yàn)結(jié)果表明,BSNET_ResNet方法在分類精度、波段選擇效果等方面均優(yōu)于PCA方法,能夠有效地學(xué)習(xí)到低維子空間中的內(nèi)在數(shù)據(jù)結(jié)構(gòu),從而提高波段選擇的準(zhǔn)確性。
4 結(jié)論
本文提出了一種基于殘差塊(ResNet)的高光譜圖像波段選擇方法(BSNET_ResNet)。該方法通過使用多個殘差塊的堆疊結(jié)構(gòu)創(chuàng)建了一個深度神經(jīng)網(wǎng)絡(luò),可自適應(yīng)地學(xué)習(xí)低維子空間中的內(nèi)在數(shù)據(jù)結(jié)構(gòu)。實(shí)驗(yàn)結(jié)果表明,該方法使用的CNN作為可訓(xùn)練的方法,能較好地與圖像分類等任務(wù)結(jié)合,有效地提取和融合高光譜圖像中的光譜特征和空間細(xì)節(jié)信息,避免了手工設(shè)計特征,并在分類精度、波段選擇效果等方面具有較大優(yōu)勢,為高光譜圖像波段選擇提供了一種有效解決方案。
在今后的工作中,將進(jìn)一步優(yōu)化模型結(jié)構(gòu),提高波段選擇的性能,并嘗試將該方法應(yīng)用于其他領(lǐng)域,如醫(yī)學(xué)影像分析、環(huán)境監(jiān)測等。
參考文獻(xiàn):
[1] GHAMISI P,YOKOYA N,LI J,et al.Advances in hyperspectral image and signal processing:a comprehensive overview of the state of the art[J].IEEE Geoscience and Remote Sensing Magazine,2017,5(4):37-78.
[2] WANG J,ZHOU J,HUANG W Q.Attend in bands:hyperspectral band weighting and selection for image classification[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2019,12(12):4712-4727.
[3] ZHAO H S,BRUZZONE L,GUAN R C,et al.Spectral-spatial genetic algorithm-based unsupervised band selection for hyperspectral image classification[J].IEEE Transactions on Geoscience and Remote Sensing,2021,59(11):9616-9632.
[4] TANG Y D, HUANG S C, XUE A J. Sparse Representation Based Band Selection for Hyperspectral Imagery Target Detection[J]. Tien Tzu Hsueh Pao/Acta Electronica Sinica, 2017, 45(10): 2368-2374.
[5] HUANG S G,ZHANG H Y,PI?URICA A.A structural subspace clustering approach for hyperspectral band selection[J].IEEE Transactions on Geoscience and Remote Sensing,2022,60:5509515.
[6] BAISANTRY M,SAO A K.Band selection using segmented pca and component loadings for hyperspectral image classification[C]//IGARSS 2019-2019 IEEE International Geoscience and Remote Sensing Symposium.July 28-August 2,2019,Yokohama,Japan.IEEE,2019:3812-3815.
[7] HABERMANN M,F(xiàn)REMONT V,SHIGUEMORI E H.Supervised band selection in hyperspectral images using single-layer neural networks[J].International Journal of Remote Sensing,2019,40(10):3900-3926.
[8] CAO X H,XIONG T,JIAO L C.Supervised band selection using local spatial information for hyperspectral image[J].IEEE Geoscience and Remote Sensing Letters,2016,13(3):329-333.
[9] ZHANG L, LUO F. Review on graph learning for dimensionality reduction of hyperspectral image[J]. Journal of Spatial Science, 2020, 23(1): 9-19.
[10] CHANG Y L,TAN T H,LEE W H,et al.Consolidated convolutional neural network for hyperspectral image classification[J].Remote Sensing,2022,14(7):1571.
[11] ZHOU Y,YAO Q R,HUO S W,et al.Hyperspectral band selection with iterative graph autoencoder[J].IEEE Transactions on Geoscience and Remote Sensing,2023(61):5511013.
【通聯(lián)編輯:唐一東】