陳立偉, 張雅涵, 王立國(guó) (哈爾濱工程大學(xué) 信息與通信工程學(xué)院,黑龍江 哈爾濱 150001)
隨著傳感器分辨率的快速發(fā)展,高光譜遙感影像具有了很高的空間分辨率和光譜分辨率[1]。高光譜圖像由大量相關(guān)波段組成,數(shù)據(jù)維數(shù)高且?guī)в袠?biāo)簽的樣本少,經(jīng)典的分類(lèi)方法往往只利用了光譜信息,而高光譜圖像具有空間聚類(lèi)的特征,同時(shí)利用空間信息和光譜信息可以提高分類(lèi)的準(zhǔn)確性,更好地挖掘有用信息[2-3]。Camps-valls等[4]提出使用基于復(fù)合核(composite kernel, CK)的空譜分類(lèi)算法對(duì)高光譜進(jìn)行分類(lèi),使用線性組合空間核和光譜核來(lái)代替支持向量機(jī)(support vector machine, SVM)中的核函數(shù)。Menon等[5]受CK算法的啟發(fā),提出使用最近鄰的組合核空譜對(duì)高光譜圖像分類(lèi),在CK的基礎(chǔ)上運(yùn)用了預(yù)處理步驟。Tarabalka等[6-8]提出馬爾科夫隨機(jī)場(chǎng)(Markov random field,MRF)與SVM分類(lèi)器結(jié)合使用的分類(lèi)算法,使用MRF引入的空間信息來(lái)調(diào)整SVM中得到的初步分類(lèi)值。Liu等[9]提出了SVMSLR的分類(lèi)算法,該算法將空間背景信息引入SVM,顯著地提高了分類(lèi)精度??臻g-光譜特征描述的目的是根據(jù)原始光譜信息和鄰近像素的空間信息,獲取圖像中每個(gè)像素的特征向量。然而,特征數(shù)量的增多可能會(huì)導(dǎo)致維數(shù)災(zāi)難。所以,在實(shí)際應(yīng)用中對(duì)高光譜圖像進(jìn)行降維處理對(duì)后續(xù)分析變得尤為重要。主成分分析 (principal components analysis, PCA)是進(jìn)行降維的主要方法,它將高光譜波段根據(jù)最高主成分的方差最大化,轉(zhuǎn)化為線性不相關(guān)的成分。PCA變換雖然降低了維數(shù),但是一定程度上會(huì)破壞高光譜圖像的空間結(jié)構(gòu)和相鄰特征的局部信息,對(duì)后續(xù)特征提取及分類(lèi)結(jié)果造成影響。而波段選擇方法[10-11]則通過(guò)找到最具代表性的波段構(gòu)成數(shù)據(jù)子集從而降低高光譜圖像的維數(shù),這種方法保留了原始光譜數(shù)據(jù)的物理意義,非常適合高光譜數(shù)據(jù)的降維。迄今為止,已有大量的波段選擇方法被提出。根據(jù)分類(lèi)時(shí)是否需要先驗(yàn)信息,可分為有監(jiān)督[12-13]、無(wú)監(jiān)督[14-15]及半監(jiān)督[16-18]3類(lèi)。而無(wú)監(jiān)督的方法則依靠數(shù)據(jù)本身來(lái)評(píng)估每個(gè)波段的重要性,所以無(wú)監(jiān)督波段選擇方法更加穩(wěn)定準(zhǔn)確。
本文重點(diǎn)在于盡可能地提取圖像的空間信息,并將其與光譜信息充分結(jié)合,并在提高分類(lèi)精度的基礎(chǔ)上增加算法的實(shí)用性。首先對(duì)高光譜圖像所有波段應(yīng)用無(wú)監(jiān)督的SOP-SRL波段選擇方法選擇出信息量大的波段,在不破壞空間結(jié)構(gòu)的前提下完成降維。然后對(duì)選定的波段使用3D-Gabor濾波器,提取空間紋理特征,更加有效的利用圖像的空間信息。最后將提取的特征輸入邏輯回歸分類(lèi)器(logistic regression,LR)。
X=[X1X2…Xn]∈Rb×n
(1)
(2)
(3)
上述過(guò)程在采樣時(shí)刻重復(fù)進(jìn)行,將所有可用樣本掃描一次后,使用緩存向量q選擇出排在前p位的波段B。
遙感高光譜圖像的光譜空間分類(lèi)技術(shù)由于能夠更好地利用高光譜圖像中現(xiàn)有的信息源,獲得較高的識(shí)別率,Gabor濾波已被應(yīng)用于特征提取,能夠從光譜和空間域提取相關(guān)信息,可獲得最佳的聯(lián)合時(shí)頻分辨率[19]。在高光譜成像的背景下,Bau等[20]提出利用三維Gabor實(shí)部獲取高光譜圖像中區(qū)域的主要能量特征。表明3D-Gabor濾波在提取光譜空間特征方面的有效性和優(yōu)越性。
3D-Gabor濾波器的中心頻率為:
(4)
3D-Gabor濾波器的方向?yàn)椋?/p>
(5)
也可以用2個(gè)空間角度(θ,φ)表示,其中θ是濾波器方向和λ方向的夾角,φ是方向投影到(x,y)方向和x之間的夾角;高斯函數(shù)的形狀參數(shù)σ;3個(gè)半軸長(zhǎng)表示為(M,N,W)。運(yùn)用3D高斯包絡(luò)的3D諧波調(diào)制能得到一個(gè)標(biāo)準(zhǔn)的空間-光譜Gabor濾波器,數(shù)學(xué)表達(dá)式、高斯成分、正弦成分及各軸線方向的投影為:
g(x,y,λ)=a(x,y,λ)b(x,y,λ)
(6)
(7)
b(x,y,λ)=cos(2π(Fxx+Fyy+Fλλ))
(8)
Fx=Fsinθcosφ,Fy=Fsinθsinφ,Fλ=Fcosθ
(9)
式中:h(x,y,λ)表示高光譜圖像的空間光譜域;分量(x,y)表示空間域;分量λ表示光譜域。
在實(shí)驗(yàn)中,通過(guò)改變?chǔ)群挺盏闹祦?lái)獲得不同方向的特征,設(shè)計(jì)不同方向的3D-Gabor濾波器(如圖1、2所示),θ和φ分別選取為(0,π/4,π/2,3π/4)。當(dāng)θ的值為0時(shí),φ的值也只能取0,所以共13個(gè)方向。為了獲得不同尺度的紋理特征,實(shí)驗(yàn)中還取了4個(gè)尺度進(jìn)行計(jì)算。因此,共52個(gè)濾波器。
圖1 3D-Gabor濾波器方向Fig.1 Direction of 3D-Gabor filter
圖2 3D-Gabor濾波器投影Fig.2 Projection of 3D-Gabor filter
Gamba等[21]使用能量原理對(duì)特征矩陣進(jìn)行后處理,濾波后的能量特征為:
(10)
式中:M和N是像素空間位置(M,N)處;W是圖像的第W個(gè)波段;i是圖像的特征號(hào),取值1~52。
本文提出基于SOP-SRL波段選擇和3D-Gabor特征的高光譜圖像空間光譜特征分類(lèi)方法(SOP-SRL and 3D-Gabor, SS-3DG)。所提出的方法融合SOP-SRL波段選擇方法與3D-Gabor特征提取方法。首先應(yīng)用SOP-SRL方法保存原始波段,并提供原始波段的一個(gè)子集作為輸出;然后在選定的波段上使用3D-Gabor濾波器獲得紋理特征,為高光譜圖像中的每一個(gè)像素獲得特征向量。在描述空間紋理特征信息時(shí),本文的空間特征是使用3D-Gabor濾波器組對(duì)輸入圖像進(jìn)行濾波,每個(gè)像素的特征向量為該像素對(duì)濾波器組的所有響應(yīng)。由于充分描述了空譜特征,減少了需要的維數(shù),從而避免了維數(shù)災(zāi)難,提高了高光譜圖像分類(lèi)的實(shí)驗(yàn)效率。本文算法的步驟為:
1)通過(guò)SOP-SRL算法更新記錄波段分?jǐn)?shù)的緩存向量q,選出分?jǐn)?shù)最高的B個(gè)波段;
2)對(duì)于B個(gè)波段,令I(lǐng)i為第i個(gè)波段,令fk是濾波器組K中的第k個(gè)濾波器的單位沖激響應(yīng)。第i個(gè)波段對(duì)第k個(gè)濾波器的響應(yīng)為:
(11)
濾波器組表示為:
(12)
式中:M為尺度個(gè)數(shù);N為方向個(gè)數(shù)。
3)應(yīng)用整個(gè)濾波器組,對(duì)選擇的B個(gè)波段進(jìn)行響應(yīng),即可得到圖像中所有像素點(diǎn)的特征向量ψ:
(13)
4)分類(lèi):選擇訓(xùn)練集,將得到的空譜特征向量ψ輸入LR分類(lèi)器進(jìn)行分類(lèi)。
本節(jié)使用提出的算法對(duì)3組真實(shí)高光譜遙感圖像進(jìn)行仿真,它們分別是印第安農(nóng)林、薩利納斯谷和帕維亞大學(xué)數(shù)據(jù)集。
印第安納農(nóng)場(chǎng)數(shù)據(jù)集是1992年由AVIRIS傳感器收集的。該影像總共有220個(gè)波段,圖像尺寸為145×145像素,可用的標(biāo)記樣本數(shù)10 366個(gè),共16種地物,如圖3(a)所示;薩利納斯谷數(shù)據(jù)集是由光譜儀AVIRIS拍攝的。圖像尺寸為512×217像素,共224個(gè)波段,但是有20個(gè)波段是不能使用的,其中標(biāo)記樣本數(shù)為54 129個(gè),共16種地物,如圖3(b)所示;帕維亞大學(xué)數(shù)據(jù)集是由ROSIS-03[21]采集的,刪除12個(gè)波段后剩余103個(gè)可用波段,每個(gè)波段有610×340個(gè)像素,標(biāo)記樣本數(shù)為42 776個(gè),有9個(gè)標(biāo)記的地物類(lèi)別,如圖3(c)。
圖3 數(shù)據(jù)集地物分布Fig.3 Dataset feature map
本文采用常用的分類(lèi)評(píng)價(jià)指標(biāo),即總體分類(lèi)精度(overall accuracy, OA),第i類(lèi)分類(lèi)精度Ai,平均分類(lèi)精度(average accuracy, AA),Kappa系數(shù)對(duì)分類(lèi)結(jié)果進(jìn)行定量分析。
1)總體分類(lèi)精度POA為:
(14)
式中:N表示總的樣本數(shù)目;mii表示第i類(lèi)被正確分類(lèi)的樣本數(shù)量。
2)第i類(lèi)分類(lèi)精度Ai為:
(15)
式中Ni為第i類(lèi)的樣本總數(shù)。
3)平均分類(lèi)精度(average accuracy, AA)PAA為:
(16)
4)Kappa系數(shù)K為:
(17)
式中K為分類(lèi)結(jié)果圖像與監(jiān)督圖像的一致性,值越高,一致性越高。
實(shí)驗(yàn)均在1.80 GHz Intel Core i7-8550U處理器的Matlab R2016a平臺(tái)完成。
為了證明本文方法的可行性,選取以下算法作為對(duì)比算法:基于標(biāo)準(zhǔn)支持向量機(jī)分類(lèi)算法(support vector machine, SVM),基于PCA降維和支持向量機(jī)分類(lèi)算法(principle components analysis and SVM, P-SVM),基于SOP-SRL波段選擇和SVM的分類(lèi)算法(SOP-SRL and SVM, SS-SVM)和基于PCA降維的Gabor特征提取分類(lèi)算法(principle components analysis and gabor, P-Gabor)。
參數(shù)設(shè)置:SVM:正則化參數(shù)C=2(-2:6),核函數(shù)選擇RBF核函數(shù),核參數(shù)σ=2(-12:12);PCA降維的主成分個(gè)數(shù)在不同數(shù)據(jù)集上需要設(shè)置不同的P,波段選擇的正則化參數(shù)τ1、τ2、τ3、k、r分別設(shè)置為105、10-5、104、15和1.75。波段選擇數(shù)在不同的數(shù)據(jù)集上需要設(shè)置不同的B。LR邏輯回歸分類(lèi)器的稀疏參數(shù)λ設(shè)置為0.000 15。
3.3.1 印第安農(nóng)林?jǐn)?shù)據(jù)集實(shí)驗(yàn)
第1組實(shí)驗(yàn)使用印第安納農(nóng)林?jǐn)?shù)據(jù)集來(lái)驗(yàn)證本文算法的有效性。本次實(shí)驗(yàn)隨機(jī)從每個(gè)地物中取總樣本的10%作為訓(xùn)練集,剩余的90%作為測(cè)試集,將實(shí)驗(yàn)重復(fù)進(jìn)行20次,取實(shí)驗(yàn)的平均結(jié)果。本文算法在印第安農(nóng)場(chǎng)數(shù)據(jù)集的分類(lèi)性能如表1所示,表1將本文算法與其他對(duì)比算法在各自最優(yōu)參數(shù)下的OA、AA、Kappa系數(shù)進(jìn)行了對(duì)比。表格中以粗體顯示不同方法的最佳準(zhǔn)確性。
表1 印第安農(nóng)林?jǐn)?shù)據(jù)集分類(lèi)結(jié)果Table 1 Classification statistics for Indian Pines dataset %
如表12所示,SVM、P-SVM和SS-SVM均只利用光譜信息進(jìn)行分類(lèi)。P-SVM和SS-SVM均對(duì)高光譜圖像進(jìn)行了降維處理,減少了運(yùn)算量縮短了實(shí)驗(yàn)時(shí)間,但是PCA降維在一定程度上破壞了高光譜圖像的空間結(jié)構(gòu),相比于SVM分類(lèi)精度反而有所下降。SS-SVM相比于P-SVM用SOP-SRL波段選擇方法替代了PCA降維方法,保留了完整的光譜結(jié)構(gòu),分類(lèi)精度有所提升,但是由于沒(méi)有充分提取空譜特征,分類(lèi)精度相比于傳統(tǒng)SVM也有所下降,分類(lèi)效果不夠理想,所以充分提取空間信息十分必要。P-Gabor算法相比P-SVM算法引入了空間信息,分類(lèi)精度有所提高,但是由于PCA降維在某種程度上破壞了圖像的空間結(jié)構(gòu)導(dǎo)致,無(wú)法反映出樣本點(diǎn)的可分性和非線性,分類(lèi)精度反而低于傳統(tǒng)SVM算法,并且增加了計(jì)算量。而本文的SS-3DG方法,當(dāng)參數(shù)B=20時(shí),OA、AA和Kappa系數(shù)分別為84.82%、91.42%、82.73%,比SVM算法和其他算法分類(lèi)精度分別高出5%、10%左右,提高了分類(lèi)準(zhǔn)確性,說(shuō)明該方法能夠在降維減少運(yùn)算量的同時(shí)充分利用圖像的空間結(jié)構(gòu),從時(shí)間上來(lái)看,SS-3DG由于采用無(wú)監(jiān)督的波段選擇方法替代PCA繁瑣的線性變換,減少了計(jì)算量,大大節(jié)約了時(shí)間成本,提高了實(shí)驗(yàn)效率,說(shuō)明該算法的分類(lèi)性能更穩(wěn)定。圖4展示了幾種算法的對(duì)比。
圖4 印第安農(nóng)林?jǐn)?shù)據(jù)集分類(lèi)結(jié)果Fig.4 Classification result maps of Indian Pinesdataset obtained
3.3.2 薩利納斯谷數(shù)據(jù)集實(shí)驗(yàn)
與3.3.1節(jié)實(shí)驗(yàn)仿真類(lèi)似,第2組實(shí)驗(yàn)數(shù)據(jù)為薩利納斯谷數(shù)據(jù)集,實(shí)驗(yàn)仿真結(jié)果圖如圖5所示。根據(jù)前文提到的評(píng)價(jià)指標(biāo)對(duì)本文算法及對(duì)比算法進(jìn)行比較分析。同樣的,隨機(jī)選擇每個(gè)樣本的10%作為訓(xùn)練集,其余的作為測(cè)試集。分類(lèi)性能如表3所示。
圖5 薩利納斯谷數(shù)據(jù)集分類(lèi)結(jié)果Fig.5 Classification result maps of Salinas dataset obtained
表3 薩利納斯谷數(shù)據(jù)集分類(lèi)結(jié)果Table 3 Classification statistics for Salinas dataset %
本文算法在薩利納斯谷數(shù)據(jù)集的分類(lèi)性能如表3所示,表3對(duì)本文算法和其他算法的OA、AA、Kappa系數(shù)進(jìn)行了對(duì)比,對(duì)比算法同樣是在參數(shù)的最優(yōu)條件下進(jìn)行,可看出每個(gè)方法的最佳精度。如表3和表2所示,P-Gabor算法在此數(shù)據(jù)集上相比傳統(tǒng)的SVM、P-SVM和SS-SVM算法引入了空間信息,OA有了一定的提高,但是由于PCA降維在某種程度上破壞了圖像的空間結(jié)構(gòu)甚至舍棄了一些有意義的信息,導(dǎo)致AA和Kapaa系數(shù)降低,而且增加了實(shí)驗(yàn)計(jì)算量,更加耗時(shí)。而本文的SS-3DG方法,當(dāng)選擇波段為20個(gè)時(shí),OA、AA和Kappa系數(shù)可分別達(dá)到97.17%、98.95%、96.82%,比SVM算法和其他算法分類(lèi)精度分別高出5%、10%左右,提高了分類(lèi)準(zhǔn)確性,同時(shí)從表4可以看出,由于減少了計(jì)算量,實(shí)驗(yàn)速度有了明顯提高。圖5展示了幾種算法的對(duì)比,通過(guò)觀察分類(lèi)圖,可以清楚的看出SS-3DG方法分類(lèi)圖上的錯(cuò)誤分類(lèi)更少,進(jìn)一步驗(yàn)證了所提出方法的有效性。
表2 不同算法的計(jì)算時(shí)間Table 2 Computation time for different algorithms s
3.3.3 帕維亞大學(xué)數(shù)據(jù)集實(shí)驗(yàn)
與上述2個(gè)實(shí)驗(yàn)類(lèi)似,第3組實(shí)驗(yàn)是在帕維亞大學(xué)據(jù)集上進(jìn)行的,該數(shù)據(jù)集共有9類(lèi)真實(shí)地物。實(shí)驗(yàn)仿真結(jié)果圖如圖6所示。在實(shí)驗(yàn)中,訓(xùn)練集依然選擇10%,剩余的為測(cè)試集。分類(lèi)性能如表4所示,3種算法的運(yùn)行速度對(duì)比如表2所示。
表4 帕維亞大學(xué)數(shù)據(jù)集分類(lèi)結(jié)果
圖6 帕維亞大學(xué)數(shù)據(jù)集分類(lèi)結(jié)果Fig.6 Classification result maps of Pavia of University dataset obtained
和前2組實(shí)驗(yàn)的評(píng)價(jià)準(zhǔn)則一樣,表3中可看出不同方法的最佳精度。正如預(yù)期的那樣,P-Gabor算法在此數(shù)據(jù)集上相比SVM方法提高了10%左右,說(shuō)明在此數(shù)據(jù)集上空間信息的引入能夠提高分類(lèi)精度。而本文的SS-3DG方法,選擇了10個(gè)信息量最大的波段,OA、AA和Kappa系數(shù)分別為98.62%、98.72%、98.11%,比只利用光譜信息的SVM算法、P-SVM算法和SS-SVM算法分類(lèi)精度有了明顯提高,幅度為10%左右。雖然相比P-Gabor分類(lèi)方法,本文方法分類(lèi)精度提高不明顯,但是從表2中可以看出,相比之下,該方法可以加快實(shí)驗(yàn)速度,縮減計(jì)算量,節(jié)省實(shí)驗(yàn)時(shí)間。
5)技術(shù)規(guī)范類(lèi):例如廚房電氣化、電動(dòng)汽車(chē)等領(lǐng)域存在相關(guān)設(shè)備品質(zhì)與相關(guān)技術(shù)標(biāo)準(zhǔn)參差不齊,因此需要相關(guān)技術(shù)部門(mén)或者業(yè)界知名企業(yè)制定與規(guī)劃相關(guān)標(biāo)準(zhǔn),從而引導(dǎo)電能替代及相關(guān)行業(yè)的長(zhǎng)足發(fā)展。
3.3.4 參數(shù)B和P對(duì)分類(lèi)結(jié)果的影響
為了使本文算法的分類(lèi)性能達(dá)到最優(yōu)狀態(tài),本節(jié)對(duì)提出算法SS-3DG的主要參數(shù)即波段選擇個(gè)數(shù)B進(jìn)行了測(cè)試與調(diào)節(jié);同時(shí)也對(duì)對(duì)比算法(P-Gabor)中的主要參數(shù)即主成分個(gè)數(shù)P進(jìn)行了分析。
圖7顯示了本文方法SS-3DG使用不同B值在不同數(shù)據(jù)集上得到的OA曲線,從圖中可以看出,當(dāng)B=20,B=15,B=10時(shí)OA在3個(gè)數(shù)據(jù)集上分別獲得最大值,當(dāng)B太小時(shí),所選擇的波段數(shù)太少,分類(lèi)精度較差,當(dāng)B值達(dá)到最優(yōu)值時(shí),即圖像的峰值點(diǎn)。分類(lèi)精度顯著提高,在超過(guò)最優(yōu)值這一點(diǎn)之后,隨著B(niǎo)值的增加,薩利納斯谷數(shù)據(jù)集和帕維亞大學(xué)數(shù)據(jù)集的OA曲線的走勢(shì)變化相對(duì)平坦,而印第安農(nóng)林?jǐn)?shù)據(jù)集的OA下降較快,原因可能是薩利納斯谷數(shù)據(jù)集和帕維亞大學(xué)數(shù)據(jù)集樣本比較集中且數(shù)據(jù)量大。隨著波段數(shù)的增加,實(shí)驗(yàn)耗時(shí)越來(lái)越多,綜合考慮分類(lèi)結(jié)果和程序運(yùn)行時(shí)間,在實(shí)驗(yàn)中將印第安農(nóng)林和薩利納斯谷數(shù)據(jù)集的B設(shè)置為20,帕維亞大學(xué)的設(shè)置為10。
圖7 波段選擇個(gè)數(shù)對(duì)OA的影響Fig.7 The influence of the number of bands on OA
對(duì)P-Gabor算法同樣進(jìn)行類(lèi)似的實(shí)驗(yàn),因此需要對(duì)主成分分析的變量P進(jìn)行實(shí)驗(yàn),參見(jiàn)圖8。從圖中可以看出,印第安農(nóng)林和薩利納斯谷數(shù)據(jù)集在P=20,帕維亞大學(xué)在P=10時(shí),在3個(gè)數(shù)據(jù)集上的OA分別獲得最大值。為了與提出的Band-Gabor算法形成對(duì)比,綜合考慮,印第安農(nóng)林?jǐn)?shù)據(jù)集和薩利納斯谷數(shù)據(jù)集在實(shí)驗(yàn)中選擇P=20,帕維亞大學(xué)數(shù)據(jù)集選擇P=10。
圖8 主成分個(gè)數(shù)P對(duì)OA的影響Fig.8 The influence of the number of principal components on OA
1)使用SOP-SRL波段選擇方法,完成降維,與傳統(tǒng)降維方法相比,在不降低圖像性能的同時(shí)選擇出信息量大的波段,降低復(fù)雜度,避免維數(shù)災(zāi)難,解決由線性降維帶來(lái)的破壞空間結(jié)構(gòu)等問(wèn)題。
2)使用3D-Gabor濾波器在選定的光譜波段上獲得紋理特征,充分描述空譜特征,改善分類(lèi)結(jié)果。
3)分類(lèi)結(jié)果表明,本文方法在提高高光譜圖像分類(lèi)精度的同時(shí),能夠減少計(jì)算復(fù)雜度,節(jié)省實(shí)驗(yàn)時(shí)間,提高實(shí)驗(yàn)效率。