沈宇臻,官云蘭,楊 祿,劉承承,嚴(yán)小芳
(1. 廣州城市規(guī)劃技術(shù)開發(fā)服務(wù)部,廣東 廣州 510030; 2. 東華理工大學(xué)測(cè)繪工程學(xué)院,江西 南昌 330013; 3. 桂林理工大學(xué)測(cè)繪地理信息學(xué)院,廣西 桂林 541004; 4. 成都理工大學(xué)地球科學(xué)學(xué)院,四川 成都 610059; 5. 興寧市國(guó)土資源局,廣東 興寧 514500)
高光譜遙感應(yīng)用是近幾年遙感領(lǐng)域發(fā)展的熱點(diǎn),由于高光譜影像的海量數(shù)據(jù)特點(diǎn)及可為每個(gè)像元提供幾乎連續(xù)的地物光譜曲線[1],因此高光譜相對(duì)于多光譜更能反映地物真實(shí)細(xì)節(jié),使高光譜遙感影像在農(nóng)業(yè)、軍事、林業(yè)、水利、航天等多個(gè)領(lǐng)域有著廣泛的應(yīng)用[2]。
高光譜遙感影像分類技術(shù)一直以來是高光譜遙感影像的應(yīng)用重點(diǎn)和技術(shù)難點(diǎn),有眾多方法成功應(yīng)用于高光譜圖像分類當(dāng)中。如文獻(xiàn)[3]通過密度抽樣與動(dòng)態(tài)時(shí)間扭曲距離值來評(píng)價(jià)樣本間相似度,并利用模糊C均值完成半監(jiān)督分類。文獻(xiàn)[4]通過平均分組及隨機(jī)波段組合進(jìn)行空譜特征融合,并利用投票法進(jìn)行極限學(xué)習(xí)機(jī)集成分類。文獻(xiàn)[5]通過隨機(jī)生成輸入權(quán)重及輸入值的偏差改進(jìn)稀疏多項(xiàng)式邏輯回歸以提高SMLR用于高光譜分類的效果。其中,稀疏多項(xiàng)邏輯回歸因其良好的性能得到了廣泛關(guān)注。稀疏多項(xiàng)邏輯回歸(sparse multinomial logistic regression,SMLR)[6]由文獻(xiàn)[7]提出的多項(xiàng)邏輯回歸(multinomial logistic regression,MLR)改進(jìn)而得。
因稀疏多項(xiàng)式邏輯回歸僅利用高光譜圖像的光譜信息,將稀疏多項(xiàng)邏輯回歸應(yīng)用于高光譜圖像中,將產(chǎn)生以下3個(gè)問題:①由于高光譜的三維數(shù)據(jù)特點(diǎn)使得高光譜遙感影像在包含海量數(shù)據(jù)的同時(shí)也摻雜了大量的噪聲數(shù)據(jù),大量的噪聲數(shù)據(jù)勢(shì)必會(huì)對(duì)高光譜影像分類造成影響;②遙感影像普遍存在“同物異譜”和“同譜異物”的現(xiàn)象,使得高光譜影像分類結(jié)果的可靠性較低;③高光譜遙感影像上混合像元的普遍存在,進(jìn)一步增大了高光譜遙感影像分類的難度[1]。因此,該算法在高光譜圖像分類中應(yīng)用效果不佳。
為此,本文提出一種顧及局部與結(jié)構(gòu)特征的稀疏多項(xiàng)式邏輯回歸高光譜影像分類方法。首先,以增強(qiáng)像元可區(qū)分性、提高分類精度為目的,通過加權(quán)均值濾波(weighted mean filter,WMF)[8]調(diào)節(jié)濾波窗口以獲取一定范圍的像元點(diǎn)局部空間特征。然后,利用拓展形態(tài)學(xué)多屬性剖面(extended multi-attribute profiles,EMAPs)[9]以得到像元點(diǎn)的空間結(jié)構(gòu)特征,由于EMAPs是不同屬性形態(tài)學(xué)濾波器濾波結(jié)果的疊加,因此可精細(xì)表達(dá)像元點(diǎn)的結(jié)構(gòu)特征,對(duì)高光譜遙感影像具有較好的適用性。最后,將加權(quán)均值濾波提取的局部空間特征和拓展形態(tài)學(xué)多屬性剖面所提取的空間結(jié)構(gòu)特征進(jìn)行融合,最終由稀疏多項(xiàng)邏輯回歸進(jìn)行分類,可充分解決稀疏多項(xiàng)邏輯回歸不能提取高光譜圖像空間信息的問題。
稀疏多項(xiàng)式邏輯回歸的核心是邏輯回歸和用來保證稀疏性的拉普拉斯先驗(yàn)兩個(gè)最優(yōu)化問題[10]。其核心原理如下:
假設(shè)C={1,2,…,M}為一組類別標(biāo)簽;Iv={1,2,…,n}為影像中n個(gè)像元的索引值;x=(x1,x2,…,xN)∈Rd×N為像元的高光譜遙感影像特征矩陣;d為每個(gè)像元的高光譜遙感影像特征向量維數(shù);y=(y1,y2,…,yN)為對(duì)應(yīng)的像素高光譜遙感影像特征向量標(biāo)簽。將Dn={(x1,y1),(x2,y2),…,(xLyn)}作為監(jiān)督分類訓(xùn)練樣本,由文獻(xiàn)[11]可知,后驗(yàn)概率為
(1)
式中,h(xi)為輸入特征;w=[w(1)w(2)…w(M-1)]T∈RM-1×d為回歸值。w共有M個(gè)變量,M為類別的個(gè)數(shù),后驗(yàn)概率的和為1,w第M個(gè)變量設(shè)置為0,因?yàn)榭梢砸揽縲的前M-1變量計(jì)算其概率值[12]。輸入特征h可以為線性或非線性。當(dāng)h為線性時(shí),如式(2)為
h(xi)=[xi1xi2…xid]T
(2)
式中,xi,j為xi的第j個(gè)分量。當(dāng)h為非線性時(shí),如式(3)所示,其中φ為一個(gè)非線性函數(shù)。
h(xi)=[1φ1(xi)…φd(xi)]T
(3)
稀疏多項(xiàng)式邏輯回歸的回歸值w可以通過計(jì)算最大后驗(yàn)估計(jì)來獲得,如式(4)為
(4)
式中,λ(w)為由式(5)給定的對(duì)數(shù)似然函數(shù)。
(5)
lnp(w)為w的先驗(yàn)值,與觀察值x無關(guān)。w被視為隨機(jī)矢量,其拉普拉斯密度表示如式(6),用于控制分類器的復(fù)雜性和泛化能力。
(6)
(7)
通過變量分離和增廣的拉格朗日[13],文中SMLR轉(zhuǎn)換成LORSAL算法以適應(yīng)大尺度高光譜影像數(shù)據(jù)。
拓展形態(tài)學(xué)多屬性剖面可提取影像結(jié)構(gòu)特征,形成描述影像結(jié)構(gòu)屬性信息的特征向量,同時(shí)也是聯(lián)合光譜和空間信息分類的有效方式[11]。EMAPs的核心思想是先由形態(tài)學(xué)濾波拓展形成的形態(tài)學(xué)屬性剖面(multi-attribute profiles,MAP)通過一系列不同屬性的形態(tài)學(xué)濾波器對(duì)一種特征進(jìn)行濾波以獲取不同的濾波后影像特征信息,再將不同屬性形態(tài)學(xué)濾波器的濾波結(jié)果進(jìn)行疊加而得到具有結(jié)構(gòu)特征的濾波后影像信息。具體原理如下:
MAP基于影像的灰度域,以每個(gè)連通分量的屬性進(jìn)行濾波操作,假設(shè)有灰度影像fi,屬性A,連通分量CCi且任意給定一個(gè)參數(shù)λT,當(dāng)A(CCi)>λT,滿足閾值條件,則保持不變;反之,則該連通分量并入鄰域灰度值最為相近的區(qū)域。當(dāng)該并入?yún)^(qū)域灰度值較小時(shí),稱為細(xì)化操作;反之,則稱為粗化操作。在灰度影像fi的基礎(chǔ)上,給定一系列閾值{λ1,λ2,…,λn},本文試驗(yàn)選用的屬性及閾值參數(shù)參考文獻(xiàn)[14]的經(jīng)驗(yàn)屬性及閾值,再通過系列細(xì)化操作和粗化操作可得灰度影像fi的屬性剖面(attribute profiles,AP)[15]為
AP(fi)={φλn(fi),φλn-1(fi),…,φλ1(fi),fi,
γλ1(f1),…,γλn-1(fi),γλn(fi)}
(8)
式中,φ和λ分別為上述細(xì)化操作和粗化操作。
式(8)可以得到任意波段的屬性剖面,由于高光譜數(shù)據(jù)有大量波段,如果將所有原AP進(jìn)行疊加會(huì)造成運(yùn)算量大,運(yùn)算時(shí)間長(zhǎng)等問題,根據(jù)高光譜影像數(shù)據(jù)特點(diǎn)可知,高光譜數(shù)據(jù)摻雜了大量噪聲,因此需通過主成分分析(PCA)對(duì)其進(jìn)行降維處理。將某一波段各個(gè)屬性剖面利用PCA降維之后疊加的結(jié)果稱為EAP。因此可知灰度影像fi的EMAP為
EMAPs(fi)={EAPa1,EAPa2,…,EAPan}
(9)
式中,{a1,a2,…an}為灰度影像fi的不同特征屬性。
加權(quán)均值濾波是一種常用的平面濾波方法,具有簡(jiǎn)單快速獲取像元點(diǎn)局部特征信息的優(yōu)勢(shì)[10],其考慮了像元點(diǎn)到中心像元點(diǎn)的距離值,以此定義對(duì)應(yīng)影響權(quán)重值,其原理如下:
設(shè)有中心點(diǎn)像素xi,其平面坐標(biāo)為(ai,bi),則可知xi的鄰域像元W(xi)為
W(xi)={xa,b|a∈[ai-c,ai+c],b∈[bi-c,bi+c]}
(10)
(11)
式中,xj∈W(xi);dk是以xik到中心點(diǎn)xi距離來計(jì)算得出的權(quán)重值為
(12)
需注意式(12)中的參數(shù)δ是一個(gè)控制濾波程度可調(diào)節(jié)參數(shù),以Indian pines數(shù)據(jù)集為試驗(yàn)數(shù)據(jù),以每類30個(gè)像元作為訓(xùn)練樣本進(jìn)行試驗(yàn),試驗(yàn)結(jié)果如圖2所示,可知當(dāng)δ取0.2時(shí),分類總體精度最高。再由文獻(xiàn)[12]可知,δ的經(jīng)驗(yàn)值為0.2,因此本文取δ=0.2。
針對(duì)高光譜影像數(shù)據(jù)的高維性和訓(xùn)練樣本的缺乏,為了獲取高精度及強(qiáng)穩(wěn)健性的高光譜影像分類結(jié)果,本文通過顧及局部與結(jié)構(gòu)特征信息以提高像元點(diǎn)的可區(qū)分性和分類穩(wěn)定性,結(jié)合EMAP算法提取像元點(diǎn)空間結(jié)構(gòu)特征和WMF的二維局部特征這兩種優(yōu)勢(shì)進(jìn)行特征融合,以適應(yīng)高光譜影像的高維和海量數(shù)據(jù)特點(diǎn)。特征融合是為了綜合高光譜影像在不同維度的特征,以增強(qiáng)像元點(diǎn)的可區(qū)分性。本文中使用以加權(quán)平均法為融合方法的特征級(jí)融合,局部特征與結(jié)構(gòu)特征融合比例為1∶1。
為證明本文方法的有效性和穩(wěn)健性,本文采用兩組目前最常用的標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行試驗(yàn),并在兩組標(biāo)準(zhǔn)數(shù)據(jù)集中分別以每類30、20和15個(gè)像元作為訓(xùn)練樣本,以傳統(tǒng)SMLR、SMLR-WMF、SMLR-EMAP這3種方法作對(duì)比參考。試驗(yàn)環(huán)境為AMD QC-4000,主頻1.30 GHz,內(nèi)存4 GB,操作系統(tǒng)Windows 7,算法實(shí)現(xiàn)環(huán)境為Matlab R2013b。
Indian pines數(shù)據(jù)集是1992年在美國(guó)印第安納州通過AVIRIS系統(tǒng)采集的一組航空數(shù)據(jù),該數(shù)據(jù)是目前高光譜影像分類研究最常用的標(biāo)準(zhǔn)數(shù)據(jù)之一。Indian pines數(shù)據(jù)影像大小為145×145像素,空間分辨率為20 m,具有200個(gè)光譜波段。共含16種地物類型。Pavia University數(shù)據(jù)集是2001年通過ROSIS傳感器獲取的Pavia大學(xué)的高光譜標(biāo)準(zhǔn)數(shù)據(jù),去除12個(gè)噪聲波段后剩余103個(gè)波段。影像大小為610×340像素,共含9種地物類型。本文方法分類結(jié)果如圖3所示。
通過上述兩組標(biāo)準(zhǔn)數(shù)據(jù)集的試驗(yàn)研究,試驗(yàn)對(duì)比分析以證明本文方法的有效性和穩(wěn)健性,本文以影像分類的總體精度(overall accuracy,OA)和Kappa系數(shù)客觀評(píng)價(jià)分類質(zhì)量。試驗(yàn)結(jié)果分析見表1、表2。綜合兩種數(shù)據(jù)集及3種不同數(shù)量訓(xùn)練樣本可知本文方法的分類總體精度相對(duì)于SMLR、SMLR-WMF、SMLR-EMAP這3種方法平均提高了35.08%、16.17%、1.03%。
表1 Indian pines數(shù)據(jù)集試驗(yàn)結(jié)果精度對(duì)比
表2 Pavia University數(shù)據(jù)集試驗(yàn)結(jié)果精度對(duì)比
高光譜影像的海量、高維等特點(diǎn)和“同物異譜,同譜異物”的普遍存在及混合像元問題使得其分類精度較低,本文設(shè)計(jì)了一種顧及局部與結(jié)構(gòu)特征的稀疏多項(xiàng)式邏輯回歸高光譜影像分類方法,該方法以拓展形態(tài)學(xué)多屬性剖面和加權(quán)均值濾波獲取高光譜影像的局部與結(jié)構(gòu)特征,并對(duì)兩種特征進(jìn)行加權(quán)平均特征級(jí)融合,使其更具唯一性,最后利用稀疏多項(xiàng)式邏輯回歸對(duì)融合結(jié)果進(jìn)行分類。結(jié)果顯示該方法在30、20、15這3類訓(xùn)練樣本下與傳統(tǒng)SMLR、SMLR-WMF、SMLR-EMAP這3種方法相比,OA分別平均提高了35.08%、16.18%、1.03%,從而提高了高光譜影像分類精度,同時(shí)具有較好的穩(wěn)健性,在較小訓(xùn)練樣本時(shí)也具有一定程度的適用性。