王立國(guó), 馬駿宇, 李陽(yáng)
(哈爾濱工程大學(xué) 信息與通信工程學(xué)院,黑龍江 哈爾濱 150001)
由于遙感學(xué)科[1]的進(jìn)步以及高光譜數(shù)據(jù)的獨(dú)特性質(zhì),高光譜技術(shù)已然成為了遙感領(lǐng)域的一個(gè)重要組成部分[2],而分類(lèi)問(wèn)題是高光譜圖像研究中一個(gè)重要的方向[3]。在圖像中,地物分布往往具有空間平滑特性[4],因此相距較近的像素屬于同種類(lèi)別的概率更高。傳統(tǒng)的分類(lèi)算法如標(biāo)準(zhǔn)SVM[5-6],三重訓(xùn)練[7]等通常只從光譜信息的角度出發(fā)對(duì)地物類(lèi)別進(jìn)行分類(lèi),而對(duì)圖像中的空間特征進(jìn)行了忽視。在分類(lèi)過(guò)程中應(yīng)用空間信息輔助分類(lèi),可以降低噪聲并且能保證分類(lèi)結(jié)果空間上的連續(xù)性。高光譜圖像分類(lèi)利用的空間信息主要包括3種:空間的紋理信息[8]、數(shù)學(xué)形態(tài)學(xué)信息以及鄰域信息。文獻(xiàn)[9]提出了一種基于數(shù)學(xué)形態(tài)學(xué)的高光譜數(shù)據(jù)預(yù)處理方法,在高光譜的城市數(shù)據(jù)集中取得了不錯(cuò)的效果。文獻(xiàn)[10]在進(jìn)行高光譜圖像分類(lèi)之后,使用了基于鄰域多數(shù)投票策略的分類(lèi)方法,以進(jìn)一步改善分類(lèi)結(jié)果。文獻(xiàn)[11]將Gabor濾波器提取的空間紋理特征用于高光譜圖像分類(lèi)并實(shí)驗(yàn)驗(yàn)證了方法有效地提升了分類(lèi)精度。因此,挖掘高光譜圖像的空間信息對(duì)于提升圖像分類(lèi)精度具有十分重要的意義,如何有效運(yùn)用高光譜圖像的空間信息也是一個(gè)研究的熱點(diǎn)話(huà)題。
基于以上內(nèi)容,關(guān)注高光譜圖像分類(lèi)中利用空間信息的問(wèn)題,本文提出了一種聯(lián)合多種空間信息的高光譜圖像半監(jiān)督分類(lèi)方法,在圖像處理的預(yù)處理階段、擴(kuò)充樣本集階段、分類(lèi)階段和后處理階段均引入了圖像的空間信息進(jìn)行輔助分類(lèi)。并且在有標(biāo)簽樣本少的情況下,利用空間鄰域信息和改進(jìn)的教與學(xué)算法2次擴(kuò)充訓(xùn)練樣本集,旨在有效利用高光譜圖像的空間信息,進(jìn)一步提升高光譜圖像分類(lèi)效果。
本文方法首先對(duì)高光譜圖像進(jìn)行降維操作。降維操作可以減少數(shù)據(jù)量,增大樣本采樣密度[12]。高光譜圖像的空間特征差異較大,Gabor濾波器[13]可以從不同的頻率及方向?qū)D像的紋理信息進(jìn)行提取,因此本文方法選用二維Gabor濾波器對(duì)高光譜圖像提取特征,并選用文獻(xiàn)[14]中的特征提取方式。設(shè)空間信息與光譜信息融合后的特征矢量為:
(1)
空譜核表達(dá)式為:
(2)
半監(jiān)督分類(lèi)中一個(gè)十分重要的研究方向是采用一定的策略從無(wú)標(biāo)簽樣本中選取置信水平高的樣本變成“偽標(biāo)記樣本”,將其加入到訓(xùn)練樣本集,本文方法在此理論基礎(chǔ)上進(jìn)行訓(xùn)練樣本集的擴(kuò)充,從有標(biāo)簽樣本的鄰域信息為出發(fā)點(diǎn),選擇置信水平高的有標(biāo)簽樣本的4-鄰域樣本添加至訓(xùn)練樣本集中。設(shè)樣本為x(i,j),樣本的分類(lèi)類(lèi)別為L(zhǎng)i,j,其4-鄰域樣本集為:
D4={x(i,j),x(i-1,j),x(i,j-1),
x(i+1,j),x(i,j+1)}
(3)
第1次擴(kuò)充訓(xùn)練樣本集的過(guò)程如下:
高光譜圖像已標(biāo)記標(biāo)簽樣本數(shù)目少,SVM經(jīng)過(guò)訓(xùn)練后得到的超分界面會(huì)產(chǎn)生一定偏差,這種問(wèn)題不利于對(duì)各個(gè)情況的地物信息在高維空間的分布進(jìn)行表達(dá)。針對(duì)此問(wèn)題,本文將鄰域樣本信息和中心樣本本身的信息加以結(jié)合后再進(jìn)行SVM分類(lèi),這種方法可以降低樣本的錯(cuò)分幾率。此方法叫做基于空間信息的SVM。設(shè)目標(biāo)像元為x0,其鄰域像元集合為:
Ω(x0)=(x0,x1,x2,x3,x4)
(4)
SVM的判別函數(shù)為:
(5)
將判別函數(shù)代入SVM的輸出公式:
(6)
其中K′(xi,Ω(x))為核函數(shù),表達(dá)式為:
(7)
式中ωj、f(xj)分別為像元xj對(duì)應(yīng)的權(quán)重值和輸出值。
教與學(xué)算法收斂速度快且收斂能力優(yōu)異,在本文方法中使用教與學(xué)(TLBO)[15]算法迭代篩選出信息量豐富的無(wú)標(biāo)記樣本,第2次擴(kuò)充訓(xùn)練樣本集。具體過(guò)程如下:
1)在無(wú)標(biāo)簽樣本集中選擇m個(gè)符合以下公式的樣本,記為集合S:
(8)
式中|f(xi)|表示無(wú)標(biāo)簽樣本xi到分類(lèi)超平面的距離,|f(xi)|越小代表樣本xi與分類(lèi)超平面越接近;
2)對(duì)集合S的高光譜數(shù)據(jù)空間進(jìn)行初始化種群操作,初始化方法為隨機(jī)生成;
3)“教”階段。在第n次迭代的教學(xué)階段,學(xué)生根據(jù)和學(xué)生平均值Xmean之間的不同進(jìn)行學(xué)習(xí);
4)“學(xué)”階段。學(xué)生在班級(jí)中隨機(jī)挑選得到自己需要學(xué)習(xí)的對(duì)象,然后雙方比較彼此的適應(yīng)函數(shù)值。
為了豐富訓(xùn)練樣本集合,在“學(xué)”階段參考差分進(jìn)化(DE)算法的交叉環(huán)節(jié),對(duì)TLBO算法的進(jìn)一步優(yōu)化。TLBO算法隨著收斂速度的加快容易產(chǎn)生局部最優(yōu)的問(wèn)題。而DE算法能夠豐富訓(xùn)練樣本集,本文中采用改進(jìn)的TLBO算法,在保證搜索能力的情況下避免陷入局部最優(yōu)的情況。
根據(jù)高光譜圖像像元處于同一相鄰區(qū)域內(nèi)的地物類(lèi)別相同的概率高的特性,本步驟對(duì)分類(lèi)結(jié)果進(jìn)行后處理,平滑噪聲,降低錯(cuò)分概率。具體過(guò)程為:首先選擇出需要進(jìn)一步確定標(biāo)簽的目標(biāo)像元,針對(duì)目標(biāo)像元周?chē)?個(gè)鄰域像元的類(lèi)別進(jìn)行統(tǒng)計(jì),其中相同數(shù)目像元的類(lèi)別記錄為D,數(shù)目記錄為N。然后設(shè)定一個(gè)小于鄰域樣本數(shù)目的閾值T,當(dāng)8-鄰域樣本中樣本數(shù)目最多的樣本D數(shù)目大于T時(shí),如果選定的像元的類(lèi)別不是D,將類(lèi)別更改為D,否則類(lèi)別不變。
本文提出了一種聯(lián)合多種空間信息的高光譜圖像半監(jiān)督分類(lèi)方法。本文方法在多個(gè)環(huán)節(jié)應(yīng)用了高光譜圖像的空間信息,主要表現(xiàn)在預(yù)處理階段,擴(kuò)充訓(xùn)練樣本集階段和后處理階段,在擴(kuò)充訓(xùn)練樣本集時(shí)采取了兩次擴(kuò)充方式,第1次應(yīng)用鄰域信息,第2次應(yīng)用改進(jìn)的TLBO算法。方法的具體流程如下:
圖1 本文方法流程Fig.1 Method flow chart
為驗(yàn)證方法的有效性,本文選用了Indian Pines和Pavia工程學(xué)院2組經(jīng)典數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)中,2個(gè)數(shù)據(jù)集的像素均選擇145×145,Indian Pines數(shù)據(jù)集去掉噪聲之后的波段數(shù)目為200個(gè),Pavia工程學(xué)院數(shù)據(jù)集去掉噪聲后的波段為103個(gè)。為使分類(lèi)結(jié)果更清晰,2個(gè)數(shù)據(jù)集均選取8個(gè)主要地物類(lèi)別進(jìn)行分類(lèi),原始高光譜灰度圖如圖2(a)和圖2(b)所示。
圖2 原始圖像Fig.2 Original image
本文實(shí)驗(yàn)應(yīng)用Matlab2015b進(jìn)行仿真實(shí)驗(yàn)。本文方法中Gabor濾波器相關(guān)參數(shù)設(shè)置情況:λmin=2.796 1,P=6,Q=10,σ=1,γ=1,φ=0。選擇徑向基核函數(shù)形式,懲罰系數(shù)根據(jù)網(wǎng)格搜索法從[10 103]中挑選,核函數(shù)從[10 2102]中挑選。采用“一對(duì)多”的分類(lèi)器結(jié)構(gòu)形式。本文參數(shù)均為多次實(shí)驗(yàn)驗(yàn)證后選擇的最佳參數(shù)。本文實(shí)驗(yàn)的評(píng)價(jià)指標(biāo)為:每個(gè)地物類(lèi)別的分類(lèi)精度、總體分類(lèi)精度(overall accuracy, OA)、平均分類(lèi)精度(average accuracy, AA)以及Kappa系數(shù)。最終記錄數(shù)據(jù)為實(shí)驗(yàn)10次數(shù)據(jù)的平均值。
本文方法從4個(gè)階段運(yùn)用高光譜圖像的空間信息:1)提取圖像的空間紋理信息,進(jìn)行空譜級(jí)聯(lián),簡(jiǎn)稱(chēng)為空譜級(jí)聯(lián);2)選取置信水平高樣本的4-鄰域樣本,更新標(biāo)記樣本集,簡(jiǎn)稱(chēng)為鄰域標(biāo)記;3)利用基于4-鄰域空間信息的SVM進(jìn)行分類(lèi),簡(jiǎn)稱(chēng)為空間信息SVM;4)根據(jù)8-鄰域樣本對(duì)分類(lèi)結(jié)果進(jìn)行后處理,簡(jiǎn)稱(chēng)為鄰域去噪。
2.3.1 實(shí)驗(yàn)1:?jiǎn)为?dú)使用空間信息對(duì)比實(shí)驗(yàn)
實(shí)驗(yàn)1主要將使用空間信息的5種方式進(jìn)行比較,5種方式為:僅使用圖像的光譜信息、空譜級(jí)聯(lián)、鄰域標(biāo)記、空間信息SVM和鄰域去噪。表1和表2分別為在Indian Pines數(shù)據(jù)集和Pavia工程學(xué)院數(shù)據(jù)集上使用5種空間信息輔助圖像分類(lèi)的結(jié)果。表中記錄了OA、AA、Kappa系數(shù)、程序運(yùn)行時(shí)間以及每項(xiàng)地物的具體分類(lèi)精度情況。從2個(gè)數(shù)據(jù)集可以得出相同的結(jié)論:本文使用的4種利用空間信息方式均對(duì)于提高圖像分類(lèi)性能有效。
表1 Indian Pines數(shù)據(jù)集使用空間信息分類(lèi)結(jié)果Table 1 Classification results of Indian Pines using spatial information
表2 Pavia工程學(xué)院數(shù)據(jù)集使用空間信息分類(lèi)結(jié)果Table 2 Classification results of Pavia University using spatial information
在分類(lèi)精度上,利用鄰域標(biāo)記方法對(duì)于分類(lèi)精度的提高最為有效。在Indian Pines數(shù)據(jù)集中,僅使用鄰域標(biāo)記的情況下,OA、AA和Kappa系數(shù)分別比僅使用光譜信息提升了16.44%、14.79%和0.190 7。在Pavia數(shù)據(jù)集中,OA、AA和Kappa系數(shù)分別比僅使用光譜信息提升6.32%、4.29%和0.838。因此,將帶標(biāo)記樣本的4-鄰域樣本中置信水平高的鄰域樣本加入到已標(biāo)記訓(xùn)練樣本中,對(duì)于SVM分類(lèi)超平面參數(shù)的計(jì)算十分重要。空間信息SVM在提升分類(lèi)精度上也有著不錯(cuò)的效果。其他兩種方法在精度提升方面起到的效果類(lèi)似。
從時(shí)間角度來(lái)看,利用空譜級(jí)聯(lián)方式耗時(shí)最少。這是因?yàn)榭兆V級(jí)聯(lián)的方式進(jìn)行了數(shù)據(jù)降維,在保留有效信息的情況下,去除了大量的冗余信息。使用空間信息SVM的方法進(jìn)行類(lèi)別判別的時(shí)候需要計(jì)算核函數(shù),計(jì)算量較大,因此所需要的時(shí)間最長(zhǎng)。
2.3.2 實(shí)驗(yàn)2:使用空間融合信息對(duì)比實(shí)驗(yàn)
實(shí)驗(yàn)2主要將本文方法中使用的空譜級(jí)聯(lián)、鄰域標(biāo)記加鄰域去噪和空間信息SVM幾種空間融合方式與本文方法進(jìn)行對(duì)比。
表3和表4分別展現(xiàn)了本文方法在Indian Pines和Pavia數(shù)據(jù)集中對(duì)高光譜圖像數(shù)據(jù)空間信息融合的分類(lèi)結(jié)果。通過(guò)2個(gè)表格可以看出,本文方法相對(duì)于對(duì)比實(shí)驗(yàn)的3種情況,OA、AA以及Kappa系數(shù)均有提高。數(shù)據(jù)有力的證明了本文方法對(duì)高光譜數(shù)據(jù)的空間信息利用的有效性,本文方法在提升高光譜圖像的分類(lèi)精度上起到了十分優(yōu)異的效果。但是從運(yùn)行時(shí)間來(lái)看,本文方法運(yùn)行時(shí)間較長(zhǎng)。
2.3.3 實(shí)驗(yàn)3:與其他算法對(duì)比實(shí)驗(yàn)
本節(jié)實(shí)驗(yàn)將本文方法與經(jīng)典算法和幾種利用空間信息且分類(lèi)精度優(yōu)異的算法進(jìn)行對(duì)比。對(duì)比算法選擇了標(biāo)準(zhǔn)SVM、三重訓(xùn)練算法(Tri-training)、基于譜聚類(lèi)的半監(jiān)督分類(lèi)算法(SC-SC)、Laplace支持向量機(jī)(LapSVM)以及基于空間-光譜聚類(lèi)的半監(jiān)督分類(lèi)方法(SC-S2C)。在LapSVM算法中,參數(shù)γA、γI的值在[10-3,103]區(qū)域內(nèi)交叉驗(yàn)證獲得最優(yōu)解,光譜近鄰數(shù)為4。在SC-SC算法中,光譜近鄰值設(shè)為4。在Tri-training算法中,使用標(biāo)準(zhǔn)SVM作為基分類(lèi)器。在SC-S2C算法中,光譜維數(shù)RNw設(shè)為5,空間信息維數(shù)RNs設(shè)為62,權(quán)重系數(shù)μ為0.4。Gabor濾波器參數(shù)為λmin=2.796 1,P=6,Q=10,σ=1,γ=1,φ=0。以上參數(shù)均選取多次實(shí)驗(yàn)后驗(yàn)證效果最好的參數(shù)。
表3 Indian Pines數(shù)據(jù)集高光譜圖像融合空間信息分類(lèi)結(jié)果Table 3 Classification results of hyperspectral image fusion spatial information in Indian Pines dataset
表4 Pavia工程學(xué)院數(shù)據(jù)集高光譜圖像融合空間信息分類(lèi)結(jié)果Table 4 Classification results of hyperspectral image fusion spatial information in Pavia University dataset
圖3和圖4分別為本節(jié)實(shí)驗(yàn)選取的6種方法的在Indian Pines數(shù)據(jù)集和Pavia工程學(xué)院數(shù)據(jù)集中的分類(lèi)效果灰度圖。根據(jù)圖3和圖4可以看出本文方法的分類(lèi)圖中噪點(diǎn)明顯少于其他對(duì)比實(shí)驗(yàn)分類(lèi)圖。
圖3 印第安農(nóng)林?jǐn)?shù)據(jù)集6種算法的分類(lèi)效果Fig.3 Classification effect diagram of six algorithms of Indian agriculture and forestry dataset
圖4 針對(duì)Pavia工程學(xué)院數(shù)據(jù)集6種算法的分類(lèi)效果Fig.4 Classification effect diagram for six algorithms of dataset of Pavia College of Engineering
表5 6種分類(lèi)算法OA對(duì)比(Indian Pines數(shù)據(jù)集)
表6 6種分類(lèi)算法OA對(duì)比(Pavia數(shù)據(jù)集)
1)不同于傳統(tǒng)高光譜分類(lèi)方法,本文方法在預(yù)處理階段、擴(kuò)充訓(xùn)練樣本集階段、分類(lèi)階段和后處理階段均結(jié)合了高光譜圖像的空間信息輔助分類(lèi)。實(shí)驗(yàn)表明方法中每一階段的結(jié)合空間信息均有利于提高分類(lèi)精度,證明了將空間信息引入高光譜圖像分類(lèi)的有效性。
2)在2個(gè)經(jīng)典數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn),證明本文方法在分類(lèi)性能上優(yōu)于其他對(duì)比算法。特別在初始有標(biāo)記樣本少的情況下,本文提出的方法可以有效地利用空間信息,選擇富含信息量的無(wú)標(biāo)簽樣本擴(kuò)充訓(xùn)練樣本集,提升分類(lèi)性能。
本文方法雖然有效利用了空間信息,提升了高光譜圖像的分類(lèi)精度,但是在提升精度的同時(shí),也引入了大量計(jì)算。如何在減少計(jì)算量的情況下更好地應(yīng)用空間信息需要進(jìn)行下一步的探究。