楊 佳,華文深,劉 恂,馬左紅
(1.軍械工程學(xué)院,河北 石家莊050003;2.解放軍73101部隊(duì),江蘇 徐州221000)
在經(jīng)歷了全色成像、彩色攝影、多光譜掃描成像階段后,20世紀(jì)80年代出現(xiàn)了成像光譜的概念。高光譜成像是利用連續(xù)的窄小波段獲取目標(biāo)有關(guān)信息的技術(shù),高光譜數(shù)據(jù)將傳統(tǒng)的圖像維和光譜維信息融為一體,在獲取目標(biāo)空間圖像的同時(shí),得到每個(gè)圖像單元對(duì)應(yīng)的光譜信息,這樣,在基于空間維度進(jìn)行目標(biāo)分類識(shí)別的同時(shí),能夠從光譜維度依光譜特征實(shí)現(xiàn)目標(biāo)信息的反演和識(shí)別。
高光譜數(shù)據(jù)中波段數(shù)量多,波段之間相關(guān)性強(qiáng),信息冗余多,使數(shù)據(jù)處理難度加大。為了有效地利用高光譜數(shù)據(jù)的豐富信息,同時(shí)較快地完成數(shù)據(jù)處理,就需要對(duì)原始數(shù)據(jù)進(jìn)行降維[1]。波段選擇便是降維的重要方法之一,依據(jù)一定的判據(jù)從全部波段中選出最能表示目標(biāo)特征的若干波段,并以此來表示整個(gè)數(shù)據(jù)集。該方法克服了變換法改變圖像特性的缺點(diǎn),較好地保留了最原始的數(shù)據(jù)信息,更有利于保持圖像的原有特性,成為高光譜數(shù)據(jù)降維的重要研究方向[2-6]。
波段選擇應(yīng)遵循以下3個(gè)原則[7]:
1)所選的波段信息量盡可能豐富;
2)所選的波段之間相關(guān)性盡可能小,保持各波段的獨(dú)立性和有效性;
3)所選的波段組合對(duì)識(shí)別或分類目標(biāo)的光譜特性差異要最大、類別可分性要強(qiáng)。
在現(xiàn)階段研究中,波段選擇的基本算法可以分為2類:一種是基于信息量的最佳波段選擇方法,如最佳指數(shù)因子法、波段指數(shù)法、自適應(yīng)波段法等;另一種是基于類間可分性的波段選擇方法,如計(jì)算離散度、光譜相關(guān)系數(shù)、波段分組等。這些方法在計(jì)算過程中,只是單獨(dú)考慮波段信息量或類間可分性,導(dǎo)致在對(duì)已知光譜特征的目標(biāo)進(jìn)行分類時(shí),效果不夠理想。為解決這一問題,本文將波段信息量與可分性綜合進(jìn)行考慮,在保證信息量最大的前提下,對(duì)波段的類間可分性進(jìn)行分析,從而找到分類精度較高的波段組合。使用K-L散度(Kullback-Leibler divergence)計(jì)算波段信息量差異,利用光譜可分性距離計(jì)算類間可分性,得到最優(yōu)波段組合,實(shí)現(xiàn)針對(duì)特定目標(biāo)的波段選擇。
常見的相似性度量方法有光譜角制圖、光譜信息散度和相關(guān)系數(shù)等,它們可以分別從不同方面描述兩波段的相似性。為了在波段選取的過程中,即保證所選波段信息量豐富,又能去除臨近波段之間大量的冗余信息,這里使用K-L散度來衡量波段間的相似程度以及波段之間信息量大小的關(guān)系。K-L散度是一種在信息論中得到廣泛應(yīng)用的信號(hào)相似度度量[8]。對(duì)于2個(gè)概率分布為P和Q的離散隨機(jī)信號(hào),Q相對(duì)于P的K-L散度可以按照(1)式進(jìn)行計(jì)算:
即按照概率P求得的P和Q對(duì)數(shù)差的平均值,并且當(dāng)且僅當(dāng)∑iP(i)=∑iQ(i)=1時(shí)才有意義。
將K-L散度應(yīng)用到高光譜圖像處理時(shí),把每一個(gè)波段看作一個(gè)隨機(jī)變量,即可求出任意2個(gè)波段的相似性[9]。假設(shè)一組高光譜數(shù)據(jù)有L個(gè)波段,表示為Y=[y1,y2,…,yL],其中yi(1≤i≤L)是N維波段列向量,代表波段i上N 個(gè)像元光譜分量。將yi進(jìn)行歸一化,得到,那么第j個(gè)波段相對(duì)于第i個(gè)波段的K-L散度為
式(2)的物理意義是用第j個(gè)波段來表示第i個(gè)波段所需信息量的大小。K-L散度越大,說明完全用第j個(gè)波段來表示第i個(gè)波段的難度越大,即2個(gè)波段之間的相似度越低[10]。
為了完成針對(duì)特定目標(biāo)的最優(yōu)波段選擇,需要對(duì)高光譜數(shù)據(jù)進(jìn)行光譜可分性距離的計(jì)算,分析不同地物類別在哪些波段上最容易區(qū)分。高光譜數(shù)據(jù)是地物對(duì)電磁波反射信息和自身輻射信息的綜合,本質(zhì)上記載了地物的總輻射量,即像元亮度值,稱為DN值(digital number)。不同地物由于結(jié)構(gòu)、組成成分和物理化學(xué)性質(zhì)不同,導(dǎo)致其光譜特性存在著差異。基于此,采用光譜混合距離可以有效地對(duì)光譜可分性距離進(jìn)行計(jì)算。光譜的混合距離計(jì)算公式如下“
式中:Dkl為光譜的混合距離;ykm、ylm分別為第k類和第l類地物在m波段上的光譜亮度值。對(duì)于任意的兩類地物,光譜混合距離越大,說明在該波段或波段組合上的可分性越好,判讀效果也就越好。
算法主要由4步組成:
HBO經(jīng)過??瓢l(fā)展已具有穩(wěn)定安全的治療方案,嚴(yán)重不良反應(yīng)罕見,目前最常見的不良反應(yīng)是中耳氣壓傷,其發(fā)生受加減壓速度和咽鼓管功能影響。由于鼻腔手術(shù)后常有黏膜腫脹和分泌物積蓄,故治療前應(yīng)保持鼻腔、鼻竇口和咽鼓管的通暢,預(yù)防中耳和鼻竇氣壓傷的發(fā)生。本次實(shí)驗(yàn)中未觀察到實(shí)驗(yàn)動(dòng)物發(fā)生明顯不良反應(yīng)。綜上所述,早期HBO治療在鼻腔手術(shù)后黏膜的恢復(fù)過程中,對(duì)抑制纖維結(jié)締組織增生和減少瘢痕形成具有促進(jìn)作用,可減輕鼻內(nèi)鏡手術(shù)后的去黏膜化反應(yīng),甚至可能在一部分難治性鼻-鼻竇炎中起到重要的逆轉(zhuǎn)作用。
1)選擇初始波段對(duì)波段子集進(jìn)行初始化,產(chǎn)生集合φ1={B1},其中B1為初始波段,與其他各波段的K-L散度值之和最大。
2)計(jì)算剩余波段與φ1中各元素的K-L散度,找到K-L散度值最大的對(duì)應(yīng)波段B2,它與φ1中元素最不相似,加入1)的波段子集中,即φ2=φ1∪{B2}。
3)循環(huán)步驟2),直到φx中的波段數(shù)目達(dá)到設(shè)定閾值。
4)在φx的波段中,對(duì)特定目標(biāo)進(jìn)行光譜可分性分析,去掉地物可分性距離小的波段,得到最終的波段子集φ。
實(shí)驗(yàn)所采用的高光譜數(shù)據(jù)有89個(gè)波段,波長(zhǎng)范圍從0.45μm~0.80μm,光譜分辨率為4nm。取第15、30、57波段分別作為R、G、B分量合成假彩色圖,如圖1所示。
圖1 波段15、30、57合成的偽彩色圖像Fig.1 Pesudo color image at channel 15,30,57
初始波段的選擇對(duì)于整個(gè)波段選擇過程具有決定性的作用。計(jì)算任意2個(gè)波段之間的K-L散度,找到相似性最低的2個(gè)波段(波段28與波段64)組成初始波段集。實(shí)際應(yīng)用中,最優(yōu)波段組合中的波段數(shù)目與圖像復(fù)雜程度有關(guān),圖像越復(fù)雜、包含的地物種類越多,所需要的波段數(shù)目就越大,從而為后續(xù)的目標(biāo)分類與探測(cè)過程提供足夠的數(shù)據(jù)支撐。圖像中主要有偽裝目標(biāo)、草坪、樹木、屋頂、路面等5種地物,設(shè)置波段個(gè)數(shù)為6個(gè),可以滿足圖像分類需要。
最終通過K-L散度計(jì)算得到包含6個(gè)波段的波段子集是φ={28,62,84,82,51,26}。各波段的灰度圖如圖2所示。
圖2 波段選擇結(jié)果Fig.2 Result of band selection
波段子集中,各波段分布均勻,不在成像光譜范圍的兩端,受到儀器本身干擾和其他噪聲干擾較少,比較理想。
圖3 5種地物的光譜曲線Fig.3 Spectral curves of 5 kinds of ground objects
為選出目標(biāo)與不同背景地物的最佳3波段(用于合成偽彩色圖像),在表1中列出的波段組合中選取最優(yōu)波段子集中相關(guān)性最小,包含信息最多的3個(gè)波段:28、51、84。這3個(gè)波段出現(xiàn)的頻率比較高,它們之間的相關(guān)系數(shù)分別為:0.825 5、0.755 0、0.710 1,相對(duì)其他波段組合相關(guān)系數(shù)較小,所以選取這3個(gè)波段用于整幅圖像的最佳3波段組合,將波段84(781nm)賦予紅色、波段28(557nm)賦予綠色、波段51(649nm)賦予藍(lán)色。得到如圖4所示的合成后的偽彩色圖像。
表1 區(qū)別目標(biāo)與其他種類地物的最優(yōu)波段子集Table 1 Optimal subset of bands for distinguishing target and other kinds of ground objects
圖4 波段84、28、51合成的偽彩色圖像Fig.4 Pesudo color image at channel 84、28、51
為了驗(yàn)證所選波段的分類效果,利用光譜角制圖法對(duì)圖像進(jìn)行分類。
光譜角制圖(spectral angle mapper,SAM)以光譜角為基礎(chǔ),將每條光譜都視為波譜空間的一個(gè)矢量,根據(jù)矢量夾角來確定兩條光譜間的相似程度。夾角越小,說明像元與參考光譜越相似,分入該類;夾角超過指定的弧度閾值,則不被分為該類。在分類過程中,可以消除或減弱因太陽入射角、地形、觀測(cè)角等因素引起的光譜變異的同物異譜現(xiàn)象,適用于高光譜數(shù)據(jù)分類。以選出的3波段28、51、82為例進(jìn)行分類,設(shè)定各類地物分類時(shí)的光譜角閾值,光譜角從0開始,以0.01rad為單位逐漸增大,找到能夠使各類地物分類精度高且錯(cuò)分精度小的光譜角作為閾值,結(jié)果如表2所示。
表2 各類地物光譜角閾值Table 2 Spectral angle thresholds of ground objects
利用表2中的光譜角閾值對(duì)圖像進(jìn)行分類得到如圖5所示的分類結(jié)果,地面參考圖像進(jìn)行對(duì)比,得到混淆矩陣如表3所示?;煜仃嚕址Q誤差矩陣,行中各元素表示分類結(jié)果中某類集合與參考圖像中各類集合的交集像元個(gè)數(shù);列中各元素表示參考圖像中某類集合與分類結(jié)果中各類集合的交集像元個(gè)數(shù);列總計(jì)為參考圖像中某類所有像元個(gè)數(shù)的之和。利用混淆矩陣,計(jì)算Kappa系數(shù)和分類精度對(duì)分類效果進(jìn)行評(píng)價(jià)。
表3 分類后的混淆矩陣Table 3 Confusion matrix of classification
Kappa=(總體精度-期望精度)/(1-期望精度)。Kappa值大于80%,說明分類圖像與參考圖像吻合度很好,40%~80%表示吻合度中等,40%表示吻合度很差。經(jīng)過計(jì)算,Kappa系數(shù)為0.887 8,說明分類效果較好。
圖5 分類結(jié)果Fig.5 Result of classification
總體分類精度=(正確分類的像元數(shù)/總像元數(shù))=(29 185/31 656)=92.2%。
其中5種類別地物的分類精度分別為:97.14%、57.81%、99.68%、95.67%、72.98%。從計(jì)算結(jié)果可以看出,整個(gè)分類過程對(duì)草地、道路、屋頂分類精度比較高,而對(duì)偽裝目標(biāo)與樹木分類精度較低。分析造成分類精度較低的原因主要有以下幾個(gè)方面:第一,分類過程受主觀因素影響較大。光譜角閾值是經(jīng)過反復(fù)實(shí)驗(yàn)觀察得到,并不是最準(zhǔn)確的。閾值偏大,會(huì)將不同類別的像元?dú)w入一類;閾值偏小,會(huì)將本該屬于一類的像元?dú)w入不同類別。第二,所使用的偽裝材料與樹木在可見光部分光譜吻合比較好,難以區(qū)分,單純依靠可見光3波段的光譜角制圖法分類,得到的結(jié)果精度不高。加入紅外波段的研究將會(huì)使分類更加準(zhǔn)確,這也是將來工作的研究重點(diǎn)。
本文設(shè)計(jì)了一種基于K-L散度與光譜可分性距離的波段選擇算法。將每個(gè)波段的N個(gè)像元光譜分量看成一個(gè)N 維波段向量,利用K-L散度計(jì)算得到信息量大且相似性最小的波段組合,同時(shí)結(jié)合高光譜圖像中各類地物的連續(xù)光譜特征,計(jì)算它們的光譜可分性距離,距離越大,說明在該波段中可分性越好,最終得到可以用于合成假彩色圖像的3個(gè)波段。實(shí)驗(yàn)結(jié)果表明,本文所用的算法在應(yīng)用到高光譜圖像的分類時(shí)能夠取得良好效果,是一種實(shí)用的高光譜圖像波段選擇算法。
[1] 張良培,張立福.高光譜遙感[M].武漢:武漢大學(xué)出版社,2005.ZHANG Liang-pei,ZHANG Li-fu.Hyperspectral remote sensing [M].Wuhan:Wuhan University Press,2005.(in Chinese)
[2] 劉建平,趙英時(shí),孫淑玲.高光譜遙感數(shù)據(jù)最佳波段選擇方法試驗(yàn)研究[J].遙感技術(shù)與應(yīng)用,2001,16(1):7-13.LIU Jian-ping,ZHAO Ying-shi,SUN Shu-ling.Experimental studies about methods on optimal bands selection of hyperspectral remote sensing datasets[J].Remote Sensing Technology and Application.2001,16(1):7-13.(in Chinese with an English abstrast)
[3] 楊金紅,尹球,周寧.一種改進(jìn)的高光譜數(shù)據(jù)自適應(yīng)波段選擇方法[J].遙感技術(shù)與應(yīng)用,2007,22(4):513-519.YANG Jin-hong,YIN Qiu,ZHOU Ning.An improved method of hyperspectral remote sensing data adaptive band selection[J].Remote Sensing Technology and Application,2007,22(4):513~519.(in Chinese with an English abstrast)
[4] DU Qian.Band selection and its impact on target detection and classification in hyperspectral image analysis[C].Maryland:IEEE Greenbelt,2003:374-377.
[5] CHANG Chein-I,WANG Su.Constrained band selection for hyperspectral imagery[J].IEEE Trans.Geosci.Remote Sens,2006,44(6):1575-1585.
[6] DU Qian,YANG He.Similarity-based unsupervised band selection for hyperspectral image analysis[J].IEEE Geosci.Remote Sens.2008,5(4):564-568.
[7] 杜培軍.高光譜遙感信息中的特征提取與應(yīng)用研究[J].光子學(xué)報(bào),2005,34(2):293-298.DU Pei-jun.Spectral feature extraction in hyperspectral RS date and its application to information processing[J].Acta photonica sinica,2005,34(2):293-298.(in Chinese with an English abstract)
[8] SHEFFIELD C.Selecting band combinations from multispectral data[J].Photogrammetric Engineering& Remote Sensing,1985,51(6):681-687.
[9] 何元磊,劉代志,易世華.一種新的高光譜圖像波段選擇方法[J].光電工程,2009,37(9):122-126.HE Yuan-lei,LIU Dai-zhi,YI Shi-hua.A new band selection method for hyperspectral images[J].Opto-Electronic Engineering,2009,37(9):122-126.(in Chinese with an English abstrast)
[10] 劉雪松,葛亮,王斌,等.基于最大信息量的高光譜遙感圖像無監(jiān)督波段選擇方法[J].紅外與毫米波學(xué)報(bào),2012,31(2):166-170.LIU Xue-song,GE Liang,WANG Bin,et al.An unsupervised band selection algorithm for hyperspectral imagery based on maximal information[J].Journal of Infrared and Millimeter Waves,2012,31(2):166-170.(in Chinese with an English abstract)