張 炎,華文深,黃富瑜,王強(qiáng)輝,索文凱
陸軍工程大學(xué)石家莊校區(qū)電子與光學(xué)工程系,河北 石家莊 050003
高光譜遙感(hyperspectral remote sensing)興起于20世紀(jì)80年代,是一種融合光譜學(xué)理論與成像原理的前沿技術(shù)[1]。高光譜圖像的光譜分辨率達(dá)到了納米級(jí)別,具有大量波段,是一種“圖譜合一”的三維圖像。光譜特征能夠表達(dá)地物的本質(zhì)特性,在目標(biāo)檢測(cè)領(lǐng)域運(yùn)用光譜特征進(jìn)行檢測(cè)更加可靠。由于光譜信息庫(kù)的不完善和大氣校正的困難,不需要先驗(yàn)知識(shí)的異常目標(biāo)檢測(cè)應(yīng)用更加廣泛,成為了近年來(lái)的研究熱點(diǎn)[2]。
最經(jīng)典的異常目標(biāo)檢測(cè)算法是Reed等[3]在1990年提出的RX算法(reed-xiaoli detection,RXD),最開(kāi)始應(yīng)用于多光譜圖像,后來(lái)成為高光譜異常目標(biāo)檢測(cè)的基準(zhǔn)算法,其本質(zhì)是基于廣義似然比檢測(cè)的一種恒虛警率異常目標(biāo)檢測(cè)算法,通過(guò)計(jì)算背景的協(xié)方差矩陣和均值向量獲得被檢測(cè)像元與背景像元的馬氏距離,從而得到檢測(cè)結(jié)果。但由于異常目標(biāo)在高光譜圖像中尺寸較小,出現(xiàn)概率低,全局RX算法(global RX,GRX)的檢測(cè)精度較低,虛警率較高。為提高檢測(cè)效果,Taitano等[4]提出了一種局部RX算法(local RX,LRX),采用滑動(dòng)雙窗口模型進(jìn)行檢測(cè),有效提高了檢測(cè)精度。但由于RX算法及其改進(jìn)算法[5]本質(zhì)上屬于線性檢測(cè)算法,沒(méi)有挖掘出高光譜數(shù)據(jù)的非線性特性,檢測(cè)效果仍然不夠理想。Kwon等[6]通過(guò)引入核函數(shù)提出了KRX算法(kernel RX,KRX),該算法是一種典型的非線性檢測(cè)算法,將線性不可分的原始數(shù)據(jù)投影到高維特征空間,增強(qiáng)了目標(biāo)和背景的差異性,提高了檢測(cè)精度,降低了虛警率。但由于KRX算法及其改進(jìn)算法[7-8]存在計(jì)算復(fù)雜度高等問(wèn)題,因此,為突破傳統(tǒng)的廣義似然比檢測(cè)和非線性核函數(shù)等方法的局限性,提高檢測(cè)精度,需要對(duì)算法進(jìn)行進(jìn)一步的改進(jìn)和優(yōu)化。
當(dāng)前大多數(shù)高光譜異常目標(biāo)檢測(cè)算法只關(guān)注目標(biāo)和背景在光譜信息方面的差異,忽略了兩者空間信息的差異,事實(shí)上,高光譜圖像異常不僅包括光譜異常,同時(shí)也包括空間異常。如果能夠挖掘出圖像的空間信息,對(duì)高光譜數(shù)據(jù)的光譜信息和空間信息進(jìn)行綜合分析,可以有效地提高檢測(cè)算法的精度[9]。因此,提出了一種基于空譜聯(lián)合異常度的高光譜異常目標(biāo)檢測(cè)算法(space-spectrum joint anomaly degree for hyperspectral anomaly target detection,SSJHAD),該算法不需要假設(shè)背景模型,基于滑動(dòng)雙窗口的基礎(chǔ)上對(duì)圖像進(jìn)行檢測(cè)。光譜角距離是一種常用的計(jì)算像元之間光譜信息差異的有效方法,但由于光譜角距離不能充分挖掘出像元之間的非線性差異,因此引入核函數(shù)將核光譜角作為度量像元之間光譜差異的方法,計(jì)算出中心像元的光譜異常度(spectral anomaly degree,SADspec);通過(guò)構(gòu)建空間窗模型得到圖像塊灰度向量的手段來(lái)描述空間方面的差異性,得到中心像元的空間異常度(spatial anomaly degree,SADspat);最后將兩者進(jìn)行加和得到最終的空譜聯(lián)合異常度(space-spectrum joint anomaly degree,SSAD),從而來(lái)判定像元是否屬于異常目標(biāo)。
基于空譜聯(lián)合異常度的高光譜異常目標(biāo)檢測(cè)算法建立在滑動(dòng)雙窗口的基礎(chǔ)上,中心像元為待測(cè)像元,內(nèi)外窗之間的像元為背景像元,如圖1所示。分別求解中心像元和背景像元之間的光譜差異和空間差異得到光譜異常度和空間異常度,并將兩者進(jìn)行加和得到空譜聯(lián)合異常度,從而得到檢測(cè)結(jié)果。
圖1 算法的滑動(dòng)雙窗口檢測(cè)模型Fig.1 The sliding double window model of algorithm
光譜異常度的原理是利用像元之間光譜信息的差異,逐個(gè)求解中心像元與背景像元的核光譜角,同時(shí)設(shè)定閾值ε1,若距離大于閾值,則中心像元的光譜異常度加1,反之,則加0,利用滑動(dòng)窗模型即可得到所有像元的光譜異常度。
1.1.1 核光譜角
光譜角(spectral angle,SA)是一種能夠衡量?jī)蓚€(gè)光譜向量差異程度的方法[10]。兩個(gè)光譜向量之間的光譜角越小,說(shuō)明兩者的光譜曲線越相似,屬于同一種物質(zhì)的概率越高;反之,屬于同一種物質(zhì)的概率越低。假定原始數(shù)據(jù)集為X=[x1,x2,…,xN]∈RD×N,其中D為光譜維數(shù),N為像元數(shù),其列向量為像元的光譜向量,則光譜角的表達(dá)式為
(1)
從式(1)可以看出光譜角只和向量的方向有關(guān),和向量本身的長(zhǎng)度無(wú)關(guān),因此,光譜角能夠有效地度量?jī)蓚€(gè)光譜曲線的差異性,同時(shí)具有很好的抵抗乘性干擾的能力,不受光譜強(qiáng)度變化的影響[11]。但由于光譜角不能很好地挖掘出高光譜圖像的非線性特性,檢測(cè)精度不高,因此引入核函數(shù)求解像元之間的核光譜角(kernel spectral angle,KSA)能夠有效地挖掘圖像的非線性特性,提高檢測(cè)精度[12]。通過(guò)非線性映射函數(shù)φ可將原始數(shù)據(jù)集X映射到高維特征空間得到:φ(X)=[φ(x1),φ(x2),…,φ(xN)]∈RQ×N,Q遠(yuǎn)遠(yuǎn)大于D,則光譜角在高維特征空間中的表達(dá)式為
(2)
由于非線性映射函數(shù)φ一般不可知,無(wú)法直接在高維特征空間中進(jìn)行計(jì)算,從而轉(zhuǎn)化為核函數(shù)在原始特征空間點(diǎn)積計(jì)算的形式,一般采用高斯徑向基(Gaussian radial Basis function,GRBF)核函數(shù),表達(dá)式為
(3)
利用核函數(shù)性質(zhì)k(x,y)=〈φ(x),φ(y)〉將高維特征空間的數(shù)據(jù)運(yùn)算映射為低維空間的核函數(shù)運(yùn)算,則可得到核光譜角的表達(dá)式
(4)
通過(guò)逐個(gè)求解中心像元和背景像元的核光譜角,根據(jù)得到的核光譜角結(jié)果的平均值設(shè)置閾值ε1,通過(guò)比較得到高光譜圖像中像元的光譜異常度SADspec。
高光譜圖像中的像元成千上萬(wàn)且都不是獨(dú)立存在,以像元為中心的鄰域能夠表達(dá)該像元的空間結(jié)構(gòu)信息[13]。為了能夠定量的衡量不同像元空間信息的差異程度,基于雙窗口的基礎(chǔ)上以坐標(biāo)點(diǎn)為(i,j)的待測(cè)像元為中心建立一定大小的空間窗,得到圖像塊灰度向量H(i,j),內(nèi)外窗均表示直徑為奇數(shù)大小的正方形,內(nèi)窗直徑定義為rin,外窗直徑定義為rout,如圖2所示。通過(guò)求解中心像元和背景像元圖像塊灰度向量的歐式距離衡量空間信息方面的差異。由于圖像中存在很多噪聲點(diǎn),并且都是獨(dú)立存在的,容易與異常目標(biāo)相混淆,建立空間窗能夠有效地避免噪聲點(diǎn)的影響。
圖2 空間異常度的檢測(cè)模型Fig.2 Detection model of spatial anomaly degree
高光譜圖像具有大量波段,為降低計(jì)算的復(fù)雜度,本文先利用典型的PCA(principal component analysis)算法對(duì)原始高光譜圖像進(jìn)行降維,將得到的前M個(gè)主成分作為空間異常度檢測(cè)的輸入圖像。在降維之前首先根據(jù)虛擬維度(virtual dimensionality,VD)確定原始數(shù)據(jù)的本征維數(shù)(intrinsic dimensionality,ID),從而確定M的值。文獻(xiàn)[13]中表明L2距離能夠作為度量圖像塊之間空間結(jié)構(gòu)相似性的一個(gè)可靠準(zhǔn)則。因此,通過(guò)計(jì)算中心像元和背景像元的圖像塊灰度向量的歐式距離,并根據(jù)得到的歐式距離結(jié)果的平均值設(shè)定閾值ε2,若距離大于閾值,則中心像元的空間異常度加1,反之,則加0,對(duì)得到的M個(gè)圖像的空間異常度進(jìn)行加權(quán)和得到最終空間異常度。像元的空間異常度SADspat定義為
SADspat(i,j)=q1SAspat(i1,j1)+
q2SAspat(i2,j2)+…+qMSAspat(iN,jN)
(5)
(6)
虛擬維度:降維的本質(zhì)是將高維特征空間的原始數(shù)據(jù)投影到低維特征空間中,低維特征空間的維數(shù)稱為本征維數(shù)。通過(guò)求取虛擬維數(shù)確定本征維數(shù),選擇相應(yīng)的波段數(shù)目?;贜eyman-Pearson探測(cè)理論分析的HFC(Harsanyi-Farrand-Chang)是確定VD值的常用方法,原理如下:
(7)
(8)
其中,μ是未知量。當(dāng)圖像像元N足夠大時(shí),方差約為
(9)
檢測(cè)率Pd和虛警率Pf的定義表達(dá)式為
(10)
中心像元的空譜聯(lián)合異常度由光譜異常度和空間異常度共同決定,定義為
SSAD(i,j)=SADspec(i,j)+SADspat(i,j)
(11)
像元的空譜聯(lián)合異常度越大,表明該像元屬于異常目標(biāo)的概率越大。
按照上述方法遍歷高光譜圖像中的所有像元,得到每個(gè)像元的空譜聯(lián)合異常度,并設(shè)置閾值,異常度高于閾值的像元為異常像元,反之,為背景像元,從而獲得圖像的最終檢測(cè)結(jié)果。
為充分驗(yàn)證本文算法的可靠性和有效性,采用了三組真實(shí)的高光譜數(shù)據(jù)進(jìn)行實(shí)驗(yàn)仿真。仿真環(huán)境為:CPU處理器為Intel Core i7-3635QM,主頻為2.40 GHZ,安裝內(nèi)存為8 GB,軟件為Matlab2018a。
數(shù)據(jù)1選取的是AVIRIS傳感器拍攝的美國(guó)San Diege海軍機(jī)場(chǎng)的部分?jǐn)?shù)據(jù),波長(zhǎng)范圍為0.37~2.51 μm,去除低信噪比和水蒸氣吸收比較嚴(yán)重的波段,保留波段為189個(gè);空間分辨率為3.5 m,截取的區(qū)域大小為100×100像素,存在38個(gè)異常目標(biāo);數(shù)據(jù)2和數(shù)據(jù)3選取的是AVIRIS傳感器拍攝的美國(guó)洛杉磯機(jī)場(chǎng)的數(shù)據(jù),波長(zhǎng)范圍為0.37~2.51 μm,去除低信噪比的波段和水蒸氣吸收比較嚴(yán)重的波段,保留波段為205個(gè);其空間分辨率為7.1 m,截取的區(qū)域大小為100×100像素,分別存在2個(gè)異常目標(biāo)和17個(gè)異常目標(biāo)。圖3為數(shù)據(jù)1的偽彩色圖像和目標(biāo)分布圖;圖4為數(shù)據(jù)2的偽彩色圖像和目標(biāo)分布圖;圖5為數(shù)據(jù)3的偽彩色圖像和目標(biāo)分布圖。
本文算法是基于雙窗口模型的基礎(chǔ)上進(jìn)行檢測(cè),利用雙窗口進(jìn)行選擇待測(cè)像元和背景像元。因此內(nèi)外窗口的尺寸大小對(duì)檢測(cè)結(jié)果具有很大的影響,如果選擇的內(nèi)外窗口使背景像元中存在異常目標(biāo)則會(huì)很大程度上影響檢測(cè)的精度。對(duì)本文中采用的三組數(shù)據(jù)進(jìn)行具體分析,可以發(fā)現(xiàn),不同數(shù)據(jù)的異常目標(biāo)的大小和分布不同,選取的理想窗口尺寸也存在差異。數(shù)據(jù)1的異常目標(biāo)大小基本為4×4像素的范圍內(nèi),相鄰目標(biāo)的距離大約為11個(gè)像素,因此,選取的內(nèi)外窗的尺寸分別為rin=9,rout=11時(shí)能夠獲得最為純凈的背景像元,避免了異常目標(biāo)的污染,具有最好的檢測(cè)效果;同理,數(shù)據(jù)2選取的內(nèi)外窗尺寸大小為rin=11,rout=17時(shí)能夠獲得最好的檢測(cè)效果;由于數(shù)據(jù)3中的不同異常目標(biāo)的大小和距離存在很大的變化,因此,通過(guò)大量實(shí)驗(yàn)結(jié)果得出最為理想的尺寸大小為rin=9,rout=15。
圖3 偽彩色圖像(a)及其相應(yīng)的目標(biāo)分布(b)Fig.3 Pseudo-color image (a) and its corresponding target distribution (b)
圖4 偽彩色圖像(A)及其相應(yīng)的目標(biāo)分布(b)Fig.4 Pseudo-color image (a) and its corresponding target distribution (b)
圖5 偽彩色圖像(a)及其相應(yīng)的目標(biāo)分布(b)Fig.5 Pseudo-color image (a) and its corresponding target distribution (b)
為充分說(shuō)明SSJHAD算法的可靠性和適用性,分別利用RX算法、LRX算法、KRX算法、只計(jì)算光譜異常度的SHAD算法、將光譜角替代SSJHAD算法中核光譜角的SSJAD算法與SSJHAD算法對(duì)三組數(shù)據(jù)分別進(jìn)行仿真實(shí)驗(yàn),圖6為六種算法對(duì)實(shí)驗(yàn)數(shù)據(jù)1的異常目標(biāo)檢測(cè)效果圖,圖7為六種算法對(duì)實(shí)驗(yàn)數(shù)據(jù)2的異常目標(biāo)檢測(cè)效果圖,圖8為六種算法對(duì)實(shí)驗(yàn)數(shù)據(jù)3的異常目標(biāo)檢測(cè)效果圖,可以看出SSJHAD算法的檢測(cè)效果相比其他五種算法有了明顯地提高,虛警率較低。
圖7 六種算法在數(shù)據(jù)2上的檢測(cè)結(jié)果對(duì)比Fig.7 Comparison of anomaly detection results of six algorithms on data 2
圖8 六種算法在數(shù)據(jù)3上的檢測(cè)結(jié)果對(duì)比Fig.8 Comparison of anomaly detection results of six algorithms on data 3
通過(guò)觀察三組異常目標(biāo)檢測(cè)效果圖,可以看出,RX算法和LRX算法基本上無(wú)法識(shí)別三組高光譜數(shù)據(jù)的異常目標(biāo);KRX算法雖然能夠檢測(cè)出絕大多數(shù)的異常目標(biāo),但虛警率很高,檢測(cè)結(jié)果中殘留了許多背景目標(biāo);SHAD算法的檢測(cè)效果雖然優(yōu)于前兩個(gè)算法,但仍然沒(méi)有檢測(cè)出所有的異常目標(biāo),虛警率依然很高;SSJAD算法能夠檢測(cè)出所有的異常目標(biāo),殘留的背景目標(biāo)也有所減少;SSJHAD算法在檢測(cè)所有異常目標(biāo)的同時(shí),能夠有效地抑制背景信息,異常目標(biāo)檢測(cè)效果圖明顯優(yōu)于其他五種算法。
為了能夠定量的比較六種算法的檢測(cè)效能,利用ROC(receiver operating characteristic curve)曲線和AUC(area under the curve)值進(jìn)行說(shuō)明比對(duì)。若ROC曲線越向左上方彎曲,AUC值越大,檢測(cè)效能越好;反之,檢測(cè)效能越差。六種算法檢測(cè)三組數(shù)據(jù)的ROC曲線如圖9所示,不同算法檢測(cè)結(jié)果的AUC值和運(yùn)行時(shí)間如表1所示。
圖9 六種算法的ROC曲線對(duì)比Fig.9 Comparison of ROC curves of six algorithms
表1 三組數(shù)據(jù)的AUC值和運(yùn)行時(shí)間(s)Table 1 AUC values/execution times with the three sets of data(s)
從ROC曲線圖和AUC值可以看出,SSJHAD算法在三組不同數(shù)據(jù)的檢測(cè)效能都遠(yuǎn)遠(yuǎn)高于其他五種算法,具有一定的可靠性和適用性;同時(shí),在虛警率較低的前提下,仍然具有很高的檢測(cè)精度,說(shuō)明SSJHAD算法能夠有效地抑制背景信息的干擾。而RX,LRX和KRX算法在數(shù)據(jù)1的檢測(cè)效果相比數(shù)據(jù)2和數(shù)據(jù)3有明顯的差距,原因在于這三種算法更適用于背景單一的數(shù)據(jù),對(duì)于背景復(fù)雜的高光譜數(shù)據(jù),檢測(cè)效果會(huì)明顯下降;將KRX算法和RX算法或者SSJHAD算法與SSJAD算法的檢測(cè)結(jié)果進(jìn)行對(duì)比,可以看出,通過(guò)引入核函數(shù)能夠有效地挖掘出數(shù)據(jù)的非線性特性,提高算法的檢測(cè)精度。對(duì)比SHAD算法和SSJHAD算法的檢測(cè)效能,說(shuō)明了異常目標(biāo)和背景不僅僅在光譜信息上存在差異,在空間信息上也存在差異,有效地將圖像的空間信息與光譜信息相結(jié)合進(jìn)行檢測(cè)能夠一定程度地提高檢測(cè)精度。綜上所述,SSJHAD算法同時(shí)考慮了異常目標(biāo)的光譜異常和空間異常,并引入了核函數(shù)對(duì)常用的光譜角進(jìn)行改進(jìn)得到核光譜角來(lái)衡量像元之間的光譜差異。因此,SSJHAD算法應(yīng)用于異常目標(biāo)檢測(cè)能夠取得很好效果。
從表1中可以看出,在保證檢測(cè)精度前提下,KRX算法的運(yùn)行速度遠(yuǎn)低于RX算法、LRX算法、SHAD算法、SSJAD算法和SSJHAD算法,表明其計(jì)算復(fù)雜度較高。
針對(duì)目標(biāo)與背景的異常不僅僅體現(xiàn)在光譜異常,同時(shí)還存在空間異常的特點(diǎn),本文提出了一種基于空譜聯(lián)合異常度的高光譜異常目標(biāo)檢測(cè)算法。算法基于滑動(dòng)雙窗口的基礎(chǔ)上,提出了光譜異常度和空間異常度的概念,并將兩者進(jìn)行加和得到聯(lián)合異常度對(duì)圖像進(jìn)行檢測(cè)。算法不需要假設(shè)背景模型,對(duì)不同的高光譜圖像都具有很好的檢測(cè)效果,具有普適性。在光譜異常度方面,引入了核函數(shù)來(lái)挖掘出高光譜圖像的非線性特性,用核光譜角計(jì)算出像元的光譜異常度,增強(qiáng)了背景和目標(biāo)的可分性。在空間異常度方面,通過(guò)計(jì)算不同像元的圖像塊向量的歐式距離能夠有效地降低噪聲對(duì)檢測(cè)精度的影響。實(shí)驗(yàn)表明,本文所提的SSJHAD算法運(yùn)行速度要優(yōu)于KRX算法,相比于其他算法,提高了檢測(cè)精度,降低了虛警率。