秦進(jìn)春,余旭初,張 麗,孫 笛
(1.西安測(cè)繪研究所,陜西 西安 710054;2.地理信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710054;3.信息工程大學(xué),河南 鄭州 450001)
?
基于非正定OCSVM的高光譜影像地物異常檢測(cè)
秦進(jìn)春1,2,余旭初3,張麗1,2,孫笛1,2
(1.西安測(cè)繪研究所,陜西 西安 710054;2.地理信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710054;3.信息工程大學(xué),河南 鄭州 450001)
摘要:針對(duì)基于高斯徑向基核函數(shù)的OCSVM等異常檢測(cè)算法,對(duì)地物光譜變異極為敏感,導(dǎo)致算法異常檢測(cè)性能不穩(wěn)定的問(wèn)題,根據(jù)光譜角度余弦測(cè)度對(duì)光譜形狀相似性的描述不受地物光譜輻射強(qiáng)度變異影響的特性,將具有非正定核特性的光譜角度余弦核測(cè)度引入非正定SVM算法中,提出一種基于非正定OCSVM的高光譜影像地物異常檢測(cè)算法。利用四組模擬數(shù)據(jù)進(jìn)行目標(biāo)異常檢測(cè)實(shí)驗(yàn),結(jié)果表明,該算法能夠有效檢測(cè)出高光譜影像數(shù)據(jù)中的目標(biāo)地物,檢測(cè)精度提升明顯。
關(guān)鍵詞:高光譜影像;光譜角度余弦核測(cè)度;支持向量機(jī);非正定單類支持向量機(jī);異常檢測(cè)
高光譜遙感與合成孔徑雷達(dá)、激光測(cè)距一起被譽(yù)為最具發(fā)展?jié)摿Φ男滦瓦b感數(shù)據(jù)獲取技術(shù),其進(jìn)步之處就在于獲取地物連續(xù)光譜影像的同時(shí),將目標(biāo)的輻射光譜信息與空間圖像信息有機(jī)結(jié)合在一起[1]。通過(guò)挖掘高光譜影像數(shù)據(jù)信息進(jìn)行目標(biāo)檢測(cè)正成為遙感數(shù)據(jù)應(yīng)用領(lǐng)域的研究熱點(diǎn)之一。根據(jù)目標(biāo)光譜信息挖掘程度的不同,目標(biāo)檢測(cè)主要分為異常檢測(cè)和光譜匹配檢測(cè)兩大類[2]。
異常檢測(cè)方法是面向原始高光譜數(shù)據(jù)進(jìn)行操作的,不需要待檢測(cè)目標(biāo)的光譜先驗(yàn)知識(shí)[3],因此得到快速發(fā)展。RX檢測(cè)[4]是異常檢測(cè)算法的典型代表,其可很好地解決多元正態(tài)分布假設(shè)下異常目標(biāo)的判斷問(wèn)題。但是地物的復(fù)雜多樣性,使高光譜影像很有可能不滿足高斯分布的假設(shè),此外高光譜影像數(shù)據(jù)具有特征維數(shù)高、特征相關(guān)性強(qiáng)以及非線性可分的特點(diǎn),在上述因素共同作用下,導(dǎo)致RX異常檢測(cè)結(jié)果通常具有較高的虛警率。
單類(One-class SVM,OCSVM)是SVM的一種分支算法[5],目前已經(jīng)在包括高光譜影像的異常檢測(cè)[6]和地物識(shí)別[7]在內(nèi)的多個(gè)領(lǐng)域中[8-9]得到應(yīng)用。文獻(xiàn)[6]提出基于OCSVM原理的高光譜影像異常檢測(cè)算法,該算法通過(guò)核函數(shù)隱式映射的方式處理非線性可分的高光譜影像數(shù)據(jù),與RX等異常檢測(cè)算法相比,即使數(shù)據(jù)不滿足高斯分布假設(shè)也能有效控制異常檢測(cè)虛警率。
但是OCSVM異常檢測(cè)算法也有其固有的局限性,其采用的高斯徑向基正定核函數(shù)的基礎(chǔ)是兩個(gè)向量之間的歐氏距離,對(duì)于同類地物的兩條光譜向量而言,度量精度受向量強(qiáng)度變化影響較大,對(duì)光照、地形、分布等環(huán)境因素的變化非常敏感。針對(duì)此局限,將光譜角度余弦核測(cè)度[10]引入到非正定SVM中,設(shè)計(jì)出基于非正定核OCSVM原理的高光譜影像異常檢測(cè)算法。
1基于非正定OCSVM的地物檢測(cè)
正定OCSVM主要有兩種技術(shù)實(shí)現(xiàn)途徑,即基于超平面的OCSVM算法和采用支持向量數(shù)據(jù)描述的SVDD算法[11]。兩種技術(shù)途徑的出發(fā)點(diǎn)雖然不同,但是兩種算法都遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,并且使用滿足Mercer條件的正定核函數(shù)將數(shù)據(jù)隱式映射到高維特征空間中來(lái)處理非線性可分問(wèn)題。要將基于超平面的OCSVM算法在非正定核函數(shù)條件下進(jìn)行推廣,就需要研究有別于正定核函數(shù)處理的方法。
1.1光譜角度余弦核測(cè)度
光譜角度余弦測(cè)度對(duì)光譜形狀相似性的描述使其不受輻射強(qiáng)度變異的影響,因此,本文采用文獻(xiàn)[10]提出的光譜角度余弦核測(cè)度代替RBF,該測(cè)度仿照RBF的形式,但卻是以光譜角度余弦作為基礎(chǔ),其表達(dá)式為
(1)
式中:Cij是由式(2)計(jì)算得到,要求初始設(shè)置參數(shù)θ>0,計(jì)算結(jié)果kc滿足核函數(shù)非負(fù)性和對(duì)稱性的特性。
(2)
為了驗(yàn)證式(1)的非正定性可以用反例法證明,即利用模擬器隨機(jī)得到100個(gè)具有30維的數(shù)據(jù)向量,并且假設(shè)θ=1,根據(jù)式(1)可以計(jì)算出向量的Gram矩陣。對(duì)Gram矩陣進(jìn)行特征分解,將得到的特征值從小到大排列,可得到其前70個(gè)小于0的特征值所構(gòu)成的特征值曲線,從圖1曲線分析可知光譜角度余弦核測(cè)度是不滿足mercer條件的非正定核。
圖1 光譜角度余弦核Gram矩陣特征值曲線
1.2非正定OCSVM算法
(3)
以核矩陣K的非半正定相似矩陣KO代替核矩陣K參與計(jì)算,借鑒答解非正定SVM分類問(wèn)題的思路,NPD-OCSVM目標(biāo)函數(shù)模型為
(4)
求解式(4)中內(nèi)側(cè)的最小化問(wèn)題,得到優(yōu)化后的核矩陣K*的顯示表達(dá)式為
(5)
將式(5)引入式(4)變形計(jì)算得到一個(gè)關(guān)于α的凸優(yōu)化目標(biāo)函數(shù),
(6)
參考文獻(xiàn)[6]采用處理非正定SVM目標(biāo)函數(shù)的優(yōu)化算法來(lái)處理NPD-OCSVM目標(biāo)函數(shù)的優(yōu)化問(wèn)題。文獻(xiàn)[12]提出兩種數(shù)值優(yōu)化方法,分別是投影梯度法與解析中心割平面法,相比而言投影梯度法的計(jì)算效率較高,考慮到異常檢測(cè)對(duì)時(shí)效性的要求,本文在對(duì)式(6)進(jìn)行二次平滑的基礎(chǔ)上,選用投影梯度法對(duì)目標(biāo)函數(shù)進(jìn)行優(yōu)化。
1.3光譜角度余弦核參數(shù)設(shè)置
與高斯核寬σ類似,通過(guò)改變光譜角度余弦核的參數(shù)θ的大小,起到控制支持向量數(shù)量的效果。
1)設(shè)置一組θ的預(yù)選值,記為θ={θ1,θ2,…,θn}。
2)對(duì)于待檢測(cè)的高光譜影像數(shù)據(jù)集HSI,從中選擇K組樣本,每組樣本都由隨機(jī)選擇的M個(gè)樣本構(gòu)成。
3)以θ的第i個(gè)元素θi作為光譜角度余弦核的參數(shù),基于NPD-OCSVM的方法采用每組隨機(jī)選擇的樣本進(jìn)行訓(xùn)練,記錄每組樣本中支持向量的個(gè)數(shù)nSVs={nSVs1,nSVs2,…,nSVsk},并按照式(7)計(jì)算支持向量比例的均值。
(7)
4)重復(fù)步驟3)使θ中的每個(gè)元素都得到利用,并得到一組支持向量比例的均值,記為p={p1,p2,…,pn}。
5)按照式(8)從θ中選擇合適的值:
(8)
2實(shí)驗(yàn)
基于NPD-OCSVM的異常檢測(cè)算法根據(jù)待檢測(cè)目標(biāo)的尺寸與影像的空間分辨率,選擇合適的空心窗口內(nèi)外尺寸,在確定合適的光譜角度余弦核參數(shù)θ后,逐像素對(duì)影像進(jìn)行異常檢測(cè)。由于缺乏地面實(shí)測(cè)數(shù)據(jù)的支持,真實(shí)影像中的目標(biāo)與背景屬性信息都難以確定,不利于算法的定量評(píng)價(jià)。因此,利用真實(shí)高光譜影像樣本構(gòu)建4組模擬數(shù)據(jù),其中兩組為多光譜模擬數(shù)據(jù),同時(shí)采用多/高光譜數(shù)據(jù)進(jìn)行對(duì)比實(shí)驗(yàn),是為了驗(yàn)證特征維數(shù)和特征間相關(guān)性的增加對(duì)檢測(cè)結(jié)果的影響。
2.1實(shí)驗(yàn)數(shù)據(jù)
第一組真實(shí)影像由AVIRIS成像光譜儀獲取,影像區(qū)域?yàn)槊绹?guó)佛羅里達(dá)州肯尼迪空間中心(Kennedy Space Center,KSC),獲取時(shí)間為1996年3月23日,影像樣本信息如表1所示。有效數(shù)據(jù)共計(jì)155個(gè)波段,根據(jù)信噪比大小確定5~97和105~131波段范圍內(nèi)的120個(gè)波段。
第二組真實(shí)影像由Hyperion成像光譜儀獲取,影像區(qū)域?yàn)槟戏遣┐耐呒{(Botswana)某三角洲地區(qū),獲取時(shí)間為2001-05-31,影像樣本信息如表2所示。原始數(shù)據(jù)共計(jì)242個(gè)波段,根據(jù)信噪比大小確定10~55、82~97、102~119、134~164、187~220波段范圍內(nèi)的145個(gè)波段。
表1 KSC影像樣本信息
表2 Botswana影像樣本信息
圖2 模擬影像目標(biāo)分布示意
兩組模擬高光譜影像數(shù)據(jù)分別由KSC和Botswana影像的樣本構(gòu)成,大小都為200×200像元。第一組模擬高光譜影像數(shù)據(jù)(記為KSC_Hyper)的背景由KSC影像的第1~12類樣本隨機(jī)排列構(gòu)成,目標(biāo)構(gòu)成方法則從第13類樣本中隨機(jī)選擇100個(gè)像元并隨機(jī)填充至25個(gè)2×2像元大小的目標(biāo)位置,如圖2所示。第二組模擬高光譜影像數(shù)據(jù)(記為Botswana_Hyper)的構(gòu)成方法與之類似,只是其背景是由Botswana影像的第2~14類樣本構(gòu)成,目標(biāo)則是由第1類樣本構(gòu)成。
兩組模擬多光譜影像數(shù)據(jù)則是分別通過(guò)對(duì)兩組模擬高光譜影像數(shù)據(jù)的等間隔波段選擇得到的10個(gè)波段數(shù)據(jù)構(gòu)成。第一組模擬多光譜影像數(shù)據(jù)從KSC_Hyper中得到,記為KSC_Multi,第二組模擬多光譜影像數(shù)據(jù)從Botswana_Hyper中得到,記為Botswana_Multi。
2.2實(shí)驗(yàn)結(jié)果
使用NPD-OCSVM、SVDD和RX三種異常檢測(cè)算法分別對(duì)上述模擬數(shù)據(jù)進(jìn)行異常檢測(cè),高光譜影像模擬數(shù)據(jù)目標(biāo)異常檢測(cè)結(jié)果的ROC曲線如圖3所示,多光譜影像模擬數(shù)據(jù)目標(biāo)異常檢測(cè)結(jié)果的ROC曲線如圖4所示。異常檢測(cè)算法運(yùn)行時(shí)間如表3所示(時(shí)間保留小數(shù)點(diǎn)后兩位)。
圖3 兩組高光譜影像數(shù)據(jù)異常檢測(cè)結(jié)果ROC曲線
圖4 兩組多光譜影像數(shù)據(jù)異常檢測(cè)結(jié)果ROC曲線
數(shù)據(jù)名 算法名 Botswana_HyperBotswana_MultiKSC_HyperKSC_MultiRX143.761.12133.431.03SVDD213.2112.83199.7111.04NPD-OCSVM674.88103.43643.5899.58
2.3實(shí)驗(yàn)分析
通過(guò)觀察圖4和圖5所示的ROC曲線可知,NPD-OCSVM和SVDD這2類非線性檢測(cè)算法的精度要明顯優(yōu)于RX算法,而NPD-OCSVM與SVDD相比也具有精度上的優(yōu)勢(shì),并且這種優(yōu)勢(shì)在對(duì)高光譜數(shù)據(jù)的處理中更加明顯。從表3中發(fā)現(xiàn),NPD-OCSVM的訓(xùn)練效率較低,主要原因在算法結(jié)構(gòu)和算法實(shí)現(xiàn)上,首先,本文中NPD-OCSVM算法是基于Matlab框架實(shí)現(xiàn)的,相比于利用C代碼進(jìn)行性能優(yōu)化的SVDD算法有一定的不足;其次,NPD-OCSVM算法核矩陣構(gòu)建、優(yōu)化的計(jì)算復(fù)雜度較高,也在一定程度上限制了算法的運(yùn)行效率。利用4組模擬數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證,但是NPD-OCSVM算法本質(zhì)上是核方法,核函數(shù)特性穩(wěn)定,能夠適應(yīng)多波段影像復(fù)雜目標(biāo)異常檢測(cè)任務(wù)。
3結(jié)束語(yǔ)
本文結(jié)合文獻(xiàn)分析正定核OCSVM在實(shí)際應(yīng)用中的局限和不足,將光譜角度余弦核測(cè)度引入到非正定SVM中,并推廣形成一種非正定OCSVM算法,在此基礎(chǔ)上提出基于非正定OCSVM的目標(biāo)異常檢測(cè)算法,詳細(xì)分析算法流程。同時(shí)設(shè)定4組模擬數(shù)據(jù)進(jìn)行目標(biāo)異常檢測(cè)實(shí)驗(yàn),通過(guò)與RX和正定核OCSVM算法運(yùn)行結(jié)果進(jìn)行對(duì)比分析可見(jiàn),基于非正定OCSVM的高光譜影像目標(biāo)異常檢測(cè)算法是有效的,能夠提高目標(biāo)異常檢測(cè)精度。
[1]楊國(guó)鵬,余旭初.高光譜遙感影像的廣義判別分析特征提取[J].測(cè)繪科學(xué)技術(shù)學(xué)報(bào),2007,24(2):101-105.
[2]范金華,陳鍛生.高光譜圖像目標(biāo)檢測(cè)研究進(jìn)展[J].微型機(jī)與應(yīng)用,2015(16):8-10.
[3]MANOLAKIS D.Taxonomy of detection algorithms for hyperspectral imaging applications[J].Optical Engineering,2005,44(6):1-11.
[4]REED I S,YU X.Adaptive multiple-band CFAR detection of an optical pattern with unknown spectral distribution[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1990,38(10):1760-1770.
[5]高燕,周成虎,蘇奮振.基于OLI影像多參數(shù)設(shè)置的SVM分類研究[J].測(cè)繪工程,2014,23(6):1-5.
[6]BANERJEE A,BURLINA P,DIEHL C.A support vector method for anomaly detection in hyperspectral imagery[M].IEEE Transactions on Geoscience and Remote Sensing,2006,44(8):2282-2291.
[7]陳偉,余旭初,張鵬強(qiáng)等.基于一類支持向量機(jī)的高光譜影像地物識(shí)別[J].計(jì)算機(jī)應(yīng)用,2011,31(8):2092-2096.
[8]JIN H L,LIU Q S,LU H Q, et al.Face detection using one-class SVM in color images[C].Proceddings of the 7th International Conference on Signal Processing.Beijing:Publishing House of Electronics Industry,2004:1431-1434.
[9]LI K L,HUANG H K,TIAN S F,et al.Improving one-class SVM for anomaly detection[C].Proceedings of the Second International Conference on Machine Learning and Cybernetics.Xi’an:Xi’an Jiao Tong University Press,2003:3077-3081.
[10] 陳偉,余旭初,張剛,等.基于新型相似性測(cè)度的高光譜影像地物檢測(cè)[J].測(cè)繪科學(xué)技術(shù)學(xué)報(bào),2012,29(1):42-46.
[11] SCH?LKOPF B,PLATT J C,SHAWE-TAYLOR,et al.Estimating the support of a high-dimensional distribution[M].Microsoft Research Corporation,1999a.
[12] LUSS R,D’ASPREMONT A.Support vector machine classification with indefinite kernels[M].Advances in Neural Information Processing Systems.Cambridge:MIT Press,2008:953-960.
[責(zé)任編輯:李銘娜]
Anomaly detection based on indefinite OCSVM method in hyperspectral imagery
QIN Jinchun1,2,YU Xuchu3,ZHANG Li1,2,SUN Di1,2
(1.Xian Research Institute of Surveying and Mapping,Xian 710054,China;2.State Key Laboratory of Geo-information Engineering,Xian 710054,China;3.Information Engineering University,Zhengzhou 450001,China)
Abstract:The anomaly detection performance of OCSVM based on Gaussian Radial Basis Function (RBF) is sensitive to the spectral variation coming from radiation intensity variation.As the description of spectral shape similarity based on spectral Angel Cosine Measure is not affected by the variation of spectral radiation intensity,a non-positive definite kernel named as spectral Angel Cosine Kernel Measure is proposed,and applied to anomaly detection based on an indefinite SVM method in hyperspectral imagery.The experiments are carried on with four groups of simulated hyperspectral image.Experimental results have shown that this method can effectively detect the target in hyperspectral image data and the accuracy of detection is improved significantly.
Key words:hyperspectral image;spectral angel cosine kernel measure;support vector machine;indefinite one-class SVM;anomaly detection
中圖分類號(hào):TP391.413
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1006-7949(2016)04-0037-05
作者簡(jiǎn)介:秦進(jìn)春(1989—),男,碩士.
基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(41201477)
收稿日期:2015-08-29