彭易錦
(中國電子科技集團公司第十研究所 成都 610036)
基于流形學習的SAR圖像目標分類?
彭易錦
(中國電子科技集團公司第十研究所 成都 610036)
提出一種基于流形學習的SAR圖像特征降維和目標分類方法,該方法包含以下三個步驟:1)提取SAR圖像目標的高維特征向量;2)采用基于流形學習的方法提取嵌入在高維特征向量中目標的本征維特征;3)利用本征特征進行目標分類。實驗結果表明,論文方法在利用較少維數(shù)特征的條件下,得到了與利用全部特征時相當?shù)哪繕朔诸惥?,證實了論文方法是有效的。
流形學習;目標分類;SAR圖像;特征提取
目標分類是SAR圖像解譯和分析的重要組成部分,是國內外圖像處理和模式識別領域的研究熱點,廣泛應用于國防和民用的諸多領域。目標分類的一種典型研究思路是從大量包含目標的數(shù)據(jù)中學習并抽取目標特征,并采用統(tǒng)計分類技術進行目標分類識別[1]。
圖像目標的特征有很多種,常用的有灰度特征、統(tǒng)計特征、紋理特征、形狀結構特征等[2~3]。為了實現(xiàn)特定的圖像分析和解譯任務,通常的做法是先提取各種圖像特征,并組成特征向量。這種方法存在以下兩個問題:1)所提取的圖像特征向量通常都位于維數(shù)較高的空間,直接對這些數(shù)據(jù)進行處理,會出現(xiàn)所謂的“維數(shù)災難”問題,巨大的計算量是無法忍受的;2)高維特征向量通常沒有反映出圖像的本質特征,存在大量無用信息,直接對這種特征向量進行處理,難以得到理想的結果。針對這一問題,普遍的做法是,對高維數(shù)據(jù)作維數(shù)約減處理,從中提取低維空間中的本征特征。
如何將高維數(shù)據(jù)表示在低維空間中,并由此發(fā)現(xiàn)反映其內在結構的低維數(shù)據(jù)是高維信息處理研究的關鍵問題之一。維數(shù)約減的基本原理是把數(shù)據(jù)樣本從高維輸入空間通過線性或非線性映射投影到一個低維空間,從而找出隱藏在高維觀測數(shù)據(jù)中有意義的低維結構。從幾何的觀點來看,降維可以看成是挖掘嵌入在高維數(shù)據(jù)中的低維線性或非線性流形。這種嵌入保留了原始數(shù)據(jù)的幾何特性,即在高維空間中靠近的點在嵌入空間中也相互靠近。最近興起的流形學習方法是一種線性降維的方法,并且依靠它們在探測嵌入在高維空間中低維流形的能力和靈活性而被廣泛應用。具有代表性的流形學習算法包括線性方法中的主成分分析(PCA)、線性判別分析(LDA),非線性方法中的等距映射(Isomap)、核主成分分析(KPCA)、局部線性嵌入(LLE)、拉普拉斯特征映射(LE)等[4~8]。
本文著眼于SAR圖像目標的分類,首先提取SAR圖像目標的高維特征向量,然后對其進行維數(shù)約減提取本征特征,并基于所提取的本征特征進行目標分類識別。
圖像特征是指圖像中可用作標志的屬性,其中有些是直覺感受到的自然特性,有些需要通過變換或測量才得到的人為特征。常見的圖像自然特征有亮度、色彩、紋理以及輪廓等;認為特征有灰度直方圖特征、投影特征、標記、Fourier描述子、矩特征、比例特征、線條特征等。通過圖像的這些特征,還可以得到如角點、頂點、邊緣、邊界、形狀等結構特征[9]。
SAR圖像的特征提取是SAR圖像解譯和分析的重要步驟,通過特征提取可以有效地降低數(shù)據(jù)空間的維數(shù),從而達到快速、準確地對SAR圖像解譯的目的。實際應用中,為了實現(xiàn)SAR圖像的解譯,通常提取灰度統(tǒng)計特征、紋理特征以及形狀結構特征等。為了驗證本文算流形學習算法以及分類方法的有效性,本文提取了灰度直方圖特征、Gabor紋理特征以及LBP直方圖特征[10~11]。
流形學習本質上是一個維數(shù)約減的過程,假設數(shù)據(jù)是均勻采樣于一個高維歐氏空間中的低維流形,流形學習就是從高維采樣數(shù)據(jù)中恢復出低維流形結構,找到內蘊在高維空間中的低維流形,并求出相應的嵌入映射,以實現(xiàn)數(shù)據(jù)的維數(shù)約減,即從觀測到的現(xiàn)象中去尋找事物的本質,找到產生數(shù)據(jù)的內在規(guī)律[4~8,12]。流形學習的數(shù)學定義可以描述如下:
給定觀測數(shù)據(jù)集X={x ,i=1,…N }∈RD,假
i設X中的數(shù)據(jù)樣本是由低維空間中的數(shù)據(jù)集Y={ yi,i=1,…N }∈Rd,通過某個未知的光滑映射f所產生,其中d?D,則流形學習的任務是基于給定的觀測數(shù)據(jù)集X:
1)恢復出低維表示;
2)構造從高維觀測空間到低維空間的光滑映射:f-1:RD→Rd。
從定義可以看出,流形學習的基本假設是一個位于高維觀測空間中的數(shù)據(jù)集有其內蘊的低維流形結構,流形學習的目的在于:在保持原始數(shù)據(jù)集某種結構不變的準則下,從觀測到的高維數(shù)據(jù)中恢復出其低維流形表示并得到相應的映射,從而抓住數(shù)據(jù)的本質規(guī)律。
根據(jù)流形學習技術對數(shù)據(jù)基本假設的不同,可以將其分為線性流形學習技術和非線性流形學習技術。線性流形學習技術通常假設數(shù)據(jù)位于一個全局線性結構中,在這種假設前提下,只需找到一個顯式的線性映射便可來實現(xiàn)數(shù)據(jù)從高維觀測空間到低維本征空間的降維過程,常見的線性流形學習技術如PCA方法、LDA方法等。非線性流形學習技術通常假設數(shù)據(jù)位于一個局部線性,全局非線性的流形曲面上,要實現(xiàn)對原始高維數(shù)據(jù)的維數(shù)約減,就需要在保持原始數(shù)據(jù)某種拓撲結構在降維后不變的準則下,對數(shù)據(jù)進行非線性映射,常見的非線性流形學習技術如Isomap、KPCA、LLE、LE 等[4~8,12]。
非線性流形學習方法與線性方法相比的一個顯著特點是,分析中的局部性,原因在于對數(shù)據(jù)集合的內蘊結構而言,有下列特性:
1)由泰勒定理,任何可微函數(shù)在一點的充分小的鄰域之內滿足線性性。形象的來講,相當于認為曲面流形可由大小不一的局部線性塊拼接而成;
2)數(shù)據(jù)流形經常是由許多可分割的子流形所組成;
3)數(shù)據(jù)流形的本征維數(shù)沿著流形不斷的發(fā)生變化,只有局部性才能抓住其根本特性。
由于現(xiàn)實問題通常是非線性的,實際應用中,非線性流形學習方法的處理結果往往優(yōu)于線性方法的處理結果。
由于真實自然數(shù)據(jù)通常表現(xiàn)為復雜的高度非線性結構,因此全局線性的假設通常不再適用,這時就需要采用非線性流形學習技術。由于篇幅限制,本文只就其中的PCA方法和LE技術作簡單介紹。
PCA技術將數(shù)據(jù)方差的大小作為衡量信息量多少的標準,方差越大則提供的信息越多,方差越小則提供的信息越少?;谶@一判斷依據(jù),PCA技術通過線性變換保留數(shù)據(jù)中方差大、信息量多的分量,而丟掉方差小、信息量少的分量,即只用少數(shù)幾個最主要的分量來表達數(shù)據(jù),從而達到降維的目的。PCA技術可以描述為如下幾個步驟:
1)求取數(shù)據(jù)集 X={xi,i=1,…N}∈RD的協(xié)方差矩陣:
2)按式(1)對協(xié)方差矩陣作特征值分解,其中U是由特征矢量構成的正交矩陣,Λ=diag(λ1,…,λD)是由特征值構成的對角矩陣,且λ1≥…≥λD:
3)選取前d個較大特征值對應的特征向量構成投影矩陣U0
4)將原始數(shù)據(jù)集按下式投影至由U0T張成的線性子空間上即得到d維特征向量
LE技術將微分流形、譜圖論的知識應用于降維之中,使人們對降維過程的認識產生了又一個新的飛躍,拓展了實際中降維方法的應用,其基本思想是:在高維空間中距離相隔很近的點投影到低維空間中像也應該相距很近,最終求解歸結到求拉普拉斯算子的廣義特征值問題。。該技術的算法描述如下:
1)構建鄰接圖G:在高維觀測空間中,求每個數(shù)據(jù)點 xi的k鄰域Ji;
2)構建加權鄰接圖W:對鄰接圖G加權得到加權矩陣W,其中t是一個比例參數(shù):
3)特征映射:計算d維嵌入。假設y=(yi,…,yN)T是一個未知的投影,可以通求解如下的目標函數(shù)最小得到
用D表示對一個對角矩陣,它的每個對角元素為矩陣W的每行所有元素的和,即L=D-W是鄰接圖的Laplacian矩陣。對任意的y有下式成立:
可以將該最優(yōu)化問題轉化為對Laplacian矩陣的廣義特征值分解:
她穿過客廳,走到陽臺上,這個陽臺,是最佳的觀景處,想必爸爸當年也是站在這樣的位置看見這樣的風景吧?春天時風擺楊柳、夏天時碧云滿天、秋天時秋月?lián)P輝……冬天時……冬天時,冬嶺秀孤松……
假設前d+1個最小特征值對應的特征向量為u,…,u,那么 X的低維嵌入表示為 y=,2d+1ii進而得到低維本征空間Rd中的數(shù)據(jù)集Y={ yi,i=1,…,N } 。
從LE算法的描述可以看出,它的準則在于保持數(shù)據(jù)的局部距離結構信息,將在原始高維觀測空間中離得近的點在映射后拉得更近,它隱式地體現(xiàn)了數(shù)據(jù)集自然聚類效果。另外,在分類問題中,通常離得較近的點屬于同一類別的概率較大,因此LE技術也適合分類問題中的維數(shù)約減。
為了驗證流形學習方法的性能,本文設計如圖2所示的分類方法流程。首先,分別提取訓練圖像和測試圖像的多種特征,并分別組成特征向量;然后,利用第3部分介紹的流行學習方法對提取的特征向量進行維數(shù)約減,得到本征特征;最后,利用本征特征對圖像目標分類。
圖1 分類方法流程
為了驗證流形學習算法的性能以及上述方法流程在圖像目標分類中的有效性,本文在真實SAR圖像上進行實驗。
圖2 各類目標的樣本示例
實驗數(shù)據(jù)為TerraSAR衛(wèi)星獲取X波段SAR圖像,獲取時間為2008年5月24日,距離向和方位向的分辨率均為1.25m,包含五類地物的目標樣本,分別為河流、濕地、耕地、建筑和山地,樣本大小為128像素×128像素,各類別的樣本數(shù)分別為204個、379個、340個446個和387個,圖2是各類目標的樣本示例。
實驗中提取的特征包括三種:灰度直方圖(圖像為16位數(shù)據(jù),分成128個灰度階得到128維特征)、Gabor濾波器組(不同尺度、不同方向濾波器組,得到40維特征)和LBP特征(統(tǒng)計LBP直方圖,得到32維特征)。
為了說明各維特征的有效性,本文采用判別數(shù)作為客觀評價指標[13]。判別數(shù)J可由下式表示
其 中 ,Sb=(xˉi-xˉ)2表 示 類 間 離 散 度 ,S=σ表示類內離散度,xˉ為第 i類的均值,xˉwii為總體均值,σi為第i類的樣本方差。J值越大,則表示特征所攜帶的信息量越豐富,類別可分性也越好。
圖3 不同特征的判別數(shù)
為了直觀地展現(xiàn)特征的類可分性,圖4畫出了上述判別數(shù)較大的六維特征對應的散點圖。由圖可以看出,各維特征、不同類別之間均存在較大程度的重疊。
以上實驗結果說明兩點:1)高維特征向量存在冗余或無效信息;2)高維特征具有非線性特性。直接利用這種數(shù)據(jù)進行分類識別,難以得到理想的處理結果。因此,有必要對高維特征向量作降維處理。本文選擇非線性流形學習方法Laplacian特征映射對高維特征向量作降維處理。為了說明非線性流形學習方法的優(yōu)越性能,實驗中同時也實現(xiàn)了經典的PCA線性降維方法,以便對比。
實驗中,分別采用PCA降維和Laplacian特征映射方法對所提取的200維特征向量作降維處理,并得到維數(shù)為10的本征維特征,圖5是其中三維特征的散點圖分布情況。由圖5可以看出,與原特征相比,降維后的特征類間離散度更大、類內聚集性更好,這一結果直觀上說明了特征降維對目標分類識別的有效性。
圖4 降維前特征的散點圖(a)第3,4,7維特征的散點圖(b)第129,149,169維特征的散點圖
圖5 降維后特征的散點圖(a)PCA降維后其中三維特征的散點圖(b)LE降維后其中三維特征的散點圖
為了進一步客觀地說明特征降維的有效性,本文在SAR圖像樣本數(shù)據(jù)上進行分類實驗,分別利用原始200維特征、PCA降維和Laplacian特征映射后的10維本征特征對樣本分類。本文采用K近鄰(KNN)分類方法[14~15],它是—種最基本的基于實例的方法,以其簡單、有效和高魯棒性而被廣泛地應用于機器學習與數(shù)據(jù)挖掘領域解決分類問題。其分類思想是:給定一個待分類的樣本x,首先找出與x最接近的或最相似的k個已知類別標簽的訓練集樣本,然后根據(jù)這k個訓練樣本的類別標簽確定樣本x的類別。該方法不對特征作優(yōu)化處理,更能反映特征本身的有效性,這也是選擇該方法的重要原因。
實驗中的參數(shù)設置如下:近鄰數(shù)K=11,每類的訓練樣本數(shù)為100個,其中,訓練樣本是隨機選擇的,并獨立重復10次實驗,分類精度為10次實驗結果的平均值。
實驗結果如表1所示。由表1可以看出,利用原始200維特征的分類方法的平均分類精度為96.4%,利用由PCA方法得到的10維特征的分類方法的平均精度為87.6%,有較大程度的精度下降;而利用由流形學習方法得到的10維本征特征的分類方法的平均分類精度為95.1%,很好地保持了分類精度。本次實驗結果表明:1)Laplacian特征映射方法能夠較好地提取嵌入在高維數(shù)據(jù)中的本征維特征;2)非線性流形學習方法較線性方法,在實現(xiàn)數(shù)據(jù)降維的同時,能更好地保留高維數(shù)據(jù)的內在結構。3)數(shù)據(jù)降維是以犧牲一部分信息為代價的,PCA方法和Laplacian特征映射方法都存在一定程度的信息損失。
表1 目標分類精度對比
本文提出了一種基于流形學習的SAR圖像目標分類方法,該方法在提取SAR圖像目標的高維特征向量后,通過流形學習降維得到嵌入在高維特征向量中的本征特征,并在TerraSAR圖像上進行分類實驗,分類準確率達到了95.1%。本次實驗的結果表明,SAR圖像目標的高維特征中存在較大程度的信息冗余,這些信息不僅需要較大的存儲空間,而且會提高計算復雜,不適合直接用于目標分類,需要進行特征的維數(shù)約減;基于拉普拉斯特征映射的流行學習方法,能在大幅度實現(xiàn)特征降維的同時,較好地提取本征特征,其在SAR圖像目標分類實驗中的分類性能明顯優(yōu)于PCA方法。因此,本文提出的方法是有效的,在目標分類識別應用中具有一定的理論意義和應用價值。
[1]D.Lu and Q.Weng.A survey of image classification meth?ods and techniques for improving classification perfor?mance[J].International Journal of Remote Sensing,2007,28(5):823-870.
[2]王潤生.圖像理解[M].長沙:國防科技大學出版社,1995.WANG Runsheng.Image Understanding[M].Changsha:Press of National Defense University of Science and Tech?nology,1995.
[3]陳宏.基于形狀特征的圖像檢索[D].西安:西安電子科技大學,2010.CHEN Hong.Image Retrieval Based on Shape Feature[D].Xi'an:Xidian University,2010.
[4]Shangtan Tu,Jiayu Chen,Wen Yang,Hong Sun.Lapla?cian Eigenmaps-based Polarimetric Dimensionality Re?duction for SAR Image Classification[J].IEEE Trans.Geosci.Remote Sens.,2012,50(1):170-179.
[5]L.J.P.van der Maaten,E.O.Postma,and H.J.van den Herik.Dimensionality reduction:A comparative review[R].Tilburg Univ.,Tilburg,the Netherlands,Tech.Rep.TiCC-TR 2009-005,2009.
[6]H.Hotelling.Analysis of a complex of statistical variables into principal components.Warwick&York,Inc,1933.
[7]M.Belkin,P.Niyogi.Laplacian Eigenmaps and spectral techniques for embedding and clustering[M].Advances in Neural Information Processing Systems,Cambridge,MA,USA:MIT Press,2002,14:585-591.
[8]J.B.Tenenbaum,V.de Silva,J.C.Langford.A global geo?metric framework for nonlinear dimensionality reduction[J].Science,2000,290(5500):2319-2323.
[9]鮑文霞.基于結構特征的圖像匹配算法及應用[D].合肥:安徽大學,2010.BAO Wenxia.Image Matching Algorithm Based on Struc?ture Feature and Its Application[D].Hefei:Anhui Univer?sity,2010.
[10]薛玉利.基于Gabor變換的特征提取及其應用[D].濟南:山東大學,2007.XUE Yuli.Gabor Transform-Based Feature Extraction and Its Application[D].Jinan:Shandong University,2007.
[11]Ahonen T,Hadid A,Pietikainen M.Face description with local binary patterns:Application to face recognition[J].IEEE Trans.on PAMI,2006,28(12):2037-2041.
[12]H.Seung,D.Lee.The manifold ways of perception[J].Science,290(2000)2268-2269.
[13]駱玉霞,陳煥偉.遙感圖像的特征提取與選擇研究[J].信息記錄材料,2002,3(2):22-26.LUO Yuxia,CHEN Huanwei.Research on Feature Ex?traction and Selection of Remote Sensing Image[J].In?formation Recording Materials,2002,3(2):22-26.
[14]豆增發(fā),王英強,王保保.一種基于信息增益的K-NN改進算法[J].計算機工程與應用,2007,43(19):52-56.DOU Zengfa,WANG Yingqiang,WANG Baobao.An Im?proved KNN Algorithm Based on Information Gain[J].Computer Engineering and Applications,2007,43(19):52-56
[15]張瑩.基于自然最近鄰居的分類算法研究[D].重慶:重慶大學,2015.ZHANG Ying.Research on Classification Algorithm Based on Natural Nearest Neighbors[D].Chongqing:Chongqing University,2015.
Manifold Learning-based SAR Image Target Classification
PENG Yijin
(China Electronics Technology Group Corporation No.10 Research Institute,Chengdu 610036)
A manifold learning-based approach is proposed for dimension reduction and target classification of SAR image.This approach includes three steps:1) Extracting high-dimensional feature vector of SAR image target;2) Manifold learn?ing-based innate character extracting from the high-dimensional feature vector;3)Target classification using the innate character.The experimental result indicates that the proposed approach obtain relatively high accuracy of target classification in the case of us?ing low-dimensional feature compared to the high-dimensional feature vector,which proves the effectiveness of the proposed ap?proach.
manifold learning,target classification,SAR image,feature extraction
Class Number TP753
TP753
10.3969/j.issn.1672-9722.2017.12.035
2017年6月9日,
2017年7月28日
國家自然科學基金項目(編號:61501178)資助。
彭易錦,男,博士,工程師,研究方向:機器學習、情報處理、信息融合、目標識別等。