楊春偉,王仕成,廖守億,劉華平
?
基于核稀疏編碼的紅外目標(biāo)識(shí)別方法
楊春偉1,2,王仕成1,廖守億1,劉華平2
(1.第二炮兵工程大學(xué)精確制導(dǎo)仿真技術(shù)實(shí)驗(yàn)室,陜西 西安 710025;2.清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,北京 100084)
針對(duì)紅外目標(biāo)識(shí)別問題,提出了一種基于協(xié)方差描述子和核稀疏編碼的紅外目標(biāo)識(shí)別方法。該方法結(jié)合了紅外圖像的灰度、一階以及二階梯度等特征的協(xié)方差描述子作為紅外目標(biāo)的特征,并采用Log-Euclidean度量進(jìn)行特征相似性計(jì)算,通過高斯核函數(shù)將協(xié)方差描述子映射到高維空間,最后在新的特征空間上進(jìn)行稀疏編碼。實(shí)測數(shù)據(jù)實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的KNN(k-nearest neighbor,k最近鄰)以及SVM(support vector machine,支持向量機(jī))等分類算法相比,基于核稀疏編碼的紅外識(shí)別方法在識(shí)別準(zhǔn)確率上有很大的提高。
協(xié)方差描述子;核稀疏編碼;紅外目標(biāo)識(shí)別
作為圖像處理領(lǐng)域的一個(gè)熱門研究課題,目標(biāo)識(shí)別在軍事運(yùn)動(dòng)目標(biāo)的識(shí)別與跟蹤、交通檢測以及人臉識(shí)別等方面有著廣泛的應(yīng)用。而隨著紅外成像技術(shù)的發(fā)展,紅外目標(biāo)識(shí)別技術(shù)在軍事領(lǐng)域受到了越來越多的關(guān)注。紅外目標(biāo)識(shí)別算法主要包括4個(gè)階段:紅外目標(biāo)檢測、背景雜波抑制、紅外目標(biāo)的特征提取以及目標(biāo)的分類識(shí)別。由于前2個(gè)階段的研究已經(jīng)比較成熟[1-2],本文對(duì)紅外目標(biāo)的特征提取及分類識(shí)別進(jìn)行研究。特征提取主要是提取目標(biāo)的邊緣、形狀以及紋理等顯著性特征,而分類識(shí)別則指選取合適的分類器對(duì)目標(biāo)的特征進(jìn)行分類。
文獻(xiàn)[3]提出了一種基于目標(biāo)紅外特征與SIFT(scale-invariant feature transform)特征相結(jié)合的紅外圖像識(shí)別算法,首先通過紅外目標(biāo)初步信息實(shí)現(xiàn)初步識(shí)別,然后采用SIFT算法進(jìn)行精確識(shí)別。文獻(xiàn)[4]采用SURF(speeded up robust features)算法對(duì)地面背景下的紅外目標(biāo)進(jìn)行識(shí)別,通過自適應(yīng)中值濾波器和小波分頻與直方圖均衡的圖像增強(qiáng)算法對(duì)圖像進(jìn)行預(yù)處理,然后采用SURF特征提取匹配的方法進(jìn)行紅外目標(biāo)識(shí)別。文獻(xiàn)[5]針對(duì)電廠冷凝塔等具有建筑規(guī)范的特殊建筑物,對(duì)自動(dòng)目標(biāo)捕獲方案中模板匹配的相似性測度計(jì)算方法進(jìn)行了研究,提出了基于梯度矢量相關(guān)系數(shù)的計(jì)算方法。文獻(xiàn)[6]針對(duì)實(shí)戰(zhàn)中紅外成像制導(dǎo)導(dǎo)彈面臨的自動(dòng)目標(biāo)識(shí)別問題,將支持向量機(jī)作為分類器,提出了一種利用二維圖像識(shí)別三維目標(biāo)的自動(dòng)目標(biāo)識(shí)別方法。
最近幾年,稀疏表示在模式識(shí)別以及計(jì)算機(jī)視覺領(lǐng)域受到了越來越多的關(guān)注。文獻(xiàn)[7]將稀疏表示應(yīng)用于分類問題,提出了一種基于稀疏表示的人臉識(shí)別算法,通過訓(xùn)練樣本的線性組合來表示測試樣本,通過求解稀疏表示問題得到測試樣本的稀疏表示系數(shù),而測試樣本的分類識(shí)別結(jié)果則由測試樣本本身與重建結(jié)果之間的殘差決定。文獻(xiàn)[8]將稀疏表示和壓縮感知理論應(yīng)用于紅外目標(biāo)識(shí)別領(lǐng)域,提出了一種新的紅外目標(biāo)自動(dòng)識(shí)別框架,將紅外目標(biāo)識(shí)別問題轉(zhuǎn)化為稀疏編碼問題進(jìn)行求解,取得了良好的識(shí)別結(jié)果。而我們知道,通過一個(gè)合適的非線性映射核函數(shù)將特征映射到高維空間,訓(xùn)練樣本可以更加準(zhǔn)確地通過測試樣本的線性組合表示。也就是說,核稀疏編碼可以更加準(zhǔn)確地表示測試樣本,具有更好的區(qū)分性。另一方面,特征選擇在目標(biāo)檢測以及分類識(shí)別中起著十分關(guān)鍵的作用,而協(xié)方差描述子[9](covariance descriptor, CovD)以其優(yōu)良的特性被廣泛應(yīng)用于紋理鑒別、目標(biāo)檢測、目標(biāo)跟蹤以及視覺顯著性提取等方面[10-12]。
采用協(xié)方差描述子,提出基于核稀疏編碼的紅外目標(biāo)識(shí)別方法。協(xié)方差描述子結(jié)合了紅外圖像的灰度以及一階二階梯度信息,通過Log-Euclidean度量計(jì)算協(xié)方差描述子之間的相似性,由高斯核函數(shù)將協(xié)方差描述子映射到高維空間,通過核稀疏編碼將目標(biāo)識(shí)別問題轉(zhuǎn)化為稀疏系數(shù)求解問題,通過殘差最小化對(duì)目標(biāo)進(jìn)行分類識(shí)別。
圖1為基于核稀疏編碼的紅外目標(biāo)識(shí)別總體流程。首先提取紅外目標(biāo)的協(xié)方差描述子,而由于協(xié)方差描述子不屬于歐式空間,無法采用歐氏距離計(jì)算不同目標(biāo)之間協(xié)方差描述子的相似性,本文采用Log-Euclidean度量進(jìn)行計(jì)算;之后通過高斯核函數(shù)將其映射到高維空間,采用核稀疏編碼將目標(biāo)識(shí)別問題轉(zhuǎn)化為稀疏系數(shù)求解問題;最后,基于核稀疏編碼得到的稀疏系數(shù),根據(jù)重建誤差對(duì)紅外目標(biāo)進(jìn)行分類識(shí)別,殘差最小值對(duì)應(yīng)的類別即為目標(biāo)所屬類別。
圖1 紅外目標(biāo)識(shí)別流程
2006年,Tuzel等人提出了協(xié)方差描述子,具體來說,令{f}=1,…為表征圖像的灰度值、梯度、邊緣、空間屬性等的維特征向量,其中為圖像像元數(shù)量。那么,×維的協(xié)方差描述子定義為:
式中:為特征向量的平均值。
協(xié)方差描述子與其他特征相比具有以下優(yōu)點(diǎn):首先,圖像的協(xié)方差描述子能夠表征圖像不同視角的特征;第二,協(xié)方差描述子能夠融合不同特征,其對(duì)角線元素表征了特征之間的變化,非對(duì)角元素表征了特征之間的相關(guān)性;第三,與其他特征相比,協(xié)方差描述子維數(shù)較低,由于對(duì)稱性,僅有(2+)/2個(gè)值;另外,協(xié)方差描述子可以通過積分圖像表示進(jìn)行快速運(yùn)算。
然而,協(xié)方差描述子為對(duì)稱正定矩陣,并不屬于歐式空間,而是位于圖2所示的黎曼流形中。因此,我們不能用歐式距離來衡量協(xié)方差描述子之間的差異。為了克服這個(gè)問題,采用Log-Euclidean度量[13]來近似協(xié)方差描述子之間的差異:
式中:logm表示對(duì)矩陣求對(duì)數(shù)。
由于測試樣本標(biāo)簽未知,因此通過所有訓(xùn)練樣本的線性組合表示,即:
=(4)
稀疏編碼解決如下的優(yōu)化問題:
公式的第1部分表示重建誤差,第2部分用來調(diào)節(jié)系數(shù)的稀疏度。
然而,現(xiàn)有的線性假設(shè)在許多應(yīng)用中并不總是有效的。文獻(xiàn)[14]指出可以通過核映射函數(shù)將原始特征映射到高維特征空間后再進(jìn)行稀疏編碼,這樣在原始空間中不能線性可分的樣本在高維空間變得線性可分,而在原始空間中線性可分的樣本在高維空間中能夠更加準(zhǔn)確的線性可分。令訓(xùn)練樣本?,其中為特征所屬的原始空間,如果通過一個(gè)合適的核映射函數(shù)將映射到高維空間,那么將具有更好的線性表示特性。因此,令?為原始空間到高維空間(可能是無限維)的映射關(guān)系,如圖3。
圖3 原始特征空間到高維空間的映射
令()=[(1),…,(d)],對(duì)于待識(shí)別紅外目標(biāo),可以通過所屬類別的訓(xùn)練樣本的線性組合來表示。因此,式(3)的優(yōu)化問題可轉(zhuǎn)化為:
重建誤差可表示為:
Trace{[()-()]T-[()-()]}=
Trace{(,)-2T(,)-T(,)} (7)
式中:(,)=[(,1),(,2),…(,d)]T,(,)=()T×(),而(,)為第(,)個(gè)元素為(d,j)的×方陣。
接下來給出基于核稀疏編碼的紅外目標(biāo)識(shí)別的計(jì)算過程:
Step 1:協(xié)方差描述子計(jì)算。對(duì)于每個(gè)紅外目標(biāo),根據(jù)式(6)計(jì)算紅外目標(biāo)的灰度以及一階二階梯度信息:
式中:(,)為圖像像素,為灰度值。根據(jù)式(1)計(jì)算紅外目標(biāo)對(duì)應(yīng)的5×5協(xié)方差描述子。
Step 2:通過Log-Euclidean度量計(jì)算協(xié)方差描述子1和2的距離。
Step 3:采用高斯核計(jì)算核。由于高斯核體現(xiàn)出的優(yōu)良特性,我們采用式(7)進(jìn)行核計(jì)算:
(1,2)=exp[-×(1,2)2] (9)
式中:為衰減因子。
圖4所示為核計(jì)算過程。第1行為從原始紅外圖像提取的目標(biāo),其中第2和第3個(gè)為同類目標(biāo);第2行為Step 1中紅外目標(biāo)對(duì)應(yīng)的協(xié)方差描述子;第3行為Step 2計(jì)算得到的距離;第4行為Step 3中的高斯核值。不難看出,核值越大,二者為同一類目標(biāo)的可能性越大。
圖4 核計(jì)算過程
Step 4:通過SLEP或SPAMS工具箱進(jìn)行優(yōu)化計(jì)算。式(5)可轉(zhuǎn)化為:
式中:
式中:ST為對(duì)稱正定矩陣(,)的奇異值分解。這樣上述優(yōu)化問題就可以采用SLEP或者SPAMS等稀疏矩陣求解工具箱求解。
Step 5:通過重建殘差進(jìn)行紅外目標(biāo)分類識(shí)別。求得稀疏系數(shù)后,待識(shí)別紅外目標(biāo)的殘差為:
r=-2(,D)+T(D,D)(12)
式中:是第類目標(biāo)的訓(xùn)練樣本。殘差最小值對(duì)應(yīng)的類別即為待測試紅外目標(biāo)所屬分類,即:
我們采用紅外熱像儀拍攝的真實(shí)紅外車輛目標(biāo)對(duì)文中所提算法進(jìn)行測試。通過感興趣區(qū)域提取,將紅外車輛從原始紅外圖像中提取出來,共計(jì)7類紅外車輛目標(biāo),每類包含100個(gè)樣本。圖5所示為示例目標(biāo)圖像,所有目標(biāo)均轉(zhuǎn)化為160×128。將每類100個(gè)樣本任意分為5組,其中4組用來訓(xùn)練,1組用來測試,并循環(huán)進(jìn)行5次實(shí)驗(yàn)。
固定訓(xùn)練樣本數(shù)量,對(duì)核參數(shù)和稀疏參數(shù)進(jìn)行調(diào)試。當(dāng)=0.08,=0.001時(shí),識(shí)別準(zhǔn)確率最高。
圖6為采用Matlab編寫的紅外目標(biāo)識(shí)別軟件。左側(cè)為樣本示例。右上方所示對(duì)第一組140個(gè)測試樣本進(jìn)行分類識(shí)別,準(zhǔn)確率為96.4286%。右下方所示為針對(duì)任一測試樣本,計(jì)算對(duì)應(yīng)的協(xié)方差描述子,稀疏系數(shù)以及殘差。根據(jù)殘差可得,第5類所對(duì)應(yīng)的殘差最小,因此,測試樣本的識(shí)別結(jié)果為廂式貨車(左側(cè)標(biāo)紅)。
我們采用KNN[15]以及SVM[16]作為基準(zhǔn)算法,針對(duì)5組測試樣本,比較3種算法的準(zhǔn)確率。表1所示為3種算法的識(shí)別準(zhǔn)確率,本文方法與KNN以及SVM算法相比,識(shí)別率平均分別高出約15%和4%。
圖7(a)~(c)所示分別為為KNN、SVM和本文方法針對(duì)實(shí)驗(yàn)數(shù)據(jù)的平均混淆矩陣,本文方法針對(duì)各類目標(biāo)的分類識(shí)別準(zhǔn)確率均高于KNN以及SVM算法。
本文針對(duì)紅外目標(biāo)識(shí)別問題,提出了一種基于核稀疏編碼的識(shí)別方法,該方法將紅外目標(biāo)識(shí)別問題轉(zhuǎn)化為稀疏表示問題,采用5×5的協(xié)方差描述子作為紅外目標(biāo)特征,通過Log-Euclidean度量進(jìn)行相似性計(jì)算,通過核稀疏編碼在高維空間對(duì)目標(biāo)特征進(jìn)行分類識(shí)別。通過對(duì)實(shí)測數(shù)據(jù)的試驗(yàn)表明該方法體現(xiàn)出了良好的識(shí)別性能。
圖5 紅外車輛目標(biāo)示例
圖6 紅外目標(biāo)識(shí)別軟件
表1 3種分類算法識(shí)別準(zhǔn)確率比較
圖7 3種分類算法的混淆矩陣
[1] Yang Chunwei, Liu Huaping, Liao Shouyi, et al. Small target detection in infrared video sequence using robust dictionary learning[J]., 2015, 68: 1-9.
[2] Gong Jinnan, Zhang Yin, Hou Qingyu, et al. Background suppression for cloud clutter using temporal difference projection[J]., 2014, 64: 66-72.
[3] 王世亮, 楊帆, 張志偉, 等. 基于目標(biāo)紅外特性與SIFT特征相結(jié)合的目標(biāo)識(shí)別算法[J]. 紅外技術(shù), 2012, 34(9): 503-507.
WANG Shi-liang, YANG Fan, ZHANG Zhi-wei, et al. A target recognition method based on infrared features and SIFT[J]., 2012, 34(9): 503-507.
[4] 朱長軍, 王民鋼, 王超, 等. 地面背景下基于SURF的紅外目標(biāo)識(shí)別方法[J]. 紅外技術(shù), 2013, 35(9): 551-554.
ZHU Chang-jun, WANG Min-gang, WANG Chao, et al. Infrared target recognition method based on SURF in ground background[J]., 2013, 35(9): 551-554.
[5] 明德烈, 田金文. 紅外前視對(duì)一類特殊建筑物目標(biāo)識(shí)別技術(shù)研究[J]. 宇航學(xué)報(bào), 2010, 31(4): 1190-1194.
MING Delie, TIAN Jinwen. Automatic infrared condensing tower target recognition using gradient vector features[J]., 2010, 31(4): 1190-1194.
[6] 范彬, 馮云松. 支持向量機(jī)在紅外成像自動(dòng)目標(biāo)識(shí)別中的應(yīng)用[J]. 紅外技術(shù), 2007, 29(1): 38-41.
FAN Bin, FENG Yun-Song. The application of the support vector machine in infrared imaging automatic target recognition[J]., 2007, 29(1): 38-41.
[7] Wright John, Yang Allen Y, Ganesh Arvind, et al. Robust face recognition via sparse representation[J]., 2009, 31(2): 210-227.
[8] Patel Vishal M, Nasrabadi Nasser M, Chellappa Rama. Sparsity-motivated automatic target recognition[J]., 2011, 50(10): 1425-1433.
[9] Tuzel Oncel, Porikli Fatih, Meer Peter. Region covariance: a fast descript- or for detection and classification[C]//, 2006.
[10] Tuzel Oncel, Porikli Fatih, Meer Peter. Pedestrian detection via classific- ation on riemannian manifolds[J]., 2008, 30(10): 1713-1727.
[11] Porikli Fatih, Tuzel Oncel, Meer Peter. Covariance tracking using model update based on lie algebra[C]//, 2006: 728-735.
[12] Erdem Erkut, Erdem Aykut. Visual saliency estimation by nonlinearly integrating features using region covariances[J]., 2013, 13(4): 1-20.
[13] Li Peihua, Wang Qilong, Zuo Wangmeng, et al. Log-Euclidean kernels for sparse representation and dictionary learning[C]//, 2013: 1601-1608.
[14] Gao Shenghua, Tsang Ivor Wai-Hung, Chia Liang-Tien. Sparse representation with kernels[J]., 2013, 22(2): 423-434.
[15] Hastie Trevor, Tibshirani Robert. Discriminant adaptive nearest neighbor classification[J]., 1996, 18(6): 607-616.
[16] Cortes Corinna, Vapnik Vladimir. Support-vector networks[J]., 1995, 20(13): 273-297.
An Infrared Target Recognition Method Based on Kernel Sparse Coding
YANG Chunwei1,2,WANG Shicheng1,LIAO Shouyi1,LIU Huaping2
(1.,’710025,; 2.,,100084,)
An infrared target recognition method based on covariance descriptor and kernel sparse coding is proposed in this paper. Covariance descriptor combining infrared image gray intensity values and the norm of first and second order derivatives of the intensities as infrared image features. With respect toandis extracted as feature representation, similarity of covariance descriptors is computed through Log-Euclidean metric. Then covariance descriptors are mapped into a high dimensional feature space through Gaussian kernel function. Finally, infrared target recognition is accomplished using sparse coding in the new feature space. Experiments on the real infrared images show that our method obtains better results compared with traditional algorithms such as KNN and SVM.
covariance descriptor,kernel sparse coding,infrared target recognition
TP391
A
1001-8891(2016)03-0230-06
2015-09-07;
2015-10-08.
楊春偉(1986-),男,山東高密人,博士研究生,研究方向?yàn)榧t外目標(biāo)的檢測與識(shí)別。E-mail:yangchunwei081129@163.com。