摘要:該文提出了一種基于HSV顏色直方圖、一二三階顏色矩、Gabor小波和SIFT特征描述子的多特征融合方法,以實(shí)現(xiàn)防空戰(zhàn)爭(zhēng)的提前預(yù)警和及時(shí)打擊功能。在目標(biāo)分類過程,針對(duì)SIFT特征描述子,該文使用最新的金子塔匹配核,通過在Caltech 101數(shù)據(jù)庫的實(shí)驗(yàn),采用SVM分類器,證明該方法在目標(biāo)識(shí)別方面性能有很大的提高。
關(guān)鍵詞:目標(biāo)識(shí)別;SVM;SIFT;金字塔匹配核
中圖分類號(hào):TP18文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)36-10534-04
Enemy Target Recognition Based on Multi-Feature Fusion
MA Xiang1, PENG Jin-ye2
(1.PianZhuan Group Information Center, XianYang 712000, China; 2.Northwestern Polytechnical University, Faculty of Electronics, Xi'an 710072, China)
Abstract: This paper presents a multi-feature fusion method to solve the enemy target recognition problem. In this method we use HSV color histogram, Color Moment, gabor wavelet and SIFT. By using multi-feature fusion and pyramid kernel and testing on Caltech 101 database, the method provide better results than other methods.
Key words: target recognition; SVM; SIFT; pyramid kernel
1 概述
從海灣戰(zhàn)爭(zhēng)、科索沃戰(zhàn)爭(zhēng)到伊拉克戰(zhàn)爭(zhēng)已經(jīng)表明,現(xiàn)代戰(zhàn)爭(zhēng)是高科技戰(zhàn)爭(zhēng),防空、防海、防陸戰(zhàn)爭(zhēng)中,敵我目標(biāo)的識(shí)別是戰(zhàn)爭(zhēng)成功與否的關(guān)鍵。在對(duì)戰(zhàn)情的分析中,首先要對(duì)所發(fā)現(xiàn)的目標(biāo)進(jìn)行分析,以便分清\"敵方目標(biāo)\",\"不明目標(biāo)\"和\"我方目標(biāo)\",在此基礎(chǔ)上才能有效的提高我軍高科技戰(zhàn)斗力.
針對(duì)我軍戰(zhàn)時(shí)獲取的圖像,通過圖像分割,將圖像分割成不同的區(qū)域.針對(duì)各個(gè)區(qū)域提取目標(biāo)的特征,通過模式分類方法確定各個(gè)區(qū)域的類型。在此基礎(chǔ)上,形成圖像的語義。這將是戰(zhàn)時(shí)判斷敵我目標(biāo)的一個(gè)有效方法。
本文提出了一種基于HSV顏色直方圖、一二三階顏色矩、Gabor小波和SIFT特征描述子的多特征融合方法,以解決敵方目標(biāo)識(shí)別問題.為了驗(yàn)證本文提出的方法,我們主要在國(guó)際著名的Caltech 101數(shù)據(jù)庫圖像數(shù)據(jù)庫上進(jìn)行效果測(cè)試。
本文其余章節(jié)組織如下:第二部分綜述采用的方法;第三部分給出了SVM分類所需的圖像特征:RGB顏色直方圖和顏色矩、Gabor小波、SIFT特征,同時(shí)給出了SIFT的金字塔核方法。第四部分在的Caltech 101數(shù)據(jù)庫圖像數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn),并給出了實(shí)驗(yàn)結(jié)果。
2 方法綜述
本文的目地是為了實(shí)現(xiàn)一個(gè)簡(jiǎn)單而實(shí)用的敵對(duì)目標(biāo)識(shí)別方法.因此,使用HSV顏色直方圖、一、二、三階顏色矩、Gabor小波和SIFT組成SVM特征空間以實(shí)現(xiàn)分類,通過多特征融合的方法實(shí)現(xiàn)了敵對(duì)目標(biāo)識(shí)別.敵對(duì)目標(biāo)識(shí)別方法流程如下:
2.1 圖像特征的獲取
對(duì)每個(gè)訓(xùn)練圖像集合中的每一個(gè)圖像,首先生成HSI顏色直方圖、一、二、三階顏色矩和Gabor小波構(gòu)造第一個(gè)SVM特征子空間。然后針對(duì)SIFT構(gòu)造第二個(gè)SVM特征子空間。針對(duì)這兩個(gè)SVM特征子空間,分別使用LibSVM進(jìn)行訓(xùn)練,獲取SVM模型信息,使用訓(xùn)練好的SVM模型,多核多特征融合方式分類識(shí)別。圖1是獲取特征空間的過程,圖2是針對(duì)特征空間,多特征多核識(shí)別。
2.2 負(fù)載均衡考慮
在圖像推介過程中,需要針對(duì)訓(xùn)練圖像和待分類圖像獲取RGB顏色直方圖、一、二、三階顏色矩和Gabor小波、SIFT特征,然后進(jìn)行SVM訓(xùn)練.在推介過程中,需要模糊化0上下文信息,使用上下文敏感SVM和CF協(xié)同工作方式進(jìn)行推介.因此推介系統(tǒng)需要極高的運(yùn)算性能和運(yùn)算內(nèi)存,在實(shí)際處理中通常采取分布使處理,以實(shí)現(xiàn)負(fù)載均衡。本文采取多個(gè)服務(wù)器分擔(dān)兩個(gè)SVM訓(xùn)練、多核判斷處理、協(xié)同推介。這些服務(wù)器之間通過TCP自定義協(xié)議方式進(jìn)行通訊。分布式處理的過程如圖3所示。
3 圖像特征獲取
利用圖像的HSV顏色直方圖、顏色矩、Gabor小波和SIFT特征進(jìn)行目標(biāo)分類,以此為基礎(chǔ)訓(xùn)練三個(gè)SVM分類器,形成多判別分類器進(jìn)行目標(biāo)識(shí)別。
3.1 HSV顏色直方圖和顏色矩
提取圖像的HSV顏色直方圖和圖像的顏色矩。HSI顏色空間是直方圖最常用的顏色空間,它的三個(gè)分量分別代表色彩(Hue)、飽和度(Saturation)和強(qiáng)度(Intensity). HSI模型是Munseu提出的, 這個(gè)模型的建立基于兩個(gè)重要的事實(shí): ① I分量與圖像的彩色信息無關(guān);② H和S分量與人感受顏色的方式是緊密相聯(lián)的。這些特點(diǎn)使得HSI模型非常適合借助人的視覺系統(tǒng)來感知彩色特性。公式1為HIS與RGB轉(zhuǎn)換公式。
顏色矩是一種簡(jiǎn)單而有效的顏色特征,是由Stricker和Oreng提出的,這種方法的數(shù)學(xué)基礎(chǔ)是圖像中的任何的顏色分布均可以用它的矩來表示。此外,由于顏色分布信息主要集中在低階矩中,因此,僅采用顏色的一階矩(mean)、二階矩(Variance)和三階矩(Skewness)就可以表達(dá)圖像的顏色分布。公式2為一、二、三階顏色矩計(jì)算公式。圖4原始圖像,圖5HSI顏色直方圖(16 bin),圖6顏色矩。
公式1HSI與RGB轉(zhuǎn)換公式 公式2一、二、三階顏色矩計(jì)算公式
圖4原始圖像 圖5HSI顏色直方圖(16 bin) 圖6顏色矩
3.2 Gabor小波
圖像I(Z)=I(x,y)表示圖像的灰度分布,則圖像I和Gabor小波gμ,ν的卷積為:
(3)
符號(hào)表示卷積。二維Gabor小波的核函數(shù)gμ,ν[11]定義為:
(4)
(5)
其中ωμ,kν分別定義了波向量的方向和尺度,z=(x,y),‖ ‖定義了向量范式.在本文中取尺度為4,方向?yàn)?。
3.3 SIFT特征和同維方法
SIFT是由Lowe提出的圖像局部特征描述子,在物體識(shí)別方面有很好的應(yīng)用,SIFT算法具有如下特點(diǎn):
1) SIFT對(duì)旋轉(zhuǎn)、尺度縮放、亮度變化保持不變性,對(duì)視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)定性。
2) 獨(dú)特性好,信息量豐富,適用于在海量特征數(shù)據(jù)庫中進(jìn)行快速、準(zhǔn)確的匹配。
3) 多量性,即使少數(shù)的幾個(gè)物體也可以產(chǎn)生大量SIFT特征向量。
4) 高速性,經(jīng)優(yōu)化的SIFT匹配算法甚至可以達(dá)到實(shí)時(shí)的要求。
5) 可擴(kuò)展性,可以很方便的與其他形式的特征向量進(jìn)行聯(lián)合。
SIFT實(shí)質(zhì)是一個(gè)基于極值點(diǎn)位置和圖像方向直方圖統(tǒng)計(jì)的特征描述子。其實(shí)現(xiàn)步驟分為三步:1、極值點(diǎn)位置獲取;2、關(guān)鍵點(diǎn)方向分配;3、特征點(diǎn)描述子生成。
3.3.1 極值點(diǎn)獲取步驟
首先對(duì)原圖形進(jìn)行高斯卷積生成尺度空間,獲取空間極值點(diǎn)坐標(biāo),最后通過曲率精確定位極值點(diǎn)。
①使用不同尺度的高斯核,生成圖像金子塔。L(x,y,σ)=G(x,y,σ)?茚I(x,y)這里(x,y)是空間坐標(biāo), σ是尺度坐標(biāo),σ決定圖像被平滑程度。其中G(x,y,σ)是尺度可變高斯函數(shù):G(x,y,σ)=e-(x2+y2)/2σ2。
②滿足在圖像二維平面空間和DOG[19](Difference of Gauss)尺度空間中同時(shí)具有局部極值的點(diǎn)作為SIFT關(guān)鍵點(diǎn)。DOG算子定義為兩個(gè)不同尺度的高斯核的差分。D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))?茚I(x,y)-=L(x,y,kσ)-L(x,y,σ)。
為了尋找尺度空間的極值點(diǎn),每一個(gè)采樣點(diǎn)要和它所有的相鄰點(diǎn)比較,看其是否比它的圖像域和尺度域的相鄰點(diǎn)大或者小。一般采樣點(diǎn)要和它處于同一尺度的8個(gè)相鄰點(diǎn)和上下相鄰尺度對(duì)應(yīng)的9×2個(gè)點(diǎn)共26個(gè)點(diǎn)比較,以確保在尺度空間和二維圖像空間都檢測(cè)到極值點(diǎn)。
③上面通過擬和三維二次函數(shù)確定了關(guān)鍵點(diǎn)的位置和尺度(達(dá)到亞像素精度)。然而因?yàn)镈OG算子會(huì)產(chǎn)生較強(qiáng)的邊緣響應(yīng),所以SIFT 算法需要舍棄低對(duì)比度的關(guān)鍵點(diǎn)和不穩(wěn)定的邊緣響應(yīng)點(diǎn)以增強(qiáng)匹配穩(wěn)定性和提高抗噪聲能力。舍棄關(guān)鍵點(diǎn)的依據(jù)是:一個(gè)定義不好的DOG的極值在橫跨邊緣的地方有較大的主曲率,而在垂直邊緣的方向有較小的主曲率.主曲率通過一個(gè)2x2 的Hessian矩陣H求出:H=,DOG的主曲率和H的特征值成正比,令α為最大特征值,β為最小的特征值,則Tr(H)=Dxx+Dyy=α+β,Det(H)=DxxDyy-(Dxy)2。令α=λβ,則===,的值在兩個(gè)特征值相等的時(shí)候最小,隨著r的增大而增大,因此,為了檢測(cè)主曲率是否在某域值r下,只需檢測(cè)<。一般取λ=10。
3.3.2 關(guān)鍵點(diǎn)方向分配
首先針對(duì)圖像I(x,y),利用關(guān)鍵點(diǎn)鄰域像素進(jìn)行梯度方向計(jì)算Ix和Ty。則(x,y)點(diǎn)的模值定義為:M(x,y)=,其方向定義為:θ(x,y)=tan-1(Iy(x,y)/Ix(x,y))。其中L所用的尺度為每個(gè)關(guān)鍵點(diǎn)各自所在的尺度。
針對(duì)圖像I(x,y)中的所有點(diǎn)(x,y),獲取γ鄰域,并統(tǒng)計(jì)γ鄰域的梯度直方圖。梯度直方圖的范圍是0~360度,將其分割為β個(gè)柱。直方圖的峰值則代表了該關(guān)鍵點(diǎn)處鄰域梯度的主方向,即作為該關(guān)鍵點(diǎn)的方向。梯度方向直方圖中,當(dāng)存在另一個(gè)相當(dāng)于主峰值80%能量的峰值時(shí),則將這個(gè)方向認(rèn)為是該關(guān)鍵點(diǎn)的輔方向。一個(gè)關(guān)鍵點(diǎn)可能會(huì)被指定具有多個(gè)方向(一個(gè)主方向,一個(gè)以上輔方向),這可以增強(qiáng)匹配的魯棒性。 一般取γ=16, β=8。通過以上幾步, 可檢測(cè)出圖像的SIFT關(guān)鍵點(diǎn),每個(gè)關(guān)鍵點(diǎn)有三個(gè)信息:位置、所處尺度和方向,由此可以確定一個(gè)SIFT特征區(qū)域。
3.3.3 特征點(diǎn)描述子生成
SIFT描述子是對(duì)一個(gè)SIFT特征區(qū)域的描述,其生成步驟如下:
① 首先將坐標(biāo)軸旋轉(zhuǎn)為SIFT特征區(qū)域的方向,以確保旋轉(zhuǎn)不變性。
② 接下來以關(guān)鍵點(diǎn)為中心取8×8的窗口。圖7左部分的中央黑點(diǎn)為當(dāng)前關(guān)鍵點(diǎn)的位置,每個(gè)小格代表關(guān)鍵點(diǎn)鄰域所在尺度空間的一個(gè)像素,箭頭方向代表該像素的梯度方向,箭頭長(zhǎng)度代表梯度模值,圖中藍(lán)色的圈代表高斯加權(quán)的范圍(越靠近關(guān)鍵點(diǎn)的像素梯度方向信息貢獻(xiàn)越大)。然后在每4×4的小塊上計(jì)算8個(gè)方向的梯度方向直方圖,繪制每個(gè)梯度方向的累加值,即可形成一個(gè)種子點(diǎn),如圖7右部分所示。此圖中一個(gè)關(guān)鍵點(diǎn)由2×2共4個(gè)種子點(diǎn)組成,每個(gè)種子點(diǎn)有8個(gè)方向向量信息。這種鄰域方向性信息聯(lián)合的思想增強(qiáng)了算法抗噪聲的能力,同時(shí)對(duì)于含有定位誤差的特征匹配也提供了較好的容錯(cuò)性。
實(shí)際計(jì)算過程中,為了增強(qiáng)匹配的穩(wěn)健性,Lowe建議對(duì)每個(gè)關(guān)鍵點(diǎn)使用4×4共16個(gè)種子點(diǎn)來描述,這樣對(duì)于一個(gè)關(guān)鍵點(diǎn)就可以產(chǎn)生128個(gè)數(shù)據(jù),即最終形成128維的SIFT特征向量。此時(shí)SIFT特征向量已經(jīng)去除了尺度變化、旋轉(zhuǎn)等幾何變形因素的影響,再繼續(xù)將特征向量的長(zhǎng)度歸一化,則可以進(jìn)一步去除光照變化的影響。
3.3.4 SIFT的金字塔方法
原始圖形 SIFT圖像5913個(gè)特征點(diǎn)原圖像SIFT圖像252個(gè)特征點(diǎn)
圖8
SIFT形成的特征描述子特征點(diǎn)個(gè)數(shù)不同、無序、而且位置互異。而SVM分類器需要向量同維,因此無法直接使用SVM針對(duì)SIFT特征進(jìn)行分類。
針對(duì)該問題,國(guó)外進(jìn)行了很多研究。2007年Kristen提出的金字塔核匹配方法,運(yùn)算簡(jiǎn)單而且準(zhǔn)確度較高,因此本文采取該方法解決SIFT分類問題。
該方法將特征子數(shù)據(jù)投影到不同的尺度空間,求同一尺度空間的重疊值。然后再求相鄰尺度空間重疊值的交叉值。其采用的核函數(shù)如下:K=wiNi。其核函數(shù)具體計(jì)算方法如圖9。
4 實(shí)驗(yàn)結(jié)果
本文采用Caltech 101數(shù)據(jù)庫作為實(shí)驗(yàn)對(duì)象,該數(shù)據(jù)庫一共用101種類數(shù)據(jù)以供識(shí)別。本文采用Libsvm作為分類器,其中訓(xùn)練測(cè)試樣本共3600張圖片。圖片類型共36種,每種100張。本文采取訓(xùn)練樣本和測(cè)試樣本各占50%進(jìn)行測(cè)試,部分Caltech101數(shù)據(jù)庫圖片如圖10。
圖10 Calth101數(shù)據(jù)庫部分圖像
部分測(cè)試結(jié)果如表1:
表1 識(shí)別率(%)
參考文獻(xiàn):
[1] 劉忠偉,章毓晉.綜合利用顏色和紋理特征的圖像檢索[J].通信學(xué)報(bào),1999(5).
[2] 王文惠,王展,周良柱,萬建偉.基于內(nèi)容的彩色圖像顏色特征的提取方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2001(6).
[3] 陳兵旗,孫明.Visual C++實(shí)用圖像處理專業(yè)教程[M].北京:清華大學(xué)出版社,2004(03):132-138.
[4] 張學(xué)工.關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論和支持向量機(jī)[J].自動(dòng)化學(xué)報(bào),2000(06):32-42.
[5] 李國(guó)正,王猛,曾華軍.支持向量機(jī)導(dǎo)論[M].北京:電子工業(yè)出版社,2004.
[6] 肖靚,顧嗣揚(yáng).基于SVM綜合利用顏色和紋理特征的圖像分類和檢索[J].通信和計(jì)算機(jī),2005.