賀康建,周冬明,聶仁燦,金 鑫,王 佺
(云南大學(xué) 信息學(xué)院,云南 昆明 650504)
基于局部控制核的彩色圖像目標(biāo)檢測方法*
賀康建,周冬明,聶仁燦,金 鑫,王 佺
(云南大學(xué) 信息學(xué)院,云南 昆明 650504)
在圖像處理問題中,對圖像中給定目標(biāo)進(jìn)行檢測和定位時,為提高目標(biāo)檢測的速度與可靠性,引入一種基于圖像局部控制核的目標(biāo)檢測算法。利用參考圖像同等大小的窗口遍歷目標(biāo)圖像,得到一系列與參考圖大小相同的子圖,然后計算參考圖和目標(biāo)子圖的局部控制核,得到圖像特征信息的數(shù)據(jù)矩陣。為了提高運(yùn)算速度,對數(shù)據(jù)矩陣用局部保留投影方法降維。再用相似性判決準(zhǔn)則將參考圖像與目標(biāo)圖像中子塊的特征矩陣進(jìn)行相似性分析,查找與參考圖像最相似矩陣所對應(yīng)的圖像區(qū)域即為檢測結(jié)果。實(shí)驗(yàn)結(jié)果表明,該算法對目標(biāo)定位具有較高的可靠性與準(zhǔn)確度。
圖像分析;數(shù)據(jù)矩陣;相似性判決;目標(biāo)檢測
近年來計算機(jī)技術(shù)快速發(fā)展,計算機(jī)智能為人們的日常生活帶來諸多方便。隨著人們需求的日益增長,目標(biāo)檢測與定位逐步進(jìn)入到人們的實(shí)際生活中[1,2],隨著對人體動作識別、人機(jī)交互技術(shù)的深入研究,計算機(jī)視覺系統(tǒng)也變得越來越智能。使用計算機(jī)進(jìn)行特征檢測、目標(biāo)跟蹤、目標(biāo)檢測及定位等技術(shù)得到了研究人員的廣泛關(guān)注,這些技術(shù)也開始應(yīng)用到人們的日常生活中。本文采用圖像局部控制核算法[3],實(shí)現(xiàn)了對不同目標(biāo)的快速檢測與定位。目前對于目標(biāo)檢測及定位問題,有關(guān)研究人員提出了許多新穎的算法,但大多數(shù)算法需要進(jìn)行繁瑣的訓(xùn)練和預(yù)處理過程。如參考匹配法[4]將隱馬爾科夫統(tǒng)計模型引入到目標(biāo)參考匹配,此方法的局限性是無法從圖像內(nèi)容來解釋并確定隱馬爾科夫模型的參數(shù),只能通過一系列的實(shí)驗(yàn)來選擇最優(yōu)參數(shù),這一問題限定了圖像識別中隱馬爾科夫模型[5]的進(jìn)一步應(yīng)用。還有一種多檢測目標(biāo)自動定位監(jiān)測技術(shù)主要是基于圖像像素的單閾值分割法[6]的運(yùn)用,此類定位方法過程繁瑣耗時。本文提出采用圖像局部控制核算法來對目標(biāo)進(jìn)行快速的配準(zhǔn)、檢測與定位[7]。
本文采用局部控制核[8]的方法,獲取圖像像素點(diǎn)的幾何結(jié)構(gòu)信息,提取出圖像的結(jié)構(gòu)特征,將目標(biāo)圖像分割成與目標(biāo)參考圖像大小一致的一系列子圖,參考圖像即為所需查找定位的目標(biāo),最后分析包含圖像特征信息的數(shù)據(jù)矩陣之間的相似性來達(dá)到目標(biāo)檢測的目的。算法流程圖如圖1所示。
圖1 算法流程圖
1.1 局部控制核函數(shù)LSK
局部控制核函數(shù)(Local Steering Kernel,LSK)是在評估梯度的基礎(chǔ)上通過分析像素值的差異來獲取圖像的局部數(shù)據(jù)結(jié)構(gòu),用所獲取的結(jié)構(gòu)信息確定核的形狀和大小,用徑向?qū)ΨQ函數(shù)來表示局部核函數(shù),表達(dá)式如式(1):
其中,P2是局部窗(P×P)中像素點(diǎn)個數(shù),是空間坐標(biāo)。Hl為轉(zhuǎn)向矩陣,其表達(dá)式為:
其中,h是一個全局平滑參數(shù)。矩陣Cl是通過計算每個像素點(diǎn)的梯度向量G得到的協(xié)方差矩陣,其表達(dá)式如下:
式中,矩陣V和S是梯度向量G的SVD奇異值分解。其中,c=(s11+1)/(s22+1),K是半徑為 P的圓形區(qū)域均值濾波器,α是靈敏度參數(shù)。轉(zhuǎn)向矩陣Hl通過編碼圖像中存在的局部幾何結(jié)構(gòu)信息,來調(diào)整局部核的形狀和大小。選用高斯函數(shù)表示K(·),可以得到如下LSK描述子:
在像素點(diǎn) x處,將函數(shù) K(xl-x;Hl)歸一化,用來描述圖像內(nèi)在的局部幾何結(jié)構(gòu),因此,在參考圖像和目標(biāo)圖像中分別得到如下算子:
式中,n和nT分別是在參考圖像Q和目標(biāo)圖像T中計算LSK所用到的子塊數(shù)目。
1.3 矩陣相似性判決準(zhǔn)側(cè)
本文采用余弦相似性準(zhǔn)則[10],通過計算特征矩陣 FQ和FTi之間的距離來度量參考圖像Q與目標(biāo)圖像子塊Ti之間的相似性。余弦相似性的定義是兩個歸一化向量的內(nèi)積,表達(dá)式如下:
用余弦相似性準(zhǔn)則度量FQ和這兩個矩陣的相似性時,用下面的公式計算矩陣內(nèi)積:
并定義 ρi=ρ(FQ,),將式(12)改寫成加權(quán)平均的形式如下:
得到ρi以后,就可以分析參考圖像Q和目標(biāo)圖像Ti之間的相似性關(guān)系。如果夾角為0°,意味著方向相同、線段重合;如果夾角為90°,意味著形成直角,方向正交;如果夾角為180°,意味著方向正好相反。為更好地體現(xiàn)向量間的差異,用與1-的比值來衡量兩向量的相似度,即 f(ρi)=/(1-),f(ρi)∈[0,∞]。這樣,就將相似度的范圍從[0,1]擴(kuò)展到[0,∞]之間,可以更好地突出向量間的微小差異,更能體現(xiàn)兩者的相似程度。
1.4 保留最大相似區(qū)域
在圖像中目標(biāo)的檢測與定位過程中,設(shè)定一個整體閾值 τ0,將 f(ρi)與 τ0作比較,若 f(ρi)>τ0就認(rèn)為目標(biāo)圖像與參考圖像相似,最終的定位與檢測的準(zhǔn)確度與相似度可以通過調(diào)節(jié)τ0來實(shí)現(xiàn)。這樣就可以得到一個相似區(qū)域,然后,進(jìn)行非極大值抑制,即只保留 maxf(ρi)的對象,就是最終的檢測與定位結(jié)果。maxf(ρi)>τ0表明目標(biāo)圖像中有需要檢測的參考圖像,maxf(ρi)<τ0,則目標(biāo)圖像中不存在所感興趣的對象。
所有相似性區(qū)域子圖塊位置和保留最大相似區(qū)域?qū)嶒?yàn)結(jié)果如圖2所示。
圖2 所有可能區(qū)域與定位結(jié)果
為了驗(yàn)證該算法的有效性,本文選取兩組圖作為實(shí)驗(yàn)數(shù)據(jù)。其中一組圖像是對衛(wèi)星接收器進(jìn)行定位,如圖3所示。
圖3 實(shí)驗(yàn)1
實(shí)驗(yàn)結(jié)果如圖4所示。圖4中,不同顏色代表不同的相似度,藍(lán)色(區(qū)域1、3)到紅色(區(qū)域2、4)表示的相似度依次增強(qiáng),實(shí)驗(yàn)選取的參考圖像為目標(biāo)圖像中最左側(cè)的圖像,所以定位結(jié)果中最左側(cè)的定位結(jié)果為紅色,與參考圖像最為接近。圖4(c)中可以看到檢測出不同的相似區(qū)域,可以通過調(diào)節(jié)整體閾值來決定不同相似度區(qū)域的取舍,最終定位出結(jié)果。
下面給出另一組人臉檢測與定位實(shí)驗(yàn),并分析靈敏度α對準(zhǔn)確度與計算復(fù)雜度的影響,實(shí)驗(yàn)結(jié)果如圖5所示。
圖4 實(shí)驗(yàn)1結(jié)果
圖5 實(shí)驗(yàn)2
由于式(3)中參數(shù)靈敏度α影響檢測的準(zhǔn)確度與運(yùn)算速度,在實(shí)驗(yàn)中,選取α=1.0。從表1與圖5中可以看出,靈敏度α越小,計算出的顯著性區(qū)域即與參考圖相似的子塊區(qū)域越大,檢測結(jié)果越準(zhǔn)確,但需要很大的計算復(fù)雜度;α越大,相似性區(qū)域越小,檢測時間越短,但有可能造成檢測目標(biāo)的缺失,如圖5(e)中所示。
本文采用的目標(biāo)定位算法對圖像中的參考圖像目標(biāo)進(jìn)行定位,該算法不需要過多的預(yù)處理和訓(xùn)練過程,只需要輸入一個參考圖像來獲取所需定位目標(biāo)的結(jié)構(gòu)信息矩陣,再用局部保留投影(LPP)對圖像矩陣進(jìn)行降維,提取顯著特征,進(jìn)而與目標(biāo)圖像的相似特征進(jìn)行匹配,用余弦相似性方法作為判決依據(jù)。由實(shí)驗(yàn)得知,該算法是一個通用的定位算法,參考圖像和目標(biāo)圖像里的定位圖像不需要嚴(yán)格一致。從實(shí)驗(yàn)1看出,在目標(biāo)圖像中,定位目標(biāo)的角度、方向、亮度和目標(biāo)大小等信息不一致,仍準(zhǔn)確定位出3個目標(biāo);在實(shí)驗(yàn)2中也可以看出,在復(fù)雜的圖像背景下,輸入的參考與檢測目標(biāo)有一定的差異,仍能檢測定位出人臉信息,說明本算法的有效性和通用性。
表1 靈敏度α對檢測時間的影響
本文算法的局限在于,檢測目標(biāo)圖像中的目標(biāo)時,目標(biāo)圖像中目標(biāo)的大小應(yīng)大致與參考圖像大小一致,這樣對檢測圖像分割成一系列與參考圖像大小一致的子圖塊時才能進(jìn)行特征點(diǎn)相似性判決。針對目標(biāo)圖像中目標(biāo)大小與參考圖像大小不一致的問題,可以通過縮放參考圖像來解決。在參考圖像與目標(biāo)圖像存在形變時,若目標(biāo)的局部幾何形狀特征明顯,能提取出特征,則可以通過調(diào)節(jié)相似度閾值τ0來實(shí)現(xiàn)對目標(biāo)進(jìn)行檢測與定位,但會造成定位精度下降。有關(guān)算法的參數(shù)設(shè)置,目前沒有自適應(yīng)的優(yōu)化參數(shù)方法,只能做大量實(shí)驗(yàn)選取最優(yōu)參數(shù),隨著這一問題的解決,必會使此算法得到更廣泛的應(yīng)用。
[1]喻鑫,明德烈,田金文.前下視紅外圖像中復(fù)雜地面背景下的目標(biāo)定位[J].紅外與激光工程,2007,6(6):988-991.
[2]楊威,付耀文,潘曉剛,等.弱目標(biāo)檢測前跟蹤技術(shù)研究綜述[J].電子學(xué)報,2014,42(9):1786-1793.
[3]SEO H J,MILANFAR P.Training-free,generic object detection using locally adaptive regression kernels[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2010,32(9):1688-1704.
[4]任仙怡,張桂林,張?zhí)煨颍?基于奇異值分解的圖像匹配方法[J].紅外與激光工程,2001,30(4):200-202.
[5]劉小軍,王東峰,張麗飛,等.一種基于奇異值分解和隱馬爾可夫模型的人臉識別方法[J].計算機(jī)學(xué)報,2003,26 (3):340-344.
[6]陳果,左洪福.圖像的自適應(yīng)模糊閾值分割法[J].自動化學(xué)報,2003,29(5):791-796.
[7]鄧集洪,魏宇星.基于局部特征描述的目標(biāo)定位[J].光電工程,2015,1(1):58-64.
[8]KUMAR Y,GAUTAM J.Training-free video indexing scheme using local steering kernel[J/OL].(2012)[2016].http://www.tjprc.org/files/2-15-1371044563-1.Training%20free%20video.full.pdf.
[9]WONG W K,ZHAO H T.Supervised optimal locality preserving projection[J].Pattern Recognition,2012,45(1):186-197.
[10]YE J.Cosine similarity measures for intuitionistic fuzzy sets and their applications[J].Mathematical&Computer Modelling,2011,53(53):91-97.
Target detection method based on local steering kernel of color image
He Kangjian,Zhou Dongming,Nie Rencan,Jin Xin,Wang Quan
(Information College,Yunnan University,Kunming 650504,China)
In image processing,aiming at the given target detection and localization of the image,in order to improve the speed and reliability of target detection,this paper introduceds a new target detection algorithm based on image local steering kernel(LSK).Using the same size window of the query image traversal target image,the paper gets a series of sub-graphs the same size as the query image,then calculates the LSK of the query image and the target sub-graphs,the image feature information data matrices are obtained.In order to increase the computing speed,the method of local preserving projection is used to reduce the dimension of the data matrices.Further,the similarity judgment criterion is used to analyze the similarity between the query image and the target sub-graphs,the target area,which is similar to the query image,is the detection result.The experimental results show thatthe algorithm of target location is of high reliability and accuracy.
image analysis;data matrix;similarity judgment;target detection
TN911.73;TP181
A
10.16157/j.issn.0258-7998.2016.12.023
賀康建,周冬明,聶仁燦,等.基于局部控制核的彩色圖像目標(biāo)檢測方法[J].電子技術(shù)應(yīng)用,2016,42 (12):89-92.
英文引用格式:He Kangjian,Zhou Dongming,Nie Rencan,et al.Target detection method based on local steering kernel of color image[J].Application of Electronic Technique,2016,42(12):89-92.
2016-06-21)
賀康建(1990-),男,碩士研究生,主要研究方向:圖像融合、人工神經(jīng)網(wǎng)絡(luò)。
周冬明(1963-),通信作者,男,博士,教授,主要研究方向:神經(jīng)網(wǎng)絡(luò)、信號處理技術(shù)、圖像融合,E-mail:zhoudm@ynu.edu.cn。
聶仁燦(1982-),男,博士,副教授,主要研究方向:圖像處理、人工神經(jīng)網(wǎng)絡(luò)。
國家自然科學(xué)基金(61365001,61463052)