劉 立, 羅 揚(yáng), 汪琳霞, 劉芳菊, 李 悛
(南華大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 421001 湖南 衡陽(yáng))
?
一種新的尺度不變特征提取方法
劉立, 羅揚(yáng), 汪琳霞, 劉芳菊, 李悛
(南華大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 421001 湖南 衡陽(yáng))
摘要:為解決傳統(tǒng)尺度不變特征點(diǎn)提取算子計(jì)算復(fù)雜度高、抗噪能力不強(qiáng)以及特征點(diǎn)位置發(fā)生漂移等問(wèn)題,提出一種基于尺度空間因果關(guān)系的尺度不變特征提取方法.首先原圖像與高斯函數(shù)進(jìn)行卷積獲得高斯平滑圖像;然后在原圖與高斯圖像中分別提取Harris角點(diǎn)作為候選特征點(diǎn);最后以高斯圖像上的候選特征點(diǎn)為中心向原圖上投影尋找對(duì)應(yīng)的特征點(diǎn)作為最終的尺度不變特征點(diǎn).實(shí)驗(yàn)結(jié)果表明,該算法容易實(shí)現(xiàn)、計(jì)算效率高、抗噪能力強(qiáng).該算法能為后續(xù)視覺(jué)處理提供穩(wěn)定抗噪的尺度不變特征點(diǎn).
關(guān)鍵詞:尺度不變特征; 因果關(guān)系; 重復(fù)率
由于高斯核產(chǎn)生的尺度空間能很好地模擬哺乳動(dòng)物的視覺(jué)生物認(rèn)知,近年來(lái),多尺度理論逐漸成為視覺(jué)領(lǐng)域一個(gè)新興的熱點(diǎn).在前人研究的基礎(chǔ)上,Lowe與他的團(tuán)隊(duì)[1]提出SIFT算子.
SIFT算子被認(rèn)為是綜合性能最好的不變特征變換算子[2]并被國(guó)內(nèi)外學(xué)者廣泛應(yīng)用在不同的領(lǐng)域.文獻(xiàn)[3-4]運(yùn)用該算子實(shí)現(xiàn)目標(biāo)分類(lèi)并應(yīng)用在人臉識(shí)別領(lǐng)域; 文獻(xiàn)[5]融合SIFT特征點(diǎn)與邊緣信息很好地解決圖像局域幾何配準(zhǔn)問(wèn)題; 文獻(xiàn)[6]將SIFT算子應(yīng)用在醫(yī)學(xué)影像光流場(chǎng)配準(zhǔn)并取得很好的效果;文獻(xiàn)[7]則結(jié)合區(qū)域選擇和 SIFT 算法很好地實(shí)現(xiàn)遙感圖像配準(zhǔn).
針對(duì)SIFT算子時(shí)間復(fù)雜度過(guò)高、仿射不變性能不理想、復(fù)雜環(huán)境下誤匹配過(guò)多等問(wèn)題[8],涌現(xiàn)多種改進(jìn)算法.文獻(xiàn)[9]提出的ASIFT(affine sift)算子在SIFT的基礎(chǔ)上加入了相機(jī)的角度參數(shù),大大提高了算法的仿射不變性,但時(shí)間復(fù)雜度成倍地增加;文獻(xiàn)[10]把壓縮感知理論的稀疏特征表示概念引入SIFT算法中,運(yùn)算速度比傳統(tǒng)SIFT算法和幾種改進(jìn)的SIFT算法有明顯提高;文獻(xiàn)[11]采用包括SIFT在內(nèi)的5種特征算子有效提高遙感圖像場(chǎng)景分類(lèi)的精度.
雖然采用不同的方式對(duì)SIFT算法進(jìn)行改進(jìn),但是與原算法一樣,都是通過(guò)遍歷整個(gè)高斯尺度空間獲得尺度不變性的,因此這類(lèi)算法存在兩個(gè)問(wèn)題,一是算法復(fù)雜度比較高;另一個(gè)問(wèn)題就是遍歷所有尺度會(huì)導(dǎo)致小尺度下特征點(diǎn)的抗噪聲能力差,在復(fù)雜環(huán)境下誤匹配率會(huì)大大增加.本文將從尺度空間的本質(zhì)出發(fā),提出一種基于因果關(guān)系的尺度不變特征提取算法,在提高算法效率的同時(shí)增強(qiáng)抗噪能力.
1高斯尺度空間的因果關(guān)系
近年來(lái)Lindeberg的尺度空間理論引起學(xué)者普遍關(guān)注,并在文獻(xiàn)中給出尺度空間的規(guī)范定義,理論證明,尺度空間就是高斯尺度空間.
高斯尺度空間是圖像與參數(shù)不同的高斯核卷積產(chǎn)生的一系列平滑圖像,見(jiàn)圖1.
圖1 Lena圖像的尺度空間表示
因果關(guān)系是高斯尺度空間最重要的屬性之一.在連續(xù)信號(hào)的平滑過(guò)程中表現(xiàn)在極值點(diǎn)不會(huì)增加,而極值點(diǎn)的坐標(biāo)發(fā)生漂移.
尺度空間的n階導(dǎo)數(shù)為?xnL(·;t)=?xn(g(·;t)*f)=g(·;t)*?xnf=0.
(1)
式(1)可看出,尺度的增大不會(huì)增加極值點(diǎn)的數(shù)目但極值點(diǎn)的位置會(huì)隨著g(·;t)的變化而變化.
定義1如果將局部極值看作平滑度的一種度量,那么隨著尺度的增大,尺度空間的極值是非增的且沒(méi)有新的極值產(chǎn)生,這種屬性就稱(chēng)為“尺度空間的因果關(guān)系”.
推理1如果信號(hào)f與尺度為σ1的高斯核卷積后得到尺度空間函數(shù)L1,存在極值點(diǎn)(x1,y1),則對(duì)于任意尺度σ<σ1, f與尺度為σ的高斯核卷積后得到尺度空間函數(shù)L一定存在與(x1,y1)對(duì)應(yīng)的極值點(diǎn)(x,y).
證明由因果關(guān)系的定義,在尺度空間中隨著尺度增大,沒(méi)有新的極值點(diǎn)產(chǎn)生,因此,如果小的尺度σ不存在極值點(diǎn)(x,y),那么在大的尺度σ1下也不會(huì)有新的極值點(diǎn)(x1,y1).
推理2如果在大尺度σ1下尺度空間函數(shù)L1存在極值點(diǎn)(x1,y1),那么所有<σ1的尺度下的尺度空間函數(shù)L中均存在與之對(duì)應(yīng)的極值點(diǎn),在某種意義上說(shuō),極值點(diǎn)(x1,y1)在尺度[0, σ1]的范圍內(nèi)是尺度不變的.
推理3理想情況下,在圖像的高斯尺度空間中,在大尺度σ1下圖像獲得的特征點(diǎn)在小尺度上存在對(duì)應(yīng)特征點(diǎn),在某種意義上說(shuō),該特征點(diǎn)在尺度[0, σ1]的范圍內(nèi)是尺度不變的.
事實(shí)上,由于在離散化過(guò)程中導(dǎo)致的量化誤差,因此圖像領(lǐng)域內(nèi)的這種因果關(guān)系并不是嚴(yán)格的滿(mǎn)足.
2本文方法
2.1尺度不變特征提取
推理3中給出圖像中提取尺度不變特征點(diǎn)的一種方法,只要在大的尺度上獲得的特征點(diǎn),那么該特征點(diǎn)就是在該尺度下是尺度不變的.
設(shè)Xσ為在尺度σ下提取的特征點(diǎn),ησ為在尺度σ下尺度不變特征點(diǎn)集合,那么:
?σ′<σ如果滿(mǎn)足Xσ∈ησ則? Xσ’∈ησ′.
按上面的推理,在尺度空間中提取的特征會(huì)在不同的尺度上重復(fù)出現(xiàn),增加了算法的時(shí)間開(kāi)銷(xiāo),同時(shí)由于小尺度下抗噪能力差,在噪聲環(huán)境下有可能會(huì)出現(xiàn)誤匹配.
然而,隨著尺度的增加,這種特征點(diǎn)的位置會(huì)發(fā)生漂移,因此還需要解決特征點(diǎn)精確位置的問(wèn)題.
圖2是Lena圖像在尺度為2.4的尺度空間圖像中獲得特征點(diǎn)以及在原圖中對(duì)應(yīng)的位置,可以看出,它們發(fā)生了較大的偏移.
(a) 原圖中特征點(diǎn)位置 (b) 大尺度下特征點(diǎn)位置
本文提取的尺度不變特征點(diǎn)分為3個(gè)主要步驟:
1)將尺度參數(shù)σ=1.3的高斯函數(shù)和與原圖像f卷積獲得高斯圖像g;
2)分別在原圖像f與高斯圖像g中提取Harris角點(diǎn)作為候選尺度不變特征點(diǎn);
3)在高斯圖像g中,遍歷每一個(gè)Harris角點(diǎn),以該角點(diǎn)為中心,向原圖像f投影,投影區(qū)域選擇以r為半徑的圓形區(qū)域.針對(duì)原圖f上投影區(qū)域角點(diǎn)的數(shù)目分3種情況進(jìn)行處理:投影區(qū)角點(diǎn)數(shù)為0,則由于量化誤差,該特征點(diǎn)無(wú)效;投影區(qū)角點(diǎn)數(shù)為1,該點(diǎn)即為最終的尺度不變特征點(diǎn);投影區(qū)角點(diǎn)數(shù)>1,分別計(jì)算投影區(qū)每個(gè)角點(diǎn)的h值,選擇與高斯圖像g中對(duì)應(yīng)的投影角點(diǎn)的h值最接近的一個(gè)作為最終的尺度不變特征點(diǎn).
步驟3中的h值為Harris算子,定義如下:
(2)
式中:Ix=?I/?x,Iy=?I/?y.設(shè)M的特征值分別是λ1、λ2,Harris算子h為
(3)
式中:det(M)=λ1×λ2,Tr(M)=λ1+λ2,k為系數(shù),k=0.04~0.06.
上述步驟中有兩個(gè)重要的參數(shù),一個(gè)是高斯核的尺度參數(shù),該參數(shù)選擇過(guò)大將導(dǎo)致圖像的特征點(diǎn)太少,選擇過(guò)小又會(huì)造成抗噪以及尺度不變性能提高不明顯.本文針對(duì)上百幅圖像進(jìn)行實(shí)驗(yàn),發(fā)現(xiàn)當(dāng)σ=1.3時(shí)綜合效果比較理想.另外一個(gè)參數(shù)是投影區(qū)域的投影半徑,參照SIFT算法給出的經(jīng)驗(yàn)值,選取半徑為3倍尺度參數(shù),即4個(gè)像素點(diǎn).
圖3 位置精確的尺度不變特征點(diǎn)提取示意圖
3實(shí)驗(yàn)驗(yàn)證
3.1特征點(diǎn)尺度不變性
尺度不變性要求圖像在不同尺度下提取的特征點(diǎn)不發(fā)生變化,圖4是結(jié)構(gòu)化圖像在不同的尺度下分別采用Harris算子、SIFT (DOG)算子以及本文推薦的算法所提取的特征點(diǎn),可看出,無(wú)論從特征點(diǎn)的數(shù)目還是特征點(diǎn)的位置,本文推薦的算法尺度不變性最好.
圖4 3種算法的尺度不變性比較
可以使用下面的公式測(cè)試不同算法的尺度不變性能:
(6)
式中:R1,2為在原圖中的特征點(diǎn)與變化尺度后獲得的特征點(diǎn)重復(fù)數(shù)量,S1,2獲得的特征點(diǎn)總數(shù),R值表示重復(fù)率.本文針對(duì)65幅自然圖像求取R值,最后取平均值進(jìn)行統(tǒng)計(jì),在不同尺度下重復(fù)率曲線見(jiàn)圖5.
由于只在大尺度下提取圖像的特征點(diǎn),降低時(shí)間復(fù)雜度,本文算法與SIFT算法提取特征點(diǎn)所消耗的時(shí)間比較見(jiàn)表1.
圖5 3種方法重復(fù)率與尺度之間的關(guān)系
尺度SIFT消耗時(shí)間/s本文算法消耗時(shí)間/s1.02.26330.33601.52.77280.32812.03.23540.31102.53.66100.31003.04.12000.31023.54.59150.3089
從表1可看出,本文推薦算法重復(fù)率優(yōu)于SIFT算法,計(jì)算效率也大大優(yōu)于后者,而且隨尺度增加,特征點(diǎn)個(gè)數(shù)減少,所消耗的時(shí)間也隨之下降.另外,本文推薦的算法是基于Harris算子的,因此也具備Harris算子的旋轉(zhuǎn)不變性與平移不變性,其中旋轉(zhuǎn)不變性效果見(jiàn)圖6.
(a) 原圖像 (b) 旋轉(zhuǎn)圖像
3.2抗噪效果
本文推薦的算法是在大尺度下提取的特征點(diǎn),因此具有較強(qiáng)的抗噪能力.圖7是在增加椒鹽噪聲情況下提取特征點(diǎn)的效果,最左邊的圖像是3種算法對(duì)原圖的特征點(diǎn)提取效果,中間的圖像為增加參數(shù)為0.01的椒鹽噪聲提取的特征點(diǎn)效果,最右側(cè)的圖像為增加參數(shù)為0.02的椒鹽噪聲提取的特征點(diǎn)效果,效果顯示,Harris的抗噪能力極差,SIFT算子的抗噪能力較好,本文推薦的算法抗噪效果最好.
圖7 非結(jié)構(gòu)目標(biāo)特征提取效果比較
3.3復(fù)雜環(huán)境下特征點(diǎn)的提取
在復(fù)雜的環(huán)境下,如海底,往往存在許多噪聲.機(jī)器人在海底實(shí)現(xiàn)對(duì)目標(biāo)的定位抓取是目前海底視覺(jué)應(yīng)用的一個(gè)熱點(diǎn),而獲得穩(wěn)定特征點(diǎn)是實(shí)現(xiàn)海底目標(biāo)定位的關(guān)鍵.圖8(a)是一幅海底礦物圖像,從圖中可發(fā)現(xiàn)存在許多的浮游生物與海底灰塵對(duì)圖像造成干擾.分別采用Harris算子,SIFT算子以及本文推薦的算子提取目標(biāo)特征點(diǎn),獲得的效果見(jiàn)圖8(b)~(d).
圖8 海底圖像特征提取
在實(shí)驗(yàn)室環(huán)境下,Harris算子耗時(shí)0.265 0 s,提取748個(gè)特征點(diǎn);SIFT算子耗時(shí)37.59 s,提取563個(gè)特征點(diǎn);本文推薦的算法提取163個(gè)特征點(diǎn),耗時(shí)0.854 3 s.從提取效果看,本文推薦算法提取的特征點(diǎn)最穩(wěn)定;從實(shí)驗(yàn)數(shù)據(jù)看,本文推薦算法在時(shí)間上接近Harris算子.因此在復(fù)雜的環(huán)境下,本文推薦的算法綜合性能最好,雖然提取的特征點(diǎn)數(shù)目不多,但是許多情況下并不需要太多的特征點(diǎn)數(shù)目,如基于雙目視覺(jué)的目標(biāo)定位與三維重建等.
本文所有實(shí)驗(yàn)均在以下環(huán)境下進(jìn)行:
操作系統(tǒng)為Windows XP, CPU為酷睿i5,內(nèi)存為2 G.
4結(jié)論
目前的尺度不變特征提取大多是基于尺度空間的,典型的如SIFT算法族,由此帶來(lái)了算法復(fù)雜,抗噪能力不強(qiáng)等弊端.本文提出尺度不變特征提取算法從高斯尺度的因果關(guān)系出發(fā),采用從上向下投影的方法實(shí)現(xiàn)像素點(diǎn)坐標(biāo)的精確定位.實(shí)驗(yàn)結(jié)果證明,本文推薦的算法具有較低的時(shí)間復(fù)雜度與較強(qiáng)的抗噪能力.適合對(duì)算法實(shí)時(shí)性比較高而對(duì)特征點(diǎn)提取數(shù)量要求不高的復(fù)雜環(huán)境,如在線全景圖像拼接,基于8點(diǎn)基本矩陣的實(shí)時(shí)目標(biāo)定位與三維目標(biāo)重建等.
雖然本文算法提出了一種可靠的尺度不變特征提取算法,但是由于沒(méi)有遍歷整個(gè)尺度,因此要實(shí)現(xiàn)機(jī)器視覺(jué)的后續(xù)相關(guān)任務(wù)還需要獲得圖像的局部特征尺度,特征尺度可以用來(lái)表征特征點(diǎn)的鄰域獨(dú)特性,根據(jù)視覺(jué)理論,也就是區(qū)域的不可預(yù)見(jiàn)性.目前已有許多成熟的算法,如T Kadir 提出的基于熵極值法等,但這些算法大多基于各向同性的算子,會(huì)導(dǎo)致仿射不變性較差.如何找到高效的各向異性局部特征尺度算子是本文下一步工作的重點(diǎn).
參考文獻(xiàn)
[1] LOWE D G. Distinctive image features from scale-invariant keypoints [J].International Journal of Computer Vision, 2004, 60(2):91-110.
[2] JUAN L, GWUN O, JUAN L, et al. A Comparison of SIFT, PCA-SIFT and SURF [J]. International Journal of Image Processing, 2009, (4):143-152.
[3] SANCHO M, LOWE D G. Local naive bayes nearest neighbor for image classification[C]//Proceedings of Computer Vision and Pattern Recognition (CVPR) 2012. Rhode Island, USA: IEEE, 2012:3650-3656.
[4] KRIZAJ J, STRUC V, PAVESIC N.Adaptation of SIFT features for face recognition under varying illumination[C]//Proceedings of the 33rd International Convention 2010.Opatija, Croatia: IEEE, 2010: 691-694.
[5] 孫統(tǒng)風(fēng),丁世飛.基于改進(jìn)尺度不變特征的圖像局域幾何配準(zhǔn)研究[J]. 計(jì)算機(jī)科學(xué), 2014, 41(1): 111-115.
[6] 于文勇, 康曉東, 葛文杰等. 結(jié)合拓?fù)浼y理圖像局部不變特征的醫(yī)學(xué)影像光流場(chǎng)配準(zhǔn)[J].計(jì)算機(jī)應(yīng)用, 2014,(S1):206-210.
[7] 樊東昊,朱建軍,郭南男,等. 一種結(jié)合區(qū)域選擇和SIFT算法的遙感圖像配準(zhǔn)方法準(zhǔn)[J].工程勘察, 2015, 43(2):69-74.
[8] 劉立,詹茵茵,羅揚(yáng),劉朝暉,彭復(fù)員.尺度不變特征變換算子綜述[J].中國(guó)圖象圖形學(xué)報(bào),2013,18(8):885-892.
[9] MOREL J, YU G. ASIFT: A New framework for fully affine invariant image comparison [J].Siam Journal on Imaging Sciences, 2009, 2(2):438-469.
[10]楊颯, 楊春玲. 基于壓縮感知與尺度不變特征變換的圖像配準(zhǔn)算法[J]. 光學(xué)學(xué)報(bào), 2014, 34(11): 1-5.
[11]徐侃, 陳麗君, 楊文, 等. 利用特征選擇的遙感圖像場(chǎng)景分類(lèi)[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào), 2011, 43(9): 117-121.
(編輯王小唯苗秀芝)
A new approach for scale invariant features detection
LIU Li, LUO Yang, WANG Linxia, LIU Fangju, LI Quan
(School of Computer Science and Technology, University of South China, 421001 Hengyang, Hunan, China)
Abstract:To resolve the problems of high computational complexity, low anti-noise ability and the drifting of pixel position, a scale invariant feature algorithm based on causality is proposed in this paper. Firstly the Gauss smoothing image is built up by Gaussian convolution with the original image. Then, the Harris corners are extracted as candidate features both in the original and the Gauss image. Finally, the stable scale invariant features are acquired by projection from the original image to the Gauss image. The experimental results indicate that this algorithm is concise, fast, efficient with strong anti-noise ability, and provides a basis for subsequent visual processing.
Keywords:the scale invariant features; causality; repeatability
中圖分類(lèi)號(hào):TP751
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):0367-6234(2016)05-0085-05
通信作者:羅揚(yáng), liuleelap@163.com.
作者簡(jiǎn)介:劉立(1971—),男,博士,碩士生導(dǎo)師.
基金項(xiàng)目:湖南省自然科學(xué)基金(13JJ9008).
收稿日期:2015-01-15.
doi:10.11918/j.issn.0367-6234.2016.05.013