宋俊芳 聞江
摘 要:局部圖像特征描述是計(jì)算機(jī)視覺(jué)的一個(gè)基本研究問(wèn)題,在尋找圖像中的對(duì)應(yīng)點(diǎn)以及物體特征描述中有著重要的作用。本文簡(jiǎn)要介紹在機(jī)器視覺(jué)發(fā)展過(guò)程中常用的圖像特征點(diǎn)描述子,并展示各特征描述子在同一圖片中的檢測(cè)結(jié)果,分析它們的特點(diǎn)及優(yōu)缺點(diǎn)。
關(guān)鍵詞:計(jì)算機(jī)視覺(jué);特征點(diǎn)描述子;檢測(cè)結(jié)果
中圖分類(lèi)號(hào): TP391.4 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1673-1069(2016)21-158-2
0 引言
圖像特征點(diǎn)描述子是很多實(shí)際應(yīng)用的基礎(chǔ),在多幅圖像的配準(zhǔn)利用多幅二維圖像進(jìn)行三維重建、恢復(fù)場(chǎng)景三維結(jié)構(gòu),這些應(yīng)用在建立圖像之間點(diǎn)與點(diǎn)之間的對(duì)應(yīng)關(guān)系通常都依賴于一個(gè)優(yōu)秀的局部圖像特征點(diǎn)描述子。尤其是近年來(lái)對(duì)復(fù)雜場(chǎng)景沖目標(biāo)跟蹤的應(yīng)用中,基于目標(biāo)圖像特征點(diǎn)的跟蹤能夠有效解決目標(biāo)被遮擋、形變等比較復(fù)雜的情況,受到越來(lái)越多研究者的關(guān)注。
1 第一類(lèi)圖像特征點(diǎn)描述子
1.1 SIFT
SIFT(尺度不變特征轉(zhuǎn)換),此算法由David Lowe在1999年所發(fā)表,2004年完善總結(jié)。是一種計(jì)算機(jī)視覺(jué)的算法,用來(lái)偵測(cè)與描述影像中的局部性特征,它在空間尺度中尋找極值點(diǎn),并提取出其位置、尺度、旋轉(zhuǎn)不變量。自它提出以來(lái),很快在物體識(shí)別、寬基線圖像匹配、三維重建、圖像檢索中得到了應(yīng)用,局部圖像特征描述子在計(jì)算機(jī)視覺(jué)領(lǐng)域內(nèi)也得到了更加廣泛的關(guān)注,涌現(xiàn)了一大批各具特色的局部圖像特征描述子。
1.2 SURF
SURF(加速穩(wěn)健特征)是Hebert Bay在ECCV2006年提出的SIFT算法加速版,在適中的條件下完成兩幅圖像中物體的匹配基本實(shí)現(xiàn)了實(shí)時(shí)處理。它的速度是SIFT的3-7倍,大部分情況下它和SIFT的性能相當(dāng),因此它在很多應(yīng)用中得到了應(yīng)用,尤其是對(duì)運(yùn)行時(shí)間要求高的場(chǎng)合。
1.3 BRISK/SBRISK
BRISK(二進(jìn)制魯棒的不變尺度關(guān)鍵點(diǎn)),是ICCV2011年提出的圖像特點(diǎn)點(diǎn)描述子,2014年提出加速版SBRISK。它具有較好的旋轉(zhuǎn)不變性、尺度不變性及魯棒性。在對(duì)有較大模糊的圖像配準(zhǔn)時(shí),BRISK算法在其中表現(xiàn)最為出色。
1.4 KAZE/AKAZE
KAZE是ECCV2012提出的一種比SIFT更穩(wěn)定的特征檢測(cè)算法,KAZE的取名是為了紀(jì)念尺度空間分析的開(kāi)創(chuàng)者——日本學(xué)者Iijima。KAZE是日語(yǔ)‘風(fēng)的諧音,寓意是就像風(fēng)的形成是空氣在空間中非線性的流動(dòng)過(guò)程一樣,KAZE特征檢測(cè)是在圖像域中進(jìn)行非線性擴(kuò)散處理的過(guò)程。AKAZE 是加速版KAZE特征,即Accelerated KAZE Features。
1.5 檢測(cè)結(jié)果
其中,圖1左上角原圖為1920*1080的高清圖像,從檢測(cè)結(jié)果可以看出,第一類(lèi)圖像特征點(diǎn)描述子中,BRISK是速度最快的,在時(shí)間效率上依次是BRISK>SURF> AKAZE>SIFT>KAZE,SURF則是特征點(diǎn)最豐富的。
2 第二類(lèi)圖像特征點(diǎn)描述子
2.1 MSER
MSER(最大穩(wěn)定極值區(qū)域)是一種用于在圖像中進(jìn)行斑點(diǎn)檢測(cè)的方法。這個(gè)方法由Matas等人于BMVC2002年提出,用于在兩個(gè)不同視角的圖片中尋找對(duì)應(yīng)關(guān)系。這種方法從圖像中提取全面的元素對(duì)應(yīng)關(guān)系,有助于寬基線匹配,以及更好的立體匹配和物體識(shí)別算法。該特征點(diǎn)描述子在具有相同閾值范圍內(nèi)所支持的區(qū)域才會(huì)被選擇;無(wú)需任何平滑處理就可以實(shí)現(xiàn)多尺度檢測(cè),即小的和大的結(jié)構(gòu)都可以被檢測(cè)到。
2.2 ORB/ORBSLAM
ORB(ORiented Brief)是ICCV2011年提出的新的特征點(diǎn)描述子, 它是在BRIEF基礎(chǔ)上引入了方向的計(jì)算方法,并在點(diǎn)對(duì)的挑選上使用貪婪搜索算法,挑出了一些區(qū)分性強(qiáng)的點(diǎn)對(duì)用來(lái)描述二進(jìn)制串。主要解決了BRIEF在噪聲敏感、旋轉(zhuǎn)不變性方面的問(wèn)題。BRIEF (Binary Robust Independent Elementary Features) 則是ECCV2010年提出,利用局部圖像鄰域內(nèi)隨機(jī)點(diǎn)對(duì)的灰度大小關(guān)系來(lái)建立局部圖像特征描述子,得到的二值特征描述子不僅匹配速度快,而且存儲(chǔ)要求內(nèi)存低,因此手機(jī)應(yīng)用中具有很好的應(yīng)用前景。優(yōu)點(diǎn)在于速度,缺點(diǎn)也相當(dāng)明顯:不具備旋轉(zhuǎn)不變性;對(duì)噪聲敏感;不具備尺度不變性。ORBSLAM是2015年提出的比較完備的單目slam算法,主要是一個(gè)基于特征點(diǎn)地圖的應(yīng)用。它對(duì)關(guān)鍵幀做了半稠密場(chǎng)景重建。
2.3 檢測(cè)結(jié)果
檢測(cè)結(jié)果顯示,MSER、ORB特征描述子均有很高的檢測(cè)效率,相對(duì)于第一類(lèi)特征描述子,更容易滿足對(duì)于實(shí)時(shí)性要求高的應(yīng)用,在特定的場(chǎng)合應(yīng)用中,這兩類(lèi)描述子應(yīng)用廣泛,例如在點(diǎn)匹配的目標(biāo)跟蹤上,由于幀率的高速,目標(biāo)在當(dāng)前幀和下一幀中的尺度變化很小,利用ORB特征點(diǎn)來(lái)實(shí)現(xiàn)跟蹤相對(duì)于其它所有特征點(diǎn)來(lái)說(shuō),具有不容忽視的巨大優(yōu)勢(shì)。
3 第三類(lèi)圖像特征點(diǎn)描述子
3.1 第三類(lèi)特征點(diǎn)描述子總述
第三類(lèi)特征點(diǎn)是一些不具有尺度變換或方向變換不變性的描述子,它們主要1994年提出的GFTT(Good Features To Track)、2006年FAST(Features From Accelerated Segment Test)、2008年Star,以及SimpleBlob特征點(diǎn)描述子等等。它們的提出時(shí)間都較早,隨著對(duì)圖像特征點(diǎn)描述子研究的深入,不少研究者在此基礎(chǔ)上不斷改良這些特征描述,提高它們的功能。當(dāng)然,計(jì)算的時(shí)間復(fù)雜度也隨之提高,在具體表現(xiàn)上,性能仍不及上述的第一類(lèi)、第二類(lèi)描述子。不過(guò)值得注意的是,它們的優(yōu)勢(shì)主要體現(xiàn)在運(yùn)算速度上,在先驗(yàn)知識(shí)比較豐富的具體應(yīng)用中,這些圖像特征描述子在時(shí)間效率上往往占有極大優(yōu)勢(shì)。
3.2 檢測(cè)結(jié)果
圖2檢測(cè)結(jié)果顯示,F(xiàn)AST特征點(diǎn)檢測(cè)速度快,且數(shù)量豐富,SimpleBlob則數(shù)量稀少。GFTT以及STAR速度快,在特征點(diǎn)的跟蹤上有著極好的性能。
4 總結(jié)
在實(shí)際應(yīng)用中,根據(jù)不同場(chǎng)景的具體情況,不同的特征點(diǎn)都有不同的優(yōu)勢(shì),例如第一類(lèi)圖像特征點(diǎn)描述子在對(duì)精度要求較高而不要求實(shí)時(shí)性的要求中表現(xiàn)出極好的性能;第二類(lèi)特征描述子則在特定場(chǎng)合能夠很好的協(xié)調(diào)精度與速度之間的關(guān)系;而第三類(lèi)特征描述子則主要在時(shí)間效率上占有極大優(yōu)勢(shì),適合于對(duì)實(shí)時(shí)性要求較高的場(chǎng)景應(yīng)用。隨著研究的不斷深入,已有的圖像特征點(diǎn)描述子不斷的被改良,新的圖像特征點(diǎn)描述子也不斷被提出,在實(shí)際應(yīng)用中也發(fā)揮著越來(lái)越重要的作用。