楊真真,匡 楠,楊永鵬,許鵬飛
(1.南京郵電大學(xué) 通信與網(wǎng)絡(luò)技術(shù)國家工程研究中心,江蘇 南京 210003 2.南京信息職業(yè)技術(shù)學(xué)院 網(wǎng)絡(luò)與通信學(xué)院,江蘇 南京 210023)
圖像配準(zhǔn)[1]是指同一目標(biāo)的兩幅或者兩幅以上的圖像在空間位置的對準(zhǔn)。目前,圖像配準(zhǔn)作為圖像處理的基本步驟,已被廣泛應(yīng)用于醫(yī)學(xué)圖像拼接與融合[2]、目標(biāo)檢測 與定位[3]、圖像分割[4]等領(lǐng)域。
主流的圖像配準(zhǔn)方法分為兩類,基于待配準(zhǔn)圖像全像素信息[5-7]的配準(zhǔn)方法以及基于待配準(zhǔn)圖像特征信息[8-10]的配準(zhǔn)方法。其中,基于待配準(zhǔn)圖像像素信息的配準(zhǔn)方法以圖像全體像素信息為依據(jù),建立待配準(zhǔn)圖像和參考圖像之間的相似性度量準(zhǔn)則,利用某種搜索算法,尋找出使得相似度量達(dá)到最優(yōu)值的變換模型參數(shù);基于待配準(zhǔn)圖像特征信息的配準(zhǔn)方法只需要提取待配準(zhǔn)圖像中的點(diǎn)、線、邊緣等特征信息,不需要其他輔助信息,在減少計(jì)算量、提高效率的同時(shí),能夠?qū)D像灰度的變化有一定的魯棒性。根據(jù)選擇的特征信息不同,把基于特征的圖像配準(zhǔn)方法分為三類:(1)基于特征點(diǎn)的配準(zhǔn)[11-12]:一般所選取的特征點(diǎn)是相對于其鄰域表現(xiàn)出來具有某種奇異性的像素點(diǎn)。特征點(diǎn)往往很容易被提取到,但是特征點(diǎn)所包含的信息相對較少,只能反映出其在圖像中的位置坐標(biāo)信息,所以在兩幅圖像中尋找匹配的特征點(diǎn)是關(guān)鍵所在;(2)基于特征區(qū)域的配準(zhǔn)[13-14]:在圖像中尋找某些明顯的區(qū)域信息作為特征區(qū)域,然而在實(shí)際應(yīng)用中尋找到特征區(qū)域后,采用最多的還是區(qū)域的形心點(diǎn),所以這類算法要求特征區(qū)域提取的精度要非常高;(3)基于特征邊緣的配準(zhǔn)[15-16]:圖像中最明顯的特征就是邊緣,而邊緣特征也是最好提取的特征之一。因此給予邊緣的匹配方法魯棒性較強(qiáng),適用范圍很廣,但這類方法對特征邊緣的提取要求很高,并且要求邊緣信息全部用數(shù)學(xué)語言予以表述也較為困難。
總的來說,基于待配準(zhǔn)圖像整體像素信息的配準(zhǔn)方法精度更高,但計(jì)算復(fù)雜度高,對圖像的灰度變化敏感,抗噪性能較差;基于待配準(zhǔn)圖像特征信息的配準(zhǔn)方法計(jì)算復(fù)雜度相對較低,但配準(zhǔn)性能的好壞很大程度依賴于特征匹配的精度。
本文所采用的配準(zhǔn)方法是基于特征點(diǎn)描述子的配準(zhǔn)方法,該方法通常需要以下四個(gè)步驟:(1)提取圖像中的特征點(diǎn):特征點(diǎn)從總體上說是在圖像領(lǐng)域或視覺領(lǐng)域中一些有別于其周圍的地方,具有很高的區(qū)分度,應(yīng)當(dāng)具有可重復(fù)性、可區(qū)分性、準(zhǔn)確性、有效性(特征的數(shù)量、特征提取的效率)、魯棒性(穩(wěn)定性、不變性)。常見的特征點(diǎn)提取方法有尺度不變特 征 變 換 (Scale-Invariant Feature Transform,SIFT)[17]、加速分割檢測特征(Features from Accelerated Segment Test,F(xiàn)AST)[18]和 加 速 魯 棒 性 特 征(Speeded Up Robust Features,SURF)[19]等。(2)計(jì)算特征描述子:該步驟旨在對上述檢測的特征點(diǎn)進(jìn)行描述,通常對每個(gè)特征點(diǎn)采用一維向量進(jìn)行特征描述,描述子的選取直接決定了圖像匹配及配準(zhǔn)的性能。(3)根據(jù)特征描述子,進(jìn)行點(diǎn)對點(diǎn)匹配:根據(jù)某種搜索算法,確定點(diǎn)與點(diǎn)之間的最優(yōu)匹配。常見的匹配算法有基于閾值[20]、基于最近鄰[21]、基于距離比例最近鄰[22]等。(4)根據(jù)匹配點(diǎn)對估計(jì)圖像的變換矩陣:由于可能存在大量誤匹配對,故在進(jìn)行估計(jì)圖像變換矩陣之前,有必要根據(jù)某種準(zhǔn)則進(jìn)行誤匹配點(diǎn)對刪除。譬如,使用基于隨機(jī)采樣一致性(Random Sample Consensus,RANSAC)[23]算法來去除誤匹配特征點(diǎn)對往往效果較好。此外,良好的估計(jì)算法一定程度上也對圖像配準(zhǔn)精度產(chǎn)生一定影響。
為了解決基于特征點(diǎn)描述子配準(zhǔn)方法的精度及魯棒性差等問題,從特征描述子入手,以期改善其性能。
特征描述子的核心問題是不變性和可區(qū)分性。在配準(zhǔn)中使用圖像特征描述子時(shí),通常是為了魯棒地處理各種圖像變換的情況。因此,在構(gòu)建描述子時(shí)需考慮尺度不變性、旋轉(zhuǎn)不變性、平移不變性以及對噪聲的不變性。此外,對于除了特定任務(wù)中特征描述子需考慮的不變性外,其他性質(zhì)需盡可能有區(qū)分性。譬如,在圖像配準(zhǔn)中,需要對參考圖像及浮動(dòng)圖像中特征點(diǎn)進(jìn)行匹配,此時(shí)不對應(yīng)特征點(diǎn)描述內(nèi)容需盡可能不一致,同時(shí)保證對應(yīng)特征點(diǎn)描述內(nèi)容一致。然而,特征描述子的可區(qū)分性的強(qiáng)弱往往和其不變性是矛盾的,一個(gè)優(yōu)秀的特征描述子,需保證在特定任務(wù)中要求的特征描述不變性,同時(shí)具有很強(qiáng)的區(qū)分度。SURF[19]統(tǒng)計(jì)特征點(diǎn)圓形鄰域的haar小波[24]特征,該描述子通過構(gòu)建尺度空間及確定特征主方向來保證描述子的旋轉(zhuǎn)不變性和尺度不變性,是一種性能優(yōu)異的描述子。蜘蛛網(wǎng)局部圖像特征(Spider Local Image Feature,SLIF)[25]是一種根據(jù)仿生學(xué)原理提出的描述子,該描述子在不增加計(jì)算量的同時(shí),采樣面積更大,且其采樣范圍和采樣點(diǎn)數(shù)(密度)根據(jù)實(shí)際情況可調(diào),其采樣模型十分具有借鑒意義。
本文充分考慮了SLIF描述子采樣模型的優(yōu)勢,將其用于所提方法的采樣模型結(jié)構(gòu)。同時(shí),由于圖像配準(zhǔn)要求其特征點(diǎn)匹配的精度更高,對其描述子從鄰域結(jié)構(gòu)及描述方式兩個(gè)方向進(jìn)行改進(jìn),以期獲得更好的特征點(diǎn)匹配及圖像配準(zhǔn)效果。在使用SLIF采樣結(jié)構(gòu)基礎(chǔ)之上,增加了方形、環(huán)形、徑向鄰域信息的描述,對圖像空間結(jié)構(gòu)信息的捕捉能力大大增強(qiáng);此外,不同于SLIF描述子構(gòu)建方法,本文利用局部區(qū)域內(nèi)物體灰度值具有自相似性的特征構(gòu)建描述方法,并引入局部圖像鄰域的標(biāo)準(zhǔn)差作為判斷自相似性的自適應(yīng)閾值。
蜘蛛網(wǎng)局部圖像特征(SLIF)描述子是一種具有尺度和旋轉(zhuǎn)不變性的描述子,該方法的提出者根據(jù)仿生學(xué)原理提出了一種新型鄰域采樣結(jié)構(gòu),在特征點(diǎn)匹配的精度上卓有成效。
SLIF采樣模型如圖1所示,圖示坐標(biāo)點(diǎn)以(n,m)表示,其中n代表采樣模型的螺旋線狀坐標(biāo)位置,m代表采樣模型的徑向坐標(biāo)位置。
其節(jié)點(diǎn)在笛卡爾坐標(biāo)系下的表示如下
其中,M和N分別為最大徑向采樣點(diǎn)數(shù)和最大螺旋線上采樣點(diǎn)數(shù),需人工指定;坐標(biāo)向量的第一維為橫坐標(biāo),第二維為縱坐標(biāo)。
其中,xi和yi分別為特征點(diǎn)(描述子中心)橫坐標(biāo)和縱坐標(biāo),即檢測出的特征點(diǎn)位置;σi為特征點(diǎn)尺度因子,該因子由特征點(diǎn)檢測算法提供;θi為特征點(diǎn)方向因子,該因子可由特征點(diǎn)檢測算法提供,亦可根據(jù)文獻(xiàn)[25]所提供方法獲得;K>0為一個(gè)可調(diào)自由變量,該變量決定了特征描述子的作用范圍。
SLIF采用一種新型的鄰域采樣模型構(gòu)建了一種具有旋轉(zhuǎn)和尺度不變性的描述子,在圖像匹配領(lǐng)域性能優(yōu)良,但是由于其描述子從局部來講為8鄰域的LBP描述子,存在對噪聲敏感、無法捕捉宏觀信息等問題,故將其用于圖像配準(zhǔn)領(lǐng)域仍存在一定缺陷。本文從描述子構(gòu)建方法對其做了相應(yīng)改進(jìn),能夠同時(shí)整合宏觀信息和微觀信息,使其在相同配準(zhǔn)框架下配準(zhǔn)精度顯著提高。
為了能夠捕捉采樣模型的整體采樣節(jié)點(diǎn)信息,首先構(gòu)建一個(gè)基于全局標(biāo)準(zhǔn)差的鄰域描述方法,其公式如下所示
為了能夠捕捉采樣模型的徑向采樣節(jié)點(diǎn)信息,構(gòu)建一個(gè)基于徑向標(biāo)準(zhǔn)差的徑向鄰域描述方法,其公式如下
為了能夠捕捉采樣模型的環(huán)形采樣節(jié)點(diǎn)信息,構(gòu)建一個(gè)基于環(huán)形標(biāo)準(zhǔn)差的環(huán)形鄰域描述方法,其格式如下
首先,說明SLIF描述子構(gòu)建方法存在的缺陷,圖2闡述了式(3)的描述子構(gòu)建方法。
該描述方法試圖利用中心點(diǎn)與鄰域像素點(diǎn)大小關(guān)系構(gòu)建中心點(diǎn)特征值,能夠很好地捕捉區(qū)域內(nèi)與中心點(diǎn)像素值差異較大的像素點(diǎn)信息。但是,大多數(shù)圖像的鄰域像素值往往與中心點(diǎn)像素值差異不大,具有區(qū)域塊的自相似性。此時(shí),若采用中心點(diǎn)與鄰域像素點(diǎn)大小關(guān)系構(gòu)建中心點(diǎn)特征值,其描述方法顯得十分不合理。其次,該描述方法很大程度依賴于中心點(diǎn)像素值,若中心點(diǎn)像素值受噪聲干擾或其描述領(lǐng)域有光照不均勻等環(huán)境噪聲,其偏差較大,此時(shí)若有一個(gè)自適應(yīng)的誤差調(diào)整項(xiàng)顯得十分必要。
因此,結(jié)合如上描述方法的優(yōu)缺點(diǎn),采用基于全局標(biāo)準(zhǔn)差的鄰域描述、基于徑向標(biāo)準(zhǔn)差的徑向鄰域描述和基于環(huán)形標(biāo)準(zhǔn)差的環(huán)形鄰域描述方法重構(gòu)采樣點(diǎn)描述方法,下面分別以圖示的方式闡述式(5)、式(7)和式(9)的描述子構(gòu)建方法。
圖3~5分別直觀展示了式(5)、式(7)和式(9)所示方法。圖3(a)為鄰域范圍內(nèi)原始圖像像素大??;圖3(b)為鄰域像素與其中心像素的絕對值之差;圖3(c)為根據(jù)閾值最終形成的二值化序列。圖3(b)→圖3(c)的閾值為圖3(a)中全體像素點(diǎn)計(jì)算而得的標(biāo)準(zhǔn)差。圖3(c)的二值化序列由中心點(diǎn)鄰域范圍內(nèi)左上角按順時(shí)針方向組成,記pw()為25((00011001)2→(25)10);圖4(c)的二值化序列自底向上組成,記pr(xin,m)為152((10011000)2→(152)10);圖5(c)的二值化序列由中心點(diǎn)逆時(shí)針方向第5個(gè)點(diǎn)起按順時(shí)針方向形成,記pc(xin,m)為145((10010001)2→(145)10)。最終一個(gè)特征點(diǎn)在圓蛛網(wǎng)狀采樣模型下從三種不同結(jié)構(gòu)狀態(tài)得以描述。
提出的描述子相較于SLIF描述子具有如下優(yōu)勢:(1)在圓蛛網(wǎng)狀采樣模型下,從三種不同鄰域采樣模型對采樣點(diǎn)周圍像素信息加以描述。相較于SLIF僅從采樣點(diǎn)周圍8鄰域范圍內(nèi)像素信息進(jìn)行編碼描述,提出的描述子還從采樣點(diǎn)在圓蛛網(wǎng)狀模型范圍內(nèi)環(huán)形像素點(diǎn)及徑向像素點(diǎn)加以描述,其描述內(nèi)容更加豐富;(2)使用中心采樣點(diǎn)與其周圍采樣點(diǎn)差分像素值的一致性對其鄰域進(jìn)行描述。相較于SLIF描述子僅僅考慮周圍采樣點(diǎn)與中心采樣點(diǎn)的大小關(guān)系來構(gòu)建描述,提出的方法更多地考慮了區(qū)域范圍內(nèi)像素信息的一致性與不一致性的區(qū)分度,即自相似性。該性質(zhì)符合大多數(shù)圖像存在的一致性,即圖像中同一物體往往具有相似甚至相同的像素值;(3)使用標(biāo)準(zhǔn)差做自適應(yīng)閾值作為二值化編碼描述子的判斷條件。相較于SLIF描述子僅僅依照中心采樣點(diǎn)與其周圍采樣點(diǎn)差分像素值是否大于或者小于0作為二值化編碼描述子的判斷條件,提出利用參與編碼的采樣點(diǎn)標(biāo)準(zhǔn)差作為判斷鄰域采樣點(diǎn)是否與中心采樣點(diǎn)滿足自相似性來構(gòu)建描述子。該閾值的設(shè)計(jì)根據(jù)周圍像素點(diǎn)一致性情況(標(biāo)準(zhǔn)差能很好地反映樣本的一致性信息)來自適應(yīng)調(diào)節(jié)一致性標(biāo)準(zhǔn)。若樣本范圍內(nèi)標(biāo)準(zhǔn)差過大,則適當(dāng)放寬一致性標(biāo)準(zhǔn)。該設(shè)計(jì)也是符合視覺直覺的,雖然圖像中物體的像素信息較為相似,但很少完全一致,即使完全一致,由于光照不均勻等環(huán)境噪聲的存在,其拍攝的圖像也會(huì)存在局部色差。故該設(shè)計(jì)增強(qiáng)了描述子的魯棒性。
此外,在設(shè)計(jì)過程中也汲取了SLIF描述子的優(yōu)點(diǎn),在采樣點(diǎn)數(shù)相同的情況下,其圓蛛網(wǎng)狀采樣模型采樣鄰域更廣;其次,該采樣模型的采樣范圍、采樣點(diǎn)數(shù)都是可調(diào)的,以適應(yīng)不同場景的要求(式(2)的參數(shù)K調(diào)節(jié)采樣范圍,M、N調(diào)節(jié)采樣點(diǎn)的個(gè)數(shù))。
為了測試提出的描述子在特征提取及配準(zhǔn)方面有較好的性能,設(shè)計(jì)了如下實(shí)驗(yàn)來證明其有效性。
為了證明所提描述方法在基于特征提取配準(zhǔn)方法中有更好的精度,將本文提出的描述方法與SLIF描述子和SURF描述子作對比。不同描述子所采用的特征提取方法及特征匹配準(zhǔn)則有差異??紤]到實(shí)驗(yàn)的公平性,均采用SURF特征點(diǎn)提取方法及最近鄰匹配準(zhǔn)則且不采用誤匹配點(diǎn)消除策略。其中,本文方法所采用的參數(shù)為:K=10,M=0,N=9,SLIF及SURF描述子均采用默認(rèn)參數(shù)。
特征描述及配準(zhǔn)圖像來自于RIRE[26]中patient-001 CT大腦切片圖像,對圖像分別進(jìn)行了旋轉(zhuǎn)及平移變換。其中,表1為旋轉(zhuǎn)圖像描述子性能比較,其測試的旋轉(zhuǎn)的范圍為[-30°,30°](旋轉(zhuǎn)中心為圖像中心點(diǎn))。表2為平移圖像描述子性能比較,其測試的水平方向及垂直方向位移范圍均為[-20,20]像素。表1、表2所示評估指標(biāo)均為選取12組隨機(jī)值進(jìn)行測試的平均值。
表1測試了本文提出的描述子在旋轉(zhuǎn)圖像上特征描述及配準(zhǔn)的性能。從表1可發(fā)現(xiàn),本文算法的平均召回率為0.492,比SLIF高0.017;與此同時(shí),其平均錯(cuò)誤率為0.022,遠(yuǎn)低于其他算法。由于根據(jù)本文提出的描述子得到的匹配特征點(diǎn)誤差較小,故得到的配準(zhǔn)圖像角度偏差也優(yōu)于SLIF??梢?,本文提出的描述子在旋轉(zhuǎn)圖像上的性能優(yōu)于SLIF及SURF。
表1 旋轉(zhuǎn)圖像描述子性能比較
表2測試了本文提出的描述子在平移圖像上特征描述及配準(zhǔn)的性能。從表2可發(fā)現(xiàn),三種算法的召回率相似,但本文算法的特征點(diǎn)匹配的平均錯(cuò)誤率最低,為0.022。與此同時(shí),經(jīng)本文提出的描述子配準(zhǔn)的水平方向及垂直方向誤差均為最低。可見,本文提出的描述子在平移圖像上的性能也優(yōu)于SLIF和SURF。
表2 平移圖像描述子性能比較
為了證明所提出的描述方法對噪聲具有良好的魯棒性,且其具有媲美全像素配準(zhǔn)方法的精度,選取了基于全像素誤差平方和(Sum of Squared Differences,SSD)配準(zhǔn)方法[27-28]以及基于全像素互相關(guān)(Cross Correlation,CC)配準(zhǔn)方法[29-30]作為對比實(shí)驗(yàn)。由于基于SLIF特征點(diǎn)描述符配準(zhǔn)算法在抗噪聲實(shí)驗(yàn)方面性能較差[25,31],所以不把該算法作為對比算法。選取CT大腦圖像作為測試數(shù)據(jù)集,其參考圖像均無噪聲,浮動(dòng)圖像分別加入高斯、椒鹽和泊松噪聲。如圖6所示,圖6(a)為干凈的參考圖像,圖6(b)至圖6(d)為經(jīng)平移的浮動(dòng)圖像,其相對于參考圖像的水平偏移量均為24像素,垂直偏移量均為22像素。其中圖6(b)加入了均值為0、方差為0.01的高斯噪聲,圖6(c)加入了椒鹽噪聲,圖6(d)圖加入了泊松噪聲。
為了使基于本文提出的描述子特征配準(zhǔn)算法具有更優(yōu)越的性能,在使用最近鄰算法完成特征匹配后,利用RANSAC算法[23]剔除誤匹配特征點(diǎn),以此提高精度。
下面以圖6中參考圖像(a)及浮動(dòng)圖像(b)(含高斯噪聲)為例,展示本文描述子的特征點(diǎn)匹配及配準(zhǔn)效果,圖6(e)為特征點(diǎn)匹配效果示意圖,經(jīng)過本文提出的描述子及誤匹配點(diǎn)消除算法后,其特征點(diǎn)匹配效果良好。經(jīng)空間變換矩陣估計(jì)的旋轉(zhuǎn)平移變換矩陣得到的配準(zhǔn)效果圖如圖6(f)所示。
本文提出的算法在高斯噪聲、泊松噪聲及椒鹽噪聲圖像配準(zhǔn)的性能指標(biāo)分別如表3和表4所示。其中表3為僅進(jìn)行平移的配準(zhǔn)實(shí)驗(yàn),表4為僅進(jìn)行旋轉(zhuǎn)的配準(zhǔn)實(shí)驗(yàn),其旋轉(zhuǎn)角度為順時(shí)針方向15°。
表3 不同噪聲下平移圖像配準(zhǔn)性能比較
表4 不同噪聲下旋轉(zhuǎn)圖像配準(zhǔn)性能比較
由表3和表4可以看出,本文算法得到的精度和配準(zhǔn)時(shí)間均遠(yuǎn)遠(yuǎn)好于SSD及CC配準(zhǔn)算法。其中,含有椒鹽噪聲的圖像使用基于全像素的SSD算法并不能完成配準(zhǔn)。對比表3和表4中各種不同噪聲的配準(zhǔn)實(shí)驗(yàn),可以發(fā)現(xiàn)相對于高斯噪聲和泊松噪聲,椒鹽噪聲圖像配準(zhǔn)精度相對較低,其精確配準(zhǔn)難度相對較大。
針對SLIF描述子鄰域結(jié)構(gòu)選擇過于單一,描述方法過于簡單,本文提出了一種改進(jìn)的SLIF描述子用于圖像配準(zhǔn)。提出的描述子的描述鄰域由原本單一的方形鄰域擴(kuò)展為方形鄰域、環(huán)形鄰域及徑向鄰域,其描述能力大大增強(qiáng)。此外,利用圖像區(qū)域內(nèi)像素點(diǎn)存在相似性的特點(diǎn),構(gòu)建了基于像素差分信息的描述方法,并利用鄰域范圍內(nèi)的標(biāo)準(zhǔn)差作為自適應(yīng)閾值來衡量相似度,很好地增強(qiáng)了描述的魯棒性。實(shí)驗(yàn)表明,基于本文提出的描述子的配準(zhǔn)方法對比其他基于特征描述的配準(zhǔn)方法和基于全像素信息的配準(zhǔn)方法,其性能更加優(yōu)異。