趙曉華
(陜西交通職業(yè)技術學院 西安 710018)
隨著人們生活水平逐步的提高以及信息技術的不斷發(fā)展,人們對信息的傳播需求也越來越大。由于數(shù)字圖像具有存儲便捷、攜帶方便、易于傳輸?shù)忍攸c,所以數(shù)字圖像被人們廣泛用于信息等的傳播。伴隨著數(shù)字圖像的廣泛應用,數(shù)字圖像處理技術也得到了日新月異的發(fā)展,圖像拼接技術作為數(shù)字圖像處理技術之一,也越來越被人們重視[1~3]。
從數(shù)碼照相機誕生之日起,它的便捷性和經(jīng)濟性就使其迅速在人群中推廣開來,可是數(shù)碼相機自身實現(xiàn)機制的限制使得數(shù)碼相機的鏡頭焦距比傳統(tǒng)膠片相機更小,更小的成像面積使得使用者在拍攝一些面積極為龐大的物體和影像時為了保證成像的高精度,不得不使用高級的廣角鏡頭乃至超廣角鏡頭,這些設備對于大眾用戶來說不僅價格過于昂貴,操作也十分復雜。但是數(shù)碼影像的不確定性和易變性卻可以很好地拿來利用,圖像拼接技術便是在此特性之上應運而生,數(shù)碼相機用戶可以使用特定的計算機軟件對自己的多個圖像進行整合和拼接,同樣可以得到高精度的廣角成像[4~5]。由于通過圖像拼接技術能夠將多幅感興趣的圖像拼接成一幅完整且清晰的圖像,所以圖像拼接技術被廣泛應用于包括醫(yī)療診斷、航天航空、軍事探測在內的多種技術領域[6~7]。因此對圖像拼接技術的研究具有非常重要的意義。對此,本文提出了基于SURF特征點的圖像拼接技術研究。
圖像配準方法大致來講有三種技術根源,分別是灰度信息、交換域和特征點,本文研究的是基于特征點的圖像配準技術。當然這樣也是籠統(tǒng)的說法,即使是基于特征點的配準技術也有更為精確的細分。但是總的來說基于特征的匹配技術,首先都是對要進行匹配的圖像進行初始化處理,一般是將圖像進行劃分和局部特征的識別和記錄,再在提取到的特征值之上進行不同圖像之間的聚類,從而建立不同圖像直接的配準映射,使用的最為常見的特征是以坐標值表示的點特征。
該類方法的具體實現(xiàn)流程如圖1所示。
圖1 基于特征的圖像匹配過程
1)特征提取
一般本文是使用人工智能算法自動的檢測圖像的不變特征,選取特征的基本標準為:(1)提取的特征應該是圖像中突出的且大量存在于畫面易于區(qū)分的部分;(2)選取的特征應當有一定的客觀抗干擾能力,即對拍攝時采光、鏡頭或者抖動等干擾有抵抗能力;(3)特征最終是用于兩幅圖像的配準,所以選取的特征在兩幅圖像里應當具有同步性。
2)特征匹配
選取出的特征,本文要用精確的抽象模型進行描述和記錄,這個本文稱之為特征描述算子。而兩幅圖像之間的特征的相似度也要用精確的量化標準去進行定義。然后本文就使用這兩部分信息進行兩幅圖像之間的特質匹配工作。而且有些匹配算法甚至還完成了下一步的模型參數(shù)估計的工作。
3)變換模型估計
根據(jù)上一步的特質匹配工作得到的信息,本文建立起兩幅圖像之間的映射模型,最佳擬合不同圖像之間的幾何變換差異,并根據(jù)變換的程度本文將建立的模型分為全局映射或者局部映射。顧名思義,全局映射就是將所有特征點都用于模型的參數(shù)猜測,而局部映射就只用到了一部分特征值信息。一般來說用的最簡單的也是最常見的就是多項式變換模型。
4)坐標變換與插值
建立起了映射模型后本文就可以對圖像進行變換,讓兩幅圖像處于一個參照系之下,這樣就可以進行下一步的配準處理。而且這一步的變換計算是浮點計算,對于精度的要求是之后成像精確的重要影響因子之一,所以本文還需要特殊的數(shù)值計算算法來處理。這里用到的最多的數(shù)值計算方式是插值法。
2.2.1 基于模板匹配的方法
此類方法需要預先進行特征模版的設定,設定好模塊各項量化標準后,就直接將模塊跟待處理圖像進行相似性對比,滿足一定相似度的子窗口像元就是本文需要的特征點。但是這種方法需要的時間太長,而且不同的圖像要建立不同的模型,兼容性不強,只能處理小規(guī)模的圖像特征點提取工作。
2.2.2 基于幾何特征的點提取算法
此類方法本文又要進行細分:一種方法關注圖像的邊界信息,將圖像進行分割,并且對分割后的子圖象的邊界信息進行特征提取,日后進行對比的也是不同的子圖象的模式識別,這種提取思路的時間復雜度極其不樂觀,可是對圖像內的噪點干擾有很好的抗性;另一種方式關于圖像的灰度,直接從圖像的灰度信息中進行特征提取,這種方法的實現(xiàn)十分簡單。
2.2.3 基于Harris角點檢測算法
Harris角點檢測算法的基本原理是取一個以目標像素點為中心的小窗口,計算該窗口沿任意方向移動后的灰度變化,并用解析形式表達。假設以像素點(x,y)為中心,Harris算法給出的灰度變化量的表達式如下式:
其中,Ex,y表示窗口內的灰度變化量,wx,y表示窗口函數(shù),一般定義為
I表示圖像灰度函數(shù),省略無窮小項得
將Ex,y轉化為
M為實對稱矩陣:
通過對角化處理后得到
其中,R代表旋轉因子,進行對角化操作后并不能改變以u,v為坐標參數(shù)的空間曲面的形狀,它的特征值反應了兩個主軸方向的圖像表面曲率。
在介紹SURF算法之前,本文需要介紹它的前身SIFT,也就是路易在兩千零四年發(fā)明的尺度不變特征換算法,SIFT建立起源圖像和高斯核的卷積之間的尺度空間,在金字塔形高斯差分空間中以尺度不變?yōu)闃藴侍崛√卣鼽c[8~9]。此算法具有的尺度不變性給予了處理結果的高強度抗性,使得最終結果可以在一定程度的視角差異、光強差異、位置差異下保持一致性。這種優(yōu)越的性能讓SIFT成為了最適用的圖像特征提取技術[10~11]。數(shù)學表達式為
然后分別計算其與圖像中每個特征點的鄰域像素值差的平方和,即:
而本文提到的SURF特征點檢測算法,就是SIFT的一種改良變體,誕生于SIFT的兩年后。SURF的改良在于引進了加速魯棒特征,使得可以簡化SIFT的計算量和計算速度,使用了近似Harr小波方法來提取特征點,簡化了二階微分模板的構建,提高了尺度空間的特征檢測的效率。SURF算法在積分圖像上使用了盒子濾波器對二階微分模板進行了簡化,從而構建了Hessian矩陣元素值,進而縮短了特征提取的時間,提高了效率[12~14]。
3.1.1 圖像拼接總體框架
圖像拼接是一個復雜的多步處理流程,每一步的精度和效果都會直接干涉最終成像的完成度,本文探討的圖像拼接技術的大致流程如圖2所示。
3.1.2 圖像拼接系統(tǒng)的實現(xiàn)
前文已經(jīng)提提到了圖像拼接技術的處理中需要用到大量的數(shù)值計算、矩陣處理[15],所以最好的軟件選擇就是美國Mathworks公司開發(fā)的Matlab平臺,該平臺不僅針對科學計算功能進行的大量的優(yōu)化和功能封裝,還具有大量的擴展包可以擴展外圍功能,所以極為適合做本文的圖像處理工作,Matlab本身也有針對計算機視覺方向的工具包可以使用。而本文就是利用Matlab進行一個簡易的圖片拼接軟件的開發(fā)。本文希望在保證極強用戶交互性的前提下,能夠使得用戶便捷的輸入自己要處理的圖片,然后將圖像進行上述流程的處理,最終輸出用戶想要的結果。
圖2 圖像拼接總體框架
以下本文簡述本系統(tǒng)的技術實現(xiàn)流程:1)用戶啟動系統(tǒng)后會進入系統(tǒng)的主界面,主界面給予用戶端口提交自己要處理的圖片,本文設置兩個按鈕Load Image1、Load Image2,按下之后就可以載入相應的圖片;2)用戶在載入圖片后就開始進行相應的處理流程——特征提取、特征匹配、匹配對提純、拼接和融合,本文設置不同的按鈕,按下相應按鈕就可以進行相應的處理;3)處理流程正常結束后,本文可以就得到了本文的最終結果,通過設置好的save按鈕來保存本文的結果到本文想要的位置;4)點擊exit按鈕就可以成功退出系統(tǒng)。
本文用幾組樣本數(shù)據(jù)演驗證Harris算法、SIFT算法與SURF算法的有效性,并對三種算法得出的特征點和特征匹配對進行對比。本文使用的是索尼數(shù)碼照相機,具有1200萬像素,成像規(guī)格是640x480。本文運行程序使用的計算機配置為1GB RAM,CPU主頻2.5GHz,四核四線程,操作系統(tǒng)為Windows7。詳細測試數(shù)據(jù)可由表1所示。
從表中觀察可以看到,提取到的特征點個數(shù)從小到大依次是Harris算法、SURF算法、SIFT算法,提取特征點的速度從小到大依次是Harris算法、SIFT算法與SURF算法。所以一般來講Harris算法雖然處理的時間只比SURF慢了0.3s,但是提取到的特征點太少,進行圖像匹配的話,構造的模型精度很值得懷疑。但是表格的數(shù)據(jù)只是量化計數(shù),如果本文觀察三種算法提取出的特征點坐標的話,會發(fā)現(xiàn)雖然SIFT算法得到了大量的特征點,但是這些特征點的分布雜亂無章,大部分特征點嚴格來說都是判斷失誤得出的,并無實際作用,反而會影響最終的匹配準確性。
表1 三種特征點提取算法比較結果
在該系統(tǒng)中,用戶可以觀察到一定范圍的真實情況,從而獲取到自己需要的信息。下面通過一組實例來說明圖像拼接技術的應用,如圖3~5所示。
圖3 測試圖A
圖4 測試圖B
圖5 拼接結果
圖3和圖4是拍攝到的某一場景圖像,圖5是采用本文圖像拼接方法得到的拼接圖,從效果來看,實現(xiàn)了無縫拼接。
總的來說,無論是進行特征點的提取,還是進行特征點的匹配,SURF算法的精確度和速度都遙遙領先于SIFT算法。
圖像處理領域里圖像拼接技術是應用廣泛,受眾龐大的高需求熱門研究方向,并且隨著此種技術逐漸進入人們的視野并被大眾廣泛接受。圖像拼接技術追求的效率也在不斷的向前進步,人們不斷希望自己使用的處理軟件能夠更快、更準確和更簡單的完成自己期望的任務。本文提出了基于SURF特征點的圖像拼接技術研究。利用基于特征點的配準方法作為本文采用的配準方法。并利用SURF算法設計了本文圖像拼接方法的總體設計,然后對本文圖像拼接算法的實現(xiàn)進行了描述。最后,本文搭建了實驗平臺,設計了仿真實驗,通過仿真實驗分析,表明了本文所設計的圖像拼接方法不僅具有良好的圖像拼接效果,而且該方法在進行圖像拼接時還具有較高的拼接效率,為圖像拼接技術的進一步研究提供了有效的參考。
[1]劉靖.實時列車圖像拼接和信息分析系統(tǒng)[J].自動化與儀器儀表,2016,2(165):165-167.
[2]楊云濤,馮瑩,曹毓.基于SURF的序列圖像快速拼接方法[J].計算機技術與發(fā)展,2011,21(3):6-9.
[3]張銳娟,張建奇,楊翠.基于SURF的圖像配準方法研究[J].紅外與激光工程,2009,38(1):160-165.
[4]賀元香,史寶明,李恒杰.一種改進的抗幾何攻擊彩色圖像水印算法[J].自動化與儀器儀表,2014,1(1):102-105.
[5]邱建國,張建國,李凱.基于harris與sift的圖像匹配方法[J].測量技術學報,2009,23(3):271-274.
[6]李云霞,曾毅,鐘瑞艷.基于SIFT特征匹配的圖像拼接算法[J].計算機技術與發(fā)展,2009,1(19):43-46.
[7]羅三定,賀俊耀.基于SURF和KLT跟蹤的圖像拼接算法[J].計算機工程,2010,1(36):215-217.
[8]史露,蘇剛,韓飛.基于SIFT和SURF圖像拼接算法的改進算法[J].計算機應用與軟件,2013,6(30):72-74+78.
[9]高超,張鑫,王云麗.一種基于SIFT特征的航拍圖像序列自動拼接方法[J].計算機應用,2007,11(27):2789-2792.
[10]王玉亮,沈建新,廖文和.基于SIFT特征的眼底圖像自動拼接[J].中國圖象圖形學報,2011,4(16):654-659.
[11]曹楠,王萍.基于SIFT特征匹配的圖像無縫拼接算法[J].計算機與應用化學,2011,2(28):242-244.
[12]高盛豐,王正勇,藏媛媛.基于顏色不變量和SURF的彩色圖像拼接[J].計算機工程與應用,2013,49(12):113-115.
[13]朱奇光,王佳,張朋珍.基于高斯矩改進SURF算法的移動機器人定位研究[J].儀器儀表學報,2015,11(36):2451-2457.
[14]詹曙,王少武,蔣建國.基于尺度限制SURF的圖像配準[J].電子測量與儀器學報,2013,10(27):963-967.
[15]袁翰祖.醫(yī)學圖像拼接中特征點檢測算法研究實現(xiàn)[J].計算機工程與應用,2013(7):103-104.