張艷邦 張 芬 張姣姣
①咸陽師范學(xué)院數(shù)學(xué)與信息科學(xué)學(xué)院 ②咸陽師范學(xué)院智能信息分析與數(shù)據(jù)處理研究所
本文提出了一種基于圖像邊緣信息的顯著性目標檢測算法。首先,應(yīng)用Roberts算子和Prewitt算子分別檢測圖像中0°,45°,90°,135°,接著清除圖像邊緣噪聲,然后結(jié)合人類視覺注意機制提出了顯著性目標檢測算法,最后在公開的數(shù)據(jù)庫上進行測試。實驗結(jié)果表明,在無任何先驗信息的情況下,本文算法能夠較好地檢測出圖像中的目標。
我們在觀察一幅圖像時,會無意識地注視圖像中的一個或幾個目標,這些目標往往是由于其顏色、形狀或紋理等特征與周圍區(qū)域有明顯的差異性。這種人眼的選擇性注意機制可以幫助我們快速地摒棄圖像中的無關(guān)信息,提取能夠反映圖像內(nèi)容的關(guān)鍵特征。圖像邊緣信息反映了圖像像素的梯度變化,勾勒出了不同的目標區(qū)域,因此對圖像邊緣信息的檢測可以有效地幫助我們提取圖像中的目標。
邊緣檢測算法已經(jīng)發(fā)展成熟,研究人員提出了許多經(jīng)典的算法模型,如Sobel、Roberts、Prewitt、Canny等。為了不失一般性,本文采用梯度算子理論的經(jīng)典方法:Roberts算子和Prewitt算子。
Roberts算子又稱為交叉微分算法,它是基于交叉差分的梯度算法,通過局部差分計算檢測邊緣信息,檢測模板為:
從其模板可以看出,它能夠較好地檢測圖像中45度和135度的邊緣。
Prewitt算子是一種圖像邊緣檢測的微分算子,其原理是利用特定區(qū)域內(nèi)像素灰度值產(chǎn)生的差分實現(xiàn)邊緣檢測。它的檢測模板為:
由模板可以看出Prewitt算子的能夠較好地檢測水平方向和垂直方向的邊緣。另外,Prewitt算子采用3×3 模板對區(qū)域內(nèi)的像素值進行計算,相比于Robert算子的模板為2×2,因此,Prewitt算子適合用來識別噪聲較多、灰度漸變的圖像。
由于通常拍照時,會把目標放置靠近圖像中心的區(qū)域,靠近圖像邊界的區(qū)域一般是背景,如藍天、草地等。因此,我們可以清除圖像中靠近邊界部分的圖像邊緣信息,另外為了清除噪聲的干擾,我們清除了像素較小的孤立點,進而獲取目標的位置先驗信息,如圖1所示。對輸入圖像I,我們獲取的圖像邊緣圖像為BW,分別讓距離圖像邊界長度小于圖像長和寬10%的像素為0,來清除背景噪聲干擾。Matlab實現(xiàn)代碼如下:
圖1 圖像邊緣特征檢測
根據(jù)圖像的邊緣特征,我們獲取了圖像中目標的粗略位置信息,然后,構(gòu)造一個矩形區(qū)域,矩形區(qū)域外的部分為圖像背景,矩形區(qū)域內(nèi)的部分為目標候選區(qū)域。接著,計算目標先驗區(qū)域與背景區(qū)域顏色特征的差異性獲得圖像的顯著性特征。最后,應(yīng)用自適應(yīng)分割算法提取圖像目標,算法思路如圖2所示。
圖2 算法流程
為了綜合評價所提出算法的性能,我們選擇采用最廣的公開的基準數(shù)據(jù)集MSRA上進行了實驗測試。MSRA數(shù)據(jù)集是微軟亞洲研究院(Microsoft Research Asia)建立的可以定量評價視覺注意力算法效果的公開的大型圖像數(shù)據(jù)庫。它包含有1000幅圖像及對應(yīng)人工標記的具有清晰邊界的顯著物體基準圖。實驗的直觀結(jié)果如圖3 所示。由圖3可以看出,文中算法可以較好地定位到目標的位置,對于目標不靠近圖像邊界圖像可以較好地檢測出來,但是檢測結(jié)果還不夠精細,當目標為與圖像邊界時圖像漏檢現(xiàn)象,這是我們下一步需要研究的問題。
圖3 實驗結(jié)果。
本文基于圖像的邊緣信息提出了一種目標檢測算法。由于文中采用的是經(jīng)典的邊緣檢測算法,而且只考慮了單一尺度下的顏色特征,因此文中算法檢測準確度不是很高,但是它為目標檢測的研究提供了一個新思路。下一步我們將研究多尺度下,多特征下的融合,提高檢測效果。