王 明 劉 哲 宋余慶
(江蘇大學計算機科學與通信工程學院 鎮(zhèn)江 212000)
局部二值模式方法最早是由芬蘭Oulu 大學機器視覺小組的研究者Ojala 等[1]提出,該方法在計算機視覺和模式識別領域引起了廣泛的關注,目前已經(jīng)成為紋理分類和人臉識別領域主要的特征提取方法之一。由于傳統(tǒng)局部二值模式容易受到光照,旋轉,噪聲等因素的影響而改變其編碼。雖然均勻模式在一定程度上減少了噪聲的影響,但是圖像對于噪聲依舊是很敏感,一個小的噪聲也會使整幅圖像的LBP編碼完全不一樣。
在此之前也有針對噪聲敏感的問題開展的研究工作[2~3],Iakovidis 等[4]提出了模糊局部二值模式(FLBP),其通過引入模糊性,在滿足差值條件的像素位置產(chǎn)生一個模糊二進制模式,將每種LBP模式按其函數(shù)定義的權值都考慮進去,該方法提高對于噪聲的魯棒性,但是其計算量大并且難以擴展到多尺度分析。之后Jiang 等[5]在此基礎上提出NRLBP,在具有模糊性的像素位置可以產(chǎn)生m種不同的均勻模式,那么每個均勻模式對最后直方圖統(tǒng)計的權值簡單的取1/m。如果不確定模式C(x)無法產(chǎn)生均勻模式,將表示非均勻模式的bin 增加1,通過建立一個查找表來實現(xiàn),使得其計算量比FLBP 明顯降低,僅僅稍高于傳統(tǒng)LBP 方法而計算量依舊很復雜。Fathi A等[6]提出的NTLBP算子,使用圓形多數(shù)表決濾波器和合適的旋轉不變標記方法來獲得更規(guī)則的均勻和非均勻模式,這些模式具有更好的識別能力和更強的噪聲魯棒性。Zhao等[3]提出了一種完備魯棒局部二值模式(CRLBP),其中3*3 局部區(qū)域中每個中心像素的值被其平均局部灰度級替換。與中心灰度值相比,平均局部灰度級對噪聲和光照變化更穩(wěn)健。為了使CRLBP 更加穩(wěn)健和穩(wěn)定,還引入了加權局部灰度(WLG)代替原中心像素值,該方法對噪聲具有較好的魯棒性。Liu 等[7]在傳統(tǒng)LBP 方法基礎上,設計一種新的對噪聲穩(wěn)健的BRINT 描述子。首先將中心像素的圓形鄰域系統(tǒng)進用連續(xù)Q 個鄰域像素的平均值表示新的鄰域系統(tǒng)中的一個鄰域像素點,最后得到一個新的圓形鄰域系統(tǒng);然后再以原中心像素值為閾值對新的鄰域系統(tǒng)進行二值量化,最終獲得一個二進制模式。
本文針對圖像出現(xiàn)的噪聲在原始LBP 基礎上提出了一種抗噪LBP描述子,結合統(tǒng)計學和圖像局部區(qū)域的一致性,計算出疑似噪聲位,并由鄰域像素確定其二進制,最終實現(xiàn)編碼。
局部二值模式(Local Binary Patterns)是一種典型的局部紋理描述子[9~11]。LBP算子最初是定義在某中心像素及其周圍大小為3*3 的矩形鄰域系統(tǒng)上,如圖1 所示:將中心像素的每個鄰域像素值以該中心像素的灰度值為閾值進行二值量化,大于或等于中心像素的像素值則編碼為1,小于則編碼為0,按照給定的編碼方向依次對不同的鄰域點賦予不同的權重,并將量化后得到的二值編碼序列轉換成一個無符號十進制數(shù)值,然后將該值最為對應像素點的LBP 特征模式值。圖像中的每一個像素點都可以計算得到一個局部二進制模式。
圖1 原始LBP算子計算示例
使用式(1)、(2)可計算出圖像中每個像素點的LBP值。
式中,R 表示鄰域半徑,P 表示半徑為R 的鄰域像素點數(shù),gc表示局部鄰域的中心像素點灰度值,gi(i=0,1,2…P-1)表示鄰域像素點灰度值。
當圖像進行了旋轉,那么圖像上某點的LBP描述子也會發(fā)生變化(全為0 或者全為1 的LBP 模式除外),為了解決圖像旋轉帶來的影響,Ojala 等[11]提出了一種旋轉不變算子其 定義為
通過不斷地循環(huán)各位使得到的局部二值模式值最小即為最終的LBP描述子,從而保證了LBP描述子不再隨圖像的旋轉而產(chǎn)生變化,并且特征維數(shù)在一定程度上得到了明顯的降低,但是隨著尺度的增加其特征維度還是很高,不利于特征的提取。之后Ojala 等注意到在所有同一尺度下的原始LBP 模式中有些模式出現(xiàn)的頻率顯著高于其他模式,于是有理由認為出現(xiàn)概率高的模式包含更多的局部紋理信息,從某種意義上來說它們反映了紋理圖像中的基本局部模式。因此,Ojala等建議采用所有LBP模式的一些子集來描述紋理圖像特征,并提出均勻LBP算子。
U 值表示LBP 模式中在圓周上相鄰的兩個二元值的0/1(或1/0)跳變的次數(shù)。如:LBP 模式00000000 和01110000 均為均勻模式,因為它們的0/1(或1/0)轉 移 次 數(shù) 分 別 為0 和2,即U(00000000)=0,U(01110000)=2。而模式01000100為非均勻模式,因為U(01100101)=4。均勻模式極大的降低了LBP 的特征維數(shù),在尺度為4,鄰域點為32的大尺度下,其特征維數(shù)僅僅為995。
Ojala 等[12]為了進一步提高LBP 特征描述子旋轉不變形,并降低特征維度,提出了旋轉不變均勻局部二值模式:
式中旋轉不變均勻模式僅P+1類,所有非均勻模式歸為一類,于是整副圖像的LBP 維度僅僅為P+2維,顯著低于上述三種。
本文在原始LBP 基礎上提出的抗噪LBP。通過式(6)計算鄰域點和中心像素點差值,由統(tǒng)計學中狄克遜準則[13]來找出鄰域中異常像素點,對于非異常像素點通過式(7)得出二進制模式;考慮到局部區(qū)域鄰域的一致性,對于異常像素點根據(jù)其左右像素點的異同性決定該位像素值,如其左右像素點的值都為1 則該點像素值也為1;若其左右像素點值為0 和1 則根據(jù)左右像素點近鄰的兩位來決定,如00X10 則X 為0;若左右近兩位還不能決定該點像素值,則根據(jù)鄰域中0 和1 統(tǒng)計數(shù)多的位決定,對于存在多個異常值情況下,按照權位由低到高依次判別出異常值的二進制位,處于未知的位,在判定時先跳過,最終得出本文改進的抗噪LBP 描述子,具體步驟如下:
1)對中心像素點gc半徑為R 的P 個像素點分別與gc做差:
其中i=0,1,2,3…P-1。
2)對差值通過狄克遜準則剔除,對于被剔除的第i位將被標記為X待定。
3)則未被剔除的差值di則第i 位的二進制數(shù)bi由以下公式得出:
對于被剔除的差值其角標記為λ,角標采用0,1,2,3…P-1 循環(huán)準則,則角標為λ的二進制bλ的值由以下規(guī)則得出:
(1)若bλ-1XOR bλ+1=0 則bλ= bλ-1或bλ=bλ+1否則轉2)繼續(xù)討論。
(2)若bλ-1XOR bλ-2=0 且bλ+1XOR bλ+2=1 則bλ=bλ-1,換個方向同理,否則轉3)繼續(xù)討論。
(3)統(tǒng)計bi=1 和bi=0 的個數(shù),bλ為二進制值統(tǒng)計數(shù)最多的那組值。
(4)之后計算模糊點左右對稱四個鄰域像素點均值并重新賦值該點。
5)最后將得到的LBP 轉換為旋轉不變均勻模式作為最終的紋理特征。采用半徑為1,鄰域點數(shù)為8 的LBP 模式,最后改進抗噪的LBP 特征維數(shù)也是10。
本文改進的抗噪LBP 模式具體實驗流程圖可由如圖2所示。
圖2 改進的抗噪LBP流程圖
在第5 位的像素點的灰度值在噪聲影響下,值由35 突變?yōu)?55,而傳統(tǒng)LBP 模式由原始的0000 0110 變?yōu)?010 0110,旋轉不變均勻模式由0000 0011 變?yōu)榱朔蔷鶆蚰J?,這嚴重的影響其特征提取。本文改進的方法使得到的旋轉不變均勻模式并沒有被改變,始終為0000 0011,修改后的像素值為30,與原始35相差無幾,本文所提出的方法很好地解決了這一問題。
為了驗證本文提出的算法對噪聲具有良好的魯棒性,選擇在標準數(shù)據(jù)庫Brodatz 和CUReT 上分別對、FLBP、NRLBP 算法進行對比實驗,使用支持向量機[14~15]完成紋理分類。實驗所用的兩個數(shù)據(jù)庫樣本紋理如圖3、4所示。
本文將沒有噪聲的紋理圖像作為訓練數(shù)據(jù),然后將不同強度的高斯白噪聲添加到旋轉的測試圖像中,其信噪比(SNR,SIGNAL-NOISE RATIO)從10dB 到50dB,四種算法的采樣半徑都為1,鄰域像素點為8,為了減小隨機誤差帶來的影響,在上述數(shù)據(jù)庫上進行紋理分類時,采用了20 次獨立的隨機采樣實驗平均分類準確率作為最后評估算法性能的指標,實驗結果如表1、表2所示。
圖3 Brodatz 紋理庫部分樣本
圖4 CURet 紋理庫部分樣本
表1 Brodatz紋理庫20次平均分類準確率
表2 CUReT紋理庫20次平均分類準確率
對于兩個數(shù)據(jù)集,所有方法在較高的SNR(SNR = 30dB)內抗噪性能較好。對于數(shù)據(jù)集Brodatz 上10dB~30dB 之間的SNR,所提出的方法與其他方法相比具有顯著差異。而在數(shù)據(jù)集CUReT上,所提方法的性能略優(yōu)于其他方法。但是在兩個數(shù)據(jù)集的SNR=10dB 非常低的情況下,所有LBP 方法的辨別能力都會下降。但是在不同的信噪比中,本文所提出的方法表現(xiàn)出更好的分類準確率和魯棒性。
LBP 運算符是用于圖像分析的強大紋理描述符。但LBP 對噪音很敏感。即使很小的噪音也可能會顯著改變LBP 模式。FLBP 通過引入多模式的模糊LBP 來解決這個問題,但是計算量巨大,無法拓展到多尺度,NRLBP 也僅僅在FLBP 基礎上通過均勻化來減少計算量,雖然效果比FLBP好,但依舊無法解決巨大的計算量問題,所提出方法的關鍵思想不僅是在局部紋理圖案中有效合理地使用鄰域與鄰域之間的關系,而且對噪聲也變得更加魯棒。為實現(xiàn)這一目的,采用了鄰域循環(huán)位表決來決定模糊位的二進制值。對不同數(shù)據(jù)庫的幾個實驗表明,該方法在現(xiàn)有LBP 算子中具有最高的識別能力和分類精度以及更好的紋理分析噪聲容忍能力。