陳 旭 解天祺
1(南京信息工程大學(xué) 江蘇 南京 210044)
2(南京信息工程大學(xué)江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心 江蘇 南京 210044)
圖像的紋理特征是一種較為顯著的視覺特征,不止有色彩和亮度可以反映圖像,所視物體表面存在著排列組合的規(guī)律,這種在圖像中多次出現(xiàn)的紋理組合也應(yīng)作為視覺特征,所以對(duì)圖像紋理特征的分析在圖像檢測和分類的工作中起了決定性作用。目前很多重要領(lǐng)域都對(duì)圖像紋理特征進(jìn)行了深入的研究并取得了顯著的研究成果,如虛擬現(xiàn)實(shí)(VR)技術(shù)通過紋理識(shí)別出不同的材質(zhì),在人機(jī)交互中可以得到更真實(shí)的感受,因此紋理特征也可以作為模式識(shí)別領(lǐng)域的重要參照。
近年來,對(duì)于紋理圖像的分類研究一直都是重點(diǎn),將其與虛擬現(xiàn)實(shí)技術(shù)結(jié)合也成了當(dāng)下的熱門。陳洋等[1]提出了結(jié)合Gabor濾波器和ICA技術(shù)的紋理分類方法,但在升維降維的過程中會(huì)丟失特征數(shù)據(jù);Dong等[2]基于Shearlets和線性回歸算法進(jìn)行紋理分類,該方法對(duì)一些相對(duì)規(guī)律的紋理有較好的效果,但對(duì)于一些復(fù)雜圖像的效果不是很好;Jawahar等[3]則是基于小波變換來進(jìn)行紋理分類,該方法的魯棒性不是很好;Fahrurozi等[4]使用GLCM結(jié)合邊緣檢測算法來提取紋理的特征,發(fā)現(xiàn)GLCM紋理特征參數(shù)中只有4組值是線性無關(guān),可以進(jìn)行級(jí)聯(lián)分類;El Khadiri等[5]基于LBP算法提出了一種局部二值梯度等值(LBGC)算法進(jìn)行紋理分類,雖然精度很高,但需要的特征維度比較高,不滿足實(shí)時(shí)性;Zhang等[6]基于局部二值模式提出了表示紋理特征的歸一化差分向量(NDV),該方法具有一定的優(yōu)越性,但對(duì)于紋理方向性的研究還不夠充分;梅軍等[7]基于Tamura紋理特征對(duì)紋理圖像進(jìn)行分類,在方向性和形態(tài)學(xué)運(yùn)算中都有很好的效果。
本文提出了一種基于B-CLBP和GLCM的紋理特征提取方法,并在傳統(tǒng)LBP算子上進(jìn)行了優(yōu)化,對(duì)其進(jìn)行雙向計(jì)算,在不增加特征維數(shù)的前提下,獲得了更大的數(shù)據(jù)量。在得到更加精確的特征參數(shù)后,使用SVM分類器對(duì)紋理圖像進(jìn)行分類。該方法具有很強(qiáng)的魯棒性,且分類精度高,由于特征參數(shù)都是一維的所以運(yùn)算速度也很快。
本文提出的分類算法流程圖如圖1所示。首先,使用濾波算法對(duì)圖像進(jìn)行預(yù)處理,消除一些冗雜因子。然后使用基于LBP和GLCM的紋理提取算法來獲取圖像的紋理信息并生成特征矩陣。最后將得到的矩陣發(fā)送到SVM分類器中,來獲取8種不同材質(zhì)的紋理特征:鋁箔、砂紙、海綿、面包、燈芯絨、棉布、餅干、橙皮。
圖1 算法流程圖
LBP(局部二進(jìn)制模式)是用于描述圖像的局部紋理特征的運(yùn)算符。它具有顯著的優(yōu)點(diǎn),如旋轉(zhuǎn)不變性和灰度不變性[8]。傳統(tǒng)LBP算子選取大小為3×3的窗口,并以窗口的中心像素值作為閾值,將其與相鄰的8個(gè)像素值進(jìn)行比較,若相鄰像素的值比中心像素值大,則該像素點(diǎn)的位置被標(biāo)記為1,反之則為0。這樣順時(shí)針取相鄰像素的標(biāo)記值,可以得到一個(gè)8位二進(jìn)制數(shù),將其轉(zhuǎn)換為十進(jìn)制后,賦值給中心像素值,從而得到該窗口的LBP值,該區(qū)域的紋理信息就可以通過LBP值反映。如圖2所示,LBP碼為11100000,然后將其轉(zhuǎn)換為十進(jìn)制數(shù)224。
圖2 LBP特征值計(jì)算方法
LBP算法可以表示為:
(1)
式中:(xc,yc)是3×3矩陣的中心像素;gc是中心像素的灰度值;gi是同矩陣下周圍像素的灰度值。
(2)
傳統(tǒng)LBP算子只能在固定窗口中進(jìn)行計(jì)算,并不能保證不同尺寸和頻率紋理的需要。為了將3×3的矩陣窗口擴(kuò)展到任意鄰域,使用圓形替代了矩形領(lǐng)域,改進(jìn)后的LBP算子允許在半徑為R的圓形鄰域內(nèi)有任意多個(gè)像素點(diǎn)[9]。圖3為圓形LBP示意圖。
圖3 圓形LBP示意圖
圓形LBP中心像素的計(jì)算可以表示為:
(3)
式中:R是采樣半徑;P是采樣點(diǎn)的個(gè)數(shù)。就圓形區(qū)域中采樣點(diǎn)的像素點(diǎn)的對(duì)應(yīng)值而言,可能不是整數(shù),可以通過雙線性插值[10]獲得。對(duì)于給定的中心點(diǎn)(xc,yc),其鄰域像素位置是(xp,yp),可以通過下式計(jì)算:
(4)
經(jīng)過LBP算子計(jì)算后可以得到與原圖同樣大小的可視化圖像,但圖像的紋理特征一般用LBP的特征直方圖來表示。
在選取CLBP的基礎(chǔ)上,得到的可視化CLBP圖像具有一定的方向擾動(dòng)因素,如圖4所示,由于計(jì)算CLBP算子的時(shí)候選取旋轉(zhuǎn)方向不同,會(huì)得到在方向上又明顯差異的LBP圖像,但它們的特征信息依舊是相同的。
(a) 正轉(zhuǎn) (b) 反轉(zhuǎn)
為了獲得更好的特征參數(shù),本文提出雙向LBP,即B-CLBP。在得到原有特征直方圖的基礎(chǔ)上,通過反向旋轉(zhuǎn)CLBP算子,得到一組新的特征直方圖,累加到原特征直方圖上,并進(jìn)行歸一化處理,在不增加維度的同時(shí),增加了每一維的特征參數(shù),還可以抵消原有的方向性擾動(dòng)因素,取得更好的分類結(jié)果。
灰度共生矩陣(GLCM)是一種成熟的統(tǒng)計(jì)圖像分析方法,已被用于許多與紋理相關(guān)的應(yīng)用,包括缺陷檢測[11]。先計(jì)算灰度圖像得到它的共生矩陣,然后通過計(jì)算共生矩陣來得到矩陣的一些特征值,以表示圖像的一些紋理特征。GLCM可以反映圖像灰度等方向,相鄰間隔和變化幅度的綜合信息。在計(jì)算矩陣之后,基于計(jì)算的共生矩陣計(jì)算紋理特征,而不是直接應(yīng)用計(jì)算的GLCM[12]。經(jīng)常采用對(duì)比度(CON)、熵(ENT)、逆差矩(IDM)和能量(ASM)等特征來表示紋理特征。
CON:直接反映像素值的亮度與其鄰域像素值的對(duì)比度,紋理凹槽越深,對(duì)比度就越明顯。
(5)
ENT:熵是圖像信息內(nèi)容的度量,代表了紋理的不均勻性或復(fù)雜程度。當(dāng)圖像幾乎隨機(jī)或有噪聲時(shí),熵將具有較大的值。
(6)
IDM:它反映了圖像紋理的同質(zhì)性,并測量了圖像的紋理變化。較大的IDM值表示圖像紋理的不同區(qū)域之間缺乏變化,并且該部分非常均勻。
(7)
ASM:它是GLCM元素值的總和,因此也稱為能量。它反映了灰度分布的均勻性和紋理的粗糙度。較大的ASM值表示紋理變化得更均勻和規(guī)則。
(8)
本文提出的紋理特征提取方法如下:
1) 選取具有旋轉(zhuǎn)不變性的LBP算子,先對(duì)圖像的每個(gè)像素進(jìn)行LBP計(jì)算,并得到LBP圖像。原始圖如圖5(a)所示,LBP圖如圖5(b)所示。
(a) 原圖 (b) LBP圖
2) 根據(jù)得到的LBP圖,對(duì)其進(jìn)行灰度共生矩陣計(jì)算,選取距離d=1,并獲得0°、45°、90°、135°四個(gè)方向上的對(duì)比度、相關(guān)性、能量、逆差矩,級(jí)聯(lián)后得到16個(gè)參數(shù)的特征矩陣。
3) 使用優(yōu)化后的B-CLBP算子,獲取雙向的紋理特征直方圖,并生成參數(shù)矩陣,結(jié)合灰度共生矩陣得到的特征矩陣,描述圖像的紋理特征。
支持向量機(jī)(SVM)[13]是一種統(tǒng)計(jì)方法,它計(jì)算兩組樣本之間的最佳分離超平面。從20世紀(jì)90年代末開始,SVM已成功應(yīng)用于大量的機(jī)器學(xué)習(xí)問題。在機(jī)器學(xué)習(xí)中,SVM是與學(xué)習(xí)算法相關(guān)的監(jiān)督模型,該算法分析用于分類和回歸分析的數(shù)據(jù)[14]。給定一組訓(xùn)練示例,每個(gè)示例標(biāo)記為屬于兩個(gè)類別中的一個(gè)或另一個(gè),SVM訓(xùn)練算法構(gòu)建將新示例分配給一個(gè)類別或另一個(gè)類別的模型,使其成為非概率二進(jìn)制線性分類器[15]。該算法需要確定一組參數(shù),包括支持向量機(jī)的類型、核函數(shù)的類型、罰因子、訓(xùn)練停止的標(biāo)準(zhǔn)。當(dāng)使用某些內(nèi)核函數(shù)時(shí),需要確定其中一些參數(shù)。其中,核函數(shù)是支持向量機(jī)算法的核心。在過去的研究中,分類算法采用徑向基函數(shù)(RBF),這是一種徑向?qū)ΨQ標(biāo)量函數(shù)。最常見的徑向基函數(shù)是高斯核函數(shù):
(9)
式中:x′是內(nèi)核函數(shù)中心;σ是函數(shù)的寬度參數(shù),控制函數(shù)的徑向范圍。
當(dāng)使用RBF內(nèi)核時(shí),考慮兩個(gè)參數(shù):懲罰因子C和γ。其中C是誤差容差,γ是RBF的寬度,它會(huì)影響每個(gè)支持向量對(duì)應(yīng)高斯的范圍,從而影響泛化性能。較好的(C,γ)可以使分類器正確預(yù)測未知數(shù)據(jù)并具有較高的分類準(zhǔn)確性。系統(tǒng)采用網(wǎng)格搜索方法獲得最優(yōu)參數(shù),獲得較高的訓(xùn)練精度,即分類器預(yù)測類標(biāo)簽已知的訓(xùn)練數(shù)據(jù)的準(zhǔn)確性,不能保證測試集的高預(yù)測精度。因此,通常采用交叉驗(yàn)證方法來提高預(yù)測精度[16]。
本文對(duì)KTH-TIPS紋理圖像庫中的鋁箔、海綿、砂紙、面包、燈芯絨、棉布、餅干、橙皮8類紋理圖像樣本進(jìn)行分類,隨機(jī)選取各類紋理圖片中的8幅圖片來檢驗(yàn)本文提出的方法的有效性。圖6為8類紋理圖像。
(a) 鋁箔 (b) 海綿 (c) 砂紙 (d) 面包
(e) 燈芯絨 (f) 棉布 (g) 餅干 (h) 橙皮
原始圖像大小均為200×200像素。共有560個(gè)訓(xùn)練樣本和240個(gè)測試樣本,每個(gè)訓(xùn)練種類70個(gè),每個(gè)測試樣本30個(gè)。采用K-means聚類算法對(duì)三類樣本進(jìn)行劃分,可以很大程度地降低特征維度,提高運(yùn)算的效率。
本文分別測試了GLCM、LBP和兩種算法的結(jié)合,并記錄的分類的精度。對(duì)于GLCM算法,選擇d=1,灰度等級(jí)為16,依據(jù)四個(gè)角度上的對(duì)比度、相關(guān)性、能量和逆差矩,得到16個(gè)參數(shù)的特征矩陣。對(duì)于LBP算法,采用CLBP算子,通過降維可以得到較少的特征參數(shù),減少計(jì)算量。同時(shí)為了獲得更好的效果,采用B-CLBP計(jì)算特征參數(shù),疊加在原來的特征參數(shù)上,在不擴(kuò)大特征維度的同時(shí),得到更準(zhǔn)確的特征參數(shù)。
實(shí)驗(yàn)一中,方法1為通過灰度共生矩陣得到的16個(gè)特征參數(shù)級(jí)聯(lián)起來的矩陣作為紋理特征通過SVM分類;方法2采用B-CLBP算子來提取紋理特征分類;方法3為本文方法,結(jié)合兩種算法得到特征參數(shù)分類。
從表1可以看出,B-CLBP分類的整個(gè)樣本的準(zhǔn)確性高于GLCM,并且每種樣本的準(zhǔn)確率也高于GLCM。兩種算法相結(jié)合的正確性明顯優(yōu)于單一算法,且準(zhǔn)確率可以達(dá)到97.5%。
表1 不同方法的準(zhǔn)確率 %
實(shí)驗(yàn)二中,為了避免直方圖的高維度,分析了當(dāng)采樣點(diǎn)均為8、半徑為1時(shí)選擇LBP算子與B-CLBP算子分類的結(jié)果。如表2所示,相同采樣條件下,B-CLBP算子獲得的特征參數(shù)具有更好的分類精度。
表2 B-CLBP與傳統(tǒng)LBP的分類準(zhǔn)確率 %
實(shí)驗(yàn)三中,對(duì)測試集進(jìn)行了錯(cuò)誤匹配實(shí)驗(yàn),同樣是取自KTH-TIPS紋理圖像庫,選取了三組不同于樣本數(shù)據(jù)的圖像,每組30幅測試樣本,測試錯(cuò)誤的圖像是否會(huì)被劃分到樣本集合中。如表3所示,經(jīng)過方法1和方法2處理的特征數(shù)據(jù)存在一定的錯(cuò)誤分類,而經(jīng)過方法3處理的特征數(shù)據(jù)也存在少數(shù)錯(cuò)誤分類,主要因?yàn)閳D像本身就接近平滑,與樣本數(shù)據(jù)中的棉布和砂紙分類有一定的混淆,總體來說,本文的分類方法仍是準(zhǔn)確可行的。
表3 錯(cuò)誤檢測分類正確率 %
本文主要研究紋理特征提取和分類的問題,提出了一種基于B-CLBP和GLCM的紋理檢測分類算法。該算法比單一特征更加全面,可為分類提供更有力的依據(jù),且適用于紋理材質(zhì)的識(shí)別。通過實(shí)驗(yàn)驗(yàn)證了該方法的可行性和優(yōu)越性。
由實(shí)驗(yàn)一可以看出,本文方法對(duì)紋理圖片的分類準(zhǔn)確率較單一特征算法更高;由實(shí)驗(yàn)二可以看出,本文提出的B-CLBP優(yōu)化算法也較傳統(tǒng)LBP的分類準(zhǔn)確率高;由實(shí)驗(yàn)三可以看出,本文方法的魯棒性也較單一特征算法的分類結(jié)果更好,可以區(qū)分出錯(cuò)誤輸入的圖像。本文方法較其他特征提取分類算法有更高的分類精度和魯棒性,可以在保證紋理識(shí)別實(shí)時(shí)性的基礎(chǔ)上有更加精準(zhǔn)的分類能力。
下一步將對(duì)以下幾方面進(jìn)行深入研究:
1) 對(duì)更多的紋理材質(zhì)圖片進(jìn)行特征提取,擴(kuò)大檢測的范圍。
2) GLCM算法的效果不是特別好,可以考慮優(yōu)化算法,研究梯度方向的灰度共生矩陣,提高算法的效率和準(zhǔn)確性。
3) 本文方法的魯棒性還需要進(jìn)一步研究,可以從圖像深度出發(fā),使該方法的魯棒性更強(qiáng)。