曹鵬祥,王如猛,鄧 英(.中國(guó)人民解放軍9373部隊(duì),遼寧 大連 6300;2.南京航空航天大學(xué) 電子信息工程學(xué)院,江蘇 南京 2006)
基于CLBP、改進(jìn)KPCA和RF的牛肉大理石紋評(píng)級(jí)*
曹鵬祥1,2,王如猛1,鄧英1
(1.中國(guó)人民解放軍93173部隊(duì),遼寧 大連 116300;
2.南京航空航天大學(xué)電子信息工程學(xué)院,江蘇 南京 210016)
為進(jìn)一步提高牛肉大理石紋評(píng)級(jí)的正確率,提出了基于完整局部二值模式(Completed Local Binary Pattern,CLBP)、改進(jìn)核主成分分析(Kernel Principal Component Analysis,KPCA)和隨機(jī)森林(Random Forests,RF)的牛肉大理石紋評(píng)級(jí)方法。首先,利用CLBP提取牛肉大理石紋圖像的紋理特征;其次,采用混沌蜂群算法對(duì)KPCA的核參數(shù)進(jìn)行優(yōu)化,使KPCA的降維效果和特征提取達(dá)到最優(yōu),獲得表征牛肉大理石紋樣本圖像的特征向量;最后,使用隨機(jī)森林完成牛肉大理石紋樣本的分級(jí)識(shí)別,獲得最終評(píng)級(jí)結(jié)果。大量實(shí)驗(yàn)結(jié)果表明,與基于分形維和圖像特征的方法、基于灰度共生矩陣和BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)法相比,本文方法所得識(shí)別率最高。
牛肉大理石紋評(píng)級(jí);圖像處理;完整局部二值模式;混沌蜂群優(yōu)化;核主成分分析;隨機(jī)森林
牛肉大理石紋的豐富程度與牛肉的口感、質(zhì)地、多汁性及風(fēng)味有著直接關(guān)系,它直接影響著牛肉的定價(jià)與消費(fèi),被國(guó)內(nèi)外普遍作為牛肉評(píng)級(jí)的主要指標(biāo)之一。人工的評(píng)級(jí)結(jié)果容易受到個(gè)人差異性和主觀性的影響,存在評(píng)級(jí)準(zhǔn)確率低和速度慢的問題,研究實(shí)現(xiàn)牛肉大理石紋的自動(dòng)化評(píng)級(jí),對(duì)提高牛肉質(zhì)量評(píng)定的準(zhǔn)確率和速度有著重要的現(xiàn)實(shí)意義[1-2]。
近年來(lái),將圖像處理技術(shù)應(yīng)用于牛肉大理石紋的自動(dòng)評(píng)級(jí)成為國(guó)內(nèi)外人們的研究熱點(diǎn)[3-5]。參考文獻(xiàn)[6-7]大多僅考慮肌內(nèi)脂肪的面積比例和顆粒數(shù)量,沒有深入考慮大理石花紋的紋理特征。參考文獻(xiàn)[8-9]采用圖像灰度共生矩陣的統(tǒng)計(jì)量描述牛肉大理石紋特征,再分別結(jié)合BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)或線性回歸模型進(jìn)行評(píng)級(jí),該類方法還需要引入其他的紋理特征和評(píng)價(jià)指標(biāo)來(lái)進(jìn)一步提升方法的評(píng)級(jí)正確率。參考文獻(xiàn)[10]提出了完整局部二值模式(Completed LBP,CLBP),在紋理圖像的分類應(yīng)用中發(fā)揮了顯著作用。采用CLBP計(jì)算牛肉大理石紋圖像的特征參數(shù),可以更好地表征大理石紋的分布性狀特點(diǎn),有助于提高最終的評(píng)級(jí)正確率。由于所得特征參數(shù)維數(shù)較大,需進(jìn)行降維處理。本文采用混沌蜂群優(yōu)化的核主成分分析 (Kernel Principal Component Analysis,KPCA)方法來(lái)實(shí)現(xiàn)降維過程。KPCA[11]被人們廣泛應(yīng)用于非線性特征提取,但由于其核參數(shù)選擇大多依據(jù)經(jīng)驗(yàn),導(dǎo)致特征提取和降維的效果受到了不同程度的影響。采用結(jié)構(gòu)簡(jiǎn)單且可有效避免局部極值的混沌蜂群算法對(duì)核參數(shù)進(jìn)行優(yōu)化,可以更好地減少時(shí)間花費(fèi),參數(shù)優(yōu)化后的KPCA具備最優(yōu)的特征提取和降維性能。
隨機(jī)森林(Random Forests,RF)[12-13]是一種較新的分類器,它具有適應(yīng)高維小樣本數(shù)據(jù)、可以自動(dòng)地進(jìn)行功能選擇、對(duì)無(wú)關(guān)特征不敏感、同等適用于二類分類和多類分類問題等優(yōu)點(diǎn),且不需要進(jìn)行復(fù)雜的參數(shù)選擇,分類正確率和識(shí)別效率都優(yōu)于多元線性回歸模型、BP神經(jīng)網(wǎng)絡(luò)方法。結(jié)合RF實(shí)現(xiàn)牛肉大理石紋的評(píng)級(jí)可望獲得更高的評(píng)級(jí)正確率和效率。
基于上述分析,本文提出基于CLBP、混沌蜂群優(yōu)化KPCA和RF的牛肉大理石紋評(píng)級(jí)方法。首先利用CLBP提取表征牛肉大理石紋圖像的特征參數(shù);其次,采用混沌蜂群優(yōu)化的KPCA對(duì)CLBP編碼信息進(jìn)行降維,得到樣本圖像的特征向量;最后利用RF完成評(píng)級(jí)。
1.1CLBP特征提取
牛肉大理石紋圖像的LBP編碼是按照式(1)計(jì)算得出的。
式中,gc是中心像素點(diǎn)的灰度值,gp是鄰域像素點(diǎn)的灰度值,P是鄰域像素點(diǎn)數(shù),R是鄰域半徑。
通過對(duì)圖像進(jìn)行局部差值符號(hào)與大小的轉(zhuǎn)換(Local Difference Sign-Magnitude Transform,LDSMT)分析,可以得到中心描述子 (CLBP-Center,CLBP_C)、符號(hào)描述子(CLBP-Sign,CLBP_S)和大小描述子(CLBP-Magnitude,CLBP_M)。參照局部二值模式方法,計(jì)算中心像素灰度值與鄰域像素灰度值之差:dp=gp-gc,dp又可以分解為:
CLBP_M編碼和 CLBP_C編碼的計(jì)算公式分別如式(3)和式(4)所示:
式中,c是局部圖像中mp的均值。
式中,cI是局部圖像的灰度均值。
建立融合CLBP_S、CLBP_M和CLBP_C的3維聯(lián)合直方圖,記為“CLBP_S/M/C”,以此表征紋理圖像的特征。
1.2混沌蜂群優(yōu)化KPCA
利用式(6)可以得到 C的特征值 λk(k=1,2,…,N)對(duì)應(yīng)的特征向量 νk(k=1,2,…,N):
則有 νk∈span{Φ(x1),…,Φ(xN)},存在 αk(k=1,2,…,N)滿足式(7):
式中,αk,j(j=1,2,…,N)是αk的第 j個(gè)分量。
設(shè)核矩陣 K大小為 N×N,第(i,j)個(gè)元素是 Ki,j=K (xi,xj)=Φ(xi)TΦ(xj)。將K、式(5)和式(7)代入式(6)可得:
那么,式(8)變?yōu)椋?/p>
求解式(9)可以得到特征值 λk、參數(shù)向量 αk和特征向量νk,那么任意樣本在高維特征空間的投影是:
以主成分貢獻(xiàn)率大于或等于90%為標(biāo)準(zhǔn),則綜合評(píng)價(jià)函數(shù)為:
采用多項(xiàng)式 K(x,xi)=[a(x,xi)+b]q作為核函數(shù),核參數(shù)a,b和q將直接影響KPCA特征提取和降維的效果。通常確定上述核參數(shù)大多依靠經(jīng)驗(yàn),使得KPCA特征提取和降維效果很難達(dá)到最優(yōu)。選用混沌蜂群優(yōu)化算法對(duì)核參數(shù)進(jìn)行選擇,有望使KPCA具備最優(yōu)的特征提取和降維性能。
混沌蜂群優(yōu)化KPCA具體步驟如下:
(1)初始化食物源,種群大小ns為30,維數(shù) D為3,a∈[0,1],b∈[2,3],q∈[1,2],引領(lǐng)蜂與觀察蜂的數(shù)目為ns/2,局部搜索最大循環(huán)次數(shù) nMC為 20,跳出局部極值的界限nL為3,當(dāng)前循環(huán)次數(shù)CT為1,最大循環(huán)次數(shù)CM為20。
(2)將KPCA的綜合評(píng)價(jià)函數(shù)式(12)作為混沌蜂群算法的目標(biāo)函數(shù),引領(lǐng)蜂產(chǎn)生候選食物源,并在原食物源和候選食物源之間產(chǎn)生新的食物源。
(3)觀察蜂依據(jù)每個(gè)食物源的選擇概率,選擇一個(gè)食物源,并執(zhí)行與該位置引領(lǐng)蜂相同的操作,進(jìn)一步局部搜索。
(4)引領(lǐng)蜂進(jìn)入偵查階段,依據(jù) nL判定食物源是否陷入局部極值,對(duì)陷入局部極值的食物源利用式(13)產(chǎn)生的Tent映射混沌序列進(jìn)行擾動(dòng),得到新的食物源。并更新陷入局部極值的食物源。
式中,i=1,2,…,k且cHi≠0.25,0.5和0.75,k是混沌序列的長(zhǎng)度大小。
(5)若 CT達(dá)到最大循環(huán)次數(shù) CM,則循環(huán)結(jié)束,輸出最優(yōu)參數(shù) a、b和 q,否則 CT=CT+1。
RF是以統(tǒng)計(jì)學(xué)習(xí)為理論基礎(chǔ),通過對(duì)測(cè)試樣本的重復(fù)抽樣隨機(jī)產(chǎn)生多棵決策樹,再構(gòu)成森林,最后用簡(jiǎn)單的多數(shù)投票法來(lái)確定分類的結(jié)果。RF具體包含學(xué)習(xí)和分類 2個(gè)過程[14-15]。
(1)學(xué)習(xí)過程。設(shè)決策樹的數(shù)量是M,訓(xùn)練樣本集為T={(x1,y1),(x2,y2),…,(xi,yi),…,(xl,yl)},其中 xi∈Rn,yi∈R,i=1,2,…,l,xi表示樣本特征向量,yi為樣本類別,l為樣本數(shù)量。首先采用具備無(wú)權(quán)重、有放回特點(diǎn)的Bagging方法,利用原訓(xùn)練集生成M個(gè)有差異的子集;然后,采用 CART(Classification And Regression Trees)算法進(jìn)行節(jié)點(diǎn)分裂,再利用隨機(jī)選擇輸入變量(Forest-RI)的方式實(shí)現(xiàn)隨機(jī)特征變量的選取,計(jì)算出節(jié)點(diǎn)屬性指標(biāo),分裂終止即構(gòu)建出一顆二叉決策樹;最后,由所有的決策樹構(gòu)成RF。
(2)分類過程。將待分類樣本集輸入到 RF,用簡(jiǎn)單多數(shù)投票的方式作為RF的輸出結(jié)果,實(shí)現(xiàn)最終分類。
綜上所述,本文方法的實(shí)現(xiàn)流程如圖1所示。
圖1 牛肉大理石紋評(píng)級(jí)流程圖
本文所使用的樣本圖像是由專業(yè)評(píng)級(jí)師將牛肉劃分為五級(jí)之后,再使用CCD相機(jī)在流水線上獲取的,共250張圖像,每級(jí)50張,其中訓(xùn)練樣本 50張、待評(píng)級(jí)樣本200張。采用本文提出的基于CLBP、混沌蜂群優(yōu)化KPCA和RF的牛肉大理石紋等級(jí)評(píng)定方法進(jìn)行實(shí)驗(yàn),并將所得評(píng)級(jí)結(jié)果與參考文獻(xiàn)[7]方法、參考文獻(xiàn)[8]方法進(jìn)行了對(duì)比。實(shí)驗(yàn)是在 Intel(R)Core(TM)Duo CPU T5550 1.83 GHz、4 GB RAM、MATLAB7.8環(huán)境中進(jìn)行的。圖2為我國(guó)NY/T676-2010牛肉大理石紋圖譜實(shí)例,為該等級(jí)的最低標(biāo)準(zhǔn);圖3為背最長(zhǎng)肌最大內(nèi)接矩形區(qū)域的灰度圖像,用以牛肉大理石紋圖像的CLBP特征提取和混沌蜂群優(yōu)化的KPCA降維。
采用CLBP提取 50張訓(xùn)練樣本牛肉大理石紋圖像特征參數(shù),用于混沌蜂群的 KPCA參數(shù)優(yōu)化訓(xùn)練,經(jīng)過多次實(shí)驗(yàn),結(jié)果表明降維后前4維主成分的累積貢獻(xiàn)率已達(dá)到98.05%,因此選用降維后的前4維主成分組成特征向量就可以有效體現(xiàn)原始的特征向量,同時(shí)也達(dá)到了預(yù)期的降維目的。表1列舉說明了經(jīng)混沌蜂群優(yōu)化的KPCA降維后,前4維主成分的單獨(dú)貢獻(xiàn)率和累積貢獻(xiàn)率。
表1 前4維主成分貢獻(xiàn)率
表2給出了利用本文所涉及的3種方法得到的牛肉大理石紋圖像待評(píng)級(jí)樣本單級(jí)識(shí)別率和總體識(shí)別率??梢钥闯?,與參考文獻(xiàn)[7]方法和參考文獻(xiàn)[8]方法相比,本文方法得到的單級(jí)識(shí)別率和總體識(shí)別率均更高。參考文獻(xiàn)[7]方法中構(gòu)造多元多項(xiàng)式模型的三個(gè)特征變量是:基于計(jì)盒維數(shù)、脂肪面積比率、脂肪顆??倲?shù),這三個(gè)特征變量主要反映的是牛肉大理石紋圖像中脂肪和肌肉數(shù)量上的統(tǒng)計(jì)信息,并不能夠完整地反映出由肌內(nèi)脂肪顆粒的分布情況所呈現(xiàn)的紋理信息;加之,多元線性回歸模型屬于線性估計(jì)解決方法,它容易因受到樣本特征空間數(shù)據(jù)間的相互作用影響,出現(xiàn)對(duì)稱效應(yīng)、叢聚效應(yīng)和屏蔽效應(yīng),因此,由構(gòu)造成的多元線性回歸模型所獲得的牛肉大理石紋圖像單級(jí)識(shí)別率和總體識(shí)別率還不夠高。參考文獻(xiàn)[8]方法中通過計(jì)算牛肉大理石紋圖像的灰度共生矩陣統(tǒng)計(jì)量作為特征值,能夠較好地反映圖像的紋理特征,但由于選用的特征量數(shù)量有限,還不能夠反映出牛肉大理石紋圖像中所有的紋理信息;另外,所用的分類器是BP神經(jīng)網(wǎng)絡(luò)分類器,它的構(gòu)造原則是依據(jù)經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化,對(duì)樣本數(shù)量的依賴程度高,容易出現(xiàn)過學(xué)習(xí)現(xiàn)象,同時(shí)還存在易陷入局部最優(yōu)問題,最后所得的牛肉大理石紋圖像單級(jí)識(shí)別率和總體識(shí)別率還不太高。本文方法中,采用CLBP計(jì)算牛肉大理石紋圖像的特征參數(shù),利用混沌蜂群優(yōu)化的KPCA對(duì)特征參數(shù)進(jìn)行降維,最終用前4維主成分表征牛肉大理石紋圖像,可以避免不能完全反映圖像紋理信息的問題;結(jié)合RF進(jìn)行分類識(shí)別,可以有效地提高分類精度和穩(wěn)定性。實(shí)驗(yàn)結(jié)果表明,本文方法所得單級(jí)識(shí)別率和總體識(shí)別率均最高,是一種行之有效的牛肉大理石紋評(píng)級(jí)方法。
表2 牛肉大理石紋圖像評(píng)級(jí)測(cè)試結(jié)果
本文提出基于CLBP、混沌蜂群優(yōu)化KPCA和RF的牛肉大理石紋等級(jí)評(píng)定方法。首先采用CLBP編碼方式來(lái)提取表征牛肉大理石紋圖像的特征參數(shù);然后,利用混沌蜂群優(yōu)化的KPCA方法對(duì)表征牛肉大理石紋圖像的參數(shù)進(jìn)行降維,降低冗余度,選取累積貢獻(xiàn)率達(dá)到98.05%的前4維主成分構(gòu)造特征向量;最后,使用RF完成分類識(shí)別。通過大量的實(shí)驗(yàn),結(jié)果表明評(píng)級(jí)正確率分別達(dá)到 100%(一級(jí))、95%(二級(jí))、95%(三級(jí))、97.5%(四級(jí))、100%(五級(jí))。相比文獻(xiàn)[7]方法、文獻(xiàn)[8]方法,采用本文方法所得的評(píng)級(jí)正確率最高,可有助于提高牛肉大理石紋評(píng)級(jí)的準(zhǔn)確率和速度。
[1]湯曉艷,王敏,錢永忠,等.牛肉分級(jí)標(biāo)準(zhǔn)及分級(jí)技術(shù)發(fā)展概況綜述[J].食品科學(xué),2011,32(19):288-293.
[2]周彤,彭彥昆.牛肉大理石花紋圖像特征信息提取及自動(dòng)分級(jí)方法[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(15):286-293.
[3]陳坤杰,姬長(zhǎng)英.牛肉自動(dòng)分級(jí)技術(shù)研究進(jìn)展分析[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2006,37(3):153-156.
[4]TAN J.Meat quality evaluation by computer vision[J].Journal of Food Engineering,2004,61(1):27-35.
[5]FUKUDA O,NABEOKA N,MIYAJIMA T.Estimation of marbling score in live cattle based on ICA and a neural network[C].IEEE 2013 International Conference on Systems Man and Cybernetics,Manchester,2013:1622-1627.
[6]陳坤杰,姬長(zhǎng)英.基于圖像運(yùn)算的牛肉大理石花紋分割方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2007,38(5):195-196.
[7]陳坤杰,吳貴茹,於海明,等.基于分形維和圖像特征的牛肉大理石花紋等級(jí)判定模型 [J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2012,43(5):147-151.
[8]謝元澄,徐煥良,謝莊.基于牛肉大理石花紋標(biāo)準(zhǔn)(BMS)圖像的紋理特征分析[J].中國(guó)農(nóng)業(yè)科學(xué),2010,43(24):5121-5128.
[9]張建勛,李濤,孫權(quán),等.豬眼肌 B超圖像紋理特征提取與分類[J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué)版,2013(2):74-78.
[10]Guo Zhenhua,Zhang Lei,ZHANG D.A completed modeling of local binary pattern operator for texture classification[J].IEEE Transactions on Image Processing,2010,19 (6):1657-1663.
[11]Zhang Yi,Han Jing,Yue Jiang,et al.Weighted KPCA degree of homogeneity amended non-classical receptive field inhibition modelforsalientcontourextraction in low-light-level image[J].IEEE Transactions on Image Processing,2014,23(6):2732-2743.
[12]CHOI J H,SONG G Y,LEE J W.Road identification in monocular color images using random forest and color correlogram[J].International Journal of Automotive Technology,2012,13(6):941-948.
[13]楊帆,林琛,周綺鳳,等.基于隨機(jī)森林的潛在 k近鄰算法及其在基因表達(dá)數(shù)據(jù)分類中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2012,32(4):815-825.
[14]陳超,李文藻.一種基于隨機(jī)森林與顏色特征的巖屑識(shí)別算法[J].四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,49(3):587-592.
[15]曹正鳳.隨機(jī)森林算法優(yōu)化研究[D].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué),2014.
Beef marbling grading based on CLBP improved of KPCA and RF
Cao Pengxiang1,2,Wang Rumeng1,Deng Ying1
(1.Unit 93173,Chinese People′s Liberation Army,Dalian 116300,China;
2.College of Electronic and Information Engineering,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China)
In order to further improve the correct rate of beef marbling grading,a beef marbling grading method based on completed local binary pattern(CLBP),kernel principal component analysis and random forests is proposed.Firstly,CLBP is used to extract texture features of beef marbling image.Then the kernel parameters of kernel principal component analysis is optimized by chaos artificial bee colony,which makes dimensionality reduction and feature extraction by KPCA to achieve the optimal effect.Thus feature vectors are obtained to characterize the beef marbling images.Finally,random forests is applied to complete classification recognition of beef marble samples and get the final ratings result.A large number of experimental results show that,compared with method based on fractal dimension and image features,method based on gray level co-occurrence matrix,and the method based on Back Propagation neural network,the proposed method attains the highest recognition rate.
beef marbling grading;image processing;completed local binary pattern;chaotic bee colony optimization;kernel principal component analysis;random forests
TP391.41
A
1674-7720(2015)15-0047-04
曹鵬祥,王如猛,鄧英.基于CLBP、改進(jìn)KPCA和RF的牛肉大理石紋評(píng)級(jí) [J].微型機(jī)與應(yīng)用,2015,34(15):47-50.
2015-03-12)
曹鵬祥(1981-),通信作者,男,碩士研究生,工程師,主要研究方向:圖像處理與視頻通信、模式識(shí)別。E-mail:feixiang2012@126.com。
王如猛(1980-),男,本科,助理工程師,主要研究方向:圖像處理與視頻通信。
鄧英(1980-),女,本科,助理工程師,主要研究方向:圖像處理與視頻通信。
江南大學(xué)食品科學(xué)與技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室開放基金項(xiàng)目(SKLF-KF-201310);江蘇省食品先進(jìn)制造裝備技術(shù)重點(diǎn)實(shí)驗(yàn)室開放課題資助項(xiàng)目(FM-201409)