張會(huì)敏 張?jiān)讫垺埳莆摹〉?/p>
摘要:利用作物葉片癥狀進(jìn)行作物病害識別是植保中的一個(gè)重要研究內(nèi)容。提出了一種基于區(qū)分矩陣屬性約簡的黃瓜病害葉片圖像分割與病害識別方法。首先,利用最大類間方差法對黃瓜病害葉片圖像進(jìn)行病斑分割;其次,提取病斑圖像的36個(gè)分類特征;再次,利用基于區(qū)分矩陣的屬性約簡算法對36個(gè)特征進(jìn)行特征選擇;最后,利用最近鄰分類器進(jìn)行病害識別。在3種常見黃瓜病害葉片圖像數(shù)據(jù)庫上的試驗(yàn)結(jié)果表明,該方法是有效可行的,能夠?yàn)榛诓『θ~片的作物病害識別系統(tǒng)研究提供參考。
關(guān)鍵詞:粗糙集;圖像分割;最大類間方差法;病害識別;黃瓜葉片病斑
中圖分類號: TP391.41文獻(xiàn)標(biāo)志碼: A文章編號:1002-1302(2015)01-0387-03
收稿日期:2014-03-19
基金項(xiàng)目:河南省鄭州市科技攻關(guān)(編號:131PPTGG426);安徽省自然科學(xué)基金(編號:1208085MF94、1208085MF98);河南省科技攻關(guān)(編號:142102310518);河南省教育廳科學(xué)技術(shù)研究重點(diǎn)項(xiàng)目(編號:14B520064)。
通信作者:張會(huì)敏(1981—),女,河南漯河人,講師,研究方向?yàn)橛?jì)算機(jī)應(yīng)用技術(shù)。E-mail:zhangshanwen1965@163.com。作物病害嚴(yán)重影響我國農(nóng)業(yè)生產(chǎn)的產(chǎn)量和質(zhì)量。及時(shí)、快速地發(fā)現(xiàn)并識別農(nóng)作物病害對正確地采取相應(yīng)措施防治病害、減少病害帶來的損失具有重要意義。但由于實(shí)際病害葉片的形狀、紋理和顏色多種多樣,使得從葉片圖像中提取的病害分類特征也各種各樣,各種特征對病害識別的貢獻(xiàn)不同,因此需要進(jìn)行特征選擇[1]。粗糙集(rough sets,RS)是一種經(jīng)典的特征選擇方法,能夠直接從給定問題的描述集出發(fā),通過不可分辨關(guān)系和等價(jià)關(guān)系類給出問題的近似域,從而得到該問題的內(nèi)在規(guī)律。多年來,RS已被成功應(yīng)用于人工智能、模式識別、智能控制、機(jī)器學(xué)習(xí)、信息處理、數(shù)據(jù)挖掘、醫(yī)療診斷、專家系統(tǒng)以及決策分析等領(lǐng)域[2-3]。屬性約簡是RS的一個(gè)重要應(yīng)用[4],基于RS的屬性約簡是在保持信息系統(tǒng)分類或決策能力不變的前提下,通過對知識的化簡,導(dǎo)出分類問題的分類規(guī)則和決策?;趨^(qū)分矩陣的屬性約簡策略是建立在兩兩互異目標(biāo)上屬性集合的區(qū)分矩陣[5]。區(qū)分矩陣的元素代表能夠區(qū)分2個(gè)目標(biāo)的屬性組合。實(shí)際應(yīng)用中可以將區(qū)分矩陣中出現(xiàn)次數(shù)多少作為屬性重要性的判斷依據(jù),即出現(xiàn)次數(shù)越多的屬性的重要性越大。本試驗(yàn)在研究作物病害葉片圖像分割的基礎(chǔ)上,將基于區(qū)分矩陣的屬性約簡策略應(yīng)用于病害葉片圖像分類特征選擇中,提出了一種有效的作物病害識別方法。
1作物病害葉片圖像特征提取
作物病害葉片病斑圖像分割是病害識別的一個(gè)重要步驟。最大類間方差(Otsu)閾值法因其分割精度高、適用范圍廣而成為廣泛采用的一種圖像閾值分割方法[6],其原理是:將病害葉片圖像像素分為病斑和正常2類,再通過計(jì)算劃分出2類病害的類間方差值,若類間方差值小于某一給定值,合并初始劃分的2類。然后計(jì)算此時(shí)所有類的類間方差值和分離因素的F值,若F值大于某個(gè)給定值,則退出該算法;否則,就按順序在已存在的類中繼續(xù)對圖像分割。最后得到葉片病斑圖像。
由于實(shí)際得到的病害葉片圖像為RGB模式,該色彩模式對光照比較敏感,而HIS色彩模式能夠克服采集過程中光照對病害識別率的影響,因此在作物病害識別中須要將RGB轉(zhuǎn)換成HIS,HIS顏色模型反映了人的視覺對色彩的感覺[7-8]。由RGB轉(zhuǎn)換HIS的公式如下:
I=(R+G+B)/3
S=1-3(R+G+B)[min(R,G,B)]
H=θG≥B
θ-2πG
式中:θ=arccos[(R-G)+R-B]/2(R-G)2+(R-B)(G-B)。
在本試驗(yàn)中,利用Matlab中的Imread函數(shù)分別提取彩色葉片圖像中R、G、B 3個(gè)通道的圖像,再利用式(1)將其轉(zhuǎn)換為H、I、S模式。然后,采用Otsu閾值法分別將H、I、S圖像轉(zhuǎn)換為二值化圖像,以提取葉片病斑區(qū)域。不妨將得到的病斑二值化圖像仍記為H、I、S。
為了得到能區(qū)分作物病害的顏色特征值,分別計(jì)算病害葉片圖像R、G、B分量和分割后的病斑圖像的H、I、S分量的均值、方差、偏度、峰值、能量、熵,共6×6=36個(gè)統(tǒng)計(jì)特征參數(shù)[9]。計(jì)算公式如下:
p(b)=h(b)/s
b=∑b=1bp(b)
bk=1/δ3∑(b-b)3p(b)
δ2=∑b=1(b-b)2p(b)
bF=1/δ4∑b=1(b-b)4p(b)-3
bN=∑b=1[p(b)]2
bE=∑b=1p(b)lg[p(b)]。(2)
式中,p(b)為灰度級,h(b)為直方圖,s為圖像的面積,b為灰度均值,b為b的均值、bk為偏度,bF為峰值,bN為能量,bE為熵。
若直接把提取的36個(gè)病害圖像特征參數(shù)用于構(gòu)建病害識別模型,則識別效果的穩(wěn)定性較差,因?yàn)楦鱾€(gè)特征對識別結(jié)果的貢獻(xiàn)不同,有些特征甚至?xí)绊懽R別結(jié)果。因此,須要對得到的特征進(jìn)行選擇。筆者使用基于區(qū)分矩陣的屬性約簡方法對得到的36個(gè)特征進(jìn)行選擇。
2基于區(qū)分矩陣的屬性約簡方法
基于區(qū)分矩陣的屬性約簡方法基本思想:將屬性在區(qū)分矩陣中出現(xiàn)的次數(shù)作為目標(biāo)屬性的重要性判斷函數(shù)。計(jì)算各屬性的重要性判斷函數(shù)f,由此可以確定第1個(gè)重要屬性,此時(shí)重要屬性的判斷函數(shù)f值最大。在第1個(gè)重要屬性簡單求出后,進(jìn)一步快速簡單地求出后續(xù)的重要屬性。設(shè)決策表S的核值集合為Core,其屬性約簡過程如下:
輸入S的屬性約簡矩陣RM;輸出S的屬性約簡Redu;
(1)初始化,令Redu=Core,H=;
(2)令Q={RM(aj)|aj∈Redu或AFI(aj)=0},則RM=RM-Q,B=A-Redu-H;
(3)對aj∈B,計(jì)算f(aj)=Max{ak},(k=1,2,…,m),其中f(x)為屬性重要性判斷函數(shù);
(4)Redu←Redu∪{aj};
(5)對每個(gè)aj∈B,令H2(aj)∩RM(ak),H3(aj)=|H2(aj)|;
(6)對所有aj∈B,令RM(aj)←RM(aj)-H2(aj),f(aj)←f(aj)-H3(aj);若f(ak)=0,則H1=∪{ak};
(7)重復(fù)步驟(2)~(6),直到判斷函數(shù)AFI為零向量;
(8)輸出Redu 。Redu為信息表的一個(gè)屬性約簡。
3基于病害葉片的作物病害識別方法
由以上分析可得作物病害識別步驟如下:
(1)將采集到的每幅病害葉片圖像轉(zhuǎn)換為HIS模式;
(2)采用Otsu閾值法分別將葉片圖像的H、I、S分量進(jìn)行病斑分割,再轉(zhuǎn)換為二值化圖像,不妨還記為H、I、S;
(3)利用式(2)分別提取H、I、S的36個(gè)分類特征,得到一個(gè)特征向量,然后生成包括條件屬性集合和結(jié)論屬性集合的滿足粗糙集數(shù)據(jù)處理要求的二維關(guān)系規(guī)則表;
(4)將關(guān)系表中的每類特征屬性進(jìn)行歸一化和離散化處理;
(5)利用基于區(qū)分矩陣的屬性約簡方法對關(guān)系表進(jìn)行屬性約簡,依次消去可省略的屬性(列)和合并重復(fù)的對象(行),再對每一個(gè)對象進(jìn)行簡化,消去冗余的屬性值;
(6)根據(jù)一定的評選準(zhǔn)則選取有效識別規(guī)則的屬性簡化表,最終獲得優(yōu)選的最簡單判定規(guī)則;
(7)利用最近鄰分類器對植物病害進(jìn)行識別。該分類器的基本思路是計(jì)算待測試樣本與訓(xùn)練樣本之間的歐式距離的最小值,由此確定待識別測試樣本的類別。
4結(jié)果與分析
為了驗(yàn)證本研究提出的作物病害識別方法,采集溫室黃瓜常見的細(xì)菌性角斑病、黃瓜炭疽病和黃瓜褐斑病的病害葉片各100幅,其中50幅圖像作為訓(xùn)練集,其余50幅作為測試集。本研究所使用的病害樣本圖像均是在陜西楊凌農(nóng)業(yè)示范區(qū)科學(xué)園黃瓜溫室采集得到的,黃瓜品種為中農(nóng)26號。以白色為背景色,在自然光照的非強(qiáng)光條件下對自然發(fā)病的黃瓜葉片進(jìn)行圖像采集得到黃瓜病害葉片圖像。以Matlab 7.X軟件中自帶的圖像處理工具箱為圖像處理和分析平臺(tái),計(jì)算以上特征參數(shù),數(shù)據(jù)統(tǒng)計(jì)分析采用常用統(tǒng)計(jì)分析SAS軟件。
采用Otsu閾值法分別將病害葉片進(jìn)行病斑分割,分割定位待識別的黃瓜葉片病害部分病斑,利用式(2)提取病害葉片病斑的36個(gè)分類特征。圖1為3種黃瓜病害葉片圖像及對應(yīng)的分割病斑圖像的H分量。
首先將得到的36個(gè)特征進(jìn)行離散化,即把每個(gè)特征劃分成有限個(gè)區(qū)域,本試驗(yàn)中取5個(gè)區(qū)域,使得每個(gè)區(qū)域中對象的決策值相同。然后利用基于區(qū)分矩陣的屬性約簡方法對這36個(gè)特征進(jìn)行屬性約簡,得到6個(gè)重要的屬性,分別為病斑分量H的均值、方差、能量,病斑分量I的均值,病斑分量S的方差和能量。再將這6個(gè)屬性組成一個(gè)特征向量來表示這個(gè)樣本。最后利用最近鄰分類器對病害種類進(jìn)行分類,結(jié)果見表1。為了說明本研究所提出方法的有效性,表1中給出了基于全部36個(gè)特征和基于其他2種方法[10-11]的識別結(jié)果。由表1看出,本研究提出的方法的識別率最高,對黃瓜褐斑病的識別率高達(dá)94.26%,表明該方法用于黃瓜葉部病害圖像識別是有效可行的。
表1不同黃瓜病害識別方法的識別結(jié)果
方法識別率(%)36個(gè)特征識別法78.59文獻(xiàn)[10]82.88文獻(xiàn)[11]90.35本研究所提出的方法94.26
葉片圖像采集和識別試驗(yàn)結(jié)果顯示:(1)病害識別中并非特征越多越好,應(yīng)對識別特征進(jìn)行優(yōu)化組合或特征選擇;(2)即使同一病害樣本在不同成像環(huán)境下拍攝,圖像特征向量也會(huì)存在一定差異;(3)不同黃瓜品種、不同發(fā)病時(shí)期的病癥表現(xiàn)差異較大。這些差異應(yīng)與識別效果相結(jié)合,可以通過制定圖像的采集規(guī)范予以解決。
5結(jié)論
本研究利用最大類間方差法分割黃瓜病斑圖像,再提取病斑圖像的36個(gè)特征,然后利用粗糙集對36個(gè)特征進(jìn)行屬性約簡,得到6個(gè)重要特征,最后利用最近鄰分類器對病害進(jìn)行分類。該方法提取病斑具有操作簡單、分割效果好的特點(diǎn)。本試驗(yàn)結(jié)果表明該方法是有效可行的。由于病害葉片拍攝狀態(tài)和光照等環(huán)境因素對顏色特征存在影響,發(fā)病程度及病斑的典型性也可能對識別準(zhǔn)確率有影響,這些因素對拍攝照片中顏色特征的定量關(guān)系有待進(jìn)一步研究。對于某些顏色、形狀特征非常相似的其他黃瓜病癥,還應(yīng)進(jìn)一步提取病斑的顏色、形狀和紋理等特征,綜合考慮決定黃瓜病害癥狀的物理特征,以實(shí)現(xiàn)對病害的有效識別。
參考文獻(xiàn):
[1]李旺,唐少先. 基于圖像處理的農(nóng)作物病害識別研究現(xiàn)狀[J]. 湖南農(nóng)機(jī),2012,39(1):176-178.
[2]Qian Y H,Liang J Y,Pedrycz W,et al. An efficient accelerator for attribute reduction from incomplete data in rough set framework[J]. Pattern Recognition,2011,44(8):1658-1670.
[3]胡可云,陸玉昌,石純一. 粗糙集理論及其應(yīng)用進(jìn)展[J]. 清華大學(xué)學(xué)報(bào):自然科學(xué)版,2001,41(1):64-68.
[4]樊持杰,陳麗敏,夏春艷. 基于RS的屬性約簡算法[J]. 微計(jì)算機(jī)信息,2010,26(2):222-223.
[5]李智玲,胡彧. 一種改進(jìn)的區(qū)分矩陣屬性約簡算法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用,2008,17(10):51-55.
[6]王祥科,鄭志強(qiáng). Otsu多閾值快速分割算法及其在彩色圖像中的應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用,2006,26(增刊1):14-15.
[7]虎曉紅,李炳軍,席磊. 基于多示例圖的小麥葉部病害分割方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2012,28(13):154-159.
[8]Tushar H J, Ravindra D B, Prashant G P. Crop disease detection using image segmentation[J]. World Journal of Science and Technology,2012,2(4): 190-194.
[9]Revathi P,Revathi R. Knowledge discovery in diagnose of crop diseases using machine learning techniques[J]. International Journal of Engineering Science and Technology,2011,3(9): 7187-7190.
[10]岑喆鑫,李寶聚,石延霞,等. 基于彩色圖像顏色統(tǒng)計(jì)特征的黃瓜炭疽病和褐斑病的識別研究[J]. 園藝學(xué)報(bào),2007,34(6):1425-1430.
[11]賈建楠,吉海彥. 基于病斑形狀和神經(jīng)網(wǎng)絡(luò)的黃瓜病害識別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2013,29(增刊1):115-121.于翰林,盧澤民,朱詠莉. 基于嵌入式Web服務(wù)器的pH值檢測系統(tǒng)的設(shè)計(jì)[J]. 江蘇農(nóng)業(yè)科學(xué),2015,43(1):390-393.endprint