張紅濤,朱 洋,譚 聯(lián),許帥濤,劉迦南
(1.華北水利水電大學(xué) 電力學(xué)院,河南 鄭州 450011; 2.西安電子科技大學(xué) 機(jī)電工程學(xué)院,陜西 西安 710071)
我國是煙草主要生產(chǎn)國和消費(fèi)國之一,煙葉總產(chǎn)量占全球的39.7%,煙草行業(yè)已成為我國社會經(jīng)濟(jì)的重要支柱產(chǎn)業(yè),其行業(yè)的發(fā)展一直是人們關(guān)注的焦點(diǎn)[1-3]。煙草在生長過程中,會受到病蟲害的侵染,降低產(chǎn)量與質(zhì)量,影響行業(yè)和國家經(jīng)濟(jì)的發(fā)展。病害是影響煙草產(chǎn)量的主要因素,其中,以煙草赤星病和蛙眼病造成的危害最為嚴(yán)重,如能在病害的早期實(shí)現(xiàn)合理的防治,可以有效降低病害導(dǎo)致的經(jīng)濟(jì)損失。煙草蛙眼病和赤星病2種病害的早期病斑相似度大,難以用肉眼區(qū)分,目前主要的病害診斷主要依靠植保專家或農(nóng)戶判斷,容易對早期煙草病害進(jìn)行錯(cuò)誤判別,不能及時(shí)有效的控制住病情,影響煙草行業(yè)的發(fā)展。因此,煙草病蟲害的檢測與防治一直以來都是研究的重點(diǎn)和難點(diǎn)[4-7]。
喻勇等[8]利用機(jī)器視覺的方法對煙葉常見病害進(jìn)行識別,對赤星病的識別率達(dá)到90%,但蛙眼病的識別率僅為44%。王建璽等[9]利用模糊模式識別技術(shù)對煙草病害進(jìn)行判別,該方法對煙草野火病和角斑病的識別率較高。滕娟[10]采用支持向量機(jī)(Support vector machine,SVM)技術(shù)對煙草病害進(jìn)行識別,并取得了良好的效果。SHAO等[11]設(shè)計(jì)了煙草常見病害識別系統(tǒng),該系統(tǒng)對煙草病害整體的識別率達(dá)到92.5%。李敬[12]利用卷積神經(jīng)網(wǎng)絡(luò)對煙草常見病害進(jìn)行分類識別,識別率達(dá)到90%。張艷令[13]研發(fā)了煙草病害自動(dòng)識別系統(tǒng),對煙草常見病害的平均識別率達(dá)到90%以上。
由以上可知,學(xué)者們利用各種技術(shù)對煙草病害的識別進(jìn)行深入研究,并取得一定的成果。但大都是根據(jù)葉片的中后期病斑形態(tài)對病害進(jìn)行判別,難以實(shí)現(xiàn)對病害的及時(shí)防治。本研究提出一種基于螢火蟲算法優(yōu)化支持向量機(jī)(FA-SVM)技術(shù)的煙草蛙眼病與赤星病早期判別方法。以煙草蛙眼病與赤星病2種病害為研究對象,利用計(jì)算機(jī)視覺實(shí)現(xiàn)對其早期判別。
利用手機(jī)對病斑圖像進(jìn)行采集,型號為華為P9(分辨率:1 920 dpi×1 080 dpi;攝像頭:1 200萬像素),拍攝時(shí)間為9:00—12:00和15:00—18:00,樣本采集地點(diǎn)為河南省平頂山市魯山縣甘樹里村,采樣時(shí)間為2019年6月底到8月中旬。
對感染了2種病害的400組(每種病害200組)煙草植株進(jìn)行標(biāo)記,每天定時(shí)對病斑圖像進(jìn)行采集,觀察病斑的變化。分別拍攝2種病害的早、中、晚期病斑圖像。本研究共采集1 200張病斑圖像樣本(早、中、晚期各200張樣本),把其中的900張作為訓(xùn)練集,剩下的300張作為測試集。2種病斑早期和中期樣本圖像分別如圖1、2所示。
圖1 煙草蛙眼病Fig.1 Frog eye disease of tobacco
圖2 煙草赤星病Fig.2 Brown spot of tobacco
圖像中背景部分主要為植物葉片,病斑圖像在顏色、紋理等方面與背景圖像相差較大。根據(jù)目標(biāo)與背景的顏色差異,并結(jié)合圖像處理方法實(shí)現(xiàn)對病斑圖像的分割。
由圖1、2可知,煙草蛙眼病與赤星病早期的2種病斑在大小、顏色和紋理上都較為相似,難以用肉眼去觀察區(qū)分,需利用機(jī)器視覺的方法對其進(jìn)行識別。2種病害的早、中期病斑在顏色、紋理和形態(tài)上有明顯的不同,故共提取了2種病斑的形態(tài)學(xué)、顏色和紋理等共計(jì)32個(gè)特征,部分特征定義如下:
灰度共生矩陣是一種通過研究灰度的空間相關(guān)特性來描述紋理的常用方法[14-15]。如下公式中,G為圖像的灰度共生矩陣,K為圖像的灰度級數(shù)。
能量(ENG):
(1)
ENG又稱角二階矩,表征圖像中灰度分布的均勻程度,圖像灰度越均勻,能量就越小,反之能量越大。
對比度(CON):
(2)
CON表征圖像紋理的深淺程度。圖像紋理間灰度值差距大,對比度就高,反之對比度低。
逆差矩(IDM):
(3)
熵(ENT):
(4)
ENT表征圖像中含有的信息量,熵值越大,則圖像中包含的信息越豐富,或圖像的紋理較為復(fù)雜。
自相關(guān)性(COR):
(5)
(6)
(7)
(8)
(9)
COR表征圖像的像素在行或列方向上的相似程度,若灰度值差別較大,則相關(guān)性較小,反之相關(guān)性較大。
三階矩(μ3):
(10)
μ3表征直方圖的傾斜程度,當(dāng)直方圖對稱時(shí),μ3=0,當(dāng)μ3>0,直方圖朝高灰度值偏斜;當(dāng)μ3<0,直方圖朝低灰度值偏斜。
一致性(u):
(11)
當(dāng)圖像中某一區(qū)域的灰度值相同時(shí)值最大,然后沿著此值開始下降。
形態(tài)學(xué)特征可以反映目標(biāo)基本形態(tài)的變化,是圖像處理與模式識別中的一類重要特征。
面積(A):
(12)
A表征目標(biāo)圖像的大小,f(x,y)表示坐標(biāo)為(x,y)的像素點(diǎn),M、N為橫坐標(biāo)和縱坐標(biāo)的最大值。
周長(P):
P=A-sum(in)
(13)
P反映目標(biāo)的大小信息,sum(in)表示四鄰域?yàn)槟繕?biāo)的像素點(diǎn)的總和。
圓形度(e):
(14)
e反映目標(biāo)的復(fù)雜程度,A為目標(biāo)面積,P為目標(biāo)周長。
寬長比(C):
(15)
H為最小外接矩形的寬,L為最小外接矩形的長。
平均灰度(ave):
(16)
ave表征目標(biāo)圖像的灰度信息,f(i,j)為像素點(diǎn)(i,j)的像素值,N為目標(biāo)像素點(diǎn)數(shù)。
顏色矩是一種顏色特征表示方法,有一階矩、二階矩和三階矩等,其顏色特征主要分布在低階矩中,所以利用一階矩、二階矩和三階矩足以表達(dá)圖像的顏色分布。
顏色一階矩(μi):
(17)
pi,j表示彩色圖像第j個(gè)像素的第i個(gè)顏色分量,N表示圖像中像素個(gè)數(shù)。該特征主要表征各顏色分量的平均強(qiáng)度
顏色二階矩(δi),表征待測區(qū)域的顏色方差,即不均勻性。
(18)
顏色三階矩(si),表征顏色分量的偏度性,即不對稱性。
(19)
蟻群算法是一種模擬螞蟻覓食行為的優(yōu)化算法,在解決旅行商問題、多目標(biāo)優(yōu)化等方面有廣泛應(yīng)用[16]。利用蟻群算法優(yōu)化原始特征空間,選取最優(yōu)特征組合,其基本過程如下:
1)螞蟻在覓食的過程中會在行走路徑上釋放信息素。
2)當(dāng)螞蟻碰到有沒走過的路口時(shí),會隨機(jī)挑選一條路走,同時(shí)釋放信息素。信息素的含量與行走的路徑長度相關(guān),行走路徑越長,信息素的含量越低,路徑越短,信息素含量越高。
3)當(dāng)后來的螞蟻再次經(jīng)過該路口時(shí),會選擇信息素含量較高的路徑。
4)最優(yōu)路徑上的信息素含量越來越高,其他路徑上的信息素含量越來越低。
5)最終蟻群尋找到最優(yōu)路徑。
螢火蟲算法(Firely algorithm,F(xiàn)A)是一種啟發(fā)式算法,靈感來源于螢火蟲的閃爍行為[17-18]。利用螢火蟲算法優(yōu)化支持向量機(jī)參數(shù),以適應(yīng)度函數(shù)作為參數(shù)選擇依據(jù)。支持向量機(jī)是一種有監(jiān)督學(xué)習(xí)的二分類模型,通過尋求結(jié)構(gòu)化風(fēng)險(xiǎn)最小來提高學(xué)習(xí)機(jī)的泛化能力。將線性不可分的問題映射到高維空間,建立分類超平面,實(shí)現(xiàn)高維空間中的線性可分[19-21]。利用螢火蟲算法優(yōu)化支持向量機(jī)參數(shù),尋找最佳懲罰因子(c)與徑向基核函數(shù)參數(shù)(g)參數(shù)組合,以達(dá)到更好的分類效果。
由圖1、2可知,2種病害的中期病斑與葉片在顏色和紋理上有明顯的不同。利用中值濾波方法對樣本圖像進(jìn)行濾除處理,利用超綠分割算法分割出葉片圖像,結(jié)合連通區(qū)域標(biāo)記法去除小面積樣本,消除噪聲影響。對分割出的葉片圖像進(jìn)行二值化操作,并進(jìn)行取反,得到病斑二值圖像如圖3所示。
圖3 煙草中期赤星病與蛙眼病病斑二值化Fig.3 Binary of mid-term brown spot and frog eye disease of tabacco
利用病斑的二值圖像對原始樣本圖像進(jìn)行處理,去除葉片背景,得到2種病害的病斑圖像,如圖4所示。
由圖3、4可知,該方法有效去除了葉片背景,分割出2種病害的病斑圖像,有利于后續(xù)的特征提取。且2種病害在中期的病斑圖像有明顯的不同,其形狀、顏色和紋理有較大的差異。
試驗(yàn)利用蟻群算法優(yōu)化原始特征空間,以適應(yīng)度函數(shù)作為特征選擇依據(jù)。在蟻群算法中,設(shè)置螞蟻數(shù)量為50個(gè),信息度啟發(fā)因子為1,期望值啟發(fā)因子為3,信息素?fù)]發(fā)因子為0.6,信息素增量為10,最大迭代次數(shù)為100次。設(shè)置15次特征優(yōu)化組合,記錄每次的適應(yīng)度值及交叉驗(yàn)證率。
圖4 煙草赤星病與蛙眼病中期病斑Fig.4 Mid-term of brown spot and frog eye disease
由表1可知,當(dāng)選擇特征組合為第10組時(shí),適應(yīng)度值和交叉驗(yàn)證率均達(dá)到最高,分別為95.68和93.21%。此時(shí)選擇的特征組合為R1、B3、H1、S1、H2、V2、S3、矩形度、復(fù)雜性、能量、對比度、熵、平均灰度共計(jì)13個(gè)特征。
表1 特征優(yōu)化選擇結(jié)果Tab.1 Result of feature optimization
本研究共采集1 200張病斑圖像樣本(早、中、晚期各200張樣本),把其中的900張作為訓(xùn)練集,剩下的300張作為測試集。根據(jù)優(yōu)化后的特征組合,利用螢火蟲算法優(yōu)化支持向量機(jī)的、參數(shù),并對2種病斑進(jìn)行判別。在蟻群算法中,設(shè)置種群規(guī)模為20個(gè),待優(yōu)化參數(shù)為2個(gè),參數(shù)取值范圍為[0.01,100],最大迭代次數(shù)為50次,當(dāng)c=94.12、g=2.43時(shí),識別率達(dá)到96%,如表2所示。由表2可知,煙草蛙眼病與赤星病早期病斑圖像共有8張被誤識,其早期病斑圖像識別率為92%。2種病害早、中和晚期的病斑圖像共有12張被誤識,對2種病害不同時(shí)期的整體識別率為96%。由識別結(jié)果可知,利用機(jī)器學(xué)習(xí)的方法可有效識別出煙草蛙眼病和赤星病2種病害。
表2 煙草赤星病與蛙眼病識別Tab.2 The recognition of brown spot and frog eye disease
前人利用數(shù)字圖像處理、特征融合等技術(shù)方法對煙草病斑區(qū)域進(jìn)行檢測,實(shí)現(xiàn)了對病斑圖像的提取與識別,但對早期煙草病害識別的研究較少,且達(dá)不到理想的識別效果[22-24]。本研究提出一種基于機(jī)器視覺的煙草早期病害識別方法。利用可見光采集病害圖像樣本,具有高效、操作簡單等優(yōu)點(diǎn)。運(yùn)用蟻群算法優(yōu)化原始特征空間,選取最優(yōu)特征組合,降低特征的維數(shù),便于分析和處理。利用螢火蟲算法優(yōu)化支持向量機(jī)的參數(shù),選取最佳參數(shù)組合,提高了分類器性能。
前人利用各種技術(shù)對植物病害進(jìn)行識別,取得了一定的成果,但大都是以病害的中、后期為研究對象,此時(shí)已造成了作物減產(chǎn),不能夠及時(shí)提供合理的防治措施。本研究對病害的早、中、晚期進(jìn)行系統(tǒng)的分析。赤星病與蛙眼病2種病害的早期病斑在顏色、紋理和形態(tài)上都較為相似,難以對不同病害采取及時(shí)有效的防治,傳統(tǒng)的識別需要依靠專家和農(nóng)戶的經(jīng)驗(yàn)進(jìn)行判斷,容易造成誤判,錯(cuò)過最佳防治時(shí)機(jī)。通過機(jī)器學(xué)習(xí)的方法可以有效避免人為的主觀性,達(dá)到更加精確的識別效果。本研究表明,利用螢火蟲算法優(yōu)化支持向量機(jī)技術(shù)對煙草蛙眼病和赤星病進(jìn)行判別,早期2種病斑的識別率達(dá)到92%,整體識別率達(dá)到了96%,有效識別出煙草赤星病與蛙眼病,可為制定合理的防治措施提供科學(xué)依據(jù)。但同時(shí)該方法也存在一些不足的地方,可能存在更好表達(dá)早期不同病害差異的特征未被提取,如若能利用深度卷積神經(jīng)網(wǎng)絡(luò)等新技術(shù)對不同病害進(jìn)行識別,可以在一定程度上避免因特征提取帶來的誤差,進(jìn)一步提高識別率,實(shí)現(xiàn)更加精確的判別,這也是下一步研究的重點(diǎn)。