趙子皓,楊再強(qiáng)
(南京信息工程大學(xué)氣象災(zāi)害預(yù)報(bào)預(yù)警與評(píng)估協(xié)同創(chuàng)新中心,江蘇 南京 210044)
番茄是一種常見的蔬果,在全國各地普遍種植,其品質(zhì)與產(chǎn)量是人們最關(guān)心的問題。在番茄生長(zhǎng)過程中,受到環(huán)境、氣候等因素影響,會(huì)出現(xiàn)不同病癥,降低產(chǎn)量,造成經(jīng)濟(jì)損失。所以,番茄病害防治尤為重要。以往的防治工作通常憑借菜農(nóng)經(jīng)驗(yàn)進(jìn)行判斷,主觀性強(qiáng)且精度高,能起到病蟲害防治效果,但人工能力有限,檢測(cè)效率完全不能滿足實(shí)際需求,普適性較差,難以在短時(shí)間內(nèi)制定針對(duì)性強(qiáng)的防治措施,容易耽誤最佳防治時(shí)間。
為解決上述問題,有關(guān)學(xué)者紛紛將現(xiàn)代化技術(shù)應(yīng)用到番茄病害防治中。例如,胡志偉[1]等人研究一種注意力機(jī)制番茄病害識(shí)別算法。利用多層注意力模塊,分層提取病害分類信息;建立殘差模塊融合特征模型,引入數(shù)據(jù)擴(kuò)充技術(shù)完成番茄病害圖像識(shí)別。柴帥[2]等人利用遷移學(xué)習(xí)機(jī)制對(duì)番茄病蟲害進(jìn)行檢測(cè)。通過圖像預(yù)處理,增強(qiáng)圖像質(zhì)量,使用訓(xùn)練成熟的多結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)模型提取病害特征,采用支持向量機(jī)分類病害特征,達(dá)到病害識(shí)別目的。
由于番茄不同病害類型表現(xiàn)出的特征具有相似性,導(dǎo)致以上方法識(shí)別精度較低。因此,本文利用構(gòu)造性核函數(shù)算法識(shí)別番茄病害圖像。該方法是神經(jīng)網(wǎng)絡(luò)[3]與支持向量機(jī)[4]的融合,可有效處理高維數(shù)據(jù),最大特點(diǎn)是將數(shù)據(jù)映射到核空間內(nèi),并在該空間使用覆蓋算法求解。因結(jié)合了全局最優(yōu)思想,使覆蓋鄰域減少,不但識(shí)別過程簡(jiǎn)單,得出的結(jié)果也更為精準(zhǔn)。
圖像預(yù)處理要求保證原有信息不發(fā)生改變,僅在視覺上改善畫質(zhì),提高可識(shí)別性。圖像去噪是預(yù)處理的主要內(nèi)容,指將圖像干擾噪聲去除,增強(qiáng)信噪比。
均值濾波[5]是在像素空間域基礎(chǔ)上完成的,通過獲取像素點(diǎn)加權(quán)平均值來抑制圖像噪聲。將像素大小設(shè)置為M×N,圖像中心點(diǎn)表示為(x,y),該點(diǎn)的周圍點(diǎn)叫做鄰域,計(jì)算(x,y)鄰域中全部點(diǎn)灰度值的平均值,并替換(x,y)點(diǎn)的初始像素值,表達(dá)式為
(1)
式中,x=0,1,…,M,y=0,1,…,N-1,S表示圖像內(nèi)全部點(diǎn)坐標(biāo)集合,M為全部坐標(biāo)點(diǎn),f(x,y)描述初始圖像噪聲點(diǎn),經(jīng)過平滑處理的噪聲點(diǎn)g(x,y)由式(1)得出。
開、閉運(yùn)算是由腐蝕、膨脹運(yùn)算發(fā)展而來的,主要作用是去除孤立點(diǎn),減少毛刺,抑制邊界模糊[6]。其中,開運(yùn)算過程為先腐蝕、后膨脹,表達(dá)式如下
X°B=(XΘB)⊕B
(2)
上述公式代表元素B對(duì)圖像X進(jìn)行計(jì)算,經(jīng)過計(jì)算后,結(jié)構(gòu)集合中的元素必須大于計(jì)算前。閉運(yùn)算表達(dá)式為
X·B=(X⊕B)ΘB
(3)
式(3)與式(2)具有對(duì)偶關(guān)系。
本文使用最大類間方差法分割圖像,該方法結(jié)合圖像灰度值,將圖像分割成背景、目標(biāo)兩個(gè)區(qū)域,更有利于圖像識(shí)別[7]。背景與目標(biāo)之間的灰度值類間方差決定二者誤判率,方差越大,二者差距越顯著。分割過程如下
設(shè)置目標(biāo)圖像灰度值,通常為0~(L-1),假設(shè)圖像某點(diǎn)坐標(biāo)為(x,y),其鄰域平均灰度值H(x,y)的計(jì)算公式如下
(4)
式中,B代表鄰域?qū)挾?,F(xiàn)(x,y)為圖像出現(xiàn)幾率。如果圖像像素表示為(M×N),點(diǎn)(x,y)的概率密度[8]表示為
L(x,y)=F(x,y)/(M×N),0 (5) (6) 為方便理解,使用二維直方圖描述目標(biāo)與背景之間的關(guān)系,假設(shè)(S′,T)是直方圖中的閾值,A′與B′分別代表背景與噪聲,C與D分別表示邊緣部分與目標(biāo),背景與目標(biāo)出現(xiàn)的幾率分別記作b0和m1[9]。 (7) (8) 如果不考慮噪聲影響,b0+m1=1,目標(biāo)與背景的整體均值表達(dá)式為 (9) 因此,獲得目標(biāo)、背景之間的閾值表達(dá)式 Q=b0[(R0x-Zx)2+(R0y-Zy)2] +m1[(R1x-Zy)2+(R1j-Zy)2] =[b0(S′,T)Zx-Rx(S′,T)2+(b0(S′,T)Zy)- Ry(S′,T)2]/[b0(S′,T)(1-b0)(S′,T)] (10) 利用上述公式計(jì)算圖像中的全部像素點(diǎn),即可實(shí)現(xiàn)目標(biāo)與背景分離。 經(jīng)過圖像預(yù)處理后,畫質(zhì)得到增強(qiáng),通過特征提取能獲得更多的病害特征。本文通過對(duì)番茄葉片顏色、形狀特征的提取,將其作為識(shí)別依據(jù),提高識(shí)別精度。 3.1.1 顏色特征 與其它特征相比,顏色特征更加直觀,且對(duì)方向、形狀具有不敏感特點(diǎn),僅需要將圖像顏色特征轉(zhuǎn)換為數(shù)值形式即可,本文利用直方圖完成顏色特征提取。通過直方圖形式描述不同顏色像素?cái)?shù)量占整體圖像像素總量大小。其中,直方圖橫軸表示顏色等級(jí),縱軸則是顏色比例[10]。直方圖不但可以體現(xiàn)出顏色大小,還能表現(xiàn)出顏色種類等信息。 直方圖的構(gòu)建需選取恰當(dāng)?shù)念伾臻g,保證信息表達(dá)的完整性,RGB(紅、綠、藍(lán))為一種常用的描述方式,利用RGB空間提取顏色特征的模型可表示為 (11) (12) (13) 3.1.2 形狀特征 利用相關(guān)經(jīng)驗(yàn),結(jié)合病斑形狀特征區(qū)分病害種類,再將先驗(yàn)知識(shí)變換為計(jì)算機(jī)可識(shí)別的語言,通過計(jì)算機(jī)給出病害判斷結(jié)果,這是現(xiàn)階段農(nóng)業(yè)領(lǐng)域發(fā)展的主要趨勢(shì)。番茄病害區(qū)和正常區(qū)域相比,病斑形狀較為明顯,針對(duì)圖像而言,形狀特點(diǎn)屬于物體本質(zhì)特征,不會(huì)受到旋轉(zhuǎn)、平移等操作影響。但是在檢測(cè)形狀特征時(shí),由于形狀的局限性與相似性,會(huì)干擾視覺判斷結(jié)果。 本文將形狀特征分為輪廓特征與紋理特征兩種。前者是對(duì)目標(biāo)邊界進(jìn)行分析,后者則需仔細(xì)探究病斑區(qū)域紋理細(xì)節(jié)。 1)邊界特征提取 此方法描述目標(biāo)邊界特征,將獲得的結(jié)果當(dāng)作形狀特征參數(shù)。經(jīng)過Hough變換[11],連接全局特征與目標(biāo)部分特征的邊界像素,構(gòu)成封閉區(qū)域;構(gòu)建邊界部分大小和方向的直方圖,根據(jù)該圖即可獲取邊界特征。 2)紋理特征提取 與邊界特征不同的是,紋理特征能反映目標(biāo)形狀以及更加深層的信息[12]。如果只依靠視覺,一些紋理特征無法提取。因此,需要通過計(jì)算機(jī)技術(shù),處理圖像內(nèi)部灰度,再將處理后的信息變換為語言。紋理與色彩特征不同,它并不是在某個(gè)像素點(diǎn)的基礎(chǔ)上完成計(jì)算,而是針對(duì)多個(gè)像素點(diǎn)。即使紋理特征在旋轉(zhuǎn)等作用下不會(huì)發(fā)生改變,但易受光照等條件影響,改變分辨率,降低特征提取準(zhǔn)確性。 為避免上述現(xiàn)象發(fā)生,使用灰度級(jí)共生矩陣提取紋理特征。此矩陣表示一種概率,即灰度值為v的像素點(diǎn)在長(zhǎng)度是d′、方向是θ上生成灰度值是j的幾率,也可以當(dāng)作對(duì)圖像灰度值概率密度的預(yù)測(cè),共生矩陣能夠最大程度體現(xiàn)像素點(diǎn)的紋理特征。本文結(jié)合矩陣對(duì)比度、相關(guān)性、能量等變量完成紋理特征提取。 已知某圖像X的像素為M×N,灰度級(jí)設(shè)置為G′級(jí),則圖像共生矩陣表示為 P(x,y,d′,θ)=P(I(l,w)) =(l+d′cos(θ),w+d′sin(θ)=y) (14) 式中,I(l,w)表示像素點(diǎn)(l,w)的灰度,d′為點(diǎn)(x,y)存在的距離,θ屬于兩點(diǎn)之間夾角。如果P為G′×G′結(jié)構(gòu)的矩陣,此時(shí)d′與角度θ一經(jīng)確定,不同角度下的共生矩陣,即可結(jié)合兩點(diǎn)之間的距離和夾角計(jì)算得出。為方便矩陣計(jì)算,一般選取的夾角度數(shù)為θ={0°,45°,90°,135°},因此有 (15) 最后,歸一化處理不同灰度共生矩陣即可實(shí)現(xiàn)紋理特征提取。 經(jīng)過圖像預(yù)處理和特征提取后,以提取的病害特征為依據(jù),引入核函數(shù),建立覆蓋領(lǐng)域,實(shí)現(xiàn)病害圖像識(shí)別。 若已知某圖像的輸入集合表示為K={(x1,y1),(x2,y2),…,(xp,yp)},其中K代表n維空間中像素點(diǎn)集合,集合中樣本數(shù)量為p。將K分割成ζ個(gè)子集合,構(gòu)建三層網(wǎng)絡(luò)N*,令其符合如下要求:經(jīng)過該網(wǎng)絡(luò)后,屬于Ki′的點(diǎn)輸出值均為yi′,且yi′=(0,…,1,0,…,0),即第i′個(gè)分量等于1,其它分量等于0。則利用構(gòu)造性核覆蓋算法識(shí)別病害圖像的過程如下: 任意選擇某核函數(shù)K(x,y),做如下變換 T′:O→Z,x∈O,〈T′(x),T′(y)〉=K(x,y) (16) 整個(gè)轉(zhuǎn)換過程可描述為:在n維超平面O中,變換T′將O平面上的點(diǎn)映射在p核空間中,則核空間輸入集合表示為pT′,此種變換具有一一對(duì)應(yīng)特征。 在核空間中,設(shè)定輸出集合Y的前a個(gè)值都不同,經(jīng)過上述變換后,能夠計(jì)算出核空間內(nèi)的覆蓋Ci′,計(jì)算過程如下 步驟一:在樣本集合內(nèi)任意挑選一個(gè)xi′,確保xi′∈pT′,且同時(shí)滿足如下條件 (17) (18) (19) (20) 結(jié)合xi′與di′建立覆蓋Ci′,此覆蓋中心是xi′,覆蓋半徑為di′。 步驟二:建立覆蓋后,刪除pT′中已經(jīng)被Ci′覆蓋的點(diǎn),再從pT′內(nèi)選出一個(gè)覆蓋中心,經(jīng)過多次操作后,直到所有點(diǎn)均被刪除后,整個(gè)覆蓋領(lǐng)域建立,也就完成了對(duì)所有病害圖像的識(shí)別。該方法增加了求優(yōu)過程,且先從局部區(qū)域考慮覆蓋問題,由局部向整體延伸,保障了識(shí)別的全面性,提高了識(shí)別精度。 仿真中,選取下述三種典型的番茄病害類型為識(shí)別目標(biāo),病害特征描述如下。 1)白粉?。弘m然危害不高,但分布范圍廣。一般表現(xiàn)為在番茄葉片上生成細(xì)小粉斑,到后期會(huì)擴(kuò)展成白粉斑,且粉狀越來越密集,逐漸遍布整個(gè)葉片。 2)番茄疫?。翰『Τ跗谠谌~片上形成圓斑,逐漸發(fā)展為不規(guī)則病斑,由中心向外擴(kuò)散,當(dāng)空氣潮濕時(shí)還會(huì)出現(xiàn)黑霉。 3)黃化曲葉?。呵捌诎Y狀為葉片皺縮并伴有發(fā)黃現(xiàn)象,使植株發(fā)育矮小。該病害通常在開花結(jié)果時(shí)間段發(fā)病,到后期整個(gè)葉片都會(huì)發(fā)黃,且葉片卷曲,嚴(yán)重時(shí)還會(huì)出現(xiàn)腐爛癥狀。 本次實(shí)驗(yàn)共采集番茄病害葉片圖像700幅,其中,健康圖像100幅,白粉病、番茄疫病、黃化曲葉病各200幅。首先對(duì)本文方法、注意力機(jī)制算法、遷移學(xué)習(xí)機(jī)制三種算法的圖像預(yù)處理效果進(jìn)行對(duì)比。選取四幅不同類型番茄葉片圖像,預(yù)處理結(jié)果分別如圖1-4所示。 圖1 初始圖像效果 圖2 本文方法圖像預(yù)處理效果 圖3 注意力機(jī)制預(yù)處理效果 圖4 遷移學(xué)習(xí)機(jī)制算法處理效果 由圖1-4能夠看出,本文方法圖像預(yù)處理效果最好,圖像畫質(zhì)得到明顯改善。注意力機(jī)制算法雖然也得到了清晰的番茄葉片圖像,但葉片細(xì)節(jié)特征無法顯現(xiàn);遷移學(xué)習(xí)機(jī)制對(duì)圖像邊緣部分處理不夠完善,且在部分圖像中還會(huì)遮擋葉片主要特征。本文之所以得到質(zhì)量較高的圖像是因?yàn)椋禐V波算法能夠有效去除圖像噪聲,再通過最大類間方差法實(shí)現(xiàn)背景分離,進(jìn)一步提高畫質(zhì)。 經(jīng)過圖像處理后,對(duì)這些圖像進(jìn)行病害識(shí)別,引入平均識(shí)別率指標(biāo)來驗(yàn)證三種算法識(shí)別性能,該指標(biāo)值越高,表明識(shí)別效果越好。計(jì)算公式如下 (21) 圖5 不同方法識(shí)別效果對(duì)比圖 分析識(shí)別結(jié)果可以發(fā)現(xiàn),本文方法無論對(duì)于哪種病害圖片,識(shí)別率都在95%以上。而其它兩種對(duì)于白粉病的識(shí)別率較低,這是因?yàn)榘追鄄≡诔跗诎Y狀較輕,白點(diǎn)較小,如果圖像清晰度不夠難以識(shí)別出來。 本文方法預(yù)處理后的圖像信噪比高,從多方面完成特征提取,再加上構(gòu)造性核覆蓋算法添加了合適的核函數(shù),實(shí)質(zhì)就是增加一次尋優(yōu)操作,使識(shí)別劃分邊界更加清晰,進(jìn)而提高識(shí)別效果。 為提高番茄病害識(shí)別效果,構(gòu)建一種基于構(gòu)造性核函數(shù)的病害圖像識(shí)別方法。在識(shí)別開始之前,對(duì)圖像進(jìn)行去噪處理,提高信噪比,再通過多方位特征提取,獲取各類病害特征,最后在核空間內(nèi)完成圖像識(shí)別。仿真結(jié)果證明了該方法可以準(zhǔn)確識(shí)別出番茄各類病害,為病害治理提供依據(jù)。但本次實(shí)驗(yàn)樣本容量范圍小,獲取的結(jié)果還有待提升。在今后研究中挖掘更多病害樣本,針對(duì)大容量樣本開展實(shí)驗(yàn),進(jìn)一步證明該方法在病害識(shí)別中的實(shí)用性。3 基于構(gòu)造性核函數(shù)的病害圖像識(shí)別
3.1 病害特征提取
3.2 核空間內(nèi)番茄病害圖像識(shí)別實(shí)現(xiàn)
4 仿真數(shù)據(jù)分析與研究
5 結(jié)論