趙川源 何東健 LEE Won Suk
(1.西北農(nóng)林科技大學(xué)機(jī)械與電子工程學(xué)院, 陜西楊凌 712100; 2.農(nóng)業(yè)部農(nóng)業(yè)物聯(lián)網(wǎng)重點(diǎn)實(shí)驗(yàn)室, 陜西楊凌 712100;3.佛羅里達(dá)大學(xué)農(nóng)業(yè)與生物工程學(xué)院, 蓋恩斯維爾 FL 32611)
柑橘黑斑病反射光譜特性與染病果實(shí)檢測(cè)方法研究
趙川源1,2何東健1,2LEE Won Suk3
(1.西北農(nóng)林科技大學(xué)機(jī)械與電子工程學(xué)院, 陜西楊凌 712100; 2.農(nóng)業(yè)部農(nóng)業(yè)物聯(lián)網(wǎng)重點(diǎn)實(shí)驗(yàn)室, 陜西楊凌 712100;3.佛羅里達(dá)大學(xué)農(nóng)業(yè)與生物工程學(xué)院, 蓋恩斯維爾 FL 32611)
通過(guò)對(duì)光譜儀采集的340~1 030 nm柑橘健康與感染黑斑區(qū)域光譜進(jìn)行分析,在探明健康和黑斑病不同癥狀光譜特性的基礎(chǔ)上,提出主成分分析結(jié)合特征排序的方法,選擇出可識(shí)別染病與健康樣本的最優(yōu)波長(zhǎng)(525 nm)建立SMO分類(lèi)模型;基于序列浮動(dòng)前向選擇方法優(yōu)選出4個(gè)特征波長(zhǎng)(678、740、794、879 nm),建立C4.5算法識(shí)別柑橘黑斑病3種癥狀的方法。試驗(yàn)結(jié)果表明,用525 nm波長(zhǎng)建立的SMO分類(lèi)模型對(duì)健康和染病果樣本的識(shí)別率達(dá)99.37%,硬斑型、破裂型和黑斑型癥狀的識(shí)別率分別為81.85%、71.88%和67.57%, 3種癥狀的平均識(shí)別率為73.77%,比前人方法提高了12.77個(gè)百分點(diǎn)。
柑橘黑斑病; 光譜特性; 特征選擇; 識(shí)別模型; 主成分分析
柑橘是美國(guó)佛羅里達(dá)州的重要果類(lèi),占全美柑橘總產(chǎn)量的65%[1]。在柑橘生產(chǎn)中,由柑橘球座菌(Guignardiacitricarp)引起的柑橘黑斑病(Citrus black spot,CBS)是常見(jiàn)病害之一,幾乎所有柑橘品種都會(huì)受到黑斑病的感染。雖然目前無(wú)報(bào)告顯示黑斑病會(huì)對(duì)柑橘內(nèi)部果實(shí)品質(zhì)造成影響,但其影響果實(shí)的外觀品質(zhì),從而影響果實(shí)在市場(chǎng)上的銷(xiāo)售價(jià)格。黑斑病也會(huì)造成果實(shí)在成熟期前落果,嚴(yán)重影響柑橘產(chǎn)量,還會(huì)導(dǎo)致儲(chǔ)藏期果實(shí)腐爛,對(duì)新鮮柑橘市場(chǎng)造成潛在影響[2-4]。若能在果園中有效地控制黑斑病,及時(shí)移除被感染果實(shí),則可減少柑橘生產(chǎn)損失。因此,尋求一種能夠快速、無(wú)損檢測(cè)黑斑病的方法具有實(shí)際意義。
機(jī)器視覺(jué)技術(shù)的應(yīng)用對(duì)食品和農(nóng)產(chǎn)品質(zhì)量評(píng)價(jià)和無(wú)損檢測(cè)提供了巨大的潛力[5-10]。PYDIPATI等[11]提出在實(shí)驗(yàn)室環(huán)境下,利用基于HSI顏色空間的共生矩陣紋理特征識(shí)別不同柑橘葉片病害的方法, 識(shí)別準(zhǔn)確率最高達(dá)到100%。BLASCO等[12]研究基于近紅外、紫外線等機(jī)器視覺(jué)技術(shù)檢測(cè)柑橘果實(shí)常見(jiàn)損傷,結(jié)合不同光譜信息對(duì)不同損傷類(lèi)型果實(shí)進(jìn)行分類(lèi),結(jié)果表明,與彩色圖像檢測(cè)結(jié)果相比,用近紅外光譜圖像可將缺陷的識(shí)別精度從86%提高到95%。
黑斑病在果實(shí)表皮上有多種不同癥狀,使得對(duì)黑斑病的檢測(cè)造成一定困難。硬斑型黑斑病是黑斑病中最常見(jiàn)且最典型的一種癥狀,它多呈凹陷的小圓形,周邊呈紅棕色而中間為褐色。破裂型黑斑病在果皮表面表現(xiàn)為大而平的深棕色病斑,有些會(huì)有凸起的裂痕。黑斑型黑斑病通常是多種病斑的融合,并且在果實(shí)表面占據(jù)很大部分[13]。黑霉病癥狀類(lèi)型的識(shí)別,對(duì)研究黑斑病菌誘因與黑斑病形態(tài)之間關(guān)系具有重要意義。近年來(lái),基于光譜技術(shù)來(lái)檢測(cè)食品和農(nóng)產(chǎn)品內(nèi)部或外部品質(zhì)取得了不少成果[14-19]。QIN等[20]獲取450~930 nm的柑橘高光譜圖像,用基于光譜信息散度(SID)分類(lèi)方法對(duì)柑橘潰瘍病進(jìn)行檢測(cè),識(shí)別率達(dá)到96.2%。BULANON等[21]研究了基于高光譜圖像的柑橘黑斑病檢測(cè),根據(jù)波長(zhǎng)比與波長(zhǎng)差特性,選取了493、629、713、781 nm作為最佳波長(zhǎng),通過(guò)人工神經(jīng)網(wǎng)絡(luò)和線性判別分析檢測(cè)黑斑病,檢測(cè)準(zhǔn)確率達(dá)到92%。為了進(jìn)一步探索不同癥狀柑橘黑斑病的檢測(cè),ZHAO等[22]應(yīng)用高光譜圖像對(duì)柑橘黑斑病不同表現(xiàn)癥狀進(jìn)行檢測(cè),對(duì)5種癥狀在396~1 010 nm進(jìn)行光譜特性分析后,通過(guò)特征選擇選取最佳波長(zhǎng),黑斑病的識(shí)別準(zhǔn)確率可達(dá)到98%,但對(duì)每種癥狀的識(shí)別率較低,只有61%左右。
高光譜圖像技術(shù)可以較好地識(shí)別柑橘黑斑病,但各種癥狀的識(shí)別率較低,且高光譜設(shè)備價(jià)格昂貴,性能受復(fù)雜環(huán)境因素影響,使用條件要求嚴(yán)格使得高光譜系統(tǒng)難以在田間實(shí)際應(yīng)用和推廣,迫切需要研究能用于柑橘黑斑病田間實(shí)時(shí)檢測(cè)的技術(shù)和方法。
本文以開(kāi)發(fā)果園中實(shí)際應(yīng)用的柑橘黑斑病實(shí)時(shí)檢測(cè)多光譜技術(shù)為目標(biāo),用便攜式光譜儀采集橘柑果實(shí)光譜數(shù)據(jù),探明健康和黑斑病不同癥狀的光譜特性,研究有效識(shí)別健康與染病柑橘的模型與方法,以及3種常見(jiàn)黑斑病癥狀的識(shí)別方法,為果園快速檢測(cè)柑橘黑斑病提供依據(jù)。
1.1 供試柑橘樣本
供試柑橘于2015年4月在美國(guó)佛羅里達(dá)州Immokalee附近的果園采摘。135個(gè)柑橘樣本中,黑斑病感染的柑橘果實(shí)105個(gè),未染病的健康柑橘果實(shí)30個(gè)。采摘的柑橘樣本被送往佛羅里達(dá)大學(xué)精準(zhǔn)農(nóng)業(yè)實(shí)驗(yàn)室用于試驗(yàn)。
數(shù)據(jù)采集之前,用水對(duì)柑橘樣本進(jìn)行清洗,并將表面擦拭干凈。為了后續(xù)研究方便,在每個(gè)染病柑橘的表面,隨機(jī)選取最多5個(gè)病斑,并以病斑為中心,用黑色記號(hào)筆標(biāo)記出直徑約為10 mm的圓形。為了與染病樣本進(jìn)行對(duì)比,在每個(gè)健康柑橘的表面也隨機(jī)標(biāo)記出5個(gè)直徑約10 mm的圓形。本文供試數(shù)據(jù)為標(biāo)記的150個(gè)健康樣本區(qū)域以及487個(gè)黑斑病區(qū)域,其中,487個(gè)黑斑病樣本中,硬斑型、破裂型和黑斑型樣本分別為270、32和185個(gè)。標(biāo)記后的健康果實(shí)與黑斑病中常見(jiàn)癥狀病斑樣本圖像如圖1所示。
1.2 光譜數(shù)據(jù)采集
本研究采用USB2000+微型光纖光譜儀 (Ocean Optics公司)獲取柑橘的光譜反射值,光譜儀系統(tǒng)連接如圖2所示。
圖1 標(biāo)記的健康果實(shí)和3種黑斑病癥狀示例Fig.1 Representative images for marked healthy fruit and fruits with three CBS symptoms
圖2 便攜式USB2000+微型光纖光譜儀Fig.2 Portable USB2000+spectrometer1.光源 2.RPH-1型反射探頭架 3.光纖反射探頭 4.光譜儀
USB2000+微型光纖光譜儀的光譜范圍為340~1 030 nm,光譜分辨率為0.3 nm,光學(xué)分辨率為0.1 nm。光譜儀由USB 2.0的接口與計(jì)算機(jī)連接,通過(guò)內(nèi)徑為600 μm的QR600-7-SR-125F型光纖反射探頭(Ocean Optics公司)與光譜儀連接,手持光纖反射探頭與待檢測(cè)物體接觸,測(cè)得接觸點(diǎn)340~1 030 nm的光譜信息,并通過(guò)計(jì)算機(jī)進(jìn)行保存。
為了保證探頭在接觸物體表面時(shí)保持45°不變,使用RPH-1型反射探頭架(Ocean Optics公司),將反射探頭架與待檢測(cè)物體表面相接觸,再將光纖反射探頭從45°孔中深入,對(duì)物體進(jìn)行光譜檢測(cè)。在每次測(cè)量前,用反射率為99%的SRS-99-020標(biāo)準(zhǔn)參考板(Labsphere公司)對(duì)光譜儀進(jìn)行校正。采集數(shù)據(jù)時(shí),保持室內(nèi)溫度25℃左右,相對(duì)濕度為65%~70%。為降低光譜檢測(cè)中產(chǎn)生的噪聲,在開(kāi)始試驗(yàn)前45 min,提前將光源(LS-1型鹵鎢光源,Ocean Optics公司)打開(kāi),以確保在試驗(yàn)過(guò)程中,光源處于平穩(wěn)狀態(tài)。
獲取柑橘的光譜數(shù)據(jù)后,在Matlab R2012a和懷卡托智能分析環(huán)境下,按照數(shù)據(jù)預(yù)處理、特征波段選擇及分類(lèi)器的構(gòu)建等步驟,識(shí)別健康和染病果實(shí),進(jìn)一步選擇特征波長(zhǎng)并構(gòu)建最優(yōu)分類(lèi)器以識(shí)別染病果實(shí)的不同癥狀。
1.3 數(shù)據(jù)預(yù)處理
由USB2000+微型光纖光譜儀采集到的柑橘樣本光譜數(shù)據(jù),包含340~1 030 nm區(qū)間共2 048個(gè)波長(zhǎng)。為了減少儀器及外界環(huán)境等因素對(duì)光譜數(shù)據(jù)的影響,舍去前160個(gè)噪聲較大波長(zhǎng)的光譜值,用剩余400~1 030 nm的1888個(gè)波長(zhǎng)的光譜值進(jìn)行分析。
為消除光譜數(shù)據(jù)中的噪聲,需要對(duì)光譜數(shù)據(jù)進(jìn)行平滑處理??紤]到Savitzky-Golay平滑濾波器[23]可在消除光譜數(shù)據(jù)噪聲的同時(shí),保持光譜形狀和相應(yīng)的光譜特性,故本文采用Savitzky-Golay平滑濾波器對(duì)光譜數(shù)據(jù)進(jìn)行平滑去噪。該方法基于低維線性最小二乘法多項(xiàng)式,實(shí)現(xiàn)相鄰連續(xù)數(shù)據(jù)點(diǎn)的擬合。根據(jù)經(jīng)驗(yàn),應(yīng)用四階最小二乘多項(xiàng)式,選擇平滑點(diǎn)左、右各20個(gè)點(diǎn)。
1.4 特征波段選擇
光譜數(shù)據(jù)包含豐富的信息含量,但是光譜各波段之間信息的關(guān)聯(lián)性導(dǎo)致冗余信息也相應(yīng)較多。為了準(zhǔn)確識(shí)別健康與染病樣本,需要特征波段選擇等降維處理,以減少光譜數(shù)據(jù)的特征維數(shù),剔除不相關(guān)或冗余的特征,降低計(jì)算時(shí)間,增強(qiáng)模型的泛化能力,提高不同染病癥狀的識(shí)別率。常用特征波段選擇方法主要有主成分分析(Principal component analysis,PCA)、序列浮動(dòng)前向選擇(Sequential floating forward selection,SFFS)及互信息(Mutual information,MI)等,考慮到各種方法在特征選擇時(shí)的局限性,本文通過(guò)分析不同方法選擇特征的識(shí)別效果,探明適合柑橘黑斑病識(shí)別的特征波段。
(1)主成分分析
主成分分析(PCA)通過(guò)正交線性變換將原始相關(guān)變量轉(zhuǎn)換成一組不相關(guān)的新變量,即主成分。將預(yù)處理后637×1 888的Temp數(shù)據(jù)分為健康與染病2類(lèi)樣本作PCA分析,分別得到特征向量矩陣COEF、對(duì)原始數(shù)據(jù)解析生成的新的數(shù)據(jù)Score以及新生成的數(shù)據(jù)對(duì)應(yīng)的貢獻(xiàn)率(協(xié)方差矩陣的特征值)LATENT。通過(guò)計(jì)算數(shù)據(jù)Temp與新生成的主成分?jǐn)?shù)據(jù)Score之間的相關(guān)系數(shù),得到各主成分的載荷,選取前幾個(gè)表示了大部分信息的主成分載荷做進(jìn)一步的分析。
(2)序列浮動(dòng)前向選擇
序列浮動(dòng)前向選擇算法(SFFS)是在序列前向選擇(SFS)基礎(chǔ)上的改進(jìn)[24-25]。結(jié)合本研究所處理的高維數(shù)據(jù),這里選擇K最近鄰分類(lèi)器(KNN)作為選擇特征的評(píng)價(jià)函數(shù),K取值設(shè)置為5。從空集開(kāi)始,每當(dāng)選擇1個(gè)特征波長(zhǎng)加入特征子集時(shí),均用評(píng)價(jià)函數(shù)KNN判斷其識(shí)別率,若新的特征子集的準(zhǔn)確率高于未加入此特征且此時(shí)的準(zhǔn)確率最優(yōu),則確定將該特征加入特征子集,否則剔除該特征,繼續(xù)評(píng)估下一個(gè)特征波長(zhǎng)。
在初步確定特征子集后,考慮到該算法是一種貪心算法,即在特征選擇過(guò)程中,只能加入特征而不能剔除已選擇的、多余的特征,所以在最終確定特征子集前加入1步回溯,即排除初步選擇的特征子集中的1個(gè)特征,找到最沒(méi)有用處的那個(gè)特征波長(zhǎng)。重復(fù)該步驟,直到評(píng)估分?jǐn)?shù)優(yōu)于之前根據(jù)相同大小的特征子集得到的最高準(zhǔn)確率,最優(yōu)子集選擇停止。
(3)互信息
互信息描述了2個(gè)系統(tǒng)之間的相關(guān)性,或互相包含信息的多少,是信息理論中一種衡量2個(gè)變量間相互關(guān)系的方法?;バ畔⑼ㄟ^(guò)熵以及聯(lián)合熵來(lái)反映對(duì)象之間信息的相互包容程度[26]。
熵(Entropy)反映系統(tǒng)本身的總能量,其表達(dá)式為
(1)
其中
X={x1,x2,…,xN}
式中X——隨機(jī)變量xj——系統(tǒng)中變量中的元素p(xj)——變量出現(xiàn)的概率
聯(lián)合熵反映了隨機(jī)變量的相關(guān)性,設(shè)2個(gè)隨機(jī)變量X和Y,則X和Y的聯(lián)合信息熵H(X,Y)表示為
H(X,Y)=-∑pX,Y(x,y)lgpX,Y(x,y)
(2)
式中x、y——隨機(jī)變量X、Y各取值的概率pX,Y——隨機(jī)變量出現(xiàn)的概率
對(duì)隨機(jī)變量Ta、Te來(lái)說(shuō),其互信息表示為
MI(Ta,Te)=H(Ta)+H(Te)-H(Ta,Te)
(3)
式中H(Ta)、H(Te)——變量Ta、Te的熵
互信息的特征選擇方法是一種衡量特征值與對(duì)應(yīng)類(lèi)別的依賴(lài)關(guān)系,是2個(gè)特征之間距離的一種非線性度量方法。根據(jù)每個(gè)特征的概率分布,對(duì)特征進(jìn)行量化。本研究中設(shè)特征量化等級(jí)為15,計(jì)算量化后的特征與對(duì)應(yīng)類(lèi)別的互信息,并按照互信息的降序輸出最終特征波長(zhǎng)的選擇結(jié)果。
1.5 分類(lèi)器的構(gòu)建
選擇出區(qū)分健康和不同癥狀染病樣本的特征波長(zhǎng)后,需要構(gòu)建分類(lèi)器進(jìn)行識(shí)別。構(gòu)建分類(lèi)器的方法很多,考慮到樣本的維數(shù)較多,需要處理的數(shù)據(jù)量較大,而且是非線性可分問(wèn)題,因此本文用序列最小優(yōu)化算法(Sequential minimal optimization, SMO)[27]、徑向基網(wǎng)絡(luò)(Radical basis function, RBF)[28]、數(shù)據(jù)挖掘C4.5算法[29-30]構(gòu)建分類(lèi)器,對(duì)健康和染病樣本進(jìn)行分類(lèi),通過(guò)分類(lèi)性能對(duì)比,優(yōu)選出適合柑橘黑斑病檢測(cè)的分類(lèi)器??紤]到供試樣本數(shù)量有限,故分類(lèi)過(guò)程中采用10折交叉驗(yàn)證方法,以增強(qiáng)分類(lèi)器的魯棒性。
2.1 光譜特性分析
從135個(gè)供試柑橘中共獲得487個(gè)黑斑病染病樣本數(shù)據(jù)和150個(gè)健康樣本數(shù)據(jù),對(duì)樣本數(shù)據(jù)進(jìn)行平滑濾波預(yù)處理后,分別計(jì)算各波長(zhǎng)下健康和染病樣本的平均反射率,2類(lèi)樣本在400~1 030 nm范圍內(nèi)的光譜特性如圖3所示。
圖3 健康和黑斑病染病樣本光譜特性分析Fig.3 Spectral characteristics analysis of healthy fruit and fruits with three CBS symptoms
從圖3中可以看出,在400~800 nm光譜范圍內(nèi),健康樣本表面的光譜反射率較高,而黑斑病染病樣本的光譜反射率則較低。健康樣本的反射率在740 nm后幾乎保持不變,而在800 nm以后,黑斑病的光譜反射率高于健康樣本。從標(biāo)準(zhǔn)差可以看出,在500~930 nm光譜范圍內(nèi),健康和CBS染病樣本的光譜反射率相差較大。從圖3可以看出,在500~710 nm光譜范圍內(nèi),健康和黑斑病光譜反射率的一階導(dǎo)數(shù)差別較大;在500~590 nm和690~930 nm范圍內(nèi),一階導(dǎo)數(shù)值為正,健康樣本在525 nm和694 nm處一階導(dǎo)數(shù)分別達(dá)到局部最大;在590~690 nm區(qū)域內(nèi),健康樣本的一階導(dǎo)數(shù)值為負(fù);在930 nm之后,健康與黑斑病樣本的一階導(dǎo)數(shù)值曲線幾乎重疊,表明在該光譜區(qū)域內(nèi)健康和黑斑病的光譜反射率變化趨勢(shì)相差不多,對(duì)應(yīng)的反射率曲線,2類(lèi)樣本在該區(qū)域的反射率均值重疊較多。
由圖3可知,3種黑斑病癥狀的光譜反射率曲線與健康樣本的差別較大,破裂型癥狀的光譜特性曲線與其他2類(lèi)(硬斑型和黑斑型)有較為明顯的區(qū)別,在整個(gè)光譜范圍內(nèi),該癥狀的光譜反射率整體呈現(xiàn)上升趨勢(shì),且沒(méi)有拐點(diǎn)。而硬斑型和黑斑型的光譜反射率曲線較為相似,結(jié)合圖1中的彩色圖像,可以看出這2類(lèi)病狀表現(xiàn)相似。
對(duì)健康和染病樣本光譜反射特性的分析表明,用位于500~930 nm的光譜區(qū)間特征波長(zhǎng),可以對(duì)健康和黑斑病樣本進(jìn)行識(shí)別。
2.2 特征波長(zhǎng)選擇結(jié)果
分別用主成分分析、基于序列浮動(dòng)前向選擇和互信息等方法選擇特征波長(zhǎng),基于序列最小優(yōu)化(SMO)、徑向基函數(shù)網(wǎng)絡(luò)(RBF)和C4.5算法建立分類(lèi)模型,以檢測(cè)不同特征波長(zhǎng)選擇方法所選波長(zhǎng)的識(shí)別效果,并采用10折交叉驗(yàn)證方法以增強(qiáng)分類(lèi)器的魯棒性。
2.2.1 健康與染病樣本的特征波長(zhǎng)選擇結(jié)果
(1)基于PCA的特征波長(zhǎng)選擇結(jié)果
對(duì)健康和染病柑橘2類(lèi)樣本在400~1 030 nm的平均反射率進(jìn)行PCA分析,其結(jié)果如圖4所示。圖4a為487個(gè)黑斑病樣本和150個(gè)健康樣本經(jīng)過(guò)主成分分析后,在前3個(gè)主成分空間的分布情況,由圖可以看出,用3個(gè)PCA分量即可將健康與染病樣本分為2類(lèi)。前3個(gè)主成分包含了超過(guò)全部數(shù)據(jù)97.4%的變量,故用前3個(gè)主成分代替全部數(shù)據(jù)。
圖4 主成分分析結(jié)果Fig.4 Results of PCA analysis
雖然前4個(gè)主成分包含了超過(guò)97%的數(shù)據(jù),但本研究的最終目的是利用選擇的若干個(gè)特征波長(zhǎng),構(gòu)建價(jià)格較低的多光譜系統(tǒng),以降低檢測(cè)儀器的成本。而主成分分析僅將原始數(shù)據(jù)進(jìn)行了壓縮,故需要進(jìn)一步從全部數(shù)據(jù)中選擇少而優(yōu)的特征波長(zhǎng)。圖4b為前3個(gè)主成分在光譜范圍內(nèi)的載荷情況,載荷值反映了主成分在光譜范圍內(nèi)不同波長(zhǎng)時(shí)的相關(guān)系數(shù),圖中呈現(xiàn)出波峰或波谷極值點(diǎn)對(duì)應(yīng)的波長(zhǎng)即為待選的特征波長(zhǎng)。根據(jù)圖4b共選出525、675、700、740 nm 4個(gè)特征波長(zhǎng)。
為進(jìn)一步優(yōu)化選擇出的最優(yōu)波長(zhǎng),基于T檢驗(yàn)、KL散度、切諾夫界和ROC曲線共4種不同評(píng)價(jià)標(biāo)準(zhǔn)的特征排序方法,對(duì)選擇出的特征波長(zhǎng)子集進(jìn)行分析。為便于對(duì)比將各方法得到的相關(guān)系數(shù)歸一化為0~1范圍,用衡量特征波長(zhǎng)對(duì)分類(lèi)重要性的相關(guān)系數(shù)進(jìn)行排序,最終選擇出最優(yōu)的特征波長(zhǎng)為525 nm。
(2)基于SFFS的特征波長(zhǎng)選擇結(jié)果
通過(guò)SFFS特征選擇方法,對(duì)健康和染病樣本進(jìn)行特征波長(zhǎng)的選擇。通過(guò)10次選擇后,最終選擇出2個(gè)最優(yōu)特征波長(zhǎng),分別為527 nm和917 nm。
(3)基于互信息的特征波長(zhǎng)選擇結(jié)果
對(duì)2類(lèi)數(shù)據(jù)采用MI方法,得分前10的波長(zhǎng)分布在513~531 nm區(qū)間內(nèi),因此選取513~531 nm光譜區(qū)域作為MI方法選擇的特征波長(zhǎng)區(qū)域。
2.2.2 黑斑病3種不同癥狀的特征波長(zhǎng)選擇結(jié)果
通過(guò)對(duì)黑斑病3種不同癥狀的光譜特性進(jìn)行觀察研究,破裂型與其他2種癥狀的光譜特性完全不同,故先將硬斑型和黑斑型看作同一類(lèi),因此問(wèn)題變成了2類(lèi)樣本的分類(lèi)識(shí)別。采用SFFS特征選擇方法選擇特征波長(zhǎng),并選擇出740、794、897 nm 3個(gè)特征波長(zhǎng),用以區(qū)分破裂型和其他癥狀。
為對(duì)硬斑型和黑斑型進(jìn)行分類(lèi),采用SFFS方法選擇區(qū)分該2類(lèi)病癥的特征波長(zhǎng)為678 nm。因此,區(qū)分3種不同癥狀的特征波長(zhǎng)為678、740、794、897 nm共4個(gè)特征波長(zhǎng)。
2.3 識(shí)別結(jié)果及分析
2.3.1 健康與黑斑病樣本識(shí)別結(jié)果
基于PCA和特征排序方法選擇的特征波長(zhǎng)525 nm和全波段的3種分類(lèi)器,對(duì)健康和黑斑病染病樣本的識(shí)別結(jié)果如表1所示。由表1可知,用525 nm特征波長(zhǎng)建立的SMO模型分類(lèi)準(zhǔn)確率最高(99.37%),RBF和C4.5模型分類(lèi)準(zhǔn)確率分別為99.21%和99.06%,也取得了較好的識(shí)別效果。采用全波段建立的SMO、RBF和C4.5模型對(duì)健康和染病樣本識(shí)別準(zhǔn)確率分別為99.84%、97.80%和98.59%,SMO的識(shí)別準(zhǔn)確率略高于單一波長(zhǎng),但采用單一波長(zhǎng)與全波段相比,SMO分類(lèi)器處理時(shí)間從0.2 s減少到0.01 s。而RBF和C4.5分類(lèi)器基于單一波長(zhǎng)的識(shí)別準(zhǔn)確率均略高于基于全波段的識(shí)別率。
通過(guò)SFFS和MI 2種特征選擇方法選擇特征波長(zhǎng)后,分別用SMO、RBF和C4.5分類(lèi)器構(gòu)建識(shí)別模型,對(duì)健康和黑斑病樣本分類(lèi),結(jié)果如表2所示。
表1 525 nm特征波長(zhǎng)和全波段建立的3種分類(lèi)器識(shí)別結(jié)果Tab.1 Identification results of healthy and CBS infected fruits using three classifiers based on selected wavelength of 525 nm and whole range of spectral data
表2 SFFS和MI選擇的特征波段對(duì)健康和染病樣本的分類(lèi)結(jié)果Tab.2 Classification results of healthy and CBS infected fruits using three classifiers based on selected wavelengths with SFFS and MI methods
由表2可以看出,由SFFS方法選擇的2個(gè)特征波長(zhǎng)527 nm和917 nm,對(duì)健康和黑斑病的識(shí)別準(zhǔn)確率均高于MI的特征子集,RBF分類(lèi)識(shí)別率最高達(dá)到99.06%,最低的識(shí)別率為基于MI特征子集的95.92%。
對(duì)比表1和表2可知,本文提出的PCA載荷結(jié)合特征排序方法選擇的525 nm特征波長(zhǎng),對(duì)健康和黑斑病染病樣本的識(shí)別準(zhǔn)確率高,優(yōu)于SFFS和MI方法所選特征子集的識(shí)別率,且數(shù)據(jù)維數(shù)更低,即僅用1個(gè)特征波長(zhǎng)525 nm就可將健康和黑斑病樣本區(qū)分出來(lái)。
2.3.2 黑斑病不同癥狀的分類(lèi)結(jié)果
為了識(shí)別破裂型、硬斑型和黑斑型3種黑斑病癥狀,用SFFS方法依次選擇出能區(qū)分破裂型、硬斑型和黑斑型的特征波長(zhǎng),結(jié)合健康和黑斑病特征波長(zhǎng)525 nm與678、740、794、897 nm,采用數(shù)據(jù)挖掘C4.5算法對(duì)健康與黑斑病3種癥狀識(shí)別結(jié)果的混淆矩陣如表3所示。
從表3可以看出,健康樣本的識(shí)別率最高,達(dá)到98.67%,150個(gè)樣本中有2個(gè)樣本被誤識(shí)別為硬斑型樣本。對(duì)3種癥狀的分類(lèi)識(shí)別中,硬斑型的識(shí)別率最高,達(dá)到81.85%,破裂型和黑斑型的識(shí)別率均較低,分別為71.88%和67.57%,3種病害癥狀平均識(shí)別率為73.77%,比文獻(xiàn)[21]采用高光譜分析方法(61.00%)提高了12.77個(gè)百分點(diǎn)。3種癥狀分類(lèi)識(shí)別率并不理想,這是因?yàn)橛舶咝秃秃诎咝偷墓庾V反射特性曲線(圖3)趨勢(shì)相似,故難以高精度識(shí)別;破裂型樣本數(shù)較少(32個(gè)),雖然在分類(lèi)過(guò)程中采用了10折交叉驗(yàn)證方法,但樣本數(shù)仍太少,使得分類(lèi)準(zhǔn)確率較低。
表3 基于5個(gè)特征波長(zhǎng)對(duì)健康和黑斑病3種癥狀識(shí)別結(jié)果的混淆矩陣Tab.3 Confusion matrix of accuracy rates using selected five optimal wavelengths for healthy fruit and fruits with three CBS symptoms classification
(1)提出主成分分析結(jié)合特征排序選擇最優(yōu)波長(zhǎng)構(gòu)建SMO分類(lèi)器識(shí)別健康和染病樣本的方法,試驗(yàn)結(jié)果表明,用525 nm波長(zhǎng)SMO分類(lèi)器對(duì)健康和染病樣本識(shí)別率為99.37%,僅比基于全波段的分類(lèi)識(shí)別率低0.47個(gè)百分點(diǎn),但分類(lèi)器處理時(shí)間從0.2 s減少到0.01 s,大大提高了識(shí)別效率。
(2)用SFFS和MI特征選擇方法分別選擇出2個(gè)特征波長(zhǎng)(527 nm和917 nm)和513~531 nm光譜區(qū)域,對(duì)健康和黑斑病的識(shí)別率均低于PCA結(jié)合特征排序方法選擇的最優(yōu)波長(zhǎng)的識(shí)別率,但也達(dá)到滿(mǎn)意的識(shí)別準(zhǔn)確率。
(3)用優(yōu)選的特征波長(zhǎng)建立C4.5算法分類(lèi)器對(duì)健康果和黑斑病3種癥狀樣本進(jìn)行識(shí)別,健康樣本識(shí)別率達(dá)98.67%,黑斑病3種癥狀的平均識(shí)別率為73.77%,比前人方法提高了12.77個(gè)百分點(diǎn)。
1 Florida Department of Agriculture and Consumer Services. Florida citrus statistics 2009—2010[M]. Maltland, FL: USDA NASS Florida Field Office, 2011.
2 CHOI D, LEE W S, EHSANI R, et al. A machine vision system for quantification of citrus fruit dropped on the ground under the canopy[J]. Transactions of the ASABE, 2015, 58(4):933-946.
3 唐淬,周常勇. 柑橘黑斑病的發(fā)病特點(diǎn)及檢測(cè)方法研究進(jìn)展[J].中國(guó)南方果樹(shù), 2012, 41(3):55-60. TANG Cui, ZHOU Changyong. Advances in occurrence characteristics and detection methods of citrus black spot[J]. South China Fruits, 2012, 41(3): 55-60. (in Chinese)
4 王興紅,陳國(guó)慶,李葉紅. 中國(guó)柑橘黑斑病相關(guān)葉點(diǎn)霉屬(Phyllosticta)真菌種類(lèi)研究[C]∥中國(guó)菌物學(xué)會(huì)第五屆會(huì)員代表大會(huì)暨2011年學(xué)術(shù)年會(huì)論文摘要集, 2011.
5 彭輝,文友先,吳蘭蘭,等.采用自適應(yīng) canny 算子的樹(shù)上柑橘圖像邊緣檢測(cè)[J]. 計(jì)算機(jī)工程與應(yīng)用, 2011, 47(9):163-166. PENG Hui, WEN Youxian, WU Lanlan, et al. Citrus edge detection based on self-adaptive canny operator[J]. Computer Engineering and Applications, 2011, 47(9):163-166. (in Chinese)
6 AL Ohali Y. Computer vision based date fruit grading system: design and implementation[J]. Journal of King Saud University—Computer and Information Sciences, 2011, 23(1): 29-36.
7 宋懷波,何東健,潘景朋.基于凸殼理論的遮擋蘋(píng)果目標(biāo)識(shí)別與定位方法[J].農(nóng)業(yè)工程學(xué)報(bào), 2012, 28(22):174-180. SONG Huaibo, HE Dongjian, PAN Jingpeng. Recognition and location methods of occluded apples based on convex hull theory [J]. Transactions of the CSAE, 2012, 28(22):174-180. (in Chinese)
8 MIZUSHIMA A, LU R. An image segmentation method for apple sorting and grading using support vector machine and Otsu’s method[J]. Computers and Electronics in Agriculture, 2013, 94: 29-37.
9 LU J, SANG N. Detecting citrus fruits and occlusion recovery under natural illumination conditions[J]. Computers and Electronics in Agriculture, 2015, 110: 121-130.
10 劉燕德,肖懷春,孫旭東,等.基于高光譜成像的柑橘黃龍病無(wú)損檢測(cè)[J/OL]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2016, 47(11):231-238. http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?file_no=20161132&flag=1. DOI:10.6041/j.issn.1000-1298.2016.11.032. LIU Yande, XIAO Huaichun, SUN Xudong, et al. Non-destructive detection of citrus Huanglong disease using hyperspectral image technique[J/OL]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(11): 231-238. (in Chinese)
11 PYDIPATI R, BURKS T F, LEE W S. Identification of citrus disease using color texture features and discriminant analysis[J]. Computers and Electronics in Agriculture, 2006, 52(1): 49-59.
12 BLASCO J, ALEIXOS N, GOMEZ J, et al. Citrus sorting by identification of the most common defects using multispectral computer vision[J]. Journal of Food Engineering, 2007, 83(3):384-393.
13 DEWDNEY M M, PERES N A, RITENOUR M, et al. Citrus black spot in Florida[J]. Citrus Industry, 2010, 91:18-21.
14 洪添勝,李震, 吳春胤,等.高光譜圖像技術(shù)在水果品質(zhì)無(wú)損檢測(cè)中的應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2007, 23(11): 280-285. HONG Tiansheng, LI Zhen, WU Chunyin, et al. Review of hyperspectral image technology for non-destructive inspection of fruit quality[J]. Transactions of the CSAE, 2007, 23(11): 280-285. (in Chinese)
15 蔡健榮,王建黑,黃星奕,等. 高光譜圖像技術(shù)檢測(cè)柑橘果銹[J]. 光電工程, 2009, 36(6):26-30. CAI Jianrong, WANG Jianhei, HUANG Xingyi, et al. Detection of rust in citrus with hyperspectral imaging technology [J]. Opto-Electronic Engineering, 2009, 36(6): 26-30. (in Chinese)
16 BENXUE M A, XIAO W, QU N, et al. Detection of fruits slight bruises based on hyperspectral imaging technology[C]∥2011 International Conference of Electronic Control Engineering, 2011: 4445-4448.
17 LI H, LEE W S, WANG K, et al. “Extended spectral angle mapping (ESAM)” for citrus greening disease detection using airborne hyperspectral imaging[J]. Precision Agriculture, 2014, 15(2):162-183.
18 歐陽(yáng)愛(ài)國(guó),吳建,劉燕德. 高光譜成像在農(nóng)產(chǎn)品無(wú)損檢測(cè)中的應(yīng)用[J]. 廣東農(nóng)業(yè)科學(xué),2015,42(23): 164-171. OUYANG A G, WU J, LIU Y D. Application of hyperspectral imaging in nondestructive detection of agricultural products[J]. Guangdong Agricultural Sciences, 2015,42(23): 164-171. (in Chinese)
19 ZHANG C, GUO C, LIU F, et al. Hyperspectral imaging analysis for ripeness evaluation of strawberry with support vector machine[J]. Journal of Food Engineering, 2016, 179:11-18.
20 QIN J, BURKS T F, RITENOUR M A, et al. Detection of citrus canker using hyperspectral reflectance imaging with spectral information divergence[J]. Journal of Food Engineering, 2009, 93(2):183-191.
21 BULANON D M, BURKS T F, KIM D G, et al. Citrus black spot detection using hyperspectral image analysis[J]. Agricultural and Engineering Inernational, 2013, 15(3):171-180.
22 ZHAO C, LEE W S, HE D. Citrus black spot detection based on selected wavelengths using hyperspectral images[C]. ASABE, 2015 Annual Meating Papers 152181190, 2015.
23 SAVITZKY A, GOLAY M J E. Smoothing and differentiation of data by simplified least squares procedures[J]. Analytical Chemistry, 1964, 36(8):1627-1639.
24 SOMOL P, PUDIL P, NOVOVI J. Adaptive foating search methods in feature selection[J]. Pattern Recognition Letters, 1999, 20(11-13):1157-1163.
25 PUDIL P, FERRI F, NOVOVICOVJ, et al. Floating search methods for feature selection with nonmonotonic criterion functions[C]∥Proceedings of the 2nd IAPR International Conference on Pattern Recognition, 1994, 2: 279-283.
26 PENG H, LONG F, DING C. Feature selection based on mutual information: criteria of max-dependency, max-relevance, and min-redundancy[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(8):1226-1238.
27 PLATT J C. Sequential minimal optimization: a fast algorithm for training support vector machines[M]∥Advances in kernel methods—support vector learning. Cambridge: The MIT Press, 1998: 212-223.
28 MOODY J, DARKEN C. Fast learning in networks of locally-tuned processing units[J]. Neural Computation, 1989, 294(1): 281-294.
29 程龍,蔡遠(yuǎn)文. 數(shù)據(jù)挖掘C4.5算法的編程設(shè)計(jì)與增量學(xué)習(xí)改進(jìn)[J]. 計(jì)算技術(shù)與自動(dòng)化, 2009, 28(4): 83-87. CHENG Long, CAI Yuanwen. Program design and an improved incremental learning method of C4.5 algorithm[J]. Computing Technology and Automation, 2009, 28(4): 83-87. (in Chinese)
30 高陽(yáng),廖家平,吳偉. 基于決策樹(shù)的ID3算法與C4.5算法[J]. 湖北工業(yè)大學(xué)學(xué)報(bào), 2011, 26(2):54-56. GAO Yang, LIAO Jiaping, WU Wei. ID3 algorithm and C4.5 algorithm based on decision tree[J]. Journal of Hubei University of Technology, 2011, 26(2): 54-56. (in Chinese)
Reflectance Spectral Characteristics of Black Spot Disease and Disease Detection Method for Citrus
ZHAO Chuanyuan1,2HE Dongjian1,2LEE Won Suk3
(1.CollegeofMechanicalandElectronicEngineering,NorthwestA&FUniversity,Yangling,Shaanxi712100,China2.KeyLaboratoryofAgriculturalInternetofThings,MinistryofAgriculture,Yangling,Shaanxi712100,China3.DepartmentofAgricultural&BiologicalEngineering,UniversityofFlorida,GainesvilleFL32611,USA)
Citrus black spot (CBS), which is one of the most common fungal diseases of citrus, causes lesions on the rind and early fruit drop before its mature stage. This disease can significantly reduce crop yield, making blemished fruit unsuitable for market. The objective of this research was to study the reflectance spectral characteristics of healthy and infected citrus fruits to identify diseased fruit from healthy ones. A portable USB2000+spectrometer was used to acquire spectral reflectance of citrus fruit in the laboratory with wavelength ranged from 340 nm to 1 030 nm. However, the spectra contained thousands of wavelengths, and many of them would be considered as redundant, which may even decrease the classification accuracy. To reduce the data dimensionality and select the useful bands for further application, principal components analysis (PCA) and four band ranking methods, i.e.,T-test, Kullback-Leibler distance, Chernoff bound and receiver operating characteristic (ROC) were applied. One important wavelength (525 nm) was selected and used to classify healthy and CBS infected fruits. Sequential minimal optimization (SMO), radical basis function network (RBF), and C4.5 classification methods were used to evaluate the performance of the selected band, and SMO achieved the highest accuracy of 99.37%. In order to compare the performance of classification accuracies according to optimal wavelengths selected by using different methods, two other methods, i.e., sequential floating forward selection (SFFS) and mutual information (MI), were applied. Wavelengths of 527 nm and 917 nm were selected based on SFFS, while the MI method selected 513~531 nm as the optimal wavelength range, and the highest recognition accuracy was 99.06%, which was lower than that of using 525 nm. Then SFFS was applied to find the optimal wavelengths for further distinguishing three CBS symptoms. C4.5 method was used to evaluate the performance of distinguishing CBS infected and healthy fruits based on selected wavelengths, and the highest overall classification accuracy was 73.77%.
citrus black spot disease; spectral characteristics; feature selection; identification model; principal components analysis
2017-02-13
2017-03-17
國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)項(xiàng)目(2013AA102304)和國(guó)家自然科學(xué)基金項(xiàng)目(61473237)
趙川源(1988—),女,博士生,主要從事計(jì)算機(jī)視覺(jué)、圖像處理和模式識(shí)別研究,E-mail: zhaochuanyuan@hotmail.com
何東健(1957—),男,教授,博士生導(dǎo)師,主要從事生物圖像分析、智能化檢測(cè)與控制研究,E-mail: hdj168@nwsuaf.edu.cn
10.6041/j.issn.1000-1298.2017.05.045
S123
A
1000-1298(2017)05-0356-07
農(nóng)業(yè)機(jī)械學(xué)報(bào)2017年5期