孔德鋒
摘要:針對(duì)當(dāng)前番茄病害智能識(shí)別精度不高、耗時(shí)長(zhǎng)的問(wèn)題,提出一種基于Inception-v3和遷移學(xué)習(xí)相結(jié)合的圖像分類算法。從試驗(yàn)田中收集8種番茄病害葉片和健康葉片,運(yùn)用1 000萬(wàn)像素高清掃描儀統(tǒng)一掃描成圖像,將圖像歸類到9種文件夾中,手動(dòng)標(biāo)記葉片屬性。最后,基于Inception-v3模型結(jié)合遷移學(xué)習(xí)算法對(duì)健康和病害葉片進(jìn)行分類試驗(yàn),并與傳統(tǒng)圖像分類算法(KNN、SVM、BP神經(jīng)網(wǎng)絡(luò))和非遷移學(xué)習(xí)算法進(jìn)行對(duì)比。結(jié)果表明,基于Inception-v3模型結(jié)合遷移學(xué)習(xí)算法,在番茄病害圖像分類中能夠快速有效識(shí)別分類生長(zhǎng)健康番茄和患病番茄,并且能高效識(shí)別番茄病害的種類。其中健康置信度達(dá)0.976 0,病害種類平均置信度達(dá)0.929 7,可為番茄病害檢測(cè)和防治提供支持。
關(guān)鍵詞:圖像分類;遷移學(xué)習(xí);番茄病害檢測(cè);Inception-v3
中圖分類號(hào):TP391.4?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):0439-8114(2020)07-0199-05
DOI:10.14088/j.cnki.issn0439-8114.2020.07.041
Abstract: An image classification algorithm based on Inception-v3 and migration learning is proposed to solve the problem that the current intelligent identification of tomato diseases is not accurate and time-consuming. Eight tomato disease leaves and healthy leaves were collected from the experimental field,the images were scanned into images using a 10 megapixel HD scanner,the images were classified into 9 folders,and the blade attributes were manually labeled. Finally,based on the Inception-v3 model combining migration learning algorithms to classify test healthy and diseased leaves,and compare them with traditional image classification algorithms (KNN、 SVM、 BP neural network) and non-migration learning algorithms. The experimental results show that,based on Inception-v3 model combined with migration learning algorithm can quickly and effectively identify grow healthy tomato and diseased tomato in tomato disease image classification,and can identify tomato disease types efficiently. Among them,the classification accuracy of health and disease is 0.976 0,and the average accuracy of disease types is 0.929 7,which provides a certain degree of support for tomato disease detection and prevention.
Key words: image classification; migration learning; tomato diseases detection; Inception-v3
防治番茄病害的關(guān)鍵是認(rèn)清病害的種類,根據(jù)其發(fā)生、流行規(guī)律,采取相應(yīng)的管理措施,消除利于病害發(fā)生發(fā)展的環(huán)境條件,再根據(jù)不同的發(fā)病情況,對(duì)癥采取相應(yīng)的措施,及時(shí)控制病害的發(fā)生。番茄病害的類型可分為侵染性病害和非侵染性病害2種。其中,侵染性病害包括真菌性病害、細(xì)菌性病害、病毒病等;非侵染性病害也稱為生理障礙,是由溫、光、水、肥、氣、藥、人為等因素引起的[1]。
斯坦福大學(xué)研究團(tuán)隊(duì)運(yùn)用深度神經(jīng)卷積網(wǎng)絡(luò)CNN[2,3]對(duì)129 450張圖片進(jìn)行訓(xùn)練,訓(xùn)練完成后進(jìn)行驗(yàn)證。結(jié)果顯示深度神經(jīng)網(wǎng)絡(luò)在驗(yàn)證集上的表現(xiàn)都達(dá)到了專家的水平,表明了該人工神經(jīng)網(wǎng)絡(luò)可以媲美皮膚科醫(yī)生。依此類比,也可以用像素和疾病標(biāo)簽作為輸入,直接從圖像中端到端訓(xùn)練出來(lái)。訓(xùn)練好的網(wǎng)絡(luò)可以作為番茄病害檢測(cè)平臺(tái),對(duì)葉片進(jìn)行跟蹤檢測(cè)。但與該團(tuán)隊(duì)研究方法不同的是,本方法依托谷歌Tensorflow平臺(tái),將Inception-v3算法與遷移學(xué)習(xí)算法相結(jié)合,對(duì)番茄病害圖像數(shù)據(jù)集進(jìn)行訓(xùn)練。該方法使用大數(shù)據(jù)集進(jìn)行模型訓(xùn)練,然后使用訓(xùn)練好的參數(shù)對(duì)小樣本進(jìn)行參數(shù)微調(diào),這樣使得最終訓(xùn)練出來(lái)的模型具有小數(shù)據(jù)集和高精度的雙重優(yōu)勢(shì)。
1?材料與方法
1.1?圖像采集
為了能清晰完整的獲取葉片圖像,采用1 000萬(wàn)像素高清掃描儀,將采摘完好的葉片放在掃描儀平臺(tái),同時(shí)使用LED燈補(bǔ)白光,圖像采集裝置如圖1。通過(guò)對(duì)試驗(yàn)田采摘回來(lái)的番茄葉片在同一環(huán)境下進(jìn)行掃描,總計(jì)獲得3 000張圖像。對(duì)掃描不清晰、不完整的圖像刪除,最終得到2 400張完整清晰圖像。每張圖像包含一片農(nóng)作物的葉子,葉子占據(jù)圖片主要位置。
3.1?遷移學(xué)習(xí)與非遷移學(xué)習(xí)對(duì)比
非遷移學(xué)習(xí)就是從頭開始訓(xùn)練模型,由于數(shù)據(jù)量太小,出現(xiàn)了訓(xùn)練樣本不足和嚴(yán)重的過(guò)擬合現(xiàn)象,導(dǎo)致準(zhǔn)確率較低同時(shí)耗費(fèi)大量的訓(xùn)練時(shí)間。如表3中所示,在相同9標(biāo)簽分類識(shí)別中,遷移學(xué)習(xí)比非遷移學(xué)習(xí)識(shí)別率高出28.46個(gè)百分點(diǎn),但是耗時(shí)卻只有非遷移學(xué)習(xí)的1/5。
3.2?基于Inception-v3算法結(jié)合遷移學(xué)習(xí)算法與傳統(tǒng)圖像分類算法比較
3種Sklearn算法KNN、SVM、BP神經(jīng)網(wǎng)絡(luò)[12]都沒有給出非常好的性能,其中在2標(biāo)簽分類的測(cè)試結(jié)果中,平均識(shí)別率為65.28%;在9標(biāo)簽分類的測(cè)試結(jié)果中,平均識(shí)別率為44.43%(表4),表明使用Sklearn方法進(jìn)行圖像識(shí)別的效果不夠好。它們?cè)趶?fù)雜圖像的分類中并不具備良好的性能,特別是SVM相當(dāng)于隨機(jī)猜想。如果要運(yùn)用這3種分類器對(duì)圖像進(jìn)行識(shí)別分類,首先要對(duì)圖像進(jìn)行復(fù)雜的二值化預(yù)處理,但是基于Inception-v3算法與遷移學(xué)習(xí)算法相結(jié)合卻可以省去復(fù)雜的預(yù)處理過(guò)程。
4?小結(jié)
通過(guò)將Incepition-v3算法與遷移學(xué)習(xí)算法相結(jié)合,在真實(shí)的番茄葉片圖像數(shù)據(jù)集中進(jìn)行訓(xùn)練,最后測(cè)試,同時(shí)比對(duì)了非遷移學(xué)習(xí)算法和傳統(tǒng)KNN、SVM、BP神經(jīng)網(wǎng)絡(luò)算法在相同數(shù)據(jù)樣本中的表現(xiàn)。結(jié)果表明,KNN、SVM和BP神經(jīng)網(wǎng)絡(luò)不能夠很好地完成諸如圖像分類這樣的特定任務(wù),而基于Tensorflow平臺(tái)的Incepition-v3模型結(jié)合遷移學(xué)習(xí)算法,在差異細(xì)微的圖像處理問(wèn)題上,有更高的準(zhǔn)確率和更短的耗時(shí)。即使在無(wú)GPU作為提速手段的情況下,也可以在短時(shí)間內(nèi)完成訓(xùn)練,同時(shí)在小數(shù)據(jù)集中,可以很好地防止過(guò)度擬合。后期可以運(yùn)用本研究提出的圖像識(shí)別算法,集成為番茄病害檢測(cè)系統(tǒng),幫助更多的番茄種植戶方便、快速、及時(shí)、準(zhǔn)確地檢測(cè)出病害,以便早發(fā)現(xiàn)、早預(yù)防、早治療。
參考文獻(xiàn):
[1] 王俊文. 番茄病害及其綜合防治技術(shù)[J]. 江西農(nóng)業(yè)學(xué)報(bào),2006,18(4):139.
[2] ESTEVA A,KUPREL B,NOVOA R A,et al. Dermatologist-level classification of skin cancer with deep neural networks[J]. Nature,2017,542(7639):115-118.
[3] 盧宏濤,張秦川. 深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺中的應(yīng)用研究綜述[J]. 數(shù)據(jù)采集與處理,2016,31(1):1-17.
[4] 黃?琳,王?龍. 系統(tǒng)魯棒性的若干問(wèn)題—背景,現(xiàn)狀與挑戰(zhàn)[J]. 控制理論與應(yīng)用,1991(1):11-29.
[5] 李儉川,秦國(guó)軍,溫熙森,等. 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法的過(guò)擬合問(wèn)題及解決方法[J]. 振動(dòng)、測(cè)試與診斷,2002,22(4):260-264.
[6] 魯?恒,付?蕭,賀一楠,等. 基于遷移學(xué)習(xí)的無(wú)人機(jī)影像耕地信息提取方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2015,46(12):274-279.
[7] 莊福振,羅?平,何?清,等. 遷移學(xué)習(xí)研究進(jìn)展[J]. 軟件學(xué)報(bào),2015,26(1):26-39.
[8] 李岳云,許悅雷,馬時(shí)平,等. 深度卷積神經(jīng)網(wǎng)絡(luò)的顯著性檢測(cè)[J]. 中國(guó)圖象圖形學(xué)報(bào),2016,21(1):53-59.
[9] 陶?軍. 車牌識(shí)別技術(shù)研究與實(shí)現(xiàn)[D]. 南京:南京理工大學(xué),2004.
[10] 武?強(qiáng),童學(xué)鋒,季?雋. 基于人工神經(jīng)網(wǎng)絡(luò)的數(shù)字字符識(shí)別[J]. 計(jì)算機(jī)工程,2003,29(14):112-113.
[11] KIM D H,MACKINNON T. Artificial intelligence in fracture detection:Transfer learning from deep convolutional neural networks[J]. Clinical radiology,2017,73(5):439-445.
[12] BRENT K,JAMES B,CHRIS E. Hyperopt-sklearn:Automatic hyperparameter configuration for scikit-learn[J]. Proc SciPy,2014:34-40.