史冰瑩,李佳琦,張 磊,李 健
1(中國(guó)科學(xué)院 計(jì)算機(jī)網(wǎng)絡(luò)信息中心,北京 100190)
2(中國(guó)科學(xué)院大學(xué),北京 100049)
3(生態(tài)環(huán)境部 南京環(huán)境科學(xué)研究所,南京 210042)
中國(guó)的耕地面積為1432 960 平方公里,排世界第3 位,然而同時(shí)中國(guó)也是世界上人口最多的國(guó)家.截止2018年,中國(guó)用全球7%的耕地養(yǎng)活了近20%的人口.作為一個(gè)人口大國(guó),保障糧食不僅關(guān)系到人民福祉也同時(shí)會(huì)影響社會(huì)安定.據(jù)中國(guó)統(tǒng)計(jì)年鑒,2016年全國(guó)農(nóng)業(yè)生產(chǎn)總值達(dá)5.93 萬(wàn)億元,占GDP 的8.0%,而由農(nóng)業(yè)病蟲害等災(zāi)害造成的直接損失達(dá)0.503 萬(wàn)億元,占農(nóng)業(yè)生產(chǎn)總值的8.48%,可見農(nóng)作物病蟲害對(duì)農(nóng)業(yè)影響之巨大.同時(shí)在農(nóng)業(yè)生產(chǎn)中,大量農(nóng)藥的使用加劇了對(duì)環(huán)境的污染.因此對(duì)農(nóng)作物的病蟲害進(jìn)行準(zhǔn)確的識(shí)別并推薦合適的防治措施,不僅對(duì)于農(nóng)業(yè)生產(chǎn)意義重大,對(duì)于改善整個(gè)社會(huì)經(jīng)濟(jì)環(huán)境也有幫助.隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,越來(lái)越多學(xué)者嘗試將圖像識(shí)別算法運(yùn)用到病蟲害識(shí)別過程中.傳統(tǒng)的圖像識(shí)別技術(shù)在對(duì)圖像進(jìn)行預(yù)處理后提取圖像的顏色紋理等的特征,基于這些提取的特征值進(jìn)行線性建模.然而這種傳統(tǒng)的圖像識(shí)別方法,局限性大,對(duì)非線性數(shù)據(jù)的識(shí)別成功率很低,因而在農(nóng)作物病害檢測(cè)中,其模型的識(shí)別成功率非常不理想.隨著大數(shù)據(jù)、機(jī)器學(xué)習(xí)等概念的出現(xiàn),支持向量機(jī)、樸素貝葉斯、BP 神經(jīng)網(wǎng)絡(luò)等經(jīng)典機(jī)器學(xué)習(xí)算法也被用于病蟲害識(shí)別分類中.然而傳統(tǒng)的機(jī)器學(xué)習(xí)算法更適用于小樣本的研究實(shí)驗(yàn)中,在農(nóng)業(yè)病蟲害圖像識(shí)別的復(fù)雜場(chǎng)景和大量數(shù)據(jù)的情況下,基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型往往能取得更優(yōu)的效果.
深度學(xué)習(xí)的快速發(fā)展使圖像分類任務(wù)的精度得到了很大提升,而卷積神經(jīng)網(wǎng)絡(luò)正是深度學(xué)習(xí)中代表性的算法,具有很強(qiáng)的泛化性,不需要特意設(shè)計(jì)分類器.因此本文基于卷積神經(jīng)神經(jīng)網(wǎng)絡(luò)的方法構(gòu)建農(nóng)作物病蟲害圖像識(shí)別模型.然而由于農(nóng)作物病蟲害圖像數(shù)據(jù)較為稀缺,且對(duì)于不同的病蟲害圖像采集難度不同,這導(dǎo)致了我們的訓(xùn)練樣本分布不平衡,如果不加以處理則會(huì)影響到模型識(shí)別的準(zhǔn)確度.因此本文采用遷移學(xué)習(xí)的方法,利用在大型數(shù)據(jù)集ImageNet 預(yù)訓(xùn)練后的模型進(jìn)行建模.并且采用數(shù)據(jù)增強(qiáng)的方法增大樣本量,緩和數(shù)據(jù)不平衡問題同時(shí)可以提高模型的泛化性能.同時(shí)改進(jìn)損失函數(shù),采用焦點(diǎn)損失函數(shù)(facal loss)[1]代替?zhèn)鹘y(tǒng)的交叉熵?fù)p失函數(shù)來(lái)解決數(shù)據(jù)不平衡問題.實(shí)驗(yàn)表明,基于Inception-V3 網(wǎng)絡(luò)以及Resnet 網(wǎng)絡(luò)建立的病蟲害圖像識(shí)別模型準(zhǔn)確率高,并且改進(jìn)損失函數(shù)后病蟲害圖像識(shí)別模型準(zhǔn)確度進(jìn)一步提升,損失明顯降低.
國(guó)外的農(nóng)作物圖像病蟲害識(shí)別的研究大約從20世紀(jì)80年代開始.Sasaki 等[2]采用貝葉斯決策的方法,通過光譜反射率之間的區(qū)別辨別黃瓜葉片的健康和病斑區(qū)域.Vízhányó等[3]提出一種RGB 空間轉(zhuǎn)換方法,通過健康蘑菇和患病蘑菇的顏色點(diǎn)的不同來(lái)辨別患病蘑菇.隨著機(jī)器學(xué)習(xí)的發(fā)展,人們開始嘗試將機(jī)器學(xué)習(xí)算法應(yīng)用于農(nóng)作物病害圖像識(shí)別.Sammany 等[4]利用遺傳算法改進(jìn)神經(jīng)網(wǎng)絡(luò),基于改進(jìn)后的網(wǎng)絡(luò)建立病蟲害識(shí)別模型,并對(duì)特征向量進(jìn)行降維,從而提高病蟲害識(shí)別效率.馬來(lái)西亞國(guó)立大學(xué)的Al Bashish 等[5]采用K 均值聚類算法將圖像分為4 個(gè)簇,分別對(duì)每個(gè)簇提取其顏色及紋理等特征值后將其輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行分類并取得了不錯(cuò)的效果.瑞士洛桑聯(lián)邦理工學(xué)院Mohanty 等[6]利用GoogLeNet 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立病蟲害識(shí)別模型并取得了不錯(cuò)的效果.
國(guó)內(nèi)的農(nóng)作物病害圖像識(shí)別起步較晚,大約從21世紀(jì)開始,徐貴力等[7]基于直方圖法提取的番茄葉片顏色特征后進(jìn)行識(shí)別,準(zhǔn)確率可達(dá)70%以上.趙玉霞等[8]采用樸素貝葉斯分類器識(shí)別玉米銹病等5 種病害,取得了比較好的效果.田凱[9]基于Fisher 判別法、貝葉斯分類器和支持向量機(jī)的方法構(gòu)建模型識(shí)別褐紋病與非褐紋病圖像,對(duì)比后發(fā)現(xiàn)Fisher判別法的平均識(shí)別效果最好.李敬[10]基于6 層卷積神經(jīng)網(wǎng)絡(luò)建立煙草病害識(shí)別模型取得了不錯(cuò)的效果.甘肅農(nóng)業(yè)大學(xué)的劉闐宇等[11]采用Faster-RCNN 方法識(shí)別葡萄葉片位置,基于卷積神經(jīng)網(wǎng)絡(luò)建立模型,該模型對(duì)葉片病變識(shí)別準(zhǔn)確率最高可達(dá)75.52%.
通過對(duì)上述國(guó)內(nèi)外的相關(guān)研究分析,可以了解到大多數(shù)研究依然采用傳統(tǒng)圖像識(shí)別的方法與機(jī)器學(xué)習(xí)方法結(jié)合從而實(shí)現(xiàn)對(duì)農(nóng)作物病害圖像的分類,通常要在農(nóng)作物病害圖像的識(shí)別之前對(duì)病害圖像進(jìn)行預(yù)處理、病斑分割和特征提取等幾個(gè)步驟,并且對(duì)于不同的病害圖像這個(gè)過程往往采用不同的方法實(shí)現(xiàn),沒有提出可以針對(duì)多種作物不同病害圖像處理的方法.與傳統(tǒng)圖像處理手段相比,深度學(xué)習(xí)省去了大量預(yù)處理的步驟,在縮短了識(shí)別時(shí)間同時(shí)提高了識(shí)別準(zhǔn)確率以及模型的泛化性能.與傳統(tǒng)的建模方法和淺層神經(jīng)網(wǎng)絡(luò)模型相比,基于深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的識(shí)別模型魯棒性更強(qiáng)[12],對(duì)于外界環(huán)境條件要求不高,更適合應(yīng)用到實(shí)際的生產(chǎn)生活中.
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)本質(zhì)是一個(gè)多層感知機(jī),基本組成部分包括輸入層、卷積層、激活函數(shù)、池化層和全連接層5 部分.局部連接、參數(shù)共享是卷積神經(jīng)網(wǎng)絡(luò)的兩大特點(diǎn).LeNet-5[13]網(wǎng)絡(luò)結(jié)構(gòu)是早期卷積神經(jīng)網(wǎng)絡(luò)的代表性結(jié)構(gòu),由Yann LeCun 提出,用于手寫數(shù)字識(shí)別.LenNet-5 共有7 層,包括2 個(gè)卷積層、2 個(gè)池化層、3 個(gè)全連接層,其結(jié)構(gòu)如圖1所示.
圖1 LeNet-5 結(jié)構(gòu)圖[13]
隨著深度學(xué)習(xí)的不斷發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)也在不斷更新,其中Inception 網(wǎng)絡(luò)以及Resnet 網(wǎng)絡(luò)是卷積神經(jīng)網(wǎng)絡(luò)發(fā)展中最具代表性的兩類算法.
Inception 網(wǎng)絡(luò)[14]是卷積神經(jīng)網(wǎng)絡(luò)發(fā)展過程中里的重大進(jìn)展,在此之前傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)依靠堆疊卷積層來(lái)提高性能,然而隨著網(wǎng)絡(luò)層數(shù)的加深會(huì)導(dǎo)致過擬合現(xiàn)象的出現(xiàn)并且計(jì)算量也大大增加.因此Google在2014年提出了Inception-V1 算法,該算法整合不同尺度的卷積核以及池化層形成Inception 模塊,利用1×1 的卷積核進(jìn)行降維,降低了參數(shù)量.該算法在ILSVRC 2014 的比賽中取得分類任務(wù)的第一名,相比于之前的AlexNet 網(wǎng)絡(luò)[15]提高準(zhǔn)確率的同時(shí)大大減少了參數(shù)量.Inception-V3 在Inception-V1 的基礎(chǔ)上,用一維的1×7 和7×1 的兩個(gè)卷積核代替原始的7×7 的卷積核.對(duì)卷積核進(jìn)行非對(duì)稱分解不僅減少了參數(shù)規(guī)模,并且因?yàn)閷? 個(gè)卷積核拆分成為2 個(gè)卷積核這使得網(wǎng)絡(luò)也可以得到進(jìn)一步加深.
典型的Inception 模塊如圖2所示.
隨著網(wǎng)絡(luò)層數(shù)的不斷增加,網(wǎng)絡(luò)結(jié)構(gòu)越來(lái)越深,結(jié)構(gòu)加深導(dǎo)致的梯度消失問題會(huì)使模型的學(xué)習(xí)愈加艱難.因?yàn)楫?dāng)梯度被反向傳播到前面時(shí)重復(fù)相乘會(huì)導(dǎo)致梯度變得無(wú)限小,此時(shí)卷積神經(jīng)網(wǎng)絡(luò)的性能不再提升甚至開始下降.針對(duì)這個(gè)問題,Resnet 算法[16]引入了全等映射的思想,引入了殘差學(xué)習(xí)單元.其基本思想是假定某段神經(jīng)網(wǎng)絡(luò)的輸入是x,期望輸出是H(x),假設(shè)我們?nèi)绻演斎離作為初始輸出結(jié)果,那么我們需要學(xué)習(xí)的目標(biāo)就變成了H(x)-x,即我們不再學(xué)習(xí)完整的輸出H(x)而是學(xué)習(xí)殘差H(x)-x.如圖3所示,這就是一個(gè)Resnet 的殘差學(xué)習(xí)單元(residual unit).
圖2 Inception 模塊結(jié)構(gòu)圖[14]
圖3 殘差結(jié)構(gòu)單元[16]
殘差單元有效地解決了在深度網(wǎng)絡(luò)中的退化問題,并且在不額外增加網(wǎng)絡(luò)參數(shù)和計(jì)算量的基礎(chǔ)上提升了模型速度和準(zhǔn)確度.
Inception-V3 和Resnet 作為近年卷積神經(jīng)網(wǎng)絡(luò)的具有代表意義的經(jīng)典模型,在圖像分類領(lǐng)域取得了優(yōu)異的成績(jī).因此本文分別以Inception-V3 和Resnet 網(wǎng)絡(luò)為基礎(chǔ)構(gòu)建農(nóng)作物病蟲害識(shí)別模型.
本文數(shù)據(jù)來(lái)自于AI Challenger 比賽,數(shù)據(jù)集包括10 個(gè)物種,27 種病害.按照物種-病害-程度不同共分為61 類.每張圖包含一片農(nóng)作物的葉子,葉子占據(jù)圖片主要位置.其中訓(xùn)練集驗(yàn)證集分布如圖4、圖5所示,可以看出訓(xùn)練集與驗(yàn)證集分布相似但不同類別分布差異較大.由于第44 類與45 類在訓(xùn)練數(shù)據(jù)集中分別只有1 張,在驗(yàn)證集中分別有1 張和0 張,數(shù)據(jù)嚴(yán)重缺失.因此在后續(xù)實(shí)驗(yàn)中剔除以下兩類數(shù)據(jù),最終有59 種數(shù)據(jù)分類.
圖4 訓(xùn)練集數(shù)據(jù)分布
圖5 驗(yàn)證集數(shù)據(jù)分布
數(shù)據(jù)集包含圖片和標(biāo)注的JSON 文件,JSON 文件中包含每一張圖片和對(duì)應(yīng)的分類ID,JSON 文件格式如下所示:
每一個(gè)ID 代表一種類型,其對(duì)應(yīng)說明詳情如表1所示.
訓(xùn)練集包含31 716 幅農(nóng)作物病蟲害圖像,驗(yàn)證集包括4539 張農(nóng)作物病蟲害圖片.每張圖片包含一片農(nóng)作物葉片且葉片位于中心主要位置,葉片有不同程度的病變.部分圖片展示如圖6所示,從左到右依次為蘋果健康、蘋果黑星病一般、蘋果黑星病嚴(yán)重.
表1 部分ID 及其對(duì)應(yīng)說明
圖6 部分病蟲害圖片
由于數(shù)據(jù)集本身分布不均,為了增大樣本量并且提升模型泛化性能,需要對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng).數(shù)據(jù)增強(qiáng)指利用已有的數(shù)據(jù)進(jìn)行比如翻轉(zhuǎn)、平移或旋轉(zhuǎn)基于卷積神經(jīng)網(wǎng)絡(luò)的農(nóng)作物病蟲害圖像識(shí)別模型等操作來(lái)衍生出更多的數(shù)據(jù),這樣不僅可以一定程度上緩解數(shù)據(jù)不平衡問題同時(shí)也可以使模型有更好的泛化效果.
數(shù)據(jù)增強(qiáng)可以分為離線增強(qiáng)和在線增強(qiáng).離線增強(qiáng)直接對(duì)數(shù)據(jù)集進(jìn)行處理,常用于數(shù)據(jù)集較小的時(shí)候.而在線增強(qiáng)適用于大型數(shù)據(jù)集,在模型訓(xùn)練過程中獲得batch 數(shù)據(jù)之后,然后對(duì)這個(gè)batch 的數(shù)據(jù)進(jìn)行增強(qiáng),如旋轉(zhuǎn)、平移、翻折等相應(yīng)的變化,該方法相對(duì)于離線增強(qiáng)操作更為簡(jiǎn)潔,且可以使用GPU 優(yōu)化計(jì)算.因此本文在后續(xù)工作中將采用在線數(shù)據(jù)增強(qiáng)的方式.在線增強(qiáng)部分代碼如下所示:
在訓(xùn)練過程中獲取batch 數(shù)據(jù)后進(jìn)行在線增強(qiáng),具體操作如下:(1)輸入尺寸變化為默認(rèn)值224×224;(2)隨機(jī)旋轉(zhuǎn)30 度;(3)隨機(jī)水平翻轉(zhuǎn);(4)隨機(jī)垂直翻轉(zhuǎn);(5)放射變化;(6)轉(zhuǎn)為Tensor 并歸一化;(7)標(biāo)準(zhǔn)化.
通常在圖像分類的時(shí)候,我們的損失函數(shù)一般為交叉熵?fù)p失函數(shù)(cross_entropy loss).交叉熵指真實(shí)輸出(概率)與預(yù)測(cè)輸出(概率)的距離,因此交叉熵的值越小,證明兩個(gè)概率分布越接近.以二分類為例,二分類交叉熵?fù)p失函數(shù)公式如下:
其中,y表示真實(shí)樣本的標(biāo)簽(1 正0 負(fù)),正樣本是指屬于該類別的樣本,負(fù)樣本是指不屬于該類別的樣本.而y'是經(jīng)過Sigmoid 激活函數(shù)的預(yù)測(cè)輸出(數(shù)值在0-1 之間).由此可見當(dāng)y為正樣本即y等于1 時(shí),輸出概率越大損失越小.而當(dāng)y為負(fù)樣本即y等于0 時(shí),輸出概率越小則損失越小.
然而由于在數(shù)據(jù)集中存在大量簡(jiǎn)單的負(fù)樣本,這些樣本在迭代過程中產(chǎn)生的損失占據(jù)了總損失的大部分,這可能會(huì)導(dǎo)致我們偏離正確的優(yōu)化方向.
為了改善這種情況,He KM 等[16]提出的一種新的損失函數(shù)思想,并將其運(yùn)用到目標(biāo)檢測(cè)中,取得了優(yōu)異的效果,焦點(diǎn)損失函數(shù)公式如下:
首先在交叉熵的基礎(chǔ)上加上一個(gè)因子( 1-y′)γ,用于減少容易分類的樣本對(duì)于損失的貢獻(xiàn)同時(shí)增大難以分類的樣本對(duì)于損失的貢獻(xiàn).例如當(dāng)γ等于2 時(shí),y真實(shí)值等于1,預(yù)測(cè)值y′為0.95 時(shí),此時(shí)(1-0.95)的γ次方就會(huì)很小,該樣本的損失函數(shù)值就變得更小.準(zhǔn)確率越高的類衰減的越厲害,這就使得準(zhǔn)確率低的困難樣本能夠占據(jù)loss 的大部分,這樣模型在訓(xùn)練時(shí)就可以更加專注于難以分類的樣本.
在此基礎(chǔ)上,引入平衡因子α,該因子可以用來(lái)平衡正負(fù)樣本本身的數(shù)量比例不均即類別不均衡.根據(jù)實(shí)驗(yàn)表明當(dāng)α的值取0.25,γ的值取2 時(shí),該組合效果最好.
基于焦點(diǎn)損失函數(shù)的思想,將該解決思路用于本文的病蟲害識(shí)別多分類模型中,用焦點(diǎn)損失函數(shù)代替原有的傳統(tǒng)交叉熵?fù)p失函數(shù)(cross_entropy loss).實(shí)驗(yàn)證明對(duì)損失函數(shù)進(jìn)行優(yōu)化后的模型準(zhǔn)確率得到了進(jìn)一步提升.
基于上述數(shù)據(jù)集建立農(nóng)作物病蟲害分類模型,訓(xùn)練集包含31 716 幅農(nóng)作物病蟲害圖像,驗(yàn)證集包括4539 張農(nóng)作物病蟲害圖片.選取Inception-V3,resnet18,resnet34,resnet50 等4 類代表性深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練.訓(xùn)練方式采用遷移學(xué)習(xí)的方式,利用已在大型數(shù)據(jù)集ImageNet 進(jìn)行預(yù)訓(xùn)練后的模型,凍結(jié)前幾層的權(quán)重,根據(jù)該數(shù)據(jù)集修改全連接層的輸出,重新以本文農(nóng)作物病蟲害數(shù)據(jù)集為基礎(chǔ)進(jìn)行訓(xùn)練,最終得到基于農(nóng)作物病蟲害圖像的識(shí)別模型.流程如圖7所示.
圖7 病蟲害識(shí)別模型學(xué)習(xí)流程
本文采用深度學(xué)習(xí)框架Pytorch,圖片輸入大小為224×224,batch size 設(shè)置為128,epochs 設(shè)置為40,由于模型進(jìn)行遷移學(xué)習(xí)只需要微調(diào)因此初始學(xué)習(xí)率設(shè)置為0.001 即可.在后續(xù)過程中對(duì)學(xué)習(xí)率采用等間隔調(diào)節(jié)的策略,每十輪迭代后學(xué)習(xí)率調(diào)整為當(dāng)前學(xué)習(xí)率為0.1 倍.
對(duì)于優(yōu)化算法而言,Adam 優(yōu)化算法既考慮了Momentum 優(yōu)化算法動(dòng)量累計(jì)梯度的思路,又結(jié)合了RMSProp 優(yōu)化算法在加速收斂速度的同時(shí)減小波幅的優(yōu)點(diǎn),因此本文在后續(xù)訓(xùn)練過程中選擇Adam 優(yōu)化器.
模型訓(xùn)練過程中的迭代詳情如圖8所示.
(1)加載已在Imagenet 上進(jìn)行好預(yù)訓(xùn)練的模型,固定前幾層的權(quán)重并將全連接層的輸出改為本文病蟲害數(shù)據(jù)集類別數(shù)59.
(2)按照上文的參數(shù)設(shè)置初始化網(wǎng)絡(luò).
(3)加載病蟲害圖像數(shù)據(jù)并進(jìn)行數(shù)據(jù)增強(qiáng)后輸入卷積神經(jīng)網(wǎng)絡(luò).
(4)通過該模型得到的預(yù)測(cè)類別與輸入圖片的實(shí)際類別進(jìn)行對(duì)比,計(jì)算損失.
(5)誤差反向傳播對(duì)網(wǎng)絡(luò)的每個(gè)權(quán)重求偏導(dǎo)計(jì)算梯度乘以學(xué)習(xí)率進(jìn)行更新.
(6)在驗(yàn)證集上進(jìn)行識(shí)別得到該模型的正確率.
圖8 訓(xùn)練迭代流程
本次實(shí)驗(yàn)選擇Inception-V3,resnet18,resnet34,resnet50 等4 類代表性卷積網(wǎng)絡(luò)神經(jīng)結(jié)構(gòu),分別進(jìn)行遷移學(xué)習(xí)并在此基礎(chǔ)上對(duì)原有的損失函數(shù)進(jìn)行優(yōu)化,建立的病蟲害識(shí)別模型準(zhǔn)確率如圖9所示.可以看出這4 類模型收斂后準(zhǔn)確率相差甚微,且準(zhǔn)確率均在86%以上.
圖9 不同模型top1 準(zhǔn)確率曲線變化
分別將原始模型以及優(yōu)化后的模型進(jìn)行對(duì)比,訓(xùn)練過程準(zhǔn)確率曲線如圖10所示,我們可以看出在Inception-V3,resnet18,resnet34,resnet50 等4 種經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)下,優(yōu)化后的模型在前期和后期都取得了更優(yōu)的結(jié)果,收斂后4 類模型的準(zhǔn)確率均得到了有效提升.
圖10 模型對(duì)比top1 準(zhǔn)確率曲線變化
最終實(shí)驗(yàn)結(jié)果如表2所示,可以看出不論是原始模型還是優(yōu)化后的模型對(duì)農(nóng)作物病蟲害圖片識(shí)別的準(zhǔn)確率都在85%以上,證明了卷積神經(jīng)網(wǎng)絡(luò)在病蟲害識(shí)別中可行性以及有效性.且與傳統(tǒng)圖像處理以及機(jī)器學(xué)習(xí)的方法相比,基于卷積神經(jīng)網(wǎng)絡(luò)建立的識(shí)別模型前期并不需要繁雜的圖像預(yù)處理步驟,數(shù)據(jù)增強(qiáng)也可以通過訓(xùn)練過程中在線完成,模型建立過程更加簡(jiǎn)潔.通過對(duì)比實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn)在Inception-V3,resnet18,resnet34,resnet50 等4 種經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)下,對(duì)損失函數(shù)進(jìn)行進(jìn)一步優(yōu)化后的農(nóng)作物病蟲害識(shí)別模型的準(zhǔn)確率都得到了有效的提升.
表2 準(zhǔn)確率對(duì)比
本文通過遷移學(xué)習(xí)的方法,將卷積神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于農(nóng)作物病蟲害識(shí)別中,基于不同的代表性網(wǎng)絡(luò)結(jié)構(gòu)建立了農(nóng)作物病蟲害識(shí)別模型,其準(zhǔn)確率均達(dá)到85%以上,證明了將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于病蟲害識(shí)別是可行并且有效的.并且在對(duì)損失函數(shù)進(jìn)行優(yōu)化后的新的模型的準(zhǔn)確率可以提升到86.5%以上.通過該農(nóng)作物病蟲害模型我們可以快速識(shí)別不同病蟲害,并且可以根據(jù)程度不同采取合適措施,噴灑不同劑量的農(nóng)藥,實(shí)現(xiàn)農(nóng)業(yè)現(xiàn)代化的同時(shí)減輕農(nóng)藥對(duì)環(huán)境的污染.
然而農(nóng)作物病蟲害種類遠(yuǎn)超本文數(shù)據(jù)集中所示的種類,想要應(yīng)用于實(shí)際生產(chǎn)中我們?nèi)匀恍枰蟾娴臄?shù)據(jù)集進(jìn)行模型訓(xùn)練.然而農(nóng)作物病蟲害數(shù)據(jù)收集困難,人工標(biāo)注成本極其高昂.因此如何獲得更全面的數(shù)據(jù)集且如何對(duì)獲得的數(shù)據(jù)集進(jìn)行準(zhǔn)確標(biāo)注是我們未來(lái)研究的重點(diǎn)內(nèi)容.