摘要:
桃樹缺磷癥(Peach Phosphorus Deficiency, PPD)初期癥狀不明顯、不同階段癥狀差異大,而現(xiàn)有的基于計(jì)算機(jī)視覺的桃樹病害識別模型,識別準(zhǔn)確率不高、對不同品種識別泛化性差,為此,提出改進(jìn)Faster R-CNN(Faster Region based Convolutional Neural Network)模型。首先,使用RS(Rank amp; Sort)-Loss函數(shù)代替區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network,RPN)中的交叉熵函數(shù);其次,使用Soft-NMS(Non-Maximum Suppression)算法代替原有的NMS算法;最后,使用ResNeXt101網(wǎng)絡(luò)替換原來的特征提取網(wǎng)絡(luò),提高對PPD識別的準(zhǔn)確率和泛化性,并在自建PPD數(shù)據(jù)集上進(jìn)行檢測試驗(yàn)。試驗(yàn)結(jié)果表明:改進(jìn)后的Faster R-CNN網(wǎng)絡(luò)在自建PPD數(shù)據(jù)集上對PPD的各類別平均檢測準(zhǔn)確率達(dá)92.28%、召回率達(dá)92.31%、識別準(zhǔn)確率達(dá)92.28%,滿足實(shí)際應(yīng)用要求。
關(guān)鍵詞:桃樹缺磷癥;改進(jìn)Faster R-CNN;RPN;Soft-NMS;ResNeXt101
中圖分類號:S436.621; TP391.4
文獻(xiàn)標(biāo)識碼:A
文章編號:2095-5553 (2024) 04-0162-07
收稿日期:2023年4月20日" 修回日期:2023年8月25日
基金項(xiàng)目:河南省科技廳科技攻關(guān)項(xiàng)目(212102310553);河南省科技廳科技攻關(guān)項(xiàng)目(222102210116)
第一作者:胡彥軍,男,1981年生,鄭州人,碩士,副教授;研究方向?yàn)橛?jì)算機(jī)視覺、智慧農(nóng)業(yè)。E-mail: 13622572@qq.com
通訊作者:張燁,男,1983年生,河南新鄉(xiāng)人,碩士,副教授;研究方向?yàn)橹腔坜r(nóng)業(yè)。E-mail: zhangye40061014@xxu.edu.cn
Research on peach phosphorus deficiency detection based on improved Faster R-CNN
Hu Yanjun1, 2, 3, Zhang Ye2, Zhang Pingchuan3, Zhang Caihong3, Chen Zhao3, Chen Xu3
(1. School of Applied Engineering, Henan University of Science and Technology, Sanmenxia, 472099, China;
2. College of Mechanical and Electrical Engineering, Xinxiang University, Xinxiang, 453003, China;
3. School of Computer Science amp; Technology, Henan Institute of Science and Technology, Xinxiang, 453003, China)
Abstract:
The initial symptoms of peach phosphorus deficiency (PPD) are not obvious, and the symptoms differ greatly in different stages. However, the existing peach disease identification model based on computer vision has low identification accuracy and poor generalization of different varieties. Therefore, the Faster R-CNN (Faster Region based Convolutional Neural Network) model is improved. Firstly, the RS (Rank amp; Sort)-Loss function is used to replace the cross-entropy function in the Region Proposal Network (RPN). Secondly, the Soft-NMS (Non-Maximum Suppression) algorithm is used to replace the original NMS algorithm. Finally, ResNeXt101 network is used to replace the original feature extraction network to improve the accuracy and generalization of PPD recognition, and the detection test is carried out on the self-built PPD data set. The experimental results show that the improved Faster R-CNN network has an average detection accuracy of 92.28%, a recall rate of 92.31% and a recognition accuracy of 92.28% on the self-built PPD data set, which meets the practical application requirements.
Keywords:
peach phosphorus deficiency; improved Faster R-CNN; RPN; Soft-NMS; ResNeXt101
0 引言
桃樹缺磷癥是一種桃樹在其生長期間常見的生理性病害,在7—8月發(fā)生較為嚴(yán)重[1]。桃樹發(fā)生輕度缺磷時,枝條相較于正常枝條,細(xì)而直立且分枝較少,呈紫紅色;初期全株葉片表現(xiàn)為深綠色,此時癥狀與施氮過多癥狀相似;缺磷嚴(yán)重時,老葉片呈棕褐色或青銅色或紅褐色,頂端新葉直立生長,葉緣及葉尖向下卷曲,新葉細(xì)長呈暗綠色或灰綠色無光澤,有時葉片基部出現(xiàn)綠色和黃綠色相間的斑紋。磷在桃樹體內(nèi)能轉(zhuǎn)移,所以PPD先從老葉開始表現(xiàn),由老葉向新葉發(fā)展,出現(xiàn)落葉提前、葉片稀少的情況。桃樹患有PPD時,春季開花展葉時間延遲、花芽瘦弱數(shù)量少、坐果率低。果實(shí)成熟期推遲、果體小、色澤不鮮艷、甜度低、品質(zhì)差,桃樹整體樹勢弱,生長遲緩[2, 3]。PPD在不同時期表現(xiàn)差異較大,且與其他病癥有相似的地方,果農(nóng)不易準(zhǔn)確識別。
傳統(tǒng)的作物病害識別主要由植保專家根據(jù)自己的經(jīng)驗(yàn)和病害特征做出判斷,但這種診斷方法受經(jīng)驗(yàn)、作物所處生長階段和天氣條件等因素影響。同種病癥,在不同環(huán)境條件下,病癥表現(xiàn)會有差異,所以病害診斷經(jīng)常難以達(dá)到理想的識別準(zhǔn)確度[4]。在種植產(chǎn)業(yè)化背景下,農(nóng)作物被大規(guī)模種植,傳統(tǒng)的人工識別農(nóng)作物病害的方法存在識別效率低、準(zhǔn)確率低的問題。一些研究者使用了紅外成像技術(shù),對作物病害進(jìn)行識別。Chen等[5]通過熱紅外成像技術(shù),獲取健康油菜和患病油菜區(qū)域的溫度數(shù)據(jù),以多重溫度指標(biāo)區(qū)分健康與病害油菜,實(shí)現(xiàn)了對早期油菜菌核病的識別。Li等[6]使用高光譜成像技術(shù)對水稻稻瘟病進(jìn)行分級檢測,通過主成分分析法和競爭性自適應(yīng)重加權(quán)法兩種算法選擇特征變量,實(shí)現(xiàn)了水稻稻瘟病的分級檢測。還有部分研究人員通過提取葉片DNA進(jìn)行聚合酶鏈反應(yīng)[7]或?qū)崟r聚合酶鏈反應(yīng)[8],這兩種檢測方法雖然檢測精度高,但對試驗(yàn)條件和專業(yè)操作有極高的要求。為確保植物病害診斷的簡單性、實(shí)時性、低成本和高準(zhǔn)確性,部分學(xué)者提出了,基于圖像的植物病害計(jì)算機(jī)輔助診斷識別方法[9]。Geetharaman等[10]將深度CNN模型優(yōu)化為9層,使用plant village提供的數(shù)據(jù)集進(jìn)行識別試驗(yàn),試驗(yàn)結(jié)果顯示準(zhǔn)確率達(dá)到96.46%。Fuentes等[11]分別使用Faster R-CNN、R-FCN、SSD三種網(wǎng)絡(luò)定位圖像中的害蟲,然后再對提取到的特征區(qū)域進(jìn)行分類。李就好等[12]對原始的Faster-R-CNN進(jìn)行修改,增加區(qū)域建議框的尺寸個數(shù),并在ResNet-50的基礎(chǔ)上融入了特征金字塔網(wǎng)絡(luò)(Feature Pyramid Networks),增強(qiáng)了網(wǎng)絡(luò)的識別效果。通過對自然環(huán)境條件下的苦瓜葉部病害進(jìn)行目標(biāo)檢測訓(xùn)練試驗(yàn),試驗(yàn)結(jié)果表明,通過該方法訓(xùn)練的網(wǎng)絡(luò)模型具有良好的魯棒性,平均檢測準(zhǔn)確率mAP達(dá)到86.39%。Dechant等[13]集成多個卷積神經(jīng)網(wǎng)絡(luò),識別玉米大斑病。陳娟等[14]通過改進(jìn)ResNet,提出改進(jìn)殘差網(wǎng)絡(luò)的園林害蟲圖像識別方法。
由于桃樹PPD在不同時期癥狀差異較大,使用上述文獻(xiàn)提供的方法識別效果不佳,為此,本文提出使用RS-Loss函數(shù)[15]代替交叉熵函數(shù)(cross-entropy function)、使用Soft-NMS算法[16]代替NMS算法、使用ResNeXt101網(wǎng)絡(luò)替換原來的特征提取網(wǎng)絡(luò)ResNet50。由于初始采集的PPD圖片數(shù)量有限,需對數(shù)據(jù)集采用垂直翻轉(zhuǎn)、水平翻轉(zhuǎn)、30°旋轉(zhuǎn)、亮度調(diào)整、銳度調(diào)整、對比度調(diào)整進(jìn)行增強(qiáng),從而建立PPD數(shù)據(jù)集,滿足自然生長場景下PPD自動識別的應(yīng)用需求。
1 改進(jìn)Faster R-CNN算法
Faster R-CNN是在Fast R-CNN[17]基礎(chǔ)上進(jìn)行優(yōu)化改進(jìn),引入RPN替換Fast R-CNN的選擇性搜索(select search)算法[18]。RPN將區(qū)域建議提取集成到深度卷積神經(jīng)網(wǎng)絡(luò),在每個位置同時預(yù)測目標(biāo)邊界框和類別置信度分?jǐn)?shù)(Confidence Score)。Faster R-CNN實(shí)現(xiàn)端到端的目標(biāo)檢測,提高檢測精度和速度,生成建議框僅需10 ms。Faster R-CNN網(wǎng)絡(luò)由特征提取層、RPN、RoI Pooling層、分類和回歸層等4部分組成,其特征提取層可以采用ResNet50[19]或VGG-16[20]網(wǎng)絡(luò)。
為提高Faster R-CNN對PPD的識別準(zhǔn)確率,本文對其特征提取網(wǎng)絡(luò)進(jìn)行改進(jìn),首先,用RS-Loss函數(shù)代替RPN中的交叉熵?fù)p失函數(shù);其次,用Soft-NMS算法替換NMS算法;最后,用特征提取能力更強(qiáng)的ResNeXt101[21]網(wǎng)絡(luò)替換原來的特征提取網(wǎng)絡(luò)。改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
1.1 標(biāo)準(zhǔn)RPN解析
RPN接受特征提取網(wǎng)絡(luò)生成的特征圖,使用3×3的滑動窗口對特征圖進(jìn)行操作。對于每個滑動窗口,生成一組特定的錨框。這些錨框有3種不同的長寬比(1∶1、1∶2、2∶1)和3種不同尺寸(128、256、512)。所以特征圖中每個像素共有9種錨框,在特征圖大小為W×H的情況下,錨框的總數(shù)量為W×H×9,其中W表示特征圖寬的像素?cái)?shù),H表示特征圖高的像素?cái)?shù)。如圖2所示,圖像尺寸為600×900,坐標(biāo)為(450, 350)處的像素點(diǎn)產(chǎn)生了9個錨框。
如圖2所示的三種不同尺寸的錨框,每個尺寸的錨框都有3個,這3個錨框的高度寬度比例分別為1∶1、1∶2和2∶1?,F(xiàn)在特征圖的每個位置設(shè)置了9個錨框,但可能有很多錨框里沒有任何物體,因此,模型需要學(xué)習(xí)哪些錨框可能有目標(biāo)物體。有目標(biāo)物體的錨框可以被歸類為前景,其他的則是背景。同時,模型需要學(xué)習(xí)前景錨框的偏移量,以適應(yīng)物體。
錨框的定位和分類是由邊界框調(diào)節(jié)器和邊界框分類器完成的。邊界框分類器計(jì)算每個錨框有目標(biāo)物體的概率,根據(jù)此概率將錨框劃分為前景或背景[22]。邊界箱回歸器根據(jù)x,y,w,h的值計(jì)算相對于前景錨框的偏移量,其中(x,y)是錨框的中心坐標(biāo),w、h分別為錨框的寬度和高度。
1.2 改進(jìn)RPN的損失函數(shù)
RPN中使用交叉熵函數(shù),由于該函數(shù)采用了類間競爭機(jī)制,比較擅長于學(xué)習(xí)類間的信息,但是只關(guān)心對正樣本標(biāo)簽預(yù)測的準(zhǔn)確性,而忽略了負(fù)樣本標(biāo)簽的差異,從而導(dǎo)致學(xué)習(xí)到的特征比較分散。
標(biāo)準(zhǔn)RPN屬于多重任務(wù),其中包括分類、邊框回歸等多個子任務(wù),因此這類任務(wù)的交叉熵?fù)p失函數(shù)通常是多個子任務(wù)的加權(quán)和。由于子任務(wù)和階段的多樣性以及每個任務(wù)重要性的不平衡,造成此類任務(wù)中超參數(shù)較多。這些超參數(shù)可以平衡不同任務(wù)重要性來使得模型獲得更好性能,但由于調(diào)這些超參數(shù)需要耗費(fèi)大量的時間和資源,并且最終可能僅得到次優(yōu)模型,沒有達(dá)到最優(yōu)模型。
為解決上述問題,本文采用文獻(xiàn)[15]提出的排名分類損失函數(shù)(Rank amp; Sort (RS)-Loss)代替RPN中交叉熵?fù)p失函數(shù),簡化模型訓(xùn)練的復(fù)雜性,使模型可以達(dá)到更好的性能。RS-Loss總共由Rank和Sort兩部分組成。Rank將每個正樣本排在所有負(fù)樣本之上,Sort根據(jù)IoU來對正樣本進(jìn)行排序。RS-Loss不僅將正負(fù)樣本進(jìn)行了排序,還在正樣本間進(jìn)行了排序,這一特性使得在訓(xùn)練過程中可以有效解決極端的類別不均衡問題,而不需要采用啟發(fā)式的采樣。此外,除了學(xué)習(xí)率,RS-Loss不需要任何超參數(shù)調(diào)優(yōu),因?yàn)樵赗S-Loss中沒有需要調(diào)優(yōu)的任務(wù)平衡參數(shù)。
1.3 改進(jìn)NMS算法
NMS算法是各類目標(biāo)檢測算法中必要處理步驟,其思想是搜索局部最大值,抑制非極大值。在進(jìn)行PPD檢測過程中,再同一片PPD葉片上會產(chǎn)生大量的候選框,這些候選框之間可能會相互重疊,每個框有一個置信度得分(confidence score),如圖3(a)所示。NMS首先將候選框按置信度進(jìn)行排序,選擇置信度最高的邊界框添加到最終的輸出列表中;將其從邊界框列表中刪除,再計(jì)算所有邊界框的面積,計(jì)算置信度最高的邊界框與每一個候選框的交并比(Intersection over Union,IoU,即兩個邊界框的交集部分除以它們的并集),若該邊界框的IoU值大于閾值,則刪除該邊界框;重復(fù)以上操作直至邊界框列表為空,選擇出最優(yōu)框的目標(biāo),如圖3(b)所示。
NMS算法是一個不連續(xù)二值權(quán)重函數(shù)的特例,即式(1)所示。
Si=
SiIoU(M,boxi)lt;Nt
0IoU(M,boxi)lt;Nt
(1)
式中:
Si——
第i個預(yù)測框?qū)?yīng)的置信度得分;
M——最高得分的候選框;
boxi——待檢測框;
Nt——超參數(shù)設(shè)定的重疊閾值;
IoU——
boxi和M的交集與并集的比。
綜上可知,NMS算法對于重疊閾值Nt設(shè)定敏感,其值設(shè)定過低會導(dǎo)致漏檢,設(shè)定過高會導(dǎo)致誤檢。如圖4所示,兩片PP桃葉的最高得分分別為0.92和0.91,若按照NMS算法處理,首先會選中得分為0.92的框,然后得分為0.91的候選框會由于IoU過高而刪除。由于NMS算法只保留了最高分?jǐn)?shù)的預(yù)測框,容易造成漏檢,本文中得分最高的最前面的PPD桃葉被檢出了,而被遮擋的PPD桃葉被漏檢了。
為解決漏檢誤檢問題,本文采用Soft-NMS算法替換NMS算法。Soft-NMS吸取了NMS的教訓(xùn),在算法執(zhí)行過程中不是簡單的刪除IoU大于閾值的檢測框,而是降低其得分。Soft-NMS算法流程同NMS相同,但其對置信度得分使用函數(shù)運(yùn)算以降低其置信度得分,而不是刪除。Soft-NMS算法采用的線性加權(quán)函數(shù)如式(2)所示。
Si=
SiIoU(M,boxi)lt;Nt
Si[1-IoU(M,boxi)]IoU(M,boxi)lt;Nt
(2)
圖5為NMS算法與Soft-NMS算法識別效果對比圖。由圖5可知,傳統(tǒng)Faster R-CNN中的NMS算法只選取重疊度區(qū)域中較高得分的候選框,造成了圖中被遮擋的兩片PPD桃葉的漏檢,而改進(jìn)后的Soft-NMS算法保留了重疊區(qū)域中得分較低的候選框,降低了PPD目標(biāo)識別的漏檢率。
1.4 改進(jìn)特征提取網(wǎng)絡(luò)
桃葉圖像中極易出現(xiàn)桃葉之間遮擋嚴(yán)重、病葉姿態(tài)各異、自然光圖像成像質(zhì)量較差、不同程度PPD桃葉差異大等問題,以上問題會導(dǎo)致PPD圖像難以檢測。Faster R-CNN的特征提取網(wǎng)絡(luò)ResNet50通過增加網(wǎng)絡(luò)層數(shù)來擬合模型,但隨著網(wǎng)絡(luò)層數(shù)的增加,經(jīng)常出現(xiàn)梯度爆炸或者梯度彌散現(xiàn)象,導(dǎo)致模型難以訓(xùn)練成功。本文選擇使用特征提取能力較強(qiáng)的ResNeXt101網(wǎng)絡(luò)替換原特征提取網(wǎng)絡(luò)ResNet50網(wǎng)絡(luò),ResNeXt101網(wǎng)絡(luò)借鑒了Inception網(wǎng)絡(luò)[23]中的拓?fù)浣Y(jié)構(gòu),采用“拆分—轉(zhuǎn)換—合并”策略,對Bottleneck結(jié)構(gòu)進(jìn)行搭建,增加了網(wǎng)絡(luò)的基數(shù)(Cardinality),提高了模型的表達(dá)能力,這樣既提高了模型的檢測精度,又保證了模型的參數(shù)量不增加。此外,ResNeXt101網(wǎng)絡(luò)利用Shortcut connection結(jié)構(gòu)實(shí)現(xiàn)信息由低層到高層的傳遞,解決了梯度爆炸與梯度彌散的問題,提高了網(wǎng)絡(luò)對自然環(huán)境下重疊桃葉圖像中細(xì)節(jié)信息特征的感知能力。
ResNeXt101網(wǎng)絡(luò)將瓶頸結(jié)構(gòu)擴(kuò)展成分支結(jié)構(gòu),每條分支都采用相同的結(jié)構(gòu)。其輸出如式(3)所示。
F=f+∑Cr=1Sr(f)
(3)
式中:
f——輸入;
F——輸出;
S——相同的拓?fù)浣Y(jié)構(gòu);
C——分支數(shù)量;
r——分支編號。
圖6為ResNeXt101塊結(jié)構(gòu),由32路輸出入為4通道的等效變換構(gòu)成,即用32個分組卷積替換分支結(jié)構(gòu),圖中每層的參數(shù)表示格式為:輸入通道數(shù),卷積核尺寸,輸出通道數(shù)。
本文使用RS-Loss函數(shù)代替RPN中交叉熵?fù)p失函數(shù),改進(jìn)RPN網(wǎng)絡(luò),避免進(jìn)行多任務(wù)權(quán)重和系數(shù)調(diào)整以及某一個損失占據(jù)主導(dǎo)地位的情況;使用Soft-NMS算法替換NMS算法,降低漏檢率;使用ResNeXt101網(wǎng)絡(luò)替換ResNet50網(wǎng)絡(luò)提高網(wǎng)絡(luò)的特征提取能力。Faster R-CNN改進(jìn)前后的結(jié)構(gòu)對比如圖7所示。
2 試驗(yàn)數(shù)據(jù)集
PPD癥狀可以表現(xiàn)在葉片和果實(shí)上,由于果實(shí)的癥狀主要表現(xiàn)為果實(shí)小、味道淡、含糖量低等特點(diǎn)。因此本文以桃葉作為研究對象,數(shù)據(jù)集分為健康桃葉和PPD桃葉兩部分。由于不同品種的桃樹葉片有一定差異,為提高模型的泛化性,本文共采集果園油蟠桃、毛蟠桃、黃桃、油桃、離核桃五種不同品種的桃樹健康葉片圖像共773張,其中152張來自PlantVillage[24]圖像數(shù)據(jù)庫,其余621張健康桃葉圖片來自河南科技學(xué)院農(nóng)業(yè)信息技術(shù)實(shí)習(xí)基地。健康桃葉圖像如圖8所示。
PPD桃葉在河南科技學(xué)院農(nóng)業(yè)信息技術(shù)實(shí)習(xí)基地采集到203張圖片,在河南科技學(xué)院東門桃園采集了125張圖片,共計(jì)328張。本文通過對這些圖片進(jìn)行截取,共獲取PPD照片800張,如圖9所示。
為提高所訓(xùn)練網(wǎng)絡(luò)的魯棒性,本文選取圖像增強(qiáng)方式有圖像垂直翻轉(zhuǎn)、水平翻轉(zhuǎn)、30°旋轉(zhuǎn)、亮度調(diào)整、銳度調(diào)整、對比度調(diào)整,如圖10所示。
通過數(shù)據(jù)增強(qiáng)最終形成由1 546張健康桃葉圖片和1 600張PPD圖片構(gòu)成的PPD數(shù)據(jù)集。將以上數(shù)據(jù)集按照7∶2∶1的比例劃分為訓(xùn)練集、驗(yàn)證集和測試集,劃分情況如表1所示。
3 試驗(yàn)結(jié)果與分析
3.1 試驗(yàn)環(huán)境
試驗(yàn)環(huán)境由計(jì)算機(jī)硬件和開發(fā)平臺兩部分組成,操作系統(tǒng):Red Hat 4.8.5-44,CPU:Intel(R) Xeon(R) Gold 6248R,GPU:NVIDIA Tesla V100S,深度學(xué)習(xí)框架:Pytorch 1.10.0,CUDA:10.2。
3.2 消融試驗(yàn)結(jié)果與分析
為驗(yàn)證所提方法的可行性、有效性和準(zhǔn)確性,本文在PPD數(shù)據(jù)集上進(jìn)行了PPD檢測試驗(yàn)。試驗(yàn)訓(xùn)練了三種類型的Faster R-CNN神經(jīng)網(wǎng)絡(luò),分別是Original版本、ResNet50+Softer-NMS+RS損失函數(shù)、ResNeXt101+Softer-NMS+RS損失函數(shù)。訓(xùn)練迭代了3 000次,訓(xùn)練集損失變化如圖11所示,損失值隨著迭代次數(shù)的增加逐步趨于穩(wěn)定,未出現(xiàn)大幅波動,沒有出現(xiàn)過擬合現(xiàn)象,模型效果穩(wěn)定。同時試驗(yàn)結(jié)果也顯示改進(jìn)后的Faster R-CNN的損失與初始的相比波動更小,說明改進(jìn)后的網(wǎng)絡(luò)更加穩(wěn)定。ResNeXt101+Softer-NMS+RS-Loss函數(shù)的Faster R-CNN具有最低的損失值,且訓(xùn)練過程中收斂較快。
本文提取了三個版本的Faster R-CNN網(wǎng)絡(luò)在驗(yàn)證集上取得的各類別平均檢測準(zhǔn)確率mAP、召回率Recall、準(zhǔn)確率Accuracy(全部預(yù)測正確(包括正樣本和負(fù)樣本)的樣本占所有樣本的比例),進(jìn)行比較,結(jié)果如表2所示。
由表2可知,不同的改進(jìn)網(wǎng)絡(luò)方法對PPD的檢測精確度影響不同,采用ResNeXt101+Softer-NMS+RS-Loss函數(shù)的Faster R-CNN網(wǎng)絡(luò)3個評價(jià)指標(biāo)均得分最高,mAP達(dá)到92.28%,Recall達(dá)到92.31%,Accuracy達(dá)到了93.51%。相較于原版Faster R-CNN,3個指標(biāo)分別提高12.21%、6.99%、20.67%,采用ResNeXt101和RS-Loss函數(shù)的Faster R-CNN確實(shí)增強(qiáng)了特征提取能力,提高預(yù)測的準(zhǔn)確率。
為比較改進(jìn)的Faster R-CNN與初始的Faster R-CNN圖像識別效果,采用這兩種神經(jīng)網(wǎng)絡(luò)訓(xùn)練出的最優(yōu)權(quán)重文件對PPD圖片進(jìn)行檢測對比,檢測結(jié)果如圖12所示。在識別明顯的PPD桃葉方面,兩種神經(jīng)網(wǎng)絡(luò)的識別效果差距不大,都能以較高概率識別,但對于被遮擋的PPD桃葉,采用Softer-NMS算法替換NMS算法使改進(jìn)后的Faster R-CNN網(wǎng)絡(luò)有效降低了漏檢率。
4 結(jié)論
1)" 本文針對PPD存在初期癥狀不明顯,不同是時期癥狀差異大,在自然環(huán)境下PPD檢測識別難度較大等問題,建立由1 546張健康桃葉和1 600 PPD桃葉組成的PPD數(shù)據(jù)集;同時提出一種改進(jìn)的Faster R-CNN桃樹缺磷癥檢測模型。
2)" 使用RS-Loss函數(shù)代替RPN中交叉熵?fù)p失函數(shù),不但顯著減少超參數(shù)數(shù)量,而且訓(xùn)練模型時超參數(shù)不需要反復(fù)調(diào)節(jié),只需調(diào)整學(xué)習(xí)率便可以提高模型性能。同時避免多任務(wù)權(quán)重調(diào)整和某一個損失占據(jù)主導(dǎo)地位的情況;使用Soft-NMS 算法替換NMS算法,降低漏檢率;使用ResNeXt101代替ResNet50提高特征提取能力。
3)" 使用本文提出的模型在自建的PPD數(shù)據(jù)集上進(jìn)行模型訓(xùn)練和檢測試驗(yàn),結(jié)果證明改進(jìn)的Faster R-CNN模型相較原版模型,對PPD的檢測效果顯著提高,mAP達(dá)到92.28%、召回率達(dá)到92.31%、準(zhǔn)確率93.51%,表明該模型設(shè)計(jì)合理,可為PPD檢測提供理論和技術(shù)支持。
參 考 文 獻(xiàn)
[1] 米日古麗·吾布力. 桃樹缺磷表現(xiàn)及防止措施[J]. 農(nóng)村科技, 2010(4): 20-21.
[2] 君廣斌, 魏鳳鳳. 渭北長武桃樹缺素癥的防治技術(shù)措施[J].果農(nóng)之友, 2021(11): 47-49.
[3] 鄭峰, 王永克. 桃樹常見缺素癥狀及防止措施[J]. 河南農(nóng)業(yè), 2022(4): 37.
[4] Singh V, Sharma N, Singh S. A review of imaging techniques for plant disease detection [J]. Artificial Intelligence in Agriculture, 2020, 4: 229-242.
[5] Chen X X, Liu Z Y, Li M Q, et al. Diagnosis and monitoring of sclerotinia stem rot of oilseed rape using thermal infrared imaging [J]. Spectroscopy and Spectral Analysis, 2019, 39(3): 730-737.
[6] Li K, Jian-qing Y, Rui G, et al. Early detection and identification of rice blast based on hyperspectral image [J]. Spectroscopy and Spectral Analysis, 2021, 41(3): 898-902.
[7] Henson J M, French R. The polymerase chain reaction and plant disease diagnosis [J]. Annual Review of Phytopathology, 1993, 31(1): 81-109.
[8] Koo C, Malapi-Wight M, Kim H S, et al. Development of a real-time microchip PCR system for portable plant disease diagnosis [J]. PloS One, 2013, 8(12): e82704.
[9] Kailey K S, Sahdra G S. Content-Based Image Retrieval (CBIR) for identifying image based plant disease [J]. International Journal of Computer Technology and Applications, 2012, 3(3): 1099-1104
[10] Geetharamani G, Pandian A. Identification of plant leaf diseases using a nine-layer deep convolutional neural network [J]. Computers amp; Electrical Engineering, 2019, 76: 323-338.
[11] Fuentes A, Yoon S, Kim S C, et al. A robust deep-learning-based detector for real-time tomato plant diseases and pests recognition [J]. Sensors, 2017, 17(9): 2022.
[12] 李就好, 林樂堅(jiān), 田凱, 等. 改進(jìn)Faster R-CNN的田間苦瓜葉部病害檢測[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2020, 36(12): 179-185.
Li Jiuhao, Lin Lejian, Tian Kai, et al. Detection of leaf diseases of balsam pear in the field based on improved Faster R-CNN [J]. Transactions of the Chinese Society of Agricultural Engineering, 2020, 36(12): 179-185.
[13] Dechant C, Wiesner-Hanks T, Chen S, et al. Automated identification of northern leaf blight-infected maize plants from field imagery using deep learning [J]. Phytopathology, 2017: 1426-1432.
[14] 陳娟, 陳良勇, 王生生, 等. 基于改進(jìn)殘差網(wǎng)絡(luò)的園林害蟲圖像識別[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2019, 50(5): 187-195.
Chen Juan, Chen Liangyong, Wang Shengsheng, et al. Pest image recognition of garden based on improved residual network [J]. Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(5): 187-195.
[15] Oksuz K, Cam B C, Akbas E, et al. Rank amp; sort loss for object detection and instance segmentation [C]. Proceedings of the IEEE/CVF International Conference on Computer Vision, 2021: 3009-3018.
[16] Li Y, Li S, Du H, et al. YOLO-ACN: Focusing on small target and occluded object detection [J]. IEEE Access, 2020, 8: 227288-227303.
[17] Girshick R. Fast r-cnn [C]. Proceedings of the IEEE International Conference on Computer Vision, 2015: 1440-1448.
[18] Uijlings J R R, Van De Sande K E A, Gevers T, et al. Selective search for object recognition [J]. International Journal of Computer Vision, 2013, 104: 154-171.
[19] He K, Zhang X, Ren S, et al. Deep residual learning for image recognition [C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016: 770-778.
[20] Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition [J]. arXiv Preprint arXiv: 1409.1556, 2014.
[21] Lin T Y, Dollár P, Girshick R, et al. Feature pyramid networks for object detection [C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017: 2117-2125.
[22] 方帥, 金忍, 于磊, 等. 一種基于RGBD圖像的似物性采樣算法[J]. 圖學(xué)學(xué)報(bào), 2015, 36(6): 931-936.
Fang Shuai, Jin Ren, Yu Lei, et al. Object proposals from RGBD images [J]. Journal of Graphics, 2015, 36(6): 931-936.
[23] Szegedy C, Ioffe S, Vanhoucke V, et al. Inception-v4, inception-resnet and the impact of residual connections on learning [C]. Proceedings of the AAAI Conference on Artificial Intelligence, 2017, 31(1).
[24] Hughes D, Salathé M. An open access repository of images on plant health to enable the development of mobile disease diagnostics [J]. arXiv Preprint arXiv: 1511.08060, 2015.