晁曉菲 池敬柯 張繼偉 王孟杰 陳 堯 劉 斌
(1.西北農(nóng)林科技大學(xué)信息工程學(xué)院, 陜西楊凌 712100;2.西北農(nóng)林科技大學(xué)水利與建筑工程學(xué)院, 陜西楊凌 712100;3.西北農(nóng)林科技大學(xué)機(jī)械與電子工程學(xué)院, 陜西楊凌 712100)
在農(nóng)業(yè)自動(dòng)化生產(chǎn)的最新進(jìn)展中,深度學(xué)習(xí)常與物聯(lián)網(wǎng)技術(shù)和無人駕駛飛行器相結(jié)合用于開發(fā)智能農(nóng)業(yè)系統(tǒng)[1]。深度卷積神經(jīng)網(wǎng)絡(luò)(Deep convolutional neural network,DCNN)[2]與自動(dòng)化機(jī)械等設(shè)備相結(jié)合,實(shí)現(xiàn)自動(dòng)、高效的作物病害識(shí)別和檢測(cè),為作物病害的預(yù)防和識(shí)別提供更為高效且準(zhǔn)確的技術(shù)支持[3]。目前,國(guó)內(nèi)外對(duì)DCNN在農(nóng)業(yè)上的應(yīng)用研究包括但不限于作物病害分類[4-6]、作物與病斑分割[7-8]、作物及其病害識(shí)別與檢測(cè)[9-10]等。
基于深度學(xué)習(xí)的植物病害目標(biāo)檢測(cè)算法主要以YOLO(You only look once)系列為核心的單階段算法以及以RCNN(Region-CNN)為核心的雙階段算法為主[11-21]。文獻(xiàn)[15-18]中的研究主要是替換或改良YOLO網(wǎng)絡(luò)中的主干網(wǎng)絡(luò)從而提高算法的檢測(cè)性能,但改進(jìn)后的網(wǎng)絡(luò)仍存在對(duì)病斑區(qū)域關(guān)注程度不足、對(duì)深層特征中所包含語義信息的利用不足等缺點(diǎn),影響病斑檢測(cè)性能。因此在對(duì)作物病斑檢測(cè)中,需要充分考慮并利用這些因素來提升YOLO網(wǎng)絡(luò)的性能。此外,還應(yīng)對(duì)YOLO網(wǎng)絡(luò)做必要的輕量化處理以滿足檢測(cè)的實(shí)時(shí)性及在移動(dòng)端部署時(shí)的要求。
為解決上述問題,本文以YOLOv4目標(biāo)檢測(cè)網(wǎng)絡(luò)為基礎(chǔ),針對(duì)蘋果葉片的病斑檢測(cè)任務(wù),以提升網(wǎng)絡(luò)對(duì)蘋果葉片病斑檢測(cè)的精確度和速度為目標(biāo),搭建具有檢測(cè)準(zhǔn)確率高、檢測(cè)速度快、小目標(biāo)檢出率高等特點(diǎn)的PSA(金字塔壓縮注意力)-YOLO目標(biāo)檢測(cè)網(wǎng)絡(luò)。
實(shí)驗(yàn)所用蘋果葉片病害數(shù)據(jù)集由人工采集,包含斑點(diǎn)落葉病、褐斑病、灰斑病和銹病等4種蘋果葉片病害圖像,其中蘋果葉片斑點(diǎn)落葉病的圖像為556幅,褐斑病圖像為493幅,灰斑病圖像為404幅,銹病圖像為429幅,共1 892幅原始圖像(JPEG格式)。圖像均采用智能手機(jī)拍攝,如圖1所示。大多數(shù)為自然光下田間直接采集的具有復(fù)雜背景的圖像,少部分為單純實(shí)驗(yàn)室背景的圖像,通過縮放、填充、裁剪等操作將原始圖像尺寸統(tǒng)一規(guī)整為256像素×256像素。從圖1中可以看出蘋果葉片病害圖像有葉片病斑小、病斑相似度高等特點(diǎn),這給病斑特征的提取及病斑的精準(zhǔn)檢測(cè)帶來了一定難度。
圖1 蘋果患病葉片數(shù)據(jù)集圖例Fig.1 Examples of apple diseased leaves dataset
本文在訓(xùn)練前將獲取的全部圖像按照8∶1∶1的比例隨機(jī)劃分訓(xùn)練集、驗(yàn)證集與測(cè)試集。采用Mosaic方法[14]對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng),如圖2所示。這種數(shù)據(jù)增強(qiáng)方法的主要過程為,在訓(xùn)練集中隨機(jī)選取4幅圖像,并對(duì)所選的圖像進(jìn)行隨機(jī)翻轉(zhuǎn),最終將這4幅圖像拼接成1幅圖像。在葉片訓(xùn)練數(shù)據(jù)有限且沒有增加訓(xùn)練集圖像數(shù)量的前提下,使每幅圖像包含4幅不同圖像的信息,能提高目標(biāo)檢測(cè)網(wǎng)絡(luò)的泛化能力。
圖2 Mosaic數(shù)據(jù)增強(qiáng)后的部分訓(xùn)練集圖像Fig.2 Images with Mosaic augmentation in training set
本文基于YOLOv4目標(biāo)檢測(cè)網(wǎng)絡(luò)進(jìn)行改進(jìn),提出PSA-YOLO網(wǎng)絡(luò),如圖3(圖中CBM表示卷積-批歸一化-Mish激活函數(shù)模塊,BN表示批歸一化)所示。首先,在CSPDarknet53主干網(wǎng)絡(luò)中添加了Focus結(jié)構(gòu)[22]和PSA機(jī)制[23],并按照“1-1-4-4-2”的型式堆疊殘差塊,精簡(jiǎn)網(wǎng)絡(luò)層數(shù)。其次,將壓縮合并(Squeeze and concat,SPC)模塊與空間金字塔池化(Spatial pyramid pooling,SPP)[24]模塊融合為空間金字塔卷積池化模塊(Spatial pyramid convolution and pooling,SPCP)替代了原有的SPP模塊。最后,采取K-means聚類方法和α-CIoU損失函數(shù)對(duì)訓(xùn)練圖像進(jìn)行維度分析和邊界框回歸,檢測(cè)頭部分保持不變。這些部分共同構(gòu)成了PSA-YOLO網(wǎng)絡(luò)的基本結(jié)構(gòu)。
圖3 PSA-YOLO結(jié)構(gòu)Fig.3 Structure of PSA-YOLO
為使含有重要信息的通道在網(wǎng)絡(luò)前向傳播初期獲得更大程度的關(guān)注,充分提取蘋果葉片病斑邊緣紋理底層特征提升檢測(cè)的精確度,PSA-CSPDarknet網(wǎng)絡(luò)只保留CSPDarknet53網(wǎng)絡(luò)CSP1-1層中的殘差塊并在殘差塊前增加Focus結(jié)構(gòu)和PSA模塊,PSA-CSPDarknet網(wǎng)絡(luò)結(jié)構(gòu)如圖4b所示。
圖4 原CSP 1-1結(jié)構(gòu)和改進(jìn)后的結(jié)構(gòu)Fig.4 Structure of original CSP 1-1 and improved structure
Focus結(jié)構(gòu)在YOLOv5[22]目標(biāo)檢測(cè)網(wǎng)絡(luò)中已經(jīng)得到運(yùn)用,代替了主干網(wǎng)絡(luò)第一次下采樣,在COCO數(shù)據(jù)集中展示了良好的檢測(cè)性能。其通過張量切片操作將輸入圖像切分為4個(gè)相似的特征圖,然后將4個(gè)特征圖在通道維度上融合使空間特征在無信息損失的情況下轉(zhuǎn)化為通道特征,以此來代替原網(wǎng)絡(luò)中的第一次下采樣。
PSA模塊分為4部分,如圖5(圖中k表示卷積核尺寸,G為卷積核分組大小,F(xiàn)C表示全連接層)所示。首先,通過SPC模塊有效地提取并整合輸入特征圖不同尺度的空間信息。SPC模塊對(duì)輸入特征圖的空間維度用3、5、7、9共4種尺寸的卷積核進(jìn)行分組卷積,每種尺寸卷積核所分組大小分別為2、4、8、16,來實(shí)現(xiàn)對(duì)特征圖的分組卷積與通道壓縮。然后將用SPC模塊處理后的特征圖使用SEWeight模塊[25]學(xué)習(xí)權(quán)重,統(tǒng)籌局部和全局注意力,根據(jù)特征通道對(duì)分類任務(wù)的重要程度分配不同權(quán)重。Softmax將包含通道的權(quán)重歸一化。通過將歸一化的權(quán)重與SPC模塊處理后的特征圖相乘實(shí)現(xiàn)了注意力權(quán)重與通道之間的交互,使得特征圖中對(duì)病斑檢測(cè)更重要的通道分配到更高權(quán)重。
圖5 金字塔壓縮注意力機(jī)制結(jié)構(gòu)Fig.5 Structure of PSA mechanism
為了均衡主干網(wǎng)絡(luò)的速度和精度,以融合Focus結(jié)構(gòu)和PSA模塊后的CSPDarknet53為基礎(chǔ),重新調(diào)整殘差塊的數(shù)量排布,以精簡(jiǎn)網(wǎng)絡(luò)層數(shù),降低網(wǎng)絡(luò)參數(shù)和計(jì)算量。分別構(gòu)建了3個(gè)模型,PSA-CSPDarknet-1、PSA-CSPDarknet-2、PSA-CSPDarknet-3。其中,PSA-CSPDarknet-1將CSPDarknet53網(wǎng)絡(luò)CSP層中殘差塊的數(shù)量減半,設(shè)置為“1-1-4-4-2”,受文獻(xiàn)[26]中ResNet-18、ResNet-34網(wǎng)絡(luò)結(jié)構(gòu)啟發(fā),將PSA-CSPDarknet-2、PSA-CSPDarknet-3殘差排列分別設(shè)置為“1-2-2-2-2”和“1-3-4-6-3”。
為進(jìn)一步提取深層主干網(wǎng)絡(luò)中空間維度的多尺度語義信息,搭建了空間金字塔卷積池化模塊以替代原有空間金字塔池化模塊。YOLOv4中頸部主要包含兩部分,即空間金字塔池化和路徑聚合網(wǎng)絡(luò)(Path aggregation network,PANet)[27]??臻g金字塔池化是一種特殊池化方法,采用步長(zhǎng)為1、卷積核尺寸為5×5、9×9和13×13的最大池化,其與主干網(wǎng)絡(luò)最深一層的特征圖緊密集成,擴(kuò)大感受野并整合多尺度空間信息。PSA-YOLO目標(biāo)檢測(cè)網(wǎng)絡(luò)中,主干網(wǎng)絡(luò)提取局部紋理和圖案信息,以構(gòu)建后續(xù)層所需的語義信息。然而,隨著網(wǎng)絡(luò)深度的增加,層之間的互連變得更加復(fù)雜,網(wǎng)絡(luò)的寬度也會(huì)變得更加龐大,尤其在通過SPP模塊后卷積核數(shù)量達(dá)到2 048,增加了網(wǎng)絡(luò)的參數(shù)量和計(jì)算量。在SPP模塊之前插入了SPC模塊,用分組多尺度卷積后再壓縮的方法使進(jìn)入SPP模塊的卷積核數(shù)減少一半,在加強(qiáng)對(duì)多尺度空間信息提取的同時(shí),對(duì)網(wǎng)絡(luò)計(jì)算量進(jìn)行了進(jìn)一步平衡。如圖6所示,將SPC模塊添加到SPP模塊之前,將通過SPP模塊后的通道數(shù)壓縮為1 024,搭建起SPCP模塊。在基本不影響網(wǎng)絡(luò)中數(shù)據(jù)傳播速度的前提下,提高了網(wǎng)絡(luò)對(duì)局部特征與全局特征信息的利用效率。路徑聚合網(wǎng)絡(luò)中使用了自下而上的路徑增強(qiáng),縮短了多尺度特征金字塔圖的高低融合路徑,融合來自PSA-CSPDarknet-1中CSP4層、CSP2層和經(jīng)SPCP模塊輸出的3種尺度的特征圖信息,使較淺網(wǎng)絡(luò)(CSP4層、CSP2層)的特征信息得到有效利用。
圖6 空間金字塔卷積池化模塊結(jié)構(gòu)Fig.6 Structure of SPCP module
在目標(biāo)檢測(cè)算法的邊界框回歸中,很多常用的邊界框損失函數(shù)都基于IoU損失演化而來,例如Generalized IoU(GIoU)[28]、Distance IoU(DIoU)和Complete IoU(CIoU)[29]。α-IoU系列損失[30]應(yīng)用冪變換來概括上述基于IoU的損失。當(dāng)出現(xiàn)IoU值低的噪聲框時(shí),α-IoU損失會(huì)自適應(yīng)地提高邊界框回歸損失值,使在訓(xùn)練帶有爭(zhēng)議的預(yù)測(cè)框時(shí),邊界框損失的降低得到抑制,避免過擬合現(xiàn)象發(fā)生。相反,當(dāng)出現(xiàn)IoU值高的預(yù)測(cè)框時(shí),α-IoU損失會(huì)相對(duì)噪聲框獲得更低的邊界框損失,進(jìn)而使得網(wǎng)絡(luò)能預(yù)測(cè)更多高IoU對(duì)象,實(shí)現(xiàn)在高IoU閾值的目標(biāo)檢測(cè)平均精度上升。在以上兩種因素同時(shí)作用下,會(huì)最終使網(wǎng)絡(luò)針對(duì)高IoU閾值的目標(biāo)檢測(cè)性能得到提高。
3.1.1硬件條件和超參數(shù)設(shè)置
實(shí)驗(yàn)環(huán)境配置參數(shù)如下:操作系統(tǒng)為Ubuntu 16.04 LTS,中央處理器為Intel Xeon E5-2620 v4,圖形處理器為NVIDIA GTX TITAN V,顯存為12 GB。訓(xùn)練使用PyTorch 1.2深度學(xué)習(xí)框架。
3.1.2評(píng)價(jià)指標(biāo)
機(jī)器視覺國(guó)際會(huì)議中常用COCO AP(Average precise)或AR(Average recall)作為目標(biāo)識(shí)別的評(píng)價(jià)標(biāo)準(zhǔn)。本文采用COCO AP@[0.5∶0.05∶0.95]作為蘋果葉片病害檢測(cè)準(zhǔn)確率評(píng)價(jià)指標(biāo)來綜合評(píng)估模型的檢測(cè)性能,即分別在IoU閾值設(shè)置以0.05的步距從0.5開始遍歷至0.95,取這些閾值條件下評(píng)估所得到的平均準(zhǔn)確率的均值。
根據(jù)檢測(cè)器的IoU閾值不同,則對(duì)應(yīng)召回率所對(duì)應(yīng)的檢測(cè)精度不同,得到不同閾值下的AP,例如當(dāng)IoU閾值等于0.5時(shí)對(duì)應(yīng)的AP值為AP50。當(dāng)被檢測(cè)的物體覆蓋面積小于32像素×32像素時(shí),其被視作小目標(biāo),對(duì)應(yīng)的指標(biāo)被稱為APS。當(dāng)被檢測(cè)的物體覆蓋面積大于96像素×96像素時(shí),其被視作大目標(biāo),對(duì)應(yīng)的指標(biāo)被稱為APL。被檢測(cè)的物體面積介于兩者之間,則為中等大小,其指標(biāo)被稱為APM。
在訓(xùn)練過程中為了擴(kuò)充數(shù)據(jù)集和保證損失值的穩(wěn)定下降,PSA-YOLO使用了學(xué)習(xí)率的余弦退火衰減策略、邊界框的非極大值抑制等YOLOv4原有的訓(xùn)練策略,并使用二元交叉熵?fù)p失作為類別置信度損失函數(shù)。還將數(shù)學(xué)特征更加平滑的Mish激活函數(shù)應(yīng)用在整個(gè)網(wǎng)絡(luò)中以增強(qiáng)目標(biāo)檢測(cè)器的準(zhǔn)確性和泛化性能。批大小(Batch size)采用16,采用余弦退火衰減策略更新學(xué)習(xí)率,學(xué)習(xí)率初始值為1.0×10-4,最小值為1.0×10-5,每20輪為一個(gè)衰減周期。α-CIoU損失中α的取值為3??傆?xùn)練輪數(shù)為200。
為實(shí)現(xiàn)主干網(wǎng)絡(luò)目標(biāo)檢測(cè)精度和檢測(cè)速度的均衡提升,以獲得更高性能的目標(biāo)檢測(cè)網(wǎng)絡(luò),在原主干網(wǎng)絡(luò)CSPDarknet53的基礎(chǔ)上進(jìn)行了模塊添加實(shí)驗(yàn)和網(wǎng)絡(luò)輕量化實(shí)驗(yàn),以此證明不同的改進(jìn)對(duì)網(wǎng)絡(luò)性能的影響,最終比較得出最優(yōu)的主干網(wǎng)絡(luò)。實(shí)驗(yàn)按照2.2節(jié)所描述的方法分別在CSPDarknet53網(wǎng)絡(luò)CSP1-1層中加入Focus結(jié)構(gòu)、PSA模塊,以及將主干網(wǎng)絡(luò)的殘差塊分別按照“1-2-2-2-2”、“1-1-4-4-2”、“1-3-4-6-3”型式進(jìn)行堆疊。最后,將不同結(jié)構(gòu)的主干網(wǎng)絡(luò)結(jié)構(gòu)帶入YOLOv4網(wǎng)絡(luò)中代替原有的CSPDarknet53主干網(wǎng)絡(luò)進(jìn)行性能比較。
如表1所示,F(xiàn)ocus結(jié)構(gòu)和PSA模塊的加入,使CSPDarknet53網(wǎng)絡(luò)在無參數(shù)量提升的情況下,AP提升2.4個(gè)百分點(diǎn)。同時(shí)注意到,F(xiàn)ocus結(jié)構(gòu)和PSA模塊的加入使網(wǎng)絡(luò)APS提升2.9個(gè)百分點(diǎn),這說明Focus結(jié)構(gòu)和PSA模塊的加入有利于主干網(wǎng)絡(luò)對(duì)蘋果葉片病斑特征的提取,尤其是小型病斑特征的提取。
表1 基于CSPDarknet53對(duì)主干網(wǎng)絡(luò)的改進(jìn)實(shí)驗(yàn)結(jié)果Tab.1 Result of improved backbone network experiment based on CSPDarknet53
PSA-CSPDarknet-1、PSA-CSPDarknet-2、PSA-CSPDarknet-3網(wǎng)絡(luò)比加入Focus結(jié)構(gòu)和PSA模塊未輕量化的PSA-CSPDarknet-0網(wǎng)絡(luò)精度都有所下降,說明網(wǎng)絡(luò)深度的減小會(huì)對(duì)病斑檢測(cè)的精確度產(chǎn)生不利影響。但三者的精確度都比最初的CSPDarknet53網(wǎng)絡(luò)有所提高,這表明Focus結(jié)構(gòu)和PSA模塊的加入抵消了因網(wǎng)絡(luò)深度減小而導(dǎo)致的精確度降低,使網(wǎng)絡(luò)的性能得到均衡提升。同時(shí)PSA-CSPDarknet-1網(wǎng)絡(luò)與PSA-CSPDarknet-3網(wǎng)絡(luò)相比,有更小的參數(shù)量和更高的檢測(cè)精度。PSA-CSPDarknet-2網(wǎng)絡(luò)雖然參數(shù)量得到了明顯的減小,但檢測(cè)精確度受網(wǎng)絡(luò)深度縮減影響較大,檢測(cè)精確度與PSA-CSPDarknet-1網(wǎng)絡(luò)相比仍有不足。
綜合以上結(jié)果,為了使主干網(wǎng)絡(luò)的檢測(cè)精確度和速度達(dá)到均衡,最終選擇PSA-CSPDarknet-1網(wǎng)絡(luò)作為病斑檢測(cè)網(wǎng)絡(luò)的主干網(wǎng)絡(luò)。相比CSPDarknet53,PSA-CSPDarknet-1的參數(shù)量小、浮點(diǎn)運(yùn)算數(shù)少、運(yùn)算速度快、精度高,其計(jì)算量與CSPDarknet53網(wǎng)絡(luò)相比減少了30.4%、AP提升了1.8個(gè)百分點(diǎn),具有更好的移動(dòng)端部署的特點(diǎn),相比表1中所對(duì)比的其他主干網(wǎng)絡(luò),PSA-CSPDarknet-1能更好地實(shí)現(xiàn)對(duì)蘋果葉片病斑的實(shí)時(shí)檢測(cè)。
為探討SPCP模塊的加入對(duì)目標(biāo)檢測(cè)網(wǎng)絡(luò)訓(xùn)練精確度和速度的影響,設(shè)計(jì)以下消融實(shí)驗(yàn)。分別采用PSA-CSPDarknet-1與CSPDarknet53兩種主干網(wǎng)絡(luò)與SPP模塊及SPCP模塊進(jìn)行組合實(shí)驗(yàn),選出最優(yōu)組合方式。
由表2可見,PSA-CSPDarknet-1網(wǎng)絡(luò)與SPP模塊及SPCP模塊組合的結(jié)果都比CSPDarknet53與這兩個(gè)模塊組合的實(shí)驗(yàn)結(jié)果更為理想,網(wǎng)絡(luò)參數(shù)量和運(yùn)算量有所下降的同時(shí),使網(wǎng)絡(luò)的準(zhǔn)確率與檢測(cè)速度得到提升。其中,以PSA-CSPDarknet-1為主干網(wǎng)絡(luò),添加SPCP模塊后,使網(wǎng)絡(luò)在計(jì)算量沒有明顯提升的前提下,病斑檢測(cè)的平均精確度達(dá)到48.5%。實(shí)驗(yàn)結(jié)果表明,當(dāng)采用PSA-CSPDarknet-1主干網(wǎng)絡(luò)且頸部中加入SPCP模塊時(shí),網(wǎng)絡(luò)獲得最優(yōu)檢測(cè)性能,相比于YOLOv4,AP提升2.2個(gè)百分點(diǎn),速度提升13幀/s。
表2 網(wǎng)絡(luò)頸部對(duì)比Tab.2 Ablation study of neck of network
不同的邊界框損失函數(shù)能夠?qū)W(wǎng)絡(luò)的檢測(cè)精度帶來不同程度的影響。為了對(duì)比α-DIoU、DIoU、α-CIoU等3種邊界框損失函數(shù)與YOLOv4所采用的CIoU邊界框損失函數(shù)的性能,分別將這4種邊界框損失函數(shù)與LeakyReLU及Mish激活函數(shù)進(jìn)行組合實(shí)驗(yàn),選出最好的激活函數(shù)與邊界框損失函數(shù)的組合方案。組合實(shí)驗(yàn)結(jié)果如表3所示。
表3 邊界框損失函數(shù)對(duì)比Tab.3 Comparisons of bounding box loss functions
實(shí)驗(yàn)結(jié)果表明,LeakyReLU激活函數(shù)與α-CIoU損失相配合獲得了最好的檢測(cè)性能,網(wǎng)絡(luò)的AP、AP50、AP75指標(biāo)比原有的CIoU邊界框損失都高,這證明了α-IoU系列損失在蘋果葉片病斑數(shù)據(jù)集上能夠與改進(jìn)后的PSA-YOLO網(wǎng)絡(luò)相互配合提高不同IoU閾值目標(biāo)的檢測(cè)精確度。由于Mish激活函數(shù)無法有效提升網(wǎng)絡(luò)的檢測(cè)精確度,因此本文選用LeakyReLU的激活函數(shù)與α-CIoU邊界框損失函數(shù)以獲得更高的病斑檢測(cè)性能。
根據(jù)3.3~3.5節(jié)的實(shí)驗(yàn)結(jié)果,確定了PSA-YOLO的基本結(jié)構(gòu),主干網(wǎng)絡(luò):PSA-CSPDarknet-1網(wǎng)絡(luò),頸部:SPCP模塊、PAN模塊,邊界框損失:α-CIoU損失。
為了驗(yàn)證本文所構(gòu)建的PSA-YOLO網(wǎng)絡(luò)在目標(biāo)檢測(cè)任務(wù)中的有效性,選取YOLOv3、YOLOv3-SPP、YOLOv4、YOLOv4-CSP網(wǎng)絡(luò),在其他條件和參數(shù)設(shè)置均保持一致的前提下進(jìn)行對(duì)比實(shí)驗(yàn)。模型性能比較結(jié)果見表4。測(cè)試結(jié)果顯示,當(dāng)IoU閾值為0.5時(shí),PSA-YOLO網(wǎng)絡(luò)檢測(cè)精確度(AP50)達(dá)到88.2%,同時(shí)PSA-YOLO網(wǎng)絡(luò)對(duì)病斑檢測(cè)的COCO AP@[0.5∶0.05∶0.95]為49.8%,兩者與其他網(wǎng)絡(luò)相比都為最高。從網(wǎng)絡(luò)對(duì)于小、中、大型目標(biāo)的檢測(cè)平均精確度來看,PSA-YOLO網(wǎng)絡(luò)的APS、APM、APL相比于其他網(wǎng)絡(luò)都有明顯提高,其中,對(duì)于小目標(biāo)的檢測(cè)精確度提升最大,APS比YOLOv4網(wǎng)絡(luò)提升了3.9個(gè)百分點(diǎn)。綜上所述,本文所構(gòu)建的PSA-YOLO目標(biāo)檢測(cè)網(wǎng)絡(luò)具有比YOLOv4更高的檢測(cè)準(zhǔn)確率和更快的檢測(cè)速度。尤其在小目標(biāo)的檢測(cè)方面,能夠勝任具有較多小目標(biāo)的蘋果葉片病斑檢測(cè)任務(wù)。同時(shí),從模型對(duì)單個(gè)圖像的平均處理時(shí)長(zhǎng)來看,PSA-YOLO檢測(cè)速度最快,在單張NVIDIA TITAN V顯卡的算力支持下,對(duì)于單幅圖像的預(yù)測(cè)時(shí)間僅為0.015 s,滿足病斑檢測(cè)過程中對(duì)實(shí)時(shí)性的要求。
表4 蘋果葉片病斑檢測(cè)任務(wù)網(wǎng)絡(luò)綜合性能對(duì)比Tab.4 Comprehensive performance comparison for apple leaf lesion detection networks
圖7(圖中紫框?yàn)槿~片,綠框?yàn)榘唿c(diǎn)落葉病,黃框?yàn)榛野卟。t框?yàn)楹职卟?,藍(lán)框?yàn)殇P病)展示了PSA-YOLO網(wǎng)絡(luò)與YOLOv4網(wǎng)絡(luò)對(duì)蘋果葉片病斑的預(yù)測(cè)結(jié)果,其中第1列和第2列圖像展示了PSA-YOLO網(wǎng)絡(luò)對(duì)蘋果葉片銹病和褐斑病病斑的檢測(cè)結(jié)果,由第1列圖像可見,PSA-YOLO網(wǎng)絡(luò)相對(duì)于YOLOv4減少了病斑的漏檢。第2列所示圖像中病斑數(shù)真實(shí)值為6個(gè),YOLOv4網(wǎng)絡(luò)檢測(cè)出4個(gè),PSA-YOLO檢測(cè)出5個(gè)病斑,而中間偏下位置相鄰的兩個(gè)病斑的距離較近,兩種網(wǎng)絡(luò)都未能準(zhǔn)確檢測(cè),這說明PSA-YOLO網(wǎng)絡(luò)在對(duì)距離較近的目標(biāo)檢測(cè)方面仍有待改進(jìn)。第3列圖像說明PSA-YOLO網(wǎng)絡(luò)能夠較好識(shí)別在大田復(fù)雜背景下對(duì)于斑點(diǎn)落葉病的檢測(cè),相對(duì)于YOLOv4網(wǎng)絡(luò)減少了對(duì)斑點(diǎn)落葉病病斑的漏檢和誤檢,但由于數(shù)據(jù)集中自然損害的斑點(diǎn)以及非病斑噪聲等因素的干擾,PSA-YOLO網(wǎng)絡(luò)對(duì)于極小的病斑依然無法準(zhǔn)確檢測(cè)。第4列和第5列圖像展示了兩種網(wǎng)絡(luò)在大田復(fù)雜背景和實(shí)驗(yàn)室背景下單葉片多病害病斑的識(shí)別,結(jié)果表明PSA-YOLO網(wǎng)絡(luò)能夠有效減少小型病斑的漏檢率,相比于YOLOv4網(wǎng)絡(luò)預(yù)測(cè)結(jié)果更加準(zhǔn)確。
圖7 4種不同蘋果病害檢測(cè)結(jié)果對(duì)比Fig.7 Comparison of four different apple diseases’ detection results
為提升YOLOv4網(wǎng)絡(luò)的檢測(cè)精確度和速度,尤其針對(duì)小型目標(biāo)較多的蘋果葉片病斑檢測(cè)任務(wù),本文以YOLOv4網(wǎng)絡(luò)為基礎(chǔ),在主干網(wǎng)絡(luò)、頸部、邊界框損失函數(shù)等方面進(jìn)行了對(duì)比實(shí)驗(yàn)。在CSPDarknet53的基礎(chǔ)上添加了Focus結(jié)構(gòu)和金字塔壓縮注意力機(jī)制,并進(jìn)行了輕量化處理,構(gòu)建了PSA-CSPDarknet-1主干網(wǎng)絡(luò)。其次,在頸部中使用了空間金字塔卷積池化模塊,同時(shí)優(yōu)選了α-CIoU損失作為目標(biāo)檢測(cè)網(wǎng)絡(luò)的邊界框損失函數(shù)。最終,搭建出PSA-YOLO網(wǎng)絡(luò)。在本文構(gòu)建的蘋果葉片病害數(shù)據(jù)集的病斑檢測(cè)任務(wù)中,當(dāng)IoU閾值為0.5時(shí),PSA-YOLO網(wǎng)絡(luò)檢測(cè)精確度(AP50)達(dá)到88.2%,檢測(cè)平均精確度(COCO AP@[0.5∶0.05∶0.95])達(dá)到49.8%,檢測(cè)速度達(dá)到69幀/s,尤其是對(duì)于小型病斑的檢測(cè)性能相對(duì)YOLOv4有較為明顯提升。因此,本文所提出的PSA-YOLO模型的檢測(cè)速度快、精度高,能滿足在復(fù)雜自然環(huán)境情況下對(duì)蘋果樹葉片病斑實(shí)時(shí)檢測(cè)任務(wù)的需要。