摘 要: 準(zhǔn)確識(shí)別農(nóng)田中常見類型的玉米葉病害并及時(shí)治療是提高玉米產(chǎn)量的關(guān)鍵,可以提高效率并降低種植成本。為了解決玉米葉病害識(shí)別精度不高、檢測(cè)效率低以及在移動(dòng)端設(shè)備難以部署的難題,本文提出了一種改進(jìn)的名為GSW-YOLOv7 的目標(biāo)檢測(cè)模型。首先,設(shè)計(jì)了GS-ELAN結(jié)構(gòu)優(yōu)化模型頸部,降低模型的參數(shù)量。其次,將簡(jiǎn)單且無(wú)需參數(shù)的SimAM注意力機(jī)制融入網(wǎng)絡(luò)結(jié)構(gòu)中,在不增加額外參數(shù)的情況下提高檢測(cè)的精度,獲取更具代表性的玉米葉病害特征。最后,采用高效的Wise-IoU 損失函數(shù)以加快收斂速度,并提高模型的精度。實(shí)驗(yàn)結(jié)果表明,GSWYOLOv7網(wǎng)絡(luò)模型平均精度(mAP)為85.60%,檢測(cè)速度為26.79FPS,該模型在檢測(cè)任務(wù)中權(quán)衡了模型的檢測(cè)精度和檢測(cè)速度,與YOLOv5、YOLOX等算法相比,該算法性能最好,能夠快速、準(zhǔn)確地檢測(cè)常見的玉米葉病害,為農(nóng)業(yè)生產(chǎn)提供了創(chuàng)新的解決方案。
關(guān)鍵詞: 玉米葉病害;YOLOv7;目標(biāo)檢測(cè);深度學(xué)習(xí);注意力機(jī)制
中圖法分類號(hào): TP391.4 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1000-2324(2024)04-0566-13
玉米,作為全球三大主要糧食作物之一,在農(nóng)業(yè)生產(chǎn)中扮演著重要角色,是我國(guó)重要的糧食作物。然而,在玉米的生長(zhǎng)過(guò)程中,葉片病害問題是影響產(chǎn)量和質(zhì)量的主要因素之一,葉片病害會(huì)直接導(dǎo)致產(chǎn)量減少和質(zhì)量下降[1]。目前,我國(guó)對(duì)玉米葉病害的識(shí)別和分類主要依賴于專業(yè)技術(shù)人員的經(jīng)驗(yàn)判斷。技術(shù)人員需要具備良好的觀察技巧和豐富的經(jīng)驗(yàn),才能進(jìn)行疾病的識(shí)別[2]。然而,這種方法需要投入大量人力物力,且嚴(yán)重依賴個(gè)人經(jīng)驗(yàn),識(shí)別準(zhǔn)確性低、效率差。因此,為確保玉米的穩(wěn)定增產(chǎn),快速準(zhǔn)確地識(shí)別常見玉米葉病害至關(guān)重要。
近年來(lái),隨著大數(shù)據(jù)分析技術(shù)和圖形處理單元(GPUs)的迅速進(jìn)步,計(jì)算機(jī)的計(jì)算能力得到了顯著提升,深度學(xué)習(xí)技術(shù)廣泛應(yīng)用于多個(gè)領(lǐng)域,包括農(nóng)業(yè)病蟲害的識(shí)別[3]。在這方面的研究中,Yinglai Huang 等人[4]對(duì)傳統(tǒng)的ResNet-50 模型進(jìn)行了改進(jìn),將LeakyReLU 激活函數(shù)替代ReLU激活函數(shù),并調(diào)整了殘差塊中批歸一化層、激活函數(shù)和卷積層的順序,這一改進(jìn)后的網(wǎng)絡(luò)在玉米葉病圖像分類中取得了98.3%的準(zhǔn)確率。Haoyu Wu[5]提出了一種基于VGG 和ResNet 的雙通道卷積神經(jīng)網(wǎng)絡(luò),他們成功將在驗(yàn)證集上對(duì)玉米葉病害類型的識(shí)別準(zhǔn)確率提高到98.33%。Deng 等人[6]建立并測(cè)試了一種基于FPN 的Faster R-CNN高精度谷物檢測(cè)模型,其平均準(zhǔn)確率達(dá)到了99.4%。以上算法具有較高的準(zhǔn)確度,但由于模型參數(shù)量大、大存儲(chǔ)空間和計(jì)算消耗,這在實(shí)際應(yīng)用中導(dǎo)致難以在嵌入式設(shè)備上部署龐大的算法模型的問題。
近年來(lái)基于深度學(xué)習(xí)的深度卷積神經(jīng)網(wǎng)絡(luò)成為研究熱點(diǎn),深度卷積神經(jīng)網(wǎng)絡(luò)在圖像目標(biāo)檢測(cè)上展現(xiàn)出顯著優(yōu)勢(shì),檢測(cè)方法可以歸納為兩類。第一類是基于區(qū)域生成的方法,這類方法先生成一系列候選框,然后對(duì)這些候選框中的目標(biāo)進(jìn)行分類,代表性的模型包括RCNN[7]、Fast-RCNN[8]和Faster-RCNN[9]。這類方法在識(shí)別準(zhǔn)確性上表現(xiàn)出色,錯(cuò)誤率和漏檢率都相對(duì)較低,但由于處理過(guò)程較為復(fù)雜,導(dǎo)致檢測(cè)速度較慢,難以滿足實(shí)時(shí)檢測(cè)的需求。第二類是基于回歸的方法,這類方法在目標(biāo)定位的同時(shí)直接預(yù)測(cè)目標(biāo)分類,YOLO系列網(wǎng)絡(luò)[10-12]是該類方法的典型代表。這類方法具有識(shí)別速度快的特點(diǎn),能夠滿足實(shí)時(shí)性的要求,并且在準(zhǔn)確性上也接近第一類方法的水平。隨著深度學(xué)習(xí)的不斷發(fā)展,研究人員發(fā)現(xiàn)目標(biāo)檢測(cè)算法已經(jīng)能夠在高性能計(jì)算機(jī)上實(shí)現(xiàn)實(shí)時(shí)檢測(cè)。然而,將模型部署到嵌入式設(shè)備上時(shí),存儲(chǔ)和計(jì)算方面依然存在問題。因此,輕量級(jí)網(wǎng)絡(luò)在計(jì)算機(jī)視覺領(lǐng)域引起了廣泛關(guān)注。以此為背景,Howard 等人[13]提出了MobileNetV1,這是一個(gè)輕量級(jí)的骨干網(wǎng)絡(luò),通過(guò)深度可分離卷積顯著減少了模型參數(shù)量。Zhang 等人[14]通過(guò)改進(jìn)的YOLOv4 模型進(jìn)行蘋果水果檢測(cè),引入了帶有坐標(biāo)注意模塊的GhostNet 特征提取網(wǎng)絡(luò),以及深度卷積來(lái)重建頸部和YOLO頭部結(jié)構(gòu),實(shí)現(xiàn)了高達(dá)95.72%的mAP,同時(shí)使得模型輕量化。Su 及其團(tuán)隊(duì)[15]在溫室環(huán)境中采用輕量化的YOLOv3 模型,并結(jié)合輕量級(jí)網(wǎng)絡(luò),成功用于對(duì)番茄成熟度的分類檢測(cè),取得了97.5%的mAP。輕量化的改進(jìn)往往伴隨著檢測(cè)精度的降低,而注意力機(jī)制可以提高檢測(cè)的精度。在疾病識(shí)別領(lǐng)域,Li 等人[16]通過(guò)應(yīng)用混合注意力Atrous SpacePyramid Pool (ASPP)對(duì)DeepLab V3+進(jìn)行優(yōu)化,實(shí)現(xiàn)了對(duì)黃瓜霜霉病和白粉病的精確分割和自動(dòng)評(píng)估。Yang 等人[17]在YOLOv4 中添加了注意力模塊,提高了小麥穗計(jì)數(shù)的準(zhǔn)確性。Cui 等人[18]通過(guò)將CBAM引入到自動(dòng)編碼器中進(jìn)行玉米葉病的分類任務(wù),在實(shí)驗(yàn)室環(huán)境中從PlantVillage 識(shí)別玉米葉病,取得了99.44%的識(shí)別準(zhǔn)確度,雖然具有較高的準(zhǔn)確度,但是該研究只是在實(shí)驗(yàn)環(huán)境中進(jìn)行的分類任務(wù),不能精確反應(yīng)在真實(shí)農(nóng)田中的情況,相比于該研究,本文應(yīng)用了比較流行的YOLO模型進(jìn)行玉米葉病害的目標(biāo)檢測(cè)任務(wù),并針對(duì)在真實(shí)環(huán)境下的玉米葉數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),同時(shí)對(duì)數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng),而且對(duì)YOLOv7 模型采用了無(wú)參數(shù)、準(zhǔn)確度高的SimAM 注意力,以及采取一系列更加先進(jìn)的改進(jìn)措施,具有更高的可靠性。上述研究表明,通過(guò)采用不同的策略優(yōu)化神經(jīng)網(wǎng)絡(luò)可以進(jìn)一步提高識(shí)別準(zhǔn)確性并減少模型參數(shù)量。常見的玉米葉病主要有玉米銹病、灰斑病、枯萎病,本文主要針對(duì)這三種常見的玉米葉病進(jìn)行研究??紤]到不同玉米葉病害之間微小差異,建立一個(gè)在移動(dòng)終端上實(shí)現(xiàn)快速且準(zhǔn)確識(shí)別常見的玉米葉病害的模型仍然是一個(gè)巨大的挑戰(zhàn)。
為了在改進(jìn)YOLOv7 目標(biāo)檢測(cè)模型的同時(shí)減少模型參數(shù)量并提高檢測(cè)準(zhǔn)確性和速度,本研究提出了一種改進(jìn)后的YOLOv7 模型,命名為GSW-YOLOv7。該模型在保持較高性能的同時(shí)能夠準(zhǔn)確識(shí)別常見玉米葉病害,彌補(bǔ)了當(dāng)前研究所面臨的一些局限性。本文的貢獻(xiàn)可以總結(jié)如下:
(1)在本研究中,構(gòu)建了輕量級(jí)GS-ELAN結(jié)構(gòu)用于優(yōu)化YOLOv7 模型的頸部,減少模型參數(shù)量,使模型輕量化。
(2)為增強(qiáng)輕量級(jí)模型在常見玉米葉病害檢測(cè)中的準(zhǔn)確性,引入了SimAM 注意力機(jī)制到網(wǎng)絡(luò)架構(gòu)中。SimAM注意力機(jī)制在不引入額外的參數(shù)的前提下提高模型的精度。
(3)將YOLOv7 算法模型中原始的CIoU 損失函數(shù)替換為WIoU 損失函數(shù)。該方法進(jìn)一步提高了YOLOv7 的邊界框回歸精度和檢測(cè)精度。