摘 要:枸杞作為我國重要的經(jīng)濟(jì)作物,其病蟲害問題嚴(yán)重影響作物的產(chǎn)量和品質(zhì)。為提高枸杞病蟲害識別效率,降低人工成本,研究基于深度學(xué)習(xí)的病蟲害識別方法,構(gòu)建了涵蓋主要病蟲害的圖像數(shù)據(jù)集,采用數(shù)據(jù)增強技術(shù)提升樣本多樣性,基于YOLOv5目標(biāo)檢測模型進(jìn)行檢測,并與SSD等模型進(jìn)行了性能對比分析;實驗通過混淆矩陣和損失函數(shù)評估模型的魯棒性與檢測精度。實驗結(jié)果表明,YOLOv5在平均精度(mAP)和召回率等指標(biāo)上均顯著優(yōu)于對比模型,其中mAP達(dá)到88.49%。此外,混淆矩陣分析結(jié)果表明,YOLOv5對負(fù)泥蟲和木虱的檢測精度最高,對癭螨類的檢測存在一定混淆?;赮OLOv5的檢測方法能夠高效、準(zhǔn)確地識別枸杞病蟲害,為智能化農(nóng)業(yè)病蟲害監(jiān)測提供了重要支持,并具備廣闊的應(yīng)用前景。
關(guān)鍵詞:枸杞病蟲害; 目標(biāo)檢測; YOLOv5; 深度學(xué)習(xí); 病蟲害識別
中圖分類號:S431.16"""""" 文獻(xiàn)標(biāo)識碼:A""""" 文章編號:1002-204X(2024)12-0078-05
doi:10.3969/j.issn.1002-204x.2024.12.016
Wolfberry Pest and Disease Identification Using Deep Learning
Li Ji, Yang Shuting, Zhang Xuejian, Zhou Hui, Ye Xin, Liang Aiyin
(Institute of Agricultural Economy and Informationg Technology, Ningxia Academy of Agriculture and Forestry Sciences, Yinchuan, Ningxia 750002)
Abstract As an important economic crop in China, wolfberry is significantly affected by pest and disease issues, which seriously impacts yield and quality. This study aims to improve the efficiency of pest and disease identification in goji berries and reduce labor costs by investigating a deep learning-based identification method. A dataset covering major pests and diseases was constructed, and data augmentation techniques were used to enhance sample diversity. The YOLOv5 object detection model was employed for detection and compared with SSD and other models in terms of performance. Experiments evaluated the robustness and detection accuracy of the models through confusion matrices and loss function analyses. The experiments demonstrated that YOLOv5 outperformed the compared models significantly in terms of mean average precision (mAP) and recall, achieving an mAP of 88.49%. Furthermore, confusion matrix analysis indicated that YOLOv5 exhibited the highest detection accuracy for Nefarious Beetles and Planthoppers, while some confusion was observed in the detection of Eriophyes Goji at different stages. The YOLOv5-based detection method can efficiently and accurately identify goji berry pests and diseases, providing critical support for intelligent agricultural pest monitoring and showcasing broad application prospects.
Key words Wolfberry pests and diseases; Object detection; YOLOv5; Deep learning; Pest and disease identification
基金資助:寧夏自然科學(xué)基金項目(2023AACO3409):基于集成學(xué)習(xí)與遷移學(xué)習(xí)的枸杞病蟲害圖像識別算法研究。
作者簡介:李季(1980—),女,吉林乾安人,副研究員,主要研究方向為農(nóng)業(yè)信息化研究。
收稿日期:2024-10-10
枸杞作為一種藥食兩用的經(jīng)濟(jì)作物,其栽培面積在我國的西北地區(qū)(如寧夏、甘肅、新疆等)持續(xù)擴大。枸杞富含多種營養(yǎng)成分及活性物質(zhì),其果實和葉片在食品、醫(yī)藥等領(lǐng)域應(yīng)用廣泛。然而,在枸杞種植過程中,病蟲害是影響其產(chǎn)量和品質(zhì)的主要問題之一。根據(jù)農(nóng)業(yè)部門統(tǒng)計,枸杞病蟲害每年導(dǎo)致的減產(chǎn)率可達(dá)30%~50%,其中白粉病和紅蜘蛛是對枸杞危害最嚴(yán)重的兩類病蟲害。傳統(tǒng)的病蟲害防控依賴于農(nóng)民的經(jīng)驗識別或農(nóng)業(yè)技術(shù)人員的現(xiàn)場診斷,這種方法不僅費時費力,還存在誤判率高的問題。此外,農(nóng)村勞動力的減少進(jìn)一步加劇了病蟲害防控的難度。因此,開發(fā)一種快速、準(zhǔn)確且自動化的病蟲害識別方法顯得尤為重要。
近年來,深度學(xué)習(xí)作為人工智能的核心技術(shù),在農(nóng)業(yè)領(lǐng)域得到了廣泛應(yīng)用。特別是基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的計算機視覺技術(shù),在作物病蟲害檢測、農(nóng)產(chǎn)品分級與分類等方面表現(xiàn)出了極大的潛力[1]。例如,AlexNet和ResNet網(wǎng)絡(luò)被廣泛用于作物病蟲害分類任務(wù),并取得了90%以上的分類準(zhǔn)確率[2]。目標(biāo)檢測模型(如SSD和YOLO系列)進(jìn)一步突破了傳統(tǒng)分類任務(wù)的局限,實現(xiàn)了病蟲害目標(biāo)的定位與類別判別[3]。YOLOv5作為目標(biāo)檢測領(lǐng)域的新型算法,在小目標(biāo)檢測任務(wù)中表現(xiàn)出色,相比于傳統(tǒng)方法,其通過多尺度特征融合和高效特征提取,能夠在復(fù)雜背景下實現(xiàn)高效、精準(zhǔn)的目標(biāo)識別[4-5]。本文選擇YOLOv5作為主要檢測模型,對枸杞病蟲害進(jìn)行自動化識別研究,旨在為智慧農(nóng)業(yè)提供高效的病蟲害監(jiān)測解決方案。
本文旨在構(gòu)建一個高質(zhì)量的枸杞病蟲害數(shù)據(jù)集,并基于YOLOv5目標(biāo)檢測模型優(yōu)化病蟲害檢測方法。研究的主要創(chuàng)新點包括:①高質(zhì)量數(shù)據(jù)集構(gòu)建。覆蓋枸杞主要病蟲害,并應(yīng)用多種數(shù)據(jù)增強技術(shù),提升數(shù)據(jù)多樣性和模型的泛化能力。②模型優(yōu)化與對比。通過引入預(yù)熱學(xué)習(xí)策略和超參數(shù)調(diào)整,顯著提升YOLOv5在枸杞病蟲害數(shù)據(jù)集上的檢測精度,并與SSD進(jìn)行系統(tǒng)性能對比。③檢測精度與穩(wěn)定性評估。基于混淆矩陣、損失函數(shù)等指標(biāo)分析模型性能,為農(nóng)業(yè)病蟲害智能監(jiān)測提供理論依據(jù)。
1 材料與方法
1.1 數(shù)據(jù)集構(gòu)建
本研究在寧夏枸杞主產(chǎn)區(qū)采集了大量枸杞病蟲害的實地圖像。采集設(shè)備包括手機和便攜式數(shù)碼相機,采集時間覆蓋不同生長階段和光照條件,以保證數(shù)據(jù)的多樣性。共收集8 000張圖像,圖像分辨率為1 920×1 080。要求各類蟲害的拍照數(shù)量達(dá)到400張及以上,單張照片至少包含1個害蟲樣本。同時,為保證各類蟲害總體樣本數(shù)據(jù)相近,各類蟲害的拍照總數(shù)相差不超過50個樣本,確保分布平衡。
為保證模型的泛化能力,圖像數(shù)據(jù)經(jīng)過以下預(yù)處理:①噪聲去除。采用高斯濾波去除圖像中的背景噪聲。②分辨率調(diào)整。將圖像統(tǒng)一縮放至640×640像素以適配YOLOv5模型輸入。
1.2 數(shù)據(jù)標(biāo)注
將照片進(jìn)行處理后,統(tǒng)一批量重命名為規(guī)定格式,以采集時間、采集數(shù)量、采集種類為順序進(jìn)行編碼,自動形成統(tǒng)一命名的批量數(shù)據(jù)。
在此基礎(chǔ)上,使用LabelImg工具對圖片進(jìn)行人工標(biāo)注,對每張照片中存在的多種害蟲分別進(jìn)行標(biāo)注及定位,并以規(guī)定編碼形式進(jìn)行存儲,每張照片對應(yīng)一個標(biāo)注文件,形成用于本系統(tǒng)識別及檢測模型的枸杞病蟲害基礎(chǔ)訓(xùn)練數(shù)據(jù)庫。每個標(biāo)注文件的編碼格式如下(圖1),蘊含每一個害蟲的種類、尺寸、分布、形狀等特性。
1.3 訓(xùn)練集和驗證集劃分
隨機挑選65%的照片為訓(xùn)練集,挑選20%作為驗證集,15%為綜合測試集,將數(shù)據(jù)集擴展為5個訓(xùn)練批次和1個測試批次,每個批次有300張圖像。測試批次包含來自每個害蟲類別的隨機選擇的圖像;訓(xùn)練批次以隨機順序包含測試批次選擇后所剩余的圖像,但一些訓(xùn)練批次可能包含來自一個害蟲類別的圖像比另一個更多。總體來說,5個訓(xùn)練集之和包含來自每個害蟲類別的圖像,初步彌補數(shù)據(jù)不平衡的問題。
2 結(jié)果與分析
2.1 分類結(jié)果
為了避免網(wǎng)絡(luò)模型過擬合,采用數(shù)據(jù)增強方法來對數(shù)據(jù)集中的大量圖像進(jìn)行增強。數(shù)據(jù)增強包括幾何變換(調(diào)整大小、隨機裁剪、旋轉(zhuǎn)和水平翻轉(zhuǎn)、縱橫比)和強度變換(對比度和亮度增強、顏色、噪聲)。此外,考慮另一種稱為mixup的增強方法。在訓(xùn)練中,每次通過兩個隨機示例的加權(quán)線性插值形成新示例。mixup參數(shù)被設(shè)置為0.2并且將迭代的數(shù)量從120增加到200,因為mixup要求更長的訓(xùn)練進(jìn)度以更好地收斂。
數(shù)據(jù)集分為80%訓(xùn)練集,10%驗證集和10%測試集,進(jìn)行了4種深度學(xué)習(xí)分類模型的實驗,模型包括VGG16、SqueezeNet、InceptionV4和ResNet18。所有模型均在具有4個NVIDIA Tesla p40 GPU和256G RAM的Intel Core i7 3.6GHz處理器上進(jìn)行了訓(xùn)練和測試。使用ImageNet預(yù)訓(xùn)練權(quán)重對所有網(wǎng)絡(luò)進(jìn)行微調(diào),學(xué)習(xí)率為0.000 1,每4個時期以指數(shù)方式衰減0.94,動量和衰減的RMSProp優(yōu)化均設(shè)為0.9。
2.1.1 分類性能比較
表1總結(jié)了4種分類模型的精確度。如表1所示,ResNet18是性能最佳的模型,在枸杞病害數(shù)據(jù)集上實現(xiàn)了98.09%的精確度。VGG16和InceptionV4的精確度差不多,都為96%左右。相比之下,SqueezeNet是一個輕量級網(wǎng)絡(luò),精度僅為92.88%。但是,它產(chǎn)生的參數(shù)越少,運行速度越快??傮w而言,枸杞病害數(shù)據(jù)集非常適合各種深度學(xué)習(xí)分類模型,為各種農(nóng)業(yè)任務(wù)提供有效的數(shù)據(jù)基礎(chǔ)。
2.1.2 損失函數(shù)
損失函數(shù)用于估計模型的預(yù)測值與真實值之間的不一致程度。它是一個非負(fù)實值函數(shù),通常由L1或L2正則項表示。損失函數(shù)越小,模型的魯棒性越好。損失函數(shù)是經(jīng)驗風(fēng)險函數(shù)的核心部分。網(wǎng)絡(luò)模型使用的損失函數(shù)是交叉熵?fù)p失函數(shù)。損失函數(shù)的公式如下:
J=-yclog(pc) """"""""""""""""""" (1)
其中M表示類別的數(shù)量;如果類別和樣本具有相同的類別,則y表示指示符變量(0或1),否則為0;p表示觀察到的樣本屬于類別c的預(yù)測概率。圖3顯示了4種模型的損失函數(shù)圖。
損失函數(shù)的比較表明,在數(shù)據(jù)集中,4個分類網(wǎng)絡(luò)的損失函數(shù)值呈減小的趨勢。它穩(wěn)定了大約90代,預(yù)測值更接近真實值。在它們之間,VGG16、ResNet18的損失函數(shù)下降最快,最終損失函數(shù)下降到約0.008 4。Inceptionv4的損失函數(shù)下降較慢,損失函數(shù)降至0.018 6左右。然而,SqueezeNet是一種低精度的輕量級分類網(wǎng)絡(luò),其參數(shù)小,速度快,損失函數(shù)下降最慢,最終接近0.195 6。
2.2 檢測結(jié)果
為了進(jìn)一步分析枸杞病害數(shù)據(jù)集的檢測性能,采用了基于深度學(xué)習(xí)的檢測網(wǎng)絡(luò),包括SSD和YOLOv5,分別對病害數(shù)據(jù)進(jìn)行檢測評估。在實驗中,訓(xùn)練集和驗證集被用來訓(xùn)練檢測網(wǎng)絡(luò),批量大小設(shè)置為64,初始學(xué)習(xí)率為10-3。由于初始訓(xùn)練過程中的損失波動較大,為了保證訓(xùn)練的穩(wěn)定性,采用了“預(yù)熱”策略,在前5個訓(xùn)練周期內(nèi)逐漸將學(xué)習(xí)率從10-6增加到4×10-3,在第150個和第200個周期時進(jìn)行除以10的衰減,總訓(xùn)練周期設(shè)置為500。訓(xùn)練過程中,采用0.000 5的權(quán)重衰減和0.9的動量參數(shù)來優(yōu)化網(wǎng)絡(luò)性能。為了進(jìn)一步提升檢測結(jié)果的準(zhǔn)確性,通過每個元架構(gòu)的非極大值抑制(NMS)策略,減少重疊候選框的干擾,僅保留與真實框的IoUgt;0.5的候選框。結(jié)果表明,YOLOv5在精度和檢測速度上表現(xiàn)更優(yōu),適合病害實時檢測任務(wù);而SSD在參數(shù)量較小的情況下,保持了一定的檢測性能,更適合資源受限的設(shè)備部署。
2.2.1 性能比較
為了評估所有模型的性能,根據(jù)Pascal VOC Challenge引入了基于交叉聯(lián)合(IoU)的平均精度(AP)。 如果一個實例被預(yù)測為正確的類,則稱為真正性(TP);如果一個實例被預(yù)測為另一個類,則稱為假負(fù)性(FN);如果一個實例被錯誤地預(yù)測到一個類,并且該模式考慮了正確的分類,則稱為假正性(FP)。計算準(zhǔn)確率和召回率以實現(xiàn)AP評估:
Per=,Rec=""""""""""" (2)
平均精度是檢測任務(wù)的精確調(diào)用曲線下的面積,通過在一組間隔調(diào)用級別[0,0.1,...,1]上平均精度,并且mAP是在所有類上計算AP的均值。
AP=Pinterp(Rec)""""""""""" (3)
Pinterp(Rec)=maxPer()"""""""""" (4)
接下來,計算IoU=0.5的平均AP(由于場景的復(fù)雜性)。檢測結(jié)果如表2所示。
比較結(jié)果顯示,在枸杞病害數(shù)據(jù)集上,YOLOv5的檢測精確度明顯高于SSD的檢測精確度,YOLOv5的檢測精確度可以達(dá)到88.49%。經(jīng)過結(jié)果分析,發(fā)現(xiàn)癭螨早期和晚期比較相似,因此兩個網(wǎng)絡(luò)對其檢測精度比較低。對于負(fù)泥蟲和木虱的檢測精度高,檢測速度可以達(dá)到實時檢測。
2.2.2 損失函數(shù)
為了估計每個檢測模型的預(yù)測程度,如圖4中所示損失函數(shù)圖。損失函數(shù)的比較結(jié)果表明,所有檢測元架構(gòu)的損失函數(shù)都呈減小趨勢。它穩(wěn)定在大約50 000迭代,網(wǎng)絡(luò)的預(yù)測值更接近真實值。其中:SSD的損失函數(shù)在下降過程中波動較大,而YOLOv5的損失函數(shù)相對平滑,這表明YOLOv5網(wǎng)絡(luò)的學(xué)習(xí)能力更強。
2.2.3 測試結(jié)果
系統(tǒng)可以檢測圖片中病害的類別和位置,如圖5所示。使用IoUgt;0.5作為參考來比較估計結(jié)果和真實框。每個類別彼此獨立,因為它們在網(wǎng)絡(luò)中表現(xiàn)出不同的特征。使用元架構(gòu)和深度特征提取器,與先前的傳統(tǒng)方法相比,該系統(tǒng)在處理各種尺寸、形狀、顏色等特征時顯示出若干優(yōu)點。
2.2.4 混淆矩陣
由于每個害蟲類別中顯示的模式具有不同的復(fù)雜性,尤其是在枸杞病害類別和背景方面,因此系統(tǒng)無法準(zhǔn)確區(qū)分幾個類別,從而導(dǎo)致準(zhǔn)確性降低。在圖6中,給出了最終枸杞病害測試結(jié)果的混淆矩陣。通過分析混淆矩陣,可以直接評估網(wǎng)絡(luò)的性能。從圖中可以看出,癭螨早期的預(yù)測值和真實值的相關(guān)性低于其他害蟲類別。說明癭螨早期與癭螨晚期之間存在一定的混淆,導(dǎo)致癭螨早期的檢測精度降低。
3 結(jié)論
本文基于深度學(xué)習(xí)技術(shù),針對枸杞病蟲害的檢測需求,構(gòu)建了涵蓋枸杞主要病蟲害的高質(zhì)量數(shù)據(jù)集,提出了一種基于YOLOv5模型的高效目標(biāo)檢測方法。通過優(yōu)化訓(xùn)練策略和引入數(shù)據(jù)增強技術(shù),顯著提升了模型的檢測精度與魯棒性。實驗結(jié)果表明,YOLOv5模型在小目標(biāo)病蟲害檢測中的表現(xiàn)優(yōu)于傳統(tǒng)檢測方法,為農(nóng)業(yè)病蟲害智能識別提供了有效方案,具有良好的應(yīng)用前景。
參考文獻(xiàn):
[1] 賈少鵬,高紅菊,杭瀟. 基于深度學(xué)習(xí)的農(nóng)作物病蟲害圖像識別技術(shù)研究進(jìn)展[J]. 農(nóng)業(yè)機械學(xué)報,2019,50(S1):313-317.
[2] 馮峰,周鑫,陳詩瑤,等. 一種基于改進(jìn)神經(jīng)網(wǎng)絡(luò)算法ResNet50的玉米病蟲害識別模型[J]. 江蘇農(nóng)業(yè)科學(xué),2024,52(16):239-244.
[3] 慕君林,馬博,王云飛,等. 基于深度學(xué)習(xí)的農(nóng)作物病蟲害檢測算法綜述[J]. 農(nóng)業(yè)機械學(xué)報,2023,54(S2):301-313.
[4] 駱潤玫,殷惠莉,劉偉康,等. 基于YOLOv5-C的廣佛手病蟲害識別[J]. 華南農(nóng)業(yè)大學(xué)學(xué)報,2023,44(1):151-160.
[5] 翟肇裕,曹益飛,徐煥良,等. 農(nóng)作物病蟲害識別關(guān)鍵技術(shù)研究綜述[J]. 農(nóng)業(yè)機械學(xué)報,2021,52(7):1-18.
責(zé)任編輯:周慧