摘" 要:YOLOv9作為YOLO系列模型中的最新版本之一,其平臺移植方便與檢測步驟簡易,相比于傳統(tǒng)的圖像識別技術(shù),基于深度學(xué)習(xí)的物體檢測模型具有更強的特征提取和泛化能力,能夠更好地識別復(fù)雜的物體和場景。基于YOLOv9c葡萄病害識別檢測算法研究,針對傳統(tǒng)的病害識別方法存在著識別準確率低、耗時長等問題,對我國七種葡萄病害進行識別,進行訓(xùn)練之后,平均檢測度mAP50為92.7%,實驗結(jié)果表明,該方法可以實現(xiàn)葡萄病害實時檢測,大大提高了農(nóng)業(yè)生產(chǎn)效率,滿足葡萄病害檢測應(yīng)用場景的精度要求和實時性。
關(guān)鍵詞:YOLOv9;葡萄病害;實時檢測;損失函數(shù);高性能
中圖分類號:TP391.4 文獻標識碼:A 文章編號:2096-4706(2025)04-0064-06
Research on Grape Disease Identification and Detection Algorithm Based on YOLOv9
XIAO Zhengrong, LIANG Yefeng, LI Fei, WANG Yizong, TIAN Jiya
(School of Information Engineering, Xinjiang Institute of Technology, Aksu" 843100, China)
Abstract: As one of the latest versions in the YOLO series of models, YOLOv9 features convenient platform transplantation and simple detection procedures. Compared with traditional image recognition technologies, object detection models based on Deep Learning possess stronger feature extraction and generalization capabilities, and can better recognize complex objects and scenes. Based on the research on YOLOv9c grape disease identification and detection algorithm, aiming at the issues such as low recognition accuracy and long processing time existing in traditional disease recognition methods, this paper conducts recognition of seven types of grape diseases in China, and the average detection metric mAP50 reaches 92.7% after training. Experimental results demonstrate that this method can achieve real-time detection of grape diseases, significantly improving agricultural production efficiency and meeting the precision and real-time requirements of grape disease detection application scenarios.
Keywords: YOLOv9; grape diseases; real-time detection; loss function; high-performance
0" 引" 言
隨著農(nóng)業(yè)生產(chǎn)的不斷發(fā)展,病蟲害的防治問題越來越受到重視。在農(nóng)業(yè)生產(chǎn)中,葡萄作為一種重要的果樹,其病害識別技術(shù)的發(fā)展對于提高葡萄產(chǎn)量和質(zhì)量具有重要意義。然而,傳統(tǒng)的病害識別方法存在著識別準確率低、耗時長等問題。近年來,深度學(xué)習(xí)技術(shù)在圖像識別領(lǐng)域取得了顯著的成果,為農(nóng)業(yè)生產(chǎn)提供了新的解決方案。胡施威等人[1]提出了一種優(yōu)化的葡萄葉部病害識別模型CD-MobileViT,為未來可部署到移動端上使用,為葡萄葉部病害的準確識別提供新的解決方案。為進一步提高葡萄病害識別的精度及速度,張惠莉等人[2]對YOLO v8模型進行了改進并取得了顯著效果。上述研究雖對葡萄葉片識別取得了可觀的效果,但對于葡萄果實等識別研究比較缺乏。為實現(xiàn)葡萄早期病害的快速準確識別,張林鍹等人[3]針對葡萄病害的相似表型癥狀識別率低及小病斑檢測困難的問題,以葡萄黑腐病和黑麻疹病為研究對象,提出了一種基于自適應(yīng)鑒別器增強的樣式生成對抗網(wǎng)絡(luò)與改進的YOLO v7相結(jié)合的葡萄黑腐病和黑麻疹病的病斑檢測方法,實驗結(jié)果表明,該模型能夠?qū)崿F(xiàn)葡萄早期病害快速準確識別,對于保障葡萄產(chǎn)業(yè)發(fā)展具有重要意義,但該研究對葡萄病害研究的種類比較單一,難以適用不同環(huán)境下果園發(fā)生的病害。為了解決上述問題,本人在前人研究的基礎(chǔ)上,結(jié)合葡萄病害的特點,基于YOLOv9c模型,實現(xiàn)了對自然環(huán)境中對葡萄病害的實時監(jiān)測?;赮OLOv9c的葡萄病害識別技術(shù)在農(nóng)業(yè)生產(chǎn)中的應(yīng)用,是一種基于深度學(xué)習(xí)的方法。該方法通過卷積神經(jīng)網(wǎng)絡(luò)(CNN)等模型直接學(xué)習(xí)圖像特征,具有更好的泛化能力。與傳統(tǒng)的特征提取方法相比,該方法不需要手動設(shè)置特征,其特征提取過程簡單,且具有較高的泛化能力。此外,該方法還可以實現(xiàn)實時病害識別,大大提高了農(nóng)業(yè)生產(chǎn)效率。此外,YOLOv9c模型具有較高的檢測速度和準確性,能夠在保證較高識別準確率的同時,實現(xiàn)實時病害識別,這對于葡萄病害的防治、提高葡萄產(chǎn)量以及質(zhì)量在農(nóng)業(yè)生產(chǎn)中的實時監(jiān)控和預(yù)警具有重要意義。
1" YOLOv9算法介紹
YOLOv9c是YOLO系列模型中的最新版本之一,由Wang等人共同提出的新一代目標檢測系統(tǒng)[4]。YOLO系列算法以其速度快和準確性高而聞名,在實時目標檢測領(lǐng)域有著廣泛的應(yīng)用。YOLOv9在當前版本的基礎(chǔ)上進行了顯著的改進,旨在解決深度學(xué)習(xí)中信息丟失的問題,并提高模型在各種任務(wù)上的性能,同時在網(wǎng)絡(luò)結(jié)構(gòu)、損失函數(shù)等方面進行了進一步的優(yōu)化和改進,如圖1所示。
YOLOv9c核心創(chuàng)新點主要是可編程梯度信息(PGI)、通用高效層聚合網(wǎng)絡(luò)(GELAN)、信息瓶頸緩解、多級輔助信息以及損失函數(shù)創(chuàng)新這五部分。PGI通過輔助的可逆分支生成可靠的梯度信息解決了深層網(wǎng)絡(luò)訓(xùn)練中的信息瓶頸問題,從而提高模型在復(fù)雜任務(wù)中的性能。YOLOv9采用了全新的網(wǎng)絡(luò)架構(gòu),GELAN通過梯度路徑規(guī)劃,優(yōu)化了網(wǎng)絡(luò)結(jié)構(gòu),減少了計算資源的需求,在保持輕量級的同時,達到前所未有的準確度和速度。YOLOv9通過PGI和GELAN的結(jié)合,有效減少了數(shù)據(jù)在傳輸過程中的信息損失,使模型能夠更加準確地學(xué)習(xí)到目標任務(wù)所需的特征,提高了特征提取能力。PGI整合了不同的預(yù)測頭的梯度信息,幫助主分支學(xué)習(xí)到更加全面的語義信息,提高了模型對各種目標檢測能力。YOLOv9融合了“Focus”思想的一系列新?lián)p失函數(shù),這些損失函數(shù)針對特定的目標檢測挑戰(zhàn)進行優(yōu)化,更加全面地考慮目標的位置和尺寸差異信息,提高目標的定位能力。
2" 檢測方案設(shè)計
2.1" 初始數(shù)據(jù)集
本研究的數(shù)據(jù)集來源于科學(xué)數(shù)據(jù)銀行,平臺的數(shù)據(jù)集為自然環(huán)境下所拍攝的圖片[5],圖片的大小為600×400像素,包括葡萄葉片、枝干以及果實,總共含有1 446張,包括我國常見的7種葡萄病害,分別是白粉病(215張圖片)、黑霉病(208張圖片)、花葉病毒病(病原體:198張圖片)、灰霉?。?04張圖片)、潰瘍?。?20張圖片)、霜霉?。?97張圖片)、酸腐?。?04張圖片),如表1所示。
2.2" 使用Powerful-IoU損失函數(shù)
Powerful-IoU v2損失函數(shù)不僅使現(xiàn)有的IoU函數(shù)損耗更快地收斂,而且增強了對中等質(zhì)量錨框的聚焦能力,實現(xiàn)了在平均精度以及性能上的改進[6],可以解決現(xiàn)有的損失函數(shù)受到不合理的懲罰因素的影響,錨框在回歸過程中膨脹導(dǎo)致收斂速度減緩的現(xiàn)象。改進后的損失函數(shù)如下所示:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
其中,式(1)中的I表示預(yù)測框與目標框的交點,U表示兩者的結(jié)合點,式(2)中的P表示一種能適應(yīng)目標大小的懲罰因子,dw1、dw2、dh1以及dh2表示預(yù)測方框的相應(yīng)邊緣與目標方框之間距離的絕對值,wgt和hgt表示目標方框的寬度和高度。式(6)中的u(λq)表示注意力函數(shù),用錨點框質(zhì)量的q表示上述的懲罰因子P,q的范圍為(0,1)。當q = 1時,意味著P = 0,表示錨點框與目標框完全對齊,式(8)中的λ表示控制注意力函數(shù)行為的超參數(shù)[6]。
3" 實驗分析
3.1" 實驗設(shè)置
本次實驗平臺是在一臺服務(wù)器上進行的,其內(nèi)存為30 GB,GPU型號為RTX 3090,16 GB顯存,在訓(xùn)練過程中使用Python語言在PyCharm編譯器下進行訓(xùn)練操作[7],其中參數(shù)epochs設(shè)置為200,batch-size大小設(shè)置為64,學(xué)習(xí)率設(shè)置為0.000 1,如表2所示。
3.2" 評估指標
在訓(xùn)練完成之后,需要對模型進行評估,本文所采用的評估方法是精確率(Precision)、召回率(Recall)、準確率(Accuracy)以及F1[8]。
精確率(P)是指在所有被模型預(yù)測為正例的樣本中實際正例的比例,其計算式為[9]:
(9)
召回率(R)是指在所有實際為正例的樣本中度量有多個正例被分為正例,它衡量了模型對正例的識別能力,其計算式為:
(10)
準確率(A)衡量越高,代表模型越好,其計算式為:
(11)
F1(F)是精確率和召回率的平均數(shù),是分類問題的一個衡量指標,1代表最好,0代表最差[10]。
(12)
3.3" 實驗結(jié)果分析
本文訓(xùn)練之后的模型測試各類葡萄病害結(jié)果P-R如圖2所示,識別結(jié)果詳見表3[11]。由表3可知,白粉病、霜霉病等的P-R平均結(jié)果均達到了92%以上,與目前葡萄病害檢測識別結(jié)果相比,結(jié)果均優(yōu)。
圖3為該模型用于葡萄病害識別結(jié)果的一個典型示例,它可以成功地識別本次所研究的我國常見的7種病害,如白粉病、黑霉病等。
4" 結(jié)" 論
本文基于YOLOv9c葡萄病害目標檢測算法,進行訓(xùn)練之后,葡萄病害識別平均檢測度為92.7%,該目標檢測算法實現(xiàn)了可以在葡萄果實疊加、背景干擾、不同密集程度以及葉面遮擋的復(fù)雜情況下,可以較好地滿足實際葡萄病害的檢測要求,具有較高的準確性和穩(wěn)定性,為葡萄病害檢測的發(fā)展提供了有力的幫助,為今后葡萄病害智能化檢測提供了方法和途徑,為提高葡萄產(chǎn)量和品質(zhì)提供了新的可能。該算法具有較高的識別準確率、泛化能力和實用性,有望在農(nóng)業(yè)生產(chǎn)中得到廣泛應(yīng)用。未來,將會通過引入先進的計算機視覺技術(shù)、模型優(yōu)化和部署策略,進一步提高病害識別的準確性和實時性,為農(nóng)業(yè)生產(chǎn)提供更加高效、準確的病害信息。同時,還會進一步研究和探索如何將這種技術(shù)應(yīng)用到其他農(nóng)作物病害的識別中,以實現(xiàn)對農(nóng)作物病害的全面識別和管理。
參考文獻:
[1] 胡施威,邱林,鄧建新.基于改進MobileViT的葡萄葉部病害識別模型 [J/OL].山東農(nóng)業(yè)科學(xué),2024:1-12[2024-09-11].http://kns.cnki.net/kcms/detail/37.1148.S.20240909.1721.002.html.
[2] 張惠莉,代晨龍,任景龍,等.基于GhostNetV2改進YOLO v8模型的葡萄病害識別方法研究 [J/OL].農(nóng)業(yè)機械學(xué)報,2024:1-11[2024-09-11].http://kns.cnki.net/kcms/detail/11.1964.S.20240827.0948.004.html.
[3] 張林鍹,巴音塔娜,曾慶松.基于StyleGAN2-ADA和改進YOLO v7的葡萄葉片早期病害檢測方法 [J].農(nóng)業(yè)機械學(xué)報,2024,55(1):241-252.
[4] WANG C-Y,YEH I-H,LIAO H-Y M. YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information [J/OL].arXiv:2402.13616 [cs.CV].[2024-08-13].https://arxiv.org/abs/2402.13616.
[5] 袁媛,陳雷.IDADP-葡萄病害識別研究圖像數(shù)據(jù)集 [J].中國科學(xué)數(shù)據(jù):中英文網(wǎng)絡(luò)版,2022,7(1):86-90.
[6] LIU C,WANG K G,LI Q,et al. Powerful-IoU: More Straightforward and Faster Bounding Box Regression Loss with a Nonmonotonic Focusing Mechanism [J].Neural Networks,2024(170):276-284.
[7] 沈薇,李紅梅,陶苑,等.基于改進YOLOv4的飲料識別算法 [J].現(xiàn)代信息科技,2024,8(15):36-41.
[8] 尹泉賀,原素慧,朱夢琳,等.基于改進YOLOv5s的無人機航拍小目標檢測算法研究[J].現(xiàn)代信息科技,2024,8(14):37-42+48.
[9] 申蜜蜜.基于深度卷積生成對抗網(wǎng)絡(luò)的葡萄葉片病害識別研究 [D].泰安:山東農(nóng)業(yè)大學(xué),2023.
[10] 董霽紅,王立兵,馮曉彤,等.黃河流域煤炭-煤電-煤化工場地特征精準智能識別方法及應(yīng)用 [J].煤炭學(xué)報,2024,49(2):1011-1024.
[11] 李冬睿,邱尚明,楊穎.復(fù)雜光照環(huán)境下基于改進生成對抗網(wǎng)絡(luò)的甘蔗病害樣本增強應(yīng)用分析 [J].數(shù)字技術(shù)與應(yīng)用,2023,41(10):64-66.
作者簡介:蕭崢嶸(2002—),男,漢族,江西萍鄉(xiāng)人,本科在讀,研究方向:圖像處理;梁燁鋒(1995—),男,漢族,廣西崇左人,助理實驗師,本科,研究方向:圖像識別、自動化;李菲(1995—),女,漢族,河南商丘人,講師,碩士,研究方向:數(shù)字媒體技術(shù);王義宗(1990—),男,漢族,甘肅慶陽人,講師,碩士,研究方向:圖像處理;田紀亞(1979—),男,漢族,山東鄆城人,教授,碩士,研究方向:人工智能和圖像處理。
收稿日期:2024-09-13
基金項目:國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項目(202413558003);2021年度校級項目(ZY202105);2023年度校級重點項目(ZZ202303)