摘要:農(nóng)業(yè)是國民經(jīng)濟(jì)的一個(gè)重要產(chǎn)業(yè),推進(jìn)農(nóng)業(yè)農(nóng)村現(xiàn)代化建設(shè)是社會(huì)主義現(xiàn)代化建設(shè)的重大任務(wù)。隨著智慧農(nóng)業(yè)的發(fā)展,深度學(xué)習(xí)技術(shù)在農(nóng)業(yè)圖像數(shù)據(jù)分析中的應(yīng)用越來越廣泛。深度學(xué)習(xí)技術(shù)在農(nóng)業(yè)圖像處理方面的應(yīng)用,有效地降低生產(chǎn)成本,提高農(nóng)業(yè)生產(chǎn)效率,加快農(nóng)業(yè)現(xiàn)代化的發(fā)展進(jìn)程。系統(tǒng)介紹了目標(biāo)檢測、圖像識(shí)別和圖像分割3種常見的深度學(xué)習(xí)技術(shù)在農(nóng)業(yè)圖像處理中的應(yīng)用現(xiàn)狀,希望能為后續(xù)研究者提供幫助。
關(guān)鍵詞:深度學(xué)習(xí)農(nóng)業(yè)圖像處理目標(biāo)檢測圖像分類圖像分割
中圖分類號(hào):TP391
ReviewofResearchonAgriculturalImageProcessingBasedonDeepLearningTechnology
WANGWanwan
CollegeofComputerandInformationEngineering,HenanNormalUniversity,Xinxiang,He’nanProvince,453007China
Abstract:Agricultureisanimportantindustryinthenationaleconomy,andpromotingthemodernizationofagricultureandruralareasisamajortaskofsocialistmodernization.Withthedevelopmentofsmartagriculture,DeepLearningtechnologyismoreandmorewidelyappliedinagriculturalimagedataanalysis.TheapplicationofDeepLearningtechnologyinagriculturalimageprocessinghaseffectivelyreduced?;productioncosts,improvedagriculturalproductionefficiency,andacceleratedthedevelopmentprocessofagriculturalmodernization.ThearticlesystematicallyintroducesthecurrentapplicationstatusofthreecommonDeepLearningtechnologies,includingobjectdetection,imagerecognition,andimagesegmentation,inagriculturalimageprocessing.Itishopedtoprovideassistanceforfutureresearchers.
KeyWords:DeepLearning;Agriculturalimageprocessing;Objectdetection;Imagesegmentation;Imagesegmentation
隨著物聯(lián)網(wǎng)與人工智能技術(shù)的發(fā)展,我國已經(jīng)進(jìn)入了智慧農(nóng)業(yè)時(shí)代。智慧農(nóng)業(yè)的發(fā)展使得農(nóng)業(yè)物聯(lián)網(wǎng)和智能農(nóng)機(jī)裝備越來越先進(jìn),農(nóng)業(yè)圖像數(shù)量急劇增加。如何從大量的圖像數(shù)據(jù)中提取出有用的信息,為農(nóng)業(yè)生產(chǎn)提供技術(shù)支持,成為迫切需要解決的問題。近年來,深度學(xué)習(xí)技術(shù)在數(shù)字圖像處理領(lǐng)域取得了令人矚目的進(jìn)步。深度學(xué)習(xí)不需要過多的數(shù)據(jù)預(yù)處理操作,就可以自主學(xué)習(xí)數(shù)據(jù)的特征,并且其具有特征表達(dá)能力優(yōu)、魯棒性高和泛化性強(qiáng)的特點(diǎn),因此逐漸被應(yīng)用到農(nóng)業(yè)圖像數(shù)據(jù)分析的研究中。
1基于深度學(xué)習(xí)的農(nóng)業(yè)目標(biāo)檢測
目標(biāo)檢測主要是在圖像中找到所關(guān)注目標(biāo)對(duì)象,用矩形框?qū)⒛繕?biāo)錨定,對(duì)目標(biāo)進(jìn)行分類并且標(biāo)記目標(biāo)的位置。目標(biāo)檢測在目標(biāo)跟蹤和農(nóng)業(yè)智能化領(lǐng)域有著重要的應(yīng)用。
目前基于深度學(xué)習(xí)的目標(biāo)檢測方法主要分為兩大類:第一類是以FasterR-CNN算法為代表的雙階段(two-stage)目標(biāo)檢測算法,該類算法首先需要找出含有目標(biāo)對(duì)象的候選區(qū)域,然后通過對(duì)候選區(qū)域分類和回歸操作進(jìn)而得到目標(biāo)檢測結(jié)果。該類算法的檢測精度較高,但是實(shí)時(shí)性較差。李佳俊等人[1]使用ResNet50替代傳統(tǒng)FasterR-CNN模型的主干特征提取網(wǎng)絡(luò),在草莓果實(shí)識(shí)別任務(wù)中表現(xiàn)出了較好的檢測性能與技術(shù)能力。李翠明等人[2]提出改進(jìn)的FasterR-CNN模型,該模型使用ResNet50作為特征提取網(wǎng)絡(luò),并在每一層的卷積后引入高效通道注意力機(jī)制進(jìn)行通道特征加強(qiáng),最后將不同尺度特征輸入征金字塔實(shí)現(xiàn)多尺度融合。該算法提高了果實(shí)采摘機(jī)器人在自然環(huán)境下果實(shí)分布密集、枝葉遮擋等情況下對(duì)可抓取蘋果的精度。
第二類是基于回歸的單階段(one-stage)目標(biāo)檢測算法,該算法不需要找出候選區(qū)域,而是直接通過卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征,同時(shí)對(duì)目標(biāo)物體的分類和定位進(jìn)行預(yù)測。該算法檢測速度快,準(zhǔn)確率較高,適合農(nóng)業(yè)實(shí)時(shí)檢測場景。YOLO算法是一種one-stage目標(biāo)檢測算法,該算法于2015年被提出,經(jīng)過一代一代的發(fā)展更新,截至目前已經(jīng)更新到Y(jié)OLOv9。YOLO算法被廣泛應(yīng)用于植物葉片和果實(shí)的檢測和識(shí)別。張震等人[3]將部分卷積和ECA模塊引入YOLOv7模型中,不僅將模型進(jìn)行了輕量化改進(jìn),還增強(qiáng)了模型的特征提取能力。在模型訓(xùn)練過程中,使用麻雀搜索算法(Sparrowsearchalgorithm,SSA)的學(xué)習(xí)率優(yōu)化策略提高了模型的檢測精度。改進(jìn)后的模型可以在復(fù)雜的果園環(huán)境下準(zhǔn)確地識(shí)別出蘋果,有利于蘋果采摘的智能化進(jìn)程。劉莫塵等人[4]在YOLOv8-Pose網(wǎng)絡(luò)的Neck部分加入Slim-neck模塊,并在特征提取層融入了卷積塊注意力模塊。改進(jìn)后的模型不僅能提升對(duì)草莓這種小目標(biāo)的檢測能力,還能提高對(duì)草莓果柄檢測的準(zhǔn)確性?;谏疃葘W(xué)習(xí)技術(shù)的目標(biāo)檢測可以做到提前防治病蟲害,提高農(nóng)產(chǎn)品的生產(chǎn)質(zhì)量,有利于推動(dòng)農(nóng)業(yè)智能化和自動(dòng)化的發(fā)展。
2基于深度學(xué)習(xí)的農(nóng)業(yè)圖像分類
圖像分類算法性能不斷地提高,越來越多的網(wǎng)絡(luò)模型被應(yīng)用到農(nóng)業(yè)圖像的分類中。陳善雄等人[5]采用最大穩(wěn)定極值區(qū)域與卷積神經(jīng)網(wǎng)絡(luò)結(jié)合的方法,實(shí)現(xiàn)對(duì)蕎麥發(fā)病區(qū)域的精確檢測,分離病害與非病害區(qū)域,準(zhǔn)確定位病灶。同時(shí),將兩級(jí)inception結(jié)構(gòu)引入傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的框架上,并采用基于余弦相似度的卷積代替?zhèn)鹘y(tǒng)的卷積運(yùn)算。最終,該模型在苦蕎病害的識(shí)別中取得了97.54%的準(zhǔn)確率。張艷等人[6]采用ResNet12提取RGB茶葉病害特征和灰度茶葉病害特征,并基于這兩個(gè)特征構(gòu)建圖神經(jīng)網(wǎng)絡(luò)的兩個(gè)子節(jié)點(diǎn)和兩條邊,交替更新雙節(jié)點(diǎn)和雙邊,提高邊特征對(duì)節(jié)點(diǎn)度量的準(zhǔn)確性,該模型在數(shù)據(jù)集樣本不充足條件下提高了對(duì)茶葉病害分類的準(zhǔn)確性。姜紅花等人[7]在ResNet18網(wǎng)絡(luò)中引入通道注意力和空間注意力模塊,增強(qiáng)了蘋果葉部病斑區(qū)域的特征提取能力,進(jìn)而提高了蘋果病害的分類準(zhǔn)確率。同時(shí),通過引入特征圖隨機(jī)裁剪分支對(duì)模型進(jìn)行優(yōu)化,提升了模型的識(shí)別實(shí)時(shí)性。姜晟久等人[8]將可分離擴(kuò)張卷積塊應(yīng)用于MobileNetv2模型中,擴(kuò)大感受野以增強(qiáng)番茄葉部病害特征提取。通過替換PReLU激活函數(shù)并應(yīng)用通道剪枝技術(shù),在減少參數(shù)的同時(shí)增強(qiáng)網(wǎng)絡(luò)的魯棒性,提高了對(duì)番茄葉部病害的識(shí)別能力。袁培森等人[9]采用注意力機(jī)制改進(jìn)MobileNetv3Small模型,并使用遷移學(xué)習(xí),將PlantVillage數(shù)據(jù)集上訓(xùn)練好的模型遷移到水稻病害數(shù)據(jù)集上,提高了病害的識(shí)別準(zhǔn)確率。
3基于深度學(xué)習(xí)的農(nóng)業(yè)圖像分割
近幾年深度學(xué)習(xí)成為計(jì)算機(jī)視覺的研究熱點(diǎn),這些新的方法也被應(yīng)用到圖像分割領(lǐng)域中來。目前在圖像分割任務(wù)中應(yīng)用最廣泛的是U-Net和全卷積神經(jīng)網(wǎng)絡(luò)。Li等人[10]將殘差塊和門控卷積應(yīng)用到U-Net模型中來提取邊緣信息,為了進(jìn)一步提升分割效果,模型還引入空洞卷積。最后,采用了空洞空間金字塔池化結(jié)構(gòu),將U-Net的邊緣特征與其高層次特征相融合,顯著地提高了青蘋果果實(shí)的分割精度和模型的泛化能力。韋鈣興等人[11]在U-Net網(wǎng)絡(luò)的編碼器上使用BAResNeXt模塊,用來增強(qiáng)每層分割對(duì)象特征并減少計(jì)算參數(shù),網(wǎng)絡(luò)中引入交叉注意力模塊和SE注意力機(jī)制提高網(wǎng)絡(luò)對(duì)于水稻葉片的分割能力,改進(jìn)后的網(wǎng)絡(luò)模型各評(píng)價(jià)指標(biāo)均有不同程度的提升。侯文慧等人[12]將MobileNet-v3Large和U-Net網(wǎng)絡(luò)相結(jié)合用于草莓壟間圖像實(shí)時(shí)分割,并將模型遷移學(xué)習(xí)到藍(lán)莓和葡萄壟間分割中以驗(yàn)證模型的泛化性和準(zhǔn)確性,該模型在果實(shí)壟間路徑的實(shí)時(shí)提取準(zhǔn)確性較高。
除了以上最常用的網(wǎng)絡(luò)模型外,其他的模型結(jié)構(gòu)在農(nóng)業(yè)圖像分割中也有優(yōu)越的表現(xiàn)。董婭蘭等人[13]提出了以殘差網(wǎng)絡(luò)和特征金字塔網(wǎng)絡(luò)為主干特征提取網(wǎng)絡(luò)的MaskR-CNN模型,用于葡萄藤關(guān)鍵結(jié)構(gòu)的分割,該模型具有較好的擬合性和泛化性能。Peng等人[14]將DeepLabV3+語義分割模型和Xception深度可分離卷積特征有效融合,采用了空間金字塔池化技術(shù)以更精確地捕捉語義像素的位置信息。此外,還借助數(shù)據(jù)增強(qiáng)和遷移學(xué)習(xí)的方法,顯著加速了模型的收斂速度,并增強(qiáng)了模型的魯棒性,該模型在荔枝樹枝語義分割中表現(xiàn)出色。李旭青等人[15]將OCR模塊(object-contextualrepresentations)入CAHRNet模型中,對(duì)輸出特征進(jìn)行粗略的類別區(qū)域分割,并采用坐標(biāo)注意力機(jī)制來提高模型邊緣細(xì)節(jié)信息的提取能力,提高了冬小麥作物田塊分割的準(zhǔn)確性。
4結(jié)語
深度學(xué)習(xí)技術(shù)的應(yīng)用促進(jìn)了農(nóng)業(yè)智能化的發(fā)展,加快了智慧農(nóng)業(yè)的發(fā)展進(jìn)程。但是深度學(xué)習(xí)在農(nóng)業(yè)圖像處理中的應(yīng)用也存在一些問題:深度學(xué)習(xí)模型的性能受預(yù)訓(xùn)練數(shù)據(jù)量影響,在數(shù)據(jù)量充足和數(shù)據(jù)質(zhì)量較好的情況下,模型的性能也更好。然而實(shí)際的數(shù)據(jù)集中,由于光照、背景和角度等因素的影響會(huì)導(dǎo)致數(shù)據(jù)的質(zhì)量參差不齊,如何綜合考慮以上問題并構(gòu)建典型的公開數(shù)據(jù)集,是促進(jìn)深度學(xué)習(xí)技術(shù)在農(nóng)業(yè)發(fā)展的關(guān)鍵。由于深度學(xué)習(xí)對(duì)計(jì)算資源的要求比較高,這就增加了實(shí)際生產(chǎn)應(yīng)用中的成本,如何能夠在保證檢測精度的同時(shí)降低成本,在硬件水平不高的情況下,網(wǎng)絡(luò)模型也能夠穩(wěn)定運(yùn)行,是研究者需要進(jìn)一步探索的方向。
參考文獻(xiàn)
[1].李佳俊,朱子峰,劉洪鑫,等.基于改進(jìn)FasterR-CNN模型的草莓果實(shí)識(shí)別算法[J].湖北農(nóng)業(yè)科學(xué),2023,62(11):183-190.
[2].李翠明,楊柯,申濤,等.基于改進(jìn)FasterR-CNN的蘋果采摘視覺定位與檢測方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2024,55(1):47-54.
[3].張震,周俊,江自真,等.基于改進(jìn)YOLOv7輕量化模型的自然果園環(huán)境下蘋果識(shí)別方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2024,55(3):231-242,262.
[4].劉莫塵,褚鎮(zhèn)源,崔明詩,等.基于改進(jìn)YOLOv8-Pose的紅熟期草莓識(shí)別和果柄檢測[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2023,54(S2):244-251.
[5].陳善雄,伍勝,于顯平,等.基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)合圖像處理技術(shù)的蕎麥病害識(shí)別[J].農(nóng)業(yè)工程學(xué)報(bào),2021,37(3):155-163.
[6].張艷,車迅,汪芃,等.基于雙節(jié)點(diǎn)-雙邊圖神經(jīng)網(wǎng)絡(luò)的茶葉病害分類方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2024,55(3):252-262.
[7].姜紅花,楊祥海,丁睿柔,等.基于改進(jìn)ResNet18的蘋果葉部病害多分類算法研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2023,54(4):295-303.
[8].姜晟久,鐘國韻.基于可分離擴(kuò)張卷積和通道剪枝的番茄病害分類方法[J].江蘇農(nóng)業(yè)科學(xué),2024,52(2):182-189.
[9].袁培森,歐陽柳江,翟肇裕,等.基于MobileNetV3Small-ECA的水稻病害輕量級(jí)識(shí)別研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2024,55(1):253-262.
[10].LiQ,JiaW,SunM,etal.AnovelgreenapplesegmentationalgorithmbasedonensembleU-Netundercomplexorchardenvironment[J].ComputersandElectronicsin?;Agriculture,2021,180:105900.
[11].韋鈣興,易文龍,劉昱成,等.基于改進(jìn)U-Net的水稻葉片細(xì)胞分割方法研究[J].河南農(nóng)業(yè)科學(xué),2023,52(3):153-160.
[12].侯文慧,周傳起,程炎,等.基于輕量化U-Net網(wǎng)絡(luò)的果實(shí)壟間路徑識(shí)別方法[J/OL].農(nóng)業(yè)機(jī)械學(xué)報(bào),1-13[2024-06-17].http://kns.cnki.net/kcms/detail/11.1964.S.20240103.0955.011.html.
[13].董婭蘭,胡國玉,劉廣,等.基于MaskR-CNN模型的葡萄藤關(guān)鍵結(jié)構(gòu)分割方法[J].中國農(nóng)機(jī)化學(xué)報(bào),2024,45(2):207-214.
[14].PengH,XueC,ShaoY,etal.SemanticsegmentationoflitchibranchesusingDeepLabV3+model[J].IEEEAccess,2020,8:164546-164555.
[15].李旭青,吳冬雪,王玉博,等.基于改進(jìn)HRNet的遙感影像冬小麥語義分割方法[J].農(nóng)業(yè)工程學(xué)報(bào),2024,40(3):193-200.