• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于改進(jìn)RT-DETR的草莓成熟度檢測(cè)

      2024-12-31 00:00:00楊國(guó)亮吳永淦丁睿盛楊楊
      江蘇農(nóng)業(yè)科學(xué) 2024年20期
      關(guān)鍵詞:目標(biāo)檢測(cè)成熟度草莓

      doi:10.15889/j.issn.1002-1302.2024.20.016

      摘要:在自然果園環(huán)境下,草莓果實(shí)生長(zhǎng)分布密集易受枝葉遮擋,不同生長(zhǎng)周期的草莓形態(tài)大小不一,面對(duì)遮擋、小尺寸草莓現(xiàn)有的檢測(cè)模型容易出現(xiàn)誤檢、漏檢問(wèn)題。針對(duì)上述問(wèn)題,提出了一種基于改進(jìn)RT-DETR的實(shí)時(shí)草莓成熟度檢測(cè)算法Strawberry Ripeness-DERT(SR-DETR)。首先,根據(jù)PConv卷積設(shè)計(jì)FasterBlock模塊替換原模型主干網(wǎng)絡(luò)中的BasicBlock模塊,提高模型特征提取能力的同時(shí)還有效降低模型參數(shù)量;然后,基于GSConv卷積和VOVGSCSP模塊設(shè)計(jì)了頸部特征融合模塊(Light_CCFM),削弱復(fù)雜背景和冗余信息的干擾,提高小目標(biāo)的識(shí)別率;最后,引入SSFF模塊改進(jìn)特征融合層,增加SR-DETR網(wǎng)絡(luò)的多尺度融合能力,使模型具有更強(qiáng)的魯棒性。改進(jìn)后的模型在自建草莓?dāng)?shù)據(jù)集上進(jìn)行試驗(yàn),結(jié)果顯示,SR-DETR模型的精確度、召回率和平均精度均值分別為93.0%、90.2%、91.7%,相比于原模型分別提升1.6、1.8、1.5百分點(diǎn),同時(shí)模型參數(shù)量、模型大小和計(jì)算復(fù)雜度分別降低31.2%、31.1%和23.6%。SR-DETR模型不僅提高了不同成熟度草莓的識(shí)別精度,還降低了遮擋目標(biāo)的漏檢率,檢測(cè)速度達(dá)到60.9幀/s,可以便捷地部署到終端完成實(shí)時(shí)檢測(cè)。

      關(guān)鍵詞:草莓;成熟度;RT-DETR;目標(biāo)檢測(cè);GSConv;VOVGSCSP

      中圖分類(lèi)號(hào):TP391.41" 文獻(xiàn)標(biāo)志碼:A

      文章編號(hào):1002-1302(2024)20-0129-09

      收稿日期:2024-07-17

      基金項(xiàng)目:江西省教育廳科技項(xiàng)目(編號(hào):GJJ210861);江西省教育廳科技計(jì)劃(編號(hào):GJJ200879)。

      作者簡(jiǎn)介:楊國(guó)亮(1973—),男,江西宜春人,博士,教授,主要從事人工智能和模式識(shí)別研究。E-mail:ygliang30@126.com。

      通信作者:吳永淦,碩士研究生,主要從事人工智能和模式識(shí)別研究。E-mail:wyg19914682903@163.com。

      草莓色澤艷麗、味道美妙,而且營(yíng)養(yǎng)價(jià)值極高,它富含維生素C、膳食纖維和多種抗氧化物質(zhì),這些成分對(duì)人體健康有著諸多益處[1]。我國(guó)作為農(nóng)業(yè)大國(guó),在草莓的生產(chǎn)規(guī)模上更是位于世界前列[2]。我國(guó)草莓的種植區(qū)域主要位于華東、中南、西南地區(qū),其種植面積在近年來(lái)逐漸增長(zhǎng)。對(duì)草莓采摘的時(shí)間把握是非常重要的,不同成熟度的草莓所含有的營(yíng)養(yǎng)價(jià)值不同[3]。如果采摘過(guò)早,草莓還未成熟,其營(yíng)養(yǎng)價(jià)值不高,并且口感酸澀;如果采摘過(guò)晚,草莓在運(yùn)輸過(guò)程中就容易腐爛,影響后期的售賣(mài)。當(dāng)前,草莓的采摘主要分為人工采摘和機(jī)械化采摘2種方式[4]。人工采摘通過(guò)人工觀察草莓的生長(zhǎng)情況來(lái)采摘草莓,其采摘周期長(zhǎng),容易錯(cuò)過(guò)采摘的最佳時(shí)間。而機(jī)械化采摘主要是機(jī)器通過(guò)草莓的表皮顏色判斷草莓是否成熟進(jìn)而進(jìn)行采摘。但是由于機(jī)器難以準(zhǔn)確判斷草莓的成熟度,導(dǎo)致容易出現(xiàn)誤采、漏采等現(xiàn)象[5]。因此,研究一款高效準(zhǔn)確的草莓成熟度檢測(cè)系統(tǒng)對(duì)草莓的機(jī)械化采摘具有重要作用。

      近年來(lái),國(guó)內(nèi)外學(xué)者通過(guò)研究機(jī)器視覺(jué)技術(shù)和光譜分析的方法來(lái)實(shí)現(xiàn)對(duì)蘋(píng)果、菠蘿、葡萄等果實(shí)成熟度進(jìn)行檢測(cè)[6]。陳仁凡等提出一種輕量化的基于YOLO-ODM的草莓成熟度檢測(cè)方法,實(shí)現(xiàn)了在溫室環(huán)境下草莓果實(shí)的快速識(shí)別,檢測(cè)效果達(dá)到97.4%[7]。張小花等提出了基于 EfficientDet-D1 的草莓快速檢測(cè)及分類(lèi)方法,實(shí)現(xiàn)了在自然環(huán)境下快速識(shí)別成熟草莓與未成熟草莓,識(shí)別精度達(dá)到97.50%[8]。熊俊濤等利用輕量化YOLO v5-Lite對(duì)木瓜的成熟度進(jìn)行分類(lèi)識(shí)別,實(shí)現(xiàn)了對(duì)不同拍攝距離、不同遮擋情況以及不同光照下的果實(shí)總體檢測(cè)效果達(dá)92.4%[9]。Raj等將草莓的全光譜信息輸入到支持向量機(jī)(SVM)中檢測(cè)草莓成熟度,達(dá)到98%的準(zhǔn)確率[10]。胡仕林等為了實(shí)現(xiàn)復(fù)雜環(huán)境中蘋(píng)果采摘機(jī)器人目標(biāo)快速檢測(cè),提出一種基于深度可分離卷積 YOLO v5 的目標(biāo)檢測(cè)方法,算法檢測(cè)精度達(dá) 95.8%,檢測(cè)速率達(dá)53幀/s,機(jī)器人單次采摘時(shí)間為 4.7 s,采摘成功率達(dá)93.9%[11]。趙德安等利用改進(jìn)的 YOLO v3算法,實(shí)現(xiàn)各類(lèi)復(fù)雜環(huán)境下的蘋(píng)果識(shí)別,該算法的檢測(cè)速度可達(dá) 60幀/s,具有良好的實(shí)時(shí)性,但在檢測(cè)密集場(chǎng)景下的蘋(píng)果時(shí)效果較差[12]。黃威等為準(zhǔn)確檢測(cè)果園中未成熟與成熟的蘋(píng)果,提出一種基于改進(jìn) YOLOX-S的蘋(píng)果成熟度檢測(cè)方法,對(duì)蘋(píng)果低成熟度、中等成熟度和高等成熟度的檢測(cè)精度分別達(dá)90.85%、95.10%和80.50%[13]。通過(guò)上述關(guān)于各種水果成熟度檢測(cè)的研究發(fā)現(xiàn),當(dāng)前仍然存在一些挑戰(zhàn):雖然提出的模型對(duì)目標(biāo)的識(shí)別精度提高了,但模型的參數(shù)量往往也會(huì)增加,這將導(dǎo)致模型在農(nóng)業(yè)采摘設(shè)備當(dāng)中難以部署;并且模型在復(fù)雜環(huán)境下識(shí)別困難,特別是對(duì)于未成熟的草莓,由于未成熟的草莓與葉片的顏色相混合、葉片遮擋果實(shí)以及目標(biāo)數(shù)量多且密集等因素,從而導(dǎo)致特征提取困難,識(shí)別準(zhǔn)確率低。

      基于CNN的模型在檢測(cè)精度與速度方面表現(xiàn)良好,但是其中閾值篩選與非極大值抑制(non-maximum suppression,NMS)2個(gè)關(guān)鍵步驟,會(huì)導(dǎo)致模型的魯棒性和檢測(cè)速度降低[14]。RT-DETR作為一種新的目標(biāo)檢測(cè)方法,無(wú)需NMS后處理,其優(yōu)化難度減小、魯棒性得到增強(qiáng),但其仍存在主干網(wǎng)絡(luò)結(jié)構(gòu)相對(duì)復(fù)雜冗余、不同模塊間數(shù)據(jù)流動(dòng)差等問(wèn)題[15]。因此,本研究基于RT-DETR提出改進(jìn)的SR-DETR檢測(cè)模型,主要貢獻(xiàn)有:(1)針對(duì)RT-DETR主干網(wǎng)絡(luò)結(jié)構(gòu)存在冗余問(wèn)題,使用FasterBlock模塊替換主干中使用的BasicBlock模塊,在不影響目標(biāo)檢測(cè)精度的同時(shí)極大地減小了模型的參數(shù)量;(2)針對(duì)RT-DETR的頸部網(wǎng)絡(luò)特征信息融合不充分的問(wèn)題,用GSConv卷積去替換頸部的標(biāo)準(zhǔn)卷積,引用VOVGSCGP模塊對(duì)特征融合模塊進(jìn)行細(xì)化,提高模型對(duì)密集目標(biāo)的檢測(cè)能力[16];(3)為了快速、準(zhǔn)確地識(shí)別小目標(biāo),在頸部引入了SSFF模塊,結(jié)合空間和尺度特征,提高小目標(biāo)的檢測(cè)能力[17]。最后,通過(guò)試驗(yàn)對(duì)所提出的SR-DETR模型的性能進(jìn)行驗(yàn)證。

      1" RT-DETR模型介紹

      RT-DETR是基于Transformer的一個(gè)實(shí)時(shí)目標(biāo)檢測(cè)模型,它包括1個(gè)主干網(wǎng)絡(luò)(BackBone)、1個(gè)高效混合編碼器和1個(gè)帶有輔助預(yù)測(cè)頭的解碼器。其模型的設(shè)計(jì)官方提供了以ResNet和HGNet等為主干的多種模型,本研究結(jié)合草莓成熟度檢測(cè)的實(shí)際需求,選擇網(wǎng)絡(luò)深度和檢測(cè)精度較為平衡的RT-DETR-R18作為基礎(chǔ)網(wǎng)絡(luò),網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。模型中的高效混合編碼器由基于注意力的尺度內(nèi)特征交互(AIFI)和基于CNN的跨尺度特征融合(CCFM)模塊組成,AIFI模塊類(lèi)似于Transformer中的Encoder,對(duì)S5特征進(jìn)行編碼,CCFM基于跨尺度融合模塊進(jìn)行優(yōu)化,該模塊在融合路徑中插入多個(gè)由卷積層組成的融合塊。解碼器則通過(guò)IoU感知查詢模塊,該模塊構(gòu)建和優(yōu)化了認(rèn)知不確定性來(lái)建模編碼器特征的聯(lián)合潛在變量,從而為解碼器提供高質(zhì)量的查詢。

      2" SR-DETR模型設(shè)計(jì)原理

      2.1" SR-DETR模型總體結(jié)構(gòu)

      本研究針對(duì)RT-DETR檢測(cè)性能不足的問(wèn)題,提出了改進(jìn)的的草莓成熟度檢測(cè)模型SR-DETR。首先,在主干網(wǎng)絡(luò)中使用FasterBlock模塊進(jìn)行特征提取,減少計(jì)算冗余的同時(shí)提取更豐富的特征信息。其次,在頸部網(wǎng)絡(luò)中采用輕量級(jí)卷積GSConv和VOVGSCSP模塊減輕模型的復(fù)雜性,實(shí)現(xiàn)骨干網(wǎng)絡(luò)特征圖信息的有效融合,實(shí)現(xiàn)高性能檢測(cè)。最后,為進(jìn)一步解決多尺度融合問(wèn)題和輕量級(jí)卷積帶來(lái)的精度下降問(wèn)題,在特征融合層中加入SSFF模塊,加速了不同尺度特征之間的融合過(guò)程,提高了模型的計(jì)算效率和推理速度。SR-DETR整體網(wǎng)絡(luò)構(gòu)架如圖2所示。

      2.2" FasterBlock模塊

      在CNN構(gòu)架中,通常采用跨步卷積和池化去除冗余信息,大多數(shù)卷積如深度卷積(DWConv)和群卷積(GConv)提取空間特征,雖然通過(guò)減少參數(shù)量和計(jì)算復(fù)雜度,在一定上緩解這一問(wèn)題,但是由于它們?nèi)匀恍枰l繁地訪問(wèn)內(nèi)存,并不能有效地加快運(yùn)算速度。FasterNet網(wǎng)絡(luò)中提出一種新的部分卷積(PConv),它通過(guò)減少計(jì)算冗余以及內(nèi)存訪問(wèn)的數(shù)量,能夠更有效地提取空間特征[18]。PConv卷積的核心在于對(duì)于輸入特征圖的通道進(jìn)行選擇性處理,而非像標(biāo)準(zhǔn)卷積那樣應(yīng)用所有通道。具體來(lái)說(shuō),PConv卷積在每一次卷積操作中,選取輸入特征圖的一部分連續(xù)通道進(jìn)行空間特征提取,而剩余通道則直接保持不變傳遞到輸出特征圖中。它通常將輸入特征圖的第1個(gè)或最后1個(gè)連續(xù)通道作為整個(gè)特征映射的代表進(jìn)行計(jì)算,既減少實(shí)際參與計(jì)算的通道數(shù),又保證輸入和輸出特征映射的通道數(shù)相同。而標(biāo)準(zhǔn)卷積則是采用卷積核通道數(shù)與輸入特征映射通道數(shù)相同的特征提取方式。PConv卷積與標(biāo)準(zhǔn)卷積的結(jié)構(gòu)如圖3所示。

      假設(shè)輸入和輸出的通道數(shù)相同,那么PConv卷積的計(jì)算量(FLOPs)和內(nèi)存訪問(wèn)量(MAC)分別為:

      FPConv=h×w×k2×c2p;(1)

      MPConv=h×w×2cp+k2×c2p≈h×w×2cp。(2)

      標(biāo)準(zhǔn)卷積Conv的計(jì)算量和內(nèi)存訪問(wèn)量分別為:

      FConv=h×w×k2×c2;(3)

      MConv=h×w×2c+k2×c2≈h×w×2c。(4)

      其中,h、w分別表示輸入特征圖的高度、寬度;k表示卷積核的大?。籧表示通道數(shù)。由上述公式可得:如果cp/c=1/4時(shí),那么PConv的FLOPs就僅為標(biāo)準(zhǔn)卷積的1/16,內(nèi)存訪問(wèn)量將是卷積的1/4。

      原始模型主干網(wǎng)絡(luò)中的BasicBlock模塊由2個(gè)卷積層和殘差連接結(jié)構(gòu)組成,多個(gè)標(biāo)準(zhǔn)卷積的殘差連接使得網(wǎng)絡(luò)結(jié)構(gòu)變得更加復(fù)雜,計(jì)算量大。針對(duì)這一問(wèn)題,使用PConv去替換殘差結(jié)構(gòu)中的標(biāo)準(zhǔn)卷積,構(gòu)成新的FasterBlock模塊,在減少計(jì)算冗余的同時(shí)提取更豐富的特征信息。FasterBlock模塊結(jié)構(gòu)見(jiàn)圖4。

      2.3" 頸部特征融合模塊Light_CCFM

      在實(shí)現(xiàn)機(jī)械化采摘草莓時(shí)往往面臨一個(gè)顯著挑戰(zhàn),大多數(shù)果實(shí)會(huì)被錯(cuò)綜復(fù)雜的枝干和密集的葉片所遮擋,導(dǎo)致系統(tǒng)難以全面準(zhǔn)確捕捉到所有果實(shí),僅有部分特征形態(tài)能夠被識(shí)別到,尤其是遠(yuǎn)景圖像中的小目標(biāo)草莓。為解決這一問(wèn)題,本研究設(shè)計(jì)出Light_CCFM模塊。一方面,將頸部網(wǎng)絡(luò)中的標(biāo)準(zhǔn)卷積替換為輕量級(jí)的GSConv卷積,減小模型的參數(shù)量和計(jì)算復(fù)雜度;另一方面,使用VOVGSCSP模塊替換RepC3模塊,進(jìn)一步提升模型的多尺度特征融合能力和特征提取能力。

      GSConv卷積的獨(dú)特之處在于集成了標(biāo)準(zhǔn)卷積、深度可分離卷積(DWConv)的參數(shù)效率和shuffle模塊的通道混洗機(jī)制,其網(wǎng)絡(luò)結(jié)構(gòu)見(jiàn)圖5。這不僅保留通道間的隱藏鏈接,增強(qiáng)了模型非線性特征表達(dá)能力,還減小了模型的參數(shù)量和計(jì)算復(fù)雜度。GSConv卷積首先將輸入數(shù)據(jù)通過(guò)標(biāo)準(zhǔn)卷積層進(jìn)行初步的特征提取;然后將提取出的特征傳遞給DWConv層,該層對(duì)每個(gè)通道獨(dú)立進(jìn)行卷積操作,極大減少計(jì)算量;最后由shuffle模塊介入,通過(guò)重新排列通道順序,將標(biāo)準(zhǔn)卷積與DWConv卷積提取的特征進(jìn)行深度混合,增強(qiáng)了模型對(duì)復(fù)雜場(chǎng)景下的特征表征能力。GSConv的輸入和輸出的通道數(shù)與標(biāo)準(zhǔn)卷積相同,在圖5中,經(jīng)過(guò)標(biāo)準(zhǔn)卷積和DWConv得到的特征圖通道數(shù)均為C1/2,其中DWConv使得該模塊實(shí)現(xiàn)了接近標(biāo)準(zhǔn)卷積的性能,同時(shí)降低了計(jì)算復(fù)雜度。如圖3-b所示,在標(biāo)準(zhǔn)卷積中卷積核的維度等于輸入維度,輸出等于卷積核個(gè)數(shù)。GSConv卷積的計(jì)算量公式如(5)、(6)所示。

      FGSConv=h×w×k2×c12×c+h×w×k2×c12;(5)

      FConvFGSConv=h×w×k2×c2h×w×k2×c12×c+h×w×k2×c12=2cc+1≈2。(6)

      由公式(6)可知,將GSConv卷積與標(biāo)準(zhǔn)卷積的計(jì)算量進(jìn)行比較,當(dāng)c>>1時(shí),標(biāo)準(zhǔn)卷積的計(jì)算量是GSConv卷積的2倍。

      VOVGSCSP模塊能夠按照一定順序?qū)⒉煌叨鹊木W(wǎng)絡(luò)特征圖鏈接起來(lái),形成一個(gè)深度增加、信息更豐富的特征向量。這種特征融合策略不僅豐富了特征的層次結(jié)構(gòu),還增強(qiáng)了模型對(duì)不同尺度目標(biāo)特征的敏感度與捕捉能力,能夠精確識(shí)別復(fù)雜場(chǎng)景

      下的目標(biāo)特征。VOVGSCSP結(jié)構(gòu)如圖6所示?;贕SConv和VOVGSCSP模型設(shè)計(jì)出的Light_CCFM模塊能夠降低網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性和計(jì)算量,適用于計(jì)算資源受限的環(huán)境,拓寬了模型的應(yīng)用范圍。

      2.4" SSFF與VOVGSCSP特征融合

      在圖像處理領(lǐng)域中,多尺度問(wèn)題一直是研究的熱點(diǎn)與難點(diǎn),它要求網(wǎng)絡(luò)能夠同時(shí)捕捉并整合圖像中細(xì)微到宏觀的復(fù)雜信息。傳統(tǒng)方法采用特征金字塔通過(guò)逐步降采樣構(gòu)建不同分辨率的特征圖,使用求和或拼接等簡(jiǎn)單操作融合特征圖。但在處理圖像中的小目標(biāo)且密集分布等復(fù)雜場(chǎng)景時(shí)顯得力不從心,因?yàn)樗茨艹浞掷媒鹱炙懈鲗犹卣鲌D之間的潛在相關(guān)性。并且采用輕量級(jí)卷積雖然會(huì)降低模型的計(jì)算復(fù)雜度,但也帶來(lái)了精度下降的問(wèn)題。為克服這一局限,有研究提出了一種尺度序列特征融合模塊(SSFF)[17]。SSFF模塊的設(shè)計(jì)在于更高效精確地將深度特征圖的高層次語(yǔ)義信息與淺層特征圖的豐富細(xì)節(jié)信息相結(jié)合,在保證圖像整體結(jié)構(gòu)特征的同時(shí)不丟失任何細(xì)節(jié)信息,以提高模型的檢測(cè)性能。該模塊通過(guò)特定的融合策略,增強(qiáng)了神經(jīng)網(wǎng)絡(luò)在提取不同尺度特征時(shí)的能力。這使得模型在處理具有復(fù)雜尺度變化的對(duì)象時(shí),能夠表現(xiàn)出更高的魯棒性和準(zhǔn)確性。SSFF模塊的原理表達(dá)式如下:

      Fσ(w,h)=Gσ(w,h)×f(w,h);(7)

      Gσ(w,h)=12πσ2e-(w2+h2)/2σ2。(8)

      其中,f(w,h)表示寬度為w、高度為h的2D輸入圖像。Fσ(w,h)通過(guò)使用一系列卷積在2D高斯濾波器Gσ(w,h)下進(jìn)行平滑生成。σ用于卷積的2D高斯濾波器的標(biāo)準(zhǔn)偏差參數(shù)。由于高分辨率特征圖級(jí)別S3包含對(duì)小目標(biāo)檢測(cè)的重要信息,所以SSFF模塊使用最近鄰插值方法調(diào)整S4和S5的大小以適應(yīng)S3級(jí)別的尺寸。為了增加每個(gè)特征層的維度,使用升維操作將特征圖從3D張量轉(zhuǎn)換為4D張量。然后沿著深度維度進(jìn)行拼接形成3D特征圖,再使用3D卷積和SiLU激活函數(shù)完成尺度序列特征提取。

      將SSFF模塊與VOVGSCSP模塊的輸出特征進(jìn)行拼接,生成更豐富的多尺度信息,實(shí)現(xiàn)信息的互補(bǔ),從而提高整體網(wǎng)絡(luò)的性能。SSFF模塊通過(guò)獨(dú)特的三維卷積策略,有效融合不同尺度的特征,提高了模型在處理多尺度問(wèn)題時(shí)的檢測(cè)性能,尤其是在目標(biāo)檢測(cè)任務(wù)中,能夠更精確地捕捉不同大小和形狀的目標(biāo)。

      3" 試驗(yàn)與結(jié)果分析

      3.1" 數(shù)據(jù)集與評(píng)估指標(biāo)

      3.1.1" 數(shù)據(jù)集介紹" 使用自建的草莓?dāng)?shù)據(jù)集,主要來(lái)源于網(wǎng)絡(luò)公開(kāi)數(shù)據(jù)集和大棚實(shí)地拍攝,為了更好地還原實(shí)地采摘時(shí)的復(fù)雜場(chǎng)景,拍攝了傍晚、燈光、晴天、陰天4個(gè)場(chǎng)景下的草莓圖片,結(jié)合公開(kāi)數(shù)據(jù)集圖片篩選得到1 645張圖片,使用Labelimg數(shù)據(jù)標(biāo)注工具對(duì)每張圖片進(jìn)行標(biāo)記。為了增強(qiáng)模型的泛化能力和魯棒性,使用數(shù)據(jù)增強(qiáng)技術(shù),包括隨機(jī)旋轉(zhuǎn)、裁剪、縮放、顏色調(diào)整、平移等方法,對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充,最終得到3 290張圖像,并按照8 ∶1 ∶1的方式分為訓(xùn)練集2 632張、驗(yàn)證集328張、測(cè)試集330張,其中包含成熟、半成熟、未成熟草莓3種類(lèi)別。部分樣本圖片如圖7所示。

      3.1.2" 評(píng)估指標(biāo)" 采用參數(shù)量、模型大小、幀率(幀/s)、召回率(R)、精確度(P)、平均精度均值(mAP)作為草莓成熟度目標(biāo)檢測(cè)的評(píng)估指標(biāo)。

      R=TPTP+FN×100%;(9)

      P=TPTP+FP×100%;(10)

      mAP=1M∑Mk=1AP(k)。(11)

      式中:TP為正樣本被正確識(shí)別為正樣本的個(gè)數(shù);FN為正樣本被錯(cuò)誤識(shí)別為負(fù)樣本的個(gè)數(shù);FP為負(fù)樣本被錯(cuò)誤識(shí)別為正樣本的個(gè)數(shù);AP為平均精度;M為被檢測(cè)樣本數(shù)量。

      3.2" 試驗(yàn)環(huán)境及參數(shù)調(diào)整

      本試驗(yàn)的操作系統(tǒng)是Windows 10,使用PyTorch作為深度學(xué)習(xí)模型的框架,配置如表1所示。具體試驗(yàn)超參數(shù)如下:訓(xùn)練輪次為200輪,批次大小為8,輸入圖像尺寸為640×640,采用AdamW優(yōu)化器,初始學(xué)習(xí)率為0.000 1,權(quán)重衰減系數(shù)為0.000 1。此次試驗(yàn)于2024年6月20號(hào)在江西理工大學(xué)電氣學(xué)院415實(shí)驗(yàn)室完成。

      3.3" 試驗(yàn)結(jié)果與分析

      3.3.1" 消融試驗(yàn)分析" 為了驗(yàn)證改進(jìn)后算法的有效性,本研究使用原始網(wǎng)絡(luò)RT-DETR與改進(jìn)的 SR-DETR 網(wǎng)絡(luò)在草莓?dāng)?shù)據(jù)集上進(jìn)行消融試驗(yàn)。具體流程就是在原有模型的基礎(chǔ)上先單獨(dú)加入改進(jìn)的模塊,對(duì)單個(gè)模塊的性能進(jìn)行驗(yàn)證,然后依次采用如下改進(jìn)措施,如訓(xùn)練時(shí)加入FasterBlock模塊,在頸部使用改進(jìn)的特征融合模塊Lingt_CCFM,特征融合網(wǎng)絡(luò)中加入SSFF模塊。然后逐一比較每次改變后模型的性能,在采用某一改進(jìn)策略就用“√”表示,具體試驗(yàn)效果見(jiàn)表2。從表2可以看出,在 RT-DETR 網(wǎng)絡(luò)采用FasterBlock模塊進(jìn)行特征提取后,召回率、平均精度均值相較于原模型分別提升了0.7、0.5百分點(diǎn),說(shuō)明FasterBlock模塊在對(duì)部分特征進(jìn)行空間提取時(shí)保留了更多的空間信息,提供了模型對(duì)小目標(biāo)的檢測(cè)效果。僅采用Light_CCFM特征融合模塊進(jìn)行特征融合后,平均精度均值提高了0.8百分點(diǎn),表明該結(jié)構(gòu)充分利用不同尺度特征的細(xì)節(jié)信息,提高了多尺度融合特征圖的特征質(zhì)量。僅采用SSFF模塊后,精確度、召回率、平均精度均值分別提高了0.3、2.0、1.2百分點(diǎn),說(shuō)明該模塊具有更強(qiáng)的特征提取能力,能夠充分將高層次語(yǔ)義信息與淺層特征圖的細(xì)節(jié)相結(jié)合,提高模型檢測(cè)性能。在模型的推理性能方面,添加SSFF模塊保留了更多的特征信息,導(dǎo)致模型的參數(shù)量和計(jì)算復(fù)雜度較原模型略微增加,而添加FasterBlock模塊和Light_CCFM模塊雖然模型提升的精度幅度不大,但是都降低了模型的參數(shù)量和計(jì)算復(fù)雜度。在整合所有模塊后,與原模型相比精確度、召回率和平均精度均值分別提高1.6、1.8、1.5百分點(diǎn),提升較為明顯,模型的參數(shù)量、大小和計(jì)算復(fù)雜度分別減少了31.2%、31.1%和23.6%,極大地減小了模型,擴(kuò)大了模型的適用范圍。

      3.3.2" 對(duì)比試驗(yàn)分析" 為了進(jìn)一步驗(yàn)證SR-DETR模型在草莓檢測(cè)方面的優(yōu)越性,將其與主流的YOLO系列模型和Faster-RCNN模型進(jìn)行對(duì)比。所有模型均在同一數(shù)據(jù)集進(jìn)行訓(xùn)練和測(cè)試,且試驗(yàn)環(huán)境和參數(shù)設(shè)置保持一致。具體試驗(yàn)結(jié)果如表3所示。從表3可知,提出的模型的在精確度、召回率、平均精度均值等評(píng)價(jià)指標(biāo)上均優(yōu)于其他算法,分別達(dá)到93.0%、90.2%和91.7%。這充分說(shuō)明了模型在提升檢測(cè)效果方面的有效性,尤其是在草莓檢測(cè)任務(wù)中的表現(xiàn)優(yōu)越。盡管在檢測(cè)速度方面,SR-DETR模型相較于廣泛應(yīng)用于實(shí)時(shí)檢測(cè)場(chǎng)景的YOLO系列而言略有不足,但其速度依然能夠滿足大多數(shù)實(shí)時(shí)檢測(cè)任務(wù)的需求,并且在參數(shù)量、模型大小和計(jì)算復(fù)雜度上均明顯低于其他模型,使得它在計(jì)算資源有限的場(chǎng)景下具有更強(qiáng)的適應(yīng)性,拓寬了它的應(yīng)用范圍。同時(shí),SR-DETR作為一種端到端的檢測(cè)模型,不需要傳統(tǒng)目標(biāo)檢測(cè)算法中的后處理過(guò)程,如非極大抑制等,這不僅降低了模型在應(yīng)用過(guò)程中的部署難度,還保證了檢測(cè)速度的穩(wěn)定性,為模型的部署和應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。

      3.3.3" 可視化分析" 為了進(jìn)一步驗(yàn)證SR-DETR模型的有效性,對(duì)不同模型的檢測(cè)效果進(jìn)行可視化處理,可視化效果圖如圖8所示。圖8-a列中展示了草莓處于傍晚時(shí)的情況。由于圖片的場(chǎng)景較為昏暗并且大棚在燈光的照射下出現(xiàn)反光,使得YOLO v5模型出現(xiàn)漏檢, YOLO v8模型雖然檢測(cè)出

      所有目標(biāo),但將葉片和大棚薄膜錯(cuò)誤識(shí)別為不成熟草莓。而SR-DETR模型具有更強(qiáng)的特征表達(dá)能力和更豐富的判別信息,在這種情況下不僅將所有目標(biāo)識(shí)別出來(lái),還在原模型的基礎(chǔ)上出現(xiàn)檢測(cè)精度提升。圖8-b列中,由于草莓的分布比較密集,導(dǎo)致檢測(cè)難度提升。YOLO v5和RT-DETR模型都出現(xiàn)漏檢的情況,RT-DETR模型更是出現(xiàn)誤檢。YOLO v8和SR-DETR都檢測(cè)出所有目標(biāo),但SR-DETR的檢測(cè)精度更高并更正了原模型的錯(cuò)誤識(shí)別。圖8-c列中,由于枝干和葉片的遮擋面積較多,容易與未成熟的草莓產(chǎn)生混淆,增加模型的檢測(cè)難度。YOLO v5、YOLO v8和RT-DETR模型都將草莓花蕾誤檢為未成熟草莓,但是SR-DETR依靠強(qiáng)大的特征提取能力,正確的識(shí)別出未成熟草莓的位置。在圖8-d列中,由于草莓果實(shí)被葉片嚴(yán)重遮擋,導(dǎo)致特征信息不明顯,使得YOLO v5和RT-DETR模型未能識(shí)別出被遮擋的部分,YOLO v8模型雖然能夠識(shí)別遮擋部分,但卻在圖片左側(cè)出現(xiàn)誤檢,只有SR-DETR模型正確識(shí)別出所有目標(biāo)。因此,SR-DETR在光照不良、目標(biāo)分布密集、環(huán)境特征與目標(biāo)特征相似以及目標(biāo)被嚴(yán)重遮擋等情況下,憑借其強(qiáng)大的特征提取能力和細(xì)節(jié)信息判別能力,能夠準(zhǔn)確檢測(cè)出目標(biāo)的同時(shí)不出現(xiàn)誤檢情況。

      4" 結(jié)論

      本研究針對(duì)機(jī)械化采摘草莓時(shí)機(jī)器難以判斷草莓的不同成熟度,導(dǎo)致容易出現(xiàn)誤檢、漏檢等問(wèn)題,在RT-DETR模型的基礎(chǔ)上,用FasterBlock模塊替換主干網(wǎng)絡(luò)中的BasicBlock模塊以減小模型的參數(shù)量及模型大?。惶鎿Q頸部網(wǎng)絡(luò)中的標(biāo)準(zhǔn)卷積,采用輕量級(jí)卷積GSConv,并用VOVGSCSP模塊替換RepC3模塊,完成對(duì)特征融合模塊CCFM模塊的重新設(shè)計(jì),在減少模型參數(shù)量和計(jì)算復(fù)雜度的同時(shí),提升模型的特征融合能力;在頸部網(wǎng)絡(luò)中添加SSFF模塊,提高模型對(duì)不同尺度特征圖的提取能力,增加模型的魯棒性和準(zhǔn)確性,最終研制出計(jì)算復(fù)雜度低且檢測(cè)精度較高的SR-DETR草莓成熟度目標(biāo)檢測(cè)模型。

      試驗(yàn)表明,在相同試驗(yàn)條件下,改進(jìn)的SR-DETR通過(guò)與Faster-RCNN和YOLO系列模型等進(jìn)行對(duì)比,改進(jìn)的模型在草莓成熟度數(shù)據(jù)集上取得較優(yōu)的效果,相比原模型,精確度、召回率和平均精度值分別提高了1.6、1.8、1.5百分點(diǎn),并且模型的參數(shù)量、模型大小和計(jì)算復(fù)雜度分別下降了31.2%、31.1%和23.6%。改進(jìn)后模型的精確度等均優(yōu)于對(duì)比算法,同時(shí)模型參數(shù)量和模型大小均為最低,為大棚中草莓成熟度快速檢測(cè)提供了方法支持。

      SR-DETR模型尚未對(duì)頸部編碼網(wǎng)絡(luò)進(jìn)行優(yōu)化改進(jìn),未來(lái)可以基于任務(wù)需求來(lái)優(yōu)化頸部編碼網(wǎng)絡(luò),以提高檢測(cè)精度和速度。并且在數(shù)據(jù)集方面,數(shù)據(jù)集里的草莓圖片大都是處于陽(yáng)光或照明條件下,后續(xù)會(huì)收集夜間昏暗環(huán)境下的草莓圖片來(lái)豐富數(shù)據(jù)集,提高模型的泛化性能。

      參考文獻(xiàn):

      [1]李紅丹,帥璐宇,徐雪環(huán),等. 基于改進(jìn)YOLO v7的草莓成熟度檢測(cè)方法[J]. 四川農(nóng)業(yè)大學(xué)學(xué)報(bào),2024,42(3):561-571.

      [2]邱" 暢,田光兆,趙嘉威,等. 基于改進(jìn)YOLO v5的草莓病害識(shí)別[J]. 中國(guó)農(nóng)機(jī)化學(xué)報(bào),2024,45(3):198-204.

      [3]劉莫塵,褚鎮(zhèn)源,崔明詩(shī),等. 基于改進(jìn)YOLO v8-Pose的紅熟期草莓識(shí)別和果柄關(guān)鍵點(diǎn)檢測(cè)[J/OL]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2023:1-12(2023-09-12)[2024-07-10]. http://kns.cnki.net/kcms/detail/11.1964.S.20230911.2034.046.html.

      [4]張暉耀,黃力湘,陳繼清,等. 基于改進(jìn)YOLO v5s的草莓成熟度檢測(cè)算法[J/OL]. 南京農(nóng)業(yè)大學(xué)學(xué)報(bào),2024:1-12(2024-06-13)[2024-07-10]. https://link.cnki.net/urlid/32.1148.S.20240612.1734.006.

      [5]Liu H,Wang X X,Zhao F Y,et al. Upgrading swin-B transformer-based model for accurately identifying ripe strawberries by coupling task-aligned one-stage object detection mechanism[J]. Computers and Electronics in Agriculture,2024,218:108674.

      [6]周" 濤,王" 驥,麥仁貴. 基于改進(jìn)YOLO v8的實(shí)時(shí)菠蘿成熟度目標(biāo)檢測(cè)方法[J]. 華中農(nóng)業(yè)大學(xué)學(xué)報(bào),2024,43(5):10-20.

      [7]陳仁凡,謝" 知,林" 晨. 基于YOLO-ODM的溫室草莓成熟度的快速檢測(cè)[J]. 華中農(nóng)業(yè)大學(xué)學(xué)報(bào),2023,42(4):262-269.

      [8]張小花,李浩林,李善軍,等. 基于EfficientDet-D1的草莓快速檢測(cè)及分類(lèi)[J]. 華中農(nóng)業(yè)大學(xué)學(xué)報(bào),2022,41(6):262-269.

      [9]熊俊濤,韓詠林,王" 瀟,等. 基于YOLO v5-Lite的自然環(huán)境木瓜成熟度檢測(cè)方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2023,54(6):243-252.

      [10]Raj R,Cosgun A,Kulic' D N. Strawberry water content estimation and ripeness classification using hyperspectral sensing[J]. Agronomy,2022,12(2):425.

      [11]胡仕林,陳" 偉,張境鋒,等. 基于改進(jìn)YOLO v5的蘋(píng)果采摘機(jī)器人目標(biāo)檢測(cè)方法[J]. 農(nóng)機(jī)化研究,2024,46(6):48-55.

      [12]趙德安,吳任迪,劉曉洋,等. 基于YOLO深度卷積神經(jīng)網(wǎng)絡(luò)的復(fù)雜背景下機(jī)器人采摘蘋(píng)果定位[J]. 農(nóng)業(yè)工程學(xué)報(bào),2019,35(3):164-173.

      [13]黃" 威,劉義亭,李佩娟,等. 基于改進(jìn)YOLOX-S的蘋(píng)果成熟度檢測(cè)方法[J]. 中國(guó)農(nóng)機(jī)化學(xué)報(bào),2024,45(3):226-232.

      [14]許小偉,陳燕玲,占" 柳,等. 基于改進(jìn)RT-DETR的路面坑槽檢測(cè)模型型[J/OL].武漢科技大學(xué)學(xué)報(bào),2024:1-10(2024-04-26)[2024-06-20]. https://link.cnki.net/urlid/42.1608.N.20240426.1710.002.

      [15]Zhao Y,Lv W,Xu S,et al. Detrs beat yolos on real-time object detection[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle,WA,USA:IEEE,2024:16965-16974.

      [16]Li H L,Li J,Wei H B,et al. Slim-neck by GSConv:a better design paradigm of detector architectures for autonomous vehicles[J]. Journal of Real-Time Image Processing,2024,21:62.

      [17]Kang M,Ting C M,Ting F F,et al. ASF-YOLO:a novel YOLO model with attentional scale sequence fusion for cell instance segmentation[J]. Image and Vision Computing,2024,147:105057.

      [18]Chen J R,Kao S H,He H,et al. Run,dont walk:chasing higher FLOPS for faster neural networks[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Vancouver,BC,Canada:IEEE,2023:12021-12031.

      猜你喜歡
      目標(biāo)檢測(cè)成熟度草莓
      產(chǎn)品制造成熟度在型號(hào)批生產(chǎn)風(fēng)險(xiǎn)管理中的應(yīng)用
      整機(jī)產(chǎn)品成熟度模型研究與建立
      不同成熟度野生水茄果實(shí)的種子萌發(fā)差異研究
      種子(2018年9期)2018-10-15 03:14:04
      剛好夠吃6天的香蕉
      草莓
      視頻中目標(biāo)檢測(cè)算法研究
      軟件(2016年4期)2017-01-20 09:38:03
      行為識(shí)別中的人體運(yùn)動(dòng)目標(biāo)檢測(cè)方法
      移動(dòng)機(jī)器人圖像目標(biāo)識(shí)別
      基于P3電位的目標(biāo)檢測(cè)研究
      科技視界(2016年4期)2016-02-22 13:09:19
      空腹吃草莓
      浦城县| 颍上县| 天峨县| 遂川县| 刚察县| 临江市| 安庆市| 龙山县| 舞钢市| 溧阳市| 株洲县| 满洲里市| 平湖市| 增城市| 和田县| 永福县| 隆回县| 那曲县| 眉山市| 宾阳县| 从化市| 迭部县| 灵山县| 松桃| 襄城县| 涟源市| 五华县| 布拖县| 安溪县| 天津市| 珲春市| 遵化市| 新兴县| 松滋市| 紫金县| 丹棱县| 福海县| 藁城市| 黔西县| 怀柔区| 和田市|