• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于卷積神經(jīng)網(wǎng)絡(luò)的原煙倉庫蟲情檢測算法研究

      2023-10-28 10:24:44姜福煥嚴(yán)祥輝范明登
      計(jì)算機(jī)測量與控制 2023年10期
      關(guān)鍵詞:蟲情蟲害注意力

      姜福煥 ,嚴(yán)祥輝,范明登

      (1.福建省龍巖金葉復(fù)烤有限責(zé)任公司,福建 龍巖 364102;2.廈門煙草工業(yè)有限責(zé)任公司,福建 廈門 361026)

      0 引言

      在原煙倉儲中除了需要對溫度、濕度有極高的要求外,對于倉庫中的蟲情也需要進(jìn)行嚴(yán)格的控制。以最常見的煙草粉螟、煙草甲蟲為例,該類害蟲通過啃食煙葉為生,除了對煙葉的品相、重量造成影響外,其排泄物也會對煙葉的品質(zhì)造成影響[1]。而在對于煙草害蟲的防治上,需要根據(jù)蟲口數(shù)量、密度選擇不同的治理方式,這需要通過監(jiān)測蟲情以獲得相關(guān)數(shù)據(jù)[2]。目前主要的監(jiān)測方式為人工記錄監(jiān)測,受限于倉庫數(shù)量、人工數(shù)量等客觀因素影響,蟲情監(jiān)測流程工作效率低下,且隨著記錄員的工作時間增加,記錄的精度也受到影響[3]。為此,如何提高蟲情監(jiān)測效率是目前行業(yè)中主要研究方向。

      經(jīng)過多年的研究,國內(nèi)外學(xué)者已提出了很多種糧蟲種類信息識別的先進(jìn)技術(shù)方法,其中最具代表性的主要有以下幾種:

      1)聲音檢測法:聲音檢測法是一種通過對糧堆中儲糧害蟲發(fā)出的聲音進(jìn)行數(shù)據(jù)采樣,隨后采用技術(shù)手段對聲音數(shù)據(jù)進(jìn)行檢測、分析,特征提取與匹配,據(jù)此來實(shí)現(xiàn)糧蟲種類識別的方法[4]。

      2)近紅外法:近紅外法是一種通過將近紅外光向不同的儲糧害蟲進(jìn)行照射,然后對所得到的近紅外光頻譜進(jìn)行圖像分析,來區(qū)分不同種類糧蟲的方法。由于不同類別的糧蟲身體成分有差異,其反射和吸收的近紅外光譜也有差異,根據(jù)這些差異化表現(xiàn)便可以分辨出不同種類的儲糧害蟲[5]。

      3)電導(dǎo)率測量法:電導(dǎo)率測量法是基于電導(dǎo)、電壓的物理特性,根據(jù)所測導(dǎo)體水分對電導(dǎo)率的影響,來判斷糧食中的害蟲情況。通常,受到害蟲侵害的糧食濕度要比無蟲害糧食大,濕度越高則電導(dǎo)率越小[6]。

      4)圖像識別法:圖像識別法是指利用攝像手段獲取糧蟲圖像,通過圖像處理、機(jī)器學(xué)習(xí)等技術(shù)提取儲糧害蟲的圖像特征,然后進(jìn)行圖像特征的特征向量分類,從而識別不同儲糧害蟲的類別的方法[7]。

      以上各種方法雖然技術(shù)手段先進(jìn)、豐富,對糧蟲種類的檢測精度在特定環(huán)境下也能達(dá)到要求,但都存在著一定的問題,這些問題阻礙了各方法的進(jìn)一步應(yīng)用與推廣[8]。具體問題如下:

      1)聲音檢測法對采樣設(shè)備周圍環(huán)境的安靜程度要求很高,在有環(huán)境噪聲的情況下,聲音檢測法難以達(dá)到理想的檢測效果。

      2)近紅外法對個體體積差異較大的糧蟲分辨效果較好,但對體積差異小的糧蟲而言,其反射的紅外光譜圖差異化較小,區(qū)分難度大。

      3)由于糧堆電導(dǎo)率的數(shù)值大小與蟲量成正比,所以該法只能檢測糧堆內(nèi)是否有蟲以及蟲量的多少,不能對糧蟲的種類進(jìn)行區(qū)分,實(shí)際意義不大,應(yīng)用場景不多。

      4)關(guān)于圖像識別法,雖然取得了一些進(jìn)展,但大部分研究中使用的儲糧害蟲圖像過于理想化,糧蟲圖像背景簡單,背景色與糧蟲顏色區(qū)分度大,所采用的訓(xùn)練集皆為理想角度、完整、高清晰度的圖像,甚至一張圖像中僅有一只糧蟲,這與實(shí)際的儲糧環(huán)境不符。

      得益于人工智能熱潮,計(jì)算機(jī)視覺技術(shù)在近年有了快速發(fā)展。相比于傳統(tǒng)目標(biāo)檢測算法基于人工先驗(yàn)知識設(shè)計(jì)特定目標(biāo)的特征檢測器,基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法則可通過學(xué)習(xí)樣本數(shù)據(jù)由網(wǎng)絡(luò)自動提取目標(biāo)特征值,在泛化性及魯棒性上相比于傳統(tǒng)算法都有了大幅度的提升進(jìn)步[9]。

      綜上,為解決目前煙葉蟲情管理模式的弊端以及將深度學(xué)習(xí)算法更好地應(yīng)用于煙蟲監(jiān)測任務(wù)中,本文基于深度學(xué)習(xí)算法設(shè)計(jì)了專門適用于原煙倉庫的蟲害檢測網(wǎng)絡(luò),通過對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化,使其在保證高精度的同時兼具有輕量化的特性,通過對蟲情數(shù)據(jù)的實(shí)時采集,實(shí)現(xiàn)原煙倉儲蟲情的預(yù)警與分析,有效提升原煙倉儲煙葉養(yǎng)護(hù)水平,進(jìn)而為倉儲養(yǎng)護(hù)管理供數(shù)據(jù)化的支撐,使其成為煙葉質(zhì)量保障的新亮點(diǎn)。

      1 理論分析

      為了提高對小目標(biāo)的檢測精度,本文主要采用了Transformer模塊搭建特征提取網(wǎng)絡(luò),依靠Transformer的全局自注意力機(jī)制,實(shí)現(xiàn)對小目標(biāo)特征的加權(quán)提取。Transformer最初應(yīng)用于自然語言領(lǐng)域中,而通過對其輸入端進(jìn)行結(jié)構(gòu)改造后,其可應(yīng)用于計(jì)算機(jī)視覺領(lǐng)域[10]。標(biāo)準(zhǔn)的Vision Transformer模塊結(jié)構(gòu)及對數(shù)據(jù)特征的處理流程如圖1所示。

      圖1 Vision Transformer模塊結(jié)構(gòu)

      2 網(wǎng)絡(luò)設(shè)計(jì)

      結(jié)合網(wǎng)絡(luò)模型的應(yīng)用場景,模型需要盡可能地輕量化,以盡可能滿足在多種設(shè)備上嵌入運(yùn)行,其次為檢測的目標(biāo)具有小、密等特點(diǎn),不易于檢測[12]。從第一方面考慮本文選用了單階段的檢測網(wǎng)絡(luò),通過精簡的檢測流程達(dá)到快速的檢測的目的[13]。而對于目標(biāo)小而密的檢測難點(diǎn),單階段網(wǎng)絡(luò)具有一定的不足性[14]。綜上,對于蟲害檢測網(wǎng)絡(luò)的設(shè)計(jì)本文主要圍繞模型輕量化與提升密集目標(biāo)檢測精度兩方面進(jìn)行。在網(wǎng)絡(luò)的設(shè)計(jì)中,本文將Transformer模塊與標(biāo)準(zhǔn)的卷積模塊進(jìn)行組合,構(gòu)建了魯棒性更強(qiáng)的特征提取網(wǎng)絡(luò),網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

      圖2 特征提取網(wǎng)絡(luò)結(jié)構(gòu)

      本文所設(shè)計(jì)的結(jié)構(gòu)為“Conv+Transformer+Conv”的組合形式,該結(jié)構(gòu)的優(yōu)勢在于整合了卷積網(wǎng)絡(luò)的局部感知性與Transformer的全局感知型,使得網(wǎng)絡(luò)整體對于目標(biāo)具有更高的敏感性,降低漏檢、誤檢的概率。

      2.1 卷積網(wǎng)絡(luò)模塊設(shè)計(jì)

      在主干網(wǎng)絡(luò)的首尾部本文采用了標(biāo)準(zhǔn)卷積層進(jìn)行構(gòu)建,由于卷積對于圖片像素更加敏感,因此在網(wǎng)絡(luò)的輸入端部分采用標(biāo)準(zhǔn)卷積能夠?qū)D片快速轉(zhuǎn)換為包含有低級形態(tài)的特征的特征圖,使得后續(xù)的Transformer模塊不需要進(jìn)行特征轉(zhuǎn)換可直接進(jìn)行全局特征的提取[15];而在網(wǎng)絡(luò)的尾部,為了銜接檢測器的輸入仍采用了卷積層對特征圖進(jìn)行處理[16]。在首尾模塊的設(shè)計(jì)中本文基于特征圖金字塔結(jié)構(gòu)進(jìn)行優(yōu)化在原基礎(chǔ)上加入通道注意力機(jī)制,利用了FPN網(wǎng)絡(luò)編解碼及特征傳遞的特性,以提升特征圖的豐富性。特征金字塔網(wǎng)絡(luò)(FPN,feature pyramid network)是一種用于計(jì)算機(jī)視覺任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。如圖3所示,F(xiàn)PN可以從多個尺度的特征圖中提取特征信息,從而提高模型的性能和魯棒性。FPN的主要組成部分包括:1)自底向上的特征提取網(wǎng)絡(luò),從輸入圖像中提取多個尺度的特征圖,每個特征圖對應(yīng)不同的物體大小和尺度;2)自頂向下的特征融合網(wǎng)絡(luò),將高層特征圖與低層特征圖進(jìn)行融合,以便在不同尺度上提取更加豐富和準(zhǔn)確的特征信息;3)橫向連接,在特征融合的過程中,F(xiàn)PN還通過橫向連接將相鄰尺度的特征圖進(jìn)行連接,從而進(jìn)一步提高特征的準(zhǔn)確性和豐富性。FPN在計(jì)算機(jī)視覺任務(wù)中的應(yīng)用非常廣泛,例如目標(biāo)檢測、語義分割和實(shí)例分割等任務(wù)。通過使用FPN,可以使模型在不同尺度上都能夠有效地提取特征信息,從而提高模型的性能和魯棒性。

      圖3 特征金字塔網(wǎng)絡(luò)示意圖

      優(yōu)化后的網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。

      圖4 通道注意力FPN網(wǎng)絡(luò)

      在網(wǎng)絡(luò)的首部卷積層以編碼的形式通過下采樣的形式進(jìn)行組合逐層縮小特征圖,而在尾部則是通過上采樣以解碼的形式逐層放大特征圖。由于本文所檢測的目標(biāo)較小,特征圖尺寸越大目標(biāo),所能在特征圖上體現(xiàn)的特征信息也越多,也利于檢測,因此在主干網(wǎng)絡(luò)的尾部采用上采樣卷積將特征圖擴(kuò)大。同時,在網(wǎng)絡(luò)的首部與尾部本文設(shè)計(jì)了特征圖通道注意力機(jī)制映射模塊,將淺層網(wǎng)絡(luò)輸出的特征圖映射輸入到深層網(wǎng)絡(luò)所輸出的特征圖中,對特征圖種的信息進(jìn)行補(bǔ)充。這種傳遞方式提高了對于特征信息的復(fù)用,但同樣也會將背景等無效信息傳輸?shù)缴顚泳W(wǎng)絡(luò),引入一定的噪聲干擾。為了消除背景信息的噪聲干擾,本文在鏈接通道中加入了通道注意力機(jī)制模塊,通過對特征圖的通道額外增加權(quán)值,以表示不同的通道與特征圖中目標(biāo)信息的相關(guān)性,權(quán)值越大說明相關(guān)性越強(qiáng),通過加權(quán)的方式對噪聲特征的通道進(jìn)行降權(quán)抑制,對包含目標(biāo)特征的通達(dá)進(jìn)行提權(quán)增強(qiáng),所設(shè)計(jì)的通道注意力機(jī)制如圖5所示。

      2.2 Transformer模塊設(shè)計(jì)

      Transformer模塊的引入主要為補(bǔ)充網(wǎng)絡(luò)對于全局信息不夠敏感的弊端。卷積模塊側(cè)重于對局部特征進(jìn)行提取,如果依靠卷積模塊獲取全局特征需要通過多層網(wǎng)絡(luò)迭代縮小特征圖,使得在相同感受野大小下能夠覆蓋更多特征圖區(qū)域[16]。而采用Transformer模塊,如第一小結(jié)所述其能夠采用少量的層結(jié)構(gòu)構(gòu)建特征圖的全局特征信息。但由于標(biāo)準(zhǔn)的Transformer模塊需要對特征圖劃分的每一塊特征區(qū)域進(jìn)行關(guān)聯(lián)性計(jì)算,需要消耗較大的計(jì)算資源,不利于網(wǎng)絡(luò)的輕量化構(gòu)建[17]。為解決標(biāo)準(zhǔn)Transformer模塊計(jì)算復(fù)雜,參數(shù)量多的問題,本文采用了稀疏Transformer模塊進(jìn)行構(gòu)建。

      稀疏Transformer模塊的功能實(shí)現(xiàn)主要由“局部-全局-局部”三個子模塊組成實(shí)現(xiàn),先將局部相似特征進(jìn)行整合,之后將整合的特征塊進(jìn)行全局關(guān)聯(lián)性計(jì)算,最后在將計(jì)算結(jié)果重新分布的局部特征塊中。每個稀疏模塊的結(jié)構(gòu)如圖6所示。

      圖6 稀疏Transformer模塊

      如圖6所示,為稀疏Transformer模塊的結(jié)構(gòu)及特征圖在其對數(shù)據(jù)的計(jì)算過程:首先輸入的特征圖先進(jìn)行Patch Embed塊分割操作,將特征圖分為多個大小為K×K的塊區(qū)域,完成分割后會由局部特征聚合模塊對每個塊區(qū)域的特征進(jìn)行聚合,該過程如圖中1號虛線框所示,特征聚合模塊采用了K×K大小的深度可分離卷積進(jìn)行構(gòu)建,其將特征塊聚合為一個像素點(diǎn)進(jìn)行表示,即該點(diǎn)代表了塊特征(以上操作將特征圖的大小進(jìn)行K×K倍的縮小,能夠減小后續(xù)自注意力計(jì)算的參數(shù)量及計(jì)算量)。之后由前饋網(wǎng)絡(luò)將這些特征點(diǎn)進(jìn)行組合,并再次進(jìn)行Patch Embed操作,將每個特征點(diǎn)重新分割并通過編碼轉(zhuǎn)換為一維向量以進(jìn)行Transformer自注意力計(jì)算。對于每個全局注意力權(quán)值的計(jì)算,本文采用了稀疏注意力的計(jì)算方式,該方式如圖中2號虛線框所示,原特征圖在每個K×K大小的區(qū)域內(nèi)由一個特征點(diǎn)進(jìn)行稀疏表示,之后僅對這些特征點(diǎn)進(jìn)行自注意力計(jì)算,獲取點(diǎn)與點(diǎn)之間的特征關(guān)聯(lián)度。最后通過局部傳播模塊將獲取到的注意力權(quán)值進(jìn)行轉(zhuǎn)發(fā),使得該權(quán)值覆蓋整張?zhí)卣鲌D。局部傳播的實(shí)現(xiàn)為通過轉(zhuǎn)置卷積將具有注意力權(quán)值的特征點(diǎn)轉(zhuǎn)換為特征塊,即每個特征塊共享一個注意力權(quán)值,轉(zhuǎn)置后即可獲得每個塊與塊之間的關(guān)聯(lián)度,在通過映射的方式將輸入稀疏Transformer模塊的特征圖與轉(zhuǎn)置后的特征圖進(jìn)行融合以獲得空間層面上的注意力權(quán)值。通過這種方式能夠在保證獲取全局特征的同時,有效降低網(wǎng)絡(luò)的計(jì)算量,并且可以通過控制分割特征圖區(qū)域大小的K值決定參數(shù)的減小倍數(shù),使其具有靈活性。

      綜上,網(wǎng)絡(luò)整體的檢測流程為輸入的圖片首先由卷積模塊的編碼器進(jìn)行目標(biāo)形態(tài)特征的提取及特征圖的快速構(gòu)建;之后由稀疏Transformer模塊組對特征圖進(jìn)行空間層面上的全局自注意力計(jì)算,獲取目標(biāo)在特征圖中的分布關(guān)系。完成之后輸入到卷積模塊的解碼器中,將特征圖進(jìn)行還原,同時在卷積模塊的編碼器會將其輸出的特征圖通過通道注意力機(jī)制映射至解碼器中,將低級形態(tài)特征與高級語義特征進(jìn)行融合,提高了特征圖的豐富性。最后,本文采用了目前單階段網(wǎng)絡(luò)中檢測級精度較高的YOLO檢測器對輸出的特征圖進(jìn)行檢測,獲取目標(biāo)在圖中的數(shù)量及位置。由于網(wǎng)絡(luò)的設(shè)計(jì)方案以輕量化為目的,且結(jié)合當(dāng)下熱門的Transformer多頭自注意力機(jī)制,并采用YOLO檢測器進(jìn)行檢測,因此將優(yōu)化后的網(wǎng)絡(luò)命名為YOLO TLite以便后續(xù)實(shí)驗(yàn)進(jìn)行區(qū)分。

      3 實(shí)驗(yàn)及數(shù)據(jù)分析

      3.1 數(shù)據(jù)采集

      為驗(yàn)證本文所構(gòu)建網(wǎng)絡(luò)適用于煙草倉儲間的蟲情檢測任務(wù),本文通過對倉儲間內(nèi)的真實(shí)蟲情環(huán)境進(jìn)行拍照采樣,制作了煙草粉螟、煙草甲兩類蟲害的數(shù)據(jù)集,所采樣圖片如圖7所示。

      圖7 采樣示例圖

      對于數(shù)據(jù)集的樣本制作,本文通過拍攝誘蟲板上的蟲害為目標(biāo)樣本,為提升模型的泛化性與增強(qiáng)其魯棒性,在拍攝的過程中,本文選擇了不同蟲害密度的誘蟲板已經(jīng)通過控制拍攝的距離獲取不同大小的樣本目標(biāo)。經(jīng)統(tǒng)計(jì),本文共采集圖片1 638張,煙草粉螟樣本數(shù)8 718個、煙草甲蟲樣本數(shù)6 539個。

      3.2 評價指標(biāo)

      對于模型性能的評估,本文結(jié)合混淆矩陣采用以下量化指標(biāo)進(jìn)行客觀評估:

      混淆矩陣中共有TP、TN、FP、FN四個參數(shù),每個參數(shù)所代表的含義分別如下:

      TP:對于正樣本,模型預(yù)測正確的個數(shù);

      TN:對于負(fù)樣本,模型預(yù)測正確的個數(shù);

      FP:對于負(fù)樣本,模型錯誤預(yù)測為正樣本的個數(shù);

      FN:對于正樣本,模型錯誤預(yù)測為負(fù)樣本的個數(shù)。

      精確率(Precision):評估模型對于目標(biāo)類別的分類精度;

      召回率(Recall):評估模型對于目標(biāo)總數(shù)的查全能力;

      F1綜合得分:評估模型在均衡精確率與召回率情況下的綜合性能。

      檢測精度均值(average precision):評估某一類別的檢測置信度;

      平均檢測精度均值(mean average precision):評估模型的綜合檢測置信度;

      模型復(fù)雜度(FLOPs):模型浮點(diǎn)運(yùn)算計(jì)算量,評估模型復(fù)雜度;

      檢測速度(FPS):幀率,評估模型每秒能夠檢測圖片的數(shù)量。

      3.3 數(shù)據(jù)分析

      對于模型性能的分析,本文以目前在輕量化網(wǎng)絡(luò)領(lǐng)域中應(yīng)用較為常用的YOLO v5s為參照對比模型,并將本文對于主干網(wǎng)絡(luò)的優(yōu)化方法分別移植至YOLO v5s上進(jìn)行消融實(shí)驗(yàn);并且為驗(yàn)證本文所設(shè)計(jì)稀疏Transform模塊在該任務(wù)中的適用性,本文選取了標(biāo)準(zhǔn)Transformer模塊與之進(jìn)行對比。首先對網(wǎng)絡(luò)的基礎(chǔ)性能進(jìn)行比較分析,對比結(jié)果如表1所示。

      表1 基礎(chǔ)性能對比

      如表1所示,在模型1的測試結(jié)果中,YOLO v5s模型對于目標(biāo)辨別的精確率較低,分析其原因主要為網(wǎng)絡(luò)結(jié)構(gòu)較為精簡,無法對目標(biāo)特征記性充分提取造成。而模型2、模型3與模型4相比較與模型1 YOLO v5s均有一定的提升,分析其原因?yàn)槟P?采用了FPN結(jié)合通道注意力機(jī)制進(jìn)行高低特征融合,在網(wǎng)絡(luò)深層融入低級形態(tài)特征;模型3與模型4采用多頭自注意力機(jī)制Transformer模型能夠?qū)μ卣鲌D的全局特征進(jìn)行提取,與卷積模塊所提取到的局部特征進(jìn)行互補(bǔ)。但對于模型4采用的標(biāo)準(zhǔn)Transformer模塊與模型3所采用本文所設(shè)計(jì)的稀疏Transformer模塊相比,在檢測精度與召回率賞要略低于模型3,分析其原因主要由于標(biāo)準(zhǔn)Transformer模塊對于特征圖的塊區(qū)域分割為等分,各個塊區(qū)域無關(guān)聯(lián),對于每個塊區(qū)域的特征關(guān)聯(lián)性相較于稀疏Transformer模塊的計(jì)算方式更低,使得所提取到的特征信息在全局性上與模型3相比有所欠缺。模型5與模型6采用了本文所設(shè)計(jì)的網(wǎng)絡(luò)結(jié)構(gòu),兩個模型的不同主要在于所采用的Transformer模塊不同,結(jié)合模型3與模型4的對比分析,模型6采用標(biāo)準(zhǔn)Transformer模塊與模型5相比,在檢測性能上也略低于模型5。以上這5個網(wǎng)絡(luò)均能提升網(wǎng)絡(luò)特征的豐富度以提升分類精度。而對于召回率,由于誘蟲板的背景為白色,蟲害為黑色有較大的色差易于區(qū)分前景與背景,故各網(wǎng)絡(luò)均有出色表現(xiàn)。綜上模型5 YOLO TLite網(wǎng)絡(luò)結(jié)合了通道注意力機(jī)制與稀疏Transformer模塊,在分類精度上相比于其他網(wǎng)絡(luò)都有明顯提升,在F1綜合得分指標(biāo)也反映了YOLO TLite的檢測性能更優(yōu)。

      在表2的檢測精度對比中,同表1的數(shù)據(jù)相關(guān)聯(lián),特征的豐富性與全面性同樣對檢測精度有一定的影響。對比結(jié)果驗(yàn)證了本文所設(shè)計(jì)的模型5 YOLO TLite網(wǎng)絡(luò)在檢測精度上同樣優(yōu)于其他網(wǎng)絡(luò)模型。

      表2 檢測精度對比

      在表3中,主要對模型的輕量化性能進(jìn)行比較。FLOPs指標(biāo)為客觀評估指標(biāo),F(xiàn)PS數(shù)據(jù)則與模型搭載的硬件參數(shù)相關(guān),本文選用了兩種硬件環(huán)境進(jìn)行對比測試?;贔LOPs指標(biāo),模型2由于在原網(wǎng)絡(luò)的基礎(chǔ)上引入了輕量化通道注意力機(jī)制,因此其計(jì)算量相比于模型1 YOLO v5s有一定的增加;而模型3采用稀疏Transformer模塊對原網(wǎng)絡(luò)殘差卷積模塊進(jìn)行替換,且模塊使用數(shù)量與原先相比有所減少,因此在計(jì)算量上低于YOLO v5s。但模型4采用標(biāo)準(zhǔn)Transformer模塊,由于Transformer模塊計(jì)算的復(fù)雜度,使得模型的計(jì)算量要高于模型1,在計(jì)算速度同樣低于模型1,結(jié)合表1與表2的檢測性能對比結(jié)果,雖然標(biāo)準(zhǔn)Transformer模塊與稀疏Transformer模塊精度相似,但在計(jì)算量與檢測速度上有明顯差距。在模型5 YOLO TLite網(wǎng)絡(luò)結(jié)構(gòu)中,其另外將檢測器的數(shù)量由3個改為1個,同時結(jié)合輕量化通道注意力機(jī)制與稀疏Transformer模塊,因此其計(jì)算量整體也要低于YOLO v5s。反之模型6采用了標(biāo)準(zhǔn)Transformer模塊,雖然網(wǎng)絡(luò)做了一定的精簡,但由于模塊計(jì)算的復(fù)雜度使得計(jì)算量仍要要高于YOLO v5s。實(shí)際檢測速度對比,以上網(wǎng)絡(luò)在搭載由GPU的硬件設(shè)備中均能達(dá)到實(shí)時檢測效果,而在CPU上也能滿足間時檢測。

      表3 檢測速度對比

      以上消融實(shí)驗(yàn)證明了相比于優(yōu)化前的YOLO網(wǎng)絡(luò),本文所設(shè)計(jì)的YOLO TLite網(wǎng)絡(luò)在倉儲煙蟲檢測中更具有優(yōu)勢。并且所設(shè)計(jì)的稀疏Transformer模塊與標(biāo)準(zhǔn)Transformer模塊相比也更適用于該場景,在具有高檢測精度的同時,兼具了輕量化的特性。

      為進(jìn)一步驗(yàn)證YOLO TLite在該任務(wù)中的通用性,本文選用了目前主流的目標(biāo)檢測算法PANet、Cascade RCNN、Detection Transformer及Swin Transformer在本文所制作數(shù)據(jù)集上進(jìn)行訓(xùn)練測試,并與YOLO TLite進(jìn)行對比,對比結(jié)果如表4所示。

      表4 多類模型對比測試

      在表4中,SENet與CBAM Net為卷積神經(jīng)網(wǎng)絡(luò),Detection Transformer與SWin Transformer為Transformer模型網(wǎng)絡(luò)。測試結(jié)果CBAM Net因同時采用了空間加權(quán)注意力機(jī)制與通道加權(quán)注意力機(jī)制提高了模型對于目標(biāo)的感知能力、SWin Transformer網(wǎng)絡(luò)通過滑動分割計(jì)算的方式提高了Transformer模型中每個token的交互性,這兩個網(wǎng)絡(luò)模型在該任務(wù)中同樣具有較好的魯棒性,但與本文的YOLO TLite相比,在檢測性能與檢測速度上能仍有一定的差距,特別是在檢測速度上,由于Transformer模型的計(jì)算較為復(fù)雜整體的計(jì)算量高,使得模型在檢測速度上較慢。而對于SENet與Detection Transformer網(wǎng)絡(luò)在網(wǎng)絡(luò)性能上相比與其他網(wǎng)絡(luò)均較有一定差距,主要體現(xiàn)在于SENet僅采用了通道加權(quán)注意力機(jī)制,對于目標(biāo)在特征圖空間上的分布定位感知能力較弱,而Detection Transformer則缺乏了特征圖分割后token與token間的關(guān)聯(lián)性。綜上,YOLO TLite綜合了卷積模型與Transformer模型的特點(diǎn),在保證檢測精度的同時,仍具有較快的檢測速度。同時YOLO TLite模型對于不同距離、密度場景下的實(shí)際檢測結(jié)果如圖8所示,均能夠?qū)D中的蟲害目標(biāo)正確框選。

      圖8 實(shí)際檢測效果圖

      綜上實(shí)驗(yàn),驗(yàn)證了本文所設(shè)計(jì)的YOLO TLite在煙草倉儲間蟲害檢測任務(wù)中兼具有較高的檢測精度與速度,適用于蟲情監(jiān)測模型中。對于監(jiān)測模型的實(shí)現(xiàn)方案,本文主要通過計(jì)算蟲害密度進(jìn)行預(yù)警模型構(gòu)建,通過在倉促間內(nèi)鋪設(shè)多個0.5的誘捕區(qū),使用YOLO TLite模型計(jì)算區(qū)域內(nèi)蟲害個數(shù),以得出相應(yīng)密度等級。為驗(yàn)證模型的實(shí)用性,本文在區(qū)域內(nèi)設(shè)置了不同蟲害個數(shù)以及在不同的外界光照環(huán)境下進(jìn)行檢測實(shí)驗(yàn),測試結(jié)果分別如圖9所示。

      圖9 標(biāo)準(zhǔn)光照條件計(jì)數(shù)準(zhǔn)確性檢測

      首先圖9的測試結(jié)果來源于正常光照條件下的檢測結(jié)果。圖中,對相同區(qū)域面積大小下,不同蟲害個數(shù)的平均計(jì)數(shù)精度對比結(jié)果上看,當(dāng)蟲害個數(shù)低于50時,模型的計(jì)數(shù)精度較高;而蟲害個數(shù)在120只以上時,密度較高,使得模型的計(jì)數(shù)精度有一定幅度的下降。但蟲害個數(shù)在200只左右時,模型的計(jì)數(shù)精度仍有0.924,網(wǎng)絡(luò)模型在整體魯棒性強(qiáng),能夠用于統(tǒng)計(jì)蟲數(shù)。

      其次,本文模擬了在夜間或照明條件不充足情況下的檢測結(jié)果,以證明模型在不同環(huán)境下對于不同密度的蟲害仍具有出色的檢測性能,如圖10所示。由于當(dāng)光照條件不夠充足時,畫面會出現(xiàn)噪點(diǎn),且蟲害自身呈現(xiàn)灰黑色,因此檢測結(jié)果相比于標(biāo)準(zhǔn)光照條件下略微有點(diǎn)下降,其檢測精度的“拐點(diǎn)”出現(xiàn)于蟲害個數(shù)為80只左右,但當(dāng)蟲害個數(shù)大于180只時檢測精度仍達(dá)0.90以上,說明模型能夠應(yīng)付光照條件不足等復(fù)雜環(huán)境下的檢測任務(wù)。

      圖10 弱光條件計(jì)數(shù)準(zhǔn)確性檢測

      4 結(jié)束語

      本文針對于煙草行業(yè)倉儲環(huán)節(jié)中蟲情檢測難的問題,提出了一種基于深度學(xué)習(xí)的解決方案。該方案主要依靠深度學(xué)習(xí)網(wǎng)絡(luò)計(jì)算單位面積內(nèi)的蟲害個數(shù),進(jìn)而換算出密度以得到相應(yīng)蟲情數(shù)據(jù)。為此本文主要基于Transformer模塊優(yōu)化設(shè)計(jì)了YOLO TLite輕量化檢測網(wǎng)絡(luò),通過輕量化的結(jié)構(gòu)設(shè)計(jì),同時增強(qiáng)主干網(wǎng)絡(luò)的特征提取能力,以提高檢測精度。經(jīng)實(shí)驗(yàn)驗(yàn)證,本文所設(shè)計(jì)的網(wǎng)絡(luò)具有較強(qiáng)的魯棒性,在不同密度環(huán)境下均能以較高的精度計(jì)算出蟲害個數(shù),具有一定的使用性能。

      猜你喜歡
      蟲情蟲害注意力
      虞以新:鑒定“蟲情”的大偵探
      學(xué)與玩(2022年9期)2022-10-31 02:53:28
      讓注意力“飛”回來
      桃樹主要蟲害及防治方法
      河北果樹(2020年4期)2020-11-26 06:05:04
      基于AI圖像識別的煙草制品蟲情監(jiān)測系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
      不用農(nóng)藥也能治蟲害
      平山縣2018年性誘劑和蟲情燈誘測棉鈴蟲成蟲效果比較
      我國病蟲害監(jiān)測預(yù)警系統(tǒng)取得新突破
      淺析白三葉的蟲害防治
      行道樹香櫞主要蟲害及其防治
      “揚(yáng)眼”APP:讓注意力“變現(xiàn)”
      傳媒評論(2017年3期)2017-06-13 09:18:10
      SHOW| 台中县| 金乡县| 甘洛县| 宜良县| 刚察县| 集安市| 苍山县| 中超| 鄯善县| 交口县| 宿州市| 旬阳县| 大庆市| 阜宁县| 衡阳县| 吐鲁番市| 灯塔市| 右玉县| 保德县| 彭水| 伊吾县| 儋州市| 仁布县| 简阳市| 郴州市| 阳山县| 西畴县| 宣汉县| 桂林市| 乐业县| 文昌市| 岱山县| 静海县| 祁阳县| 南康市| 禄劝| 琼海市| 宝丰县| 包头市| 潼南县|