• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于細?;卣鞲兄乃履繕?biāo)檢測算法

      2024-01-01 00:00:00陳曉楊琪姚海洋王海燕
      陜西科技大學(xué)學(xué)報 2024年4期
      關(guān)鍵詞:注意力機制目標(biāo)檢測

      摘 要:針對水下光學(xué)圖像細節(jié)模糊以及水下生物遮擋導(dǎo)致目標(biāo)檢測精度低的問題,提出一種基于細?;卣鞲兄乃履繕?biāo)檢測算法.該算法基于YOLO(You Only Look Once)v7網(wǎng)絡(luò)結(jié)構(gòu),首先,提出ELSA(ELAN-SimAM)模塊,提升主干網(wǎng)絡(luò)對水下圖像模糊細節(jié)的特征感知;其次,提出多梯度聚合結(jié)構(gòu)(Multi-gradient Aggregation Structure),實現(xiàn)特征信息多梯度高效融合,并在頸部網(wǎng)絡(luò)中嵌入輕量化的三重注意力機制(Triplet Attention),使特征信息跨維度交互融合,減少由水下生物遮擋導(dǎo)致的漏檢問題.實驗結(jié)果表明,所提出的算法適用于水下復(fù)雜環(huán)境下的目標(biāo)檢測,可以在較短時間內(nèi)實現(xiàn)目標(biāo)定位與檢測,且檢測精度較高.

      關(guān)鍵詞:目標(biāo)檢測; YOLOv7; 多路徑融合; 注意力機制

      中圖分類號:TP391.9

      文獻標(biāo)志碼: A

      Underwater target detection method based on fine-grained feature perception

      CHEN Xiao1, YANG Qi1, YAO Hai-yang1, WANG Hai-yan1,2

      (1.School of Electronic Information and Artificial Intelligence, Shaanxi University of Science amp; Technology, Xi′an 710021, China; 2.School of Marine Science and Technology, Northwestern Polytechnical University, Xi′an 710072, China)

      Abstract:Aiming at the problem of low target detection accuracy due to the blurring of details in underwater optical images and the occlusion of underwater organisms,an underwater target detection algorithm based on fine-grained feature perception is proposed.The algorithm is based on the YOLO (You Only Look Once) v7 network structure,which firstly proposes the ELSA(ELAN-SimAM) module to enhance the feature perception of the backbone network on the blurred details of the underwater image.Secondly,it proposes the Multi-gradient Aggregation Structure (MAS) to realize the efficient fusion of the feature information across multiple gradients,and embeds a lightweight Triplet Attention mechanism to enable cross-dimensional interactive fusion of features and reduce the leakage detection problem caused by underwater biological occlusion.The experimental results show that the proposed algorithm is suitable for target detection under the underwater complex environment,and can realize target localization and detection in a short time with high detection accuracy.

      Key words:target detection; YOLOv7; multipath fusion; attention mechanism

      0 引言

      向海圖強,逐夢深藍.海洋作為我國新時代發(fā)展的戰(zhàn)略要地,是國家經(jīng)濟發(fā)展格局的重要支撐,推動其高質(zhì)量發(fā)展對于建設(shè)海洋強國意義重大[1].其中,新型海洋漁業(yè)發(fā)展模式—“海洋牧場”是海洋經(jīng)濟建設(shè)的重要組成部分,但由于全球氣候變化以及海洋生物資源短缺,人們致力于探求智能化海洋牧場,將人工智能等創(chuàng)新型技術(shù)與其相結(jié)合是一種重要途徑.目前海洋牧場大多利用水下攝像設(shè)備來獲取生物圖像以實現(xiàn)對水下生物的監(jiān)測以及環(huán)境監(jiān)控,由于受到水體吸收和散射作用的影響,水下光學(xué)圖像呈現(xiàn)出嚴(yán)重的色彩畸變和細節(jié)丟失等問題,而且水下生物目標(biāo)由于生活習(xí)性、環(huán)境的因素,使得它們的個體較小且分布較為密集,彼此之間存在遮擋、重疊,使得漏檢率較高,極大地降低了水下圖像的質(zhì)量及對目標(biāo)的檢測能力.因此,對于水下生物目標(biāo)的檢測而言,有效地增強水下目標(biāo)特征的表達能力,有助于提高水下目標(biāo)檢測精度.

      傳統(tǒng)的目標(biāo)檢測算法通常分為三個步驟,首先在給定的圖像上利用滑動窗口選擇一些候選區(qū)域,然后對該區(qū)域進行特征提取,最后使用訓(xùn)練的分類器進行分類.但是由于區(qū)域選擇時間復(fù)雜度高,其次水下被檢測的目標(biāo)形態(tài)多樣且在面對水下復(fù)雜環(huán)境時,人工提取水下圖像特征已經(jīng)無法滿足需求,傳統(tǒng)算法對于規(guī)?;幚硖卣髂芰Σ蛔?目前深度學(xué)習(xí)算法可以較好的彌補這些缺點,已經(jīng)逐漸成為水下目標(biāo)檢測領(lǐng)域的主流,其中應(yīng)用較多的是以YOLO[2-7](You Only Look Once)系列為代表的基于回歸的一階段算法.

      在水下目標(biāo)檢測任務(wù)中,一些學(xué)者已經(jīng)進行了一些研究.Yi等[8]提出了一種基于改進YOLOv7[7]的水下小目標(biāo)檢測算法,通過結(jié)合SENet注意機制、增強FPN網(wǎng)絡(luò)以及EIoU損失函數(shù)來降低模型的復(fù)雜性,實現(xiàn)了水下目標(biāo)檢測時間和精度之間良好的平衡;Liu等[9]基于YOLOv7網(wǎng)絡(luò)提出ACmixBlock模塊,結(jié)合全局注意力機制增強網(wǎng)絡(luò)的特征提取能力,有助于網(wǎng)絡(luò)捕獲更多信息特征,提高了水下目標(biāo)的檢測精度;Hua等[10]針對傳統(tǒng)目標(biāo)檢測器在檢測時由于水下環(huán)境噪聲和物體尺度變化等導(dǎo)致目標(biāo)特征難以提取的問題,提出了一種特征增強和漸進式動態(tài)聚合策略,并基于YOLOv5進行水下目標(biāo)檢測,提升了模型的泛化能力和檢測精度;安志強等[11]以真實海底養(yǎng)殖環(huán)境下的海珍品為研究對象,采用性能優(yōu)異的YOLOv7算法實現(xiàn)海珍品目標(biāo)檢測器,提出一種基于視頻多目標(biāo)跟蹤的多類別海珍品計數(shù)方法.該研究方法可有效幫助水產(chǎn)養(yǎng)殖企業(yè)掌握水下海珍品數(shù)量;Chen等[12]提出一種對于水下小目標(biāo)的檢測算法,通過實驗確定CBAM的最佳位置來獲得細粒度的語義信息,結(jié)合Conv2Former作為水下模糊圖像網(wǎng)絡(luò)的Neck組件,并且應(yīng)用了Wise-IoU,結(jié)果表明可以在水下復(fù)雜環(huán)境下實現(xiàn)較高的檢測準(zhǔn)確度,但融合CBAM、改進頸部模塊操作都會給模型引入額外參數(shù)量.

      目前,水下目標(biāo)檢測任務(wù)還存在以下問題:水下光學(xué)圖像大多因為顏色失真、對比度低而導(dǎo)致水下目標(biāo)細節(jié)模糊且可見度降低,同時,水下生物目標(biāo)分布密集,彼此之間相互遮擋和重疊,使特征信息耦合,導(dǎo)致漏檢率較高.針對上述問題,為了增強網(wǎng)絡(luò)模型對細?;卣鞯母兄芰Γ疚奶岢隽嘶诩毩;卣鞲兄乃履繕?biāo)檢測算法.首先,提出ELSA(ELAN-SimAM)結(jié)構(gòu),使網(wǎng)絡(luò)能夠有針對性地關(guān)注不同層級卷積所提取的深層特征,減少由于水下圖像低對比度而導(dǎo)致生物細節(jié)模糊的問題.其次,為減少水下生物由于遮擋導(dǎo)致漏檢的問題,本文提出多梯度高效聚合網(wǎng)絡(luò)(MAS)結(jié)構(gòu),通過增加多梯度的卷積路徑,使網(wǎng)絡(luò)學(xué)習(xí)到更加重要的細節(jié)特征并實現(xiàn)多層級的特征交互,最后在頸部網(wǎng)絡(luò)中嵌入輕量化的三重注意力機制(Triplet Attention),使得在特征融合時更加關(guān)注豐富的語義信息,有選擇性地進行特征語義交互,提高對水下生物目標(biāo)的檢測精度.

      1 相關(guān)工作

      1.1 YOLOv7網(wǎng)絡(luò)結(jié)構(gòu)

      YOLOv7[7]算法是2022年提出的最先進的實時目標(biāo)檢測算法,與之前的YOLO系列等方法相比,YOLOv7模型速度更快,精度更高.針對水下復(fù)雜環(huán)境以及水下生物目標(biāo)的特點,本文基于YOLOv7網(wǎng)絡(luò)結(jié)構(gòu),提出了一種改進的算法來解決水下生物目標(biāo)檢測中存在的漏檢及檢測率低的問題.YOLOv7網(wǎng)絡(luò)結(jié)構(gòu)主要包括四個部分,分別是輸入端(Input)、主干網(wǎng)絡(luò)(Backbone)、頸部(Neck)網(wǎng)絡(luò)和檢測頭(Head).

      YOLOv7模型的輸入端,采用了Mosaic數(shù)據(jù)增強對圖像進行預(yù)處理,同時自適應(yīng)圖像填充和自適應(yīng)錨框計算可以對圖像進行規(guī)范化操作,以提高檢測樣本的多樣性和覆蓋率,從而提升目標(biāo)檢測的準(zhǔn)確性和穩(wěn)定性.

      主干網(wǎng)絡(luò)首次提出了ELAN模塊以及MP模塊,ELAN模塊是用于特征提取的聚合網(wǎng)絡(luò)結(jié)構(gòu),由多個卷積塊構(gòu)成,通過控制不同的梯度路徑使得網(wǎng)絡(luò)學(xué)習(xí)不同層次的特征;MP模塊主要由卷積塊和最大池化構(gòu)成,可以保證特征層輸入前后通道保持一致,實現(xiàn)下采樣操作.

      頸部(Neck)網(wǎng)絡(luò)主要用于特征融合,通過上下采樣結(jié)合不同尺度的特征信息.主要模塊包括ELAN-H模塊、SPPCSPC等.ELAN-H在不破壞原有的梯度路徑情況下,對每個卷積層進行輸出,可以學(xué)習(xí)到深層的語義特征,同時具有較好的魯棒性.SPPCSPC模塊主要作用為增大感受野,通過兩路不同的常規(guī)卷積以及不用尺度的最大池化操作,提升模型檢測精度并減少計算量.

      檢測頭(Head)部分是YOLOv7的分類器與回歸器,主要負責(zé)在不同大小的特征圖上預(yù)測不同尺寸的目標(biāo),從而實現(xiàn)對目標(biāo)的精準(zhǔn)檢測和定位.

      1.2 注意力機制分析

      1.2.1 SimAM無參注意力機制

      常用的空間注意力、通道注意力對于特征的關(guān)注集中于通道或空間維度,在多通道或者層次上學(xué)習(xí)注意力權(quán)重靈活性較低,同時在計算權(quán)重或處理特征信息時實驗繁瑣,參數(shù)量大.針對上述問題,Yang等[13]在2022年提出的SimAM是一種簡單且有效的注意力機制,基于著名的神經(jīng)科學(xué)理論提出優(yōu)化能量函數(shù)以挖掘神經(jīng)元的重要性,對于通道以及空間維度的信息同時關(guān)注,且在推導(dǎo)權(quán)重時無需額外參數(shù).

      SimAM利用最小能量函數(shù)計算注意力權(quán)重,通過定義線性可分性的能力函數(shù)對每個網(wǎng)絡(luò)中的每個神經(jīng)元進行評估.最小能量函數(shù)如公式(1)所示:

      E=4(2+λ)(t-)2+22+2λ

      (1)

      式(1)中:t表示為輸入特征圖的通道上的神經(jīng)元,λ為正則項,和表示神經(jīng)元在通道上的均值和方差,計算公式分別如式(2)、(3)所示:

      =1M∑Mi=1xi

      (2)

      2=1M∑Mi=1(xi-)2

      (3)

      當(dāng)能量E越小,神經(jīng)元t與周圍神經(jīng)元的區(qū)別程度越高,重要程度也越高.每個神經(jīng)元的重要程度可以用最小能量的倒數(shù)表示.按照注意力機制,權(quán)重計算公式如式(4)所示:

      X·=sigmoid(1E)⊙X

      (4)

      1.2.2 Triplet Attention注意力機制

      Triplet Attention注意力機制[14]為一種輕量化的三重注意力機制,利用不同維度的交互計算來推導(dǎo)注意力權(quán)重,其包含三個平行分支結(jié)構(gòu),前兩個路徑用于捕獲通道維度C與空間維度H或W之間的交叉維度交互作用,最后一個分支用于構(gòu)建空間注意力,其結(jié)構(gòu)如圖1所示.Triplet Attention注意力機制可以通過交互計算減少空間和通道信息的丟失,同時強調(diào)了跨緯度但不降維度的重要性,在保證權(quán)重正確計算的同時簡化了參數(shù)量.

      2 細?;卣鞲兄乃履繕?biāo)檢測算法

      雖然目前將YOLOv7算法應(yīng)用于水下目標(biāo)檢測的相關(guān)研究已經(jīng)取得了一些進展,但是仍然存在以下問題:由于水下光學(xué)圖像存在細節(jié)模糊造成水下目標(biāo)可見度損失,同時水下生物目標(biāo)分布密集,彼此之間存在遮擋、重疊,使得特征信息耦合,導(dǎo)致漏檢率較高,因此,本文提出一種新的水下目標(biāo)檢測算法,對網(wǎng)絡(luò)結(jié)構(gòu)進行改進,提高網(wǎng)絡(luò)模型對于細?;卣鞯母兄芰?,使網(wǎng)絡(luò)在保證檢測精度的同時以較少的計算量達到高效的特征融合效果.所提出的算法網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示.

      2.1 ELSA模塊

      為了提高網(wǎng)絡(luò)對細節(jié)特征信息的感知,本文提出了ELSA(ELAN-SimAM)結(jié)構(gòu).ELSA是將SimAM無參數(shù)注意力機制集成到ELAN結(jié)構(gòu)中,對不同卷積所提取的語義特征賦予權(quán)重,使得網(wǎng)絡(luò)在保證深度的同時對特征提取更加準(zhǔn)確.ELSA結(jié)構(gòu)如圖3所示,在YOLOv7的ELAN結(jié)構(gòu)基礎(chǔ)上,在concat之后加入SimAM,提升了對于細節(jié)特征的感知能力,有助于對經(jīng)過不同層級的卷積所提取的深層特征有側(cè)重的關(guān)注,保證水下目標(biāo)的檢測精度.

      2.2 多梯度聚合結(jié)構(gòu)(MAS結(jié)構(gòu))

      Inception[15]是經(jīng)典模型GoogLeNet中核心的子網(wǎng)絡(luò)結(jié)構(gòu),Inception就是將多個卷積或池化操作放在一起組裝成一個網(wǎng)絡(luò)模塊,設(shè)計神經(jīng)網(wǎng)絡(luò)時,以模塊為單位去組裝整個網(wǎng)絡(luò)結(jié)構(gòu),其設(shè)計了一個稀疏網(wǎng)絡(luò)結(jié)構(gòu),但是能夠產(chǎn)生稠密的數(shù)據(jù),既能增加神經(jīng)網(wǎng)絡(luò)表現(xiàn),又能保證計算資源的使用效率.Inception結(jié)構(gòu)如圖4所示.

      Inception結(jié)構(gòu)通過多尺度特征提取,提高模型對復(fù)雜圖像的理解能力;并且網(wǎng)絡(luò)結(jié)構(gòu)中的各個卷積核共享參數(shù),可以減少模型中學(xué)習(xí)的參數(shù)量,從而減少網(wǎng)絡(luò)過擬合的風(fēng)險;Inception使用了稀疏結(jié)構(gòu),即通過1x1的卷積核來減少輸入特征的數(shù)量,這有助于降低計算成本和內(nèi)存消耗.針對水下生物目標(biāo)分布密集,彼此之間存在遮擋、重疊,使得漏檢率較高的問題,我們參考Inception結(jié)構(gòu)的優(yōu)勢,設(shè)計了MAS(Multi-gradient Aggregation Structure)結(jié)構(gòu),其思路主要是從梯度優(yōu)化的角度來保證網(wǎng)絡(luò)在模型復(fù)雜的情況下對細節(jié)特征提取有更好的效果.MAS結(jié)構(gòu)共有三個分支,一個分支為1*1卷積,然后是一個1*1卷積和四個3*3卷積塊,并在此分支上加入兩路梯度路徑,最后一個分支為一個1*1卷積和四個5*5卷積,加入四個梯度路徑,最后進行concat操作和卷積操作保證特征圖通道數(shù)不變,MAS結(jié)構(gòu)如圖5所示.

      MAS結(jié)構(gòu)在不同路徑的大小相同的感受野上分別疊加更多不同大小的卷積核,對于圖像中多層次的特征進行提取,可以讓模型學(xué)習(xí)到更加豐富的特征,增加了模型的泛化性,同時最后的拼接意味著不同尺度特征融合,對于細節(jié)特征語義信息的學(xué)習(xí)也更加全面,減少了漏檢的可能性.

      3 實驗結(jié)果

      3.1 實驗數(shù)據(jù)集

      本實驗采用全國水下機器人(湛江)大賽比賽用數(shù)據(jù)集(URPC2020),其包含有5543幅訓(xùn)練圖像(含人工標(biāo)注真值數(shù)據(jù)),目標(biāo)類別包括海參“holothurian”,海膽“echinus”,扇貝“scallop”和海星“starfish”四類,包含了遮擋、重疊以及小目標(biāo)的生物圖像,按照8∶2比例將圖片隨機劃分為訓(xùn)練集和測試集.圖6為數(shù)據(jù)集內(nèi)不同類別生物標(biāo)記的數(shù)量,縱坐標(biāo)為標(biāo)簽數(shù)量,橫坐標(biāo)為生物類別名;圖7是標(biāo)記中心點的分布情況,可以看到數(shù)據(jù)集中標(biāo)記的水下生物的位置大多分布由圖像的中心向外擴散;圖8表示標(biāo)簽高寬分布圖,數(shù)據(jù)集中水下生物大多體積小,所以看到樣本大多分布在(0~0.1,0~0.1);圖9展示了數(shù)據(jù)集中部分水下生物圖像.

      3.2 實驗環(huán)境配置

      本實驗的環(huán)境配置如下,硬件處理器配置為Intel(R) Core(TM) i9-10920X,GPU為GeForce RTX 4090,在Windows10操作系統(tǒng)下,深度學(xué)習(xí)框架采用Pytorch1.7.1,集成開發(fā)環(huán)境為Pycharm、Python3.9,訓(xùn)練參數(shù)設(shè)置如表1所示,輸入圖片大小均為640*640.

      3.3 評價指標(biāo)

      本文采用精準(zhǔn)率(P)、召回率(R)和全部樣本平均檢測精度(mAP)為評價指標(biāo).

      精準(zhǔn)率指對所有樣本進行預(yù)測后,其中預(yù)測正確的正樣本占所有檢測為正樣本比例的大小,如公式(5)所示:

      P=TP/TP+FP

      (5)

      TP指預(yù)測值與真實值相同,均為正樣本,F(xiàn)P指預(yù)測值與真實值不同,預(yù)測值為正樣本,真實值為負樣本.

      召回率是指對所有樣本進行預(yù)測后,其中預(yù)測正確的正樣本占所有真實正樣本比例的大小,如公式(6)所示:

      R=TP/TP+FN

      (6)

      FN是指預(yù)測值與真實值不同,預(yù)測值為負樣本,真實值為負正樣本.要評價目標(biāo)檢測網(wǎng)絡(luò)的能力,就要確保精準(zhǔn)率以及召回率之間的平衡關(guān)系,

      平均精度(AP)計算方式為P-R曲線與坐標(biāo)軸組成的面積,衡量數(shù)據(jù)集內(nèi)不同類別下的檢測精度主要采用mAP,計算方式為求出各檢測類別下AP 的平均值,如公式(7)、(8)所示,其值越大則表明目標(biāo)檢測效果越好.

      AP=∫10PdR

      (7)

      mAP=∑Ni=1APiN

      (8)

      3.4 消融實驗

      為驗證所提算法對水下目標(biāo)的檢測能力,首先通過消融實驗進行分析,結(jié)果如表2所示.

      實驗1在YOLOv7原結(jié)構(gòu)基礎(chǔ)上在主干網(wǎng)絡(luò)替換ELSA結(jié)構(gòu),實驗2在YOLOv7頸部網(wǎng)絡(luò)上替換MAS結(jié)構(gòu),實驗3在YOLOv7頸部網(wǎng)絡(luò)上加入Triplet Attention注意力模塊,實驗4在主干網(wǎng)絡(luò)替換ELSA結(jié)構(gòu)并在頸部加入MAS結(jié)構(gòu),實驗5在頸部替換MAS結(jié)構(gòu)并加入Triplet Attention注意力模塊,實驗6即為本文提出的算法,各個改進在網(wǎng)絡(luò)中添加的位置固定,且表中“√”表示使用相應(yīng)方法.

      (1)對實驗1~實驗3進行分析,結(jié)果表明:與YOLOv7算法相比,每種改進方法均可使檢測精度有所提升.其中MAS結(jié)構(gòu)的加入使得網(wǎng)絡(luò)的mAP值提升了1.03%,可以得出MAS結(jié)構(gòu)可以實現(xiàn)對特征信息的多梯度感知,使特征融合更加充分;在主干網(wǎng)絡(luò)替換ELSA結(jié)構(gòu),使檢測精度提升了0.97%,召回率提升2.03%,這意味著ELSA結(jié)構(gòu)可以保證網(wǎng)絡(luò)更加關(guān)注到被測目標(biāo)的模糊特征,提升了對細粒化特征的感知能力;在頸部集成Triplet Attention注意力機制使檢測精度提升了1.0%,結(jié)果表明其有助于網(wǎng)絡(luò)實現(xiàn)跨維度跨通道的特征融合,提升了檢測精度.

      (2)對實驗4以及實驗5進行分析,MAS分別與ELSA和Triplet Attention注意力模塊相結(jié)合,檢測精度分別提升了1.01%和0.92%,表明網(wǎng)絡(luò)加入MAS結(jié)構(gòu)的改進方法是有效的.

      (3)實驗6即為本文提出的算法,除精準(zhǔn)率部分降低外,召回率相比YOLOv7算法提升了1.54%,檢測精度提升了1.34%.

      綜上所述,本文所提出的改進實驗結(jié)果相比YOLOv7算法都有所提升,說明本文提出的改進在水下目標(biāo)檢測任務(wù)中均有效,可以實現(xiàn)水下復(fù)雜環(huán)境下的目標(biāo)檢測且具有較好的檢測精度.

      3.5 對比實驗

      為了驗證本文算法的先進性,選擇與當(dāng)前主流目標(biāo)檢測算法作為參考,在同一實驗環(huán)境下,利用相同的數(shù)據(jù)集對精度進行測試,實驗結(jié)果如表3所示.同時將本文算法的檢測效果與YOLOv7進行對比,水下目標(biāo)檢測效果對比如圖10以及圖11所示.

      檢測速度一般用FPS(Frames Per Second)來衡量,其表示目標(biāo)檢測網(wǎng)絡(luò)每秒能處理圖片的數(shù)量,F(xiàn)PS值越大網(wǎng)絡(luò)模型處理圖像的速度越快.由表3結(jié)果分析得出,本文算法對于水下魚類目標(biāo)檢測的精確度和召回率均高于其他算法,同時檢測速度與精度達到一定平衡,證明在水下目標(biāo)檢測任務(wù)中,本文算法可以在較短時間內(nèi)實現(xiàn)較高的檢測精度;同時將YOLOv7模型與本文所提出的算法在檢測效果上的差異進行對比,其中用紅框?qū)唧w檢測結(jié)果進行標(biāo)記,圖10主要展示了由于水下生物相互重疊遮擋導(dǎo)致水下生物漏檢的問題,圖11主要展示了由于水下光學(xué)圖像低對比度造成的生物細節(jié)模糊導(dǎo)致漏檢的問題,通過對比可以看出,本文算法可以有效解決被測目標(biāo)漏檢的問題.

      4 結(jié)論

      在復(fù)雜水下環(huán)境下,本文提出了一種改進的水下目標(biāo)檢測算法,解決了由于光學(xué)圖像中生物目標(biāo)細節(jié)模糊以及被測目標(biāo)之間相互遮擋、重疊導(dǎo)致檢測率較低的問題,幫助網(wǎng)絡(luò)對被測目標(biāo)的細?;卣鬟M行提取與融合,提升目標(biāo)檢測精度.

      (1)首先,提出ELSA模塊,結(jié)合SimAM注意力機制提升網(wǎng)絡(luò)的特征感知能力,使主干特征提取時對水下生物的細節(jié)信息進行關(guān)注,改善由于生物細節(jié)模糊而導(dǎo)致檢測精度下降的問題.

      (2)其次,針對水下生物遮擋重疊的問題,在頸部網(wǎng)絡(luò)中設(shè)計MAS模塊,有助于語義信息實現(xiàn)多路徑高效聚合.

      (3)最后,在頸部集成輕量化的Triplet Attention三重注意力機制,其跨維度跨通道的信息交互,使得網(wǎng)絡(luò)學(xué)習(xí)更加豐富的特征信息.

      在URPC2020水下數(shù)據(jù)集上通過實驗證明,本文算法可以在較短的訓(xùn)練時間實現(xiàn)更高的檢測精度,相比于YOLOv7結(jié)構(gòu)精度提升1.34%;由于該數(shù)據(jù)集包含了不同水下環(huán)境的生物目標(biāo),模型識別正確率高,證明該方法可以在水下昏暗環(huán)境、圖像模糊的情況下均可以達到較好的檢測結(jié)果,具有很好的魯棒性.但是整個網(wǎng)絡(luò)結(jié)構(gòu)還有很多的改進空間,對于水下圖像低對比度導(dǎo)致的漏檢現(xiàn)象也需要大量研究,接下來也會繼續(xù)實驗以實現(xiàn)更加輕量且高效的水下目標(biāo)檢測網(wǎng)絡(luò).

      參考文獻

      [1] 唐 敏,初 慧.關(guān)于塑造全過程優(yōu)勢推動威海海洋經(jīng)濟走在前的研究與思考[J].海洋開發(fā)與管理,2023,40(7):85-89.

      [2] Redmon J,Divvala S,Girshick R,et al.You only look once:Unified,real-time object detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition.Vegas:IEEE,2016:779-788.

      [3] Redmon J,F(xiàn)arhadi A.YOLO9000:Better,faster,stronger[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition.Honolulu:IEEE,2017:7 263-7 271.

      [4] Yang H,Liu P,Hu Y Z,et al.Research on underwater object recognition based on YOLOv3[J].Microsystem Technologies,2021,27:1 837-1 844.

      [5] Zhou J,Yang Q,Meng H,et al.An underwater target recognition method based on improved YOLOv4 in complex marine environment[J].Systems Science amp; Control Engineering,2022,10(1):590-602.

      [6] Wang J,Li Q,F(xiàn)ang Z,et al.YOLOv6-ESG:A lightweight seafood DetectionMethod[J].Journal of Marine Science and Engineering,2023,11(8):1 623-1 642.

      [7] Wang C Y,Bochkovskiy A,Liao H Y M.YOLOv7:Trainable bag-of -freebies sets new state-of-the-art for real-time object detectors[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.Vancouver,BC:IEEE Computer Society,2023:7 464-7 475.

      [8] Yi W,Wang B.Research on Underwater small target detection algorithm based on improved YOLOv7[J].IEEE Access,2023,11:66 818-66 827.

      [9] Liu K,Sun Q,Sun D,et al.Underwater target detection based on improved YOLOv7[J].Journal of Marine Science and Engineering,2023,11(3):677-698.

      [10] Hua X,Cui X,Xu X,et al.Underwater object detection algorithm based on feature enhancement and progressive dynamic aggregationstrategy[J].Pattern Recognition,2023,139(7):109 511.

      [11] 安志強,李智軍,劉 碩,等.融合 YOLOv7 和 BYTE 多目標(biāo)跟蹤的多類別海珍品計數(shù)方法[J].農(nóng)業(yè)工程學(xué)報,2023,39(9):183-189.

      [12] Chen X,Yuan M,Yang Q,et al.Underwater-YCC:Underwater target detection optimization algorithm based onYOLOv7[J].Journal of Marine Science and Engineering,2023,11(5):995-1 013.

      [13] Yang L,Zhang R Y,Li L,et al.Simam:A simple,parameter-free attention module for convolutional neural networks[C]//International Conference on Machine Learning.New York:PMLR,2021:11 863-11 874.

      [14] Misra D,Nalamada T,Arasanipalai A U,et al.Rotate to attend:Convolutional triplet attention module[C]//Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision.Virtual:IEEE,2021:3 139-3 148.

      [15] Szegedy C,Liu W,Jia Y,et al.Going deeper with convolutions[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.Piscataway:IEEE Computer Society,2015:1-9.

      [16] 辛世澳,葛海波,袁 昊,等.改進YOLOv7的輕量化水下目標(biāo)檢測算法[J].計算機工程與應(yīng)用,2024,60(3):88-99.

      【責(zé)任編輯:蔣亞儒】

      猜你喜歡
      注意力機制目標(biāo)檢測
      面向短文本的網(wǎng)絡(luò)輿情話題
      基于自注意力與動態(tài)路由的文本建模方法
      基于深度學(xué)習(xí)的問題回答技術(shù)研究
      基于LSTM?Attention神經(jīng)網(wǎng)絡(luò)的文本特征提取方法
      基于注意力機制的雙向LSTM模型在中文商品評論情感分類中的研究
      軟件工程(2017年11期)2018-01-05 08:06:09
      InsunKBQA:一個基于知識庫的問答系統(tǒng)
      視頻中目標(biāo)檢測算法研究
      軟件(2016年4期)2017-01-20 09:38:03
      行為識別中的人體運動目標(biāo)檢測方法
      移動機器人圖像目標(biāo)識別
      基于背景建模法的運動目標(biāo)檢測
      铜梁县| 蓬莱市| 河津市| 仙居县| 长宁区| 桂林市| 安仁县| 宁国市| 博兴县| 广水市| 广东省| 金阳县| 宁陕县| 裕民县| 祁阳县| 祁东县| 西充县| 忻城县| 桑植县| 隆德县| 商南县| 政和县| 孝义市| 定日县| 大邑县| 茂名市| 大洼县| 福海县| 连云港市| 收藏| 华宁县| 海门市| 镇安县| 辽宁省| 泸州市| 武定县| 临颍县| 包头市| 永康市| 绥江县| 衢州市|