中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2025)13-0050-05
Abstract:Gaofen-SARsatelitesforrailroadinspectionhavetheadvantagesofwidecoverage,all-weatherandmetal sensitivity,butneedtosolvetheproblemofinstantdetectionofrlwaytargets.Forthisreasonanimprovedmodelcalled Lightweight-YOLOv5sisproposedbasedonYOLOv5s,whichisespeciallysuitablefordetectionofrailroadtargetsinSARimage. ByreducingtheMobile-Darknetbackbonefeatureextractionnetwork layers,weoptimizedthenetworkstructure;byaddingHDC andCBMmechanisms,weadjustedthesmalltargetsensoryfieldweightsandstrengthenthesmalltargetlinefacilityfeature extraction;byusing FPGMpruning,weeliminatedtheredundantfeaturemodulesandachievealightweightmodel;byusing VarifocalLossasthelossfunction,weequalizedthepositiveandnegativecategoriesandhighlightthecontributionofpositive examples.The results show that,the accuracy of Lightweight-YOLOv5s model achieves 9 7 . 6 % ,and the inference time reduces to 6.87ms.Comparedwiththeclasicalalgorithmsfordetectinglineartargetsinremotesensingimages,theperformanceisgreatly improved for instant detection of railroad targets.
Keywords: SAR; railroad inspection; rail target detection; YOLOv5s; lightweight network
鐵道線路覆蓋范圍廣、距離長(zhǎng),所處地區(qū)地形、地貌條件復(fù)雜多樣,尤其是氣候及地質(zhì)條件復(fù)雜的山區(qū),地震、洪水、泥石流等自然災(zāi)害易發(fā),會(huì)嚴(yán)重威脅鐵路系統(tǒng)安全穩(wěn)定運(yùn)行,需要即時(shí)準(zhǔn)確地監(jiān)測(cè)鐵路所處環(huán)境情況,才能有效保障鐵路安全。傳統(tǒng)的鐵路監(jiān)測(cè)手段如人工巡檢、在線監(jiān)測(cè)等監(jiān)測(cè)范圍有限且同樣受災(zāi)害制約,無(wú)人機(jī)和光學(xué)衛(wèi)星遙感易受天氣影響[-3]。鐵道線路設(shè)施的主要材料是金屬,對(duì)電磁波有較強(qiáng)的后向散射,在SAR影像中的特征較為明顯,為其識(shí)別與定位提供了基礎(chǔ)。隨著高分辨極化SAR影像在鐵路設(shè)施遙感監(jiān)測(cè)和應(yīng)急減災(zāi)的應(yīng)用越來(lái)越廣泛,大范圍、高分辨SAR影像的處理準(zhǔn)確度及速度要求越來(lái)越高,如何快速?gòu)臉O化SAR影像中提取鐵道自標(biāo)就成了遙感影像處理方法研究與應(yīng)用的熱點(diǎn)[4-5]。
基于深度學(xué)習(xí)理論的目標(biāo)檢測(cè)模型已廣泛應(yīng)用于SAR影像的目標(biāo)識(shí)別、分割分類研究中。YOLOv3、FasterRCNN、Mask-RCNN[6-8等目標(biāo)檢測(cè)算法具有檢測(cè)精度高、檢測(cè)效果優(yōu)異的優(yōu)點(diǎn),但由于雙階段算法將候選區(qū)域的生成與目標(biāo)分類分開,導(dǎo)致其計(jì)算量大、檢測(cè)速度慢。以YOLOv5為代表的單階段目標(biāo)檢測(cè)算法因其檢測(cè)速度快、實(shí)時(shí)性高、移植簡(jiǎn)便等優(yōu)勢(shì)得以廣泛應(yīng)用。針對(duì)SAR影像特定目標(biāo)樣本數(shù)據(jù)稀疏問(wèn)題,有學(xué)者提出基于卷積神經(jīng)網(wǎng)絡(luò)仿真SAR影像遷移學(xué)習(xí)的目標(biāo)識(shí)別方法,將預(yù)訓(xùn)練模型得到的網(wǎng)絡(luò)參數(shù)遷移到自標(biāo)模型上作為自標(biāo)模型的初始化參數(shù),有效解決了SAR影像數(shù)據(jù)不足所產(chǎn)生的過(guò)擬合問(wèn)題。由于鐵路設(shè)施鋪設(shè)范圍廣、跨度大,造成SAR影像中的各種地質(zhì)及基礎(chǔ)設(shè)施特征復(fù)雜,需要進(jìn)一步提高基于SAR影像的鐵道目標(biāo)檢測(cè)模型精度和效率[0]。
本文提出了一種面向SAR影像鐵道目標(biāo)輕量化檢測(cè)網(wǎng)絡(luò)模型Lightweight-YOLOv5s。針對(duì)鐵道線路狹長(zhǎng)目標(biāo)像素?cái)?shù)占比少、不易識(shí)別的問(wèn)題,設(shè)計(jì)重構(gòu)網(wǎng)絡(luò)結(jié)構(gòu),加人融合空間與通道注意力機(jī)制和空洞卷積的特征增強(qiáng)提取網(wǎng)絡(luò),并調(diào)整感受野權(quán)重,加強(qiáng)小目標(biāo)線路設(shè)施特征提?。煌ㄟ^(guò)剪枝對(duì)網(wǎng)絡(luò)模型進(jìn)行寬度的調(diào)整,使用VarifocalLoss作為損失函數(shù),提高模型精度。
1改進(jìn)的Lightweight-YOLOv5s網(wǎng)絡(luò)模型
針對(duì)SAR圖像中的鐵道小尺度目標(biāo)與網(wǎng)絡(luò)層深度特征損失的矛盾,改進(jìn)YOLOv5s網(wǎng)絡(luò),在主干網(wǎng)絡(luò)骨架基礎(chǔ)上,去掉過(guò)深的卷積層,只保留4個(gè)殘差模塊,將下采樣倍數(shù)由32調(diào)整為16,在減少小目標(biāo)信息損失的同時(shí)降低了參數(shù)量,提高網(wǎng)絡(luò)的推理速度,并將輸出預(yù)測(cè)層進(jìn)行前向移動(dòng),以充分利用保留的更多小目標(biāo)信息的淺層特征進(jìn)行預(yù)測(cè),形成以Mobile-Darknet為主干特征提取骨架的改進(jìn)后的Lightweight-YOLOv5s,網(wǎng)絡(luò)模型整體結(jié)構(gòu)如圖1所示。
針對(duì)SAR高分辨圖像中鐵道線路設(shè)施目標(biāo)相對(duì)周圍地質(zhì)特征尺度較小的特點(diǎn),加人卷積注意力機(jī)制模塊(Convolutional Block Attention Module,CBAM)和空洞空間金字塔池化模塊(AtrousSpatialPyramidPooling,ASPP)結(jié)合的特征增強(qiáng)提取網(wǎng)絡(luò),調(diào)整小目標(biāo)感受野權(quán)重,加強(qiáng)小目標(biāo)線路設(shè)施特征提取,通過(guò)不斷地進(jìn)行下采樣可以得到圖片更深層次的語(yǔ)義信息,進(jìn)而完成特征提取任務(wù),為后續(xù)的分類及回歸奠定基礎(chǔ);為剔除特征融合網(wǎng)絡(luò)架構(gòu)中的冗余特征模塊,采用幾何中值濾波器剪枝(Filter Pruningvia Ge-omet-ricMedian,F(xiàn)PGM)方法調(diào)整網(wǎng)絡(luò)模型寬度,采用改進(jìn)的VarifocalLoss作為損失函數(shù),均衡正負(fù)類別損失函數(shù)影響,突出正例的貢獻(xiàn)。對(duì)提取的鐵路SAR影像中像素點(diǎn)進(jìn)行曲線擬合和濾波整正,最終可得到平順連續(xù)的鐵道線路檢測(cè)結(jié)果。
1.1CBAM與ASPP結(jié)合的特征增強(qiáng)提取網(wǎng)絡(luò)
為了讓模型更多地關(guān)注真實(shí)目標(biāo)存在的區(qū)域,學(xué)習(xí)到更多有意義的特征,結(jié)合SAR遙感影像的特性,設(shè)計(jì)引入結(jié)合了通道與空間的注意力機(jī)制的CBAM。通過(guò)學(xué)習(xí)的方式分配權(quán)重,加強(qiáng)感興趣區(qū)域的特征提取,將依次經(jīng)過(guò)通道注意力模塊(Channel Attention Mod-ule,CAM)與空間注意力模塊(SpatialAttentionModule,SAM)之后重新標(biāo)定的權(quán)重賦予原始特征圖,可降低目標(biāo)的漏檢率及誤檢率。CBAM模塊結(jié)構(gòu)如圖2所示。
由于遙感SAR影像視野廣大,檢測(cè)背景復(fù)雜,池化操作可能導(dǎo)致特征圖中小目標(biāo)丟失,在后續(xù)的上采樣操作中目標(biāo)信息無(wú)法復(fù)原,從而限制了檢測(cè)精度的提升。因此,在小自標(biāo)特征圖處理中,增加混合空洞卷積(HybridDialatedConvolution,HDC),使用原始大小為 3×3 的卷積核,將空間金字塔池化中的池化操作用空洞卷積替代,可以在分辨率不丟失的情況下增大感受野,減少信息損失,提高分割性能,并消除普通空洞卷積引起的柵格效應(yīng)。
HDC的約束條件公式為
(1)式中:
是第 i 層2個(gè)非零元素之間的最大距離,
是n 組空洞率
中第 i 位的膨脹系數(shù)。
要求
為卷積核大小,設(shè)計(jì)為3,且 n 組空洞率的公因子應(yīng)為1。
融合混合空洞卷積的ASPP結(jié)構(gòu)如圖3所示,設(shè)計(jì)三層卷積,空洞卷積的空洞率分別為1、3、8,空洞率為8的卷積層對(duì)應(yīng)感受野為 1 7 × 1 7 個(gè)像素,對(duì)輸入的5 1 2 × 5 1 2 圖像16倍下采樣的高維特征圖長(zhǎng)、寬為 3 2 × 32個(gè)像素,占比過(guò)半可實(shí)現(xiàn)有效特征提取,卷積并聯(lián)操作后與輸入特征圖進(jìn)行通道堆疊構(gòu)成空洞空間卷積金字塔結(jié)構(gòu),增強(qiáng)模型的特征感受,提高特征提取能力。
1.2 FPGM剪枝
為提高模型計(jì)算效率,本文采用FPGM來(lái)進(jìn)行網(wǎng)絡(luò)的軟剪枝,以減小模型規(guī)模。該方法突破基于范數(shù)的剪枝局限性,在保留豐富的有效信息特征同時(shí)裁剪掉冗余信息]。FPGM剪枝算法核心思想,首先是計(jì)算每個(gè)點(diǎn)相較于其他點(diǎn)的歐氏距離
式中: x 為輸人數(shù)據(jù), 代表第 i 層歐氏空間的點(diǎn)。然后選出相對(duì)較近的歐氏距離之和濾波器,以剔除其中的最近距離點(diǎn)
在計(jì)算第 i 層所有濾波器的公共距離時(shí),采取幾何中值的計(jì)算方式。每一個(gè)卷積核參數(shù)維度可表示為 。 K 為卷積核大小,
和
分別表示第i 個(gè)卷積層的輸入通道數(shù)和輸出通道數(shù)。
按距幾何中值中心距離的遠(yuǎn)近進(jìn)行剪枝,尋找距離幾何中心較近的濾波器
進(jìn)一步計(jì)算出距離之和最小的濾波器
式中: 為第 i 個(gè)卷積層的第
個(gè)濾波器,
為實(shí)數(shù)空間內(nèi)各點(diǎn)歐式距離最小的
為到各點(diǎn)距離和最小的幾何中心。通過(guò)不斷迭代歐氏距離之和小的濾波器梯度置零,實(shí)現(xiàn)訓(xùn)練模型收斂,得到剪枝后模型。在推理過(guò)程中進(jìn)行去零操作,去掉全零的卷積核、冗余通道和BN層冗余參數(shù)。此過(guò)程,避免了求解幾何中心的大量計(jì)算工作,僅需計(jì)算濾波器之間的距離,實(shí)現(xiàn)了剪枝后模型的計(jì)算效率優(yōu)化。
1.3 VarifocalLoss損失函數(shù)
在SAR影像中進(jìn)行線路設(shè)施目標(biāo)檢測(cè)時(shí),由于線路設(shè)施像素少,且分布較為稀疏,使用局部損失函數(shù)如下。
式中:目標(biāo)類的預(yù)測(cè)概率為 p ,取值范圍為[-1,1];真實(shí)正負(fù)樣本類別為 y ,取值為1或-1;設(shè)計(jì)目標(biāo)和背景兩類調(diào)制因子分別為 和
為可調(diào)比例因子。通過(guò)因子調(diào)節(jié),可增加對(duì)稀疏樣本和誤檢樣本的損失評(píng)估權(quán)重,使得局部損失函數(shù)能夠使用加權(quán)方法解決IoU感知分類得分的回歸訓(xùn)練時(shí)類別不均衡問(wèn)題。
為進(jìn)一步增加正樣本的貢獻(xiàn)重要度,基于局部損失函數(shù)改進(jìn)為VarifocalLoss損失函數(shù)如下,采用 因子對(duì)負(fù)樣本進(jìn)行處理,即基于二元交叉熵?fù)p失,借鑒局部損失函數(shù)加權(quán)方式處理IoU感知分類得分的訓(xùn)練回歸過(guò)程中類別不匹配問(wèn)題。
式中:IoU感知分類得分預(yù)測(cè)值為 p ,代表目標(biāo)分?jǐn)?shù);分類條件為 q ,將背景類別的 q 值均設(shè)置0,將目標(biāo)類的正樣本 q 值設(shè)置為預(yù)選框和groundtruth(gt_IoU)之間的IoU值,負(fù)樣本 q 值設(shè)置為 0 。
2 實(shí)驗(yàn)
2.1實(shí)驗(yàn)環(huán)境及數(shù)據(jù)集
本節(jié)所有模型的訓(xùn)練及評(píng)估實(shí)驗(yàn)均在PyTorch框架中實(shí)現(xiàn),CPU為CoreInteli9-9900K,GPU為GeForceRTX3080,使用python3.7進(jìn)行編程。為驗(yàn)證本文算法的目標(biāo)檢測(cè)效果,基于MSAR10數(shù)據(jù)集進(jìn)行樣本篩選和預(yù)訓(xùn)練2,并結(jié)合實(shí)際采集鐵道線路數(shù)據(jù)進(jìn)行調(diào)優(yōu)。通過(guò)圖像拉伸,旋轉(zhuǎn)等進(jìn)行樣本擴(kuò)增,形成涵蓋山區(qū)、平原及多種分辨率的研究所用數(shù)據(jù)集影像樣本1000個(gè),按照7:2:1的比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。
2.2 評(píng)價(jià)指標(biāo)
評(píng)價(jià)目標(biāo)檢測(cè)算法的指標(biāo)有準(zhǔn)確率 P (preci-sion)召回率R(recall)、平均準(zhǔn)確率 m A P (mean Av-
erage Precision,mAP)[1l-12]。其中, P 是預(yù)測(cè)為正且實(shí)際為正的樣本所占比例; R 為正樣本中被正確檢測(cè)所占比例; m A P 為所有類別準(zhǔn)確率的均值,計(jì)算公式如下
式中: T P (TruePositive)為檢測(cè)結(jié)果為真的正樣本; F N (FalseNegative)為檢測(cè)結(jié)果非真的正樣本; F P (FalsePositive)為檢測(cè)結(jié)果為真的負(fù)樣本; A P 是單個(gè)類別的準(zhǔn)確率。 c 為類別數(shù)。
2.3 VarifocalLoss損失函數(shù)
在驗(yàn)證集中隨機(jī)選擇圖片進(jìn)行結(jié)果驗(yàn)證,所選圖片中包含不同范圍及地貌特征中的不同類型線路設(shè)施目標(biāo)。圖4可以看出,提出的改進(jìn)模型可準(zhǔn)確識(shí)別不同地貌特征中的線路目標(biāo),盡管SAR影像中的線路目標(biāo)較小,利用改進(jìn)網(wǎng)絡(luò)中的目標(biāo)特征提取與小目標(biāo)注意力機(jī)制,仍然可以較好地實(shí)現(xiàn)目標(biāo)檢測(cè)。
為驗(yàn)證模型中各種改進(jìn)機(jī)制在SAR影像線路設(shè)施檢測(cè)的有效性,進(jìn)行消融實(shí)驗(yàn),結(jié)果見表1。結(jié)果表明,Lightweight-YOLOv5s模型經(jīng)網(wǎng)絡(luò)重構(gòu)、VarifocalLoss優(yōu)化后均對(duì)檢測(cè)精度提升有正向作用,同時(shí),準(zhǔn)確率和召回率也有提高。
將Lightweight-YOLOv5s與FasterR-CNN、YOLOv3、YOLOv5s算法進(jìn)行性能對(duì)照實(shí)驗(yàn),結(jié)果見表2。
在考慮最高精度時(shí),本文提出的模型平均精度可提高至 9 7 . 6 % ,與各經(jīng)典算法相比,平均精度分別提高了 1 3 % , 6 . 4 % , 2 . 5 % ;且模型體積僅5MB,推理時(shí)間6 . 8 7 m s 。
3結(jié)束語(yǔ)
及時(shí)準(zhǔn)確地監(jiān)測(cè)鐵道線路的運(yùn)轉(zhuǎn)狀態(tài)及其周圍地域的情況,為應(yīng)急搶險(xiǎn)和災(zāi)情評(píng)估提供準(zhǔn)確全面的數(shù)據(jù)信息,是保障鐵路安全穩(wěn)定運(yùn)行,避免突發(fā)性災(zāi)害對(duì)鐵路系統(tǒng)造成重大危害,降低經(jīng)濟(jì)損失的關(guān)鍵。本文提出的鐵道目標(biāo)輕量化檢測(cè)模型Lightweight-YOLOv5s,主要從網(wǎng)絡(luò)改進(jìn)及輕量化處理展開,網(wǎng)絡(luò)重構(gòu)后模型體積、計(jì)算速度和檢測(cè)精度均有改善。后續(xù),通過(guò)樣本庫(kù)建設(shè)、模型遷移等工作,可進(jìn)一步研究解決鐵道線路檢測(cè)不完全的問(wèn)題,提升檢測(cè)技術(shù)對(duì)多類型SAR影像的泛化能力。
參考文獻(xiàn):
[1]鄭佳怡,馮楠,田超.基于空天地遙感技術(shù)的鐵路外部環(huán)境安全隱患監(jiān)測(cè)與管理研究[J].科技創(chuàng)新與應(yīng)用,2024,14(22):141-144.
[2]DEREN L,MI W,JIE J.China's high-resolution opticalremote sensing satellites and their mapping applications[J].Geo-spatial Information Science,2021,24(1):1-10.
[3]楊懷志,秦勇,王志鵬.基于無(wú)人機(jī)遙感圖像的鐵路軌道區(qū)域分割提取方法研究[J].鐵道技術(shù)標(biāo)準(zhǔn)(中英文),2021,3(9):6-12.
[4]姚京川,郭繼亮,簡(jiǎn)國(guó)輝,等.基于TSInSAR技術(shù)的鐵路線路沉降監(jiān)測(cè)[J].中國(guó)鐵路,2022(7):53-58.
[5]楊鶴猛,孟秀軍,陳艷芳,等.極化SAR影像地物智能分類技術(shù)進(jìn)展[J].電子技術(shù)應(yīng)用,2022,48(8):34-37,94.
[6]蔣忠進(jìn),王強(qiáng),曾祥書.一種基于改進(jìn)YOLOv3網(wǎng)絡(luò)的SAR圖像目標(biāo)檢測(cè)方法[J].現(xiàn)代雷達(dá),2023,45(2):31-38.
[7]REN S,HE K,GIRSHICK R,et al.Faster r-cnn:To-wards real-time object detection with region proposal net-works[J].IEEE Transactions on Pattern Analysis amp; MachineIntelligence,2017,39(6):1137-1149.
[8] HE K,GKIOXARI G,DOLLAR P,et al.[C]//Mask r-cnn.Proceedings of the IEEE international conference on com-putervision(ICCV).2017:2961-2969.
[9]羅荔豪,歐鷗,趙偉,等.基于改進(jìn)YOLOv5s的水果圖像識(shí)別[J].信息技術(shù),2023(11):28-34,40.
[10]袁慕策,姚京川,簡(jiǎn)國(guó)輝,等.基于綜合衛(wèi)星遙感的典型鐵路設(shè)施提取方法研究[J].航天返回與遙感,2024,45(1):29-40.
[11]王恒濤,張上.輕量化SAR圖像艦船目標(biāo)檢測(cè)算法[J].電光與控制,2023,30(5):99-104,110.
[12]趙志成,蔣攀,王福田,等.基于深度學(xué)習(xí)的SAR弱小目標(biāo)檢測(cè)研究進(jìn)展[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2024,33(6):1-15.