王新良,紀(jì)昂志,李自強
1.河南理工大學(xué) 物理與電子信息學(xué)院, 河南 焦作 454003
2.許繼電氣股份有限公司,河南 許昌 461000
輸電線路巡檢正朝著智能化、無人化的方向發(fā)展。作為輸電線路中的重要部件之一,絕緣子的正常狀態(tài)是保證輸電線路穩(wěn)定運行的重要一環(huán)。但由于輸電桿塔大多架設(shè)在室外,絕緣子不可避免地會受到惡劣天氣及環(huán)境的影響,使其表面積累污穢,提升了發(fā)生閃絡(luò)的幾率,對輸電線路帶來了極大的隱患。傳統(tǒng)的絕緣子污穢巡檢需要運維人員登上輸電桿塔對其進(jìn)行檢測,不僅具有危險性而且效率較低。因此準(zhǔn)確高效地識別并定位輸電線路中的污穢絕緣子,對于輸電桿塔的巡檢以及礦區(qū)電力系統(tǒng)的安全運行具有重要意義。
針對絕緣子不同的缺陷有不同的檢測方式,對于絕緣子污穢檢測,一些研究通過提取絕緣子的特殊特征對其進(jìn)行識別。文獻(xiàn)[1]利用絕緣子的高光譜圖像對絕緣子污穢識別。文獻(xiàn)[2]使用紅外圖像對絕緣子表面的污穢度進(jìn)行表征。但這些方法都容易受到環(huán)境影響,具有一定的局限性。隨著近年來無人機(jī)技術(shù)與人工智能算法的發(fā)展,通過無人機(jī)遠(yuǎn)程將圖像傳回再使用深度學(xué)習(xí)算法進(jìn)行識別成為了一種十分有效的巡檢方式[3-4]。然而基于深度學(xué)習(xí)的絕緣子識別通常采用通用目標(biāo)檢測來識別絕緣子,由于絕緣子長寬比較大,且在圖中的方向存在不確定性,使用傳統(tǒng)的水平框?qū)^緣子進(jìn)行檢測并不能十分準(zhǔn)確表達(dá)絕緣子的位置信息,且使用水平框?qū)^緣子框選時的范圍較大,容易出現(xiàn)相鄰絕緣子由于重合面積過大而被篩除掉的現(xiàn)象。為了精確定位并識別絕緣子,有研究使用旋轉(zhuǎn)目標(biāo)檢測對絕緣子進(jìn)行識別[5],加入角度信息的旋轉(zhuǎn)目標(biāo)檢測能夠更精確地體現(xiàn)絕緣子在圖中的位置,但使用旋轉(zhuǎn)目標(biāo)檢測算法進(jìn)一步對絕緣子的污穢現(xiàn)象進(jìn)行研究的較少。為能夠提升對絕緣子污穢的檢測效率,將采用旋轉(zhuǎn)目標(biāo)檢測算法對污穢絕緣子進(jìn)行識別與定位。
在旋轉(zhuǎn)目標(biāo)檢測問題上,也有較多的算法被提出。一些算法在二階段網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)行改進(jìn),得到帶有旋轉(zhuǎn)框的檢測結(jié)果[6-8]。也有一些算法在一階段網(wǎng)絡(luò)上改進(jìn):文獻(xiàn)[9]提出將物體角度預(yù)測視為分類問題并設(shè)計了環(huán)形平滑標(biāo)簽以解決邊界問題。文獻(xiàn)[10-12]在解決檢測中的特征不對齊問題。文獻(xiàn)[13-15]使用無錨框檢測旋轉(zhuǎn)目標(biāo)。同時有研究通過將旋轉(zhuǎn)框的分布信息轉(zhuǎn)換為高斯分布再計算損失[16-18],提升了旋轉(zhuǎn)目標(biāo)檢測的準(zhǔn)確度。
R3Det[10]是基于RetinaNet[19]的端到端單階段旋轉(zhuǎn)目標(biāo)檢測算法,該算法針對旋轉(zhuǎn)目標(biāo)檢測任務(wù)中寬高比大、排列密集和方向任意的三大難題,通過級聯(lián)多個分類和回歸子網(wǎng)絡(luò),并設(shè)計特征精煉模塊,逐步細(xì)化特征,解決特征不對齊的問題,在DOTA[20]等常用遙感數(shù)據(jù)集上獲得了較為準(zhǔn)確的旋轉(zhuǎn)位置回歸與分類估計。但R3Det 的主干網(wǎng)絡(luò)與特征融合網(wǎng)絡(luò)對細(xì)粒度特征提取效果不佳;同時計算量較大,不利于實時檢測。針對以上問題,基于架空輸電線路實際環(huán)境中污穢絕緣子的特性對R3Det 算法進(jìn)行改進(jìn),通過引入更適用于絕緣子污穢檢測的主干網(wǎng)絡(luò)ConvNeXt[21]與特征融合網(wǎng)絡(luò)PANet[22],并對檢測頭網(wǎng)絡(luò)進(jìn)行改進(jìn),引入KLD[17]損失函數(shù),得到能夠準(zhǔn)確識別污穢絕緣子的單階段旋轉(zhuǎn)目標(biāo)檢測算法。
在R3Det 的基礎(chǔ)上進(jìn)一步改進(jìn),提出的算法總體結(jié)構(gòu)如圖1 所示,主要由主干網(wǎng)絡(luò)、特征融合網(wǎng)絡(luò)以及對齊檢測頭三部分組成。
圖1 改進(jìn)R3Det的絕緣子污穢檢測模型結(jié)構(gòu)圖Fig.1 Structure diagram of improved R3Det insulator contamination detection model
為提升網(wǎng)絡(luò)對污穢絕緣子細(xì)粒度特征的提取能力,將原始網(wǎng)絡(luò)中作為主干網(wǎng)絡(luò)的ResNet[23]替換為ConvNeXt[21]。ConvNeXt 借鑒了目標(biāo)檢測領(lǐng)域中性能較好的Swin Transformer[24]的結(jié)構(gòu)和策略,在相同的FLOPs(floating point operations,浮點運算數(shù))下,ConvNeXt擁有更高的準(zhǔn)確率。其網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2 所示,圖中k表示卷積核的大小,s表示卷積核的步長,n表示block的堆疊次數(shù)。ConvNeXt 在每一個block 的最后都使用了一層layer scale,即在每一層輸出的特征上額外乘上一層可學(xué)習(xí)的參數(shù),使得模型能夠更側(cè)重需要關(guān)注的特征,從而提升模型的細(xì)粒度特征提取能力;且采用卷積核大小為7×7 的深度可分離卷積以增大模型的感受野同時獲得更多的全局信息;此外使用更少的激活函數(shù)和批標(biāo)準(zhǔn)化等非線性投影來增強特征在網(wǎng)絡(luò)中的傳遞效率,有效地提升了網(wǎng)絡(luò)的表達(dá)能力。
圖2 ConvNeXt結(jié)構(gòu)圖Fig.2 Architecture of ConvNeXt
根據(jù)block 堆疊數(shù)量的多少,ConvNeXt 有T/S/B/L四種不同的版本,為了保證提升模型性能的同時不引入過多的參數(shù)量與計算量,采用ConvNeXt-T,其四個bolck的堆疊數(shù)為(3,3,9,3),各個bolck 輸出通道數(shù)為(96,192,384,768)。
在特征融合網(wǎng)絡(luò)中,將FPN[25](feature parymid network,特征金字塔)替換為PANet[22](path aggregation network,路徑聚合網(wǎng)絡(luò)),如圖1 中的特征融合網(wǎng)絡(luò)所示,與原始網(wǎng)絡(luò)中的FPN只進(jìn)行自頂而下的特征融合不同的是,PANet 額外增加了一條自底而上的融合路徑,這樣使得各個尺度的特征都能融合來自頂層的語義信息和來自底層的位置信息,使得各個尺度的特征有更豐富的表達(dá)能力。同時為了盡可能得到更多尺度的預(yù)測結(jié)果,除了主干網(wǎng)絡(luò)生成的三個尺度特征進(jìn)行融合外,還會從主干網(wǎng)絡(luò)最后一層特征連續(xù)下采樣兩次生成額外的兩個尺度的特征,作為檢測頭網(wǎng)絡(luò)的輸入特征。
使用水平框?qū)^緣子進(jìn)行框選存在真實目標(biāo)與標(biāo)注框的貼合度較差的問題。如圖3 所示的使用旋轉(zhuǎn)框與水平框?qū)^緣子進(jìn)行框選的對比,在對距離比較近的兩個絕緣子目標(biāo)使用水平框進(jìn)行框選時,標(biāo)注框并不能反映絕緣子的真實尺寸;且由于兩個標(biāo)注框的重合面積過大,若使用通用的水平框?qū)ζ溥M(jìn)行檢測,在進(jìn)行非極大值抑制時,當(dāng)同屬一個類別,容易出現(xiàn)兩個框處于同一區(qū)域從而只保留得分最高的框的現(xiàn)象。而使用旋轉(zhuǎn)框則可以較為精確地描述絕緣子的形狀與位置信息,并且可以避免出現(xiàn)重合面積過大而被篩除掉的現(xiàn)象。
圖3 水平框與旋轉(zhuǎn)框的對比Fig.3 Comparison between horizontal box and rotating box
圖4 角度定義示意圖Fig.4 Structural diagram of angle definition
在模型的檢測頭網(wǎng)絡(luò)中,特征采用固定感受野的網(wǎng)格方式對整張圖像進(jìn)行表征,是軸對齊的,因此對于非軸對齊、帶有角度偏移的目標(biāo)來說會存在分類與回歸特征不對齊的問題,由特征生成的錨框一定程度上并不能準(zhǔn)確地表示有角度偏移的目標(biāo),分類分?jǐn)?shù)也存在不準(zhǔn)確性。在R3Det中采用了雙線性插值的方式來緩解上述問題,本文通過引入對齊卷積[11(]alignment convolution,AC),同時對分類子分支做出改進(jìn),提出對齊檢測頭(alignment detection head,ADH),在解決特征不對齊問題的同時,進(jìn)一步提升檢測性能。
對齊卷積由標(biāo)準(zhǔn)卷積改進(jìn)而來,但與標(biāo)準(zhǔn)卷積不同的是,對齊卷積在每一個默認(rèn)采樣位置上額外增加了一個偏移量,如圖5 所示,該偏移量表示得到對齊特征所需的采樣點與標(biāo)準(zhǔn)卷積默認(rèn)采樣點之間的偏移。若定義各個點的特征在特征圖上的位置為P={0 ,1,…,H-1} ×{0,1,…,W-1} ,標(biāo)準(zhǔn)卷積的采樣點為R={(-1,-1),(-1,0),…,(0,1),(1,1)},對每個位置p∈P的在卷積時各個采樣點上的偏移量O用公式表示為:
圖5 對齊卷積示意圖Fig.5 Structural diagram of alignment convolution
在對旋轉(zhuǎn)框類型的標(biāo)注框進(jìn)行描述時,除了需要包含水平框包含的中心點坐標(biāo)以及框的長度和寬度信息以外,還需要額外包含角度偏移信息,本文采用處理圖像的OpenCV 包中的角度定義法對旋轉(zhuǎn)框角度的描述。具體表示如圖4所示,在圖中不同的方向的標(biāo)注框可以用圖4中的四種情況概括,角度θ的范圍始終介于(0°,90°]之間,h則表示與X軸之間的夾角小于90°的邊,w表示另外的一條邊。
從公式(1)可以看出,該偏移主要根據(jù)第一階段生成的錨框位置信息與默認(rèn)生成的位置信息之間的差異來表征,生成的(x,y)、(w,h)和θ是以原圖作為參考系的信息,因此將其除以卷積核的大小,經(jīng)過旋轉(zhuǎn)矩陣將該向量旋轉(zhuǎn)θ°,再除以特征圖的每一格所代表的步長,即可得到該框所對應(yīng)于特征圖中的位置,再減去特征圖中的默認(rèn)位置,即可得到所需的偏移量。從而對齊卷積使用該偏移量完成對齊特征的采樣。
加入對齊卷積的ADH結(jié)構(gòu)如圖6所示,圖中c表示卷積層層數(shù),k表示卷積核的大小。ADH 通過級聯(lián)兩個階段的回歸與分類子網(wǎng)絡(luò)并在其中通過對齊卷積解決特征不對齊問題。在第一階段將輸入的特征先經(jīng)過分類和回歸子網(wǎng)絡(luò)輸出未對齊的錨框回歸和分類分?jǐn)?shù),并經(jīng)過過濾保留每個位置分?jǐn)?shù)最高的錨框,再通過該錨框的偏移生成對齊卷積計算所需的偏移量,利用偏移量對輸入的特征進(jìn)行對齊卷積操作生成對齊特征從而完成特征的重構(gòu)。使用的對齊卷積可以看做一層卷積層,不會帶來過多的參數(shù)與計算量,同時相較于R3Det 中的檢測頭網(wǎng)絡(luò),ADH 沒有對特征使用雙向卷積的重新映射,而是直接對輸入特征進(jìn)行重構(gòu),減少特征在傳遞時的損耗,也減少了雙向卷積部分的計算量與參數(shù)量。
圖6 對齊檢測頭結(jié)構(gòu)示意圖Fig.6 Structural diagram of alignment detection head
經(jīng)過對齊重構(gòu)的特征在第二階段再次經(jīng)過分類和回歸子網(wǎng)絡(luò)生成精確的分類分?jǐn)?shù)與位置回歸。與在第一階段使用的積核大小為3×3的四層卷積層不同的是,在第二階段中的分類分支使用卷積核大小為1×1 的四層卷積層,這是由于上層特征代表了一定感受野范圍的語義信息,且第二階段的特征是經(jīng)過對齊重構(gòu)的更為精確的特征,使用1×1的卷積可以減少周圍信息帶來的冗余,提升細(xì)粒度分類的準(zhǔn)確性,使得網(wǎng)絡(luò)能夠?qū)^緣子是否污穢更具有分辨力。位置回歸分支為了得到更多的位置信息,依舊都采用卷積核大小為3×3 的卷積層。同時為了防止一些高質(zhì)量的錨框由于不對齊的特征生成了較低的分?jǐn)?shù),從而在第一階段被篩除掉,進(jìn)一步影響偏移量的精確性,因此在第一階段的分類與回歸子網(wǎng)絡(luò)中使用較低的交并比閾值,在第二階段的分類與回歸子網(wǎng)絡(luò)中使用較高的交并比閾值。
采用OpenCV 定義法表示角度會在邊的臨界位置帶來角度周期性和邊的交換性問題,本來較小的損失會被描述的很大[16]。Kullback-Leibler Divergence(KLD)損失函數(shù)[17]將由(x,y,w,h,θ)表示的預(yù)測框和真實框的中心點坐標(biāo)、寬、高和角度信息轉(zhuǎn)換為由(μ,Σ)表示的二維高斯分布,轉(zhuǎn)換過程用以下公式表示:
式中,R為旋轉(zhuǎn)矩陣;S為特征值的對角線矩陣。
公式(2)將坐標(biāo)點的中心點信息作為二維高斯分布的位置信息,公式(3)利用旋轉(zhuǎn)矩陣將寬高以及角度信息作為二維高斯分布的尺度信息,以完成任意旋轉(zhuǎn)矩形框到其二維高斯分布的映射。且轉(zhuǎn)換后的二維高斯分布具有周期性和交換性,因此可以解決角度周期性和邊的交換性問題。故回歸損失就可以使用真實框與生成框在二維高斯分布中的距離表示,KLD 損失函數(shù)使用Kullback-Leibler距離對其進(jìn)行描述。引入KLD損失函數(shù)后的位置回歸損失用公式表示為:
式中,D表示兩個高斯分布之間的Kullback-Leibler 距離;μt、Σt表示真實框轉(zhuǎn)換后的高斯分布,μp、Σp表示預(yù)測框轉(zhuǎn)換后的高斯分布;Lreg表示最終的回歸損失,τ為調(diào)節(jié)整個損失函數(shù)的超參數(shù)。
公式(4)計算兩個高斯分布之間Kullback-Leibler距離,公式(5)通過ln 函數(shù)與超參數(shù),控制KLD 損失函數(shù)的范圍,使得損失函數(shù)更加平滑,避免損失傳播過程中梯度爆炸。KLD 損失函數(shù)具備尺度不變性,同樣的目標(biāo)在不同尺度下的損失不變,減少了預(yù)測框的大小不同對損失帶來的影響;此外,KLD損失函數(shù)在長寬比變大時求導(dǎo)會更注重角度的優(yōu)化,這也在一定程度上減小長寬比大的目標(biāo)受角度差過大帶來的影響。因此相比較于其他損失函數(shù),KLD 損失函數(shù)更適合對具有長寬比較大特點的污穢絕緣子檢測,且能夠提供較高精度的檢測結(jié)果。
整體的損失函數(shù)主要由對齊檢測頭的兩個階段的損失組成,其中分類子分支使用Focal loss[19]函數(shù),以解決生成框正負(fù)樣本不均衡的問題,回歸子分支使用KLD損失函數(shù)。用公式表示為:
式中,N1和N2表示第一階段和第二階段的生成錨框的數(shù)量;λ1和λ2分別為平衡分類損失與回歸損失以及兩個階段權(quán)重的超參數(shù),默認(rèn)為1;Lcls和Lreg分別為計算分類與回歸的函數(shù);p1n和l1n為第一階段生成錨框的類別信息和位置信息;p2n和l2n為第二階段生成錨框的類別信息和位置信息;tn和gn為真實框的類別信息和位置信息;obj1n和obj2n分別為用二進(jìn)制表示的前景、背景信息,如結(jié)果為前景則為1,否則為0。
基于某礦區(qū)輸電公司使用無人機(jī)拍攝的輸電線路照片,篩選出大約1 000張含有絕緣子的圖像,由于絕緣子在圖像中的位置并不會影響檢測效率,使用Photoshop隨機(jī)裁切絕緣子并隨機(jī)改變尺寸大小將數(shù)據(jù)集擴(kuò)充到了1 600 張;進(jìn)一步通過隨機(jī)翻轉(zhuǎn)以及隨機(jī)調(diào)整對比度和亮度,最終得到包含復(fù)合類型絕緣子和瓷質(zhì)絕緣子在內(nèi)的圖像共2 300 張。圖像的尺寸集中于1 100×800 附近。按照8∶1∶1的比例將數(shù)據(jù)集劃分為訓(xùn)練集、驗證集與測試集。
使用可以標(biāo)注旋轉(zhuǎn)框信息的labelImg 對所有圖像進(jìn)行標(biāo)注,結(jié)果為包含真實框中心點坐標(biāo)、寬、高和角度信息的xml類型文件,再將其轉(zhuǎn)換為DOTA類型的含有真實框四個角點坐標(biāo)信息的txt文件作為輸入。
標(biāo)注結(jié)果分布見圖7所示,圖中橫縱坐標(biāo)分別表示標(biāo)注框的寬度和高度。由圖可知標(biāo)注的絕緣子較為均勻地分布在靠近兩條坐標(biāo)軸的區(qū)域,說明了絕緣子目標(biāo)尺寸的多樣性,也反應(yīng)了絕緣子目標(biāo)長寬比較大的特點。經(jīng)統(tǒng)計,共標(biāo)注目標(biāo)4 250 個,其中污穢絕緣子(Dust)目標(biāo)1 364 個,非污穢絕緣子(Not dust)目標(biāo)2 886個。
圖7 標(biāo)注結(jié)果分布圖Fig.7 Annotation result distribution map
所有對比實驗均在CPU 為Intel?Xeon?E5-2680 v4 2.40 GHz和GPU為Nvidia GeForce RTX 3080 10 GB的硬件配置,以及Ubuntu18.04 的軟件環(huán)境下進(jìn)行。所有算法均基于深度學(xué)習(xí)框架Pytorch搭建。
模型訓(xùn)練采用隨機(jī)梯度下降算法(stochastic gradient descent,SGD)。訓(xùn)練的參數(shù)設(shè)置為:批量設(shè)置為2;輸入圖像尺寸設(shè)置為1 024×1 024;最大迭代數(shù)設(shè)置為100;動量設(shè)置為0.9;權(quán)重衰減系數(shù)設(shè)置為0.000 1;初始學(xué)習(xí)率設(shè)置為0.001 25,采用warm up策略調(diào)整學(xué)習(xí)率,并分別在第27、33、50 次迭代衰減學(xué)習(xí)率;主干網(wǎng)使用ImageNet-1k預(yù)訓(xùn)練模型作為初始值。此外,在公式(5)中控制KLD損失平滑程度的超參數(shù)τ按照默認(rèn)設(shè)置為了1;公式(6)中平衡分類損失與回歸損失的超參數(shù)λ1均設(shè)置為1,同時控制兩個階段權(quán)重的超參數(shù)λ2也設(shè)置為1。ADH 中第一階段交并比閾值設(shè)置為0.5,第二階段設(shè)置為0.6。
在對實驗結(jié)果進(jìn)行分析使用的評價指標(biāo)有:(1)平均精度均值(mean average precision,mAP),表示所有類別平均精度的均值,體現(xiàn)模型的性能;(2)平均精度(average precision,AP),表示檢測結(jié)果中預(yù)測正確的數(shù)量占目標(biāo)總體的比值;(3)浮點運算次數(shù)(floating point of operations,F(xiàn)LOPs)表示模型的計算量;(4)參數(shù)量(Params)表示模型的參數(shù)量。
在ADH 結(jié)構(gòu)中,對使用的對齊卷積和第二階段分類子分支使用的卷積核大小進(jìn)行分析,結(jié)果見表1 所示,表中“—”表示不使用,“√”表示使用,Kernal 表示在第二階段分類子分支使用的卷積核大小。從表中可得,相比較于原始網(wǎng)絡(luò)中的方法,在使用了對齊卷積后,模型的計算量大幅下降,下降了19.8%,模型的參數(shù)量也有所下降,同時模型的平均精度均值出現(xiàn)略微提升。將第二階段分類子分支使用的卷積核大小設(shè)置為1后,模型的計算量與參數(shù)量均下降,mAP 提升到90.3%,證明了使用較小卷積核能夠更好地對絕緣子污穢進(jìn)行分類。結(jié)果表明,引入的對齊卷積可以解決特征不對齊問題,提升了網(wǎng)絡(luò)的性能,同時還能大幅降低模型的計算量。而在ADH的分類子分支使用較小尺寸的卷積核在降低計算量與參數(shù)量的同時,對絕緣子污穢的檢測效果更好。
表1 對齊檢測頭網(wǎng)絡(luò)消融實驗Table 1 Ablation experiment of alignment detection head
此外,使用不同的初始錨框設(shè)置也會對結(jié)果帶來一定的影響,表2 中是使用不同初始尺寸錨框的結(jié)果對比,表中Loss 表示使用的損失函數(shù),Radios 表示初始錨框的長寬比,N表示初始生成的錨框數(shù)量。從表中可得,在初始錨框設(shè)置為1、0.5、2三種長寬比,每個位置共9個錨框的情況下,引入KLD損失函數(shù)后平均精度均值有所下降,這是因為,KLD損失函數(shù)對正方形的目標(biāo)識別精確度較低,兩個正方形轉(zhuǎn)換為二維高斯分布后,無論角度相差多少,KLD 損失值都為0,但初始錨框中有1/3 都是正方形類型,這對于長寬比較高的絕緣子而言影響較大。因此將錨框長寬比為1的尺寸刪除,并為了進(jìn)一步降低計算量,將初始錨框設(shè)置為每個位置只生成同一尺寸的一個錨框,減少生成正方形的概率,并再次引入KLD 損失函數(shù),最后mAP 達(dá)到90.6%。同時由于減少錨框的生成數(shù)量,模型的計算量也有所下降,但由于損失函數(shù)只對訓(xùn)練的過程起作用,因此引入的損失函數(shù)對模型的計算量與參數(shù)量沒有影響。
表2 不同初始錨框的結(jié)果對比Table 2 Comparison of results of different initial anchor boxes
為了進(jìn)一步分析各個模塊對模型性能的影響,分別對各個模塊進(jìn)行消融實驗并在計算量、參數(shù)量、平均精度均值等維度進(jìn)行對比,結(jié)果見表3所示,表3中“—”表示不使用,“√”表示使用。從表中可得,相比較于原始R3Det,模型在替換主干網(wǎng)為ConvNeXt 以后,mAP 提升了2.1個百分點,提升主要在污穢絕緣子類別上,同時計算量和參數(shù)量有小幅度的提升,表明ConvNeXt 在相似的參數(shù)量與計算量下,其中l(wèi)ayer scale等結(jié)構(gòu)對絕緣子是否污穢的細(xì)粒度特征提取能力相較于原始網(wǎng)絡(luò)有所提高。在引入PANet 后,mAP 與計算量、參數(shù)量均有小幅度提升,可以說明PANet 在污穢絕緣子識別中,對特征的加強和融合能力要比FPN更強。在檢測頭網(wǎng)絡(luò)中,由于減少了錨框的數(shù)量并采用卷積核大小為1的卷積,計算量下降了近27.4%,參數(shù)量也同時下降。最后引入的KLD 損失函數(shù)只對訓(xùn)練的過程有影響,通過不同的初始錨框設(shè)置,mAP 相較于未引入提升了0.3 個百分點。相比較于原始R3Det,改進(jìn)后的模型計算量下降25.2%,參數(shù)量提升4.9%,同時mAP 提升了4.9 個百分點。改進(jìn)的模型在更少的計算量下,實現(xiàn)了更高的檢測精度。
表3 改進(jìn)模型各模塊的消融實驗Table 3 Ablation experiment of each module of improved model
使用不同的模型在自制數(shù)據(jù)集上進(jìn)行實驗,結(jié)果見表4所示,從表中可得,相比較于用于旋轉(zhuǎn)檢測的Faster R-CNN[26]的二階段目標(biāo)檢測網(wǎng)絡(luò)以及S2ANet 等一階段目標(biāo)檢測網(wǎng)絡(luò),提出的改進(jìn)模型相比較于其他網(wǎng)絡(luò)有較高的mAP,證明本文方法對于污穢絕緣子檢測的有效性。
表4 不同模型對污穢絕緣子檢測結(jié)果對比Table 4 Comparison of insulator contaminated detection results using different models
圖8、圖9 所示為R3Det 與改進(jìn)算法的檢測結(jié)果對比。從圖8 原始R3Det 網(wǎng)絡(luò)的檢測結(jié)果中可以看出,在圖8(a)中存在旋轉(zhuǎn)框與真實位置不對齊,且在遮擋情況下目標(biāo)被分為兩部分的現(xiàn)象;圖8(b)中小尺度目標(biāo)較多情況下,有較多的絕緣子檢測結(jié)果存在偏移,且有漏檢的情況;圖8(c)中由于對細(xì)粒度特征提取不足,因此出現(xiàn)同一個目標(biāo)有污穢和非污穢兩個結(jié)果的重影現(xiàn)象。在圖9所示的改進(jìn)后算法的檢測結(jié)果中,與原始網(wǎng)絡(luò)相對應(yīng)的圖片對比,提出的模型能夠解決以上的問題,在各個尺度均有較低的誤檢率和漏檢率,且分類分?jǐn)?shù)更加準(zhǔn)確,定位更加精確,進(jìn)一步體現(xiàn)改進(jìn)的方法對污穢絕緣子檢測的可行性。
圖8 R3Det的檢測結(jié)果Fig.8 Detection results of R3Det
圖9 改進(jìn)算法的檢測結(jié)果Fig.9 Detection results of improved algorithm
針對絕緣子污穢檢測任務(wù)中漏檢率與誤檢率較高的問題,提出一種單階段旋轉(zhuǎn)目標(biāo)檢測算法。首先針對污穢絕緣子與非污穢絕緣子的細(xì)粒度分類,采用提取特征能力更強且具有注意力的主干網(wǎng)ConvNeXt和特征表達(dá)能力更強的多路徑特征聚合網(wǎng)絡(luò);再引入對齊卷積及小尺度卷積,在降低計算量的同時,解決特征不對齊問題,提升目標(biāo)的分類精度;針對絕緣子長寬比較大的特點,通過使用不同初始錨框的策略并引入更高精度的KLD 損失函數(shù),提升模型的檢測性能。通過自制數(shù)據(jù)集的測試結(jié)果表明,本模型的mAP 可以達(dá)到90.6%,能夠很好地完成污穢絕緣子的檢測任務(wù),模型的速度和以及定位和分類精度都具有一定的優(yōu)勢。但模型依舊有一些改進(jìn)的空間,對細(xì)粒度特征的表達(dá)還有缺陷,同時模型的參數(shù)量與檢測速度也有待進(jìn)一步改進(jìn)。