宋萬(wàn)潼,李冰鋒,費(fèi)樹岷
(1.河南理工大學(xué) 電氣工程與自動(dòng)化學(xué)院,河南 焦作 454000;2.東南大學(xué) 自動(dòng)化學(xué)院,南京 210096)
架空輸電線路作為電力能源輸送的載體,由線路桿塔、導(dǎo)線、絕緣子、線路金具、拉線、桿塔基礎(chǔ)、接地裝置等構(gòu)成。由于架空輸電線路長(zhǎng)期暴露在野外,其各個(gè)組成部分均易受自然環(huán)境侵襲。各裝置材料屬性及其安裝位置的差異使其發(fā)生故障的頻率和檢修的難度不同。絕緣子通常由陶瓷、玻璃或復(fù)合材質(zhì)制成且懸掛在空中,相對(duì)于架空輸電線路中的其他金屬件,絕緣子發(fā)生故障的頻率和檢修難度均加大。因此,在架空輸電線路定期巡檢過(guò)程中主要對(duì)絕緣子的運(yùn)行狀態(tài)進(jìn)行檢測(cè)。傳統(tǒng)的絕緣子運(yùn)行狀態(tài)檢測(cè)多采用人工巡檢的方法,但其存在著人工成本高、檢測(cè)效率低、危險(xiǎn)性高等缺點(diǎn)。隨著無(wú)人機(jī)、人工智能等領(lǐng)域的發(fā)展,基于航拍圖像的絕緣子運(yùn)行狀態(tài)檢測(cè)已成為輸電線路運(yùn)行管理中新的研究熱點(diǎn)[1-2]。
基于航拍圖像的絕緣子運(yùn)行狀態(tài)檢測(cè)包括兩個(gè)部分,即在航拍圖像中精確定位絕緣子的位置和在其基礎(chǔ)上進(jìn)行絕緣子故障的判斷和定位。從本質(zhì)上兩者都屬于目標(biāo)檢測(cè)的范疇[3],且前者對(duì)后者有一定的借鑒意義。早期的絕緣子檢測(cè)算法多采用人工提取特征與機(jī)器學(xué)習(xí)算法相結(jié)合。人工提取的特征包括紋理特征、結(jié)構(gòu)化特征和形狀特征。早期算法具有方法簡(jiǎn)單且計(jì)算負(fù)擔(dān)小的優(yōu)點(diǎn),缺點(diǎn)是只能在特定場(chǎng)景下使用,其泛化能力相對(duì)較弱。例如,楊翠茹[4]提取絕緣子的紋理特征,利用K 均值聚類算法實(shí)現(xiàn)對(duì)絕緣子的定位。由于背景圖像中河流、樹木、田野等特征與絕緣子紋理較相似,因此該算法易受環(huán)境因素的干擾而影響其檢測(cè)性能。趙振兵[5]等利用絕緣子串的形狀特征,采用閾值分割和邊緣檢測(cè)的方法對(duì)絕緣子進(jìn)行定位。該算法使用固定閾值對(duì)圖像進(jìn)行預(yù)分割,因此易受光照條件的影響,導(dǎo)致后續(xù)絕緣子邊緣提取失敗。實(shí)際航拍圖像中絕緣子背景相對(duì)較復(fù)雜,早期的檢測(cè)方法很難滿足大多數(shù)實(shí)際工程需求。
隨著計(jì)算機(jī)硬件性能和深度學(xué)習(xí)方法的提高,基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法逐漸代替了傳統(tǒng)的檢測(cè)算法[6-8]。與早期基于經(jīng)典機(jī)器學(xué)習(xí)理論的絕緣子檢測(cè)算法相比,基于深度學(xué)習(xí)的絕緣子檢測(cè)算法多采用卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)從大量數(shù)據(jù)中學(xué)習(xí)最優(yōu)的目標(biāo)特征,再采用全連接網(wǎng)絡(luò)進(jìn)行目標(biāo)定位,從而在復(fù)雜的背景下獲得較高的檢測(cè)精度和較強(qiáng)的泛化能力。例如,LIU 等[9]利用標(biāo)準(zhǔn)的Faster R-CNN[10]模型對(duì)絕緣子進(jìn)行檢測(cè),在復(fù)雜背景下獲得了較高的檢測(cè)精度。XU[11]等利用單次多重目標(biāo)檢測(cè)器(Single Shot Multibox Detector,SSD)算法對(duì)絕緣子進(jìn)行檢測(cè)[12],提高其在多尺度上絕緣子的檢測(cè)精度。CHEN 等[13]結(jié)合本身數(shù)據(jù)集中目標(biāo)絕緣子尺寸較小的特點(diǎn),利用YOLO V3[14]算法對(duì)絕緣子進(jìn)行檢測(cè)獲得顯著的效果。上述基于深度學(xué)習(xí)的絕緣子檢測(cè)算法大多是在通用檢測(cè)模型基礎(chǔ)上進(jìn)行檢測(cè),其檢測(cè)精度仍需進(jìn)一步提高。
基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法中,本文選擇精度較優(yōu)的Faster R-CNN 為基礎(chǔ)算法對(duì)航拍圖像中的絕緣子進(jìn)行檢測(cè)。Faster R-CNN 作為兩階段的目標(biāo)檢測(cè)算法,其檢測(cè)過(guò)程分為特征提取、候選區(qū)域生成、目標(biāo)類別的類別判斷和位置回歸。算法通過(guò)多層的卷積神經(jīng)網(wǎng)絡(luò)對(duì)輸入圖像進(jìn)行特征提??;在得到特征圖像的每個(gè)位置上放置9 個(gè)尺寸和長(zhǎng)寬比不同的錨點(diǎn)框,并通過(guò)softmax 算法判斷每個(gè)錨點(diǎn)框?qū)儆谇熬斑€是背景并對(duì)位置進(jìn)行粗略估計(jì)。最終對(duì)前景的錨點(diǎn)框進(jìn)行類別判斷,通過(guò)回歸算法進(jìn)行檢測(cè)框的精確位置計(jì)算。Faster R-CNN 算法檢測(cè)精度較高的關(guān)鍵因素是利用卷積層通過(guò)簡(jiǎn)單的前景背景判斷和粗略的位置計(jì)算生成高質(zhì)量的候選框,同時(shí)兩次類別判斷和位置回歸計(jì)算。但Faster R-CNN 算法作為通用的目標(biāo)檢測(cè)算法,并未包含絕緣子圖像。
本文提出基于先驗(yàn)知識(shí)的航拍絕緣子改進(jìn)算法。通過(guò)在Faster R-CNN 特征提取層中引入注意力機(jī)制以提高算法對(duì)絕緣子的表達(dá)能力??紤]到航拍過(guò)程中無(wú)人機(jī)平臺(tái)與目標(biāo)絕緣子的距離為固定,基于航拍圖像中絕緣子尺度的先驗(yàn)知識(shí),結(jié)合K 均值聚類算法改進(jìn)錨點(diǎn)框的生成模式。在此基礎(chǔ)上,將中心損失函數(shù)引入到交叉熵分類損失函數(shù)中,以提高絕緣子與背景特征的可區(qū)分性。
為提高從航拍圖像中檢測(cè)絕緣子的準(zhǔn)確度,本文設(shè)計(jì)了兩階段的目標(biāo)檢測(cè)算法,其整體結(jié)構(gòu)如圖1 所示。檢測(cè)過(guò)程分為特征提取、候選區(qū)域生成、目標(biāo)物的類別判斷和精確定位。其整體框架與Faster R-CNN 較相似,但與基于絕緣子的先驗(yàn)知識(shí)不同,本文對(duì)檢測(cè)過(guò)程部分進(jìn)行了改進(jìn)。
圖1 絕緣子檢測(cè)算法框架Fig.1 Insulator detection algorithm framework
基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法在訓(xùn)練集充分且標(biāo)注足夠準(zhǔn)確的情況下,特征提取網(wǎng)絡(luò)性能在很大程度上影響后續(xù)目標(biāo)的檢出率。特征提取模塊的作用是對(duì)航拍圖像進(jìn)行卷積操作以獲得顯著的絕緣子特征,同時(shí)抑制其他目標(biāo)物的特征。絕緣子航拍圖像如圖2所示。
圖2 絕緣子航拍圖像Fig.2 Aerial images of insulator
在特征提取網(wǎng)絡(luò)層引入卷積塊注意力模塊(Convolutional Block Attention Module,CBAM)[15],其網(wǎng)絡(luò)結(jié)構(gòu)原理如圖3 所示。其中,F(xiàn)∈?C×H×W表示注意力機(jī)制的輸入,其尺寸為H×W,通道數(shù)為C,經(jīng)過(guò)通道注意力模塊后,其輸出為MC∈?C×1×1,表示學(xué)習(xí)得到C個(gè)通道的權(quán)重。
圖3 CBAM 結(jié)構(gòu)Fig.3 CBAM structure
將F∈?C×H×W和MC進(jìn)行如式(1)所示的通道間點(diǎn)乘,得到F′∈?C×H×W,F(xiàn)′與F的尺寸和通道數(shù)完全相同,但不同于F,F(xiàn)′的各個(gè)通道會(huì)自適應(yīng)被賦予不同的權(quán)重;其中,含有絕緣子特征的通道將會(huì)被賦予大的權(quán)重,反之亦然。
將通道注意力的輸出F′輸入空間注意力模塊,其輸出為MS∈?1×H×W,表示尺寸為H×W平面上每個(gè)點(diǎn)的權(quán)重,最終將MS和F′進(jìn)行空間上的點(diǎn)乘,如式(2)所示,得到F″。
相對(duì)于F′,F(xiàn)″對(duì)每個(gè)通道特征圖的不同位置施加不同的權(quán)重,從而在空間上對(duì)絕緣子的部分進(jìn)行特征增強(qiáng)。
注意力機(jī)制模塊在通道和空間2 個(gè)維度上對(duì)輸入的特征圖重新分配權(quán)重,所以其輸出可以選擇性增強(qiáng)絕緣子特征表征能力,從而提高特征提取網(wǎng)絡(luò)聚焦絕緣子的能力。
對(duì)輸入圖像進(jìn)行特征提取后,在特征圖的每個(gè)位置放置若干個(gè)錨點(diǎn)框,分別進(jìn)行目標(biāo)分類和定位。每個(gè)位置設(shè)定的錨點(diǎn)框尺寸和個(gè)數(shù)與檢測(cè)對(duì)象的先驗(yàn)知識(shí)相關(guān)。與通用的多目標(biāo)檢測(cè)算法不同,本文檢測(cè)目標(biāo)只是單一的絕緣子,在進(jìn)行航拍巡線時(shí),無(wú)人機(jī)與絕緣子的距離相對(duì)較固定,所以航拍圖像中絕緣子的尺寸僅與其自身實(shí)際大小相關(guān)。從懸掛角度分析,架空輸電線路上絕緣子多為0°、90°和45°角3 個(gè)方向。
基于以上先驗(yàn)知識(shí),為了能更好地提高檢測(cè)性能,本文采用K 均值聚類方法學(xué)習(xí)最優(yōu)的錨點(diǎn)框尺寸及個(gè)數(shù),K 均值聚類算法的目標(biāo)函數(shù)如式(3)所示:其中,Bi為訓(xùn)練樣本中第i個(gè)絕緣子目標(biāo)框的長(zhǎng)和寬,Cj為第j類目標(biāo)框的聚類中心,N和K分別為訓(xùn)練樣本中絕緣子的個(gè)數(shù)和聚類中心的個(gè)數(shù)。di(Bi,Cj)表示Bi和Cj之間的相似性度量準(zhǔn)則,常用的度量準(zhǔn)則包括L1或L2范數(shù),但是兩者對(duì)目標(biāo)的尺寸較敏感。采用如式(4)和式(5)所示,將Bi和Cj的交并比作為兩者的相似性度量準(zhǔn)則[16]。
根據(jù)式(4)定義的度量指標(biāo),通過(guò)迭代最小化式(3),不斷減小每個(gè)聚類中心所有樣本對(duì)應(yīng)其中心之間的距離,最終得到K個(gè)錨點(diǎn)框尺寸信息。
采用交叉熵函數(shù)描述目標(biāo)檢測(cè)算法的分類損失。由于本文中的前景目標(biāo)只有絕緣子一類,為提高絕緣子與背景特征間的可分性,在分類損失函數(shù)中增加一個(gè)正則項(xiàng)[17]。該正則項(xiàng)能提高目標(biāo)和背景描述各自的聚類性能,如式(6)所示:
其中,xi∈?d表示進(jìn)入分類層前關(guān)于第i個(gè)區(qū)域的描述子。當(dāng)yi=1 時(shí),對(duì)應(yīng)xi表示絕緣子區(qū)域的描述子;當(dāng)yi=0 時(shí),對(duì)應(yīng)xi表示背景區(qū)域的描述子表示第yi類特征中心,本文共包括絕緣子特征和背景特征的聚類中心。m為訓(xùn)練過(guò)程中每個(gè)批量數(shù)據(jù)的數(shù)量。
在訓(xùn)練過(guò)程中,通過(guò)最小化中心損失正則項(xiàng),使絕緣子和背景描述子同時(shí)向各自的聚類中心靠攏,絕緣子和背景描述子內(nèi)聚性增強(qiáng)的同時(shí),則絕緣子和背景描述子的可區(qū)分性增強(qiáng)。在訓(xùn)練過(guò)程中,LC對(duì)xi的梯度,以及特征中心的更新表示如下:
在式(8)中,δ(yi=j)為狄拉克函數(shù),表示當(dāng)yi=j時(shí)等于1,否則為0。式(9)中,α為控制學(xué)習(xí)速率的超參數(shù);t表示迭代次數(shù)。
引入中心損失正則項(xiàng)后的分類損失函數(shù)如式(10)所示:
其中,LS為交叉熵?fù)p失函數(shù);LC為中心損失函數(shù);λ為協(xié)調(diào)因子。
本文提出的網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示。其中,特征提取網(wǎng)絡(luò)以VGG16 為基準(zhǔn),并去除最后一個(gè)池化層后的卷積層;在VGG16 的第3、4、5 個(gè)結(jié)構(gòu)塊(block)中分別引入注意力機(jī)制模塊。其主要作用是:一方面卷積層底層輸出一般為輸入圖像的淺層特征表示,不具備表征待檢測(cè)目標(biāo)特征的能力;另一方面綜合考慮計(jì)算負(fù)擔(dān)的問(wèn)題。本文的區(qū)域候選網(wǎng)絡(luò)和Faster R-CNN 的區(qū)域候選網(wǎng)絡(luò)完全相同,但本文采用先驗(yàn)知識(shí)優(yōu)化的錨點(diǎn)框獲取方式。
圖4 Faster R-CNN 改進(jìn)算法網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Faster R-CNN improved algorithm network structure
本文使用PyTorch 框架進(jìn)行實(shí)驗(yàn),并采用GPU 進(jìn)行加速運(yùn)算,實(shí)驗(yàn)環(huán)境中Windows10系統(tǒng),PyTorch 框架、Python 語(yǔ)言,CPU 為Intel Core i7-8700k,GPU 為GTX 1080 Ti,RAM 為32 GB。設(shè)計(jì)數(shù)據(jù)集共包括1 500 張圖像,在輸電線路巡檢時(shí)由無(wú)人機(jī)在真實(shí)場(chǎng)景下拍攝獲得,其中900 張由國(guó)家電網(wǎng)某公司提供,另外600 張來(lái)自于文獻(xiàn)[18]。隨機(jī)選擇數(shù)據(jù)集中750 張用于訓(xùn)練,余下的750 張用于測(cè)試。使用LabelImg①工具對(duì)數(shù)據(jù)集進(jìn)行標(biāo)注。
目標(biāo)檢測(cè)性能通過(guò)計(jì)算測(cè)試集上的平均準(zhǔn)確率(Average Precision,AP)和所有類別的平均準(zhǔn)確率均值(Mean Average Precision,MAP)進(jìn)行衡量。本文前景目標(biāo)只有絕緣子一類,只需要計(jì)算AP 值即可。AP 值越高,表示檢測(cè)性能越好。AP 的計(jì)算過(guò)程如下:
1)設(shè)定IOU 的閾值(本文IOU 設(shè)定為0.7),當(dāng)檢測(cè)框與真實(shí)框的IOU≥0.7 時(shí),表示絕緣子被正確檢測(cè);當(dāng)檢測(cè)框與真實(shí)框的IOU<0.7 時(shí),表示非絕緣子被檢測(cè)為絕緣子。
2)用TP表示絕緣子被正確檢測(cè)的數(shù)目;FP表示非絕緣子被檢測(cè)為絕緣子的數(shù)目;FN表示漏檢的數(shù)目;(TP+FP)表示檢測(cè)框的數(shù)目;(TP+FN)表示真實(shí)框的數(shù)目。根據(jù)式(11)和式(12)分別計(jì)算出精確率(P)和召回率(R)。
3)根據(jù)預(yù)測(cè)框的分類置信度,對(duì)其進(jìn)行降序排列得到所有檢測(cè)框的精確率和召回率。以召回率為橫坐標(biāo),精確率為縱坐標(biāo)作P-R 曲線。AP 值即曲線與橫坐標(biāo)包圍的面積。
本文使用隨機(jī)梯度下降法,對(duì)網(wǎng)絡(luò)采用端對(duì)端的方式進(jìn)行訓(xùn)練。其中batcn_size 設(shè)置為1,動(dòng)量設(shè)置為0.9,權(quán)值衰減系數(shù)為5-4。訓(xùn)練共進(jìn)行了14 個(gè)輪次(epoch),其中前9 個(gè)輪次學(xué)習(xí)率設(shè)置為10-4,后5 個(gè)輪次學(xué)習(xí)率為10-5。
在模型初始化中,對(duì)共享的卷積層在ImageNet[19]數(shù)據(jù)集上訓(xùn)練的VGG16 模型參數(shù)進(jìn)行初始化,而RPN特有的卷積層以及網(wǎng)絡(luò)中的全連接層則以0 均值、標(biāo)準(zhǔn)差為0.01 的高斯分布隨機(jī)初始化。對(duì)RPN 網(wǎng)絡(luò)在特征圖每個(gè)位置共設(shè)定6 個(gè)錨點(diǎn)框,其寬高尺寸分別為(31,467)、(46,617)、(101,365)、(117,265)、(272,56)、(785,166)。中心損失正則項(xiàng)的協(xié)調(diào)因子λ和超參數(shù)α分別設(shè)置為0.04、0.5。
在上述設(shè)定條件的目標(biāo)檢測(cè)結(jié)果如圖5 所示??梢钥闯?,在不同背景條件下,本文提出的方法可以準(zhǔn)確地檢測(cè)絕緣子目標(biāo)。
圖5 本文方法檢測(cè)結(jié)果Fig.5 Detection results of the proposed method
Faster R-CNN、SSD 和YOLO V3 這3 種算法并不是原始的檢測(cè)算法,而是Faster R-CNN、SSD、YOLO 的方法。本文方法是制作一個(gè)更大的數(shù)據(jù)集(包括訓(xùn)練集和測(cè)試集),將所有參與比較的網(wǎng)絡(luò)在本文提供的訓(xùn)練集上重新進(jìn)行訓(xùn)練和測(cè)試。
圖6 為本文方法與Faster R-CNN、SSD、YOLO目標(biāo)檢測(cè)算法的P-R 曲線對(duì)比??梢钥闯觯疚那€與橫坐標(biāo)包圍的面積明顯大于其他3 種曲線與橫坐標(biāo)包圍的面積,說(shuō)明本文方法的檢測(cè)精度優(yōu)于其他3 種方法。
圖6 不同方法P-R 曲線Fig.6 P-R curves of different methods
表1是本文方法與Faster R-CNN、SSD、YOLO。可以看出,目標(biāo)檢測(cè)算法的AP 值對(duì)比,本文方法檢測(cè)AP 值明顯高于其他3 種方法。SSD 與YOLO V3 算法為了提高網(wǎng)絡(luò)的多尺度檢測(cè)能力,設(shè)置了多尺度的錨點(diǎn)框,因此這2 種算法的檢測(cè)精度偏低。本文的目標(biāo)絕緣子多尺度特征并不明顯,影響其檢測(cè)性能。
表1 本文方法與其他深度方法的AP 值Table 1 AP values of the proposed method and other depth methods
圖7 是本文方法與Faster R-CNN 的損失值曲線對(duì)比。可以看出,2 種方法都能較快速收斂。本文方法設(shè)置了更符合本文數(shù)據(jù)集尺寸以及數(shù)量的錨點(diǎn)框,并增加了中心損失正則化,因此在收斂速度上略優(yōu)于Faster R-CNN 算法。
圖7 不同方法訓(xùn)練損失值曲線Fig.7 Training loss curves of different methods
在本文的實(shí)驗(yàn)環(huán)境下,對(duì)2 種方法進(jìn)行訓(xùn)練與測(cè)試時(shí)間的對(duì)比如表2 所示。在經(jīng)過(guò)完整的14 個(gè)迭代次數(shù)訓(xùn)練后,本文方法所需的時(shí)間比Faster R-CNN算法少4.68 min。在測(cè)試時(shí)間上,本文方法處理一張圖片所需的時(shí)間與Faster R-CNN 算法僅相差0.01 s。本文方法在提高檢測(cè)精度的同時(shí),并沒(méi)有過(guò)多增加計(jì)算量,且屬于兩階段目標(biāo)檢測(cè)算法,在速度上不與其他一階段算法進(jìn)行比較。
表2 不同方法的訓(xùn)練與測(cè)試時(shí)間Table 2 Training and testing time of different methods
本文各模塊的消融實(shí)驗(yàn)對(duì)比如表3 所示,聚類中心K設(shè)置為6。從表3 可以看出,F(xiàn)aster R-CNN 算法在本文數(shù)據(jù)集上檢測(cè)的AP 值為89.7%,注意力機(jī)制的使用提高AP 值1.7 個(gè)百分點(diǎn),融入先驗(yàn)知識(shí)后的候選框生成模式提高3.3 個(gè)百分點(diǎn),中心損失正則化的使用提高2.4 個(gè)百分點(diǎn)。其中,由注意力機(jī)制導(dǎo)致的性能提升最少,而由K 均值聚類能有效提高性能。
表3 各模塊的消融實(shí)驗(yàn)對(duì)比Table 3 Comparison of each module ablation experiments
2.5.1 注意力機(jī)制分析
為定性分析注意力模塊對(duì)整個(gè)網(wǎng)絡(luò)的影響,采用熱力圖(Grad-CAM[20])方式對(duì)注意力機(jī)制的特征提取結(jié)果進(jìn)行可視化輸出,如圖8 所示紅色區(qū)域表示特征提取的強(qiáng)響應(yīng);藍(lán)色區(qū)域表示特征提取的弱響應(yīng)(彩色效果見(jiàn)《計(jì)算機(jī)工程》官網(wǎng)HTML 版)。相對(duì)于VGG16,VGG16+CBAM 可以產(chǎn)生更強(qiáng)輸出,側(cè)面說(shuō)明注意力機(jī)制能更好地學(xué)習(xí)絕緣子特征并聚焦該特征。但如圖8(b)中的第3 幅圖,當(dāng)航拍圖像中包括較多鐵塔部分時(shí),注意力機(jī)制雖然在一定程度上提高了對(duì)絕緣子區(qū)域的響應(yīng)值,但是絕緣子的周邊區(qū)域也同樣得到了增強(qiáng)。在一定程度影響后續(xù)絕緣子的檢出率。為進(jìn)一步提升注意力機(jī)制作用,除了現(xiàn)有的對(duì)于絕緣子區(qū)域增強(qiáng)措施外,還需要增加對(duì)周邊區(qū)域的抑制措施。
圖8 熱力圖可視化結(jié)果Fig.8 Thermal map visualization results
2.5.2 K 均值聚類分析
不同于經(jīng)典的目標(biāo)檢測(cè)算法,本文通過(guò)使用K 均值聚類算法設(shè)定錨點(diǎn)框的寬高尺寸信息。將訓(xùn)練集中所有真實(shí)框的寬高值作為K 均值聚類算法的輸入;通過(guò)式(3)所示的目標(biāo)函數(shù),不斷減小每個(gè)聚類中心所有樣本對(duì)應(yīng)其中心的距離,最終得到聚類中心即本文需設(shè)定的錨點(diǎn)框?qū)捀叱叽?。影響K 均值聚類性能的關(guān)鍵因素是聚類中心的個(gè)數(shù)。如圖9(a)所示,隨著聚類中心個(gè)數(shù)K的增加,F(xiàn)aster R-CNN 改進(jìn)算法的檢測(cè)精度逐步提高,在聚類中心等于6 時(shí)獲得最高值,隨著聚類中心數(shù)目的增加,算法的檢測(cè)精度呈現(xiàn)下降的趨勢(shì)。
這可能是因?yàn)楸疚牡臋z測(cè)目標(biāo)只是單一絕緣子整體尺寸相差不大,絕緣子多為0°,90°和45°角3個(gè)方向。無(wú)人機(jī)航拍時(shí)在架空輸電線路的一側(cè)飛行,在航拍圖像中靠近無(wú)人機(jī)一側(cè)的絕緣子尺寸較大,而遠(yuǎn)離無(wú)人機(jī)一測(cè)的絕緣子尺寸較小。絕緣子在航拍圖像中的大小就是3個(gè)方向和2個(gè)尺度,共6種情況。圖9(b)為K=6時(shí)的聚類可視化結(jié)果,不同形狀的點(diǎn)表示不同的類簇,五角形狀的點(diǎn)為聚類的中心。
圖9 聚類檢測(cè)結(jié)果Fig.9 Clustering detection results
本文提出一種基于先驗(yàn)知識(shí)的航拍絕緣子檢測(cè)算法,并在絕緣子航拍圖像數(shù)據(jù)集上對(duì)絕緣子進(jìn)行測(cè)試。在Faster R-CNN 基礎(chǔ)算法引入注意力模塊提取航拍圖像中絕緣子的特征信息,基于航拍圖像中絕緣子尺度的先驗(yàn)知識(shí),結(jié)合K 均值聚類算法改進(jìn)目標(biāo)候選框的生成模式。在此基礎(chǔ)上,通過(guò)在訓(xùn)練中引入中心損失正則項(xiàng),增強(qiáng)目標(biāo)絕緣子特征和背景特征的可區(qū)分性。實(shí)驗(yàn)結(jié)果表明,F(xiàn)aster R-CNN改進(jìn)算法檢測(cè)AP 值達(dá)到93.7%,優(yōu)于Faster R-CNN算法。后續(xù)將在進(jìn)一步提升本文算法檢測(cè)精度的同時(shí),對(duì)絕緣子的故障進(jìn)行診斷。