趙園喜,邱志斌,朱 軒,余沿臻,周志彪
(1.南昌大學(xué)能源與電氣工程系,江西南昌 330031;2.武漢大學(xué)電氣與自動化學(xué)院,湖北武漢 430072)
絕緣子作為輸電線路上的重要部件,起著懸掛導(dǎo)線與電氣絕緣的關(guān)鍵作用。長期工作在露天環(huán)境下,運行中的絕緣子容易出現(xiàn)不同類型的故障,例如自爆[1-2]、破損[3-4]與電弧灼傷、老化[5]等,嚴重影響輸電線路安全穩(wěn)定運行,實現(xiàn)絕緣子的定期巡檢尤為重要。
目前線路巡檢人員通常采用現(xiàn)場勘察,或攀爬機器人巡檢的方式對絕緣子缺陷進行檢測,檢測效率不高。機器學(xué)習(xí)方法憑借穩(wěn)定的分類效果和快速的檢測性能在圖像識別領(lǐng)域得到廣泛應(yīng)用,通常包括圖像數(shù)據(jù)集的構(gòu)建、預(yù)處理、特征數(shù)據(jù)提取以及分類器訓(xùn)練等流程[6]。文獻[7]提出了一種絕緣子檢測和缺陷分類算法,利用單片絕緣子圖像的局部方向性特征(Local Derivative Pattern,LDP)與旋轉(zhuǎn)不變局部方向性特征(Rotation Invariant-Local Derivative Pattern,RI-LDP)對支持向量機進行訓(xùn)練,缺陷識別率為89.94%。文獻[8-9]提出了一種復(fù)合絕緣子缺陷識別方法,利用橢圓曲線對Canny 算子提取的絕緣子邊緣進行擬合,并通過擬合前后邊緣曲線的差異有效識別絕緣子缺陷區(qū)域。文獻[10]根據(jù)玻璃絕緣子和陶瓷絕緣子的顏色特征和空間形態(tài)特征識別絕緣子目標區(qū)域,對目標區(qū)域進行形態(tài)處理以突出斷層位置,并根據(jù)有無斷層絕緣子的空間特征實現(xiàn)故障識別,測試精度達90.6%。文獻[11]通過顏色特征分割絕緣子圖像,并標記圖像中絕緣子連接區(qū)域,根據(jù)連接區(qū)域的垂直長度與相鄰絕緣子的水平距離確定缺陷判別式從而檢測絕緣子缺陷。文獻[12]利用提取的方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征與灰度共生矩陣(Gray-Level Cooccurrence Matrix,GLCM)特征對優(yōu)化的粒子群算法優(yōu)化支持向量機(Particle Swarm Optimization-Support Vector Machines,PSO-SVM)分類器進行訓(xùn)練,以實現(xiàn)完好和缺陷絕緣子的分類識別,缺陷絕緣子識別準確率為90%。
考慮到絕緣子及其缺陷邊緣信息不顯著[13]與單個特征的局限性,本文提出了一種基于結(jié)構(gòu)相似性指標策略-Sobel(Structural Similarity Index Measure-Sobel,SSIM-Sobel)與多特征融合的絕緣子缺陷分類識別方法。利用SSIM-Sobel 算法強化絕緣子缺陷邊緣,增強圖像對比度;再提取其HOG 特征、局部二值特征(Local Binary Pattern,LBP)與GLCM 特征,并將其融合后輸入隨機森林分類器進行訓(xùn)練,實現(xiàn)絕緣子缺陷的分類識別。
絕緣子缺陷識別易受光照、拍攝角度等外界因素影響,為此本文采用拉普拉斯銳化、伽馬校正與SSIM-Sobel 邊緣提取算法增強圖像對比度并強化絕緣子缺陷邊緣。具體步驟如下:
1)采用拉普拉斯銳化[14]、伽馬校正算法[15]突出絕緣子及缺陷邊緣細節(jié)。采用[0,1,0;1,-4,1;0,1,0]的拉普拉斯模板對二維絕緣子圖像g(x,y)進行濾波處理,獲得其拉普拉斯銳化圖h(x,y),x與y分別為行像素與列像素。根據(jù)式(1)對h(x,y)進行伽馬校正,以增強絕緣子圖像對比度。
式中:γ為伽馬系數(shù),本文取為1.2[16];?2g(x,y)為求圖像g(x,y)的二階微分。
2)計算SSIM 值[17]以自適應(yīng)選取Sobel 算子模板。其原理是將一幅完好絕緣子圖像作為固定模板Y,對任意輸入圖像X 與Y 作圖像分塊處理,并按照式(2)計算各分塊SSIM 的值(用TSSIM表示,無量綱),再以其均值作為預(yù)處理后絕緣子圖像整體TSSIM,TSSIM計算公式為:
式中,α,β,λ為權(quán)重;I(x,y),c(x,y),s(x,y)分別為亮度、標準差和結(jié)構(gòu)對比度,可表示為:
式中:μx和μy分別為圖像X,Y 的平均灰度;σx和σy分別為圖像X,Y 的標準差;σxy為X 與Y 的協(xié)方差;L為圖像灰度級數(shù);K1,K2為遠小于1 的常數(shù)。
以完好、破損、電弧灼傷各15 幅絕緣子圖像作為基礎(chǔ),提取其TSSIM,繪制圖1 所示曲線,可知當TSSIM為0.45 時能夠有效區(qū)分絕緣子完好、破損缺陷狀態(tài),故本文取TSSIM閾值為0.45。
圖1 閾值選取示意圖Fig.1 Diagram showing threshold selection
3)自適應(yīng)選取Sobel 邊緣提取模板[18]。計算任意絕緣子圖像與模板圖像的TSSIM,并與預(yù)先設(shè)置閾值進行比較,按照式(4)自適應(yīng)選取圖2 中3×3 與5×5 的水平和垂直Sobel 邊緣提取模板,利用不同尺度模板與圖像f(x,y)分別進行卷積得到不同邊緣強化圖像。
圖2 Sobel方向模板圖示Fig.2 Illustration of Sobel direction template
以一幅電弧灼傷圖像為例,處理前后效果如圖3 所示。
圖3 邊緣強化效果對比圖Fig.3 Comparison of edge strengthening effect
為克服單個特征無法全面描述圖像的局限性,提出一種多特征融合的絕緣子缺陷分類識別方法,實現(xiàn)流程如圖4 所示。
圖4 絕緣子缺陷分類識別流程Fig.4 Process of insulator defect classification identification
2.1.1 HOG特征
HOG 是由DALAL 等人[19]提出的一種描述圖像局部特征的算子。針對邊緣強化絕緣子圖像,根據(jù)式(5)和式(6)計算圖像中每個像素點的梯度。
式中:K(x,y),δ(x,y)分別為像素(x,y)的梯度幅值與方向;Kx(x,y)與Ky(x,y)分別為其水平和垂直方向梯度。
式中:H(x,y)為像素值。
將絕緣子圖像劃分若干個8×8 的單元,統(tǒng)計每個單元的梯度方向直方圖,并進行加權(quán)投影(其原理是將2π角度平均劃分為若干個方向塊,并計數(shù)相應(yīng)梯度方向內(nèi)存在的梯度幅值數(shù)目),構(gòu)成每個單元的HOG 特征;最終串聯(lián)若干個單元組成block(塊)的HOG 特征,再串聯(lián)每個block 的HOG 特征,以提取圖像的HOG 特征。
2.1.2 LBP特征
LBP 是一種具有旋轉(zhuǎn)不變性和良好光照魯棒性的局部紋理特征算子,其原理是以任意中心像素點(xc,yc)構(gòu)建一個半徑為R的圓形鄰域[20],根據(jù)式(7)計算中心像素點周圍p個像素點的灰度值,并與中心像素點的灰度值比較,形成p位二進制數(shù),然后根據(jù)矩陣編碼轉(zhuǎn)化為十進制數(shù),即為(xc,yc)的LBP 特征值。特征數(shù)據(jù)TLBP可描述為:
式中:ic為像素點(xc,yc)的灰度值;ip為鄰域內(nèi)像素點(xp,yp)的灰度值。
2.1.3 GLCM特征
GLCM 特征提取原理為通過統(tǒng)計一幅圖像中任意兩像素點在一定距離d與方向θ下成對出現(xiàn)的概率,構(gòu)建GLCM 灰度共生矩陣,以反映圖像的方向、距離和灰度值變化。GLCM 在點(x,y)處的概率值可表示為:
式中:a,b為偏移量;方向θ取0°;i,j分別為兩像素點的灰度值。
由于灰度共生矩陣參數(shù)量較大,常選用統(tǒng)計特征來表征圖像紋理特征。在HARALICK[21]定義的14 種描述圖像紋理的統(tǒng)計特征中,選用角二階矩(Angular Second Moment,ASM)、對比度(Contrast,CON)、熵(Entropy,ENT)與逆差距(Inverse Differential Moment,IDM)來構(gòu)建GLCM 紋理特征,它們的值用DASM,DCON,DENT和DIDM表示。
最后根據(jù)式(10)對HOG,LBP 與GLCM 特征進行串行特征融合[22],融合特征FM作為分類器的訓(xùn)練與測試數(shù)據(jù)。
式中:Concat 為串行特征融合運算;FHOG,F(xiàn)LBP與FGLCM分別為HOG,LBP 與GLCM 的特征數(shù)據(jù)值。
隨機森林(Random Forest,RF)是一種基于決策樹的有監(jiān)督的學(xué)習(xí)算法[23]。輸入樣本與特征數(shù)據(jù)的隨機選取使RF 分類器能夠充分降低數(shù)據(jù)過擬合的影響,具有較強的泛化能力,其結(jié)構(gòu)如圖5 所示。
圖5 RF分類模型Fig.5 RF classification model
從訓(xùn)練樣本中有放回地隨機抽取K個樣本數(shù)據(jù)構(gòu)建一個訓(xùn)練子集[24],將其作為根節(jié)點存儲數(shù)據(jù);多次抽取構(gòu)建n個訓(xùn)練子集,每個訓(xùn)練子集對應(yīng)一棵分類回歸樹,并進行分類樹分裂;在分類樹分裂時,從全部M維度特征數(shù)據(jù)中隨機選取m維(m<<M),再根據(jù)基尼系數(shù)最小原則選取最優(yōu)分裂特征將樣本劃分為2 個子節(jié)點,直至子節(jié)點基尼系數(shù)為0?;嵯禂?shù)G(p)計算方式為:
式中:k為類別數(shù);pi為第i個類別樣本比例。
將n棵樹組成隨機森林,并根據(jù)投票原則,選擇得票數(shù)目最多的作為最終分類結(jié)果。
根據(jù)無人機[25]航拍收集的1 690 幅原始絕緣子圖像樣本,手動提取出完好、破損、電弧灼傷3 種絕緣子片圖像,每類圖像500 幅,共計1 500 幅,構(gòu)建本文算例所需的絕緣子圖像數(shù)據(jù)集。其中,3 類典型圖像如圖6 所示。算例實現(xiàn)與分析過程中,按照8:2 的比例劃分為訓(xùn)練集和測試集,結(jié)合邊緣強化處理、特征提取與融合、RF 分類器,實現(xiàn)絕緣子完好、破損、電弧灼傷3 種狀態(tài)的分類識別。
圖6 典型絕緣子圖像樣本Fig.6 Typical insulator image samples
為便于分析模型性能,采用檢測分類中常用的精準率P、召回率R及平均精準率PA評價指標來評估模型的分類效果。其數(shù)學(xué)表達式為:
式中:TP為正確分類的目標數(shù)量;FP為將其他目標分類為正確目標的數(shù)量;FN為將正確目標分類為其他目標的數(shù)量;TP+FP為已分類目標總數(shù);TP+FN為待分類目標總數(shù);Pi為第i類目標精準率;N為分類目標種類,本文為3。
針對絕緣子及其缺陷邊緣信息不顯著問題[26],本文通過SSIM-Sobel 方法強化絕緣子及其缺陷邊緣,并與原始Sobel 算法進行對比,其結(jié)果如表1 所示。可以看出,本文提出的SSIM-Sobel 方法在絕緣子缺陷的分類精準率與平均精準率上均有大幅提升,其中以絕緣子破損缺陷的精準率提升最為顯著。GLCM 與LBP 特征對應(yīng)的破損缺陷精準率分別提升33%和13%,HOG 特征對應(yīng)的精準率高達99%,驗證了SSIM-Sobel 方法能夠有效增強絕緣子及其缺陷的邊緣,提高分類器的識別精度。
表1 Sobel算子優(yōu)化結(jié)果對比Table 1 Comparison of optimization results between Sobel operators %
同時,為了驗證本文提出的多特征融合策略,開展了如表2 所示的4 組消融實驗。根據(jù)表2 結(jié)果可知,HOG 與GLCM 特征融合時PA值最低;LBP與GLCM 特征融合,及HOG 與LBP 特征融合時,其R值與PA值能夠達到87%以上,能夠有效減少誤檢現(xiàn)象;而當HOG,LBP,GLCM 3 個特征融合時,絕緣子缺陷識別效果最優(yōu),達92.67%,其中破損缺陷的精準率達99%,驗證了本文提出的多特征融合方法能夠有效提高絕緣子缺陷的識別精度[27-29]。
表2 不同特征融合的結(jié)果對比Table 2 Comparison of results with different feature fusion %
基于HOG,LBP 與GLCM 特征融合數(shù)據(jù),分別對額外構(gòu)建的最鄰近分類(K Nearest Neighbor,KNN)、支持向量機(Support Vector Machines,SVM)與樸素貝葉斯(Naive Bayes,NB)分類器進行訓(xùn)練與測試,驗證RF 分類器在絕緣子缺陷分類上的優(yōu)越性,結(jié)果如表3 所示。
表3 訓(xùn)練不同分類器模型的實驗結(jié)果對比Table 3 Comparison of experimental results for training different classifier models %
根據(jù)表3 結(jié)果可知,KNN 分類器雖然能夠在絕緣子破損缺陷識別上P值達100%,但對電弧灼傷而言其P值僅為25%;NB 與SVM 分類器的PA值分別能夠達到83.67%和85.67%,且有效減少了誤檢情況。總體而言,RF 分類器結(jié)果最優(yōu),具有92.67%的分類平均精準率和91.29%的召回率,優(yōu)于其他3 種分類器。
本文根據(jù)輸電線路絕緣子圖像數(shù)據(jù)集,開展了基于SSIM-Sobel 與多特征融合的絕緣子缺陷識別算例,對比分析了Sobel 算子優(yōu)化前后、多特征融合與不同分類器對缺陷識別精度的影響,得出如下結(jié)論:
1)采用SSIM-Sobel 算法可以有效強化絕緣子及其缺陷的邊緣,在實驗中相對于Sobel 算法處理的圖像識別平均精準率提高20%以上。
2)提出的多特征融合方法,能夠為絕緣子缺陷識別提供更有效的信息,識別的平均精準率可達92.67%,可助力輸電線路巡檢人員開展絕緣子日常運維工作。
3)提出的多特征融合與隨機森林集成學(xué)習(xí)分類方法與SVM 等分類器進行比較,缺陷識別率有明顯的提升,具有良好的魯棒性。