于曉,莊光耀
(天津理工大學(xué)電氣工程與自動化學(xué)院,天津 300384)
隨著經(jīng)濟(jì)水平的不斷提高,工農(nóng)業(yè)生產(chǎn)、生活等用電需求與日俱增,電網(wǎng)規(guī)模不斷擴(kuò)大,對電力設(shè)備的安全可靠性提出了更高要求[1].為避免因電力設(shè)備故障而對生產(chǎn)和生活造成的嚴(yán)重?fù)p失[2],快速準(zhǔn)確地識別電力設(shè)備故障非常重要.電力設(shè)備發(fā)生故障時,常常出現(xiàn)異常發(fā)熱現(xiàn)象,隨著紅外診斷技術(shù)的不斷發(fā)展,紅外技術(shù)在電力設(shè)備中的應(yīng)用逐漸廣泛[3].紅外診斷技術(shù)可以直觀地識別電力設(shè)備發(fā)熱問題,能夠?qū)﹄娏υO(shè)備進(jìn)行實時的、快速的、準(zhǔn)確的故障診斷識別.但電力設(shè)備一般存在于背景復(fù)雜的發(fā)電廠、供電網(wǎng)環(huán)境中,所拍攝電力設(shè)備紅外圖像存在目標(biāo)邊緣模糊、輪廓不完整、設(shè)備重疊遮擋等復(fù)雜情況.雖然有經(jīng)驗的故障識別人員可以發(fā)現(xiàn)電力設(shè)備異常問題,但人工的故障診斷識別效率低;而傳統(tǒng)的機(jī)器學(xué)習(xí)算法對復(fù)雜背景的噪聲干擾的魯棒性較差,因此較低的識別準(zhǔn)確率和泛化能力難以實現(xiàn)針對電力設(shè)備紅外圖像故障的診斷識別.
基于深度學(xué)習(xí)算法的缺陷目標(biāo)識別,利用CNN 網(wǎng)絡(luò)的支持具有更好的泛化能力,可以學(xué)習(xí)和提取電力設(shè)備故障特征.針對電力設(shè)備的故障識別,國內(nèi)外學(xué)者已做了大量研究[4].文獻(xiàn)[5]提出了一種基于VGG16 模型的紅外圖像故障識別方法:首先使用VGG16 模型進(jìn)行特征提取,然后采用支持向量機(jī)(SVM)對特征進(jìn)行分類,最終實現(xiàn)紅外圖像的故障識別.文獻(xiàn)[6]通過利用標(biāo)準(zhǔn)化和殘差連接等技術(shù)改進(jìn)了VGG16 模型的結(jié)構(gòu),提高了模型的性能和穩(wěn)定性.文獻(xiàn)[7]提出了一種利用深度卷積神經(jīng)網(wǎng)絡(luò)和圖像增強(qiáng)技術(shù)進(jìn)行紅外圖像缺陷識別的方法.文獻(xiàn)[8]提出了一種基于多任務(wù)學(xué)習(xí)的電力設(shè)備紅外圖像故障識別方法,該方法能夠有效地識別電力設(shè)備.文獻(xiàn)[9]采用VGG16 網(wǎng)絡(luò)進(jìn)行特征提取,并采用最近鄰分類器進(jìn)行分類,以實現(xiàn)電力設(shè)備紅外圖像的缺陷識別.文獻(xiàn)[10]采用了VGG16 模型提取特征,并通過優(yōu)化網(wǎng)絡(luò)參數(shù)和激活函數(shù),提高了模型的識別性能和魯棒性.文獻(xiàn)[11]利用VGG-16 網(wǎng)絡(luò)提取特征,并通過微調(diào)模型參數(shù),提高了模型的識別性能.文獻(xiàn)[12]以VGG16 為基礎(chǔ)提出了一種基于加權(quán)損失函數(shù)的訓(xùn)練策略,以提高模型的識別性能和魯棒性.文獻(xiàn)[13]對VGG16 網(wǎng)絡(luò)進(jìn)行了改進(jìn),添加卷積層和全連接層,并通過數(shù)據(jù)增強(qiáng)和優(yōu)化網(wǎng)絡(luò)參數(shù)提高模型的識別性能和魯棒性.文獻(xiàn)[14]提出了一種基于VGG16 的新型網(wǎng)絡(luò)架構(gòu),并采用集成學(xué)習(xí)的策略提高模型的識別性能和魯棒性.文獻(xiàn)[15]提出了一種基于遷移學(xué)習(xí)和多尺度特征融合的紅外圖像分類方法.該方法使用遷移學(xué)習(xí),將經(jīng)過大規(guī)模數(shù)據(jù)集訓(xùn)練的VGGNet 網(wǎng)絡(luò)應(yīng)用于紅外圖像分類,并且采用了一種基于多尺度卷積的特征融合方法,從而提高了圖像分類的準(zhǔn)確性.文獻(xiàn)[16]提出了一種利用紅外圖像進(jìn)行變壓器繞組故障診斷的方法.該方法通過對紅外圖像進(jìn)行分析,提取故障的特征,并采用支持向量機(jī)分類器對其進(jìn)行分類診斷.文獻(xiàn)[17]提出了一種針對高壓絕緣子故障診斷的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)方法.該方法通過對卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和訓(xùn)練策略進(jìn)行改進(jìn),有效提高了故障診斷的準(zhǔn)確性和魯棒性.文獻(xiàn)[18]提出了一種將改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)用于紅外圖像分類的方法.該方法通過優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和訓(xùn)練策略,提高了紅外圖像分類的準(zhǔn)確性和魯棒性.文獻(xiàn)[19]提出了一種基于通道注意力和空間注意力機(jī)制的紅外小目標(biāo)識別方法.該方法使用通道注意力機(jī)制提高目標(biāo)特征的重要性,并進(jìn)一步通過空間注意力機(jī)制優(yōu)化識別效果.
電力設(shè)備在運行過程中存在多種變化,例如環(huán)境溫度的變化、照明條件的變化、拍攝角度與距離的變化等,這些變化都會對紅外圖像造成一定程度的影響,高精度的網(wǎng)絡(luò)模型太過繁瑣、模型冗余,而一些追求識別速度的網(wǎng)絡(luò)過于簡單而導(dǎo)致模型的魯棒性不足,從而影響故障識別的準(zhǔn)確性.論文基于電力設(shè)備缺陷在紅外圖像中的實際特征,參考已有研究,提出了一種基于輕量化VGG16 和BCBAM的電力設(shè)備紅外圖像故障診斷識別算法.算法通過優(yōu)化全連接層減少網(wǎng)絡(luò)的計算量,同時將BCBAM注意力機(jī)制嵌套到網(wǎng)絡(luò)模型中,從而提高算法故障診斷識別準(zhǔn)確率.
在當(dāng)今社會,電力設(shè)備已經(jīng)成為支撐國家經(jīng)濟(jì)和社會發(fā)展的重要基礎(chǔ)設(shè)施之一.然而,由于電力設(shè)備長期運行和復(fù)雜的內(nèi)部結(jié)構(gòu),其會出現(xiàn)各種各樣的故障.這些故障不僅會影響電力設(shè)備的正常運行,還會對整個電網(wǎng)的安全和穩(wěn)定性產(chǎn)生不良影響,甚至引發(fā)重大事故.因此,如何提高電力設(shè)備故障診斷的準(zhǔn)確性和速度,已經(jīng)成為當(dāng)前電力領(lǐng)域研究的重點之一.
隨著深度學(xué)習(xí)技術(shù)的不斷進(jìn)步,電力設(shè)備紅外圖像在電力設(shè)備故障診斷中的應(yīng)用越來越受到重視.這種非接觸、非破壞、高精度的技術(shù)能夠準(zhǔn)確反映電力設(shè)備的運行狀態(tài)和故障信息.借助深度學(xué)習(xí)的優(yōu)勢,基于電力設(shè)備紅外圖像故障的診斷和識別已成為電力設(shè)備智能化維護(hù)領(lǐng)域的一個熱門研究方向.圖1 為電力設(shè)備紅外圖像.
由于電力設(shè)備本身的復(fù)雜性和特殊性, 電力設(shè)備紅外圖像故障識別一直面臨著獲取足夠高質(zhì)量數(shù)據(jù)樣本的困難.目前提出的深度學(xué)習(xí)算法在解決這一困難時,高精度的網(wǎng)絡(luò)模型往往過于復(fù)雜冗余,導(dǎo)致故障識別算法的計算復(fù)雜度較高,需要更長的訓(xùn)練時間和更多的計算資源;而一些旨在提高識別速度的網(wǎng)絡(luò)則可能過于簡單,無法很好地提取和分類電力設(shè)備缺陷的復(fù)雜特征,從而對故障識別的準(zhǔn)確性產(chǎn)生一定的限制.因此本文考慮電力設(shè)備缺陷在紅外圖像中的特性,提出了一種基于輕量化VGG16 和BCBAM 的電力設(shè)備紅外圖像故障診斷識別算法.該算法通過優(yōu)化全連接層,減少網(wǎng)絡(luò)計算量,并將BCBAM注意力機(jī)制引入到輕量化VGG16 中.具體來說,一是引入歸一化方法改進(jìn)通道注意力模塊和空間注意力模塊,可以降低不太顯著的特征的權(quán)重;二是在原本級聯(lián)基礎(chǔ)上結(jié)合網(wǎng)絡(luò)特性以及處理過程,將鏈接方式改為并行,將網(wǎng)絡(luò)結(jié)構(gòu)與網(wǎng)絡(luò)性能提升,從而提高算法故障診斷識別準(zhǔn)確率,從而減少人力成本和時間成本,提高電力設(shè)備運行的效率和安全性.
本識別模型利用VGG16 的前三段卷積層強(qiáng)大的特征提取能力,通過將BCBAM注意力機(jī)制引入輕量化VGG16 的第三段卷積后,使兩者深度融合,從而提高對故障的識別精度.整體模型結(jié)構(gòu)如圖2 所示.
圖2 總體結(jié)構(gòu)Fig.2 Overall structure diagram
VGGNet 是一種深度卷積神經(jīng)網(wǎng)絡(luò),其中VGG16 是性能最佳的網(wǎng)絡(luò)之一[20],其在2014 年的ImageNet圖像分類比賽中獲得第二名[21].本文提出的輕量化VGG16 網(wǎng)絡(luò)包含15 個權(quán)重層,由5 段卷積層和1 段全連接層組成,共包含13 個卷積層和2 個全連接層.其結(jié)構(gòu)示意如圖3 所示.
圖3 輕量化VGG16 網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 The structure diagram of lightweight VGG16 network
輕量化VGG16 采用了5 段卷積層來提取圖像的不同層次特征,每段卷積層包含2~3 個卷積層,每個卷積層后都采用ReLU 激活函數(shù).ReLU 激活函數(shù)具有非線性特性,可以防止梯度消失和加快網(wǎng)絡(luò)的訓(xùn)練速度.相比其他激活函數(shù),ReLU 函數(shù)的優(yōu)勢在于它能夠更好地減小反向傳播誤差,使網(wǎng)絡(luò)更快地收斂,因此在網(wǎng)絡(luò)訓(xùn)練過程中,選擇ReLU 函數(shù)更加高效.公式如下
式(1)中:fReLU為ReLU函數(shù)計算結(jié)果;x表示接受區(qū)域的向量.
輕量化VGG16 由經(jīng)典的深度卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化而來,用于圖像分類和目標(biāo)識別任務(wù).它由5 段卷積層和2 個全連接層組成.每一段卷積層包含2 到3 個卷積層,采用3×3 的卷積核提取低、中、高各層的圖像特征,并使用ReLU 激活函數(shù)增加非線性效果,減少過擬合.每段卷積的尾部都接一個2×2 的最大池化層,以減小誤差和捕捉細(xì)節(jié)變化.為了減少計算量,將全連接層的數(shù)量從3 個優(yōu)化為2 個.這些優(yōu)化和設(shè)計使VGG16 網(wǎng)絡(luò)能夠更有效地進(jìn)行特征提取和任務(wù)分類.
輕量化VGG16 網(wǎng)絡(luò)通過逐層的特征學(xué)習(xí),可以捕捉到輸入特征的不同抽象層次,從而具有更強(qiáng)的非線性表達(dá)能力.這種深度網(wǎng)絡(luò)可以更好地表示輸入圖像的復(fù)雜特征,提高分類精度.
CBAM是一種簡單有效的前饋卷積神經(jīng)網(wǎng)絡(luò)注意力模塊,可以對中間特征圖進(jìn)行注意力計算,然后將注意力圖應(yīng)用于輸入特征圖以進(jìn)行自適應(yīng)特征優(yōu)化.CBAM模塊分別在通道和空間兩個維度上計算注意力圖,是一種輕量級通用模塊,可以無縫地集成到各種卷積神經(jīng)網(wǎng)絡(luò)中,并與基礎(chǔ)網(wǎng)絡(luò)一起進(jìn)行端到端的訓(xùn)練,具有很高的可擴(kuò)展性和靈活性.CBAM結(jié)構(gòu)如圖4 所示.
圖4 CBAM 結(jié)構(gòu)Fig.4 CBAMStructure diagram
通道注意力模塊是通過全局平均池化和全局最大池化得到一個1×1×C的特征圖,然后將其輸入到共享的多層感知機(jī)中進(jìn)行處理,得到的多層感知機(jī)輸出特征與Sigmoid 激活函數(shù)結(jié)合,獲得通道權(quán)重Mc.將通道權(quán)重與輸入特征F相乘,從而得到優(yōu)化后的特征圖.這個過程可以使用通道注意力公式來表示.由于通道注意力是一個輕量級的通用模塊,因此可以方便地與各種CNN 架構(gòu)結(jié)合使用,并在端到端訓(xùn)練過程中進(jìn)行無縫集成.通道注意力的公式為
式(2)(3)中:σ 為Sigmoid激活函數(shù),MLP為共享參數(shù)的感知器,GAP為全局平均池化,GMP為全局最大池化, ?為逐元素相乘.
與通道注意力模塊不同,空間注意力模塊先對輸入特征進(jìn)行全局平均池化和全局最大池化,然后將這兩個池化結(jié)果拼接在一起.這個拼接的特征圖會被送到卷積層,并經(jīng)過Sigmoid激活函數(shù)得到空間權(quán)重系數(shù)Ms,然后將Ms與輸入特征F1相乘,即可完成空間注意力的計算.這個計算過程可以用以下公式表示
式(4)(5)中:σ 為Sigmoid激活函數(shù),conv為卷積核為7×7 的卷積操作;GAP為全局平均池化;GMP為全局最大池化;? 為逐元素相乘.
為了避免模型精度下降、梯度消失、梯度爆炸等問題的出現(xiàn),有效地節(jié)省網(wǎng)絡(luò)計算量以及計算時長,本文提出了BCBAM注意力模塊.
首先,在通道注意力模塊和空間注意力模塊中引入歸一化方法,可以降低不太顯著特征的權(quán)重,這種方式在注意力模塊上應(yīng)用了稀疏的權(quán)重懲罰,使這些權(quán)重在計算上更加高效,同時能夠保持同樣的性能.
對于通道注意力子模塊,使用Batch Normalization 中的縮放因子,如下式所示
縮放因子是Batch Normalization(BN)中的方差,它能夠反映出各個通道的變化大小,并反映該通道的重要性.方差越大,表示該通道的變化越劇烈,其中包含的信息也會更加豐富且重要性更高.反之,對于變化較小的通道,信息單一且重要性較低.通道注意力子模塊如圖5 所示,通道注意力的權(quán)重如式(7)所示.
圖5 通道注意力子模塊Fig.5 Channel attention submodule
MC表示最后得到的輸出特征,γ 是每個通道的縮放因子,因此,每個通道的權(quán)值可以得到,對空間中的每個像素使用同樣的歸一化方法,就可以得到空間注意力的權(quán)重,如式(8)所示,空間注意力如圖6 所示.
圖6 空間注意力子模塊Fig.6 Spatial attention sub-module
為抑制非重要特征,在損失函數(shù)中加入一個正則化項,如式(9)所示
然后在原本級聯(lián)基礎(chǔ)上結(jié)合網(wǎng)絡(luò)特性以及處理過程, 將鏈接方式改為并行,BCBAM注意力模塊如圖7 所示,對原始CBAM的串行注意力模塊原來的級聯(lián)模式改為并行模式后,兩種注意力模塊均可以直接獲得圖像的原始特征,不需要關(guān)注注意力的運算順序,從原始的特征圖中運算的兩種注意力機(jī)制捕獲權(quán)值信息,將權(quán)值信息直接加權(quán)到原始特征圖,從而方便網(wǎng)絡(luò)捕獲目標(biāo)信息,計算公式如下
圖7 BCBAM 注意力機(jī)制模塊圖Fig.7 BCBAMattention mechanism module diagram
BCBAM注意力網(wǎng)絡(luò)模塊對不同通道的差異性捕捉能力更強(qiáng),能夠較好地對不同通道圖像信息進(jìn)行比對、搜集.而空間注意力模塊的作用是抓捕圖像的不同目標(biāo)的空間信息,從兩個方面豐富圖像的特征.
因為電力設(shè)備復(fù)雜特殊,所以電力設(shè)備紅外圖像故障識別一直存在獲取高質(zhì)量數(shù)據(jù)樣本難的問題,而缺少樣本容易導(dǎo)致過擬合問題和模型失去泛化能力.本模型通過采用隨機(jī)翻轉(zhuǎn)、旋轉(zhuǎn)和裁剪等方法對電力設(shè)備紅外數(shù)據(jù)圖像擴(kuò)充數(shù)據(jù),增加數(shù)據(jù)集的多樣性,這相當(dāng)于擴(kuò)充了更多的訓(xùn)練和測試樣本.最終電力設(shè)備紅外圖像數(shù)據(jù)集包括2 000 多張圖像,并使用其中80%作為訓(xùn)練數(shù)據(jù),20%作為測試數(shù)據(jù),以驗證改進(jìn)模型對電力設(shè)備故障的診斷識別能力.部分?jǐn)U充后的電力設(shè)備紅外圖像如圖8 所示.
圖8 部分?jǐn)?shù)據(jù)集Fig.8 Some examples of the dataset
實驗用的電腦配置及環(huán)境如表1 所示.
表1 實驗配置及環(huán)境Tab.1 Experimental configurations and environments
準(zhǔn)確率(Precision)表示在匹配結(jié)果中有多少樣本是正確的,計算方法如下式所示
式(11)中:TP代表正確的預(yù)測值,FP代表錯誤的預(yù)測值.
平均精度AP表示一個類別的所有準(zhǔn)確率的平均值.計算AP其數(shù)值為集合中某一類別的全部準(zhǔn)確率之和與包含此類對象的總圖像Nc的比率,具體見式(12)
然后再計算平均精度均值mAP,mAP 值見式(13)
式(13)中:C表示總類別數(shù).
為測試本模型引入BCBAM 注意力機(jī)制后輕量化VGG16 網(wǎng)絡(luò)故障診斷識別精度,本實驗使用了Resnet50、Faster-RCNN 和傳統(tǒng)VGG16 模型作為實驗比較算法.在電力設(shè)備紅外圖像中,光照和拍攝角度與距離的變化會對故障的識別產(chǎn)生影響,Resnet50 和傳統(tǒng)VGG16 模型的表現(xiàn)較差,準(zhǔn)確率不高.另一方面,由于環(huán)境溫度的變化會對電力設(shè)備紅外圖像產(chǎn)生影響,因此Faster-RCNN 模型對故障的識別準(zhǔn)確率下降.部分樣本故障診斷結(jié)果如表2 所示.
表2 故障診斷結(jié)果Tab.2 Fault diagnosis results
實驗定量分析結(jié)果見表3.
表3 實驗定量分析Tab.3 Quantitative analysis of experiments
通過表3 可以看出,本文算法的mAP相比傳統(tǒng)VGG16 網(wǎng)絡(luò)提高了2.8 個百分點,相比Resnet50 網(wǎng)絡(luò)提高了6.9 個百分點,相比Faster-RCNN 網(wǎng)絡(luò)提高了3.6 個百分點.實驗數(shù)據(jù)表明,這一改進(jìn)的網(wǎng)絡(luò)模型在準(zhǔn)確率評價指標(biāo)上優(yōu)于傳統(tǒng)VGG16、Resnet50 和Faster-RCNN 等模型,改進(jìn)模型具有較為準(zhǔn)確的故障識別能力.其變化用折線圖表示,見圖9.從圖9 可以直觀地看出本算法相比其他幾種算法在本數(shù)據(jù)集上有很好的表現(xiàn).
圖9 實驗結(jié)果對比折線圖Fig.9 Line chart comparing experimental results
基于輕量化VGG16 和BCBAM的電力設(shè)備故障診斷紅外圖像識別算法,考慮了電力設(shè)備缺陷在紅外圖像中的特性.該算法通過優(yōu)化全連接層,減少網(wǎng)絡(luò)計算量,并將BCBAM 注意力機(jī)制引入輕量化VGG16 中.具體來說,引入歸一化方法改進(jìn)通道注意力模塊和空間注意力模塊,可以降低不太顯著的特征的權(quán)重;然后在原本級聯(lián)基礎(chǔ)上結(jié)合網(wǎng)絡(luò)特性以及處理過程,將鏈接方式改為并行,將網(wǎng)絡(luò)結(jié)構(gòu)與網(wǎng)絡(luò)性能提升,從而提高算法故障診斷識別準(zhǔn)確率.實驗數(shù)據(jù)表明,改進(jìn)模型具有迅速準(zhǔn)確地識別故障的能力,在準(zhǔn)確率評價指標(biāo)上優(yōu)于傳統(tǒng)VGG16、Resnet50 和Faster-RCNN 等模型,從而驗證了算法對故障診斷識別的準(zhǔn)確度.