王碩禾,鞏方超,2,古曉東,田繼祥,金 格,牛江川
(1.石家莊鐵道大學(xué) 電氣與電子工程學(xué)院,河北 石家莊 050043;2.威海海洋職業(yè)學(xué)院,山東 威海 264300;3. 中國(guó)鐵路設(shè)計(jì)集團(tuán)有限公司,天津 300142)
牽引變電站作為電氣化鐵路的核心樞紐,其室外長(zhǎng)期運(yùn)行的電氣設(shè)備受環(huán)境影響出現(xiàn)的各類故障易對(duì)牽引供電系統(tǒng)的安全穩(wěn)定運(yùn)行造成沖擊。這些故障設(shè)備整體或局部的溫度會(huì)發(fā)生變化,呈現(xiàn)出不同于正常狀態(tài)的熱像特征。當(dāng)前,多數(shù)基于紅外熱成像檢測(cè)技術(shù)的變電站電氣設(shè)備熱狀態(tài)監(jiān)測(cè)還是僅依靠操作人員的經(jīng)驗(yàn)分析紅外圖像,進(jìn)而對(duì)電氣設(shè)備的熱故障做出診斷[1]。
解決人工巡檢出現(xiàn)的耗時(shí)耗力、檢測(cè)精度低、可靠性差等問題的方法之一,就是結(jié)合紅外技術(shù)和機(jī)器視覺對(duì)電氣設(shè)備類型及故障進(jìn)行識(shí)別[2-3],提升圖像分析處理的自動(dòng)化與智能化水平。文獻(xiàn)[4]通過提取紅外圖像的HOG特征,選擇支持向量機(jī)進(jìn)行特征分類,本文采用HOG特征有效分類了局部場(chǎng)景下的高壓設(shè)備。但HOG算法對(duì)圖像的空間信息描述不足,無法更細(xì)致地判別設(shè)備圖像的局部外觀和形狀信息,對(duì)此有學(xué)者提出PHOG(Pyramid Histogram of Oriented Gradients)算法來進(jìn)行改進(jìn)[5]。文獻(xiàn)[6]結(jié)合GLOH描述子和GVF Snake模型精準(zhǔn)分割絕緣子,并通過分析統(tǒng)計(jì)直方圖來實(shí)現(xiàn)零值絕緣子的自動(dòng)檢測(cè)。對(duì)于零值絕緣子本方法檢測(cè)效果較好,但是并不適合其他狀態(tài)的絕緣子或其他電氣設(shè)備。文獻(xiàn)[7]利用Faster-RCNN精確定位,采用深度殘差網(wǎng)絡(luò)(Res-Net)提取圖像特征,最后利用稀疏表示進(jìn)行絕緣子狀態(tài)分類。文獻(xiàn)[8]結(jié)合紅外圖像和可見光圖像分割變壓器故障子圖像,并在Tensorflow上搭建卷積神經(jīng)網(wǎng)絡(luò)(CNN)對(duì)巡檢目標(biāo)進(jìn)行圖像分類和識(shí)別。這兩類方法均采用深度學(xué)習(xí)算法訓(xùn)練,相較于傳統(tǒng)方法,有更高的準(zhǔn)確率,但運(yùn)算開銷較大,難以達(dá)到實(shí)時(shí)要求。文獻(xiàn)[9]采用Gist算法和PHOG算法進(jìn)行全局和局部的特征提取,并以Gist+i*PHOG形式進(jìn)行特征融合,但最后的分類準(zhǔn)確率不高,識(shí)別率僅達(dá)60%~80%。
多特征融合技術(shù)[10-11]一直以來都受到高度重視,已成為解決圖像整體信息特征與局部信息特征描述矛盾的方法之一。鑒于此,本文融合設(shè)計(jì)了FastPCA和PHOG特征加權(quán)融合的特征描述子,同時(shí)聯(lián)合優(yōu)化參數(shù)的SVM作為分類器,設(shè)計(jì)了紅外圖像下高壓電氣設(shè)備類型及其故障狀態(tài)識(shí)別系統(tǒng)。該系統(tǒng)首先引入K-means完成紅外圖像分割,然后對(duì)提取的FastPCA和PHOG特征向量進(jìn)行數(shù)據(jù)規(guī)格化描述,并加權(quán)融合成新的混合描述子;最后,輸入到訓(xùn)練好的SVM分類器進(jìn)行分類,并分析紅外圖像下電氣設(shè)備劃分層數(shù)L、錯(cuò)誤代價(jià)系數(shù)C以及RBF(徑向基函數(shù))核自身的參數(shù)γ取值大小對(duì)識(shí)別精度與速度的影響。經(jīng)試驗(yàn)證明,該算法有效提升了特征提取效率、電氣設(shè)備類型及故障識(shí)別的準(zhǔn)確率。
根據(jù)上述相關(guān)研究成果和設(shè)備圖像先驗(yàn)知識(shí),結(jié)合現(xiàn)場(chǎng)訓(xùn)練樣本集的分析,發(fā)現(xiàn)快速主成分分析法(Fast Principal Component Analysis,F(xiàn)astPCA)對(duì)圖像全局特征描述能力強(qiáng),而金字塔式梯度方向直方圖PHOG在兼具HOG良好的局部特征描述能力的同時(shí),魯棒性和幾何光學(xué)不變性較強(qiáng),所以本文選擇它們作為互補(bǔ)特征。
主成分分析法PCA是一種基于協(xié)方差矩陣對(duì)信息進(jìn)行處理壓縮的有效方法[12],能很好地解決維度災(zāi)難問題。但是PCA算法中樣本協(xié)方差矩陣的本征值和本征向量計(jì)算非常耗時(shí),當(dāng)維數(shù)d較大時(shí)計(jì)算復(fù)雜度會(huì)非常高,常會(huì)耗盡計(jì)算機(jī)的內(nèi)存。后來經(jīng)過加速的FastPCA則可以快速計(jì)算協(xié)方差矩陣非零本征值所對(duì)應(yīng)的本征向量。
設(shè)協(xié)方差矩陣S為
(1)
式中:xi為樣本,大小為1×d;m為樣本均值。若設(shè)Zn×d=xi-m,則協(xié)方差矩陣S的表達(dá)式可改寫為S=(ZTZ)d×d。令R=(ZZT)n×n,由于實(shí)際應(yīng)用中樣本數(shù)目n遠(yuǎn)小于樣本維數(shù)d,所以R的尺寸遠(yuǎn)小于S,但R卻與S有著相同的非零本征值。計(jì)算分析,設(shè)n維列向量ν是R的本征向量,那么
(ZZT)ν=λν
(2)
對(duì)于式(2)ν兩邊同時(shí)左乘ZT,整理得
(ZTZ)(ZTν)=λ(ZTν)
(3)
式(3)說明λ為協(xié)方差矩陣S=(ZTZ)d×d的特征值。通過上述分析不難得出,先計(jì)算小矩陣R的本征向量ν,再對(duì)公式進(jìn)行左乘ZT得到散布矩陣S=(ZTZ)d×d的本征向量ZTν來達(dá)到簡(jiǎn)化計(jì)算目的。本文利用 FastPCA 快速降維,刪減部分區(qū)分力較差的特征,擴(kuò)大了差異性較大的特征占比,快速降維后識(shí)別正確率往往會(huì)提高。
自Navneet Dalal和Bill Triggs在2005年的CVPR上提出HOG后,這種主要用來描述圖像局部特征的方法得到了許多科研工作者的青睞[13]。具體描述就是將圖像分成若干胞元,計(jì)算得出每個(gè)胞元的梯度直方圖作為一個(gè)本征向量,每4個(gè)胞元組成一個(gè)塊,然后把圖像所有分塊的特征向量組合合成目標(biāo)圖像的HOG本征向量。HOG雖然具有較強(qiáng)的圖像邊緣信息描述能力,但是對(duì)于圖像的空間信息描述不足。因此,Anna Bosch采取空間四叉樹分解方法,劃分目標(biāo)圖像子空間,并且進(jìn)行多尺度表達(dá),通過利用已經(jīng)劃分的空間區(qū)域分析邊緣特征的梯度方向直方圖來體現(xiàn)目標(biāo)特征,即PHOG[5](金字塔式梯度方向直方圖)。圖1為絕緣子紅外圖像不同尺度L下PHOG特征的梯度柱狀圖。
圖1 不同尺度PHOG特征的梯度柱狀圖
PHOG相對(duì)于HOG可以檢測(cè)到不同尺度L下圖像的特征,能夠更好地進(jìn)行巡檢目標(biāo)圖像描述,展現(xiàn)出更豐富的特征信息,但另一方面其特征計(jì)算量與L成正比增加。這是因?yàn)楫?dāng)圖像所劃分的層次過高時(shí),所分無效信息區(qū)域概率增大,它們不包含必要的圖像邊緣特征,反而增加了特征向量的長(zhǎng)度和計(jì)算時(shí)間,且會(huì)對(duì)之后的分類產(chǎn)生干擾。因此,選取合適的L值對(duì)具體應(yīng)用很關(guān)鍵。
由于不同的描述子對(duì)圖像的特征描述各有側(cè)重,很多情況下是無法達(dá)到最優(yōu)的,如前文所介紹的兩種應(yīng)用算法:FastPCA更強(qiáng)調(diào)對(duì)圖像的全局特征描述,PHOG對(duì)圖像的局部特征則有更強(qiáng)的描述能力。針對(duì)紅外圖像下變電站電氣設(shè)備類型及其故障識(shí)別問題,以及受多特征融合技術(shù)的啟發(fā),本文提出兩種特征加權(quán)融合的混合描述子,同時(shí)設(shè)計(jì)了變電站電氣設(shè)備類型及其故障狀態(tài)識(shí)別算法。因此,本文算法提取的特征充分利用了圖像全局和局部的信息,有效解決了圖像整體信息特征和局部信息特征描述的矛盾,為后續(xù)的分類工作奠定了良好的基礎(chǔ)。
本文算法具體流程見圖2。
圖2 識(shí)別系統(tǒng)算法流程
由于變電站各種電氣設(shè)備之間的分布比較緊湊,從而導(dǎo)致巡檢拍攝的電氣設(shè)備圖片背景異常復(fù)雜。因此,引入改進(jìn)的K-means算法進(jìn)行紅外圖像分割,該方法根據(jù)原始圖像直方圖估計(jì)聚類數(shù)K值,分割前分別采用直方圖均衡化、模糊集理論進(jìn)行對(duì)比度調(diào)整和增強(qiáng)圖像,為后續(xù)K-means算法對(duì)圖像數(shù)據(jù)的處理做準(zhǔn)備[14]。
本文算法提取的FastPCA和PHOG特征數(shù)量巨大,為防止采集圖像特征數(shù)據(jù)中大的數(shù)字范圍的壓倒性,必須進(jìn)行數(shù)據(jù)規(guī)格化。通常應(yīng)用最大最小規(guī)格化方法 (min-max Normalization),其實(shí)質(zhì)是進(jìn)行一種線性轉(zhuǎn)換,將原屬性A的一個(gè)值v映射為新v′(v′∈[newmaxA,newminA]),設(shè)vminA和vmaxA為v的最小值和最大值,則有
(4)
為得到類內(nèi)差異小、類間差異大的最佳區(qū)分力特征,本方法采用 FastPCA 從樣本圖像提取主成分,利用投影進(jìn)行基的轉(zhuǎn)換和降維,得到相應(yīng)的FastPCA特征向量;再結(jié)合PHOG 對(duì)該巡檢設(shè)備目標(biāo)圖像進(jìn)行不同尺度的分割,采集分割后圖像邊緣輪廓的梯度方向直方圖并串聯(lián)成一維特征向量,即 PHOG 特征向量。
在主成分分析時(shí),從描述能力和速度的角度出發(fā),一般對(duì)特征向量選取20維特征,所以設(shè)提取的FastPCA特征為20維的特征向量Y。在PHOG(L=1時(shí))中,每個(gè)Block生成的描述子維度36或45(順序疊加4個(gè)胞元的9個(gè)bin的直方圖,會(huì)額外添加9維的整體信息),所以設(shè)提取的PHOG特征為45維特征向量X。在進(jìn)行數(shù)據(jù)歸一化后,為區(qū)別FastPCA特征和PHOG特征的權(quán)重,可將其分別乘以權(quán)重系數(shù)α、β,再重新組合,構(gòu)成新的65維描述子。
權(quán)重系數(shù)α、β的選取非常重要,它們都為正數(shù)且滿足約束條件α+β=1。首先在0~1區(qū)間內(nèi)選取等間隔的10組α、β值;而后,針對(duì)不同組的權(quán)重系數(shù)進(jìn)行訓(xùn)練分類,選擇分類效果最好的那組作為當(dāng)前數(shù)據(jù)庫(kù)的權(quán)重系數(shù)。圖3為電壓互感器瓷套紅外圖像的新描述子的梯度柱狀圖(PHOG特征提取參數(shù)設(shè)置為:bin=9,L=0、1、2,angle=180,α=0.5,β=0.5)。
不同尺度L下,圖像的特征向量維數(shù)不同,隨L的增大而迅速增大。并且訓(xùn)練集不同,L最佳取值往往不同,常選取L=1~4。對(duì)于本次使用的紅外圖像數(shù)據(jù)樣本,L=1時(shí)描述子維數(shù)為45維,當(dāng)L=2時(shí)描述子維數(shù)為209維, 試驗(yàn)表明當(dāng)L≥3時(shí)維數(shù)迅速增加,分類效果下降。本文算法充分汲取了PHOG特征和FastPCA特征的各自優(yōu)點(diǎn),通過訓(xùn)練樣本集的特點(diǎn)分別調(diào)節(jié)α、β值,以達(dá)到最優(yōu)的描述效果。
本文采用SVM進(jìn)行最終的分類,支持向量機(jī)參數(shù)中選擇RBF作為核函數(shù)。目的是利用其可將輸入樣本映射到高維空間,解決非線性不可分問題。而且具有對(duì)樣本大小、維度變化適應(yīng)性強(qiáng)的特點(diǎn)。利用SVM分類時(shí),SVM分類分類器的性能受到多個(gè)參數(shù)影響,同時(shí)影響其推廣能力[15]。所以,本文采用文獻(xiàn)[16]基于交叉驗(yàn)證和網(wǎng)格搜索的參數(shù)選擇方法LibSVM來優(yōu)化RBF核自身的參數(shù)γ、錯(cuò)誤代價(jià)系數(shù)C以及權(quán)重系數(shù)α和β,其中C的初始值一般可以設(shè)置為inf,γ設(shè)置為1。
本文算法試驗(yàn)所用的自建紅外樣本庫(kù)是利用FLUKE TI400熱成像儀采集的圖像數(shù)據(jù)。此采集設(shè)備包括工業(yè)級(jí)500萬像素的可見光相機(jī)、IFOV(空間分辨率)1.31 mrad的紅外鏡頭以及先進(jìn)的IR-Fusion技術(shù)(具備可見光圖像與紅外圖像融合功能,并且可以改變?nèi)诤媳壤?。本文所設(shè)計(jì)的識(shí)別系統(tǒng)試驗(yàn)平臺(tái)選擇的硬件參數(shù)為:Intel(R)Core(TM) i5 CPU 1.7~2.4 GHz RAM 12GB,Windows8.1操作系統(tǒng)。
試驗(yàn)數(shù)據(jù)樣本集Ⅰ有訓(xùn)練及測(cè)試數(shù)據(jù)樣本共80個(gè),包含變壓器、正常狀態(tài)絕緣子、過熱絕緣子、零值絕緣子、電源和其他3種干擾物體。為測(cè)試不同參數(shù)下分類器的性能,設(shè)置樣本集Ⅱ,樣本數(shù)量80個(gè),設(shè)備種類有所區(qū)別。樣本集Ⅰ、Ⅱ所有圖像的分辨率均調(diào)制為128×96。圖4為樣本集Ⅰ的部分樣本圖像,包括正常、過熱、零值3種同型號(hào)絕緣子及干擾物。樣本符合2016版《帶電設(shè)備紅外診斷應(yīng)用規(guī)范》[17]的設(shè)備特征要求。
圖4 部分樣本的紅外圖像
為驗(yàn)證本文算法對(duì)紅外圖像下電氣設(shè)備類型及故障狀態(tài)識(shí)別的有效性,將本文算法與PHOG+SVM算法[18]、FastPCA+SVM算法[19]進(jìn)行運(yùn)行時(shí)間、分類精度的對(duì)比以及參數(shù)優(yōu)化后的性能分析。此對(duì)比試驗(yàn)數(shù)據(jù)為樣本集Ⅰ,試驗(yàn)結(jié)果如表1所示。
表1 算法測(cè)試數(shù)據(jù)對(duì)比分析表
由表1的數(shù)據(jù)對(duì)比分析可知,對(duì)于自建樣本集Ⅰ的80個(gè)紅外圖像樣本,未優(yōu)化參數(shù)時(shí)3種算法的識(shí)別精度都低于80%,對(duì)RBF核自身的參數(shù)γ以及錯(cuò)誤代價(jià)系數(shù)C優(yōu)化后,3種算法的識(shí)別精度都得到一定的提升??傮w而言,本文算法精度最高,可達(dá)到95.7%,3.7 s的運(yùn)行時(shí)間相比于另外兩種算法稍長(zhǎng)。但是,隨著多線程編程技術(shù)和計(jì)算機(jī)高性能GPU和配套加速庫(kù)的發(fā)展,其處理速度越來越高,算法運(yùn)行時(shí)間會(huì)大大縮短,足以滿足實(shí)時(shí)要求。除此之外,由于本文算法訓(xùn)練所需樣本集很小,而且僅提取65維特征向量,特征向量維度小、計(jì)算機(jī)相對(duì)計(jì)算量低,對(duì)于硬件配置同樣要求低,便于擴(kuò)展應(yīng)用。
同時(shí)根據(jù)訓(xùn)練樣本結(jié)果分析,該融合算法不僅對(duì)不同類型巡檢目標(biāo)圖像有較高的分辨能力,而且對(duì)同型巡檢目標(biāo)圖像也具有較高類內(nèi)分辨能力。該特點(diǎn),為同型巡檢目標(biāo)圖像的不同故障判別奠定了基礎(chǔ),如對(duì)試驗(yàn)樣本集Ⅰ中的正常、過熱、零值3種同型號(hào)絕緣子具有很好的分辨效果。
性能良好的特征描述子區(qū)分能力強(qiáng),除此之外為保證推廣能力,要有較強(qiáng)的魯棒性,所以本文設(shè)計(jì)了相關(guān)的測(cè)試試驗(yàn)。首先在測(cè)試集Ⅰ中設(shè)置目標(biāo)設(shè)備圖像角度和位置變化的樣本,根據(jù)測(cè)試數(shù)據(jù)分析,對(duì)于目標(biāo)巡檢圖像,當(dāng)尺度L=0時(shí)基本無變化,L=1時(shí)識(shí)別精度下降5%。此外,對(duì)測(cè)試集Ⅰ的樣本添加干擾,見圖5,均添加噪聲密度為0.02的椒鹽噪聲以及一定程度的背景干擾(線條、顏色、虛化)。經(jīng)試驗(yàn)發(fā)現(xiàn):從這些樣本提取的特征向量依舊具有較好的區(qū)分能力。
圖5 算法的魯棒性試驗(yàn)
總體來說,本文提出的FastPCA和PHOG特征加權(quán)融合的混合描述子綜合考慮了訓(xùn)練樣本集局部和整體信息,并調(diào)節(jié)α、β值權(quán)重,因此增強(qiáng)了算法的魯棒性。
本節(jié)主要分析參數(shù)L、C、γ對(duì)本文算法識(shí)別性能的影響,試驗(yàn)數(shù)據(jù)為樣本集Ⅰ和樣本集Ⅱ。
由表2可以得出:當(dāng)L≤2時(shí),本文算法分類精度相比PHOG+SVM有很大的提高,但當(dāng)L≥3時(shí)分類精度急劇下降,這和L過高時(shí),那些不包含邊緣信息且會(huì)使特征向量變長(zhǎng)的空白塊的增加相關(guān)。由此可以縮小L的最佳值尋找范圍,通過測(cè)試樣本集數(shù)據(jù)對(duì)比分析,可以得出,對(duì)于本測(cè)試數(shù)據(jù)L=1時(shí)存在最佳分辨率。
表2 尺度L對(duì)樣本識(shí)別性能的影響 %
通過調(diào)整附加錯(cuò)誤代價(jià)系數(shù)C,可以權(quán)衡最大分類間隔與最小化訓(xùn)練錯(cuò)誤以及增強(qiáng)對(duì)測(cè)試樣本的推廣能力。根據(jù)本測(cè)試數(shù)據(jù)樣本集分析,C值的影響較弱,而對(duì)支持向量機(jī)中采用的RBF核函數(shù)的參數(shù)γ則較為敏感。不同樣本集的最佳參數(shù)會(huì)有差異,利用LibSVM對(duì)自建數(shù)據(jù)庫(kù)進(jìn)行參數(shù)搜索優(yōu)化后發(fā)現(xiàn)對(duì)樣本集Ⅰ的推薦值為C=127,γ=0.007 8;對(duì)樣本集Ⅱ的推薦值為C=127,γ=0.02。為了更加直觀地觀察參數(shù)γ對(duì)分類精度的影響,對(duì)兩組試驗(yàn)數(shù)據(jù)集的訓(xùn)練與測(cè)試樣本采取交叉試驗(yàn)取平均值的方法,測(cè)試數(shù)據(jù)如表3、表4所示。
表3 參數(shù)γ對(duì)Ⅰ組數(shù)據(jù)識(shí)別性能的影響
表4 參數(shù)γ對(duì)Ⅱ組數(shù)據(jù)識(shí)別性能的影響
分析兩組試驗(yàn)結(jié)果可知:當(dāng)參數(shù)γ=1時(shí),分類精度都很低,隨著γ的減小分類正確率顯著提升。對(duì)于樣本集I而言,在γ=0.007 8時(shí),分類準(zhǔn)確率達(dá)到最大且為97.5%;對(duì)于樣本集Ⅱ,在γ=0.02時(shí),分類準(zhǔn)確率達(dá)到最大且為95.0%。對(duì)于本文算法和自建紅外樣本集而言,在L=1、C=127、γ=0.007 8時(shí),可取得最佳分辨率,經(jīng)樣本集I測(cè)試的電氣設(shè)備類型及其故障狀態(tài)識(shí)別率高達(dá)97.5%。
為方便實(shí)際應(yīng)用操作,依據(jù)FastPCA和PHOG特征加權(quán)融合的識(shí)別算法建立分類識(shí)別系統(tǒng),用戶可以通過運(yùn)行界面快速判斷電氣設(shè)備類型及故障狀態(tài)。圖6、圖7為FLUKE TI400熱成像儀對(duì)應(yīng)的圖像分析軟件Smartview和搭建的識(shí)別系統(tǒng)的運(yùn)行界面。
圖6 Smartview軟件界面
圖7 識(shí)別系統(tǒng)運(yùn)行界面
本文提出一種基于FastPCA和PHOG特征加權(quán)融合的電氣設(shè)備類型及其故障狀態(tài)識(shí)別算法,并建立分類識(shí)別系統(tǒng)。該算法融合了PHOG和FastPCA特征的優(yōu)點(diǎn),增強(qiáng)了對(duì)圖像的整體和局部的信息描述能力,加權(quán)融合特征能很好地區(qū)分各類設(shè)備及其故障狀態(tài)。試驗(yàn)結(jié)果表明,本文提出的算法對(duì)于巡檢目標(biāo)電氣設(shè)備及其故障狀態(tài)識(shí)別率較高,準(zhǔn)確率也有明顯提升(達(dá)97.5%),而且對(duì)于變電站的復(fù)雜背景也具有良好的穩(wěn)定性和魯棒性。另外,通過自建紅外圖像樣本集測(cè)試,發(fā)現(xiàn)該算法特別適合小樣本的數(shù)據(jù)集,并且在現(xiàn)場(chǎng)運(yùn)行條件和環(huán)境改變時(shí),能快速地添加訓(xùn)練的新樣本,提高識(shí)別準(zhǔn)確率。