趙洲峰,趙志勇,鄒君文,裘呂超,楊斌,呂福在
(1.杭州意能電力技術(shù)有限公司,浙江 杭州 310000;2.浙江大學(xué) 工程師學(xué)院,浙江 杭州 310015;3.浙江省電力鍋爐壓力容器檢驗(yàn)所有限公司,浙江 杭州 310000;4.國網(wǎng)浙江省電力公司電力科學(xué)研究院,浙江 杭州 310000;5.杭州浙達(dá)精益機(jī)電技術(shù)股份有限公司,浙江 杭州 311100;6.浙江大學(xué) 機(jī)械工程學(xué)院,浙江 杭州 310013)
高壓瓷支柱絕緣子是發(fā)電廠和變電站電力設(shè)備的重要部件,其損壞會(huì)造成停電事故,進(jìn)而影響電力系統(tǒng)的穩(wěn)定性和經(jīng)濟(jì)性。據(jù)學(xué)者統(tǒng)計(jì),絕大多數(shù)瓷支柱絕緣子斷裂故障發(fā)生在下部法蘭內(nèi)30 mm與瓷絕緣體第1個(gè)傘裙之間[1]。
傳統(tǒng)的絕緣子缺陷診斷技術(shù)(如視覺方法、超聲波法、紫外線法、紅外線法和電場法等[2-6])都存在著容易受周圍環(huán)境影響、無法實(shí)現(xiàn)帶電檢測或無法檢測內(nèi)部缺陷等局限性。而振動(dòng)聲學(xué)方法是通過激勵(lì)被測件,使其發(fā)生機(jī)械振動(dòng),從振動(dòng)信號(hào)中判定被測件損傷的方法,能夠?qū)崿F(xiàn)帶電快速檢測,具有很好的應(yīng)用前景。近年來不斷有科研人員對絕緣子振動(dòng)聲學(xué)缺陷檢測算法和振動(dòng)聲學(xué)信號(hào)影響因素方面展開了研究。
鐘力強(qiáng)等[7]提出瓷支柱絕緣子振動(dòng)聲學(xué)信號(hào)的聲紋識(shí)別算法,通過對絕緣子振動(dòng)聲學(xué)信號(hào)建立聲紋特征矢量庫,并對實(shí)測信號(hào)進(jìn)行識(shí)別,驗(yàn)證該方法識(shí)別效果能達(dá)到與人工判斷近似效果。萬書亭等[8]提出一種基于絕緣子振動(dòng)信號(hào)時(shí)域、頻域與梅爾頻域倒譜系數(shù)組成的特征向量,并建立支持向量機(jī)故障判別模型,在加熱冷卻法制造的缺陷數(shù)據(jù)集上證明該方法能夠準(zhǔn)確分類絕緣子上下法蘭裂紋故障。焦宗寒等[9]提出利用高斯混合模型對瓷支柱絕緣子的振動(dòng)信號(hào)進(jìn)行特征提取,利用高斯密度函數(shù)和期望最大值算法將頻譜劃分為3種模態(tài),提取每種模態(tài)的特征參數(shù)作為極限學(xué)習(xí)機(jī)分類模型的輸入,實(shí)現(xiàn)了絕緣子振動(dòng)信號(hào)的準(zhǔn)確分類。趙飛亞等[10]對振動(dòng)聲學(xué)方法檢測瓷支柱絕緣子傳感器布置的位置進(jìn)行探討,通過仿真與實(shí)驗(yàn),表明在下法蘭邊緣中心區(qū)域檢測效果最佳。宗方蕊等[11]以220 kV瓷支柱絕緣子為研究對象,探究激振傳感器與接收傳感器之間距離對振動(dòng)檢測結(jié)果的影響,通過仿真和實(shí)驗(yàn)得出激振和接受傳感器的最佳布置距離。
在振動(dòng)聲學(xué)檢測儀使用過程中,探針頂緊力度和角度會(huì)嚴(yán)重影響信號(hào)質(zhì)量,檢測結(jié)果依賴人工判斷;現(xiàn)有缺陷檢測算法未考慮儀器使用方式的影響,現(xiàn)場實(shí)用性較差。為提高現(xiàn)場檢測準(zhǔn)確率,本文提出一種包含時(shí)域特征、功率譜峰值特征和各頻段小波包能量比組合特征的隨機(jī)森林故障自動(dòng)識(shí)別模型,通過特征篩選和模型參數(shù)優(yōu)化,實(shí)現(xiàn)對故障類型的準(zhǔn)確判別。
振動(dòng)聲學(xué)檢測儀的原理是使絕緣子產(chǎn)生受迫振動(dòng),根據(jù)響應(yīng)信號(hào)中諧振頻率的變化來判斷絕緣子是否發(fā)生損傷。
振動(dòng)聲學(xué)檢測儀通常由振動(dòng)激勵(lì)探針、加速度接收探針、信號(hào)記錄裝置殼體組成,記錄裝置包括主控制板、RAM、ROM以及通信模塊等,實(shí)物如圖1所示。
圖1 振動(dòng)聲學(xué)檢測儀Fig.1 vibroacoustic detector
在使用振動(dòng)聲學(xué)檢測儀器時(shí),需要將裝置探針抵到待檢測的絕緣子法蘭下表面或者支撐板上,當(dāng)彈簧被壓緊時(shí),探針自動(dòng)激發(fā)信號(hào),約6 s可以進(jìn)行1次檢測。在采集完信號(hào)之后通過USB數(shù)據(jù)線連接到上位機(jī),利用信號(hào)分析處理軟件進(jìn)行分析和展示。
儀器采樣頻率為48 kHz,接收到的信號(hào)為16 384點(diǎn)隨機(jī)振動(dòng)響應(yīng)信號(hào),信號(hào)無明顯規(guī)律,通常需要通過功率譜的方式進(jìn)行判別。
振動(dòng)聲學(xué)檢測方法基本判別理論為:對無損傷的瓷支柱絕緣子進(jìn)行振動(dòng)聲學(xué)檢測時(shí),其振動(dòng)響應(yīng)功率譜的形狀一般為中間高兩側(cè)低,峰值頻率范圍為3~6 kHz;當(dāng)下法蘭附近發(fā)生損傷時(shí),其功率譜會(huì)在2 kHz以下的頻率段出現(xiàn)高峰值;上法蘭附近發(fā)生損傷時(shí),其功率譜則會(huì)在8 kHz以上的頻率段出現(xiàn)高峰值。目前振動(dòng)聲學(xué)結(jié)果判斷標(biāo)準(zhǔn)比較單一,在實(shí)際檢測過程中依賴人工判別,容易造成誤判漏檢。
由于儀器的探針結(jié)構(gòu),不同操作人員在使用儀器時(shí),難以保持同樣的力度,且絕緣子安裝空間較小導(dǎo)致儀器探針無法與絕緣子軸線完全平行(儀器探針與絕緣子軸線存在夾角),檢測到的信號(hào)往往存在較大誤差,都給結(jié)果判斷帶來干擾。
由于絕緣子探傷儀采用隨機(jī)信號(hào)作為激勵(lì),使得故障信息容易被淹沒在振動(dòng)信號(hào)中,信號(hào)均值、方差等特征具有局限性,因此本文在時(shí)域、功率譜、小波域挖掘信號(hào)中的深層次信息,提高故障診斷的準(zhǔn)確度。
在分析瓷支柱絕緣子振動(dòng)聲學(xué)信號(hào)時(shí),時(shí)域信號(hào)作為直接接收到的響應(yīng)信號(hào),包含豐富的信息,因此首先提取振動(dòng)信號(hào)時(shí)域特征。
根據(jù)隨機(jī)振動(dòng)理論,激發(fā)信號(hào)應(yīng)為無限長的白噪聲信號(hào),一般在實(shí)際工作中利用截?cái)嗟母咚拱自肼曅盘?hào)作為激發(fā)信號(hào),因此用統(tǒng)計(jì)的方法研究信號(hào)的特征具有重要意義。本節(jié)提取時(shí)域信號(hào)統(tǒng)計(jì)特征以及波形特征,作為組合特征的一部分。
結(jié)合瓷支柱絕緣子振動(dòng)聲學(xué)信號(hào)特點(diǎn),本文選用振動(dòng)時(shí)域信號(hào)的最大值、最小值、均值、方差、峭度系數(shù)以及波形因子作為時(shí)域特征向量。用時(shí)域信號(hào)特征進(jìn)行缺陷檢測是最簡便的方式,但是時(shí)域信號(hào)容易受到噪聲影響,因此還需要提取出其他更有效的特征信息。
由于隨機(jī)振動(dòng)激勵(lì)信號(hào)為寬頻白噪聲信號(hào),理論上的隨機(jī)信號(hào)的持續(xù)時(shí)間為無限長,其傅里葉變換不存在。根據(jù)能量守恒定律,一段有限長度的信號(hào)在時(shí)域和頻域均滿足能量守恒,因此白噪聲信號(hào)的平均功率可以認(rèn)為是恒定的。自功率譜代表的物理意義是信號(hào)在單位頻帶內(nèi)的功率,結(jié)構(gòu)發(fā)生損傷時(shí)任意檢測位置的加速度響應(yīng)信號(hào)的自功率譜會(huì)發(fā)生改變[12],所以自功率譜可以反映結(jié)構(gòu)的損傷狀況。
功率密度譜所求的數(shù)值都是相對值,峰值高度不能反映真實(shí)功率幅值,峰值之間的比例更能反映能量的分布,因此在提取功率譜特征之前利用功率譜最大的峰值將功率譜歸一化處理。
由于儀器采樣率的限制,在實(shí)際檢測過程中無法獲取到精確的功率譜估計(jì),振動(dòng)響應(yīng)信號(hào)中存在噪聲形成的峰值。如果構(gòu)建算法時(shí)選取的峰值數(shù)量過多,則會(huì)帶來干擾。綜合考慮,選取最高的2個(gè)峰值頻率、中位數(shù)頻率、最小值頻率以及第2峰值高度作為功率譜特征。
小波變換是一種窗口形狀可以改變的自適應(yīng)時(shí)頻分析方法,其缺點(diǎn)是對高頻部分分辨率較差[13]。小波包變換作為小波變換的推廣,通過小波基的縮放和平移功能,能夠?qū)⒚恳粚有盘?hào)同時(shí)在低頻和高頻部分進(jìn)行分解,兼顧信號(hào)的輪廓和細(xì)節(jié)特征,在振動(dòng)信號(hào)處理領(lǐng)域應(yīng)用廣泛[14]。小波包分析方法與小波分析類似,分解效果受到小波基函數(shù)的影響。
結(jié)構(gòu)的損傷可以視為結(jié)構(gòu)某一位置的剛度下降,導(dǎo)致該位置吸收更多的能量,從而影響結(jié)構(gòu)整體的振動(dòng)響應(yīng)信號(hào)。由于小波包系數(shù)與能量有著相同的量綱,其分解系數(shù)能夠反映各頻帶的能量值,相比于功率譜峰值特征,能夠更好地描述能量分布的頻帶。結(jié)構(gòu)中缺陷的存在會(huì)造成振動(dòng)聲學(xué)信號(hào)改變,小波包各頻帶的能量占比也會(huì)隨之改變,因此小波包能量值能夠用于表征缺陷信號(hào)特征。
振動(dòng)聲學(xué)信號(hào)進(jìn)行3層小波包分解得到的小波包樹示意圖如圖2所示。
圖2 小波包分解樹Fig.2 Wavelet packet decomposition tree
圖2中 :Ai,j為第i層輪廓系數(shù)的第j個(gè)節(jié)點(diǎn),Di,j為第i層細(xì)節(jié)系數(shù)的第j個(gè)節(jié)點(diǎn)。每個(gè)節(jié)點(diǎn)代表原始信號(hào)S在該頻段上的分解信號(hào),或者稱為小波包。每個(gè)頻段的小波包可以用于計(jì)算該頻段的振動(dòng)聲學(xué)信號(hào)的小波包能量,用于表征該頻段的能量值,第i層小波包分解得到的第j個(gè)頻段的 小波包能量
(1)
式中di,j,k為第i層小波包分解輪廓系數(shù)節(jié)點(diǎn)Ai,j或者細(xì)節(jié)系數(shù)節(jié)點(diǎn)Di,j的第k個(gè)值;ni為第i層節(jié)點(diǎn)數(shù),ni取值為2i。根據(jù)小波系數(shù)可以計(jì)算出小波能量比
(2)
式中Etotal為第i層小波包分解得到的小波包能量之和。
小波包能量比能夠更好地反映信號(hào)特征,從而挖掘出信號(hào)中蘊(yùn)含的損傷信息。經(jīng)過對比小波基函數(shù),選取db4小波基,并對信號(hào)進(jìn)行4層小波包分解,提取振動(dòng)信號(hào)在16個(gè)頻段的能量占比作為小波域特征。
提取時(shí)域、功率譜、小波域組合特征能夠更好地表征絕緣子振動(dòng)響應(yīng)信號(hào)中的缺陷特征。
隨機(jī)森林算法[15]是一種基于決策樹方法改進(jìn)的集成學(xué)習(xí)算法,具有強(qiáng)抗干擾性,對樣本不平衡數(shù)據(jù)集具有極佳的適應(yīng)性[16]。其基本原理是將1個(gè)數(shù)據(jù)集引申為多個(gè)子數(shù)據(jù)集,在每個(gè)數(shù)據(jù)集上建立1個(gè)性能相對較弱的決策樹模型,最后對若干個(gè)模型投票整合形成性能較強(qiáng)的模型。通過組合多個(gè)模型并進(jìn)行加權(quán)融合的方式,隨機(jī)森林方法避免了如ID3、C4.5以及分類回歸樹(classification and regression tree,CART)等決策樹模型可能出現(xiàn)的過擬合問題[17]。而絕緣子振動(dòng)信號(hào)樣本較少,且信號(hào)特征干擾因素多,采用隨機(jī)森林模型具有較強(qiáng)的技術(shù)優(yōu)勢[18]。
隨機(jī)森林算法可以采用任意類型的決策樹構(gòu)建子模型,本文采用CART。隨機(jī)森林算法流程總結(jié)如下。
a)采用自助抽樣法(Bootstrap)從原始樣本中進(jìn)行重采樣,隨機(jī)產(chǎn)生T個(gè)訓(xùn)練集S1,S2,…,ST。
b)利用每個(gè)訓(xùn)練集,生成對應(yīng)的CART決策樹C1,C2,…,CT,在每個(gè)非葉子節(jié)點(diǎn)(內(nèi)部節(jié)點(diǎn))上選擇屬性前,從M個(gè)屬性(假設(shè)原始訓(xùn)練集數(shù)據(jù)中的屬性總和為M)中隨機(jī)抽取m個(gè)屬性作為當(dāng)前節(jié)點(diǎn)的分裂屬性集V1,V2,…,Vm,并依據(jù)Gini指數(shù)最小原則選擇出最好的分裂方式對該節(jié)點(diǎn)進(jìn)行分裂。其中,Gini指數(shù)可以用來衡量數(shù)據(jù)集分類的純度,通常作為隨機(jī)森林特征分類效果衡量指標(biāo)。假設(shè)決策樹節(jié)點(diǎn)K的樣本集合D中共包含有e個(gè)分類樣本D1,D2,…,De,則數(shù)據(jù)集中節(jié)點(diǎn)K的Gini指數(shù)
(3)
式中P1,P2,…,Pe為每個(gè)分類樣本對應(yīng)的概率。
從式(3)易知,Gini指數(shù)表示從數(shù)據(jù)集中隨機(jī)抽取2個(gè)樣本,其類別標(biāo)記不一致的概率。因此,在選擇屬性集劃分時(shí),可以根據(jù)Gini指數(shù)最小原則選出最優(yōu)劃分方式。若采用屬性F劃分,決策樹節(jié)點(diǎn)K劃分得到l個(gè)子節(jié)點(diǎn)的集合{K1,K2,…,Kl},則劃分后的Gini指數(shù)
(4)
式中|Ki|為決策樹節(jié)點(diǎn)K劃分到第i個(gè)子節(jié)點(diǎn)上的樣本總數(shù);|K|為決策樹節(jié)點(diǎn)K的樣本總數(shù)。
c)對于測試集中的樣本,利用每個(gè)決策樹進(jìn)行測試,得到對應(yīng)的類別C1(X),C2(X),…,CT(X),X為抽樣樣本隨機(jī)變量。由于每棵決策樹之間是相互獨(dú)立的,對于得到的T個(gè)輸出結(jié)果可以采用投票的方法,將T個(gè)弱決策樹中輸出票數(shù)最多的類別作為測試集樣本X所屬的最終類別。
由于隨機(jī)森林每次進(jìn)行訓(xùn)練時(shí),采用隨機(jī)采樣的方式形成數(shù)據(jù)集,每個(gè)弱分類器每次只是從總樣本中抽取一部分,沒被抽取到的數(shù)據(jù)就成為袋外數(shù)據(jù)。對于已經(jīng)生成的隨機(jī)森林,用袋外數(shù)據(jù)測試其性能。假設(shè)袋外數(shù)據(jù)總數(shù)為Q,將Q個(gè)袋外數(shù)據(jù)作為輸入,代入之前已經(jīng)生成的隨機(jī)森林分類器,分類器會(huì)給出Q個(gè)數(shù)據(jù)相應(yīng)的分類,設(shè)隨機(jī)森林分類器分類錯(cuò)誤的數(shù)目為C,則第i個(gè)樣本的袋外數(shù)據(jù)誤差
(5)
袋外數(shù)據(jù)沒有參與模型建立,所以可以對每棵決策樹分別計(jì)算袋外誤差,再平均到每棵決策樹,作為整個(gè)隨機(jī)森林模型的誤差衡量指標(biāo)。該值是一個(gè)無偏估計(jì),可以代替數(shù)據(jù)集的交叉驗(yàn)證誤差,用來衡量隨機(jī)森林模型的泛化能力。隨機(jī)森林整體袋外誤差
(6)
式中N為樣本數(shù)量。袋外數(shù)據(jù)不僅可以用來計(jì)算模型的誤差,還可用于評估特征的重要性[19-20]。所以第t個(gè)特征qt的重要性指標(biāo)
(7)
式中:Oerrt,i為以特征qt得到樣本分類結(jié)果的袋外誤差,Oerrt,i-Oerri為袋外誤差隨著特征變量qt發(fā)生的變化,其值越大說明袋外數(shù)據(jù)準(zhǔn)確率下降幅度越大,則說明該特征變量越重要。
本節(jié)基于前面提出的多維組合特征向量和隨機(jī)森林檢測算法,構(gòu)建瓷支柱絕緣子缺陷檢測算法框架。本算法的具體技術(shù)路線如圖3所示。
圖3 隨機(jī)森林缺陷檢測模型技術(shù)路線Fig.3 Random forest defect detection model technical route
首先,將采集到的瓷支柱絕緣子振動(dòng)聲學(xué)響應(yīng)信號(hào)數(shù)據(jù)集分為訓(xùn)練集和測試集;其次,對響應(yīng)信號(hào)提取時(shí)域特性、功率譜特征和小波域特征,組成組合特征向量;再次,根據(jù)各項(xiàng)特征的重要性指數(shù),從中篩選出最能夠代表振動(dòng)信號(hào)特征的特征子集,作為隨機(jī)森林分類模型的輸入。同樣,對于訓(xùn)練集中的信號(hào),提取出多維特征向量,根據(jù)特征重要性,形成測試集組合特征,輸入到構(gòu)建好的隨機(jī)森林缺陷檢測模型。將測試集的預(yù)測結(jié)果與實(shí)際分類進(jìn)行比較,并對模型各項(xiàng)參數(shù)進(jìn)行調(diào)優(yōu),最終得到模型的最優(yōu)參數(shù),據(jù)此構(gòu)建最優(yōu)分類模型。對于需要預(yù)測的新數(shù)據(jù),則直接提取組合特征,輸入到調(diào)優(yōu)后的隨機(jī)森林模型,即可得到預(yù)測結(jié)果。
本文以ZS-35/400絕緣子為實(shí)驗(yàn)對象,首先在無缺陷狀態(tài)下采集絕緣子振動(dòng)響應(yīng)信號(hào),之后在靠近上端法蘭和靠近下端法蘭的位置分別設(shè)置裂紋缺陷,并采集振動(dòng)響應(yīng)信號(hào)。參考瓷支柱絕緣子實(shí)際損傷形式,本文設(shè)置槽狀缺陷以模擬表面裂紋形式的缺陷。
用不同長度的缺陷表征不同程度的裂紋缺陷,由于裂紋一般為細(xì)長的表面裂紋,因此將缺陷長度L分別設(shè)置為10 mm、20 mm、30 mm、40 mm、50 mm和60 mm,缺陷寬度設(shè)置為約為2 mm。分別將缺陷設(shè)置在絕緣子上法蘭與鄰近的第1個(gè)傘裙以及下法蘭與鄰近的第1個(gè)傘裙之間。設(shè)置在上法蘭與傘裙之間的缺陷用以模擬絕緣子上端發(fā)生裂紋缺陷的情況,如圖4所示。
圖4 瓷支柱絕緣子上端缺陷設(shè)置Fig.4 Porcelain pillar insulator upper end defect setting
設(shè)置在下法蘭與傘裙之間的缺陷用以模擬絕緣子下端發(fā)生裂紋的情況,如圖5所示。
圖5 瓷支柱絕緣子下端缺陷設(shè)置Fig.5 Defect setting of lower end of porcelain pillar insulator
本節(jié)對圖4和圖5中的絕緣子以不同按壓力度、檢測角度和檢測位置共采集1 440組振動(dòng)響應(yīng)信號(hào),其中無缺陷絕緣子信號(hào)、下端缺陷絕緣子信號(hào)、上端缺陷絕緣子信號(hào)各480組。在有缺陷的數(shù)據(jù)中,根據(jù)缺陷的不同長度(10~60 mm)、不同位置、不同方位各采集80組數(shù)據(jù)用于分析。
為驗(yàn)證3.3節(jié)提出的基于隨機(jī)森林的瓷支柱絕緣子振動(dòng)聲學(xué)缺陷檢測方法的檢測能力,本節(jié)采用4.1節(jié)采集的絕緣子振動(dòng)信號(hào)數(shù)據(jù)集對算法效果進(jìn)行驗(yàn)證。將數(shù)據(jù)集等比例隨機(jī)分為5份,其中1份作為測試集,另外4份用于訓(xùn)練。根據(jù)第2章提出的組合特征,共提取28個(gè)維度的特征。
a)特征選擇。在對隨機(jī)森林算法進(jìn)行調(diào)優(yōu)之前,首先以500棵決策樹為參考,根據(jù)特征的重要性對特征進(jìn)行篩選。使用4.1節(jié)的所有數(shù)據(jù)作為模型的輸入重復(fù)訓(xùn)練10次,組合特征在測試集上的準(zhǔn)確率見表1。
表1 隨機(jī)森林模型準(zhǔn)確率
從表1中可以看出,隨機(jī)森林模型分類準(zhǔn)確率較高,說明其適用于本數(shù)據(jù)集,但是在測試集上的準(zhǔn)確率高于袋外數(shù)據(jù)上的準(zhǔn)確率,說明由于選取的模型過多導(dǎo)致模型出現(xiàn)過擬合,因此需要對特征進(jìn)行篩選。首先根據(jù)3.2節(jié)的式(7),將各特征對Gini指數(shù)的貢獻(xiàn)率作為特征重要性指標(biāo),結(jié)果如圖6所示,其中特征序號(hào)對應(yīng)的特征見表2。
圖6 特征重要性指標(biāo)Fig.6 Feature importance index
將各個(gè)特征按照貢獻(xiàn)率排序,從中選取最大的15個(gè)特征作為最終特征,包括:①時(shí)域信號(hào)均值;②功率譜最大峰值頻率;③功率譜最小值頻率;④功率譜次高峰頻率;⑤次高峰幅值;⑥1.5~3 kHz頻段能量比;⑦6~7.5 kHz頻段能量比;⑧7.5~9 kHz頻段能量比;⑨10.5~12 kHz頻段能量比;⑩13.5~15 kHz頻段能量比;15~16.5 kHz頻段能量比;16.5~18 kHz頻段能量比;18~19.5 kHz頻段能量比;19.5~21 kHz頻段能量比;22.5~24 kHz頻段能量比。
表2 特征匯總Tab.2 Feature summary
b)決策樹數(shù)量確定。確定特征數(shù)量之后,還需要確定隨機(jī)森林模型決策樹的數(shù)量以及每次建立決策樹時(shí)選取的特征數(shù)量。隨機(jī)森林中決策樹的數(shù)量越多則模型越復(fù)雜,計(jì)算速度越慢。而建立決策樹時(shí)選取的特征數(shù)量會(huì)影響所建決策樹的復(fù)雜程度,選取的特征數(shù)量越多,則隨機(jī)森林總體的計(jì)算量越大。本文將a)選取的15維特征作為模型訓(xùn)練的輸入,模型袋外誤差隨著決策樹數(shù)量的變化曲線如圖7所示。
圖7 袋外數(shù)據(jù)誤差Fig.7 Out-of-bag data error
從圖7可以看出,決策樹數(shù)量對袋外誤差影響很大,隨著決策樹數(shù)量的增多,袋外誤差逐漸減小,在100棵樹左右袋外誤差趨于穩(wěn)定,但是袋外誤差并不是一直減少,而是在0.04左右波動(dòng)。一方面說明本文提出的組合特征缺陷識(shí)別算法具有很好的識(shí)別準(zhǔn)確率;另一方面,樹的數(shù)量過多不能明顯提高檢測檢測準(zhǔn)確率,而且會(huì)影響模型的計(jì)算速度。因此本文選取139棵樹作為隨機(jī)森林的最終決策樹數(shù)量,并且在構(gòu)建每棵決策樹時(shí)從全部特征中選取2個(gè)特征。
根據(jù)選取的特征以及最終確定的最佳參數(shù),以1 440組數(shù)據(jù)按照4∶1的比例隨機(jī)分為訓(xùn)練集和測試集,建立隨機(jī)森林模型,并與文獻(xiàn)[8]中的方法進(jìn)行對比。表3給出了不同方法在訓(xùn)練集和測試集上的結(jié)果準(zhǔn)確度。
表3 隨機(jī)森林缺陷檢測結(jié)果Tab.3 Random forest defect detection results %
從表3可以得知,本文提出的模型在驗(yàn)證集上的缺陷準(zhǔn)確率達(dá)到96.70%,在測試集上的檢測準(zhǔn)確率達(dá)到96.53%,兩者相近,說明本模型擬合程度較好,而且相比于特征篩選前,算法準(zhǔn)確率有所提升,說明算法參數(shù)具有很好的效果。而文獻(xiàn)[8]中的算法在驗(yàn)證集和測試集中的準(zhǔn)確度均低于本文的算法。將2種算法在測試集中的預(yù)測結(jié)果繪制成混淆矩陣進(jìn)一步分析,結(jié)果如圖8、圖9所示。
圖8 本文算法測試集分類結(jié)果混淆矩陣Fig.8 The confusion matrix of the classification results of the test set of the algorithm in this paper
根據(jù)表3,本文提出的算法在訓(xùn)練集中1 152組數(shù)據(jù)全部分類正確,從混淆矩陣可以看出,在測試集288組信號(hào)中共有10組信號(hào)分類錯(cuò)誤,其中無缺陷絕緣子信號(hào)2個(gè),上端缺陷7個(gè),下端缺陷1個(gè)。文獻(xiàn)[8]中的方法在訓(xùn)練集中只有94.14%的準(zhǔn)確率,在測試集中有34組數(shù)據(jù)分類錯(cuò)誤,其中無缺陷信號(hào)18個(gè),上端缺陷信號(hào)7個(gè),下端缺陷信號(hào)9個(gè)。
圖9 文獻(xiàn)[8]中算法測試集分類結(jié)果混淆矩陣Fig.9 The confusion matrix of the classification results of the algorithm test set in the literature[8]
對比2種算法可以看出,相較于文獻(xiàn)[8]中的算法,本文提出的算法有更高的準(zhǔn)確率。并且相比于文獻(xiàn)[8]中的46維特征,本文僅用15維特征,模型復(fù)雜度低,計(jì)算速度更快,分類效果更好。
本文的算法能夠減少振動(dòng)聲學(xué)檢測儀器按壓力度和角度的影響,并準(zhǔn)確識(shí)別瓷支柱絕緣子的損傷,有效提高振動(dòng)聲學(xué)檢測儀器的實(shí)用性。
本文針對瓷支柱絕緣子故障檢測難題,在現(xiàn)有振動(dòng)聲學(xué)缺陷檢測技術(shù)與儀器的基礎(chǔ)上,根據(jù)對瓷支柱絕緣子振動(dòng)聲學(xué)信號(hào)的分析,提取振動(dòng)信號(hào)的時(shí)域特征、功率譜特征以及小波域特征作為組合特征,建立隨機(jī)森林分類模型,通過特征重要性指數(shù)對特征進(jìn)行篩選并對模型參數(shù)進(jìn)行優(yōu)化,最終在測試集中的準(zhǔn)確率達(dá)到96.53%,能夠準(zhǔn)確判別上端缺陷與下端缺陷。
時(shí)域特征包括時(shí)域信號(hào)最大值、最小值、均值、方差、峭度系數(shù)、波形因子;功率譜特征包括功率譜最大峰值頻率、均值頻率、功率譜最小值頻率、功率譜中位數(shù)頻率、功率譜次高峰頻率、次高峰幅值;小波域特征包括4層小波包分解各頻段能量比。該多維組合特征能夠更好地反映絕緣子的損傷變化,與現(xiàn)有模態(tài)頻移法相比,提高了診斷準(zhǔn)確率,并且相比于文獻(xiàn)[8]中的缺陷判別方法,具有一定的技術(shù)優(yōu)勢。
本文的不足之處是只能識(shí)別絕緣子缺陷的存在性,無法識(shí)別絕緣子缺陷程度,后續(xù)可以通過采集更多的不同損傷程度的缺陷數(shù)據(jù)進(jìn)行分析,進(jìn)一步研究缺陷程度的識(shí)別技術(shù)。