杜 磊,任曉紅,劉顯策,韓向棟,俞 嘯
(1.兗州煤業(yè)股份有限公司興隆莊煤礦,山東濟(jì)寧 273500;2.中國(guó)礦業(yè)大學(xué)物聯(lián)網(wǎng)(感知礦山)研究中心,江蘇 徐州 221008)
逆變器作為直流信號(hào)轉(zhuǎn)換為交流信號(hào)的關(guān)鍵器件,被廣泛應(yīng)用于礦井提升機(jī)和皮帶變頻控制系統(tǒng)等電力控制裝置中[1]。多電平逆變器具有電壓輸出中的諧波失真較低、波形更接近正弦波、有效避免發(fā)生電位漂移并且對(duì)負(fù)載的影響較小等優(yōu)點(diǎn)[2-3]。在工業(yè)領(lǐng)域中,中性點(diǎn)鉗位三電平逆變器經(jīng)常被用到[4-5]?;谌娖捷敵龅拈_(kāi)關(guān)狀態(tài)遵循單位電平跳變的原則,控制開(kāi)關(guān)管的通斷可降低功率損耗[6]。絕緣柵雙極晶體管(Insulated Gate Bipolar Transistor,IGBT)是中性點(diǎn)鉗位型三電平逆變器中常用的電源開(kāi)關(guān),可在高電壓、高溫和高頻率下長(zhǎng)時(shí)間導(dǎo)通和關(guān)斷[7-8]。
但若長(zhǎng)時(shí)間處于過(guò)壓高溫狀態(tài),逆變器IGBT 會(huì)出現(xiàn)故障,故障會(huì)影響到整個(gè)煤礦運(yùn)行。因此,有效且及時(shí)的診斷IGBT 運(yùn)行狀態(tài)尤其重要。
由于逆變器設(shè)備本身電路結(jié)構(gòu)復(fù)雜、運(yùn)行環(huán)境的復(fù)雜性以及多變性,逆變器IGBT 故障信號(hào)具有非平穩(wěn)和非線性特點(diǎn),導(dǎo)致逆變器的故障特征難以準(zhǔn)確提取,進(jìn)而影響故障診斷與識(shí)別的有效性[9-10]。工程上經(jīng)常通過(guò)多角度提取反映逆變器系統(tǒng)各種運(yùn)行狀態(tài)的多種類型特征信息,以提高故障診斷和故障識(shí)別的準(zhǔn)確率。但在提取多類特征信息的同時(shí)可能會(huì)帶來(lái)特征維數(shù)增多以及特征之間冗余問(wèn)題[11]。為了挖掘原始故障特征數(shù)據(jù)集中的關(guān)鍵特征和潛在信息,采用適當(dāng)?shù)奶卣鬟x擇方法對(duì)逆變器功率管IGBT 多故障特征進(jìn)行選擇,這對(duì)故障診斷更加重要。
特征選擇是以從原始特征集中剔除相關(guān)性弱的特征,進(jìn)而篩選出一組最能表征有效信息的子特征集為目標(biāo)[12-13]。根據(jù)特征子集的搜索策略,可以將特征選擇方法劃分為兩大類[14],即裝式方法(Wrappers)[15]和過(guò)濾式方法(Filters)[16]。這兩類方法是單一的特征選擇方法,遇到多故障特征選擇時(shí),影響故障分類準(zhǔn)確率。隨著智能算法在高維特征數(shù)據(jù)中的應(yīng)用,混合特征選擇方法已慢慢被應(yīng)用到特征選擇中[17]。這種混合特征選擇方法不僅可以提高分類準(zhǔn)確率還能夠減少計(jì)算時(shí)間。
Fisher Score 是對(duì)樣本故障特征進(jìn)行評(píng)價(jià)的一種標(biāo)準(zhǔn)。其主要思想是在選擇故障特征子集時(shí),選擇使得異類數(shù)據(jù)點(diǎn)間距離大,而同類別的數(shù)據(jù)點(diǎn)之間距離小的故障特征子集。
假設(shè)訓(xùn)練樣本xk∈Rm,k=1,2,3…,多類之間的類間散度計(jì)算公式如式(1)所示:
針對(duì)多故障類型的重疊性和分布不均勻問(wèn)題,改進(jìn)Fisher Score 算法,其計(jì)算公式如式(2)所示:
式中,N為除去重復(fù)特征值的樣本總數(shù),分母表示類內(nèi)散度之和,nj為第j類的數(shù)據(jù)樣本數(shù)。
采用Fisher Score 算法只能確定逆變器不同故障特征的重要度,但是,多故障特征子集中的冗余度以及特征與特征彼此之間的相關(guān)性無(wú)法確定。最大信息系數(shù)是一種基于信息論的方法,它不僅可以挖掘不同特征之間的線性和非線性關(guān)系,還可以度量特征之間的非函數(shù)關(guān)系;采用最大信息系數(shù)對(duì)逆變器功率管IGBT 故障特征之間的相關(guān)性進(jìn)行表征與計(jì)算。
假設(shè)兩個(gè)隨機(jī)變量X={xi,i=1,2,3,…,n}和Y={yi,i=1,2,3,…,n},n為樣本數(shù),互信息I(X∶Y):
式中,p(x)是X邊緣概率分布密度,p(y)是Y的邊緣概率分布密度,p(x,y)是兩個(gè)變量的聯(lián)合概率密度。
定義在X×Y網(wǎng)格的最大互信息值為max(I(X∶Y)),則最大信息系數(shù)計(jì)算公式如式(4)所示:
式中,B是x×y網(wǎng)格劃分上限值。
若n個(gè)樣本的特征集F={f1,f2,…,fk},其中,k為特征數(shù),對(duì)于任意兩類特征fi和特征fj相關(guān)性為Mic(x,y),若Mic(x,y)值越大,則特征fi和特征fj之間的冗余性就越大。若Mic(x,y)為零,此時(shí),特征fi和特征fj之間彼此相互獨(dú)立。
在此基礎(chǔ)上,定義冗余特征:對(duì)于特征集為F,特 征fi和特征fj的Fisher Score 值Fi>Fj,且Mic(x,y)>0.8,則特征fj是特征fi的冗余特征。
為了能夠更好地選擇出最有效的敏感故障特征子集,建立了一種Fisher Score 與最大信息系數(shù)混合模型。該模型具體流程如圖1 所示。
圖1 Fisher Score與最大信息系數(shù)的混合模型流程
所提出的基于Fisher Score 與最大信息系數(shù)混合模型的三電平逆變器故障特征選擇方法框架如圖2所示,特征選擇過(guò)程分為以下三個(gè)步驟。
圖2 基于Fisher Score與最大信息系數(shù)混合模型的特征選擇方法框架圖
步驟1:三相電流信號(hào)預(yù)處理,在希爾伯特黃變換(HHT)方法的基礎(chǔ)上,采用噪聲自適應(yīng)完備總體平均經(jīng)驗(yàn)?zāi)B(tài)分解CEEMDAN(Complete EEMD with Adaptive Noise)方法分別對(duì)三相電流信號(hào)樣本數(shù)據(jù)集進(jìn)行分解和重構(gòu),以去除電流信號(hào)中的噪聲信號(hào)。
步驟2:特征提取,采用Hilbert 變換,對(duì)三電平逆變器三相電流進(jìn)行希爾伯特邊際譜和希爾伯特包絡(luò)譜變換,得到其對(duì)應(yīng)的三個(gè)邊際譜和三個(gè)包絡(luò)譜;對(duì)于每個(gè)希爾伯特邊際譜,計(jì)算表1 中的前13 種統(tǒng)計(jì)特征,且計(jì)算三相電流Park 矢量變換后的模值和相角兩種特征。則得到41 維(13×3+2)特征集;對(duì)于每個(gè)希爾伯特包絡(luò)譜,計(jì)算表3 中前11 種統(tǒng)計(jì)參數(shù),則得到33 維(11×3)特征集;對(duì)于每一個(gè)三相電流信號(hào)樣本,得到原始特征集維數(shù)74 維(11×3+13×3+2)。
步驟3:敏感特征選擇,對(duì)原始特征集進(jìn)行Fisher Score 值計(jì)算,并根據(jù)值的大小按照降序進(jìn)行排序,計(jì)算特征間的最大信息系數(shù),進(jìn)行二次排序調(diào)整,并采用隨機(jī)森林分類算法對(duì)排序調(diào)整后的特征集進(jìn)行分類,根據(jù)隨機(jī)森林分類準(zhǔn)確率篩選敏感故障特征子集。
基于Matlab/Simulink 環(huán)境下,搭建三電平逆變器電路原理仿真模型,實(shí)驗(yàn)采用電感和電阻的不同組合來(lái)模擬負(fù)載變化,其負(fù)載組合參數(shù)設(shè)置如表1所示,負(fù)載組合設(shè)置了10 種電阻和電感組合類型,且這10 種組合代表10 種工況。在恒定的電壓頻率比下,采集電機(jī)在加速和勻速狀態(tài)下的三相電流數(shù)據(jù),采集時(shí)間是4 s,頻率是10 kHz。通過(guò)仿真模型控制端模擬正常與故障共13 種狀態(tài),且采集13 種狀態(tài)下的三相電流數(shù)據(jù)樣本,每種狀態(tài)下的電流信號(hào)劃分378 個(gè)周期,每個(gè)周期為一個(gè)樣本,10 種工況共有10×13×378 個(gè)樣本,且構(gòu)建仿真原始數(shù)據(jù)集Case1(10×13×378 個(gè)樣本)。
表1 仿真數(shù)據(jù)采集參數(shù)設(shè)置
利用直流電源、NPC 三電平逆變器、示波器、電阻電感等器材搭建了NPC 三電平逆變器電流信號(hào)采集實(shí)驗(yàn)臺(tái)。采用電阻與電感組合表示負(fù)載,實(shí)驗(yàn)設(shè)置4 種負(fù)載類型,即4 種工況,如表2 所示。在電機(jī)為加速和勻速狀態(tài)下,采集三相電流信號(hào),采集頻率仍設(shè)置為10 kHz,采集時(shí)長(zhǎng)20 s,重復(fù)采集了5 次。通過(guò)實(shí)驗(yàn)臺(tái)控制端采集正常狀態(tài)和12 種故障狀態(tài)下的三相電流數(shù)據(jù),每一種狀態(tài)下的電流數(shù)據(jù)劃分378 個(gè)周期,將每個(gè)周期作為一個(gè)樣本,4 種工況下,共有19 656(13×378×4)個(gè)樣本,重復(fù)采集了數(shù)據(jù)5次,得到總樣本數(shù)是98 280(5×4×13×378)個(gè),即將總樣本構(gòu)建原始數(shù)據(jù)集Case2(5×4×13×378 個(gè)樣本),即Case2 表示實(shí)驗(yàn)原始數(shù)據(jù)集。
表2 實(shí)驗(yàn)數(shù)據(jù)采集參數(shù)設(shè)置
采用CEEMDAN 方法分別對(duì)仿真和實(shí)驗(yàn)臺(tái)采集的三相電流信號(hào)樣本集進(jìn)行分解和重構(gòu),以去除噪聲信號(hào)。逆變器三相電流經(jīng)過(guò)CEEMDAN 分解得到10 個(gè)本征模態(tài)函數(shù)(IMF)分量。對(duì)于CEEMDAN 變換之后的IMF 分量中一般含有虛假分量,而虛假分量不僅不能反映信號(hào)特征信息,而且會(huì)干擾其他的IMF 分量,采用相關(guān)分析方法剔除虛假分量。根據(jù)IMF 分量與原始信號(hào)特征信息間的相關(guān)系數(shù),判斷虛假IMF 分量,若相關(guān)系數(shù)小于0.2,則判斷為虛假IMF 分量。
CEEMDAN 分解出的10 個(gè)IMF 分量與特征相關(guān)系數(shù)對(duì)應(yīng)關(guān)系如圖3所示。根據(jù)相關(guān)系數(shù)計(jì)算,后6階IMF 分量的相關(guān)系數(shù)小于0.2,屬于虛假IMF 分量,不能表征原始信號(hào)的信息特征,該實(shí)驗(yàn)選擇前4 階IMF分量,并將其重構(gòu)為CEEMDAN 分解之前信號(hào)。
圖3 IMF分量與信號(hào)特征相關(guān)系數(shù)對(duì)應(yīng)關(guān)系
采用Hilbert 變換算法對(duì)前4 階IMF 分量重構(gòu)之后的信號(hào)進(jìn)行變換,得到三相電流對(duì)應(yīng)的三個(gè)Hilbert 邊際譜和三個(gè)Hilbert 包絡(luò)譜;對(duì)于每個(gè)希爾伯特邊際譜,計(jì)算與表3 標(biāo)題不符統(tǒng)計(jì)特征,且計(jì)算三相電流Park 矢量變換后的模值和相角兩種特征。則得到41維(13×3+2)特征集;對(duì)于每個(gè)希爾伯特包絡(luò)譜,計(jì)算表3 中前11 種統(tǒng)計(jì)參數(shù),則得到33 維(11×3)特征集;綜上所述,對(duì)于每一個(gè)三相電流信號(hào)樣本,得到原始特征集的維數(shù)為74 維(11×3+13×3+2)。
表3 15種統(tǒng)計(jì)特征
首先,采用Fisher Score 計(jì)算方法評(píng)估特征指標(biāo)重要度,并進(jìn)行排序;再采用最大信息系數(shù)評(píng)價(jià)特征與特征之間相關(guān)度,并將相關(guān)度低的特征調(diào)整到最后;借助隨機(jī)森林算法的強(qiáng)大分類能力,采用隨機(jī)森林分類器篩選敏感特征子集。
為了驗(yàn)證所提出的特征選擇方法具有更好的有效性和可靠性,開(kāi)展了對(duì)比實(shí)驗(yàn),選擇仿真數(shù)據(jù)樣本數(shù)24 570×74 個(gè)樣本(Case3),實(shí)驗(yàn)臺(tái)數(shù)據(jù)樣本數(shù)為63 960×74 個(gè)樣本(Case4)。故障類別數(shù)為13 種,特征數(shù)為74,選擇mRMR 算法和reliefF 算法與所提出的特征選擇方法(Fisher-MIC)進(jìn)行對(duì)比實(shí)驗(yàn),采用隨機(jī)森林算法進(jìn)行故障分類,根據(jù)故障分類準(zhǔn)確率的高低判斷特征選擇算法的效果。不同特征選擇方法的特征選擇效果如圖4 和圖5 所示。
圖4 仿真數(shù)據(jù)集不同特征選擇方法的特征選擇效果圖
圖5 實(shí)驗(yàn)數(shù)據(jù)集不同特征選擇方法的特征選擇效果圖
根據(jù)圖4 和圖5 可知,三種特征選擇方法在三電平逆變器仿真數(shù)據(jù)集和實(shí)驗(yàn)數(shù)據(jù)集上的分類準(zhǔn)確率整體都呈現(xiàn)先上升后下降的趨勢(shì)。三種方法篩選出的特征集,輸入分類器中,分類準(zhǔn)確率不同。其結(jié)果如表4 和表5 所示。
根據(jù)表4 和表5 可知,對(duì)比Fisher-MIC、reliefF 和mRMR 三種特征選擇方法,對(duì)于Fisher-MIC 特征選擇方法,仿真數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)測(cè)試分類準(zhǔn)確率都比其他兩種特征選擇方法下的分類準(zhǔn)確率高。仿真實(shí)驗(yàn)和實(shí)驗(yàn)臺(tái)實(shí)驗(yàn)結(jié)果表明,F(xiàn)isher-MIC 特征選擇方法相比其他兩種特征選擇方法有較好的效果,所選擇出的敏感特征子集能夠更好地反映逆變器功率管IGBT 相應(yīng)故障狀態(tài)的特征信號(hào)。
表4 13種統(tǒng)計(jì)特征仿真數(shù)據(jù)集測(cè)試結(jié)果
表5 13種統(tǒng)計(jì)特征實(shí)驗(yàn)數(shù)據(jù)集測(cè)試結(jié)果
為了提高三電平逆變器故障識(shí)別準(zhǔn)確率,提出了一種基于Fisher Score 與最大信息系數(shù)的混合模型的三電平逆變器特征選擇方法,該方法采用希爾伯特黃變換對(duì)三相電流信號(hào)進(jìn)行時(shí)頻域變化,得到包絡(luò)譜和邊際譜,并將經(jīng)過(guò)計(jì)算的統(tǒng)計(jì)特征集構(gòu)建原始特征集;采用Fisher Score 方法對(duì)原始特征集進(jìn)行相關(guān)故障特征重要度排序;且采用最大信息系數(shù)對(duì)特征之間的相關(guān)性進(jìn)行評(píng)價(jià),進(jìn)而對(duì)特征排序結(jié)果進(jìn)行調(diào)整;以故障分類準(zhǔn)確率為評(píng)判依據(jù),基于隨機(jī)森林算法對(duì)Fisher Score 與最大信息系數(shù)混合模型進(jìn)行修正,進(jìn)而實(shí)現(xiàn)敏感故障特征篩選。進(jìn)行了仿真實(shí)驗(yàn)和實(shí)驗(yàn)臺(tái)實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,所提出的方法在篩選有效的故障特征上效果明顯,與傳統(tǒng)的reliefF 和mRMR 特征選擇方法相比,所提出的特征選擇方法有利于逆變器故障診斷識(shí)別分類,且故障識(shí)別準(zhǔn)確率分別提高了2.1%和1.3%。