孫海蓉,王 蕊,2,耿軍亞,2
(1.華北電力大學(xué)控制與計(jì)算機(jī)工程學(xué)院,河北保定 071003;2.華北電力大學(xué)河北省發(fā)電過(guò)程仿真與優(yōu)化控制工程技術(shù)研究中心,河北保定071003)
基于信息熵和BP神經(jīng)網(wǎng)絡(luò)的故障分類方法
孫海蓉1,王 蕊1,2,耿軍亞1,2
(1.華北電力大學(xué)控制與計(jì)算機(jī)工程學(xué)院,河北保定 071003;2.華北電力大學(xué)河北省發(fā)電過(guò)程仿真與優(yōu)化控制工程技術(shù)研究中心,河北保定071003)
為了實(shí)現(xiàn)電廠運(yùn)行中設(shè)備故障類型的快速、準(zhǔn)確判斷,解決神經(jīng)網(wǎng)絡(luò)因輸入量增多導(dǎo)致收斂速度大幅降低的問(wèn)題,將基于近似決策熵模型的屬性約簡(jiǎn)算法結(jié)合BP神經(jīng)網(wǎng)絡(luò)進(jìn)行故障分類預(yù)測(cè)?;谛畔㈧氐膶傩约s簡(jiǎn)算法對(duì)故障樣本數(shù)據(jù)進(jìn)行預(yù)處理,得到約簡(jiǎn)決策表,將約簡(jiǎn)數(shù)據(jù)樣本作為BP神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練,預(yù)測(cè)故障分類。將該方法用于汽輪機(jī)振動(dòng)故障診斷,結(jié)果表明:有效降低了神經(jīng)網(wǎng)絡(luò)的輸入維數(shù),簡(jiǎn)化了網(wǎng)絡(luò)結(jié)構(gòu),獲得了較高的分類精度,同時(shí)降低了計(jì)算開銷,對(duì)快速判斷故障類型,提高維修效率,具有工程實(shí)用價(jià)值。
粗糙集;神經(jīng)網(wǎng)絡(luò);近似決策熵;故障分類預(yù)測(cè);汽輪機(jī)
設(shè)備故障診斷方法主要有三種,分別是基于信號(hào)處理的方法、基于解析模型的方法和基于知識(shí)的診斷方法。近年來(lái),隨著人工智能及計(jì)算機(jī)技術(shù)的進(jìn)步,基于知識(shí)的故障診斷方法發(fā)展迅速?;谥R(shí)的故障診斷方法包括神經(jīng)網(wǎng)絡(luò)法、故障樹法、數(shù)據(jù)驅(qū)動(dòng)法以及粗糙集法[1]等。由于現(xiàn)有設(shè)備系統(tǒng)的復(fù)雜性,現(xiàn)有診斷方法難以滿足診斷要求,且無(wú)法滿足在線診斷的要求,因此多種診斷方法融合的診斷方法得到關(guān)注。將粗糙集與神經(jīng)網(wǎng)絡(luò)方法相結(jié)合[2-6],利用粗糙集對(duì)數(shù)據(jù)的預(yù)處理能力對(duì)數(shù)據(jù)樣本進(jìn)行屬性約簡(jiǎn)[7-9],可以降低神經(jīng)網(wǎng)絡(luò)的復(fù)雜度,但是粗糙集的計(jì)算性能對(duì)運(yùn)行時(shí)間的影響是其面臨的問(wèn)題。
尋求樣本數(shù)據(jù)的最小約簡(jiǎn)已被證明是一個(gè)NP-hard問(wèn)題,因此提出了很多啟發(fā)式屬性約簡(jiǎn)方法,通過(guò)計(jì)算局部最優(yōu)解來(lái)獲得全局最優(yōu)解。信息熵概念的引入,使得基于熵的屬性約簡(jiǎn)得到廣泛關(guān)注。但是現(xiàn)有基于熵的屬性約簡(jiǎn)算法大多是從信息論觀點(diǎn)出發(fā),忽略了代數(shù)觀點(diǎn)的影響,且計(jì)算性能還有待提高。
針對(duì)傳統(tǒng)屬性約簡(jiǎn)算法的現(xiàn)有問(wèn)題,本文提出了結(jié)合信息熵的BP神經(jīng)網(wǎng)絡(luò)故障分類辦法,采用一種新的信息熵模型——近似決策熵模型作為屬性約簡(jiǎn)算法,對(duì)輸入樣本進(jìn)行處理,將得到的約簡(jiǎn)樣本用于構(gòu)建神經(jīng)網(wǎng)絡(luò),結(jié)果表明,該方法運(yùn)行時(shí)間快,能獲得較小的約簡(jiǎn)和較高的分類精度,最終達(dá)到提高收斂速度的目的。將該方法用于汽輪機(jī)振動(dòng)故障診斷,驗(yàn)證了該方法的可行性和有效性,對(duì)于快速準(zhǔn)確地判斷故障類型,提高維修效率,具有重要的現(xiàn)實(shí)意義。
給定一個(gè)論域U和該論域上的一簇等價(jià)關(guān)系S,若P?S,且P≠φ,則∩P仍然是論域U上的一個(gè)等價(jià)關(guān)系,即可定義不可分辨關(guān)系IND(P)[10]。
對(duì)于給定的知識(shí)庫(kù)K=(U,S),其中S為論域U上的等價(jià)關(guān)系簇,則?X?U和論域U上的一個(gè)等價(jià)關(guān)系R∈IND(K),可以定義子集X關(guān)于知識(shí)R的下近似和上近似分別為
(1)
(2)
給定一個(gè)論域U和該論域上的一個(gè)等價(jià)關(guān)系R,?X?U,等價(jià)關(guān)系R定義的集合X的近似精度為
(3)
2.1 定義
已知給定決策表為DT=(U,C,D,V,f),其中,令U/IND(B)={X1,X2,…,Xn},X為任意屬性集B在論域U上的等價(jià)類,n為屬性集B在論域U上的等價(jià)類數(shù);令U/IND(D)={Y1,Y2,…,Ym},Y為決策屬性D在論域U上的等價(jià)類,m為決策屬性D在論域U上的等價(jià)類數(shù)。并且對(duì)于任意屬性集B?C,將決策屬性集D相對(duì)于B的近似決策熵定義為[10]
(4)
式中:αB(Yi)為Yi在不可分辨關(guān)系IND(B)下的近似精度;p(Xj)=|Xj|/|U|;p(Yi|Xj)=|Xj∩Yi|/|Xj|;i和j的取值范圍為1≤i≤m,1≤j≤n。
可知,在近似決策熵的定義中,將粗糙集中的近似精度引入到傳統(tǒng)的條件熵模型中。相對(duì)于傳統(tǒng)的信息熵模型,近似決策熵重新定義屬性重要性,不僅可以度量知識(shí)的粒度大小,而且可以度量知識(shí)的完備性,提供了一種更加全面的不確定性度量方法。在計(jì)算不可分辨關(guān)系的劃分時(shí)引入了基數(shù)排序和增量式的思想,提高了計(jì)算性能。
在決策表DT中的任何屬性a∈C-B相對(duì)于B和D的重要性定義為
Sig(a,B,D)=
(5)
該屬性重要性由近似決策熵度量,以此作為尋找約簡(jiǎn)的啟發(fā)式信息。
2.2 屬性約簡(jiǎn)算法
知識(shí)庫(kù)中的屬性并不都是同等重要的,甚至其中某些屬性是冗余的。屬性約簡(jiǎn)就是在保持知識(shí)庫(kù)分類能力不變的條件下,刪除其中不相關(guān)或不重要的屬性。令R為一族等價(jià)關(guān)系,且有屬性a∈R,如果IND(R)=IND(R-{a}),則稱R-{a}是R的一個(gè)約簡(jiǎn)。其中IND(R)為子集R在論域上的不可分辨關(guān)系。約簡(jiǎn)算法[10]的具體步驟如下:
第1步:置核屬性集合和約簡(jiǎn)集合為空。
第2步:計(jì)算條件屬性和決策屬性的劃分。
第3步:計(jì)算條件屬性的近似決策熵。
第4步:計(jì)算基于近似決策熵的核屬性。令約簡(jiǎn)集等于核屬性集,并求取約簡(jiǎn)集合的近似決策熵。
第5步:求取約簡(jiǎn)集。對(duì)約簡(jiǎn)集合以外的每個(gè)條件屬性,計(jì)算其對(duì)約簡(jiǎn)集和決策屬性的重要性,該重要性以近似決策熵度量。選取重要性最大的條件屬性并入約簡(jiǎn)集合,并計(jì)算新的約簡(jiǎn)集的近似決策熵。
終止條件為:約簡(jiǎn)屬性集合的近似決策熵和條件屬性集合的近似決策熵相等。
表1 汽輪機(jī)振動(dòng)故障數(shù)據(jù)樣本序號(hào)
BP神經(jīng)網(wǎng)絡(luò)最主要的優(yōu)點(diǎn)是其具有極強(qiáng)的非線性映射能力以及可以濾除訓(xùn)練樣本中的隨機(jī)噪聲,但是神經(jīng)網(wǎng)絡(luò)不具備對(duì)輸入數(shù)據(jù)預(yù)處理的能力。粗糙集可以剔除冗余屬性,降低樣本空間的維數(shù),但是其對(duì)噪聲很敏感。因此,先利用粗糙集對(duì)冗余數(shù)據(jù)進(jìn)行約簡(jiǎn),然后將約簡(jiǎn)樣本空間作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)進(jìn)行訓(xùn)練。粗糙集和神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法,彌補(bǔ)各自的不足,可以達(dá)到優(yōu)化網(wǎng)絡(luò)性能的目的。但是粗糙集的計(jì)算性能對(duì)運(yùn)行時(shí)間的影響是需要解決的問(wèn)題。
本文將基于近似決策熵的屬性約簡(jiǎn)算法用于對(duì)故障樣本數(shù)據(jù)的預(yù)處理。該算法在分類精度、運(yùn)行時(shí)間等方面優(yōu)于傳統(tǒng)的基于信息熵的屬性約簡(jiǎn)算法等多個(gè)算法[10]。具體步驟為:
第一步:對(duì)連續(xù)數(shù)據(jù)進(jìn)行離散化、標(biāo)準(zhǔn)化,得到原始決策表。
第二步:對(duì)原始決策表進(jìn)行約簡(jiǎn),刪除冗余屬性,得到約簡(jiǎn)決策表。
第三步:將約簡(jiǎn)數(shù)據(jù)樣本作為BP神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練。
4.1 汽輪機(jī)振動(dòng)故障信息系統(tǒng)
本文所采用的數(shù)據(jù)為模擬轉(zhuǎn)子實(shí)驗(yàn)臺(tái)采集的故障數(shù)據(jù)[11-12],模擬轉(zhuǎn)子實(shí)驗(yàn)臺(tái)可用于研究軸系振動(dòng)特性,同時(shí)測(cè)量x和y方向軸的相對(duì)振動(dòng),在實(shí)驗(yàn)臺(tái)上人為制造了4組故障試驗(yàn),本文選取其中的3種故障數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),包括不平衡、碰磨和油膜振蕩等故障信息,每類故障選取5組數(shù)據(jù),構(gòu)成3類15組數(shù)據(jù)樣本,如表1所示。
其中f1為轉(zhuǎn)速工頻。另選取3類9組故障數(shù)據(jù)作為測(cè)試樣本,驗(yàn)證網(wǎng)絡(luò)性能。表1中的征兆數(shù)據(jù)是根據(jù)給定的征兆提取公式獲得的,例如,2倍頻信號(hào)的征兆提取公式為X2f1/Xf1≥K,即相應(yīng)頻譜信號(hào)幅值與工頻信號(hào)幅值的比值,若其大于給定的判別基準(zhǔn),則認(rèn)定為故障征兆。其中,X代表振幅,K代表該成分振動(dòng)是否存在的判別基準(zhǔn)。
4.2 連續(xù)決策表離散化
將故障數(shù)據(jù)的頻譜值作為條件屬性,故障類別作為決策屬性,構(gòu)建原始決策表。根據(jù)頻譜值特性將連續(xù)決策表離散化,得到離散化后的決策表,如表2所示,其中,決策屬性1代表不平衡故障,2代表碰磨故障,3代表油膜振蕩故障;條件屬性中的c1~c9分別代表頻譜值(0.01~0.39)f1,(0.4~0.49)f1,0.5f1,(0.51~0.99)f1,1f1,2f1,(3~5)f1,奇數(shù)f1,>5f1(f1為轉(zhuǎn)速工頻);離散化后的決策表中離散型數(shù)值0代表連續(xù)屬性值范圍為(0,0.1),離散型數(shù)值1代表連續(xù)屬性值范圍為(0.1,0.3),數(shù)值2代表范圍為(0.3,1)。
表2 離散化后的故障樣本決策表
4.3 故障樣本屬性約簡(jiǎn)
利用基于近似決策熵模型的屬性約簡(jiǎn)算法對(duì)故障樣本進(jìn)行預(yù)處理,決策表進(jìn)行屬性約簡(jiǎn)后的故障樣本見表3。
由表3可知,得到約簡(jiǎn)條件屬性集為[c4,c5,c6],即頻譜值為(0.51~0.99)f1,1f1,2f1,共3個(gè)屬性,剔除了冗余故障征兆,簡(jiǎn)化了樣本空間。
表3 約簡(jiǎn)后的故障樣本
4.4 信息熵與BP神經(jīng)網(wǎng)絡(luò)結(jié)合故障分類
當(dāng)隱含層神經(jīng)元個(gè)數(shù)不同時(shí),比較預(yù)測(cè)誤差,如表4所示??芍[含層節(jié)點(diǎn)數(shù)為11時(shí)分類正確率較高,且訓(xùn)練時(shí)間較短,因此確定該網(wǎng)絡(luò)隱含層節(jié)點(diǎn)個(gè)數(shù)為11,即網(wǎng)絡(luò)結(jié)構(gòu)為3-11-3。
表4 不同隱含層神經(jīng)元個(gè)數(shù)時(shí)的網(wǎng)絡(luò)性能
為了驗(yàn)證本文方法的可行性和有效性,用信息熵與BP神經(jīng)網(wǎng)絡(luò)結(jié)合的方法和傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比。使用9個(gè)測(cè)試樣本對(duì)訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類準(zhǔn)確性的檢驗(yàn),離散化后的測(cè)試樣本如表5所示,表中只給出了約簡(jiǎn)后的屬性數(shù)據(jù)。圖1為傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)類別和實(shí)際類別的比較,由圖可知,在9個(gè)樣本數(shù)據(jù)中,7個(gè)數(shù)據(jù)分類正確,2個(gè)數(shù)據(jù)分類錯(cuò)誤,分類準(zhǔn)確率為77.78%。圖2為近似決策熵與BP神經(jīng)網(wǎng)絡(luò)結(jié)合方法的預(yù)測(cè)結(jié)果比較,由圖可知,在9個(gè)樣本數(shù)據(jù)中,8個(gè)數(shù)據(jù)分類正確,1個(gè)數(shù)據(jù)分類錯(cuò)誤,其中不平衡故障和油膜振蕩故障全部分類正確,分類準(zhǔn)確率為88.89%。
表5 離散化后的測(cè)試樣本決策表
由圖1、圖2比較結(jié)果可知,近似決策熵與BP神經(jīng)網(wǎng)絡(luò)結(jié)合的方法比傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)方法分類準(zhǔn)確度更高。
圖1 傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果
圖2 近似決策熵與BP神經(jīng)網(wǎng)絡(luò)結(jié)合的預(yù)測(cè)結(jié)果
分別用傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)(BP NN)、近似決策熵與BP神經(jīng)網(wǎng)絡(luò)結(jié)合(ADE-BP NN)兩種方法對(duì)故障樣本進(jìn)行10次訓(xùn)練??傻闷骄A(yù)測(cè)分類正確率和運(yùn)行時(shí)間(表6)。將預(yù)測(cè)結(jié)果與基于粗糙集和支持向量機(jī)分類方法(RS-(LS-SVM))[10]的診斷結(jié)果進(jìn)行對(duì)比,如表6所示。
可知,與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)相比,近似決策熵與BP網(wǎng)絡(luò)的結(jié)合方法消除了反應(yīng)不明顯的故障征兆,將原始的9維數(shù)據(jù)集降為3維,在不改變分類能力的條件下簡(jiǎn)化了BP網(wǎng)絡(luò)結(jié)構(gòu),最終使得訓(xùn)練時(shí)間減少,網(wǎng)絡(luò)性能得到改善。與基于粗糙集和支持向量機(jī)的分類方法相比,本文提到的方法有更高的分類精度。因而驗(yàn)證了本文提到的基于近似決策熵模型的屬性約簡(jiǎn)算法與神經(jīng)網(wǎng)絡(luò)結(jié)合的可行性和有效性,體現(xiàn)了其在數(shù)據(jù)挖掘方面的應(yīng)用價(jià)值[13-17]。
表6 不同方法網(wǎng)絡(luò)性能比較結(jié)果
本文將信息熵與神經(jīng)網(wǎng)絡(luò)相結(jié)合應(yīng)用于汽輪機(jī)振動(dòng)故障診斷,采用近似決策熵模型進(jìn)行屬性約簡(jiǎn),在保證分類能力不變的條件下簡(jiǎn)化了網(wǎng)絡(luò)結(jié)構(gòu)。結(jié)果表明,約簡(jiǎn)結(jié)果剔除反應(yīng)不明顯的故障征兆,有效降低了神經(jīng)網(wǎng)絡(luò)的輸入維數(shù),提高了神經(jīng)網(wǎng)絡(luò)的收斂速度,提高了故障分類預(yù)測(cè)的正確率,驗(yàn)證了本文方法的有效性。該方法可以實(shí)現(xiàn)運(yùn)行過(guò)程中快速準(zhǔn)確判斷故障類型,提高維修效率,具有工程實(shí)用價(jià)值。
[1]張小易,徐兵,張巖,等.利用氣象等影響要素的電力系統(tǒng)故障元件識(shí)別與故障原因分析[J].華北電力大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,41(6):14-21.
[2]張鵬,郝一川.粗糙集-神經(jīng)網(wǎng)絡(luò)在民航飛機(jī)故障數(shù)據(jù)處理中的應(yīng)用[J].控制工程,2016,23(1):87-90.
[3]李虎成,邱建東,李屹.基于粗糙集-BP神經(jīng)網(wǎng)絡(luò)的機(jī)車滾動(dòng)軸承故障診斷[J].計(jì)算機(jī)與數(shù)字工程,2014,42(3):526-530.
[4]王學(xué)明.幾種粗糙集模型及與神經(jīng)網(wǎng)絡(luò)相結(jié)合的研究[D].成都:電子科技大學(xué),2013.
[5]李偉,何鵬舉,楊恒,等.基于粗糙集和改進(jìn)遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的算法研究[J].西北工業(yè)大學(xué)學(xué)報(bào),2012,30(4):601-606.
[6]洪月華.一種基于蟻群算法與粗糙集的混合BP神經(jīng)網(wǎng)絡(luò)[J].微電子學(xué)與計(jì)算機(jī),2014,31(4):156-159.
[7]馬立新,鄭曉棟,尹晶晶.主分量啟發(fā)式約簡(jiǎn)算法的短期負(fù)荷預(yù)測(cè)[J].電力科學(xué)與工程,2015,31(1):27-30.
[8]王秋平,陳志強(qiáng),魏浩.基于數(shù)據(jù)挖掘的電站運(yùn)行參數(shù)目標(biāo)值優(yōu)化[J].電力科學(xué)與工程,2015,31(7):19-24.
[9]李建強(qiáng),姜翻,汪安明,等.粗糙集在控制燃煤電廠NOx排放中的應(yīng)用[J].電力科學(xué)與工程,2014,30(12):19-23.
[10]江峰,王莎莎,杜軍威,等.基于近似決策熵的屬性約簡(jiǎn)[J].控制與決策,2015,30(1):65-70.
[11]張鴻雁.基于改進(jìn)支持向量機(jī)方法的汽輪機(jī)故障診斷研究[J].煤礦機(jī)械,2008,29(7):197-199.
[12]李鵬.基于粗糙集和支持向量機(jī)的汽輪機(jī)振動(dòng)故障診斷研究[D].保定:華北電力大學(xué),2009.
[13]李成,于永斌,王舜燕,等. 基于BP和WTA神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷方法研究[J]. 計(jì)算機(jī)與數(shù)字工程,2017(2):291-298.
[14]王松嶺,許小剛,劉錦廉,等.基于符號(hào)動(dòng)力學(xué)信息熵與改進(jìn)神經(jīng)網(wǎng)絡(luò)的風(fēng)機(jī)故障診斷研究[J].華北電力大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,40(4):51-58.
[15]劉國(guó)慶,史小春,廖強(qiáng).基于神經(jīng)網(wǎng)絡(luò)分類算法的電機(jī)軸承故障檢測(cè)方法[J].微特電機(jī),2017,45(1):30-33,37.
[16]劉鑫,賈云獻(xiàn),孫磊,等.基于BP神經(jīng)網(wǎng)絡(luò)的變速箱故障診斷方法研究[J]. 計(jì)算機(jī)測(cè)量與控制,2017,25(1):12-15.
[17]韓中合,韓悅,朱霄珣.基于IMF信息熵與SVM的轉(zhuǎn)子振動(dòng)故障智能診斷方法[J].華北電力大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,39(4):81-85.
Fault Classification Prediction Based on Entropy and BP Neural Network
SUN Hairong1,WANG Rui1,2,GENG Junya1,2
(1.School of Control and Computer Engineering,North China Electric Power University,Baoding 071003,China;2. Hebei Engineering Research Center of Simulation & Optimized Control for Power Generation,North China Electric Power University,Baoding 071003,China)
In order to determine the fault type quickly and accurately during the normal operation of a power plant, and solve the problem that the convergence rate of Neural Network (NN) decreases dramatically with the increase of the inputs, a new prediction scheme based on entropy was presented. The model of approximation decision entropy was used to reduce attribute of the fault sample and then the reduction results were used as the inputs of BP NN. The scheme was applied to the vibration fault classification prediction of the steam turbine. The prediction results were also compared with the ones obtained by other algorithms. The results show that the input dimension of BP NN was reduced, and the proposed scheme obtains smaller reductions and higher classification accuracies with relatively low computational cost. This scheme will have the practical value on fault diagnosis.
rough set;neural network;approximation decision entropy;fault classification prediction;steam turbine
10.3969/j.ISSN.1672-0792.2017.03.009
2016-09-05。
中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(2016MS143)。
TP18
A
1672-0792(2017)03-0049-06
孫海蓉(1972-),女,副教授,博士,研究方向?yàn)橹悄芸刂啤?shù)據(jù)挖掘、火電廠優(yōu)化控制、故障診斷。