趙榮珍, 常書源
(蘭州理工大學(xué) 機(jī)電工程學(xué)院, 甘肅 蘭州 730050)
旋轉(zhuǎn)機(jī)械廣泛應(yīng)用于機(jī)械制造、電力等許多重要領(lǐng)域,一旦發(fā)生故障會導(dǎo)致突然停機(jī),造成重大經(jīng)濟(jì)損失,甚至威脅人身安全[1].轉(zhuǎn)子作為旋轉(zhuǎn)機(jī)械的核心部件,它的故障是造成旋轉(zhuǎn)機(jī)械故障的重要原因[2].因此,對轉(zhuǎn)子系統(tǒng)進(jìn)行故障診斷具有重要的現(xiàn)實(shí)意義.
故障診斷本質(zhì)上是故障模式辨識,而故障模式辨識的效果受制于前期的特征提取.隨著數(shù)據(jù)獲取和存儲技術(shù)的長足發(fā)展,描述故障狀態(tài)的特征維度也在不斷地增加,導(dǎo)致在對故障狀態(tài)敏感的特征中混雜了大量的冗余信息,不同故障的特征屬性交互重疊,這為人工智能的模式識別帶來了極大的挑戰(zhàn).因此,需要對高維數(shù)據(jù)進(jìn)行有效的維數(shù)約簡[3].
特征選擇是降低數(shù)據(jù)維數(shù)的一類重要方法,能夠在提供足夠多分類信息的同時(shí)避免特征數(shù)目過多而引起維數(shù)災(zāi)難[4].在特征選擇方法中,較典型的有Fisher分值(fisher score,FS)[5]、方差分值[6]、拉普拉斯分值(Laplacian score,LS)[7]等.其中,FS是一種監(jiān)督式特征選擇算法,它僅僅關(guān)注特征的區(qū)分能力,以區(qū)分能力為標(biāo)準(zhǔn)篩選特征,但沒有考慮特征的局部信息保持能力.方差分值是最簡單的無監(jiān)督特征選擇算法,它認(rèn)為特征的方差越大表示能力就越強(qiáng),但它只用了特征的統(tǒng)計(jì)特性,并沒有關(guān)注數(shù)據(jù)的流形特性.LS是一種以局部保持投影[8]和拉普拉斯映射[9]為基礎(chǔ),結(jié)合特征的方差和局部信息保持能力來進(jìn)行無監(jiān)督特征選擇的方法,已經(jīng)被應(yīng)用到生物醫(yī)學(xué)[10]、故障診斷[11-12]等領(lǐng)域.然而,LS算法目前仍存在以下兩個(gè)主要缺點(diǎn):1) 在LS計(jì)算特征得分的過程中,以歐式距離為度量函數(shù)來構(gòu)造特征的近鄰圖,但已有研究表明,在高維空間中,歐氏距離不能提供顯著的相對距離差,從而無法明顯體現(xiàn)特征之間的差別;2) LS作為無監(jiān)督算法,無法利用樣本中的標(biāo)記信息,從而無法篩選出具有較好判別性的特征.
針對上述兩點(diǎn)不足,本文欲通過引入Manhattan距離[13]以克服高維空間中距離的計(jì)算問題.進(jìn)一步地,通過引入監(jiān)督思想改進(jìn)LS算法的權(quán)值函數(shù),以充分利用樣本中的標(biāo)記信息來提升算法的特征篩選性能,提出基于Manhattan距離的權(quán)值判別拉普拉斯分值(manhattan-weighted discriminative laplacian score,M-WDLS)特征選擇方法.
多元統(tǒng)計(jì)學(xué)中的主成分分析(principal component analysis,PCA)[14]可以抽取樣本集的主要元素,挖掘出隱藏在復(fù)雜數(shù)據(jù)中的簡單結(jié)構(gòu),不但能使數(shù)據(jù)可視化,而且能提高分類效率,被廣泛應(yīng)用在多個(gè)領(lǐng)域.因此,本文擬結(jié)合M-WDLS與PCA進(jìn)行轉(zhuǎn)子故障數(shù)據(jù)集的維數(shù)約簡和故障診斷.首先,對轉(zhuǎn)子系統(tǒng)振動信號在時(shí)域、頻域、時(shí)頻域分別提取特征,構(gòu)造混合域特征集;然后用M-WDLS方法進(jìn)行特征選擇,形成特征矩陣;最后對特征矩陣進(jìn)行PCA降維處理,并用K-近鄰(K-nearest neighbor algorithm,KNN)分類器[15]來建立低維特征向量與故障類別之間的對應(yīng)關(guān)系.
LS算法的基本思想[11]是:根據(jù)局部保持能力衡量特征的重要性,特征的分值代表其保持局部結(jié)構(gòu)的能力.該值越低表示其在特征空間中保持局部結(jié)構(gòu)的能力越強(qiáng),意味著這個(gè)特征越好.
LS假設(shè)同類樣本間距離較近,異類樣本間距離較遠(yuǎn),令s個(gè)特征的LS為Ls,定義為
由式(2)可知,LS方法采用歐式距離來衡量高維空間中特征間的相似性,從而無法有效體現(xiàn)特征之間的差別[3,13].然而文獻(xiàn)[13]通過數(shù)據(jù)升維實(shí)驗(yàn)證明,在高維空間中Manhattan距離可提供較歐氏距離更大的相對距離差值,能夠更好地體現(xiàn)出特征間的差異性.因此,引入Manhattan距離作為距離度量函數(shù),即
(3)
式中:xi、xj為d維空間上的兩個(gè)點(diǎn).
LS屬于無監(jiān)督方法,無法利用數(shù)據(jù)標(biāo)記中的先驗(yàn)信息來篩選出有利于實(shí)施分類的特征.因此,將樣本的類別標(biāo)記信息引入權(quán)值設(shè)置,在式(2)的基礎(chǔ)上,定義一種有監(jiān)督的判別賦權(quán)函數(shù)模型:
(4)
由式(4)和圖1可以看出:一方面,當(dāng)自變量相同時(shí),同類近鄰點(diǎn)權(quán)值大于異類近鄰點(diǎn)權(quán)值,因此同類近鄰點(diǎn)較異類近鄰點(diǎn)具有更高的相似度,使得同類近鄰局部散度小于異類近鄰局部散度;另一方面,相對于簡單的權(quán)值函數(shù)權(quán)值函數(shù)模型和熱核函數(shù)權(quán)值模型,判別權(quán)值函數(shù)中同類近鄰點(diǎn)權(quán)值保持不變,異類近鄰點(diǎn)權(quán)值變小,使得局部結(jié)構(gòu)的散度也必然變小.因此從局部結(jié)構(gòu)優(yōu)化的角度而言,結(jié)合了標(biāo)記信息的判別權(quán)值函數(shù)模型比簡單的權(quán)值函數(shù)權(quán)值函數(shù)模型與熱核函數(shù)權(quán)值模型更具判別性.
圖1 判別權(quán)值函數(shù)圖Fig.1 The graph of discriminant weight function
綜上所述,本文將Manhattan距離度量和判別賦權(quán)函數(shù)結(jié)合對LS進(jìn)行改進(jìn),提出一種M-WDLS方法.令Kt為第t個(gè)特征的M-WDLS,fti為第i個(gè)樣本的第t個(gè)特征(i=1,2,…,l,t=1,2,…,D),其中l(wèi)為樣本個(gè)數(shù),D為特征的維數(shù).M-WDLS的具體計(jì)算步驟設(shè)計(jì)如下:
步驟1 采用式(3)度量,通過K-近鄰法分別構(gòu)建類內(nèi)局部近鄰圖Gw和類間局部近鄰圖Gb.
步驟2 按照式(4),根據(jù)Gw和Gb計(jì)算加權(quán)矩陣W的元素.
步驟3 對于第t個(gè)特征,定義
式中:I為l維單位矩陣,L為圖的拉普拉斯矩陣.
由于某些維度數(shù)據(jù)差異很大,會主導(dǎo)局部近鄰圖的構(gòu)造,所以需對各個(gè)特征進(jìn)行去均值化處理
(9)
步驟4 計(jì)算第t個(gè)特征的得分
式(10)中,分子越小表示近鄰樣本在該特征上的差異越小,即該特征保持局部信息的能力越強(qiáng);分母越大表示樣本在該特征上差異越大,即該特征的區(qū)分能力越強(qiáng).因此,特征重要性與其得分成反比,即特征得分越低,該特征越重要.那么,根據(jù)得分對這些特征進(jìn)行升序排列,排在越前的特征越重要,M-WDLS特征選擇法選取Kt值最小的前若干個(gè)特征作為特征篩選的結(jié)果.
本文建立的故障診斷方法在一個(gè)典型雙跨度轉(zhuǎn)子實(shí)驗(yàn)臺上進(jìn)行了實(shí)驗(yàn)驗(yàn)證,故障診斷方法的流程如圖2所示,該方法的使用步驟如下:
圖2 基于M-WDLS和PCA故障診斷方法流程圖
首先,采用文獻(xiàn)[16]中的混合濾波方法對原始振動信號進(jìn)行消噪處理,對消噪后的振動信號進(jìn)行時(shí)域、頻域、時(shí)頻域的特征提取,得到初始高維特征集.其次,對初始高維特征集中的每一個(gè)特征計(jì)算其M-WDLS分值,按照從小到大的順序選擇若干個(gè)特征形成敏感特征子集.最后,用PCA挖掘出敏感特征子集中的主成分,并輸入KNN分類器實(shí)現(xiàn)對轉(zhuǎn)子系統(tǒng)故障的診斷.
本研究工作的實(shí)驗(yàn)對象為文獻(xiàn)[17]中的雙跨度轉(zhuǎn)子實(shí)驗(yàn)臺,如圖3所示.設(shè)備安裝有13個(gè)電渦流傳感器.其中,1個(gè)傳感器布置在電機(jī)端用于采集轉(zhuǎn)速信號,其余12個(gè)傳感器分別布置在6個(gè)截面處的相互垂直方位,用于采集不同方位的振動信號.在該設(shè)備上分別模擬轉(zhuǎn)子不對中、質(zhì)量不平衡、動靜碰磨、軸承松動及正常轉(zhuǎn)動5種狀態(tài)實(shí)驗(yàn).設(shè)置采樣頻率為5 000 Hz,轉(zhuǎn)速為3 000 r/min,采集各種狀態(tài)類型數(shù)據(jù)樣本80組,其中20組作為訓(xùn)練樣本,60組作為測試樣本.對每個(gè)通道采集的信號按表1所列的參數(shù)提取特征,擴(kuò)展至12個(gè)通道,構(gòu)造12×26=312維的混合域特征集,特征集構(gòu)造方式如表2所列.
圖3 雙跨度轉(zhuǎn)子實(shí)驗(yàn)臺Fig.3 Double-span rotor test bench
表1 特征參數(shù)Tab.1 Characteristic parameters
表2 初始高維特征集Tab.2 Initial high dimensional feature set
… ,f400,n]T,(m=1,… ,400;n=1,…,312).
按照圖2所示的流程,本文需確定的參數(shù)有:M-WDLS中的近鄰參數(shù)k1與選擇敏感特征向量的數(shù)量m,PCA降維的目標(biāo)維數(shù)d及KNN中的近鄰參數(shù)k2.
其中,PCA降維的目標(biāo)維數(shù)d采用極大似然估計(jì)法計(jì)算得到d=4.不同的k1與m組合得到的效果在KNN中的識別率不同,設(shè)置k1的范圍為3~15,步長為1.用M-WDLS計(jì)算各個(gè)特征量的得分,剔除得分大于0.1的特征量,剩余的特征量作為候選特征.經(jīng)多次試驗(yàn),確定的40個(gè)候選特征量={F288,F301,F287,F290,F289,F184,F183,F186,F185,F197,F262,F261,F264,F263,F236,F275,F238,F235,F237,F249,F93,F157,F1,F48,F80,F85,F276,F269,F149,F76,F82,F267,F60,F266,F279,F69,F58,F94,F81,F281},因而選定m的范圍為4~40,步長為1.對所有的k1和m進(jìn)行計(jì)算,結(jié)果如圖4所示.
由圖4可知,當(dāng)k1=8時(shí),整體識別率相較于其他情況更好,盡管k1取其他值時(shí)也有識別率較高的情況出現(xiàn),但起伏較大不穩(wěn)定,整體而言k1=8時(shí)效果最好.當(dāng)k1=8,m的范圍為17~20時(shí),整體識別率達(dá)到最大值99%.固定單一分量k1=8,參數(shù)m的選擇情況,如圖5所示.
圖4 整體識別率隨k1與m的變化Fig.4 The overall recognition rate change with k1 and m
由圖5可以看出,當(dāng)k1=8時(shí),m在17~20范圍內(nèi)整體識別率達(dá)到最高,但從21開始整體識別率有所下降.由此表明特征量個(gè)數(shù)m對故障診斷結(jié)果有顯著影響,若特征量個(gè)數(shù)過少,則無法完全反映和區(qū)分故障類型與故障程度,診斷精度不高;如果特征量個(gè)數(shù)過多會造成信息的冗余,降低診斷精度.基于上述分析,選擇特征量個(gè)數(shù)過多或過少都不宜,本文選取m=18是可行且合理的.因此選擇出的18個(gè)特征向量={F288,F301,F287,F290,F289,F184,F183,F186,F185,F197,F262,F261,F264,F263,F236,F275,F238,F235}.
圖5 k1=8時(shí)整體識別率隨m變化曲線Fig.5 The overall recognition rate change with k1 and m
確定k1和m的取值后,將經(jīng)PCA降維得到的低維特征集輸入到 KNN中,并設(shè)置k2的范圍為3~15,其整體識別率隨k2變化如圖6所示.可見當(dāng)k2=6時(shí),KNN達(dá)到了最高識別率.
圖6 整體識別率隨k2變化的曲線Fig.6 The overall recognition rate change with k2
通過上述分析可以看出,當(dāng)k1=8、m=18、k2=6時(shí),整體識別率能達(dá)到較為理想的效果,因此本文在實(shí)驗(yàn)分析中采用這些取值.
為進(jìn)一步說明本文方法的有效性,采用文獻(xiàn)[2]中類間離散度與類內(nèi)離散度的相關(guān)比值Je作為評價(jià)指標(biāo)進(jìn)行算法的有效性評估.Je越大,則說明類內(nèi)離散度越小,類間離散度越大,分離效果越好.Je的計(jì)算公式如下:
(13)
(14)
(15)
為驗(yàn)證本文提出方法的有效性,分別用FS、LS、SLS算法代替2.3節(jié)所示流程中的M-WDLS算法,對高維特征集進(jìn)行特征篩選,對比4種方法的診斷效果.經(jīng)4種算法篩選后得到能使識別率達(dá)到最高的最優(yōu)特征子集如表3所列.4種算法篩選出的最優(yōu)特征子集經(jīng)PCA降維可視化得到的三維輸出效果如圖7所示.用評價(jià)指標(biāo)Je評價(jià)圖7中基于4種方法的分離效果,結(jié)果如表4所列.
表3 各個(gè)算法選擇出的特征子集Tab.3 Feature vector selected by each algorithm
表4 四種方法類間類內(nèi)評價(jià)指標(biāo)Tab.4 Four methods and inter-class evaluation indicators
由圖7和表4可以看出:圖7a和圖7b中轉(zhuǎn)子不對中、松動、碰磨這3類故障分離,但是質(zhì)量不平衡與正常狀態(tài)之間存在不同程度的混疊,而且FS與LS兩種方法篩選出的特征分類評價(jià)指標(biāo)都較低,說明類間并沒有很好地分開,這是由于經(jīng)FS與LS篩選后的特征集中還存在冗余數(shù)據(jù);圖7c中SLS篩選出特征的分離效果較FS和LS好,5種狀態(tài)大致分離,但不平衡、碰磨、正常這3類狀態(tài)之間間距較小,類間離散度小,其評價(jià)指標(biāo)Je=9.773 4,亦可佐證這點(diǎn);圖7d中故障狀態(tài)分離效果最好,明顯使類內(nèi)聚集、類間分離,評價(jià)指標(biāo)Je達(dá)到15.670 7,可見M-WDLS能有效篩選出對故障敏感且聚類性較好的特征,具有一定的優(yōu)越性.
圖7 測試樣本基于不同算法的可視化效果
將上述4種方法得到的融合特征集分別輸入KNN分類器.為了對比,同樣將特征集輸入SVM分類器,進(jìn)行故障辨識,SVM選用RBF核函數(shù),設(shè)置懲罰參數(shù)C=1,核參數(shù)ε=1,結(jié)果如表5所列.
表5 特征選擇算法及其KNN辨識準(zhǔn)確率Tab.5 Feature selection algorithm and its KNN identification accuracy
由表5可知:原始特征的分類精度遠(yuǎn)低于特征選擇方法篩選出特征的分類精度,這表明了特征選擇的重要性;并且KNN的平均辨識精度優(yōu)于SVM的.
分析表3和表5可知:從最優(yōu)特征子集來看,本文方法在所有特征選擇方法中得到了最小的特征子集規(guī)模,而其他3種方法得到的特征子集維數(shù)均略大;從分類準(zhǔn)確率方面來看,基于M-WDLS算法的分類精度最高為99%,具有一定優(yōu)勢.
為進(jìn)一步驗(yàn)證本文所提方法的穩(wěn)定性,改變訓(xùn)練樣本與測試樣本的比例,設(shè)置訓(xùn)練樣本數(shù)/測試樣本數(shù)為10/70、15/65、20/60、25/55、30/50、35/45、40/40、45/35、50/30.并且分析出4種方法的低維測試樣本輸入KNN分類器所得的平均識別率,如圖8所示.
圖8表明:總體上,4種特征選擇方法的平均識別率都隨訓(xùn)練樣本數(shù)的增加而增加,這是因?yàn)橛?xùn)練樣本越多,其中所包含的判別信息就越多,所以故障識別率得到了一定提升;LS方法在訓(xùn)練樣本少于25時(shí)平均識別率出現(xiàn)波動情況,這是由于LS并不能有效提取存在于數(shù)據(jù)樣本中的判別信息;SLS的穩(wěn)定性和平均識別率明顯優(yōu)于FS與LS,但在訓(xùn)練樣本較少時(shí),識別率低于M-WDLS;其中,M-WDLS的穩(wěn)定性最好,在訓(xùn)練樣本較少的情況下也能取得較好的平均識別率,明顯優(yōu)于其他3種方法.
圖8 不同訓(xùn)練樣本數(shù)對應(yīng)的平均識別準(zhǔn)確率Fig.8 The average recognition accuracy of different training sample
以上分析表明,基于M-WDLS特征選擇方法能夠有效地提取轉(zhuǎn)子故障的特征信息,與PCA及KNN分類器結(jié)合可以有效實(shí)現(xiàn)轉(zhuǎn)子系統(tǒng)的故障診斷,比基于FS、LS、SLS的方法具有更好的辨識精度和穩(wěn)定性,是一種有效的轉(zhuǎn)子故障診斷方法.
本文提出一種M-WDLS特征選擇算法,該算法使用Manhattan距離作為度量函數(shù)量化樣本間的相似性.在考慮數(shù)據(jù)局部幾何結(jié)構(gòu)的同時(shí),將數(shù)據(jù)的標(biāo)記信息融入權(quán)值的設(shè)置,充分利用了數(shù)據(jù)的標(biāo)記信息,使算法能有效提取對故障敏感的特征,減少無關(guān)或冗余特征.方法的驗(yàn)證結(jié)果表明,用M-WDLS方法進(jìn)行特征選擇得到敏感特征矩陣,再對敏感特征矩陣進(jìn)行PCA降維處理,能有效提取轉(zhuǎn)子系統(tǒng)故障特征.在此基礎(chǔ)上再應(yīng)用KNN分類算法對轉(zhuǎn)子系統(tǒng)故障狀態(tài)進(jìn)行識別,能有效地提高轉(zhuǎn)子系統(tǒng)故障辯識的準(zhǔn)確性.