劉忠鑫,康建設(shè),曲鳳明,鄧雅沖
(1.陸軍工程大學(xué)石家莊校區(qū),石家莊 050003;2.解放軍63856部隊(duì),吉林 白城 100037;3.陸軍裝甲兵軍事代表局駐天津地區(qū)軍代室,天津 300161)
自從 2000年,Seung[1-3]等人發(fā)表了 3篇流形學(xué)習(xí)開創(chuàng)性的研究成果,流形學(xué)習(xí)越來越多地被用到了數(shù)據(jù)處理中,與傳統(tǒng)的線性判別分析、主成分分析方法、核主成分分析方法相比,流形學(xué)習(xí)對(duì)非全局線性、高維數(shù)據(jù)的可視化具有很大優(yōu)勢(shì),能夠從海量的數(shù)據(jù)中尋找到數(shù)據(jù)中蘊(yùn)含的內(nèi)部幾何結(jié)構(gòu)及其規(guī)律。郝騰飛[4]將流形學(xué)習(xí)中的拉普拉斯算法應(yīng)用到旋轉(zhuǎn)機(jī)械的特征提取中,顯著提高了故障診斷的正確率;肖婷[5]等人利用流形學(xué)習(xí)和最小二乘支持向量機(jī)的方法對(duì)滾動(dòng)軸承進(jìn)行退化趨勢(shì)預(yù)測(cè);何青[6]等人基于流形學(xué)習(xí)方法對(duì)汽輪機(jī)組進(jìn)行特征提取,取得良好的效果。但是在實(shí)際應(yīng)用中發(fā)現(xiàn),幾乎任何一種流形學(xué)習(xí)算法都存在對(duì)噪聲數(shù)據(jù)比較敏感,要求稠密均勻取樣以及泛化能力差等缺點(diǎn),造成了流形學(xué)習(xí)在實(shí)際應(yīng)用中還存在一定的問題,針對(duì)此,國(guó)內(nèi)外專家學(xué)者做了大量研究。國(guó)防科學(xué)技術(shù)大學(xué)的詹宇斌[7]提出了一種噪聲健壯的流形學(xué)習(xí)算法;Choi[8]等成功地將Mercer核引入ISOMAP算法中,提高了原算法的泛化學(xué)習(xí)能力,同時(shí)其算法對(duì)抑制噪聲干擾有良好效果;Chang[9]等提出了一種魯棒局部線性嵌入算法(RLLE)來消除原始的局部線性嵌入算法對(duì)噪聲敏感,取得良好的效果。
本文主要針對(duì)滾動(dòng)軸承采集到的信號(hào)往往受到噪聲干擾,利用Boxplot算法對(duì)原始信號(hào)進(jìn)行去噪聲處理,再利用局部切空間排列方法(LTSA)對(duì)處理后的信號(hào)進(jìn)行降維,達(dá)到可視化的目的,并通過與直接使用流形學(xué)習(xí)算法降維結(jié)果進(jìn)行比較,表明該算法對(duì)于受到噪聲干擾的滾動(dòng)軸承信號(hào)有著良好的故障診斷效果。
Boxplot箱線圖實(shí)質(zhì)上是使用統(tǒng)計(jì)的方法對(duì)每一個(gè)點(diǎn)進(jìn)行識(shí)別,Boxplot算法在實(shí)現(xiàn)過程中的關(guān)鍵是求出每一點(diǎn)的權(quán)值向量,利用權(quán)值向量進(jìn)行判斷。分別對(duì)奇異值上下限進(jìn)行定義,上限定義為{Q1+α(Q3-Q1)},下限定義為{Q1-α(Q3-Q1)},其中,α∈[1.0,1.5]當(dāng)數(shù)據(jù)點(diǎn)的權(quán)值超出上下限,認(rèn)為就是被噪聲污染的點(diǎn),通過調(diào)節(jié)α具體確定上下限,與以往統(tǒng)計(jì)方法數(shù)據(jù)去噪相比,Boxplot箱線圖在進(jìn)行噪聲識(shí)別時(shí),不需要假設(shè)數(shù)據(jù)服從正態(tài)分布,具有很好的適用性,一般認(rèn)為使用統(tǒng)計(jì)方法識(shí)別噪聲點(diǎn),噪聲點(diǎn)個(gè)數(shù)不能超過1%,但Boxplot箱線圖最多能夠容忍25%的數(shù)據(jù)點(diǎn)被噪聲污染,在計(jì)算復(fù)雜程度上,Boxplot箱線圖方法計(jì)算簡(jiǎn)便快捷,能夠滿足超大數(shù)據(jù)量的運(yùn)算要求。
Boxplot算法是通過計(jì)算每一點(diǎn)的權(quán)值向量來實(shí)現(xiàn)的。具體過程為:
2)利用主成分分析方法,計(jì)算原始高維矩陣的低維映射X',以及反映射變換回來的像X'',因?yàn)榻?jīng)過主成分后的反映射與原始高維矩陣之間會(huì)產(chǎn)生一個(gè)誤差,記為 εj,εj=X'-X''。
4) 輸出權(quán)值向量 W=[w1,w2,…,wn]。
利用權(quán)值向量,采用Boxplot箱線圖算法識(shí)別其中的奇異值,認(rèn)為奇異值在原始矩陣中的對(duì)應(yīng)點(diǎn)被噪聲污染,予以刪除,獲取經(jīng)過處理的矩陣Ti。
采用局部線性嵌入算法對(duì)高維矩陣進(jìn)行降維處理,獲得低維映射矩陣
局部切空間排列算法(LTSA)是一種針對(duì)樣本存在孔洞情況下的有效的流行學(xué)習(xí)算法,同時(shí)計(jì)算量小,執(zhí)行速度快。其算法步驟為:
Dijb表示第i類和第j類之間的類間距向量;Diw表示第j類的類內(nèi)距向量;n為類別數(shù)。
2)計(jì)算局部切空間坐標(biāo),對(duì)XNi進(jìn)行中心化處理,求得進(jìn)行奇異值分解,得到左右奇異向量所構(gòu)成的矩陣Qi、Vi,選取最大的d個(gè)奇異值對(duì)應(yīng)的右奇異向量,組建矩陣Vi';同時(shí)得到的最優(yōu)解,即:,構(gòu)建出局部坐標(biāo)系
3)局部坐標(biāo)全局排列
將這些有交疊的局部坐標(biāo)系統(tǒng)Θi排列起來得到全局坐標(biāo)系統(tǒng) T,T=[Ti,…,TN]。Θi經(jīng)過局部排列矩陣Li(待確定)仿射轉(zhuǎn)換全局坐標(biāo)為:Ti=[ti1,ti2,…,tik],則局部重構(gòu)誤差為:,為了盡可能保持局部低維特征,極小化重建誤差,即:,固定全局坐標(biāo)矩陣Ti,最小化局部重構(gòu)誤差矩陣Ei,重建誤差又可以寫成:,其中為排列矩陣,是滿足的選擇矩陣,I是單位陣,,這樣通過計(jì)算φ的第2到第d+1小的特征值所對(duì)應(yīng)的特征向量就可以獲得低維映射,即 T=[u2,…,ud+1]。
本文采用Boxplot-LTSA算法進(jìn)行滾動(dòng)軸承狀態(tài)識(shí)別,直接對(duì)去噪后的原始振動(dòng)信號(hào)進(jìn)行處理,減少了在時(shí)頻域特征提取中造成的信息失真,增強(qiáng)了可視化的準(zhǔn)確性。
通過Boxplot算法對(duì)原始數(shù)據(jù)各個(gè)不同狀態(tài)進(jìn)行噪聲識(shí)別,去噪后的新數(shù)據(jù)集為Ti(i=1,2,…,n),將Ti均勻分成l組建立原始狀態(tài)矩陣XiM×l,對(duì)矩陣X使用LTSA算法進(jìn)行維數(shù)約減,達(dá)到滾動(dòng)軸承狀態(tài)識(shí)別的目的。
嵌入維數(shù)的確定:在進(jìn)行維數(shù)約減,實(shí)現(xiàn)可視化過程中,根據(jù)文獻(xiàn)[10-11]的研究結(jié)果,最優(yōu)的嵌入維數(shù)d為故障類數(shù)減去1,即d=n-1。
本研究提出以原始振動(dòng)信號(hào)建立高維矩陣,以原始信號(hào)構(gòu)建高維矩陣時(shí)l值的確定十分重要:在信號(hào)點(diǎn)數(shù)量一定的情況下,l較小時(shí)不同狀態(tài)的聚類效果很好,但是各個(gè)不同故障低維映射重疊嚴(yán)重,無法分辨軸承故障狀態(tài);當(dāng)l較大時(shí),可以通過低維映射識(shí)別不同故障,但是同類故障的聚類效果不好,誤判率較高,無法實(shí)現(xiàn)準(zhǔn)確的狀態(tài)識(shí)別。本文中分別使l=10,50,100,500,1 000,2 000,尋找合適的 l值。
本文以滾動(dòng)軸承作為研究對(duì)象,選擇美國(guó)凱斯西儲(chǔ)大學(xué)(Case Western Reserve University)電氣工程實(shí)驗(yàn)室的滾動(dòng)軸承,該數(shù)據(jù)來源于SKF6205滾動(dòng)軸承,其采樣頻率為12 kHz,預(yù)置故障的損傷尺寸為0.355 6 mm,分別選取該條件下的內(nèi)環(huán)故障、外環(huán)故障、滾動(dòng)體故障以及正常情況下的實(shí)驗(yàn)數(shù)據(jù),構(gòu)建原始矩陣。
為了驗(yàn)證本研究的有效性,通過與直接使用流形學(xué)習(xí)算法降維處理結(jié)果比較驗(yàn)證。
3.2.1 原始數(shù)據(jù)去噪處理
利用IRLS算法,計(jì)算每個(gè)點(diǎn)的權(quán)值,利用箱線圖找出奇異值,在原始矩陣中去除被噪聲污染的點(diǎn),組建新的原始矩陣。如圖 1(a)~ 圖 1(d)所示,分別為內(nèi)環(huán)故障、外圈故障、滾動(dòng)體故障以及健康狀態(tài)下的奇異值識(shí)別結(jié)果,圖中紅色“+”代表奇異值,不難看出,健康狀態(tài)下原始數(shù)據(jù)中受噪聲污染的數(shù)據(jù)點(diǎn)最少,符合實(shí)際預(yù)期。分別找出原始矩陣中對(duì)應(yīng)值,刪除后得到去噪后的原始矩陣X。
圖1 新的原始矩陣
3.2.2 基于去噪流形學(xué)習(xí)算法的三維可視化
圖2 l=1 000時(shí)Boxplot-LTSA降維映射分布圖
圖3 l=2 000時(shí)Boxplot-LTSA降維映射分布圖
將新的原始矩陣?yán)肔TSA算法進(jìn)行降維,近鄰點(diǎn)數(shù)量k=l/2,嵌入維數(shù)d=3。分別選擇l=10,50,100,500,1 000,2 000,由于篇幅原因,給出部分l值時(shí)低維映射結(jié)果。其中當(dāng)l=1 000時(shí),如圖2所示,在三維坐標(biāo)系中,不同故障的低維映射坐標(biāo)有明顯的區(qū)別,可以實(shí)現(xiàn)不同故障類型的診斷。當(dāng)l=2 000時(shí),如圖3所示,健康狀態(tài)下的低維映射聚類很好,內(nèi)環(huán)故障和滾動(dòng)體故障聚類效果一般,在進(jìn)行故障識(shí)別時(shí)會(huì)出現(xiàn)一定的誤判,外環(huán)故障聚類最差,無法完成故障識(shí)別。當(dāng)l=500時(shí),如圖4所示,健康狀態(tài)下的低維映射聚類很好,且與其他3種狀態(tài)無重疊,可以實(shí)現(xiàn)故障識(shí)別,內(nèi)環(huán)故障、滾動(dòng)體故障、外環(huán)故障的低維映射盡管聚類很好,但是卻重疊嚴(yán)重,無法準(zhǔn)確判斷故障位置。當(dāng)l=10,50,100時(shí),低維映射結(jié)果沒有明顯區(qū)別,不同狀態(tài)的三維映射重疊十分嚴(yán)重,無法區(qū)分不同故障類型。最終經(jīng)過測(cè)試l∈(900,1 200)時(shí),可以達(dá)到分類要求。
圖4 l=500時(shí)Boxplot-LTSA降維映射分布圖
圖5 l=1 000時(shí)LTSA降維映射分布圖
將不經(jīng)Boxplot算法處理的數(shù)據(jù),直接進(jìn)行維數(shù)約減,選擇近鄰點(diǎn) k=l/2,嵌入維數(shù) d=3,l=1 000,其三維圖如圖5所示,健康狀態(tài)、滾動(dòng)體故障的低維映射聚類效果較好,但是內(nèi)環(huán)故障、外環(huán)故障振動(dòng)信號(hào)明顯受到了干擾,并且,不同故障類型的低維映射重疊嚴(yán)重,很難通過降維識(shí)別出故障位置。因此,噪聲、沖擊等干擾對(duì)原始信號(hào)的影響確實(shí)是存在的,破壞了原始信號(hào)的內(nèi)部流形結(jié)構(gòu),因此,在不經(jīng)去噪處理的情況下,利用流形學(xué)習(xí)進(jìn)行維數(shù)約減無法找出其內(nèi)在規(guī)律。
為了進(jìn)一步驗(yàn)證該方法的有效性,分別選取4種狀態(tài)下的訓(xùn)練數(shù)據(jù),組建M×l矩陣,其中l(wèi)=1 000,k=l/2,利用Boxplot-LTSA算法進(jìn)行降維處理,通過低維映射,內(nèi)環(huán)故障、外環(huán)故障、滾動(dòng)體故障、健康狀態(tài)的識(shí)別率分別達(dá)到了97.5%、95%、96.2%、99%。
LTSA流形學(xué)習(xí)算法對(duì)噪聲信號(hào)的魯棒性較差,且對(duì)樣本點(diǎn)的密度和曲率變化敏感,樣本點(diǎn)密度和曲率的變化會(huì)使得樣本點(diǎn)到流形局部切空間的投影產(chǎn)生偏差。在消噪過程中,不可避免地一部分干凈信號(hào)被去除,一部分噪聲信號(hào)被留下,經(jīng)過探索,當(dāng) l∈(900,1 200)時(shí),剩余噪聲信號(hào)在每個(gè)維度的分割相對(duì)均勻,且信噪比也較低,噪聲影響降到了可以接受的程度,因此,能夠達(dá)到較好的映射效果,實(shí)現(xiàn)了滾動(dòng)軸承的故障診斷。
本文以滾動(dòng)軸承為背景,針對(duì)傳感器采集到的數(shù)據(jù)易受到噪聲、振動(dòng)、沖擊等多因素影響,提出了一種基于Boxplot-LTSA的噪聲流形學(xué)習(xí)算法,Boxplot算法對(duì)噪聲信號(hào)的耐抗性與LTSA算法在數(shù)據(jù)存在孔洞情況下良好的魯棒性結(jié)合,獲取的低維映射很好地反映了滾動(dòng)軸承不同故障信息,達(dá)到了狀態(tài)識(shí)別的目的。