摘 要:軸承是鐵路列車(chē)走行部中的關(guān)鍵組成部分,其工作環(huán)境復(fù)雜,容易發(fā)生故障,不能保障列車(chē)運(yùn)行安全。根據(jù)經(jīng)驗(yàn)對(duì)運(yùn)營(yíng)條件下的貨車(chē)故障軸承進(jìn)行識(shí)別,缺乏智能檢測(cè)技術(shù)。本文基于孿生網(wǎng)絡(luò)(Siamese)和局部離群因子(Local outliers factor, LOF)算法實(shí)現(xiàn)了復(fù)雜軸承特征的異常檢測(cè)。在真實(shí)運(yùn)營(yíng)條件下驗(yàn)證了方法的有效性。結(jié)果顯示,利用傅里葉變換的頻域信號(hào)識(shí)別效果比時(shí)域信號(hào)更顯著;與傳統(tǒng)方法相比,孿生網(wǎng)絡(luò)和分類(lèi)算法結(jié)合的方法對(duì)故障和正常軸承特征的分類(lèi)效果更好;LOF和一類(lèi)支持向量機(jī)(One Class SVM,OCSVM)作為分類(lèi)器均能實(shí)現(xiàn)4.4%和5.6%提升,而LOF算法分類(lèi)效果比OCSVM更好。
關(guān)鍵詞:貨運(yùn)列車(chē);滾動(dòng)軸承;故障診斷;神經(jīng)網(wǎng)絡(luò);振動(dòng)分析
中圖分類(lèi)號(hào):TP 311" " " " " " " 文獻(xiàn)標(biāo)志碼:A
現(xiàn)階段基于振動(dòng)信號(hào)的滾動(dòng)軸承故障診斷方法研究已經(jīng)比較深入,其應(yīng)用也取得了階段性進(jìn)展?;谛盘?hào)處理的故障診斷技術(shù)比較成熟,診斷效果較好,對(duì)數(shù)據(jù)量要求不高且計(jì)算快速,其多應(yīng)用于在線監(jiān)測(cè)應(yīng)用場(chǎng)景?;跀?shù)據(jù)驅(qū)動(dòng)的智能診斷技術(shù)主要用于離線分析應(yīng)用場(chǎng)景。隨著傳感技術(shù)發(fā)展以及歷史監(jiān)測(cè)數(shù)據(jù)不斷積累[1],建立智能診斷模型,與基于信號(hào)處理的故障診斷技術(shù)相比,其診斷精度更高。隨著人工智能識(shí)別方法體系的快速發(fā)展,其研究成果廣泛應(yīng)用于滾動(dòng)軸承的故障診斷[2]。目前,研究對(duì)象主要是普通軸。此外,基于數(shù)據(jù)驅(qū)動(dòng)的智能診斷技術(shù)須保證數(shù)據(jù)分布相同,當(dāng)對(duì)列車(chē)軸承故障進(jìn)行診斷時(shí)不能充分利用實(shí)驗(yàn)室中的滾動(dòng)軸承數(shù)據(jù)[3]。本文采用時(shí)頻分析方法對(duì)在實(shí)際運(yùn)行條件下的故障和正常軸承數(shù)據(jù)進(jìn)行分析。在該基礎(chǔ)上提出一種基于軸承特征相似性的異常識(shí)別算法,準(zhǔn)確診斷鐵路貨車(chē)輪軸承早期故障,防止故障進(jìn)一步惡化,避免過(guò)度耗損軸承服役性能。
1 異常檢測(cè)模型
1.1 Siamese特征提取模型
本文建立孿生網(wǎng)絡(luò)(Siamese)特征提取模型,基于計(jì)算原理利用一維卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)的特征提取功能[4]?;诰矸e運(yùn)算提取輸入數(shù)據(jù)的局部特征,輸入層至隱藏層映射為一個(gè)特征提取層??紤]輸入數(shù)據(jù)之間的相似性。由于軸承振動(dòng)數(shù)據(jù)的故障與正常特征在不同頻帶中的反映比較明顯,因此以數(shù)據(jù)對(duì)的形式建立初始樣本集,利用正常(故障)數(shù)據(jù)建立2個(gè)初始數(shù)據(jù)對(duì),將其轉(zhuǎn)化為輸入向量,分別輸入2個(gè)特征提取網(wǎng)絡(luò),提取獨(dú)立的特征向量。利用曼哈頓距離定義輸入向量之間相似距離尺度L,將其作為損失函數(shù)來(lái)進(jìn)行網(wǎng)絡(luò)訓(xùn)練。損失函數(shù)計(jì)算過(guò)程如公式(1)所示。
L=yD2+(1-y)max(a-D2,0) (1)
式中:L為損失函數(shù),為輸入向量間相似距離尺度;D為樣本特征間的歐氏距離;y為當(dāng)樣本匹配時(shí)的標(biāo)簽;a為設(shè)定的閾值。當(dāng)距離超過(guò)a時(shí),損失為0;當(dāng)輸入向量一和輸入向量二都為正常(或異常)時(shí)損失函數(shù)更小;當(dāng)輸入向量一和輸入向量二不均為正常(或異常)時(shí)損失函數(shù)更大。在該過(guò)程中,2個(gè)網(wǎng)絡(luò)結(jié)構(gòu)相同且參數(shù)共享。將訓(xùn)練后得到的特征結(jié)果以二維數(shù)組形式映射至二維平面中,即適用于軸承分類(lèi)的特征。
1.2 特征分類(lèi)模型
對(duì)提取后的樣本特征進(jìn)行特征分類(lèi)和故障樣本診斷。本文采用基于相似性特點(diǎn)的局部異常因子算法來(lái)進(jìn)行分類(lèi)。采用LOF算法計(jì)算每個(gè)點(diǎn)o與其鄰域點(diǎn)的局部可達(dá)密度比來(lái)反映樣本的異常程度。設(shè)第k距離dk以及第k可達(dá)距離rk(p,o),dk為目標(biāo)點(diǎn)P至其第k個(gè)最近鄰點(diǎn)的距離。
任意點(diǎn)p的局部可達(dá)密度如公式(2)所示。
(2)
式中:lrdk(p)為點(diǎn)p的第k鄰域內(nèi)點(diǎn)至p的平均可達(dá)距離的倒數(shù);rk(p,o)為點(diǎn)o至點(diǎn)p的第k可達(dá)距離rk(p,o)=max{dk(o)d(p,o)};rk(p,o)=max{dk(o)d(p,o)};Nk(p)為點(diǎn)p的第k距離以內(nèi)的所有點(diǎn)的集合。
任一點(diǎn)p的局部離群因子LOFk(p)如公式(3)所示。
(3)
式中:LOFk(p)為局部離群因子;lrdk(o)為點(diǎn)o的第k鄰域內(nèi)至o的平均可達(dá)距離的倒數(shù);點(diǎn)p的鄰域點(diǎn)Npk的局部可達(dá)密度與點(diǎn)p的局部可達(dá)密度之比的平均數(shù)越接近1,p的鄰域點(diǎn)密度越接近,越可能與鄰域點(diǎn)輸入同一簇;平均數(shù)越﹥1,p的異常分?jǐn)?shù)越高,其是異常點(diǎn)的可能性越大。
1.3 混淆矩陣
模型訓(xùn)練完成后,需要采用科學(xué)的評(píng)價(jià)方法對(duì)其效果進(jìn)行評(píng)估?;煜仃囀穷A(yù)測(cè)和評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)結(jié)果的重要工具。矩陣的每一行為真實(shí)歸屬類(lèi)別,每一列為預(yù)測(cè)類(lèi)別,如公式(4)所示。
(4)
式中:TP為模型預(yù)測(cè)為正類(lèi)的正樣本;TN為模型預(yù)測(cè)為負(fù)類(lèi)的負(fù)樣本;FP為模型預(yù)測(cè)為正類(lèi)的負(fù)樣本;FN為模型預(yù)測(cè)為負(fù)類(lèi)的正樣本。公式(4)的4個(gè)指標(biāo)為由混淆矩陣衍生的適用于分類(lèi)算法的通用評(píng)價(jià)指標(biāo),用于量化評(píng)價(jià)模型分類(lèi)效果。Precision(精準(zhǔn)率)為在預(yù)測(cè)為正的樣本集合中預(yù)測(cè)正確的樣本的比例;Recall(召回率)為實(shí)際為正的樣本中預(yù)測(cè)正確的樣本的比例;Accuracy為預(yù)測(cè)正確的樣本數(shù)占總樣本的個(gè)數(shù);F1-score為統(tǒng)計(jì)學(xué)中用來(lái)衡量二分類(lèi)精度的指標(biāo)。
2 試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理
2.1 試驗(yàn)測(cè)臺(tái)設(shè)計(jì)
改造后的雙輪對(duì)滾動(dòng)實(shí)驗(yàn)平臺(tái)(測(cè)試臺(tái)架如圖1(a)所示)可同時(shí)進(jìn)行雙軸測(cè)試。在測(cè)臺(tái)與軸承間存在相對(duì)位移,因此采集數(shù)據(jù)為包括軸承振動(dòng)和測(cè)臺(tái)振動(dòng)的復(fù)合數(shù)據(jù)。因此,其分析頻率范圍與傳統(tǒng)意義的軸承故障范圍有所差別,需要采用高頻采樣的方式對(duì)其特征范圍進(jìn)行覆蓋識(shí)別。
在卡鉗平臺(tái)布置與軸承豎向一致的傳感器,收集輪對(duì)的傳遞振動(dòng)加速度信號(hào)。傳感器類(lèi)型為靈敏度為10 g的三軸50G加速度傳感器。振動(dòng)采集過(guò)程也是軸承的磨合過(guò)程,在該過(guò)程中紅外測(cè)溫探針會(huì)周期性伸縮,實(shí)時(shí)探測(cè)軸承溫度。在溫度穩(wěn)定后,進(jìn)行振動(dòng)數(shù)據(jù)采集(如圖1(b)所示)。車(chē)輪型號(hào)為RE2B,直徑為840 mm,采樣頻率為10 240 Hz,轉(zhuǎn)速為300 r/min,列車(chē)時(shí)速約35 km/h,試驗(yàn)在無(wú)負(fù)荷狀態(tài)下運(yùn)行。
2.2 數(shù)據(jù)處理
利用試驗(yàn)測(cè)臺(tái)完成數(shù)據(jù)采集后對(duì)原始振動(dòng)信號(hào)進(jìn)行處理。本文的數(shù)據(jù)處理流程共分為以下3步。
2.2.1 數(shù)據(jù)預(yù)處理
在測(cè)試過(guò)程中,由于測(cè)溫探針會(huì)周期性伸縮,導(dǎo)致出現(xiàn)周期性異常值,該值對(duì)模型訓(xùn)練不利,因此需要進(jìn)行剔除。原始數(shù)據(jù)采樣時(shí)間長(zhǎng),軸承振動(dòng)信號(hào)具有一定的周期性,根據(jù)試驗(yàn)中的采樣頻率以及車(chē)輪轉(zhuǎn)速,以2轉(zhuǎn)為1個(gè)樣本將原樣本進(jìn)行分割。例如,在試驗(yàn)中振動(dòng)傳感器采樣頻率f為10 240 Hz,車(chē)輪轉(zhuǎn)速n為300 r/min,根據(jù)數(shù)據(jù)長(zhǎng)度計(jì)算L如公式(5)所示。
(5)
經(jīng)過(guò)計(jì)算,L=4 096,計(jì)算后可以使用移動(dòng)窗口分割方法(窗口內(nèi)4 096點(diǎn))對(duì)原始數(shù)據(jù)進(jìn)行分割。
2.2.2 數(shù)據(jù)集建立
將從實(shí)驗(yàn)平臺(tái)收集的所有類(lèi)型的數(shù)據(jù)按2∶1的比例分為訓(xùn)練集和測(cè)試集,這是一種常見(jiàn)的數(shù)據(jù)劃分方法,可以保證樣本訓(xùn)練的均衡性。
2.2.3 信號(hào)時(shí)頻域轉(zhuǎn)換
對(duì)原始的高頻采樣信號(hào)來(lái)說(shuō),其時(shí)域信號(hào)特征冗雜,區(qū)分度較低,其頻域信號(hào)以特征頻率的形式表示數(shù)據(jù),區(qū)分度更高。為了比較使用時(shí)域信號(hào)和頻域信號(hào)作為模型輸入對(duì)分類(lèi)結(jié)果的影響,利用快速傅里葉變換將重新采樣的片段轉(zhuǎn)換為相應(yīng)的頻域信號(hào)??焖俑道锶~變換是對(duì)離散傅立葉變換快速求解的一種算法,計(jì)算過(guò)程如公式(6)所示。
X(u)=Xeven(u)+Xodd(u)Wu 2K " (6)
式中:X(u)為結(jié)果序列中的第u個(gè)元素,對(duì)應(yīng)頻域中的第u個(gè)頻率分量;Xeven(u)為對(duì)輸入序列偶數(shù)索引部分經(jīng)過(guò)子序列計(jì)算后的第u個(gè)頻率分量;Xodd(u)為對(duì)輸入序列奇數(shù)索引部分經(jīng)過(guò)子序列計(jì)算后的第u個(gè)頻率分量;Wu 2K為旋轉(zhuǎn)因子,即在變換的區(qū)間內(nèi)等間隔采樣序列的頻譜函數(shù)。
3 實(shí)例分析
首先,本節(jié)對(duì)高頻采樣的軸承振動(dòng)數(shù)據(jù)時(shí)頻域特征進(jìn)行分析。其次,對(duì)比了時(shí)頻域樣本輸入特征提取后的效果,對(duì)提取層的有效性和準(zhǔn)確性進(jìn)行驗(yàn)證。最后,基于不同的分類(lèi)模型驗(yàn)證了本文所提方法效果很好。
3.1 數(shù)據(jù)特征分析
對(duì)高頻采樣的振動(dòng)數(shù)據(jù)來(lái)說(shuō),采用傳統(tǒng)的分析方法對(duì)其數(shù)據(jù)主要特征進(jìn)行初步分析。從數(shù)據(jù)集中隨機(jī)選取2個(gè)劃分后的正常和故障樣本,進(jìn)行最值、標(biāo)準(zhǔn)差和極差等傳統(tǒng)時(shí)域指標(biāo)計(jì)算,計(jì)算結(jié)果見(jiàn)表1。由表1可知,對(duì)有某些故障特征的樣本來(lái)說(shuō),其故障特征整體指標(biāo)值大于正常樣本,為區(qū)分提供了可能性。基于表2結(jié)果,使用傳統(tǒng)數(shù)據(jù)降維方式提取其特征和主要成分進(jìn)行分析,發(fā)現(xiàn)時(shí)域下的正常與故障數(shù)據(jù)樣本之間存在一定區(qū)分度,但是其特征還存在較大重合,不利于設(shè)定區(qū)分界限。
3.2 時(shí)、頻域特征提取效果對(duì)比
使用傳統(tǒng)數(shù)據(jù)降維方式進(jìn)行特征提取,難以有效區(qū)分特征。本節(jié)展示卷積神經(jīng)網(wǎng)絡(luò)對(duì)正常和故障軸承數(shù)據(jù)的特征提取效果。其中,原始時(shí)域數(shù)據(jù)集每批次樣本長(zhǎng)度為4 096,轉(zhuǎn)換后的頻域數(shù)據(jù)集樣本長(zhǎng)度為2 048。由于存在模糊界限,因此時(shí)域樣本在識(shí)別正常樣本的過(guò)程中容易誤判,無(wú)法同時(shí)對(duì)正常和故障軸承進(jìn)行準(zhǔn)確預(yù)測(cè)。頻域樣本分類(lèi)準(zhǔn)確度較高,分類(lèi)效果更顯著,頻域數(shù)據(jù)更能反應(yīng)特征,在正常軸、故障軸分類(lèi)神經(jīng)網(wǎng)絡(luò)模型中,先將時(shí)域樣本轉(zhuǎn)化為頻域樣本,再進(jìn)行訓(xùn)練。
將原始時(shí)域數(shù)據(jù)以及變換后的頻域數(shù)據(jù)輸入Siamese進(jìn)行特征提取,由于在輸入和迭代過(guò)程中均對(duì)樣本向量間的相似性特征進(jìn)行了提取,因此其得到的分類(lèi)特征在卷積分類(lèi)的基礎(chǔ)上增添了相似性信息,進(jìn)一步區(qū)分了正常和故障邊界。將頻域數(shù)據(jù)輸入Siamese進(jìn)行特征提取后,再輸入OCSVM和LOF分類(lèi)器進(jìn)行分類(lèi)工作訓(xùn)練。得到無(wú)量綱低維映射特征。特征提取與分類(lèi)效果可視化如圖2所示。圖2中內(nèi)環(huán)區(qū)域?yàn)榉诸?lèi)器按照提取特征收斂得到的決策邊界。判定測(cè)試樣本邊界外為異常,邊界內(nèi)為正常。
從圖2可以看出,Siamese提取的特征分布范圍更小,樣本點(diǎn)更密集。這說(shuō)明考慮相似性特點(diǎn)后,提取特征間的波動(dòng)性更小,收斂的邊界適用性更強(qiáng)。雖然OCSVM分類(lèi)器收斂的邊界能有效涵蓋大多數(shù)正常樣本點(diǎn),但是其邊界會(huì)造成較多點(diǎn)的誤判。LOF分類(lèi)器收斂的邊界更靈活,可以涵蓋的數(shù)據(jù)點(diǎn)更多。
與傳統(tǒng)CNN網(wǎng)絡(luò)相比,本文模型初始損失比CNN初始損失少,收斂速度更快。使用OCSVM或者LOF分類(lèi)器對(duì)Siamese進(jìn)行結(jié)合,其分類(lèi)效果比傳統(tǒng)CNN好,可優(yōu)先考慮。
為了量化對(duì)比模型差異,采用Precision、Recall、F1-score和Accuracy 4種指標(biāo),對(duì)3種模型的測(cè)試集分類(lèi)結(jié)果進(jìn)行對(duì)比,對(duì)比結(jié)果見(jiàn)表2。
由表2可知,與傳統(tǒng)CNN方法相比,Siamese + OCSVM與Siamese + LOF方法的各項(xiàng)指標(biāo)均有提高,分類(lèi)效果更顯著,準(zhǔn)確度分別提升4.4%、5.6%,LOF分類(lèi)器性能比OCSVM分類(lèi)器更好,可優(yōu)先考慮。
4 結(jié)論
本文設(shè)計(jì)了雙輪對(duì)軸承實(shí)驗(yàn)平臺(tái),在工程條件下采集故障與正常軸承的加速度數(shù)據(jù)。在該基礎(chǔ)上提出一種基于孿生網(wǎng)絡(luò)和局部離群因子算法的貨車(chē)滾動(dòng)軸承異常檢測(cè)模型。模型測(cè)試結(jié)果顯示其可以有效提升識(shí)別準(zhǔn)確度。
本文提出的數(shù)據(jù)采集和異常檢測(cè)模型在一定程度上還原了真實(shí)條件下異常軸承的特征識(shí)別過(guò)程和數(shù)據(jù)采集結(jié)果,考慮相似性的特征提取和分類(lèi)算法可以降低在工程條件下的數(shù)據(jù)波動(dòng)造成的影響。以后將進(jìn)一步提高特征提取過(guò)程的準(zhǔn)確性,并嘗試解決在工程條件下數(shù)據(jù)采集的波動(dòng)性問(wèn)題。
參考文獻(xiàn)
[1]楊宇,于德介,程軍圣.基于EMD與神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷方法[J].振動(dòng)與沖擊,2005,24(1):85-88.
[2]劉韜,陳進(jìn),董廣明.KPCA 和耦合隱馬爾科夫模型在軸承故障診斷中的應(yīng)用[J].振動(dòng)與沖擊,2014,33(21):85-89.
[3]肖雄,王健翔,張勇軍,等.一種用于軸承故障診斷的二維卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化方法[J].中國(guó)電機(jī)工程學(xué)報(bào),2019,39(15):4558-4568.