摘要:文章研究了基于小波變換的時頻域特征提取方法和基于隨機森林的故障診斷方法,用于機械振動信號的故障檢測與分類。首先,文章采用小波變換對機械振動信號進行時頻域特征提取,生成特征向量;然后,利用隨機森林算法對提取的特征向量進行訓練和分類;最后,采用CWRU軸承數(shù)據(jù)集進行實驗,通過混淆矩陣分析模型的分類性能。結果表明,所提方法在識別正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動體故障時具有較高的準確性和魯棒性。
關鍵詞:小波變換;隨機森林;機械振動;故障檢測
中圖分類號:TH17中圖分類號 "文獻標志碼:文獻標志碼A
0 引言
隨著工業(yè)設備復雜性的增加和運行條件的多樣化,傳統(tǒng)的基于規(guī)則的故障診斷方法已逐漸顯露出其局限性[1]。因此,機器學習類方法因其能夠處理非線性、高維度數(shù)據(jù)等特點成為當前研究的熱點之一。
近年來,研究者們在機器學習驅動的機械故障診斷領域取得了顯著研究進展[2]。早期的工作集中在特征提取方法的改進方面,如頻域分析、時域分析等[3-4],然而這些方法通常無法充分捕捉到信號的時頻特征,限制了故障診斷的準確性和泛化能力。同時,傳統(tǒng)的故障診斷方法在復雜環(huán)境下表現(xiàn)不佳[5]。例如,工業(yè)設備在變化多端的工況下,其故障模式通常呈現(xiàn)多樣性和隨機性,這對傳統(tǒng)方法的穩(wěn)健性提出了更高要求。
基于上述背景,本文主要聚焦于2個關鍵內(nèi)容:一是基于小波變換的時頻域特征提取方法[6-7],小波變換因其能夠同時提供時間和頻率信息而被廣泛應用于信號處理領域;二是基于隨機森林的故障診斷方法[8-10]。本文結合小波變換提取的特征,構建針對機械故障的隨機森林分類器,并在CWRU軸承數(shù)據(jù)集上進行驗證和評估。本研究旨在為工業(yè)設備的實時監(jiān)測與故障預測提供一種新的方法路徑,促進機器學習在工業(yè)應用中的進一步推廣與應用。
1 基于小波變換與隨機森林的故障診斷
1.1 基于小波變換的時頻域特征提取
小波變換時頻域特征提取的核心思想是將信號分解到多尺度的時頻域中并提取每個尺度上的特征信息。該方法能夠同時反映信號的時域和頻域特征,有效地捕捉信號的局部特性,從而更好地應用于機械故障診斷等領域。具體而言,小波變換時頻域特征提取的核心思想可以概括為以下幾個方面。
(1)多尺度分析:小波變換是一種多尺度分析方法,可將信號分解到不同尺度的子波分量中。每個子波分量對應于特定的頻率范圍,具有不同的時間分辨率和頻率分辨率。
(2)時頻局部化:小波變換具有良好的時頻局部化特性,這意味著其可以同時反映信號的時域和頻域特征,并能夠有效地捕捉信號的局部特性,例如瞬態(tài)沖擊、脈沖等。
(3)特征提?。涸诿總€尺度上,小波變換都可以提取各種特征信息,例如能量、峰值、方差等。這些特征信息可以反映信號在這個尺度上的特性,并用于故障診斷等任務。
本文采用基于小波變換的時頻域特征提取方法從機械振動信號中提取特征向量。設機械振動信號為x(t),小波變換的連續(xù)小波系數(shù)W(a,b)定義為:
W(a,b)=∫∞-∞x(t)ψ*a,b(t)dt(1)
其中,ψa,b(t)表示尺度參數(shù)a和平移參數(shù)b下的小波函數(shù),ψ*a,b(t)表示其共軛。小波系數(shù)W(a,b)可以通過卷積操作進行計算,其具體形式為:
W(a,b)=〈x(t),ψa,b(t)〉=∫∞-∞x(t)ψ*a,b(t)dt(2)
為了獲取機械振動信號的特征向量,本文選取合適的小波基函數(shù)ψa,b(t),使其能夠有效地反映出振動信號在時頻域上的特征;通過計算不同尺度a和平移b下的小波系數(shù)W(a,b),構成特征向量W,如式(3)所示。
W=[W(a1,b1),W(a1,b2),…,W(a1,bm),W(a2,b1),…,W(an,bm)]T(3)
其中,a1,a2,…,an表示尺度參數(shù)的集合,b1,b2,…,bm表示平移參數(shù)的集合。特征向量W包含了振動信號在不同尺度和平移下的時頻特征信息,能夠為后續(xù)的故障診斷與分析提供基礎數(shù)據(jù)。
1.2 基于隨機森林的故障診斷
得到特征向量W后,本文采用基于隨機森林的故障診斷方法進行分析。隨機森林的核心思想在于集成學習,即通過組合多個學習器來提高整體性能,其將多棵決策樹作為基學習器,每棵決策樹在不同的訓練數(shù)據(jù)集上訓練,并根據(jù)投票機制進行預測。通過融合多個學習器的優(yōu)勢,該方法可以有效降低模型的偏差和方差,提高泛化能力。對于機械故障診斷問題,隨機森林能夠有效地處理高維數(shù)據(jù)和復雜特征,適用于振動信號的多類別分類任務。
設訓練集包含N個樣本,每個樣本i的特征向量為Wi=[Wi(1),Wi(2),…,Wi(m)],其中m表示特征向量的維度。隨機森林的構建包括以下步驟。
(1)決策樹的構建:隨機森林由多棵決策樹組成,每棵決策樹通過對訓練集進行重復抽樣和特征隨機選擇來構建。若假設第k棵決策樹的訓練樣本集為Dk,則通過遞歸選擇最優(yōu)特征和劃分節(jié)點來生成樹結構。
(2)集成學習:每棵決策樹能夠對樣本進行獨立分類,最終的分類結果由所有決策樹投票得出。設第k棵樹的分類器為CRF(W),則隨機森林的分類器為:
CRF(W)=1K∑Kk=1Ck(W)(4)
其中,K表示隨機森林中決策樹的數(shù)量。
(3)故障診斷與預測:將待診斷的特征向量Wnew輸入隨機森林模型,通過投票機制得出樣本所屬的故障類別。設模型預測結果為y^,則最終的故障診斷結果可以表示為:
y^=CRF(Wnew)(5)
隨機森林通過集成多棵決策樹的優(yōu)勢,提高了故障診斷模型的穩(wěn)健性和泛化能力。
2 實驗與分析
在實驗中,本文采用了凱斯西儲大學(Case Western Reserve University,CWRU)軸承數(shù)據(jù)集對上述方法進行測試。CWRU軸承數(shù)據(jù)集是由美國凱斯西儲大學電機與計算機工程系提供的公開數(shù)據(jù)集,被廣泛應用于機械故障診斷領域研究。該數(shù)據(jù)集包含在不同工況下運行的滾動軸承振動信號數(shù)據(jù),包括正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動體故障等。實驗平臺通過在軸承外殼上安裝加速度傳感器,采集軸承運行時的振動信號。數(shù)據(jù)集的豐富性和多樣性為機械故障診斷算法的研究和驗證提供了理想的平臺,通過使用CWRU軸承數(shù)據(jù)集可以全面測試基于小波變換的時頻域特征提取方法和基于隨機森林的故障診斷模型的性能,本實驗的步驟如下。
(1)數(shù)據(jù)預處理:對振動信號進行去噪處理,使用帶通濾波器去除高頻和低頻噪聲。
(2)特征提?。簩︻A處理后的振動信號x(t)進行小波變換,選擇合適的Daubechies小波基函數(shù),計算不同尺度a和平移b下的小波系數(shù)W(a,b),提取時頻域特征來構建特征向量W。
(3)構建訓練集和測試集:將提取的特征向量按照7∶3的比例劃分為訓練集和測試集,確保各類故障數(shù)據(jù)在訓練集和測試集中均勻分布。
(4)訓練隨機森林模型:利用訓練集中的特征向量Wtrain及其對應的故障類別標簽ytrain,訓練隨機森林分類器。
(5)模型測試與評估:將測試集中的特征向量Wtest輸入訓練好的隨機森林模型預測其故障類別y^test,計算模型的混淆矩陣,如表1所示。預測結果分為正常、內(nèi)圈故障、外圈故障、滾動體故障4種。
在表1所示混淆矩陣中,橫軸表示模型的預測類別,縱軸表示實際類別,對角線上的數(shù)字表示正確分類的樣本數(shù)量,非對角線上的數(shù)字表示被誤分類的樣本數(shù)量。從混淆矩陣中可以看出,模型對4類故障的分類準確性總體較高。正常類別的樣本有95個被正確分類,正確率為95%;內(nèi)圈故障、外圈故障和滾動體故障類別的正確分類數(shù)分別為92、94、94,正確率分別為92%、94%、94%。這表明,模型在處理不同故障類型時,能夠較為準確地進行故障分類。
盡管總體準確性較高,但仍存在一定的誤分類現(xiàn)象。具體而言:正常類別有2個樣本被誤分類為內(nèi)圈故障,1個樣本被誤分類為外圈故障,2個樣本被誤分類為滾動體故障;內(nèi)圈故障類別有3個樣本被誤分類為正常,4個樣本被誤分類為外圈故障,1個樣本被誤分類為滾動體故障;外圈故障類別有1個樣本被誤分類為正常,3個樣本被誤分類為內(nèi)圈故障,2個樣本被誤分類為滾動體故障;滾動體故障類別有2個樣本被誤分類為正常,1個樣本被誤分類為內(nèi)圈故障,3個樣本被誤分類為外圈故障。
通過這些誤分類的情況,本文可以發(fā)現(xiàn)模型在區(qū)分內(nèi)圈故障和外圈故障以及正常與滾動體故障時存在一定的混淆。這可能是由于這些故障在特定特征上具有相似性,從而導致模型難以完全區(qū)分。
根據(jù)誤分類的情況,未來的研究工作可以進行以下改進。
(1)優(yōu)化特征提取方法:盡管小波變換在特征提取中表現(xiàn)良好,但可以嘗試結合其他時頻分析方法(如短時傅里葉變換或希爾伯特黃變換)以提取更多有辨識度的特征,提高分類準確率。
(2)增強模型訓練:增加訓練數(shù)據(jù)的多樣性,特別是對容易混淆的故障類型進行更多的數(shù)據(jù)采集和增強,提升模型的泛化能力。
(3)調(diào)整模型參數(shù):通過更精細的參數(shù)調(diào)整(如決策樹數(shù)量、樹深度等),進一步提升隨機森林模型的分類性能。
綜上所述,通過對混淆矩陣的詳細分析,本文發(fā)現(xiàn)模型在機械故障診斷中的總體表現(xiàn)較好,但仍有改進的空間。通過優(yōu)化特征提取方法、增強模型訓練和調(diào)整模型參數(shù),可以進一步提升故障診斷的準確性和魯棒性,為工業(yè)設備的健康監(jiān)測和維護提供更加可靠的技術支持。
3 結語
本文通過研究基于小波變換的時頻域特征提取和隨機森林的故障診斷方法,成功實現(xiàn)了對機械振動信號的高效分類與診斷。通過小波變換,振動信號被分解為多個尺度和頻率的特征向量,準確地捕捉到故障信號的時頻特性。在模型訓練階段,隨機森林算法通過集成多棵決策樹,提高了分類的準確性和模型的泛化能力。實驗結果表明,所提方法能夠有效區(qū)分不同類型和程度的軸承故障,混淆矩陣分析進一步驗證了模型的可靠性和穩(wěn)健性。未來的研究可以通過優(yōu)化特征提取方法和增強模型訓練,進一步提升故障診斷的性能,為工業(yè)設備的健康監(jiān)測提供更全面的技術支持。
參考文獻
[1]葉永偉,程毅飛,賴劍人,等.基于改進關聯(lián)規(guī)則的卸船機故障預測模型[J].中國機械工程,2019(20):2463-2472.
[2]翟嘉琪,楊希祥,程玉強,等.機器學習在故障檢測與診斷領域應用綜述[J].計算機測量與控制,2021(3):1-9.
[3]王金福,李富才.機械故障診斷技術中的信號處理方法:時域分析[J].噪聲與振動控制,2013(2):128-132.
[4]王金福,李富才.機械故障診斷的信號處理方法:頻域分析[J].噪聲與振動控制,2013(1):173-180.
[5]王國彪,何正嘉,陳雪峰,等.機械故障診斷基礎研究“何去何從”[J].機械工程學報,2013(1):63-72.
[6]嚴海濤,毛漢領,黃振峰,等.金屬聲發(fā)射信號三種時頻域分析的比較研究[J].計量與測試技術,2008(3):32-34.
[7]王正,文傳博,董逸凡.基于小波變換和Involution卷積神經(jīng)網(wǎng)絡的滾動軸承故障診斷方法[J].軸承,2022(11):61-67.
[8]方匡南,吳見彬,朱建平,等.隨機森林方法研究綜述[J].統(tǒng)計與信息論壇,2011(3):32-38.
[9]李兵,韓睿,何怡剛,等.改進隨機森林算法在電機軸承故障診斷中的應用[J].中國電機工程學報,2020(4):1310-1319,1422.
[10]張鈺,陳珺,王曉峰,等.隨機森林在滾動軸承故障診斷中的應用[J].計算機工程與應用,2018(6):100-104,114.
(編輯 沈 強編輯)
Research on mechanical fault diagnosis methods driven by machine learning
YANG" Xianfeng1,2
(1.Chengdu Industry amp; Trade College, Chengdu 611730, China; 2.Chengdu Technician College, Chengdu 611730, China)
Abstract: This paper studies the time-frequency domain feature extraction method based on wavelet transform and the fault diagnosis method based on random forest for fault detection and classification of mechanical vibration signals. Firstly, the time-frequency domain features of mechanical vibration signals are extracted by wavelet transform to generate feature vectors. Then,the extracted feature vectors are trained and classified by random forest algorithm. Finally, the CWRU bearing dataset is used in the experiment to analyze the classification performance of the model through confusion matrix. The results show that the proposed method has high accuracy and robustness in identifying normal state, inner ring fault, outer ring fault and rolling element fault.
Key words: wavelet transform; random forest; mechanical vibration; fault detection