丁家滿,原 琦,李 川
(昆明理工大學(xué) 信息工程與自動化學(xué)院,云南 昆明 650500)
在城市軌道交通迅速發(fā)展的今天,輪對軸承作為列車運行的核心部件,因為長期處在高速運轉(zhuǎn)的工作環(huán)境下,導(dǎo)致輪對軸承極易產(chǎn)生損壞。在列車高速運行情況下,一旦軸承發(fā)生故障將造成車輛延誤,若對故障發(fā)現(xiàn)不及時并且沒有采取相應(yīng)有效措施,容易引起重大事故,甚至造成嚴重人員傷亡。因此,開展列車輪對軸承狀態(tài)監(jiān)測和故障診斷方面的研究尤為重要,而且十分必要[1-3]。
常見的列車輪對軸承狀態(tài)監(jiān)測與故障診斷方法有共振解調(diào)方法、沖擊脈沖方法、小波分析等[4-6],這些方法在早期輪對軸承故障診斷中應(yīng)用較為廣泛,在單一故障診斷方面取得較好的診斷效果,近些年涌現(xiàn)出了諸如基于模糊理論、知識推理、遺傳算法和人工神經(jīng)網(wǎng)絡(luò)等具有智能特點的故障診斷方法[7-11]。文獻[12]采用高斯RBF神經(jīng)網(wǎng)絡(luò)建立智能故障診斷系統(tǒng)用于機械齒輪箱故障診斷。文獻[13]結(jié)合小波分解和集合經(jīng)驗?zāi)B(tài)分解來提取信號故障特征,利用能量判別法和搜索算法進行故障模式識別。文獻[14]利用局部均值分解對信號進行分解,從中提取時域統(tǒng)計量和能量等特征參數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù),訓(xùn)練故障診斷模型。然而,在現(xiàn)實中,隨著輪對軸承之間的耦合性越來越高,造成故障的原因大多數(shù)是多重原因,輪對軸承信號的采集也是多方面的,采集到的故障信號信息也存在不確定性,即便符合某種分布,很可能也存在波動情況。例如軸承振動信號基本符合正態(tài)分布,但信號均值在[a,b]之間,方差在[c,d]之間漂移。另外,在對原始信號進行特征提取會帶來特征以外的信息缺失問題。對于這種情況,采用傳統(tǒng)方法,簡單使用分布函數(shù)來代替或者用區(qū)間來表達都不合適,都存在無法完整描述、信息丟失的問題。
針對上述問題,本文引入概率包絡(luò)理論,以SVM為分類模型,提出一種基于概率包絡(luò)的輪對軸承故障診斷方法(PE-SVM)。在對原始輪對軸承信號分布類型檢驗的基礎(chǔ)上,建立概率包絡(luò)模型,提取其幾何形狀特征作為SVM的輸入,訓(xùn)練并得到診斷模型。診斷結(jié)果表明該方法較好地包容了輪對軸承故障診斷中存在的不確定性問題,提高了診斷精度。
概率包絡(luò)(Probability Envelope,PE)結(jié)合概率論和區(qū)間理論,通過計算隨機變量的累計概率函數(shù)(Cumulative Probability Distribution Function,CDF)積分面積變化范圍,將不確定性變量的波動漂移包裹在一個具有上下邊界的區(qū)域內(nèi),防止信息丟失。概率包絡(luò)同時考慮了不確定參數(shù)固有的隨機性和不精確性。
(1)
(2)
則CDF函數(shù)的范圍為PE,可表示為
(3)
利用PE將變量X的累積概率函數(shù)限制在一個范圍內(nèi),即有
(4)
圖1 概率包絡(luò)示意
證據(jù)結(jié)構(gòu)體(Dempster-Shafer Structure,DSS)由有限個焦元組成,每個焦元由一個區(qū)間和區(qū)間信度組成,即
{([x1,y1],m1),([x2,y2],m2),…,([xn,yn],mn)}
所有焦元對應(yīng)的信度之和為1,即∑mi=1。
假若樣本空間為R,則處于這個鄰域R的證據(jù)結(jié)構(gòu)體m即mass函數(shù)可以表示為
2R→[0,1]
則置信函數(shù)為
(5)
似然函數(shù)為
(6)
概率包絡(luò)的核心是由多個DSS構(gòu)成,與證據(jù)結(jié)構(gòu)體之間可以相互轉(zhuǎn)化。
由DSS可以繪制出概率包絡(luò)下邊界為
(7)
概率包絡(luò)上邊界為
(8)
如果將概率包絡(luò)看成整體,那么證據(jù)結(jié)構(gòu)體就是它的組成部分。將所有證據(jù)結(jié)構(gòu)體xi值按mi間隙縱向排列并將其連接成線可以得到概率包絡(luò)上邊界。同理,將所有證據(jù)結(jié)構(gòu)體yi值按mi間隙縱向排列并將其連接成線可以得到概率包絡(luò)下邊界。反之,將概率包絡(luò)水平均勻切成n片,可以近似得到多個證據(jù)結(jié)構(gòu)體,切線兩個端點組成證據(jù)結(jié)構(gòu)體的區(qū)間,切片的高度為其信度(均勻切片,故所有證據(jù)結(jié)構(gòu)體的信度相等,為n分之一),如圖2所示。
圖2 概率盒的等信度離散化
針對故障信號出現(xiàn)的各類不確定性問題,利用概率包絡(luò)建模將采集到的不確定信號繪制在一個包絡(luò)結(jié)構(gòu)體內(nèi)。在分析軸承故障信號分布特點的基礎(chǔ)上,采用3種建模方法,其建模過程分為以下幾個步驟:
step1對采集到的原始信號進行時頻域概率分布比對,判斷其分布類型。
step2若原始信號基本遵循某種概率分布規(guī)律,則利用原始參數(shù)概率包絡(luò)建模方法(the Probability Envelope Modeling Method Based on Original Parameters,OPPEM)進行概率包絡(luò)建模。
step3若原始信號不遵循某種概率分布規(guī)律時,提取其無量綱特征并分析其分布特點,判斷是否遵循某種概率分布規(guī)律,若滿足則采用特征參數(shù)概率包絡(luò)建模方法(the Probability Envelope Modeling Method Based on Characteristic Parameters,CPPEM)。
step4若所提取的特征信息無法確定概率分布類型時,則采用概率包絡(luò)定義建模方法(the Probability Envelope Modeling Method Based on Definition,DPEM)。
建模流程如圖3所示。
圖3 建模流程
在針對不同的分布采用不同的建模方法對信號進行概率包絡(luò)建模后,提取出概率包絡(luò)的特征量作為后續(xù)診斷的特征不僅可以增加診斷精度而且可以降低因為數(shù)據(jù)規(guī)模增大帶來的時間消耗問題。本文通過提取概率包絡(luò)的幾何形狀構(gòu)成特征向量。
(1)累積包絡(luò)寬度
累積包絡(luò)寬度主要是為了描述信號數(shù)據(jù)的不確定的范圍,其計算公式為
(9)
(2)對數(shù)累積包絡(luò)寬度
其本質(zhì)是對累積包絡(luò)寬度取對數(shù)運算,在壓縮不確定范圍的同時,消除模型的異方差等特性,其計算公式為
(10)
(3)累積區(qū)間寬度
累積區(qū)間寬度主要是為了描述不確定性信號的取值平均范圍,其計算公式為
(11)
(4)邊界值
其本質(zhì)是獲取PE的累積置信區(qū)間,即PE上下界的各自加和,計算公式為
(12)
(5)矛盾區(qū)間統(tǒng)計
矛盾區(qū)間統(tǒng)計本質(zhì)是計算DSS的上界值大于下界值的特殊信號點的個數(shù),其計算公式為
(13)
(6)權(quán)重區(qū)間
其本質(zhì)是計算對數(shù)累積包絡(luò)寬度之外的焦元權(quán)重區(qū)間,其計算公式為
(14)
基于概率包絡(luò)的故障診斷方法的主要思想是將提取到的概率包絡(luò)的幾何形狀作為特征向量輸入到支持向量機SVM,訓(xùn)練得到分類器,進行故障診斷。
基于概率包絡(luò)故障診斷算法如下:
Input: 信號數(shù)據(jù){x1,x2,…,xm}
Output: 故障分類診斷結(jié)果
Step1forn=1 tom
Step2概率包絡(luò)建模
Step3提取特征向量{y1,y2,…,yn}
Step4end
Step5將特征數(shù)據(jù)切分為訓(xùn)練集{a1,a2,…as}和測試集{b1,b2,…bt}
Step6初始化參數(shù)K(K折交叉驗證)
Step7forj=1 toK
Step8選取徑向核函數(shù)
Step9確定參數(shù)懲罰因子C和σ
Step10end
Step11fori=1 toS
Step12確定松弛變量和權(quán)重系數(shù):ε,w
Step13訓(xùn)練模型
yi(wTxi+b)≥1-εi(i=1,2,…,n;εi≥0)
Step14end
Step15測試數(shù)據(jù)測試模型得出分類精度
本文分別選用了公共數(shù)據(jù)集和實測數(shù)據(jù)進行了3次實驗,實驗一主要驗證本文提出基于概率包絡(luò)的特征提取方法的有效性,實驗二和實驗三分別從公共數(shù)據(jù)集和實測數(shù)據(jù)進一步說明本文方法的有效性及泛化能力。其中滾動軸承振動數(shù)據(jù)選用NSFI/UCR智能維護系統(tǒng)中心的公共數(shù)據(jù)集(IMS-www.imscenter.net)。實驗裝置如圖4所示,其中安裝了4個軸承,旋轉(zhuǎn)速度為2 000 r/min,采樣頻率為1 024 Hz,軸和軸承上施加了6 000磅(約2.78 kN)的徑向載荷。
圖4 軸承故障測試實驗裝置
本實驗選取數(shù)據(jù)集1中的第三個軸承的數(shù)據(jù),其中正常與內(nèi)圈故障數(shù)據(jù)各60 000條。
對原始信號進行頻譜分析,其時域波形和頻譜如圖5所示。
圖5 軸承時域波形圖和頻譜圖
由圖5可知,因為各傳感器檢測信號較為復(fù)雜,采集到的信號中常包含背景噪聲和其他不確定性,假如無法完整、準確地提取故障特征,將影響甚至導(dǎo)致故障診斷精度的下降。
針對以上存在的問題,采用本文方法對原始信號建立概率包絡(luò)模型,其正常軸承和內(nèi)圈故障的概率包絡(luò)圖如圖6所示。
圖6 概率包絡(luò)建模
由圖6可知,當軸承出現(xiàn)故障時,所構(gòu)建的概率包絡(luò)模型與正常軸承信號所建光滑曲線包絡(luò)相比,既有趨勢的相似,又有形狀特征的區(qū)別。如此,將所有信息包裹在概率包絡(luò)中,經(jīng)過概率包絡(luò)建模后的原始信號降低了因噪聲干擾和數(shù)據(jù)不確定性帶來的問題。
經(jīng)過概率包絡(luò)建模后的信號,分別對正常軸承和內(nèi)圈故障軸承采用概率包絡(luò)的特征提取方法得到特征向量,見表1、表2。
本實驗選取累積包絡(luò)寬度、矛盾區(qū)間統(tǒng)計和累積區(qū)間寬度為三類特征向量。當利用SVM故障診斷時,為了避免因參數(shù)選取不當造成模型的不準確,采用k折交叉驗證(k-fold Cross Validation)的方法尋求出最恰當?shù)膮?shù)值,其中k設(shè)為5,最終確認SVM參數(shù)C和σ值分別為100和0.01。本實驗分別從正常軸承和內(nèi)圈故障軸承數(shù)據(jù)中抽取,每300條數(shù)據(jù)為一組共200組,每組分別提取概率包絡(luò)特征,其中2/3用于訓(xùn)練SVM生成分類模型,用剩余1/3測試數(shù)據(jù)進行故障診斷,并給出診斷結(jié)果及其分析。
表1 正常軸承特征向量
表2 內(nèi)圈故障特征向量
在相同信號源的條件下,基于相同的SVM分類原理,采用小波變換提取特征,進行訓(xùn)練和故障診斷(WT-SVM),與本文方法的診斷結(jié)果對比見表3。
表3 PE-SVM和WT-SVM
從表3可以看出,相對于采用WT-SVM診斷方法而言,采用本文提出的PE-SVM診斷方法不僅在訓(xùn)練時間上具有明顯的優(yōu)勢,而且診斷精確度較高。這種差別形成的原因一方面是本文方法使用概率盒來表達參數(shù)不確定性,使得對于振動信號不確定性的描述更加全面,提取的特征更具區(qū)分度;另一方面,本文提出的基于概率包絡(luò)故障診斷算法采用k折交叉驗證來尋找并確定最恰當?shù)某瑓?shù),避免了過擬合的問題。
為更好驗證本文方法的有效性,再次進行一組對比實驗。重新從數(shù)據(jù)集1的軸承3中截取出60 000條數(shù)據(jù)構(gòu)成新的原始數(shù)據(jù)集,部分數(shù)據(jù)見表4。
表4 原始數(shù)據(jù)
采用概率包絡(luò)分別對采集到的信號數(shù)據(jù)進行建模,正常和內(nèi)圈故障軸承概率包絡(luò)模型如圖7所示。
圖7 概率包絡(luò)建模
在建模后分別采用PE-SVM診斷方法和基于樸素貝葉斯網(wǎng)絡(luò)的概率包絡(luò)方法(PE-BN)進行診斷對比分析,即先利用概率包絡(luò)對數(shù)據(jù)進行特征提取,然后分別基于SVM和樸素貝葉斯網(wǎng)絡(luò)進行訓(xùn)練和測試對比。利用概率包絡(luò)提取出的正常和內(nèi)圈故障軸承特征,見表5、表6。
表5 正常軸承特征向量
表6 內(nèi)圈故障特征向量
此次實驗選取對數(shù)累積包絡(luò)寬度、矛盾區(qū)間統(tǒng)計和權(quán)重區(qū)間為特征向量作為SVM和樸素貝葉斯網(wǎng)絡(luò)的輸入進行故障分類診斷。SVM參數(shù)設(shè)定采用k折交叉驗證的方法確定出參數(shù)值,其中k設(shè)為5,最終選取出SVM參數(shù)C和的σ值分別為10和0.5,同時將特征值按6∶4隨機分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),將其分別傳入SVM和樸素貝葉斯網(wǎng)絡(luò)中進行故障分類診斷。對比結(jié)果見表7。
表7 PE-SVM和PE-BN
表7結(jié)果是在采用概率包絡(luò)提取到相同特征向量的基礎(chǔ)上兩種方法的對比。一方面,表明采用本文提出的PE-SVM方法在訓(xùn)練時間上與PE-BN方法相當,但是在診斷精確度上優(yōu)于PE-BN方法。另一方面,兩種方法的診斷精確度綜合平均為99.03%,進一步突顯本文采用概率包絡(luò)進行不確性建模和故障特征提取的方法有效性。
為了更好地驗證本文方法的泛化能力,進行了第三次實驗,選取實測輪對軸承數(shù)據(jù)集中的外圈故障、滾動體故障和正常軸承數(shù)據(jù)各5 000條,數(shù)據(jù)采樣頻率為10 240 Hz。對實測信號數(shù)據(jù)建立概率包絡(luò)模型,并提取累積包絡(luò)寬度、矛盾區(qū)間統(tǒng)計和累積區(qū)間寬度為三類概率包絡(luò)形狀特征,采用本文PE-SVM方法進行故障診斷,其分類診斷精度和時間見表8。
表8 基于實測數(shù)據(jù)的診斷結(jié)果
由表8可以看出,由于樣本數(shù)量的降低和實測平臺部署環(huán)境與公開實驗平臺環(huán)境差異性,尤其是將外圈、滾動體故障混合在一起診斷,分類診斷精度有所下降,但故障診斷精度仍然穩(wěn)定在98%以上,并且分類診斷時間大幅縮短,因而表明本文所提PE-SVM故障診斷方法具有良好的泛化能力。
本文針對信號不確定性問題,引入概率包絡(luò)理論,將信號的不確定性包裹在概率包絡(luò)中,解決了特征提取信息丟失的問題。實驗表明本文方法有效可行,在兼顧診斷模型訓(xùn)練效率的同時,提高了故障診斷的精確度。本文方法具有較好的泛化能力,除了能用于列車輪對軸承故障診斷之外,對于其他類型的機械故障,也具備良好診斷效果。