李寶慶 楊路航 楊宇 程軍圣
摘要:針對多面體錐分類器形成的凸包區(qū)域分類邊界數量有限且無法進行不同尺度伸縮的問題,在范數向量化的基礎上增加旋轉因子,提出一種旋轉多面體錐分類器(Rotated and Extended Polyhedral Conic Classifier,REPCC). REPCC增加了凸包區(qū)域的分類邊界數量,并且分類邊界可以在每個維度上自適應伸縮,從而可以更好地擬合正類區(qū)域,提高了分類精度.在兩個不同的滾動軸承數據集上進行實驗驗證,實驗結果表明:REPCC具有更好的分類精度、魯棒性和泛化能力,能夠準確識別滾動軸承的工作狀態(tài)和故障類型,可以用于滾動軸承智能故障診斷.
關鍵詞:多面體錐分類器;旋轉因子;滾動軸承;模式識別;故障診斷
中圖分類號:TH 113;TH 165+.3文獻標志碼:A
Rolling Bearing Intelligent Fault Diagnosis Based on Rotated and Extended Polyhedron Cone
LI Baoqing,YANG Luhang,YANG Yu,CHENG Junsheng
(College of Mechanical and Vehicle Engineering,Hunan University,Changsha 410082,China)
Abstract:In order to solve the problem that the number of classification boundaries of convex hull region formed by polyhedral cone classifier is limited and it is unable to scale in different scales,a rotated and extended polyhedral conic classifier(REPCC)is proposed by adding a rotation factor based on norm vectorization. REPCC increases the number of classification boundaries of the convex hull region,and the classification boundaries can be adaptively scaled in each dimension,which can better fit the positive region and improve the classification accuracy. Experimental verification is carried out on two different rolling bearing datasets. The results show that REPCC has better classification accuracy,robustness and generalization ability,and can accurately identify the working state and fault type of rolling bearing. REPCC can be used for intelligent fault diagnosis of rolling bearing.
Key words:polyhedral conic classifier;rotation factor;rolling bearing;pattern recognition;fault diagnosis
滾動軸承是機械設備的關鍵部件,長期在復雜多變載荷環(huán)境下高速運行,工作環(huán)境惡劣,極易發(fā)生故障,直接影響機械系統(tǒng)的總體性能[1].因此,滾動軸承故障診斷研究具有重要意義,已得到許多學者的廣泛關注[2-3].
滾動軸承智能故障診斷的核心是模式識別,隨著近年來人工智能技術的快速發(fā)展,滾動軸承智能故障診斷方法的研究也迅速發(fā)展[4].人工神經網絡(Artificial Neural Network,ANN)、支持向量機(Support Vector Machine,SVM)等方法被廣泛應用于滾動軸承故障識別,取得了良好的效果[5-6].特別是深度學習(Deep Learning,DL)可以利用深層神經網絡結構直接從原始信號中提取特征,近幾年已在滾動軸承智能故障診斷領域獲得廣泛應用[7-8].但是,這些智能診斷方法也存在一些問題,其中:神經網絡和深度學習需要大量的訓練樣本,而工程實際故障大多為小樣本[9];SVM方法對核的選取不敏感,確定核參數和懲罰系數需要花費較多的時間,另外,由于引入核函數計算,當處理大樣本或者樣本數據本身維度相對較高時,會遇到核函數計算緩慢的問題.
合正類區(qū)域.本質上,REPCC等基于PCF的分類模型具有與線性SVM相似的性質和復雜性,都是基于統(tǒng)計學習理論的有監(jiān)督機器學習方法,可以使用與SVM相關聯的凸二次規(guī)劃問題進行最大邊距訓練求解.但是,REPCC等分類模型不需要引入核函數,并能夠保證較高的識別率,在參數選擇上比SVM更加便捷.
當滾動軸承出現故障時,其振動信號的時頻分布與正常情況不同,振動信號的時域和頻域統(tǒng)計參數通常被用作滾動軸承故障診斷的特征[13].本文將REPCC應用于滾動軸承故障診斷,首先提取振動加速度信號的時域和頻域特征作為候選故障特征;然后采用距離評估技術[14](Distance Evaluation Technique,DET)篩選候選故障特征中的敏感特征,DET通過有效因子來評估特征在樣本類別變化時的敏感程度,選擇類間變化明顯和類內變化小的特征,評估因子越大特征越敏感;最后將篩選后的敏感特征作為分類器的輸入特征,輸入到REPCC進行故障識別.
在兩種不同的滾動軸承數據集上開展實驗驗證,分析REPCC的識別精度、魯棒性和泛化能力.通過對比實驗,與PCC和EPCC相比,REPCC具有更高的識別精度、更好的抗干擾能力、更好的泛化能力.REPCC可以有效識別滾動軸承的工作狀態(tài)和故障類型,在小樣本情況下具有更優(yōu)越的故障識別性能.
1多面體錐分類器及其擴展型
1.1多面體錐分類器
在n維向量空間R中,PCF可以用來分割不相交的兩個點集,對于測試樣本x∈R,分類函數定義如下:
式(1)所示的函數是一個多面體錐,其頂點位于(a,-γ)∈R×R,PCF的每個水平截面都是凸多邊形.三維向量空間下的PCF示意圖如圖1所示.
從圖中可以看出,在平面g=0上,多面體錐的四個錐面將平面分為內部區(qū)域和外部區(qū)域,由四條線性邊界包圍構成,這四條邊界包圍的區(qū)域可以看作是一個封閉的二維凸包,此時在凸包內部區(qū)域的點映射到超平面上的值g小于0,外部區(qū)域的點映射到超平面上的值g大于0,實現線性可分.因此,當一個二分類數據集樣本特征維度為2,且其正類分布較為緊湊,負類分布較為分散時,一個二維PCF就能夠很好地對其實現分類擬合.當樣本特征維度大于2 時,與二維類似,PCF會在特征空間形成封閉凸包,并在更高維空間形成決策項來實現分類.
為直觀表示PCC的分類特點,隨機生成二維數據樣本點,方框點為正類,圓圈點為負類,然后使用PCC進行優(yōu)化分類,分類結果如圖2所示.從圖中可以看出,分類邊界完全線性,實現了對隨機樣本點的正確分類.
1.2擴展型多面體錐分類器
EPCC中的ξ是一個屬于R空間的向量,其幾何意義為:分類截面所形成的凸包頂點在n個維度上的不同伸縮因子.因此,PCC中的ξ為常數,只能實現分類截面整體尺度的縮放,而EPCC的分類邊界則更加靈活,可以調整凸包邊界實現對正類樣本的更好擬合.當ξ向量的每個值都相等時,EPCC就退化成了PCC.
對于測試樣本x,g(x)<0屬于正類,g(x)>0屬于負類.對PCC進行最大邊界訓練,對于正類樣本強制g(x)<-1,負類樣本g(x)>+1.為了實現這種方式的訓練,對樣本特征向量和目標函數進行向量維度的擴展,對于PCC而言,將特征向量擴展為如下形式:
權重向量擴展為:
由于權重變化為負的,所以對于正類樣本f>0,負類樣本f<0.
同樣地,對于EPCC而言,將特征向量擴展為如下形式:
權重向量擴展為:
2旋轉多面體錐分類器
2.1旋轉多面體錐函數
雖然EPCC可以使得分類決策的凸包邊界能夠在每個維度上實現不同權重的伸縮,改善了原始分類區(qū)域擬合正類樣本的精度,但是EPCC的分類邊界數量始終等于向量維度的2倍,以二維特征向量分類為例,形成的分類邊界是四邊形,分類邊界只有4 條,有限的分類邊界仍然無法保證對所有正類樣本進行充分地擬合,來實現更高的分類精度.
為了擴大分類截面多邊形的邊數,從而使得分類截面能夠更好地擬合正類區(qū)域,將坐標軸進行旋轉,然后融合重新繪制在原始的坐標軸中,形成新的凸包區(qū)域,得到旋轉多面體錐函數(Rotated Polyhedral Conic Function,RPCF).三維向量空間下,RPCF截面區(qū)域的旋轉融合過程如圖3所示.從示意圖中可以看出,原始錐面形成的凸包邊界只有4條,融合后的凸包邊界增加到了8條,并且對于新的凸包區(qū)域,凸包上的8個頂點同時能夠在四個方向維度上進行不同比例的伸縮,從而更好地擬合正類區(qū)域.
2.2旋轉因子計算
基于RPCF定義REPCC,公式如式(9)所示.式中,A是維數為n的旋轉變換矩陣,即旋轉因子,μ是一個權重向量,ξ和μ控制四個維度方向的伸縮尺度.
在高維空間進行坐標旋轉須保證旋轉因子A是正交矩陣[15].在二維笛卡爾坐標系中,旋轉因子A的形式如式(10)所示.坐標繞原點的旋轉可以通過原始坐標向量和坐標變換矩陣相乘得到,如式(11)所示.其中,0≤θ≤π,x表示在原坐標系中x逆時針旋轉θ弧度得到的新坐標.
在n維空間中,在兩個特征維度的坐標系上的旋轉因子A可以采用一個n維的單位方陣表示,如式(12)所示.
由于是在n維空間進行旋轉,需要兩兩組成子坐標空間進行旋轉,共有n(n-1)/2組子空間,因此需要將每個子空間的旋轉矩陣進行左乘.旋轉因子的計算流程如表1所示.
選擇一個初始的旋轉角度0,根據表1計算相對應的旋轉因子A.確定旋轉因子后,與PCC和EPCC的變換策略相同,REPCC將特征向量擴展為式(13)所示的形式,將權重向量擴展為式(14)所示的形式.
REPCC變換后的特征向量和權重向量的維度是原始的3倍,屬于R空間.分類截面的邊界數量是原始邊界數量的2倍,并且繼承了EPCC的優(yōu)點,可以實現分類截面在2n個維度上的不同尺度伸縮,可以擬合出更為合理的正類區(qū)域,從而提高分類精度.
為直觀表示,根據式(1)給出一個二維特征的分類函數,具體參數如式16所示,該仿真信號的三維空間示意圖如圖4所示.根據REPCC,給定一個初始旋轉角度后計算旋轉因子,其三維空間示意圖如圖5所示.
從圖4中可以看出,PCF在平面g=0形成的二維凸包區(qū)域存在4條線性邊界,分別為:0.44x+0.44x-2.76≤0,0.22x-0.22x-0.12≤0,0.44x-0.22x-1.44≤0,-0.22x+0.44x-1.44≤0.
從圖5中可以看出,經過旋轉融合后的多面體錐函數在平面g=0形成的凸包區(qū)域存在8條線性邊界,RPCF能夠以更加合理的尺度形成新的凸包邊界來擬合正類樣本.
2.3多分類模型
根據決策函數,PCC、EPCC和REPCC三種分類器的±1邊距都轉化為類似SVM方法的±1邊距,采用凸二次規(guī)劃算法進行最大邊距訓練,可以得到支持向量,然后根據決策函數逆變換獲得權重向量.目標函數如式(17)所示.
式中:y為樣本的類別標簽,對于正類y=1,負類
采用一對多的策略將二分類問題推廣到多分類模型,對于m類問題,以當前類為正類樣本,其他類為負類樣本,構造m個分類器進行訓練[16].當進行新樣本的預測時,將樣本輸入到每個分類器中,以輸出值最大的那個分類器對應的正類類別作為新樣本的最終決策.決策函數如式(19)所示.
3基于REPCC的滾動軸承故障診斷
3.1基于REPCC的故障診斷步驟
選取滾動軸承振動信號的時域和頻域統(tǒng)計參數作為故障診斷的特征.時域統(tǒng)計參數選取16個,具體有:均值、方根幅值、均方根值、峰值、標準差、偏斜度、峭度、峰度指標、裕度指標、波形指標、脈沖指標、方差、最大值、最小值、峰峰值、絕對平均值.頻域統(tǒng)計參數選取8個,具體有:頻率均值、頻率均方根值、頻率斜度、頻率峭度、頻率方差、頻率標準差、中心頻率、重心頻率.時域和頻域統(tǒng)計參數共計24個.
不是所有的特征都對區(qū)分不同的滾動軸承故障敏感,因此在進行分類訓練時,需要從候選特征中選擇對故障敏感的顯著特征.DET方法通過有效因子來評估特征在樣本類別變化時的敏感程度,可以有效提取候選特征中的敏感特征.
基于REPCC的滾動軸承故障診斷的主要步驟如下:
1)采集滾動軸承不同故障狀態(tài)的振動加速度信號,并將每種故障狀態(tài)的數據分為訓練樣本和測試樣本,訓練樣本和測試樣本各占50%;
2)提取振動加速度信號的時域和頻域統(tǒng)計參數,共計24個特征參數,進行歸一化處理后構建候選特征集;
3)采用DET方法從候選特征集中篩選敏感特征,評估因子的閾值設置為全部特征評估因子的均值,選擇大于評估因子閾值的敏感特征作為故障特征,構建新的特征集;
4)將經過DET篩選后的特征集輸入REPCC中進行訓練和測試,進行滾動軸承故障診斷.
3.2實驗數據集
為驗證基于REPCC的滾動軸承故障診斷方法的有效性和優(yōu)越性,采用數據集A和B兩個實驗數據集進行分析驗證,具體如表2所示.
數據集A的數據來源為美國凱斯西儲大學軸承數據中心,實驗軸承為型號6205-2RS的SKF深溝球軸承,采用電火花加工設置單點損傷,本文采用的數據是驅動端軸承的振動加速度測試數據,采樣頻率為48kHz,電機轉速為1 797 r/min、1 772 r/min、1 750 r/min、1 730 r/min,以每12 000個數據點劃分為一個樣本,總共400個樣本.
數據集B的數據來源于旋轉機械故障實驗臺的實際測試數據,實驗滾動軸承型號為6205-2RS- SKF,實驗臺如圖6所示.所有的故障均采用激光切割加工,故障深度為0.2 mm,電機轉速為986.1 r/min,采樣頻率10 kHz,以6 000個數據點作為一個樣本,總共400個樣本.
3.3特征集構建
為更加客觀地體現REPCC的分類性能,不對采集得到的振動加速度信號進行處理,直接提取其時域和頻域統(tǒng)計參數作為候選特征集.然后,采用DET方法從候選特征集中篩選敏感特征構建新的特征集.在進行敏感特征篩選時,選擇大于評估因子閾值的敏感特征作為故障特征,評估因子的閾值設置為全部特征評估因子的均值,有效因子的計算方法參照文獻[14].
數據集A和數據集B經過時域和頻域特征提取并進行歸一化后,各個特征的評估因子及其均值如圖7~圖8所示.
在圖7-8中,黑色虛線為平均值,是評估因子閾值,選擇評估因子位于黑色虛線上方的特征構建新的故障特征集.從兩圖中可以看出,篩選后重新構建的特征集的維數下降,數據集A的特征維數從24下降為14,數據集B的特征維數從24下降為11.由于數據集A和數據集B的故障尺寸設置以及電機轉速等試驗工況不同,因此經DET篩選后構建的故障特征集不同.
3.4實驗結果及分析
將經過DET篩選構建的新特征集輸入分類器進行滾動軸承智能故障診斷.為驗證REPCC的有效性和優(yōu)越性,在表2所示的兩個數據集上采用SVM、PCC、EPCC和REPCC進行分類識別,考察不同分類器的識別精度、魯棒性和泛化能力.
3.4.1分類器的識別精度
在使用不同的分類器時,需要確定分類器所需的相關參數.SVM需要確定的參數為高斯核參數δ和懲罰系數C采用網格搜索法獲取最優(yōu)參數.PCC和EPCC無須進行核計算,需要確定的參數為懲罰系數C.由于引入了旋轉因子A,REPCC需要確定的參數為懲罰系數C和旋轉弧度θ,采用控制變量法,旋轉弧度0在EPCC的懲罰系數C基礎上進行優(yōu)化選擇.
在數據集A和數據集B上,對DET篩選后的數據特征集進行五折交叉驗證實驗,獨立重復30次,統(tǒng)計測試數據30次的平均準確率.PCC和EPCC的識別精度隨懲罰系數C的變化如圖9所示.對于REPCC,在EPCC懲罰系數C的基礎上,REPCC的識別精度隨旋轉弧度e的變化如圖10所示.利用圖9 和圖10選擇最優(yōu)化參數,各分類器確定的最優(yōu)化參數如表3所示.
為分析REPCC的識別精度,在表3所示的最優(yōu)化參數下,隨機獨立重復30次實驗,得到平均識別準確率如表4所示.從表4中可以看出,在兩個滾動軸承實驗數據集上,REPCC的識別準確率最高,優(yōu)于改進前的PCC和EPCC的識別準確率,也優(yōu)于SVM的識別準確率.實驗結果表明,REPCC具有更高的識別精度.
從表2中可以知道,與數據集A相比,數據集B的試驗工況更加單一.從表4中還可以看出,各分類器在數據集B上的分類精度都高于數據集A,符合實際情況.
3.4.2分類器的魯棒性
為分析REPCC的魯棒性,在兩個滾動軸承實驗數據集上進行添加離群點實驗,從其他類的訓練樣本中隨機選擇m個樣本作為離群點,添加到當前類的訓練樣本集中再進行訓練,然后驗證測試樣本的識別準確率.對于不同的m值,每次都隨機獨立重復30次,然后統(tǒng)計測試樣本的平均識別精度.實驗結果如圖11和圖12所示.
從圖11和圖12中可以看出,在兩個滾動軸承實驗數據集上,隨著訓練集中混雜的離群點個數增加,測試集的識別準確率都出現下降,SVM的下降程度最嚴重.圖11和圖12對比分析可以看出,對于不同的數據集,PCC和EPCC的下降趨勢變化較大,REPCC的下降趨勢基本一致.整體來看,REPCC的下降趨勢最低,表明REPCC具有更好的魯棒性.
3.4.3分類器的泛化能力
為分析REPCC的泛化能力,在兩個滾動軸承實驗數據集上,以不同的數量樣本作為訓練集,分析測試樣本集的識別準確率隨訓練集樣本數量的變化情況.對于兩個實驗數據集,每種故障狀態(tài)的數據分為訓練樣本和測試樣本,隨機選取其中一半為訓練樣本,其余的為測試樣本.在訓練樣本中根據不同比例構建不同數量樣本的訓練集.在最優(yōu)參數下,不同樣本數量的訓練集每次隨機獨立重復30次,然后統(tǒng)計測試樣本的平均識別精度.實驗結果如圖13和圖14所示.
從圖13-14中可以看出,兩個數據集的趨勢基本一致,隨著訓練樣本數量的增加,各分類器的識別準確率也增加;REPCC的識別準確率最高,而且在訓練樣本較少的情況下REPCC的優(yōu)勢更加明顯,識別準確率大于其他分類器.REPCC不僅提高了PCC和EPCC的分類精度,而且具有更好的泛化能力.
4結論
本文在EPCC的基礎上引入旋轉因子,提出了REPCC模式識別方法,并將其用于滾動軸承智能故障診斷.REPCC增加了分類邊界數量,并且分類邊界可以在每個維度上自適應伸縮,改進了分類精度,并且具有更好的抗干擾性能和泛化能力.在兩個滾動軸承數據集上進行實驗驗證,結果表明REPCC可以準確識別滾動軸承的工作狀態(tài)和故障類型,REPCC可以用于滾動軸承智能故障診斷.
REPCC是一種二分類約束算法,但是其分類模型也可以作為一種單分類模型,在后續(xù)的研究中可以尋找一種在只有單一樣本分布下的模型優(yōu)化求解算法,實現單分類.
參考文獻
[1]王玉靜,呂海巖,康守強,等.不同型號滾動軸承故障診斷方法[J].中國電機工程學報,2021,41(1):267-276.
WANG Y J,LYU H Y,KANG S Q,et al. Fault diagnosis method for different types of rolling bearings [J]. Proceedings of the CSEE,2021,41(1):267-276(In Chinese)
[2]程軍圣,馬利,潘海洋,等.基于EEMD和改進VPMCD的滾動軸承故障診斷方法[J].湖南大學學報(自然科學版),2014,41(10):22-26.
CHENG J S,MA L,PAN H Y,et al. A fault diagnosis method for rolling bearing based on EEMD and improved VPMCD [J]. Journal of Hunan University (Natural Sciences),2014,41(10):22-26.(In Chinese)
[3] QIAO M Y,TANG X X,LIU Y X,et al. Fault diagnosis method of rolling bearings based on VMD and MDSVM [J]. Multimedia Tools and Applications,2021,80(10):14521-14544.
[4]ALSHORMAN O,IRFAN M,SAAD N,et al. A review of artificial intelligence methods for condition monitoring and fault diagnosis of rolling element bearings for induction motor [J]. Shock and Vibration,2020,2020:8843759.
[5] LI B,CHOW M Y,TIPSUWAN Y,et al. Neural-network-based motor rolling bearing fault diagnosis [J]. IEEE Transactions on Industrial Electronics,2000,47(5):1060-1069.
[6]YANG Y,YU D J,CHENG J S. A fault diagnosis approach for roller bearing based on IMF envelope spectrum and SVM[J].Measurement,2007,40(9/10):943-950.
[7]LI X,ZHANG W,DING Q. Understanding and improving deep learning-based rolling bearing fault diagnosis with attention mechanism[J].Signal Processing,2019,161:136-154.
[8]JIA F,LEI Y G,LIN J,et al. Deep neural networks:a promising tool for fault characteristic mining and intelligent diagnosis of rotating machinery with massive data [J]. Mechanical Systems and Signal Processing,2016,72/73:303-315.
[9]SHAO H D,JIANG H K,ZHANG X,et al. Rolling bearing fault diagnosis using an optimization deep belief network [J]. Measurement Science and Technology,2015,26(11):115002.
[10] OZTURK G,TAHIR CIFTCI M.Clustering based polyhedralconic functions algorithm in classification[J].Journal of Industrial & Management Optimization,2015,11(3):921-932.
[11] CEVIKALP H,YAVUZ H S.Fast and accurate face recognition with image sets[C]//2017 IEEE International Conference on Computer Vision Workshops.October 22-29,2017,Venice,Italy.IEEE,2017:1564-1572.
[12] CEVIKALP H,TRIGGS B.Polyhedral conic classifiers for visual object detection and classification [C]//2017 IEEE Conference on Computer Vision and Pattern Recognition.July 21-26,2017,Honolulu,HI,USA.IEEE,2017:4114-4122.
[13]程軍圣,鄭近德,楊宇,等.基于部分集成局部特征尺度分解與拉普拉斯分值的滾動軸承故障診斷模型[J].振動工程學報,2014,27(6):942-950.
CHENG J S,ZHENG J D,YANG Y,et al.Fault diagnosis model for rolling bearing based on partly ensemble local characteristicscale decomposition and Laplacian score[J].Journal of Vibration Engineering,2014,27(6):942-950.(In Chinese)
[14] GEORGOULAS G,LOUTAS T,STYLIOS C D,et al.Bearing fault detection based on hybrid ensemble detector and empirical mode decomposition[J].Mechanical Systems and Signal Processing,2013,41(1/2):510-525.
[15] REDI M H. Oceanic isopycnal mixing by coordinate rotation [J]. Journal of Physical Oceanography,1982,12(10):1154-1158.
[16] VAPNIK V N.An overview of statistical learning theory[J].IEEE Transactions on Neural Networks,1999,10(5):988-999.