張 濤,王朝陽(yáng),吳鑫輝,葛平淑,王 陽(yáng)
(大連民族大學(xué) 機(jī)電工程學(xué)院,遼寧 大連 116600)
隨著科學(xué)技術(shù)和社會(huì)經(jīng)濟(jì)的飛速發(fā)展,電機(jī)作為一種新型的傳動(dòng)設(shè)備,在人們的生產(chǎn)生活中占有舉足輕重的地位[1]。根據(jù)EPRI的報(bào)告,在各種電機(jī)故障中,軸承故障占41%。因此,軸承故障診斷是電機(jī)預(yù)測(cè)和健康管理的一項(xiàng)關(guān)鍵且具有挑戰(zhàn)性的任務(wù)。當(dāng)電機(jī)軸承表面損壞時(shí),會(huì)產(chǎn)生周期性沖擊,其振動(dòng)信號(hào)包含豐富的故障特征,可以快速直接地反映軸承的運(yùn)行狀態(tài)。因此,基于振動(dòng)信號(hào)的電機(jī)軸承故障診斷方法是目前應(yīng)用最廣泛的[2]。
隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的發(fā)展,智能學(xué)習(xí)算法與電機(jī)軸承故障識(shí)別相結(jié)合成為研究熱點(diǎn)。常用的算法包括支持向量機(jī)(support vector machine,SVM)[3]、BP(back propagation)神經(jīng)網(wǎng)絡(luò)[4]和極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)[5]、深度學(xué)習(xí)[6]等。在故障診斷模型構(gòu)建中,SVM模型因其能很好地解決小樣本數(shù)據(jù)集和非線性問(wèn)題而被廣泛應(yīng)用。然而,傳統(tǒng)SVM性能的優(yōu)劣很大程度上取決于其參數(shù)選擇,如果手動(dòng)調(diào)參,工作量大,且不容易找到最優(yōu)參數(shù)。因此,有必要選擇合適的優(yōu)化算法來(lái)優(yōu)化相關(guān)參數(shù)。布谷鳥(niǎo)搜索(cuckoo search,CS)、粒子群優(yōu)化算法(particle swarm optimization,PSO)、灰狼優(yōu)化算法 (grey wolf optimizer,GWO)等具有代表性的算法因優(yōu)化性能好、易于實(shí)現(xiàn)等優(yōu)點(diǎn),被廣泛應(yīng)用于SVM結(jié)構(gòu)參數(shù)的優(yōu)化。Xie等[7]利用漢寧窗對(duì)頻域信號(hào)進(jìn)行窗口化得到樣本的均方根特征值,并使用CS優(yōu)化SVM(CS-SVM)對(duì)樣本進(jìn)行分類。Zan等[8]提出基于特征矩陣聯(lián)合近似對(duì)角化(JADE)和PSO優(yōu)化SVM(PSO-SVM)的方法,結(jié)果表明該方法能夠準(zhǔn)確預(yù)測(cè)小樣本尺寸下軸承的性能下降趨勢(shì)和剩余使用壽命。Dong等[9]提出時(shí)移多尺度加權(quán)排列熵方法,并結(jié)合GWO-SVM模型進(jìn)行滾動(dòng)軸承故障分類,實(shí)驗(yàn)表明,GWO-SVM故障診斷模型比SVM模型效率更高。然而,傳統(tǒng)GWO具有收斂速度慢、精度低的缺點(diǎn)。
為了解決傳統(tǒng)GWO的不足,實(shí)現(xiàn)電機(jī)軸承故障的準(zhǔn)確診斷,本文中利用非線性收斂因子進(jìn)一步平衡GWO的全局探索能力和局部開(kāi)發(fā)能力,并應(yīng)用Levy飛行改進(jìn)狼群搜索策略,克服傳統(tǒng)GWO容易陷入局部最優(yōu)的缺點(diǎn),提出一種基于多維特征與改進(jìn)灰狼優(yōu)化算法優(yōu)化支持向量機(jī)(IGWO-SVM)的電機(jī)軸承故障診斷算法。
特征提取作為電機(jī)軸承故障診斷的關(guān)鍵程序之一,直接影響診斷結(jié)果。為了獲取豐富的故障信息,特征提取常采用時(shí)域分析、頻域分析和時(shí)頻域方法。時(shí)域分析用于計(jì)算信號(hào)的各種時(shí)域參數(shù),可以區(qū)分正常狀態(tài)和故障狀態(tài),但隨著故障程度的加深,時(shí)域特征值可能會(huì)出現(xiàn)較大的異常波動(dòng),導(dǎo)致無(wú)法有效判別故障程度。而頻域分析則是用于描述在時(shí)域中無(wú)法獲得的信息,包括頻譜能量大小和信號(hào)中的周期分量。
因此,針對(duì)直接利用時(shí)域特征作為模型輸入軸承故障種類和故障程度分類效果不理想的問(wèn)題,將時(shí)域特征與頻域特征進(jìn)行集成。共提取16個(gè)故障特征構(gòu)成多維特征矩陣,包括12個(gè)時(shí)域特征參數(shù)和通過(guò)快速傅里葉變換(FFT)將時(shí)域信號(hào)轉(zhuǎn)換為頻域之后獲得的4個(gè)頻域特征,分別為信號(hào)的峭度、偏度、波形因子、峰值因子、脈沖因子、裕度因子、峰峰值、均值、方差、標(biāo)準(zhǔn)差、均方值、均方根值、重心頻率、均方頻率、頻率方差和均方根頻率,詳細(xì)計(jì)算公式可參考文獻(xiàn)[10]。
主成分分析(principal components analysis,PCA)是一種無(wú)監(jiān)督降維方法,適合高維數(shù)據(jù)降維的重要統(tǒng)計(jì)分析,能在盡量減少信息損失的同時(shí)明顯地降低特征的維度[11]。以下是利用主成分分析進(jìn)行數(shù)據(jù)降維的主要步驟。
步驟1提取電機(jī)軸承振動(dòng)信號(hào)的時(shí)域、頻域特征,在n個(gè)振動(dòng)信號(hào)樣本中提取出m個(gè)特征構(gòu)成該組的n×m階多維特征向量矩陣,有:
(1)
然后,計(jì)算平均值為:
(2)
(3)
然后,計(jì)算該協(xié)方差矩陣的特征值λi(i=1,2,…,n)和相應(yīng)的特征向量vi(i=1,2,…,n)。
步驟3將特征值按降序排序,即λ1≥λ2≥λ3…≥λn,并根據(jù)需求的累計(jì)貢獻(xiàn)率保留前Z個(gè)主成分。前Z個(gè)主成分的累積貢獻(xiàn)率可以計(jì)算為:
(4)
步驟4將前Z個(gè)特征向量形成一個(gè)新的矩陣,并且將數(shù)據(jù)轉(zhuǎn)換為矩陣P的空間,其中P=(v1,v2,…,vz)。得到簡(jiǎn)化到Z維的數(shù)據(jù)矩陣為:
X′=PX
(5)
與原始振動(dòng)信號(hào)相比,新的振動(dòng)信號(hào)數(shù)據(jù)集維度更低,保留了最重要的數(shù)據(jù)特征,計(jì)算成本顯著降低。
GWO是Mirjalili等人在2014年提出的一種算法,其基本原則是模仿灰狼的種群系統(tǒng),將它們劃分為α狼、β狼、δ狼和ω狼4個(gè)等級(jí),分別對(duì)應(yīng)優(yōu)化問(wèn)題的最優(yōu)解、優(yōu)解、次優(yōu)解和候選解[12]。GWO的優(yōu)化過(guò)程以α、β和δ為指導(dǎo),在判斷獵物位置為最優(yōu)解后,引導(dǎo)ω圍繞獵物,通過(guò)不斷迭代找到最優(yōu)值?;依莾?yōu)化算法的過(guò)程可以分為3個(gè)階段:包圍、追擊和攻擊,具體步驟如下:
1) 包圍獵物。
灰狼鎖定獵物位置后會(huì)慢慢向獵物移動(dòng)進(jìn)行包圍,每個(gè)灰狼個(gè)體與獵物間的距離D和灰狼個(gè)體位置更新公式為
D=|C·Xp(t)-X(t)|
(6)
X(t+1)=Xp(t)-A·D
(7)
式(7)中:t為目前迭代的次數(shù);XP、X分別表示獵物和灰狼的位置。
A和C為系數(shù)向量,可表示為
A=2·a0·r1-a0
(8)
C=2·r2
(9)
式(8)、式(9)中:a0為線性收斂因子,從2線性降低到0;r1和r2為[0,1]之間的隨機(jī)數(shù)。
2) 狩獵獵物。
在包圍獵物之后,狼群就會(huì)進(jìn)行狩獵活動(dòng)。狩獵過(guò)程由種群中適應(yīng)度前3的灰狼α、β、δ共同做出決策,每個(gè)灰狼個(gè)體都遵循以下等式進(jìn)行追捕,即
Dq=|Cl·Xj-Xf(t)|
(10)
Xl=Xq-Al·Dq
(11)
(12)
式(10)(12)中:q取α、β和δ;l取 1、2 和 3;Dq為q狼和獵物之間的距離;Xl為灰狼個(gè)體到q狼的距離;Xf(t)為灰狼在開(kāi)始追逐之前的個(gè)體位置;Xf(t+1)為灰狼在捕捉結(jié)束后的個(gè)體位置;Al和Cl分別使用式(8)和式(9)確定。
3) 攻擊獵物。
這一步是捕獵過(guò)程的最后階段,灰狼圍攻并攻擊獵物(獲得最優(yōu)解)。當(dāng)a0從2線性減小到0時(shí),A的范圍為[-a0,a0]。當(dāng)|A|<1,灰狼正在攻擊獵物,此時(shí)對(duì)應(yīng)算法的局部開(kāi)發(fā)能力;當(dāng)|A|≥1,灰狼離正在遠(yuǎn)離獵物位置,尋找新的潛在獵物,擴(kuò)大整個(gè)狼群狩獵范圍,此時(shí)對(duì)應(yīng)算法的全局探索能力。
2.2.1非線性收斂因子
根據(jù)傳統(tǒng)灰狼優(yōu)化算法的優(yōu)化原理,灰狼的搜索獵物代表全局搜索,通常僅在迭代計(jì)算的早期階段實(shí)。迭代計(jì)算由線性收斂因子a0決定,a0隨迭代次數(shù)在區(qū)間[0,2]間線性減小。其中,a0的值越大,意味著更好的全局搜索能力,可以增加種群多樣性。反之,a0值越小,全局搜索能力越差,種群多樣性降低。在傳統(tǒng)GWO中,a0在早期完全大于1,在后期完全小于1,這導(dǎo)致了全局和局部搜索的分離。因此,為了平衡整個(gè)迭代過(guò)程中的全局和局部搜索能力,提高迭代后期的種群多樣性,引入非線性收斂因子[13],計(jì)算公式為
(13)
式(13)中:t為當(dāng)前迭代次數(shù);tmax為最大迭代次數(shù)。
收斂因子變化曲線如圖1所示,由圖1可以明顯看出,非線性收斂因子a1的值是先減小后增大的,這表示在進(jìn)化的最后階段種群多樣性增加,所引入的非線性收斂因子能有效平衡全局搜索和局部搜索能力。
圖1 收斂因子變化曲線
2.2.2引入Levy飛行策略
當(dāng)傳統(tǒng)GWO包圍獵物時(shí),所有灰狼都在α狼的帶領(lǐng)下收斂,這使得算法在迭代搜索過(guò)程中容易陷入局部最優(yōu)值。為了在灰狼落入局部最優(yōu)時(shí)找到更好的解決方案,使用Levy飛行策略進(jìn)行全局搜索。
Levy飛行策略是一種服從Levy分布的隨機(jī)搜索方法,其搜索步驟是短距離搜索和長(zhǎng)距離搜索交替進(jìn)行[14]。利用Levy飛行在迭代過(guò)程中的隨機(jī)徘徊的特點(diǎn),改善種群多樣性,從而避免過(guò)早收斂,增強(qiáng)算法全局搜索能力,有效地跳出局部最優(yōu)。Levy飛行的位置更新公式為:
X(t+1)=X(t)+θ·Levy
(14)
(15)
(16)
式(14)—式(16)中:t為當(dāng)前迭代;θ為[0,1]間隨機(jī)數(shù);參數(shù)ε=1.5。
本文中選擇在解決小樣本、非線性和高維識(shí)別方面表現(xiàn)出巨大優(yōu)勢(shì)的SVM作為基本的故障診斷模型,SVM 模型的核心參數(shù)是懲罰因子c和核函數(shù)參數(shù)g,如果使用模型的默認(rèn)參數(shù),容易出現(xiàn)過(guò)擬合或欠擬合現(xiàn)象[15]。因此,利用所提出的IGWO算法對(duì)SVM的2個(gè)參數(shù)進(jìn)行優(yōu)化,得到基于IGWO優(yōu)化SVM的故障診斷模型。IGWO-SVM故障診斷模型的流程如圖2所示。
圖2 IGWO-SVM故障診斷模型流程
具體步驟如下:
步驟1設(shè)置 IGWO和SVM 算法的參數(shù)并初始灰狼種群。
步驟2將SVM對(duì)訓(xùn)練集樣本的識(shí)別錯(cuò)誤率最小作為適應(yīng)度函數(shù),計(jì)算種群中所有個(gè)體的適應(yīng)度,并根據(jù)適應(yīng)度值的大小排序,確定前三的灰狼個(gè)體。
步驟3根據(jù)式(10)—式(12)更新當(dāng)前灰狼個(gè)體的位置。
步驟4根據(jù)式(13)更新非線性收斂因子a1的值,并根據(jù)式(8)、式(9)更新參數(shù)向量A、C。
步驟5根據(jù)式(14)對(duì)灰狼種群引入Levy飛行策略,調(diào)整灰狼的位置。
步驟6判斷算法是否達(dá)到最大迭代次數(shù)。若達(dá)到,則返回α狼的位置作為SVM最優(yōu)參數(shù)值。若未達(dá)到,跳到第2步。
步驟7利用最優(yōu)的懲罰因子c和核函數(shù)參數(shù)g對(duì)訓(xùn)練集樣本進(jìn)行訓(xùn)練學(xué)習(xí),得到IGWO-SVM故障診斷模型。
步驟8將測(cè)試集樣本輸入到訓(xùn)練好的IGWO-SVM模型中進(jìn)行故障識(shí)別。
研究路線如圖3所示,通過(guò)特征提取、數(shù)據(jù)降維和故障診斷對(duì)電機(jī)軸承振動(dòng)信號(hào)進(jìn)行處理和故障狀態(tài)識(shí)別。
圖3 基于多維特征與IGWO-SVM的電機(jī)軸承故障診斷
本實(shí)驗(yàn)使用的數(shù)據(jù)樣本來(lái)自美國(guó)凱斯西儲(chǔ)大學(xué)的軸承數(shù)據(jù)集(CWRU),選擇負(fù)載為3 HP,采樣頻率為12 kHz條件下收集的振動(dòng)加速度信號(hào)。實(shí)驗(yàn)數(shù)據(jù)集共有10種故障分類,由4種狀態(tài)組成,即正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動(dòng)體故障,除正常狀態(tài)外,其他3種故障狀態(tài)都包含3種不同故障程度的數(shù)據(jù)。樣本數(shù)據(jù)長(zhǎng)度劃分為1 024個(gè)采樣點(diǎn),每種類型的數(shù)據(jù)取100個(gè)樣本,總共獲得1 000個(gè)樣本。實(shí)驗(yàn)中使用的數(shù)據(jù)集信息如表1所示。
表1 數(shù)據(jù)集組成
首先對(duì)電機(jī)軸承振動(dòng)信號(hào)的時(shí)域特征與頻域特征進(jìn)行集成。實(shí)驗(yàn)數(shù)據(jù)集有 10 種狀態(tài)類別的數(shù)據(jù),每種狀態(tài)類別有100個(gè)樣本,每個(gè)樣本提取16個(gè)特征,1 000個(gè)樣本的特征矩陣維數(shù)加上對(duì)應(yīng)標(biāo)簽得到的特征矩陣大小為[1 000×17]。如果直接將特征矩陣輸入到訓(xùn)練模型,則維度過(guò)大,容易導(dǎo)致數(shù)據(jù)冗余和過(guò)擬合。因此,為了更好地保留電機(jī)軸承原有的振動(dòng)信號(hào)特性,減輕計(jì)算負(fù)擔(dān),采用PCA進(jìn)行數(shù)據(jù)降維。各個(gè)主成分的貢獻(xiàn)率從大到小排序如圖4所示,從圖4中可以看出,最后幾個(gè)主成分的貢獻(xiàn)率幾乎為零,并通過(guò)式(4)計(jì)算出前10個(gè)主成分累計(jì)貢獻(xiàn)率高達(dá)99.87%。因此,選擇前10個(gè)主成分代表原來(lái)的16個(gè)特征輸入到IGWO-SVM故障診斷模型中進(jìn)行故障分類。
圖4 主成分貢獻(xiàn)率
然后,將降維后的多維特征矩陣歸一化并作為IGWO-SVM軸承故障診斷模型的輸入。將數(shù)據(jù)集的1 000個(gè)樣本隨機(jī)抽取80%的樣本作為訓(xùn)練集,其余作為測(cè)試集。設(shè)置初始狼群數(shù)量為5,最大迭代次數(shù)為30,通過(guò)IGWO算法對(duì)SVM的參數(shù)進(jìn)行尋優(yōu),最終得到最優(yōu)參數(shù)c、g組合為[0.100 0,6.356 2]。然后利用優(yōu)化后的SVM對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練,訓(xùn)練過(guò)程中的適應(yīng)度曲線如圖5所示,由圖5可以看出,IGWO-SVM的最初適應(yīng)度為0.028 75,迭代至第14次時(shí)達(dá)到最佳適應(yīng)度0.011 25,訓(xùn)練集樣本結(jié)果如圖6所示,診斷精度為98.875%,只有9個(gè)樣本分類錯(cuò)誤。然后將測(cè)試樣本輸入到訓(xùn)練好的SVM中,測(cè)試樣本診斷結(jié)果如圖7所示,診斷精度為98.5%,具有良好的軸承故障診斷效果。結(jié)合2個(gè)樣本集的診斷結(jié)果可知,IGWO算法能準(zhǔn)確找到SVM的最優(yōu)參數(shù),有效避免過(guò)擬合和局部最優(yōu)。
圖5 訓(xùn)練過(guò)程中的適應(yīng)度曲線
圖6 訓(xùn)練集樣本診斷結(jié)果
圖7 測(cè)試集樣本診斷結(jié)果
為了驗(yàn)證所提基于多維特征與IGWO-SVM的電機(jī)軸承故障診斷模型的準(zhǔn)確性和穩(wěn)定性,將本文中提出的模型用于CWRU軸承數(shù)據(jù)集,采樣頻率為12 kHz,負(fù)載分別為0 hp、1 hp、2 hp和3 hp條件下收集的振動(dòng)加速度信號(hào)。共包含4個(gè)實(shí)驗(yàn)數(shù)據(jù)集,每個(gè)數(shù)據(jù)集構(gòu)成與表1類似,包含1 000個(gè)樣本,涉及9種故障工況和1種正常工況,實(shí)驗(yàn)的正確樣本數(shù)、錯(cuò)誤樣本數(shù)及準(zhǔn)確率如表2所示。
表2 不同工況診斷結(jié)果
實(shí)驗(yàn)結(jié)果表明,所提模型對(duì)CWRU軸承數(shù)據(jù)集下4種不同工況的電機(jī)軸承故障診斷是穩(wěn)定和有效的。
為了進(jìn)一步驗(yàn)證所提SVM參數(shù)優(yōu)化算法的優(yōu)越性,將引入非線性收斂因子和Levy飛行策略的改進(jìn)灰狼優(yōu)化算法與軸承故障領(lǐng)域的傳統(tǒng)灰狼優(yōu)化算法、基于差分進(jìn)化的改進(jìn)灰狼優(yōu)化算法(DEGWO)對(duì)SVM參數(shù)的優(yōu)化進(jìn)行比較。在相同實(shí)驗(yàn)條件下(狼群數(shù)量5、最大得代數(shù)50),每個(gè)優(yōu)化算法的診斷結(jié)果如表3所所示。
表3 不同優(yōu)化算法診斷結(jié)果
根據(jù)表3可知,本文中所提方法的故障診斷準(zhǔn)確率達(dá)到99%,同時(shí),IGWO在14次迭代時(shí)可以達(dá)到全局最優(yōu)解。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)GWO和DEGWO相比,所提IGWO在SVM優(yōu)化中具有高效率、高精度的優(yōu)點(diǎn),可滿足軸承故障診斷應(yīng)用需求。
1) 提出基于多維特征與IGWO-SVM的電機(jī)軸承故障診斷方法,并通過(guò)CWRU軸承數(shù)據(jù)集驗(yàn)證了該方法能有效區(qū)分電機(jī)軸承不同故障位置和故障程度,診斷效果良好。
2) 所提方法在4種不同負(fù)載下的實(shí)驗(yàn)結(jié)果表明,該方法具有精度高、性能穩(wěn)定等優(yōu)點(diǎn),為現(xiàn)有故障診斷技術(shù)提供了一種有效的新方法。
3) 基于非線性收斂因子和Levy飛行策略的IGWO算法與其他優(yōu)化算法相比,在優(yōu)化精度和算法收斂性方面具有良好的性能。