柯 耀,王 琪,苗育茁,黃 浪,陳漢新
(武漢工程大學(xué) 機(jī)電工程學(xué)院,武漢 430205)
離心泵是一個非常復(fù)雜的非線性系統(tǒng),其無故障運行對生產(chǎn)至關(guān)重要。針對離心泵故障振動信號的非線性非平穩(wěn)特征,Soylemezoglu 等[1]根據(jù)Mahalanobis-Taguchi系統(tǒng)的相關(guān)理論,應(yīng)用采集到的離心泵信號進(jìn)行故障特征提取、故障分離與分析,能夠成功對離心泵等多種故障部件進(jìn)行診斷。
離心泵故障診斷過程可視為模式識別的過程,從非平穩(wěn)的振動信號中提取出故障特征信息是離心泵故障診斷的關(guān)鍵。由于負(fù)載、摩擦等非線性因素對振動信號的不同影響,僅在時域和頻域?qū)C(jī)械設(shè)備工作狀態(tài)進(jìn)行精確診斷是比較困難的[2]。特別是對于多源信號而言,其特征存在耦合和混疊等現(xiàn)象,張英堂等[3]利用平行因子分析對缸蓋振動信號進(jìn)行盲源分離,提高了故障診斷精度。本文采用多尺度小波分解和平行因子分析(PARAFAC)相結(jié)合的方法來提取單源故障信號的時間、頻率和空間的特征信息,并采用支持向量機(jī)(SVM)作為分類器來對離心泵正常和故障狀態(tài)進(jìn)行分類。
本文擬將PARAFAC 方法與SVM 結(jié)合起來,建立PARAFAC-SVM 的分類器模型,對離心泵進(jìn)行故障診斷。即以PARAFAC 分析作為振動信號的預(yù)處理器,以SVM作為分類器,提取PARAFAC分解后的時間加載因子和頻率加載因子作為分類器的特征參數(shù),對正常和故障的離心泵進(jìn)行分類。同時,將PARAFAC 方法與小波包分析方法進(jìn)行比較分析。還將PARAFAC 方法應(yīng)用于BP 神經(jīng)網(wǎng)絡(luò)分類器。實驗結(jié)果表明,基于PARAFAC 方法的SVM 分類模型具有更好的識別效果。
平行因子概念始于心理實驗學(xué)領(lǐng)域的數(shù)據(jù)分析,是一種多維低秩分解方法。PARAFAC經(jīng)常被用于化學(xué)統(tǒng)計、無線通信和盲源分離等領(lǐng)域,并取得了良好的效果。本文中以三維數(shù)據(jù)為例,數(shù)據(jù)集X∈CI×J×K可以分解為R個秩為1 的三維矩陣之和,如式(1)所示[4]。
其中:ar∈CI,ar∈CJ,ar∈CK,r=1,2,…,R。ο表示張量積。式(2)給出了三維矩陣低秩分解過程,三維矩陣X的秩為R,三維矩陣X可以通過一個立方體表示,本文中的數(shù)據(jù)矩陣SNe×Nf×Ng是振動信號通過小波變換得到的三維時變頻譜陣列Ne,Nf和Ng,分別表示通道數(shù)、頻率步長和數(shù)據(jù)點個數(shù),故障診斷中的平行因子模型如圖1所示。
圖1 多尺度平行因子(PARAFAC)分解模型
此模型的關(guān)鍵問題是尋找矩陣A,B和C,它們的要素是aek,bfk和cgk,每個成分k代表一個原子,相應(yīng)的向量ak={aek}、bk={bfk}和ck={cgk}是每個原子的空間信號、譜信號和時間信號,公式(2)的分解是由求解來實現(xiàn),PARAFAC 產(chǎn)生的向量ak(Ne×1)是第k個成分空間向量,向量bk(Nf×1)是頻譜的第k個成分,向量ck(Ng×1)是時間信號的第k個成分。此方法的主要優(yōu)點是頻譜分解是唯一的,且保證在最小平方差原則下取得最好的模型。
SVM 是從線性可分情況下的最優(yōu)分類面提出的[5]。假設(shè)訓(xùn)練樣本集X={(xi,yi)|i=1,…,N},xi∈Rn,yi∈(-1,1)其中xi是輸入指標(biāo),yi是輸出指標(biāo)。對于兩類分類問題,分類的目的就是尋找一個能將兩類樣本完全分開的超平面,通過非線性映射可以得到這個超平面:(ω?x)+b=0,要求其不但能正確區(qū)分樣本,且使分類間隔最大。求解最優(yōu)分類超平面可以轉(zhuǎn)化為求解下列優(yōu)化問題:
其中:ω是超平面的權(quán)值向量,b是偏置。c為懲罰因子,是影響SVM 分類性能的重要參數(shù)之一,ξi為松弛變量。引入拉格朗日函數(shù),用對偶原理把原優(yōu)化問題轉(zhuǎn)化為:
式中:αi為拉格朗日乘子,K(xi,xj)為核函數(shù),SVM常用的核函數(shù)包括線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù)、Sigmoid核函數(shù)等。本文采用具有普適性的徑向基核函數(shù)(Radial Basis Function,RBF),文獻(xiàn)[6]已證明其優(yōu)越性,其函數(shù)表達(dá)式為:
式中:g為核參數(shù),控制著高斯核的作用范圍,是影響SVM 分類性能的另一個參數(shù)。采用徑向基核函數(shù)可得到?jīng)Q策函數(shù)為:
本文采用一種改進(jìn)粒子群算法(Improved particle swarm optimization,IPSO)來優(yōu)化SVM 的超參數(shù),在式(7)、式(8)所示PSO算法的基礎(chǔ)上,通過引入新的動態(tài)慣性權(quán)重和優(yōu)化粒子速度與位置更新策略來防止算法陷入局部最優(yōu),增強(qiáng)SVM 模型泛化性能。
式中:i=1,2,…,m,d=1,2,…,n,其中m為粒子群中粒子的個數(shù),n為解向量空間的維數(shù),c1和c2為兩個正常數(shù),r1和r2為兩個獨立的、介于[0,1]之間的隨機(jī)數(shù);ωi為動量項系數(shù);pbi表示當(dāng)前粒子所經(jīng)歷的最優(yōu)位置;pg表示種群中最好粒子的位置。
對上述基本粒子群算法進(jìn)行2 個方面的改進(jìn)后,構(gòu)成本文的IPSO算法[7]。
1)提出一種IPSO算法,即在迭代中考慮種群其它粒子對于粒子尋優(yōu)的影響。則讓每個粒子的速度根據(jù)以下三個因素更新:粒子本身歷史最優(yōu)值pbi、粒子鄰域范圍內(nèi)粒子最優(yōu)值qb和種群的全局最優(yōu)值pg。
在迭代中,計算每個粒子與其它粒子間的距離,記當(dāng)前粒子m到任一粒子n之間的距離為lmn,最大距離為lmax,計算比值lmn/lmax。閾值ξ 根據(jù)迭代次數(shù)而改變,其表達(dá)式為:
其中:k為迭代的次數(shù);kmax為最大的迭代次數(shù)。當(dāng)ξ<0.9時,若lmn/lmax<ξ,則認(rèn)為粒子n在粒子m的鄰域內(nèi)。據(jù)此,引入新的學(xué)習(xí)因子c3和隨機(jī)數(shù)r3可根據(jù)以下公式來更新粒子的速度:
若ξ>0.9或若比值lmn/lmax>ξ,則按照式(7)更新粒子速度。
2)標(biāo)準(zhǔn)PSO 算法采用線性降低ωi的方式來減小搜索的步長,并使迭代逐漸收斂到極值點[7],該種方式的缺點是:算發(fā)易陷入局部最優(yōu)。為了克服上述缺點,將ωi以S形函數(shù)遞減,即ωi動態(tài)變化,剛開始進(jìn)行搜索時,ωi取值大,便于進(jìn)行全局搜索,在搜索過程接近尾聲時,ωi取值變小,有利于進(jìn)行局部搜索。IPSO算法中權(quán)重的表達(dá)式為如下:
IPSO 算法的具體步驟如下:
步驟1:設(shè)置IPSO 的相關(guān)參數(shù),如學(xué)習(xí)因子、最大迭代次數(shù)、種群規(guī)模等。
步驟2:初始化粒子個體極值位置pbi=(xi1,xi2,…,xin),對應(yīng)的極值pbf,全局極值位置pg=(xg1,xg2,…,xgn)和它對應(yīng)的全局極值pgf。
步驟3:計算所有粒子適應(yīng)度值pi。
步驟4:比較得到pbi、pbf、pg、pgf。
步驟5:更新粒子的位置,且使其在限定范圍內(nèi)。
若xij(k+1)>xmax,則xij(k+1)=xmax;
若xij(k+1) 其中:xmax、xmin分別為最大位置和最小位置。 步驟6:若達(dá)到迭代次數(shù)或截止精度,結(jié)束迭代;否則返回步驟2。 離心泵是一個非常復(fù)雜的非線性系統(tǒng)。造成離心泵故障原因多種多樣,本實驗選取離心泵葉輪常見故障包括穿孔損傷葉輪F2、外緣磨損葉輪F3和葉片磨損葉輪F4,并與正常葉輪F1進(jìn)行對比。 為了采集非線性多故障模式特征信號,建立的機(jī)械多源動態(tài)信號監(jiān)控系統(tǒng)如圖2所示。系統(tǒng)包括振動信號、聲信號和流量信號等信號源采集分析系統(tǒng),電機(jī)轉(zhuǎn)速分別為1 200 r/min、1 400 r/min、…、2 800 r/min。系統(tǒng)同步采集了流量、壓力、轉(zhuǎn)速、振動等實時信號,通過控制流程回路的流量和壓力,模擬流程工業(yè)過程機(jī)械系統(tǒng)非線性運行狀態(tài),形成非線性多故障模式,同步采集多通道信號,獲取多源信號。圖3和圖4分別表示F1和F2兩種模式下3個測點X軸方向采集到的多源信號經(jīng)PARAFAC 分解后的結(jié)果。 圖2 離心泵試驗系統(tǒng) 圖3 離心泵正常狀態(tài)F1多源信號的平行因子分析 圖4 離心泵故障狀態(tài)F2多源信號的平行因子分析 3個測點的X軸振動信號組成三維特征矩陣,經(jīng)過多尺度平行因子分解,得到通道加載因子(mode1)、頻率加載因子(mode2)、時間加載因子(mode3),且每一種加載因子中包含第一、第二和第三成分(component)。 通過實驗分析,mode2 和mode3 可以明顯表征設(shè)備正?;蚬收蠣顟B(tài),利用這一特征建立不同狀態(tài)的離心泵與其對應(yīng)的mode2 和mode3 的映射關(guān)系。同時分別提取離心泵4 種模式下mode2 和mode3 的第一、第二、第三成分共計6 個特征。根據(jù)上述方法,分別測試離心泵4種模式下的振動信號各40組,為后續(xù)SVM分類提供依據(jù)。 為了測試不同故障特征輸入SVM 分類器的分類性能,采用以下兩種特征參數(shù)作為支持向量機(jī)分類器的輸入向量,即:(1)小波包分解后的能量;(2)多源信號經(jīng)PARAFAC分解所提取的特征。SVM輸出與離心泵對應(yīng)狀態(tài)如表1所示。 表1 離心泵各狀態(tài)對應(yīng)的支持向量機(jī)輸出 根據(jù)經(jīng)驗設(shè)定SVM 的兩個超參數(shù),懲罰因子c=2,10 和核參數(shù)g=1,10 進(jìn)行實驗。以參數(shù)c=2,g=1為例,進(jìn)行離心泵故障的識別與分類。在仿真實驗中,訓(xùn)練集的樣本量為120,測試集的樣本量為40。 采集每種模式離心泵的一個測點上X軸振動信號,采樣時間10 s,共計90 000 個數(shù)據(jù)點,經(jīng)小波包降噪后,將其作為原始數(shù)據(jù)。將不同狀態(tài)下的原始數(shù)據(jù)的小波包能量作為各分類器的輸入向量。由于離心泵在不同狀態(tài)模式下各頻帶的能量不同,而小波包分解可以將信號分解為原信號在不同頻帶上的投影,因此可以提取小波包分解后不同頻率段上信號的能量作為故障特征向量。采用Daubechies6 對振動信號進(jìn)行三層小波包分解,得到第三層8 個頻帶的小波包分解系數(shù),分別重構(gòu)第三層8 個頻帶的小波包分解系數(shù)以構(gòu)成8 個新的時間序列,按頻率成分由高到低的順序排列為:c0(t),c1(t),…,c7(t),然后求各分量的總能量Ei。 以能量為元素構(gòu)造一個特征向量T: 再對特征向量進(jìn)行歸一化處理,令: 則可以得到歸一化后的特征向量: 由表2可知,基于小波包能量的SVM 測試集精度都不超過75 %。測試集樣本分類結(jié)果如圖5所示。 圖5 基于小波包能量特征的SVM測試集分類圖 表2 基于小波包能量的SVM的識別結(jié)果 經(jīng)大量仿真和實驗對比分析發(fā)現(xiàn):平行因子分析應(yīng)用于通道-時間-頻率信號時,mode2和mode3與離心泵狀態(tài)關(guān)聯(lián)度最大,利用這一特征可以建立振動信號分解后mode2和mode3與離心泵各狀態(tài)間的映射關(guān)系,通過mode2和mode3的變化進(jìn)行診斷。 為驗證經(jīng)PARAFAC 分析所提取的故障特征在SVM 分類器中的分類準(zhǔn)確率,根據(jù)第3 節(jié)實驗中所提取離心泵四種模式下mode2 和mode3 的第一、第二、第三成分共計6 個特征。其中測試離心泵四種模式下的振動信號各40組。 在仿真實驗中,訓(xùn)練集樣本量為120,測試集樣本量為40。通過對訓(xùn)練樣本進(jìn)行學(xué)習(xí),建立SVM多分類模型。其中以參數(shù)c=2,g=1 為例,進(jìn)行離心泵故障的識別與分類。測試集樣本分類結(jié)果如圖6所示。 圖6 基于PARAFAC方法的SVM測試集分類圖 由表3顯示的識別結(jié)果可知,根據(jù)經(jīng)驗設(shè)定SVM的兩個超參數(shù)進(jìn)行故障識別,訓(xùn)練集的分類精度是85.83%,測試集的分類精度是87.5%,分類精度有明顯提高。 表3 PARAFAC-SVM的識別結(jié)果 由上述不同特征的分類結(jié)果可知,以經(jīng)驗設(shè)定SVM故障診斷模型超參數(shù),故障診斷模型的分類準(zhǔn)確率沒有達(dá)到應(yīng)用級的要求。故采用IPSO 算法優(yōu)化SVM的核函數(shù),使得分類器模型達(dá)到最佳。其中IPSO 算法主要參數(shù)c1=1.5,c2=2,c3=1.5,控制系數(shù)e=8。 采用標(biāo)準(zhǔn)測試函數(shù)Ackley 函數(shù)來分析比較IPSO算法的合理性,尋優(yōu)收斂曲線如圖7所示。IPSO算法在10 次左右就基本達(dá)到全局最優(yōu),收斂速度快,且性能比較穩(wěn)定魯棒性強(qiáng)。將IPSO算法應(yīng)用于SVM分類器,測試集分類結(jié)果如圖8所示。 圖7 Ackley函數(shù)尋優(yōu) 圖8 基于SVM分類模型分類結(jié)果 利用BP 網(wǎng)絡(luò)對比驗證IPSO-SVM 模型的有效性,BP 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為6-5-4。其中設(shè)置最大迭代次數(shù)為100,學(xué)習(xí)率為0.01,訓(xùn)練的目標(biāo)為0.001。其中,訓(xùn)練集樣本量為120,測試集樣本量為40。測試集分類結(jié)果如圖9所示。 由圖8和圖9可知,本文建立的IPSO-SVM分類模型的分類精度高于BP神經(jīng)網(wǎng)絡(luò),能滿足應(yīng)用級的需求,且該模型在有效地提升故障診斷準(zhǔn)確率的同時還具有較好的穩(wěn)定性。 圖9 基于BP神經(jīng)網(wǎng)絡(luò)模型分類結(jié)果 不同類型分類器的診斷結(jié)果如表4所示。 表4 5種分類器的故障診斷結(jié)果 結(jié)果表明故障特征的選擇和提取對診斷結(jié)果影響很大,正確選擇特征參數(shù)可以有效提高故障診斷的精度。基于PARAFAC 方法的PSO-SVM 分類器的準(zhǔn)確率為92.5%,而IPSO-SVM 分類器的準(zhǔn)確率為97.5%,利用BP 神經(jīng)網(wǎng)絡(luò)再一次對比驗證了IPSO-SVM 模型的有效性??芍狿ARAFAC 方法在多源信號故障特征提取時的優(yōu)良性能。 如表4所示,將分類器2 分別與分類器1 和3 對比可知,基于PARAFAC 分析的故障特征提取方法應(yīng)用于SVM分類器時取得了良好的效果。分類器5與分類器2相比,測試集精度提高了10%。 本文提出了一種基于PARAFAC 的故障特征提取方法,利用其在多源振動信號分解中的優(yōu)良性能,將其應(yīng)用于離心泵的故障診斷中,并與IPSO-SVM故障診斷模型相結(jié)合,取得了良好的診斷效果,與傳統(tǒng)的時域或時頻特征提取方法相比,有效提高了故障診斷精度,縮短了診斷時間,且復(fù)雜度并沒有明顯增加。3 實驗系統(tǒng)
4 PARAFAC-SVM 在故障診斷中的應(yīng)用
4.1 基于小波包能量特征提取的故障診斷
4.2 基于PARAFAC的故障特征提取及其故障診斷
4.3 不同特征參數(shù)的SVM分類結(jié)果比較
5 結(jié)語