張炎亮,齊聰,程燕培
(鄭州大學管理工程學院,河南鄭州 450001)
隨著工業(yè)4.0時代的到來,我國的制造業(yè)也在不斷向高質量發(fā)展邁進。對于制造企業(yè)來說,產品質量的好壞很大程度上取決于生產流程能否順利進行。而旋轉機械作為生產制造設備的主力軍,其故障的發(fā)生往往導致整條生產線無法正常運作,給生產帶來不可逆的負面影響。轉子、軸承和齒輪箱作為旋轉機械的重要組成部分,也常常是該類機械故障的主要來源。特別是轉子作為電機和旋轉式機械的旋轉部分,發(fā)生故障的頻率相對更高一些。因此,對轉子的故障診斷進行研究是很必要的。
旋轉機械的故障診斷問題一直是相關領域的研究焦點,主要集中于對故障特征提取與故障診斷的研究。就故障特征提取而言,信號特征提取方式可歸結為時域統(tǒng)計特征提取、頻域特征提取和時頻域特征提取。在上述3種提取方式中,時域與頻域特征提取由于局限性明顯,廣泛應用的是針對時頻域特征的提取。現有的時頻域特征提取方法很多,最常見為經驗模態(tài)分解(Empirical Mode Decomposition,EMD)、變分模態(tài)分解(Variational Mode Decomposition,VMD)、小波變換、小波包分解等。THAMBA等借助于經驗模態(tài)分解和Hilbert-Huang變換(HHT)對軸承故障狀態(tài)進行特征提取。陳東寧等將變分模態(tài)分解與排列熵結合對滾動軸承振動信號進行特征提取。DHAMANDE和CHAUDHARI采用連續(xù)小波變換和離散小波變換從振動信號中提取齒輪和軸承的復合故障特征。郭偉超等將提取的小波包能量譜作為故障特征向量對滾動軸承進行故障診斷。小波變換和小波包分解需要人為選定基函數,VMD需要調整模態(tài)分量數量以及懲罰參數,這些相關函數和參數的主觀選擇會對結果產生很大的影響。而在使用EMD對信號進行分解的過程中,不需要人為設定任何函數和參數,依照數據本身所具有的時間尺度特征就可以對信號進行分解。除此之外,它在理論上能夠分解所有類型的信號,尤其適用于非平穩(wěn)、非線性信號的分解過程,因而被廣泛應用于很多領域。
在故障診斷方面,現有故障模式識別的分類算法眾多。其中,人工神經網絡、決策樹分類法、支持向量機、樸素貝葉斯分類法較為常見。隨著人工智能的發(fā)展以及大數據時代的到來,人工神經網絡因具有較強的自學習能力和適應性,得到了廣泛的應用。相比于其他的人工神經網絡算法,BP神經網絡的使用范圍最廣,但它有一個無法避免的缺點,即容易落入局部極值。相關學者針對這一問題進行了研究,徐玲等人采用PSO優(yōu)化BP神經網絡模型對冷水機組進行故障診斷研究;姜春英等利用改進的PSO-BP算法對尺寸超差進行故障診斷;李浩然和陸金桂借助PSO-BP神經網絡對紅外鎖相缺陷進行屬性識別,均取得了很好的效果。因此,采用PSO算法對BP神經網絡進行優(yōu)化,可以很好地解決BP神經網絡容易陷入局部最小值的問題。
綜上所述,本文作者通過計算EMD分解后的各IMF分量與原始信號的相關系數的方式篩選出有效的IMF分量,并計算出各有效IMF分量的能量以及信號的能量熵,并將它們相結合,結合構成用于故障模式識別的特征向量;采用改進的粒子群算法(Discrete Particle Swarm Optimization Algorithm,DPSO)優(yōu)化BP神經網絡的權值和閾值,構建DPSO-BP模型,對機械轉子進行故障診斷;采用上述方法進行案例仿真,證實所提方法的可行性。
經驗模態(tài)分解是由黃鍔提出的一種用來處理非平穩(wěn)信號特征的方法,黃鍔認為所有信號歸根到底都能被分解為一系列的固有模態(tài)函數(Intrinsic Mode Function, IMF)。EMD的最大特點是能自適應地對信號進行主要成分分析,不需要事先選取或強制給定函數和參數,而是以借助信號自身特征的方式使信號自適應地進行分解。此外,采用該方法分解出來的各IMF分量不僅包含了原始信號在不同時間尺度上的局部特征信號,且各IMF分量的順序是從高頻到低頻排列的。原始信號()借助EMD可分解為一系列IMF分量和線性疊加的剩余部分。即:
(1)
其中:()為各個IMF分量;()為一個單調序列或者一個常數序列。
對各IMF分量的能量進行計算:
(2)
計算出IMF分量的能量熵:
(3)
其中:=,是第個IMF分量的能量在總能量中所占的比值。
IMF分量依照是否能夠反映原始信號特征可分為兩類:真實的IMF分量和虛假的IMF分量。一個IMF分量應該歸屬于哪一類別可以借助該分量與原始信號之間的相關系數進行判斷。
相關系數的計算公式為
(4)
以EMD的方式分解轉子的振動信號,并將4種轉子狀態(tài)下的有效IMF分量所包含的能量與IMF分量的總的能量熵結合,構建故障特征數據集。
傳統(tǒng)的BP神經網絡雖然有很好的自學習能力,但由于其初始權值和閾值是通過隨機賦值的方法進行確定,這在很大程度上影響了模型的收斂速度與訓練時長,使得它在取得局部極值時停頓時間較長。而粒子群算法(Particle Swarm Optimization, PSO)可通過給定確切的初始權值和閾值的方式對它進行改進,從而使其訓練精度得以提高。
BP(Back Propagation)神經網絡是一種多層前饋網絡,主要通過誤差反向傳播算法對模型進行訓練,目前已經廣泛應用于眾多領域。它不需要具體的數學方程式或者函數表達式,依靠自身的不斷訓練建立輸入以及輸出之間的內在關系,并將這種關系存儲起來,對后續(xù)數值進行運算。BP神經網絡包括輸入層、中間層以及輸出層。信號的前向傳播和誤差的反向傳播是該網絡的主要特點。
在應用神經網絡模型時,一般采用3層神經網絡,輸入層和輸出層的節(jié)點個數可以依照采用的數據集確定,中間層的節(jié)點個數則需要進行試算,以選出使得網絡模型訓練結果最優(yōu)的中間層節(jié)點個數。中間層節(jié)點個數的經驗公式為
(5)
其中:為輸入層節(jié)點個數;為輸出層節(jié)點個數;為1~10之間的調節(jié)常數。
粒子群算法是通過觀察鳥類捕食行為進行研究而誕生的一種常用的優(yōu)化算法。該算法初期是從鳥類群體性活動的一般規(guī)律中獲得靈感,然后通過對群體智能進行研究,將其抽象化而建立的一個簡化模型。粒子群算法主要是通過觀察和分析動物的集群活動,從而利用群體中單個個體之間的信息共享,使整個群體能夠快速地對求解區(qū)域進行探測,以鎖定最優(yōu)解的大概位置,進而找到最優(yōu)解。在尋找最優(yōu)解的迭代過程中,每進行一次迭代,每個粒子都依據個體極值與全局極值更新自己的空間位置和速度。具體的更新方式如下:
(+1)=()+()[()-()]+
()[g()-()]
(6)
(+1)=()+(+1)
(7)
其中:為第個粒子;為第維空間;為第維空間的第個粒子的速度;為迭代次數;為個體最優(yōu)粒子;g為全局最優(yōu)粒子;和為學習因子,絕大多數情況下,二者相等;和在 [0,1] 區(qū)間內隨機取值,以增加粒子飛行的不確定性;為慣性權重,其取值區(qū)間一般為 [08,12]。
傳統(tǒng)的PSO算法雖然擁有較強的搜索能力,但由于其慣性權重是恒定不變的,所以在面對一些復雜問題時往往容易陷入局部最優(yōu)解。因而在尋找最優(yōu)解的過程中,在對全局進行搜索時,需要一個較大的權重;而在對局部進行搜索時,又需要一個較小的權重。為更好地平衡算法的整體搜索能力以及局部搜索能力,SHI提出了線性遞減權重策略,其表達式為
(8)
其中:、分別為最大慣性權重和最小慣性權重,大多數情況,前者為0.9,后者為0.4;表示當前迭代次數;表示最大迭代次數。
從公式(8)中可以看出,剛開始的值比較大,在附近,隨著迭代次數的增加,的值逐漸減小,減小到附近。因而DPSO算法能夠對不同的區(qū)域進行有效搜索,具有比傳統(tǒng)粒子群算法更快的收斂速度。
采用DPSO算法對BP神經網絡進行優(yōu)化時,首先將神經網絡的初始權值和閾值轉化為粒子群的維度,然后將累計誤差平方和最小作為粒子群尋找的最優(yōu)解,最后將粒子群算法的搜索結果代入到BP神經網絡中。DPSO-BP神經網絡模型的具體構建步驟如圖1所示。
圖1 DPSO-BP神經網絡模型的算法流程
文中采用武漢大學液壓機械瞬態(tài)教育部重點實驗室的相關數據。采集信號時,設置采樣頻率為2 048 Hz,采樣時長為1 s。這些數據都是經過小波閾值去噪法處理過的去噪信號。該數據集包括180組數據,其中,4種不同轉子狀態(tài)(正常、接觸碰摩、不平衡、不對中)下的數據各45組。在機械轉子每種狀態(tài)下,選取36組數據用于模型的訓練,9組用于測試,以檢驗模型的訓練效果。由于選取的數據集較小,故設置神經網絡的輸出節(jié)點為1,將轉子4種狀態(tài)的標簽依次設置為1、2、3、4。具體類別標簽如表1所示。
表1 轉子的4種狀態(tài)的數據及標簽
采用EMD對振動信號進行分解,在轉子4種狀態(tài)下,各隨機選取1組數據進行經驗模態(tài)分解,結果如圖2—圖5所示。
圖2 正常狀態(tài)下的EMD分解結果
圖3 接觸摩擦狀態(tài)下的EMD分解結果
圖4 不平衡狀態(tài)下的EMD分解結果
圖5 未對準下的EMD分解結果
由圖2—圖5可知:經過經驗模態(tài)分解,除去殘余項之后,4種轉子狀態(tài)下的振動信號可分解得到的IMF分量個數依次為 6、6、5、8。對每種狀態(tài)下的各IMF分量的相關系數進行計算,為便于比較,只列出前5個IMF分量的相關系數(保留4位小數),如表2所示。
表2 前5個IMF分量的相關系數Q
若IMF分量的相關系數較小,||<0.01 ,基本上可以判定該IMF分量為虛假的IMF分量。由表2可知:正常狀態(tài)下的IMF5與原信號的相關系數為0.002 0,小于0.01。故文中選取前4個IMF分量以及信號的能量熵作為特征向量,進行故障模式識別。
(1)神經網絡參數
由于選取的特征向量是信號的能量熵以及前4個IMF分量的能量,故BP神經網絡的輸入節(jié)點為5,又BP神經網絡的輸出節(jié)點為1,故BP神經網絡的拓撲結構如圖6所示。
圖6 BP神經網絡拓撲結構
由式(5)可得,神經網絡的中間層節(jié)點個數可在3~12之間進行取值。利用試算法發(fā)現中間層節(jié)點個數為4時,BP神經網絡的故障診斷正確率最高,故選取中間層節(jié)點個數為4。分別選定logsig、purelin函數作為中間層與輸出層的激活,采用最速下降法對網絡進行訓練。將迭代次數設置為1 000次,訓練誤差目標設置為0.001,初始權重和閾值設定為[-1,1]內的隨機數。
(2)PSO參數
設置種群規(guī)模大小為100,學習因子和都為1.5。由于神經網絡的初始權值和閾值為[-1,1]內的隨機數,故設置粒子群位置的取值范圍也為 [-1,1]。粒子維度可根據神經網絡的拓撲結構確定,計算公式為
=(+1)+(+1)
(9)
由計算可得,粒子維度為29。為便于與神經網絡進行對比,設置粒子群算法的最大迭代次數為1 000次,并選取累計誤差作為其適應度函數。對于傳統(tǒng)的PSO算法,通過仿真實驗發(fā)現,=0.9時,模型的訓練結果最優(yōu),故設置=0.9。對于動態(tài)權重的PSO算法,設置=0.9,=0.4。
驗證模型的有效性,分別采用BP神經網絡模型、PSO-BP神經網絡模型以及DPSO-BP神經網絡模型對轉子狀態(tài)特征向量數據集進行分類測試,并對結果進行對比分析。
為使模型能夠更好地訓練,首先對特征向量進行歸一化處理,然后將處理后的144組訓練樣本代入建立好的BP神經網絡模型中進行訓練。選取累計誤差作為衡量網絡模型性能的指標,3種模型的累計誤差迭代曲線如圖7—圖9所示。
圖7 BP神經網絡的累計誤差迭代曲線
由圖7—圖9可知:3種模型的迭代次數依次減少,累積誤差也逐漸減小。其中:DPSO-BP模型的收斂速度最快;BP神經網絡前期收斂速度較快,但它在迭代了200次之后,特別容易陷入局部最小值,在迭代了200次之后,每經過100多次迭代,累計誤差會再次減少,但減少幅度較小,在迭代754次之后,累計誤差穩(wěn)定在30.5;PSO-BP神經網絡模型在迭代392次之后,累計誤差穩(wěn)定在8.35;DPSO-BP神經網絡模型在迭代278次之后,累計誤差穩(wěn)定在6.38。相比于BP神經網絡,DPSO-BP神經網絡的迭代次數減少了476次,大約為BP神經網絡的63.13%;累積誤差減少了24.12,大約為BP神經網絡的79.08%。
圖8 PSO-BP神經網絡的累積誤差迭代曲線 圖9 DPSO-BP神經網絡的累積誤差迭代曲線
將測試集的數據代入上述3種訓練好的模型進行故障診斷,結果如表3所示。
表3 3種模型的故障診斷結果
由表3可知:BP神經網絡的平均正確率為86.11%,PSO-BP神經網絡的平均正確率為91.6%,DPSO-BP神經網絡的平均正確率為94.44%,且DPSO-BP神經網絡模型對轉子接觸摩擦故障以及不平衡故障的診斷正確率高達100%。由此可知,DPSO-BP神經網絡模型的診斷結果是3種模型中最優(yōu)的。
利用經驗模態(tài)分解對原始信號進行時頻域特征提取,將經驗模態(tài)分解后的有效IMF分量的能量以及信號的能量熵作為特征向量。在轉子故障模式識別階段,分別采用傳統(tǒng)的BP神經網絡模型、PSO-BP神經網絡模型以及DPSO-BP神經網絡模型3種方法對轉子進行故障診斷。結果表明:經過粒子群優(yōu)化的BP神經網絡模型可顯著減少模型的迭代次數、縮短訓練時間,同時累計誤差更小、模型的精確度更高,故障診斷的準確率也更高。此外,相比于傳統(tǒng)的粒子群優(yōu)化的BP神經網絡,經過動態(tài)權重優(yōu)化的BP神經網絡效果更好,實驗結果也驗證了該方法的有效性。