陳國成,張 建,菅光雷
(山東里能魯西礦業(yè)有限公司,山東 濟寧272000)
軸承故障診斷是航空航天、工程機械和軌道交通等眾多領(lǐng)域的研究熱點之一。軸承故障往往會對機械設備的健康狀態(tài)產(chǎn)生直接影響,如果故障不能被及時檢測出來,很容易使整個機械系統(tǒng)崩潰并造成財產(chǎn)損失,甚至產(chǎn)生人員傷亡。由于當今高端裝備機械各種工況干擾和結(jié)構(gòu)的復雜性,對其進行有效的機器健康監(jiān)測研究具有非常大的挑戰(zhàn)性[1]。同時,在機械設備長時間運行后,會收集大量的實時監(jiān)測數(shù)據(jù),使機器健康監(jiān)測領(lǐng)域進入了機械大數(shù)據(jù)時代[2]。
深度學習試圖通過建立深度神經(jīng)網(wǎng)絡(Deep neural network,DNN)結(jié)構(gòu),經(jīng)疊加多層信息處理模塊,對大規(guī)模數(shù)據(jù)的高層表示進行建模,并預測模式[2]。近年來,深度學習受到了計算機視覺[3]、語音處理[4]、人臉識別[5]等各個領(lǐng)域研究人員的廣泛關(guān)注。與淺層機器學習方法相比,深度學習從直觀上看似乎是一種從輸入數(shù)據(jù)到輸出數(shù)據(jù)的轉(zhuǎn)換。因此,下一層網(wǎng)絡能學習上一層數(shù)據(jù)新的表示,多層網(wǎng)絡疊加的框架能從輸入數(shù)據(jù)中提取到更具魯棒性的特征[6]。近年來,許多研究者成功地將DNN 應用于機械健康監(jiān)測中。雷亞國等[7]構(gòu)建了基于頻域特征提取的5 層堆疊自動編碼器(Stacked Autoencoders,SAE)DNN,用于旋轉(zhuǎn)機械故障診斷。王金瑞等[8]提出了批量標準化的DNN,實現(xiàn)了機械信號特征的快速提取與精確診斷。羅金等[9]提出了通過集成經(jīng)驗模態(tài)分解對軸承信號進行處理,再輸入SAE 實現(xiàn)故障診斷的方法。Lu等[10]研究了一種多層去噪自編碼器的DNN方法,用于包含環(huán)境噪聲和交叉工況信號的故障診斷。
通過文獻綜述可以看出,DNN作為一種深度學習算法在機械健康監(jiān)測方面尤為有效。本文利用基于SAE和Softmax回歸[11]的DNN方法實現(xiàn)軸承的智能故障診斷。采用機械信號的頻譜數(shù)據(jù)為SAE 的輸入,隨后采用Softmax 回歸作為DNN 的最后一層實現(xiàn)軸承故障類型的分類。使用頻譜的主要原因是頻譜能夠反映出離散頻率下信號的本構(gòu)分量分布,并且更加清晰地反映旋轉(zhuǎn)機械的狀態(tài)信息[7]。此外,為防止模型在測試過程中產(chǎn)生過擬合現(xiàn)象,選用L1正則化來約束SAE的學習能力。
本文組織如下:第1 節(jié)簡要介紹堆疊式自動編碼器和Softmax 回歸算法。第2 節(jié)詳細介紹所提方法的內(nèi)容。第3 節(jié)以軸承故障數(shù)據(jù)集開展實驗,驗證了提方法的準確性。并與其他方法比較,說明所提方法的優(yōu)越性。最后,在第4節(jié)中得出結(jié)論。
SAE 網(wǎng)絡是AE 的堆疊結(jié)構(gòu),AE 屬于無監(jiān)督學習的機器學習框架,由輸入層、隱含層和輸出層組成,結(jié)構(gòu)如圖1所示。Bengio 等[12]曾將其作為DNN的通用成分進行研究。AE 訓練的過程包括兩個部分:編碼和解碼。編碼用于將輸入數(shù)據(jù)映射為隱藏表示,解碼用于根據(jù)隱藏表示重建輸入數(shù)據(jù)。其中,xn為輸入數(shù)據(jù)集,hm表示由其中計算出的隱層編碼器向量,rn為輸出層的解碼器向量。W1和W2表示相鄰層間的權(quán)重矩陣。編碼過程如下:
圖1 自動編碼器
其中:fθ表示編碼函數(shù)。b1表示編碼的偏置向量。
解碼過程如下:
其中:gθ表示解碼函數(shù),b2表示解碼的偏置向量。
隨后對自動編碼器的參數(shù)集進行優(yōu)化,使重構(gòu)誤差最小化:
其中:L表示損失函數(shù),L(x,r)= ‖x-r‖2。
雖然自動編碼器能夠?qū)崿F(xiàn)特征自動提取,但是其在測試過程中容易出現(xiàn)過擬合。為此,本文對自動編碼器增加正則化策略,以此增強其的泛化能力,改善模型在測試集上的表現(xiàn)。
L1正則化[13]是指權(quán)值向量w中各個元素的絕對值之和,L1正則化可以利用其特征選擇能力產(chǎn)生較稀疏的解而僅需求解一個凸優(yōu)化問題,與拉普拉斯先驗是一致的,可以產(chǎn)生稀疏權(quán)值矩陣,即產(chǎn)生一個稀疏模型用于特征選擇。通過向目標函數(shù)增加額外項來對參數(shù)值進行軟約束,即:
在此L1正則化除了可以約束數(shù)量級外,還能使提取的特征更加稀疏,稀疏化的結(jié)果使優(yōu)化后的學習特征一部分為0,另一部分為非零實值。非零實值的那部分學習特征可起到選擇重要參數(shù)或特征維度的作用,同時可起到去除噪聲的效果。
DNN的預訓練是用無監(jiān)督分層學習算法將n個AE堆疊成n個神經(jīng)網(wǎng)絡層,然后用有監(jiān)督的方法進行微調(diào)。把前一層網(wǎng)絡提取的特征當成下一層網(wǎng)絡的輸入,然后再循環(huán)重復此過程到整個網(wǎng)絡訓練結(jié)束,如圖2所示。因此,基于SAE 建立的DNN 方法可分為以下四個步驟:
圖2 基于SAE的DNN
(1)通過輸入數(shù)據(jù)集訓練AE,得到學習的特征向量{h1,h2,…,hm};
(2)采用{}h1,h2,…,hm作為下一個AE 的輸入,并通過分層訓練的形式到最后一個隱藏層;
(3)采用Softmax 作為網(wǎng)絡最后一層的分類器,對軸承的故障類型進行分類;
(4)在對所有隱層進行訓練后,利用反向傳播算法最小化代價函數(shù)并更新權(quán)值,實現(xiàn)DNN的參數(shù)微調(diào)。
Softmax回歸是在Logistic回歸的基礎上對多分類[14]的延伸。模型的結(jié)構(gòu)如圖3所示。它是一種監(jiān)督學習算法,不僅需要輸入數(shù)據(jù),還需要模型對應的標簽集。
圖3 Softmax回歸
給出一個訓練集{(x1,y1),…,(xm,ym)}包含m個樣本,其中xi∈?N×1及其標簽集yi∈{1,2,…,k}。p(yi=j|x)表示每個xi的概率。假設函數(shù)是對每個類別p(yi=j|x)的概率進行估計。最后得出輸出hθ(xi)的k維向量:
其中:θ1,θ2,…,θk表示模型參數(shù)。將分布歸一化,以確保p(yi=j|x)總和等于1。
為方便起見,1{?}表示指示函數(shù)。例如1{true}=1,1{false}=0。所以,Softmax的成本函數(shù)如下:
其中:m表示訓練樣本個數(shù),k表示類別個數(shù),λ為權(quán)重衰減項,用于懲罰值較大的參數(shù),并經(jīng)全局優(yōu)化得到更高準確率。
在這節(jié)中詳細描述機械信號的自動特征提取方法,提出方法的流程圖如圖4所示。
圖4 所提方法框架
具體步驟如下所述:
(1)采用原始振動信號的頻譜作為訓練樣本,并組成訓練樣本集{xi,li}M i=1,其中M是樣本個數(shù),xj∈?Nin×1是第i個樣本包含Nin個數(shù)據(jù)點,li是樣本xi的標簽。
(2)將樣本集組成一個矩陣形式T∈Nin×M,然后將其輸入到DNN模型中進行訓練,通過最小化目標函數(shù)以獲得權(quán)重矩陣W。
(3)學習特征f i∈?Nout×1通過W由xi計算并經(jīng)激活函數(shù)映射而得。
實驗采用一個特殊設計的軸承故障植入試驗臺進行振動信號采集[15],試驗臺結(jié)構(gòu)如圖5所示。實驗設備主要包括:電動機、聯(lián)軸器、轉(zhuǎn)盤、軸承座、齒輪箱和制動器等。電機轉(zhuǎn)速為1 500 r/min,在軸承座表面安裝三向振動加速度傳感器,采樣頻率設置為12.8 kHz。共設計5種不同的軸承健康狀況:正常狀況、內(nèi)圈故障、外圈故障、滾柱故障、外圈與滾柱復合故障,如圖6所示。每個樣本取2 400 個數(shù)據(jù)點,每種健康狀況采集200 個樣本,總共1 000 個樣本數(shù)。然后采用快速傅里葉變換將時域信號轉(zhuǎn)換為頻譜,每個樣本得到1 200 個傅里葉系數(shù)。軸承各類型故障信號細節(jié)如圖7所示。可以看出無論從時域還是頻域都很難區(qū)分出不同的故障類型。尤其是正常與內(nèi)圈故障、滾柱與復合故障之間,幾乎看不出較為明顯的區(qū)別特征。另外大量的樣本需要區(qū)分,導致手動特征提取的困難。
圖5 軸承故障植入試驗臺
圖6 軸承故障類型
圖7 軸承故障信號特征
在本節(jié)中,使用提出方法來處理軸承故障植入試驗臺測得的5 種軸承健康狀態(tài)數(shù)據(jù)。首先,隨機選取每種健康狀況下50%的樣本來訓練基于SAE建立的DNN 模型。參考文獻[16]中的網(wǎng)絡設置,模型第一層的輸入維數(shù)即為頻譜的傅里葉系數(shù)維數(shù)1 200,隨后每個SAE隱層通過降維的原則設置神經(jīng)元個數(shù),依次為600、200、100。輸出維度為Softmax分類器設定的類別數(shù)5。L1正則化參數(shù)為1×10-5,學習率為1×10-3,動量為0.05,激活函數(shù)選用Sigmoid函數(shù),網(wǎng)絡每層的迭代步數(shù)設為100。
為了顯示所提方法的優(yōu)越性,采用文獻[16]中建立的DNN模型進行對比,該方法同樣采用SAE建立DNN 模型,并且網(wǎng)絡結(jié)構(gòu)和參數(shù)保持一致,不同點為此方法未對SAE添加L1正則化,以此對比所提的網(wǎng)絡正則化方法對模型測試的有效性。同時,為了消除隨機性給實驗結(jié)果帶來的誤差影響,對兩種方法分別進行15次試驗,得到每次試驗的測試準確率如圖8所示。
圖8 測試準確率對比圖
可以很清晰地看出,每次試驗中所提方法的測試準確率均明顯優(yōu)于對比方法,并且所提方法的準確率波動情況也小于對比方法,故可得所提方法的穩(wěn)定性也較高。通過計算得出兩個方法的平均測試準確率為98.93%和92.64%,可以看出所提方法高于對比方法6個百分點。
圖9為第15次試驗中兩種方法的訓練誤差迭代曲線。可以看出,對比方法在初始階段誤差就較大,在迭代過程中訓練誤差出現(xiàn)輕微波動,且未收斂到0值附近。而提出方法的誤差曲線從初始位置就在較低的0.55開始很平穩(wěn)的進行收斂,并且在80步左右便收斂到了0值附近。由此可以看出所提方法能夠更快地訓練到網(wǎng)絡最優(yōu)實現(xiàn)收斂。
圖9 網(wǎng)絡迭代對比圖
為更直觀地展示所提方法的有效性,采用t-SNE[17]對經(jīng)兩種方法學習的高維特征向量做降維處理進行可視化研究。在此,將通過SAE 隱層提取的所有軸承健康狀況100 維的特征向量經(jīng)t-SNE 降維成二維向量,并采用二維散點圖的形式展示在同一平面內(nèi),以觀察兩個方法對軸承樣本的分類效果。取第15次試驗得到的降維結(jié)果如圖10所示。
從圖10(a)可以看出所提方法能夠把不同軸承健康狀況類型的樣本完美地分開,相同軸承健康狀況類型的樣本都聚集在了一起。同時,各個軸承健康狀況類型間的距離都足夠大到可以區(qū)分不同的類型模式。相比之下,圖10(b)展示的對比方法的降維結(jié)果相對較差,僅把正常和內(nèi)圈故障軸承樣本完好地區(qū)分開,而外圈、滾柱和復合故障的軸承樣本均產(chǎn)生明顯的混疊現(xiàn)象,且有多個樣本沒有聚集到相應的類型樣本群中。
圖10 降維結(jié)果對比圖
通過以上對比分析可以看出,所提方法無論是在測試準確率和降維表現(xiàn)上均明顯優(yōu)于對比方法,由此顯示出所提方法在處理軸承故障診斷問題上的有效性。
本文提出了一種基于疊加自動編碼器的深度神經(jīng)網(wǎng)絡構(gòu)建方法,并成功地應用在軸承的智能故障診斷研究中,得到如下結(jié)論:
(1)將多個自動編碼器經(jīng)逐層疊加能夠建立深度神經(jīng)網(wǎng)絡,實現(xiàn)對軸承頻譜信號的逐層特征提取和分類。
(2)采用L1正則化可以約束深度神經(jīng)網(wǎng)絡的學習能力,減少網(wǎng)絡的過擬合問題,提高模型的測試準確率。
(3)通過一組軸承故障實驗數(shù)據(jù)驗證,所提方法在測試準確率、訓練迭代和降維表現(xiàn)上均明顯優(yōu)于對比方法,說明了所提方法的有效性。