盧占標,黃細霞,姬 克,鮑佳松
(上海海事大學 航運技術與控制工程交通行業(yè)重點實驗室,上海201306)
在現(xiàn)代工業(yè)中旋轉(zhuǎn)機械的健康狀況監(jiān)測和故障診斷具有重要意義[1]。如變速箱,其在機械傳動系統(tǒng)中起著至關重要的作用。齒輪箱的任何故障都可能導致不必要的停機、昂貴的維修,甚至造成人員傷亡。齒輪箱故障多樣,如裂齒、齒面磨損、齒面剝落、齒面變形等故障,早期故障對旋轉(zhuǎn)機械的穩(wěn)定性影響較小,處理簡單。由于早期故障的特征不太明顯[2],很容易被背景噪聲所覆蓋,利用傳統(tǒng)方法依靠工程師或?qū)<业慕?jīng)驗,通過手工提取特征來分析故障是不現(xiàn)實的。如建立支持向量機(support vector machine,SVM)[3,4]模型分類預測。近年來,深度學習模式識別領域的最新研究成果,由于其強大的建模和表征能力,已在機電設備故障診斷領域得到應用,其可以從原始數(shù)據(jù)中自動學習具有代表性的特征和復雜的非線性關系[5]。多通道稀疏矩陣卷積神經(jīng)網(wǎng)絡用于檢測當中[6],以及使用卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)模型對軸承和齒輪箱故障診斷做研究[7~9]。
本文通過分析來自多個傳感器不同方向、位置測得原始數(shù)據(jù)之間存在特征關系提出了一種多通道輸入連續(xù)CNN-SVM早期故障診斷模型。
CNN是一類包含卷積計算且具有深度結構的前饋神經(jīng)網(wǎng)絡。傳統(tǒng)的CNN[10]由三種類型的層構成:卷積層、子采樣層(池化層)和全連接層。
1)卷積層:將輸入與卷積核進行卷積計算,其輸入為前一層的輸出,卷積運算的結果通過激活函數(shù)得到輸出。近年來,整流線性單元(Relu)由于其計算量小、訓練速度快等特點,被廣泛用作激活函數(shù)。卷積層的數(shù)學模型可以用以下方程來描述
(1)
式中 *為卷積運算;l為網(wǎng)絡的第l層;k為卷積核,為二維矩陣;f為一個非線性激活函數(shù);b為偏置。
2)池化層:在卷積層之后連接的就是下采樣層(池化層)。池化層不會改變輸入矩陣的深度,但可以縮小矩陣的大小。通過池化層,可以減小后面全連接層中的節(jié)點個數(shù),從而減少了整個神經(jīng)網(wǎng)絡中的參數(shù)數(shù)量。池化層可通過以下方程式進行數(shù)學描述
(2)
式中 down()為子采樣函數(shù)。
3)全連接層:是一種傳統(tǒng)的前饋神經(jīng)網(wǎng)絡,采用SoftMax函數(shù)作為激活函數(shù)輸出。全連接層的每一個神經(jīng)元都與上一層的所有神經(jīng)元相連,把前邊提取到的特征綜合起來進行分類。SoftMax函數(shù)在多分類過程中,將多個神經(jīng)元的輸出,映射到(0,1)區(qū)間內(nèi),從而來進行多分類。SoftMax函數(shù)定義如下
(3)
(4)
SVM是一種經(jīng)典的二分類模型。本文提出的CNN-SVM方法主要采用非線性SVM作為后端多分類器。通常,旋轉(zhuǎn)機械故障數(shù)據(jù)是線性不可分的。假設訓練數(shù)據(jù)是Z={(x1,y1),…,(xi,yi),…,(xn,yn)},xi∈Rn,yi∈{-1,+1},其中,xi為第i個輸入特征向量,yi為xi的類別標簽,通過引入松弛變量ξi,將線性不可分問題可以描述未一個軟區(qū)間最大化問題
s.t.yi(wi·xi-b)≥1-ξi,?(xi,yi)∈Z
ξi≥0,i=1,2,…,N
(5)
式中w,b為優(yōu)化參數(shù);ξi為松弛變量;C為懲罰因子。
以上只適用樣本嚴格線性可分的情況。在非線性情況下,SVM通過適合的核函數(shù)將樣本映射到高維空間,使樣本集在高維空間中線性可分。本文CNN-SVM模型使用高斯徑向基函數(shù)作為模型的核函數(shù)。徑向基函數(shù)定義為
(6)
最終模型的分類決策函數(shù)為
(7)
以上模型只能將樣本分為兩類,而在處理多分類問題時,需要構造合適的多分類器。而本文構造的SVM多分類模型為一對一。其原理是在l類訓練樣本中構造所有可能的兩類分類器,每個分類器僅在l類中的兩類訓練樣本上訓練,故共構造N=l(l-1)/2個分類器,對N個分類器的結果進行投票,如果某個二分類器的輸出結果為i類,則i類得票數(shù)加1,如果輸出結果為j類,則j類得票數(shù)加1,最后統(tǒng)計得票最多的類別,分類的結果就是該類別。
CNN具有局部感知域、權重共享和池化的特點,大大降低了網(wǎng)絡復雜度和過擬合風險。本文利用CNN強大的特征提取能力,將其應用到行星齒輪箱的故障診斷。特征提取過程中采用連續(xù)卷積減少可學習參數(shù),通過Relu激活函數(shù)防止梯度消失,收斂快。從全連接層提取特征作為SVM的輸入,訓練模型。最后把測試集輸入模型分類,通過測試準確率來檢驗模型效果。模型結構如圖1所示,完成檢驗步驟如下:1)將來自多個傳感器不同方向、位置測得原始數(shù)據(jù),將取部分原始數(shù)據(jù)樣本為多通道二維圖像輸入到改進的CNN模型中進行預訓練,完成訓練,保存CNN模型參數(shù)。2)利用訓練好的CNN模型作為特征提取工具,從新的故障原始數(shù)據(jù)中提取具有代表性的特征。3)將全連接層提取的稀疏代表性特征向量輸入到支持向量機分類。4)保存訓練好的模型,用于現(xiàn)場檢測。
圖1 多維輸入CNN-SVM故障診斷流程圖
數(shù)據(jù)來源于東南大學小組從傳動系動態(tài)模擬器(DDS)采集,本文采用負載設置為20_0數(shù)據(jù),包括4類故障數(shù)據(jù)和1類健康數(shù)據(jù)。每類數(shù)據(jù)都是由8個信號源組成。為了充分利用數(shù)據(jù)的信息,本文把8只傳感器得到的原始數(shù)據(jù)全部用來分析,將數(shù)據(jù)重構,每類故障類型1 024個樣本,其中預訓練樣本256個,訓練測試樣本768個,每個樣本8 192個數(shù)據(jù)點。
將原始一維時間序列振動信號,重構成二維特征圖,將其進行圖像增強操作。每個樣本是一個8通道一維時間序列數(shù)據(jù)(1 024,8)重建三維輸入特征圖(32,32,8),其中,8表示8通道,32表示特征圖高度,32表示特征圖的寬度。
將原始數(shù)據(jù)按70 %為訓練集(537×5=2 685個樣本),30 %為測試集(231×5=1 155個樣本)。再在訓練集中隨機抽取20 %的樣本作為驗證集(訓練樣本430×5=2 150個,驗證樣本107×5=535個)。每個樣本長度為1 024×8=8 192個數(shù)據(jù)點。本文設置驗證集,目的為了驗證訓練后的CNN-SVM模型的準確性。當驗證集上的誤差大于訓練集上的誤差時,表明模型可能過擬合,模型訓練及時停止。最后,利用測試數(shù)據(jù)集對模型進行最終故障分類和精度評估。
實驗基于Keras深度學習框架,模型結構由連續(xù)卷積CNN和SVM分類器構成如圖2所示,每層的設置超參數(shù)如圖3所示,Adam超參數(shù)設置為η=0.001,β1=0.9,β2=0.999,在CNN結構中加入Dropout參數(shù)防止模型過擬合。卷積1和卷積2中的卷積核為(3,3),卷積3和卷積4中卷積核為(4,4)。激活函數(shù)使用Relu 激活函數(shù)。
圖2 8通道輸入CNN-SVM網(wǎng)絡結構
從全連接層得到特征輸入多分類SVM,為了查看CNN對數(shù)據(jù)的特征提取能力,對測試集1 155個樣本,在測試數(shù)據(jù)下的t分布隨機鄰居嵌入(t-SNE)散點圖如圖3共構造10個分類器。由于輸出特征是非線性數(shù)據(jù),本文采用徑向基函數(shù)對高維數(shù)據(jù)進行映射。
圖3 測試數(shù)據(jù)t分布隨機鄰居嵌入(t-SNE)散點
本文采用的是8通道輸入CNN-SVM模型,繪制訓練過程的精度如圖4所示,由圖可知模型的收斂速度比較快,在40次訓練就基本開始收斂了。
圖4 8通道輸入CNN-SVM模型訓練過程的精度和損失率
當把全連接層的提取的特征作為輸入給SVM,用混淆矩陣表示測試集的效果如圖5所示,橫軸表示真實標簽,縱軸表示預測標簽,由圖可知故障2有1個樣本誤為故障3;其余都預測正確。正確率高達99.91 %。
圖5 CNN-SVM方法建立故障診斷結果的多類混淆矩陣
為了驗證本文提出的方法的可靠性做了以下對比實驗。把每類數(shù)據(jù)用其中某只傳感器采集原始數(shù)據(jù)作為單通道輸入,CNN-SVM模型訓練過程如圖6所示,由圖分析可知模型的波動性很大不穩(wěn)定。對多通道數(shù)據(jù)輸入,能夠保存更多的故障的信息,并增強了模型的泛化能力。
圖6 單通道的CNN-SVM模型準確率和損失率
由表1可以得知,一個是用預訓練訓練好的模型CNN-SoftMax,另一個是本文提出CNN-SVM模型。兩種模型對比可知,本文提出的模型測試準確率要高于用SoftMax分類器模型。兩種模型訓練時間相差不大,但是本文采用的模型測試時間為0.072 s,明顯優(yōu)于CNN-SoftMax模型的0.483 s。減少測試時間對故障的快速診斷和故障的在線實時監(jiān)控具有重要意義。
表1 CNN-SVM模型的診斷結果
將本文所提的訓練好的模型對測試數(shù)據(jù)進行10次試驗,識別率平均約99.94 %,證實了該模型的準確性。本文還建立二維卷積神經(jīng)網(wǎng)絡(2DCNN)和主成分分析—支持向量機(PCA-SVM)模型進行對比分析,對三種模型分別對測試數(shù)據(jù)進行10實驗,后二者的準確率分別為99.21 %,85.19 %,本文所提出的模型精確性更高。
提出了一種多通道輸入數(shù)據(jù)融合的CNN-SVM故障診斷模型。該模型通過在傳統(tǒng)CNN中引入融合模型來實現(xiàn)多維數(shù)據(jù)的特征學習;對傳統(tǒng)的CNN改進加入連續(xù)卷積減少學習參數(shù),加快模型更快收斂。該模型可以直接從原始振動信號中提取特征,避免人為特征選取的不確定性和復雜性。模型可以利用多個輸入層直接從信號中自動有效地學習不同數(shù)據(jù)類型的互補性和豐富的故障特征,大大提高了特征提取和故障識別的能力。本文通行星齒輪箱實驗驗證了模型的有效性。在實際應用應考慮齒輪箱運行環(huán)境不同而對模型進行遷移學習。