尹愛軍, 王 昱, 戴宗賢, 任宏基
(1.重慶大學機械傳動國家重點實驗室 重慶,400044) (2.重慶市計量質量檢測研究院 重慶,401120)
軸承運行健康狀態(tài)評估(prognostics and health management,簡稱PHM)及其退化性能的偵測在現(xiàn)代機械設備中具有越來越重要的作用。近年來,學者們提出了諸多軸承運行健康狀態(tài)評估方法[1-5]。張朝林等[6]提出了一種基于本征時間尺度分解(intrinsic time-scale decomposition,簡稱ITD)多尺度熵和極限學習機的軸承健康狀態(tài)識別模型。朱朔[7]針對冗余特征降維問題,提出了一種基于改進局部保留投影算法的滾動軸承特征向量降維方法。劉小勇[8]提出了一種基于長短時記憶網(wǎng)絡的評估方法,對軸承和渦輪的退化性能進行預測。Qiu等[9]通過使用自組織映射方法將提取到的特征融合構建為軸承健康狀態(tài)檢測指標。
以上方法均通過人為提取數(shù)據(jù)特征或對數(shù)據(jù)的真實概率分布和組織形式進行某種假設,進而再通過實驗對假設進行驗證。該方法有如下限制:①基于人為假設數(shù)據(jù),使用數(shù)據(jù)驅動構建模型的方法,評估效果依賴于模型的參數(shù)調校,難以在同類數(shù)據(jù)上具備較好的魯棒性;②基于人工提取低維特征的方法損失了原始數(shù)據(jù)的信息量,冗余無法確定,且所提取的特征對狀態(tài)評估的貢獻度難以定量描述,造成評估模型只能在特定工況下才能達到理想的效果,且大多數(shù)特征提取一般是基于某種特定的假設下;③基于支持向量機(support vector machine,簡稱SVM),深度神經網(wǎng)絡(deep neural networks,簡稱DNN)等智能學習方法完全由數(shù)據(jù)驅動,缺乏理論背景且對數(shù)據(jù)的數(shù)量較為依賴。軸承在復雜多變的工況下運行并伴隨大量環(huán)境噪聲,在數(shù)據(jù)量較為缺失的情況下,使得該評估方法難以在軸承狀態(tài)偵測方面具備較好的通用性。
由于信號頻域幅值譜在其特征空間具有更為穩(wěn)定的概率分布,提出了一種面向高熵特征的變分自編碼器軸承健康狀態(tài)評估模型。通過建立振動信號頻譜在特征空間的概率分布量化模型并最大化其邊緣似然概率,實現(xiàn)對振動信號頻譜高維空間中真實復雜概率分布的精確逼近,完成對振動信號狀態(tài)的定量評估。通過實驗及對比,證明了變分自編碼器在軸承運行健康狀態(tài)評估上具有較好的準確性和魯棒性。
(1)
其中:P(x(i))為觀測數(shù)據(jù)x(i)的概率密度函數(shù)。
VAE試圖極大化P(x(i))的似然概率,從而估計觀測數(shù)據(jù)的真實分布。
對于隱空間先驗分布P(z),VAE指定其服從標準正態(tài)分布N(0,I)。其中:I為z空間中的單位陣。同時,變分自編碼器使用后驗分布P(z|x(i))對具體觀測數(shù)據(jù)的隱空間分布進行度量。VAE使用變分推斷方法,構造可優(yōu)化函數(shù)Q(z|x(i);φ),通過優(yōu)化參數(shù)φ,逼近真實后驗分布P(z|x(i))。根據(jù)變分理論并考慮易優(yōu)化性,優(yōu)化目標通過Kullback-Leibler(簡稱KL)散度進行度量,即
(2)
對式(2)運用貝葉斯定理變形可得
logP(x(i))-KL[Q(z|x(i))‖P(z|x(i))]=
Ez~Q[logP(x(i)|z)]-KL[Q(z|x(i))‖P(z)]
(3)
式(3)包含了最初式(1)的優(yōu)化目標P(x(i)),由于KL[Q(z|x(i))‖P(z|x(i))]≥0且無法直接計算,因此優(yōu)化目標可變?yōu)闃O大化logP(x(i))的變分證據(jù)下界(evidence lower bound,簡稱ELBO),即
(4)
VAE通過最大化變分下界來實現(xiàn)最大化邊緣似然概率P(x(i))。對于Pθ和Qφ,一般可采用多層神經網(wǎng)絡實現(xiàn)。在VAE中,Q(z|x(i);φ)被指定為一個具有對角協(xié)方差矩陣的多維高斯分布
Q(z|x(i);φ)=N(z;μ(i),σ(i)°Ι)
(5)
其中:μ(i),σ(i)可由一個多層神經網(wǎng)絡輸出,即VAE假設觀測數(shù)據(jù)后驗分布服從高斯分布。
對于Ez~Q[logP(x(i)|z;θ)]項,為避免其對Qφ梯度過大而引起計算不穩(wěn)定問題,VAE使用基于蒙特卡洛采樣的隨機梯度變分貝葉斯評估器(stochastic gradient variational Bayes,簡稱SGVB)對優(yōu)化目標進行估計,同時使用自編碼變分貝葉斯(auto-encoding variational Bayes,簡稱AEVB)算法[10]進行訓練,并在實際模型中采用重參數(shù)技巧解決后驗分布采樣過程中梯度不可計算的問題,最終變分下界的估計值可表示為
L(θ,φ;x(i))=-KL[Qφ(z|x(i))‖P(z)]+
(6)
其中:L為隱變量z的采樣次數(shù);z(i,l)=μ(i)+σ(i)°∈(l);∈(l)~Ν(0,I)。
變分自編碼器實現(xiàn)采用最小化解碼數(shù)據(jù)和觀測數(shù)據(jù)L2范數(shù),從而間接優(yōu)化logPθ(X(i)|z),所以式(6)的優(yōu)化目標為
L(θ,φ;x(i))=-KL[Qφ(z|x(i))‖P(z)]-
(7)
其中:fθ為解碼器。
為使基于蒙特卡洛采樣的SGVB優(yōu)化器[10]獲得收斂,VAE對觀測數(shù)據(jù)采用小批量多批次方式進行優(yōu)化,使L(θ,φ;x(i))達到最終穩(wěn)定解。
基于VAE的軸承健康狀態(tài)評估模型實質是健康狀態(tài)下振動信號x(t)頻譜X(f)的邊緣概率分布P(X(f)),對于軸承運行狀態(tài)下頻譜X(f),評估模型P(X(f)),計算X(f)所表征健康狀態(tài)的概率值,從而實現(xiàn)對軸承健康狀態(tài)的定量評估。由式(3)得
(8)
評估模型通過對P(X(f))進行最大似然估計,從而使P(X(f))逼近真實邊緣概率分布。由于KL[Q(z|X(f))‖P(z|X(f))]≥0且無法計算,因此采用變分下界L(θ,φ;X(f))作為logP(X(f))的估計。由于AEVB算法采用小批量多批次方式進行訓練,若單批次訓練數(shù)量達到一定規(guī)模(100以上),根據(jù)均值場論[14],L(θ,φ;X(f))中蒙特卡洛采樣次數(shù)可降為一次[10]。筆者指定評估模型單批次訓練數(shù)量為128,每批次訓練采樣一次。因此,變分下界L(θ,φ;X(f))表示為
P(z)]-‖fθ(z(i))-X(f)(i)‖2}
(9)
在訓練階段,VAE將軸承振動信號頻譜解碼為連續(xù)三維隱空間中后驗分布參數(shù),同時使后驗分布與先驗分布的KL散度及編解碼前后頻譜間L2范數(shù)最小化,以此實現(xiàn)對所有訓練數(shù)據(jù)的邊緣似然概率最大化。圖1為基于VAE的軸承健康狀態(tài)評估模型及其訓練,具體訓練步驟如下。
圖1 基于VAE的軸承健康狀態(tài)評估模型Fig.1 Model architecture for the bearing health status evaluation with VAE
1) 從訓練集數(shù)據(jù)中隨機選取128個觀測數(shù)據(jù)點,組成單批訓練集{X(f)(i)|i=0,1,…,127}。
2) 將單批訓練集中每個數(shù)據(jù)點X(f)(i)送入編碼器,得到對應后驗分布N(z;μ(i),σ2(i)°I)。
3) 從三維標準正態(tài)分布中采樣128個噪聲{∈(i)|i=0,1,…,127},結合對應后驗分布生成隱變量{z(i)|z(i)=∈(i)°σ2(i)+μ(i)}。
5) 重復步驟1~4,直至模型總體損失函數(shù)值低于設定值,保存模型參數(shù)Qφ及Pθ。
軸承健康狀態(tài)評估指標即為對應頻譜X(f)的邊緣似然概率響應值P(X(f))。由分析可知,P(X(f))無法直接計算,而是通過其變分下界L(θ,φ;X(f))對其對數(shù)值logP(X(f))進行估計,且由于高斯后驗分布的簡化假設導致變分推斷存在一定誤差[15],因此P(X(f))不能直接作為軸承健康狀態(tài)評估指標。L(θ,φ;X(f))作為logP(X(f))的一個下界逼近,同樣可作為預測階段的健康狀態(tài)評價指標,由此得出的評價結果是偏嚴格的,即真實退化程度不會高于評估退化程度,這對發(fā)現(xiàn)軸承運行早期故障是有益的。
為了避免計算解碼器解碼期望而帶來的額外采樣運算,直接使用后驗高斯分布期望值作為采樣隱變量。設某時間段軸承振動信號為x(t),頻譜為X(f),則基于變分下界的健康狀態(tài)評估指標E表示為
(10)
其中:u(X(f))為X(f)后驗分布期望值。
E(x(t))值越大,表明其退化程度越嚴重。對軸承振動頻譜X(f),首先通過解碼器Qφ(X(f))得到其高斯后驗分布期望u及方差σ,通過u,σ構建后驗分布N(u,σ),并計算其和先驗分布的KL散度KL[N(u,σ)‖N(0,I)]。同時,將期望u送入解碼器fθ,得到解碼值fθ(u),并計算解碼值與真實值間L2范數(shù)‖fθ(u)-X(f)‖2,最終KL[N(u,σ)‖N(0,I)]與‖fθ(u)-X(f)‖2之和即為軸承健康狀態(tài)評估指標。
為了驗證變分自編碼器對軸承振動信號狀態(tài)評估效果,筆者選取辛辛那提大學智能維護系統(tǒng)實驗室開源滾動軸承加速退化實驗數(shù)據(jù)集[16]。試驗臺傳動軸由交流電機通過皮擦帶輪驅動測試軸旋轉,轉速恒定為2 kr/min。實驗共有4個數(shù)據(jù)采集通道,均采用加速度傳感器收集對應軸承振動信號,采樣頻率為20 kHz。筆者使用軸承1振動數(shù)據(jù)作為數(shù)據(jù)集。實驗歷時9 840 min后,軸承1出現(xiàn)外圈故障,停止實驗。
在軸承運行全過程9 840 min內,選取前100個數(shù)據(jù)集(前1 000 min)作為訓練數(shù)據(jù)集,其余數(shù)據(jù)均作為測試集。為了降低訓練數(shù)據(jù)維度,每個數(shù)據(jù)集選取轉子旋轉一圈時間(5 s)的采樣信號作為訓練數(shù)據(jù)維度,對模型進行隨機多批次訓練。訓練完畢后對軸承全退化過程健康狀態(tài)進行評估,圖2為VAE軸承健康狀態(tài)評估結果。區(qū)域Ⅰ為早期訓練數(shù)據(jù)狀態(tài)評估結果,區(qū)域Ⅱ為軸承后續(xù)運行狀態(tài)評估結果。可見,在1 000~5 000 min時間段內,軸承未表現(xiàn)出退化跡象,其健康狀態(tài)評估值和訓練階段的評估值具有相同的變化波動趨勢,這說明基于VAE的軸承健康狀態(tài)評估指標在測試集同類數(shù)據(jù)上具有良好的泛化能力。
圖2 VAE軸承健康狀態(tài)評估結果Fig.2 Evaluation results of bearing health status with VAE
基于VAE的軸承健康狀態(tài)評估模型通過隱變量來表征振動信號的潛在狀態(tài),隱變量蘊含解碼器對原始信號特征的有效轉化和提取。因此,對于一個有效的評估模型,其隱變量的分布狀態(tài)及變化趨勢應當和評價指標結果相似。為了驗證VAE對軸承振動信號狀態(tài)的隱變量解碼分布,在軸承運行全過程中每間隔10 min對解碼后隱變量進行可視化分析。
圖3為全退化過程振動信號頻譜隱變量分布。圖中,三維坐標系建立在三維先驗標準正態(tài)分布空間,坐標原點位于先驗高斯分布均值處。由于VAE使用標準正態(tài)分布作為先驗分布,因此前1 000 min內測試數(shù)據(jù)隱變量分布符合高斯分布先驗假設,且在1 000 min至軸承開始退化前時間段內,隱變量分布仍符合高斯分布,這進一步說明了模型在測試數(shù)據(jù)集同類數(shù)據(jù)上具有良好的泛化能力。隨著軸承退化性能逐漸加重,隱變量開始逐漸偏離先驗分布,且偏離程度基本和退化性能成正比。這說明VAE正是通過調整隱變量在其空間分布,從而達到表征軸承振動信號頻譜有效特征的目的,而不是強行通過編解碼器對訓練數(shù)據(jù)進行強行記憶,由此也證實了解碼器學習到了從高維原始特征空間到低維有效特征空間的平滑映射。
圖3 全退化過程振動信號頻譜隱變量分布Fig.3 Embedding hidden space of vibration spectrum point overall test time
為驗證基于VAE的軸承健康狀態(tài)評估模型對軸承退化性能評估的準確性和敏感性,將其評估結果分別與傳統(tǒng)健康狀態(tài)評估指標的結果進行對比,所有評估指標的評估值均被歸一化到0~1區(qū)間,結果如圖4所示。
圖4 VAE狀態(tài)評估歸一化值及對比Fig.4 Normalized evaluation value and comparison with other methods
從圖4可以看出,基于VAE的軸承健康狀態(tài)評價方法對退化數(shù)據(jù)的評估結果與傳統(tǒng)健康狀態(tài)評估結果的曲線走勢基本一致,證明了其對軸承退化性能評估的準確性。圖4表明,基于VAE的評價方法在軸承退化早期狀態(tài)評估敏感度上大大優(yōu)于其他評估方法,在軸承開始進入退化時,評估值發(fā)生了明顯變化,這有利于盡早對軸承退化狀態(tài)進行判斷,避免進入二次突變惡化造成更嚴重的事故。
VAE通過建立軸承振動數(shù)據(jù)的概率模型從而對其健康狀態(tài)進行定量評估?;陔[馬爾科夫模型(hidden Markov model,簡稱HMM)、深度信念網(wǎng)絡(deep belief network,簡稱DBN)等代表性概率推斷模型在軸承狀態(tài)評估方面得到廣泛研究[17-20]。
圖5為VAE,HMM和DBN評估結果對比,評估值被歸一化在0~1區(qū)間。為了量化不同評價方法下的臨界退化時間點,采用3σ原則[21]確定出4 000 min前軸承的健康狀態(tài)評估值上界,并以此上界作為健康狀態(tài)至退化狀態(tài)的評估值轉變點,由此確定不同方法下軸承退化的臨界時間點,結果如表1所示。
圖5 VAE,HMM和DBN評估結果對比Fig.5 Evaluation results in comparison with VAE, HMM, and DBN
表1 VAE,DBN和HMM臨界退化時間Tab.1 Threshold degradation time of VAE,DBN and HMM min
可見,基于HMM的評估方法對軸承早期故障的偵測較為遲滯,在后期退化狀態(tài)的偵測上敏感度也較弱?;贒BN的評估方法在軸承健康狀態(tài)轉變臨界時間點判斷上稍落后于VAE評估方法,退化后期對軸承退化狀態(tài)的評估敏感度也不及VAE方法強。基于VAE的評估方法僅需要少量樣本進行訓練,其狀態(tài)評估結果不僅在進入軸承退化臨界點時具有敏感的變化趨勢,且在相同退化狀態(tài)下的評估敏感度均高于HMM和DBN。因此,基于VAE的軸承健康狀態(tài)評估方法相比其他概率推斷方法更為準確、高效。
提出了一種基于變分自編碼器的軸承狀態(tài)評估方法。通過變分推斷的方式,從振動信號頻域中自動學習潛在的狀態(tài)概率分布,并將其應用于軸承運行狀態(tài)評估中,取得了較好的效果。證明了變分自編碼器在處理軸承運行狀態(tài)評估方面具有良好的準確度,對異常狀態(tài)更為敏感,且無需人為提取特征和復雜的參數(shù)設置,不需要對特定的系統(tǒng)進行針對性的參數(shù)設置和調校。在小容量訓練數(shù)據(jù)集上具備良好的魯棒性,工程應用上具有一定的推廣價值。