趙 川, 馮志鵬
(1. 北華航天工業(yè)學院 機電工程學院,河北 廊坊 065000; 2. 北京科技大學 機械工程學院,北京 100083)
行星齒輪箱在工業(yè)與航空等領域應用廣泛,但工作環(huán)境中存在多種因素容易對其零部件(齒輪、軸承等)造成不良影響導致發(fā)生損傷或失效,嚴重時會造成重大損失。文獻[1]指出由軸承缺陷引起的故障和平均停機時間占整個齒輪箱缺陷和總停機時間的 60% 以上。因此,對行星輪軸承故障診斷的研究具有重要意義。
在實際應用中,行星輪軸承運動比定軸軸承更為復雜,一般的定軸軸承故障診斷方法很難適用[2];加之行星齒輪箱轉(zhuǎn)速與載荷通常具有時變性,信號中的故障特征頻率也隨時間發(fā)生變化,使得發(fā)掘信號中的故障信息變得更為困難[3]。對于時變信號,通常采用時頻分析法來研究信號中的特征頻率成分以及頻率隨時間變化的規(guī)律。但在應用時頻分析方法對時變工況下行星齒輪箱信號進行分析時,發(fā)現(xiàn)存在時頻分辨率低與虛假成分干擾等問題,給故障特征的提取與識別造成困難。為解決該問題,相關學者進行了進一步的研究[4-9],基于廣義解調(diào)與同步壓縮變換、相角的熵特征、階次譜分析、自適應線性調(diào)頻模式分解等理論,提出多種時變工況下行星齒輪箱故障診斷方法。以上研究有助于在非平穩(wěn)條件下對行星輪軸承進行故障診斷,但是大多數(shù)工作涉及專家知識,并依靠數(shù)據(jù)分析人員來人工識別故障特征頻率,主觀因素可能會影響故障診斷的準確性。
針對上述局限性,研究人員開展了相關的智能故障診斷研究。在近期的研究中,Zhang等[10]提出抗干擾深度卷積神經(jīng)網(wǎng)絡模型,用于處理強噪音與不同負載環(huán)境下軸承的故障診斷問題。Shao等[11]基于壓縮傳感,改進了卷積深度置信網(wǎng)絡模型,并用滾動軸承故障數(shù)據(jù)進行了驗證,研究表明提出的模型提高了數(shù)據(jù)分析效率,增強了壓縮數(shù)據(jù)的特征學習能力,與傳統(tǒng)方法相比具有一定的優(yōu)越性。Jia等[12]將特征提取與故障識別融合到一個模型中,用歸一化的稀疏自編碼器學習特征,后經(jīng)特征層處理獲取移不變特征,最后在輸出層進行模式識別。經(jīng)齒輪與軸承數(shù)據(jù)驗證表明,該模型提取的特征具有獨立的意義,增強了特征模式識別性能,具有一定的優(yōu)越性。Ding等[13]利用局部多項式擬合和基于稀疏性的算法以及階次跟蹤技術來提取時域瞬態(tài)特征,并將非平穩(wěn)瞬態(tài)特征轉(zhuǎn)換為角域中的平穩(wěn)特征以進行故障診斷。但是,大多數(shù)智能診斷方法主要用于處理穩(wěn)定工況下的故障診斷問題,且是對一維信號進行分析,提取特征;提取的特征通常為原始信號在低維度的抽象,沒有顯式的表達,缺乏可解釋性與可控性。而賦予特征顯式的表達與意義,能夠更具體地描述特征,并且通過對其顯式的表達進行變換或控制更容易實現(xiàn)對特征的優(yōu)化,從而提高特征的聚類性能與模式識別準確率。因此,如何采用相關方法提取時變特征,同時賦予特征顯式意義,強化不同類別特征間的差異性需要進一步研究。
近來,生成模型因為能夠自適應提取特征,通過已知的分布對隱變量(即特征)進行擬合從而賦予特征顯式的表達而受到越來越多的關注[14-17],并開始應用到故障診斷領域[18-19]。Wang等[18]將生成對抗網(wǎng)絡(generative adversarial network, GAN) 和堆疊式降噪自動編碼器組合在一起以生成新樣本來擴展樣本集,解決了故障診斷中的小樣本問題。Zhao等[19]將變分自動編碼器 (variational auto-encoder, VAE) 引入故障診斷框架,使用來自高斯分布的隱變量生成人工振動信號,與真實信號混合,增強樣本集,然后結合卷積神經(jīng)網(wǎng)絡提出了一種增強的故障診斷方法,解決了故障診斷中小樣本與樣本不平衡問題。但上述研究主要針對故障診斷中的小樣本問題,模型對于非平穩(wěn)信號的適應性以及在特征分布擬合方面的應用還有待進一步研究。因此,在非平穩(wěn)狀態(tài)下行星齒輪箱的智能故障診斷仍然是一個具有挑戰(zhàn)性的問題。
為了能夠自適應提取時變工況下行星輪軸承的信號特征,進行行星輪軸承智能故障診斷,本文構建了基于對抗變分自編碼的智能故障診斷模型。首先,獲取樣本時頻圖,為簡化模型輸入結構,對時頻圖進行二值化處理;構建多維獨立高斯分布,并進行采樣,根據(jù)類別信息,對樣本進行變換使其服從新的分布;利用變分自編碼模型提取的特征與變換后的對應類別的采樣樣本對判別器進行訓練,從而實現(xiàn)利用已知的先驗分布擬合未知的特征分布,賦予特征顯式的意義,并通過控制分布強化不同類別特征間的差異;最后利用優(yōu)化后的特征對分類器進行訓練,通過測試數(shù)據(jù)驗證其性能。整體實現(xiàn)流程如圖1所示。
圖1 故障診斷過程
變分自編碼器是對自編碼器 (auto-encoder, AE)的改進與升級。AE本質(zhì)是以一種無監(jiān)督的方式自適應地提取非線性特征。圖2展示了多層自動編碼器的深層網(wǎng)絡結構。其中,編碼器部分旨在從輸入數(shù)據(jù)生成隱變量表示,而解碼器部分用于根據(jù)隱變量重構輸出,使其盡可能接近原始輸入[20]。如圖2所示,該結構具有輸入層,2r-1個隱藏層以及輸出層。輸入數(shù)據(jù)表示為向量x=[x1,x2,…,xm]T,輸出向量表示為u=[u1,u2,…,um]T,其中m為輸入與輸出層神經(jīng)元個數(shù)。
圖2 自編碼網(wǎng)絡結構
第k個隱含層的向量為zk=[zk,1,zk,2,…,zk,s_k]T,其中s_k為第k層的神經(jīng)元個數(shù)為s。每一層的激活計算可按式 (1) 進行。
(1)
與AE不同,GAN的本質(zhì)是以一種簡單的方式從潛在空間生成與真實數(shù)據(jù)近似的樣本,并使生成樣本服從與真實樣本相同的分布。在GAN模型中,生成器G從潛在空間生成新樣本,而判別器D則將生成樣本與訓練樣本區(qū)分開。具體地,生成器利用函數(shù)G(z) 欺騙判別器D(x),使判別器認為生成的樣本來自訓練集,而判別器則嘗試正確識別生成樣本。經(jīng)過訓練,生成器生成的樣本與訓練數(shù)據(jù)近似。圖3給出了一個GAN的結構。
圖3 對抗生成網(wǎng)絡結構
對抗過程損失函數(shù)可通過目標函數(shù)式 (2) 進行計算。
(2)
式中:E為期望;pdata(x) 與p(z) 分別為x與z服從的概率分布情況;D(x) 為判別器的輸出結果,用于判斷判別器輸入為x的概率。目標函數(shù)一方面希望當把真實數(shù)據(jù)放入判別器后,輸出的概率值與目標函數(shù)值最大,另一方面希望找到最優(yōu)的生成函數(shù)G(z),使得目標函數(shù)值最小,因而二者進行對抗。最后,使用交替隨機梯度下降法來進行訓練,直到收斂。
Kingma等[22]提出變分自編碼思想,揭示了輸入數(shù)據(jù)與隱變量間分布的映射關系,改善了AE由于單值映射而造成的過擬合問題。變分自編碼器 (variational auto-encoder,VAE) 結構如圖4所示。
圖4 變分自編碼網(wǎng)絡結構
在AE中,當訓練得到解碼器后,我們希望輸入一個編碼,通過解碼器生成一張圖片,但實際上僅僅通過自編碼器得到的結果并不好。研究表明,變分自編碼器能夠提升編碼器對圖片的重構效果。在VAE中,編碼器與解碼器過程不變,編碼器輸出兩個向量,不妨設定編碼維數(shù)為3,則兩個向量分別為(m1,m2,m3)與(σ1,σ2,σ3),此外再從高斯分布中采樣 (e1,e2,e3),通過式(3)計算隱變量(z1,z2,z3),通過解碼器獲取輸出,使重構誤差更小。
zi=exp(σi)×ei+mi
(3)
在自編碼模型中,如果編碼器產(chǎn)生的隱變量服從高斯分布,即z~N(μ,σ),則可實現(xiàn)分布的映射。從N(μ,σ)采樣輸入解碼器,可以重構原始數(shù)據(jù)。但采樣操作對μ和σ不可導,導致通過誤差反向傳播的梯度下降訓練法無法使用。因此,VAE給定了一個標準正態(tài)分布N(0,1),并從該分布采樣e,使得z=exp(σ)×e+m,從而實現(xiàn)z~N(μ,σ)。此時,從編碼器輸出到z,只涉及線性操作,而且e對于神經(jīng)網(wǎng)絡而言只是常數(shù),因此,可以正常使用梯度下降訓練法進行優(yōu)化。
但對于多類別輸入,變分自編碼中的標準正態(tài)分布只是使得編碼器輸出的隱變量服從正態(tài)分布N(μ,σ),特征分布由未知變?yōu)橐阎?,進一步規(guī)范了特征,而不同類別特征間的差異性卻并沒有得到明顯強化。因此,該方法對特征模式識別性能的改善比較有限。
針對該問題,本文構建了多維獨立高斯分布,以使提取的每個隱變量 (即特征向量的每個元素) 都有自己的專屬分布,從而實現(xiàn)用已知分布擬合特征的未知分布,賦予特征顯式意義,也為通過控制已知分布來強化不同類別特征間的差異性提供可能。設p維的隨機向量為O=[o1,o2,…,op]T,且有密度函數(shù)如式(4)所示。
(4)
式中:μ為p維向量;H為p階正定對角矩陣;detH為H的行列式,則稱O服從p維獨立高斯分布,記為O~Np(μ,H)。
這里以二維獨立高斯分布(p=2)為例,不妨給定參數(shù)μ=[0, 0]T,H=[0.5,0; 0,0.1],然后從該分布采集b個樣本,樣本點記為(o1k,o2k),k=1,2,…,b,則o1與o2分別服從一維高斯分布N(0,0.5)和N(0,0.1)。為了能夠使采集的b個樣本約束n類特征,通過式(5)、式(6)將其分成與類別信息相關的n組
(5)
(6)
圖5 從分布Np(A μ, AHAT) 采集的樣本(n=4,b=4 000)
為了便于理解模型,將特征可視化。引入二維獨立高斯分布 (p=2),通過對抗學習,用已知的二維高斯分布擬合未知的特征分布,使得不同類別的特征具有專屬分布,計算過程如圖 6 所示。
圖6 對抗變分自編碼模型
在圖 6 中:x表示輸入向量,假定服從分布p(x);z為隱變量向量,如果將編碼器分布表示為q(z|x),則可以根據(jù)式(7)計算后驗分布q(z)。
(7)
由于p(x) 未知,因而無法對q(z) 進行顯式的表達。對抗變分自編碼旨在用已知的分布p(z) 擬合分布q(z),同時最小化VAE的重構誤差。判別器用于確定樣本來自哪個分布。如果樣本來自p(z),則判別器將認為它是真實樣本,并且輸出為 1,否則輸出為零。同時,作為對抗網(wǎng)絡的生成器,VAE不斷更新并試圖欺騙判別器以給出錯誤的結果。
具體地,將信號的時頻圖數(shù)據(jù)輸入編碼器,并通過標準正態(tài)分布給隱變量增加噪聲。將隱變量、二維獨立高斯分布的采樣樣本分別與相應的標簽信息融合,形成復合向量。與常規(guī)對抗網(wǎng)絡輸入不同,這里以高斯分布的復合向量為真,隱變量復合向量為假,對判別器進行訓練,從而使得隱變量受到專屬分布的約束。之后,提取訓練集的特征來訓練分類器。在訓練多維獨立高斯分布對抗變分自編碼器和分類器之后,將使用測試樣本來測試整個框架及其性能。
針對時變工況下行星輪軸承故障信號,模式識別具體處理過程如下:
步驟1樣本分類。將時變工況下行星輪軸承信號樣本分為訓練集與測試集,每個樣本集包含四類樣本,分別對應正常(狀態(tài)1)、外圈損傷(狀態(tài)2)、滾動體損傷(狀態(tài)3)與內(nèi)圈損傷(狀態(tài)4)等狀態(tài)。
步驟2信號處理。采用短時傅里葉變換 (short time fourier transformation, STFT) 法獲取樣本時頻圖,并根據(jù)最大類間方差法[23]進行二值化處理,從而簡化模型輸入結構,便于特征提取。
步驟4softmax分類器訓練。用提取的訓練樣本的特征訓練分類器,提取所有測試樣本特征,測試分類器性能,最終識別行星輪軸承故障。
行星齒輪箱實驗臺基本組成如圖 7 所示,驅(qū)動電機與齒輪箱之間通過速度傳感器連接,負載由電磁制動器提供 (實驗中為零負載),數(shù)據(jù)采集系統(tǒng)用于檢測齒輪箱運行狀態(tài),對信號進行測量與保存。相關齒輪箱參數(shù)如表1所示。
圖7 實驗系統(tǒng)平臺
表1 行星齒輪箱齒輪參數(shù)
為模擬行星輪軸承故障,分別對外圈、某一滾動體、內(nèi)圈進行人工處理,形成剝落損傷,損傷尺寸如表2所示,實物如圖8所示。由此可形成時變工況下的四種運行狀態(tài):①基準——狀態(tài)1,所有零件無損傷;②外圈損傷——狀態(tài)2,只一個行星輪軸承外圈有損傷;③滾動體損傷——狀態(tài)3,只有一個行星輪軸承的單個滾動體有損傷;④內(nèi)圈損傷——狀態(tài)4,只有一個行星輪軸承內(nèi)圈有損傷。
表2 軸承損傷尺寸
圖8 軸承損傷
驅(qū)動電機轉(zhuǎn)速根據(jù)分段函數(shù)式(8)進行設定,其中fmax=19 Hz。轉(zhuǎn)速曲線如圖9所示。分別對每種運行狀態(tài)進行兩次實驗,采集位于齒圈上方齒輪箱箱體頂部傳感器的振動信號。設置采樣頻率為102 400 Hz,每次實驗采樣時間60 s。將第一次實驗的數(shù)據(jù)作為訓練數(shù)據(jù),第二次的作為測試數(shù)據(jù)。
圖9 轉(zhuǎn)速曲線圖
(8)
分析對應轉(zhuǎn)速曲線5~45 s內(nèi)的數(shù)據(jù)。為方便計算,對信號進行重采樣,采樣頻率5 120 Hz,對應每種運行狀態(tài)可獲得兩組數(shù)據(jù),每組包含209 920個數(shù)據(jù)點。圖10給出了軸承不同狀態(tài)訓練信號的時域波形。
圖10 信號波形
采用時移的方法,將每組數(shù)據(jù)劃分為150個樣本,每個樣本包含5 120個點,則四種狀態(tài)對應訓練樣本總數(shù)為600,測試樣本總數(shù)為600。
根據(jù)2.3節(jié)中模式識別的基本步驟對信號進行處理與分析。不妨選對應轉(zhuǎn)速曲線第15 s內(nèi)的不同狀態(tài)的樣本為例,樣本時頻圖如圖11所示。
圖11 樣本時頻圖
在研究中,所涉及的參數(shù)主要是批量大小,隱含層神經(jīng)元數(shù)量和迭代次數(shù)。首先根據(jù)表 3 建立模型,再通過單因素分析法分析和選擇適當?shù)膮?shù)。觀察當其他參數(shù)確定,只有一個參數(shù)發(fā)生變化時,該參數(shù)對模型故障診斷準確率的影響。
首先,給定批處理的大小和隱含層中神經(jīng)元的數(shù)量分別為100和1 000,迭代次數(shù)預設為100,200,300,400,500??紤]到訓練過程中樣本選擇的隨機性,針對每個迭代次數(shù),重復計算5次,選擇每個狀態(tài)對應的5個準確率中的最小值作為最終結果,則由迭代次數(shù)變化引起的影響結果如圖12所示。
圖12 迭代次數(shù)選擇
根據(jù)圖 12 可知,迭代次數(shù)為100和500時,模型的故障診斷準確率偏低。通過200~400次迭代,模型能夠以較高準確率診斷四種狀態(tài)。其中,當?shù)螖?shù)為300時,模型整體的診斷準確率更高。因此,可以選擇迭代次數(shù)為300。
接下來,給定神經(jīng)元數(shù)量為100,迭代次數(shù)為300,預設批量大小為25,50,75,100,125。圖13顯示了對應不同批量大小樣本數(shù)的故障診斷結果。由圖13可知,當批量樣本數(shù)為25和125時,模型的故障診斷準確率偏低;批量大小為50時,整體上能夠以較高的準確率識別四種狀態(tài)。因此,可以選擇批量大小為50。
圖13 批量樣本數(shù)選擇
最后,給定迭代次數(shù)為300,批量大小為50,將神經(jīng)元數(shù)設置為250,500,750,1 000,1 250。圖 14給出了不同神經(jīng)元數(shù)量對診斷準確率的影響。根據(jù)圖14,神經(jīng)元數(shù)從500~1 250,能夠以較高準確率診斷四種狀態(tài)。但是隨著神經(jīng)元數(shù)量的增加,結果并沒有變得更好。因此,為了保證計算效率,可以選擇神經(jīng)元數(shù)量為750。
圖14 神經(jīng)元數(shù)量選擇
根據(jù)上面的分析不難發(fā)現(xiàn),模型迭代次數(shù)與批量樣本數(shù)對模型故障診斷準確率有一定的影響。當參數(shù)值較小時,模型訓練不充分,導致故障診斷準確率偏低;參數(shù)值較大時,模型訓練產(chǎn)生過擬合現(xiàn)象,使得模型的泛化能力下降,也會導致模型故障診斷準確率降低。對于每層神經(jīng)元數(shù)量而言,當參數(shù)值取較小值時,模型權值需要來回調(diào)整,不易穩(wěn)定,導致診斷準確率相對偏低,而隨著神經(jīng)元數(shù)量的增加,權值訓練則更容易快速趨于穩(wěn)定,但該參數(shù)值的變化對于模型診斷準確率的影響較小。為保證計算效率與網(wǎng)絡性能,一般在滿足精度要求的前提下選擇較少的神經(jīng)元個數(shù)。綜上所述,相關參數(shù)通常需要根據(jù)經(jīng)驗和實驗分析確定。這里選擇的參數(shù)是300(迭代次數(shù)),50(批量大小) 和750(神經(jīng)元數(shù)量)。
在本節(jié)中,將AVAE與其他兩種廣泛使用的方法AE和VAE進行比較。根據(jù)表3以及在3.2節(jié)中選定的參數(shù)建立AVAE模型。AE和VAE模型的網(wǎng)絡結構參數(shù) (包括網(wǎng)絡層數(shù)與每層神經(jīng)元個數(shù)) 與AVAE的對應部分相同,訓練參數(shù)如迭代次數(shù)、批量樣本數(shù)等通過單因素分析法確定。AE對應的訓練參數(shù)值為300,50;VAE對應的訓練參數(shù)值為700,50。在分類器部分,網(wǎng)絡結構設置為2-250-4,標簽設置為[1, 0, 0, 0],[0, 1, 0, 0],[0, 0, 1, 0]和[0, 0, 0, 1],分別對應于狀態(tài)1,2,3,4。為了觀察提取的特征,將特征可視化,如圖15所示。
表3 模型構建參數(shù)
圖15 聚類結果
此外,使用模糊C均值聚類算法[24],以分類系數(shù)F和平均模糊熵H為指標來評估聚類性能。當F越接近1同時H越接近0時,聚類效果越好。表4列出了不同方法提取的特征對應的F和H值,從中可以看出AVAE提取出的特征聚類性能最好,這是因為AVAE提取的特征受到了多維獨立高斯分布的專屬約束,強化了不同類別特征間的差異。此外,從圖15中也可以看出,AVAE提取的特征比AE和VAE提取的特征具有更好的聚類性能,這與上面的定量分析保持了一致。最后,用訓練樣本的特征對分類器進行訓練,然后通過測試樣本進行測試。考慮到模型訓練過程中樣本選擇的隨機性,重復5次計算過程,選擇每個狀態(tài)對應的5個準確率中的最小值作為最終結果,如表5所示。這表明所提出的模型能夠以較高準確率識別時變工況下的行星輪軸承故障,具有一定的優(yōu)越性。其中,滾動體損傷的故障診斷準確率相對較低,這是因為行星輪軸承中滾動體的運動最為復雜,除了繞自身軸線旋轉(zhuǎn)外,還會圍繞行星輪軸轉(zhuǎn)動,同時隨著行星架的運動而運動。此外,滾動體損傷與內(nèi)圈或外圈接觸時都會引發(fā)沖擊振動。因而滾動體損傷引起的振動信號包含更多復雜的成分,受到的干擾更多,識別難度也最大。
表4 聚類效果評估
表5 診斷準確率
在研究中,我們將多維獨立高斯分布引入對抗變分自編碼模型,提出了一種新的智能故障診斷方案,用于對時變工況下行星輪軸承進行故障診斷。該方法用變分自編碼模型來提取原始信號的時頻圖特征,同時通過對抗機制,用已知的多維獨立高斯分布來擬合未知的特征分布,賦予了特征顯式的意義,同時強化了不同狀態(tài)樣本時頻圖特征間的差異性。方法經(jīng)實驗數(shù)據(jù)進行了驗證,結果表明:
(1)模型迭代次數(shù)與批量樣本數(shù)對故障識別準確率有一定的影響。參數(shù)值較小時,由于訓練不充分導致模型準確率不高,參數(shù)值較大時,則容易產(chǎn)生過擬合現(xiàn)象,導致模型泛化能力下降,降低模型準確率。
(2)模型每層神經(jīng)元數(shù)量取較小值時,模型權值需要來回調(diào)整,不易穩(wěn)定。為保證計算效率與網(wǎng)絡性能,一般在滿足精度要求的前提下選擇較少的神經(jīng)元個數(shù)。
(3)與AE、VAE相比,AVAE提取的特征具有更好的聚合性能,特征能夠被顯式的表達,且不同類別特征間的差異更為明顯。AVAE能夠以較高的準確率診斷時變工況下行星輪軸承故障,表現(xiàn)出一定的優(yōu)越性。