(中國飛行試驗研究院 測試所,西安 710089)
航空發(fā)動機具有自動化程度高,結構復雜,專業(yè)化程度高的特點。在整個飛機系統(tǒng)中,如果發(fā)動機出現(xiàn)故障而無法正常工作,將直接影響飛機的安全運行,造成巨大的經濟損失甚至損壞飛機。死亡的嚴重后果[1-2]。然而,由于航空發(fā)動機結構復雜,難以確保長期安全可靠運行,隨著發(fā)動機工作時間的增加,發(fā)動機故障不可避免地會因老化,環(huán)境和變載荷而發(fā)生[3-4]。因此,我們需要研究一種能夠有效預測發(fā)動機剩余壽命、準確預測發(fā)動機故障時間、及時實施維護、最終防止災難性故障的方法[5-6]。
航空發(fā)動機維護已經從過去的“基于預防”的維護思想轉變?yōu)椤耙钥煽啃詾橹行摹钡木S護理念,并且還從簡單的定期維護到狀態(tài)監(jiān)控,基于狀態(tài)的維護和生命存儲部件監(jiān)控相應的維護方法,定時維護的組合。20世紀70年代開發(fā)了發(fā)動機健康管理技術,如發(fā)動機狀態(tài)監(jiān)測,故障診斷和壽命預測,以實現(xiàn)先進的維護理念[7-8]。對于發(fā)動機用戶,全面了解發(fā)動機性能,快速準確地隔離和識別故障,可以更好地更換計劃[9],確定發(fā)動機維修的范圍和深度,大大降低運行和維護成本,有效避免重大事故的發(fā)生[10]。
目前,國外已開發(fā)出一些發(fā)動機健康管理系統(tǒng),其主要功能包括趨勢分析,故障診斷,壽命預測,維護計劃和管理。自1985年以來,美國空軍一直使用集成發(fā)動機管理系統(tǒng)(CEMS)來管理其發(fā)動機機隊。目前,CEMSIV已被全面的發(fā)動機趨勢和診斷系統(tǒng)(CETADS)取代[11]。美國科學監(jiān)測公司為該系統(tǒng)開發(fā)了一個強大的數(shù)據(jù)分析和處理模塊,稱為基于狀態(tài)的智能狀態(tài)發(fā)動機管理系統(tǒng)(ICEMS),具有以下功能:數(shù)據(jù)驗證和監(jiān)測趨勢;報警,檢測和隔離;故障預測;部件壽命評估;運營和維護計劃管理[12-13]。
在國內民用航空發(fā)動機狀態(tài)監(jiān)測領域,20世紀90年代,中國民航學院,北京航空航天大學和北京飛機維修工程公司AMECO開發(fā)了發(fā)動機監(jiān)測和診斷EMD(發(fā)動機監(jiān)測與診斷)系統(tǒng)[14]。
作為大數(shù)據(jù)時代的明星,深度學習在學術界和工業(yè)界引起了廣泛的關注,并在許多傳統(tǒng)的識別任務中取得了顯著的成果?;诙鄠€隱藏層,深度學習可以很好地實現(xiàn)復雜高維函數(shù)的表示,因此具有強大的表示能力,并且具有其他算法在自動特征提取中無法比擬的許多優(yōu)點[15-16]。堆疊自編碼網絡(SAE)是深度學習中最重要的模型之一,近年來,在故障診斷領域,SAE的應用已經完成了許多故障識別和分類任務。2015年,雷亞國等人。使用常見的SAE和降噪SAE來解決滾動軸承和行星齒輪箱的故障診斷,并比較SAE與傳統(tǒng)模式識別方法之間的識別準確性[17];2016年,邵海東等。通過人工魚群算法改進了SAE的損失函數(shù),優(yōu)化了網絡的關鍵結構參數(shù),有效地提高了齒輪箱和滾動軸承故障的識別率。2017年,崔江等人用灰色。通過支持向量機分類支持相關優(yōu)化后的SAE提取特征,實現(xiàn)了航空發(fā)電機旋轉整流二極管的故障診斷。此外,SAE已應用于變壓器,核電站和風力渦輪機設備等復雜機電系統(tǒng)的故障診斷領域,并取得了良好的效果[18]。
因此研究了一種基于堆疊自編碼網絡的無監(jiān)督特征提取方法。以自編碼網絡為基本單元,采用逐層貪心訓練算法構建分層自編碼網絡模型。通過改善網絡的結構復雜性,增強了網絡的功能表達能力,使得網絡模型可以從輸入數(shù)據(jù)中獲得更好的效果。提出了特征表達式,特征的自動提取,以及深度網絡特征提取的定性分析方法,提高了神經網絡知識獲取過程的可解釋性,提升了預測準確率。
自編碼神經網絡(auto-encoder,AE)是一個三層無監(jiān)督神經網絡,由輸入層、隱含層和輸出層構成。網絡中不同層的神經單元之間采用全連接的方式,同一層的神經單元之間不存在相互連接。從結構上看,自編碼神經網絡可以認為是一種特殊的多層感知機,其也是通過反向傳播的方式進行訓練學習,但不同點在于自編碼神經網絡是為了重構輸入數(shù)據(jù),即自編碼神經網絡學習的目標是使得網絡的輸出等于網絡的輸入。由于學習規(guī)則要求網絡的輸出等于輸入,自編碼神經網絡的輸入層的神經單元個數(shù)必須與輸出層的神經單元個數(shù)相等,而其隱含層的神經元個數(shù)可以是任意的[19-21]。因此,只要確定網絡輸入層和隱含層的神經元個數(shù),自編碼神經網絡的結構也就確定了。圖1為一個自編碼神經網絡的結構示意圖,該網絡的輸入層包含5個神經元,隱含層包含3個神經元。
圖1 自編碼神經網絡結構示意圖
自編碼神經網絡包括兩個部分:編碼網絡和解碼網絡。其中編碼網絡用于將原始輸入數(shù)據(jù)投影到一個低維空間(當隱含層神經元個數(shù)少于輸入層神經元個數(shù)時)中,得到輸入數(shù)據(jù)的一種特征表達,而解碼網絡則用于將低維空間的特征表達重新投影回原始的數(shù)據(jù)空間,并最小化輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的差別,從而達到數(shù)據(jù)重構的目的。對于給定的輸入數(shù)據(jù)集x={x1,x2,x3...xN}(N為數(shù)據(jù)集的樣本個數(shù)),其編碼過程為:
an=fθ(xn)=s(W(1)xn+b(1))
(1)
(2)
式中,θ′={W(2),b(2)}為解碼網絡的權值參數(shù)和偏置。式(1)和式(2)中,s()為神經元的激活函數(shù),如tanh或sigmoid。
通過對輸入數(shù)據(jù)進行先編碼后解碼的過程,可以在網絡的輸出得到輸入數(shù)據(jù)的重構表示,自編碼神經網絡通過最小化重構誤差[48]完成訓練,其中重構誤差用下面的代價函數(shù)來衡量:
(3)
從數(shù)據(jù)重構的角度來看,對于一個訓練好的自編碼神經網絡而言,如果去掉網絡的解碼部分,對任意給定的新的輸入,利用網絡參數(shù)可以通過編碼計算,得到中間隱含層的激活值向量。一般可以認為是對原輸入更好的表達向量,即提取的特征向量。自編碼神經網絡的特征提取模型示意圖如圖2所示。
圖2 自編碼神經網絡特征提取模型示意圖
在學習過程中,SAE的參數(shù)通過最小化成本使用反向傳播來調整稀疏約束內的函數(shù)。稀疏性約束在隱藏層上工作以限制其單位使它成為稀疏向量,其中大多數(shù)元素為零或接近于零。對于自動編碼的網絡結構,具有S形激活功能的神經元處于活躍狀態(tài)如果輸出接近1則顯示狀態(tài),如果輸出接近0則顯示非活動狀態(tài)。因此,稀疏性約束被引入來限制大多數(shù)神經元在大多數(shù)時候不活動。
圖3 去噪自編碼神經網絡的概念
隱藏單元j的激活由aj(x)表示,并且隱藏單元j的平均激活如下:
(4)
(5)
m訓練樣例的訓練集{x(1),y(1)..., (x(m),y(m)}表示,原始成本函數(shù)被定義為:
(6)
式(5)中的第一項是平均平方和誤差術語,第二項是正則化項或權重衰減項,這些往往會減少權重。這里,W和b與(1)和(2)中的相同,和λ是權重衰減參數(shù)。通過添加稀疏懲罰項,成本函數(shù)被修改為:
(7)
其中:β代表稀疏性懲罰項的權重。
盡管描述了上述過程,學習功能很好地提高了性能并且預測模型的泛化能力仍在繼續(xù)由于在現(xiàn)實世界數(shù)據(jù)中出現(xiàn)的噪音和異常值而面臨挑戰(zhàn)。為了強制隱藏層發(fā)現(xiàn)更強大的功能,可以重建來自損壞版本的輸入來訓練自編碼神經網絡,它是自編碼神經網絡去噪的理念如圖4所示。
圖4 兩層堆疊稀疏自編碼神經網絡和邏輯回歸
(8)
標準方法是通過將x元素的隨機分數(shù)設置為零來將掩蔽噪聲應用于原始數(shù)據(jù)。接下來,損壞的數(shù)據(jù)x通過一個基本的自編碼神經網絡進程并映射到一個隱藏表示:
(9)
從這個等式,我們重建:
z=gθ′(y)
(10)
在最后階段,訓練參數(shù)以最小化平均重建誤差:
LH(x,z)=H(Bx‖Bz)
(11)
作為一個典型的深度神經網絡,堆疊自編碼神經網絡由多層稀疏或去噪自編碼神經網絡和邏輯回歸組成。堆疊自編碼神經網絡的每一層的輸出都連接到后續(xù)層的輸入。兩層架構堆疊稀疏自編碼神經網絡如圖5所示。每個稀疏或者去噪自編碼神經網絡生成輸入的表示(來自飛機發(fā)動機傳感器的數(shù)據(jù))比前一層更抽象和更高維度,因為它是通過應用額外的非線性變換來獲得的。將稀疏自編碼神經網絡的最后一層的輸出輸入到BP神經網絡中,然后獲得結果(發(fā)動機壽命值)
圖5 堆疊自編碼神經網絡結構示意圖
微調的過程主要集中在調整SAE網絡中的權重,從而獲得更好的預測性能。首先,前饋用于計算激活所有自編碼神經網絡層。在下一步中,我們設置δ(nl)=-(△anlJ)*f1(znl)作為輸出層,在△J=θ(I-P)中,I是輸入標簽,P是條件概率的向量。然后,對于圖層l=nl-1,nl-2,..., 3, 2,我們設定δ(l)=((W(1))Tδ(l+1))*f′(znl),然后,所需的偏導數(shù)是:
△WlJ(W,b;x,y)=δ(l+1)(a(1))T,
△blJ(W,b;x,y)=δl+1
(12)
其中:W,b和a如式(1)和(2)所示。最后,使用批量梯度下降算法最小化整體成本函數(shù)。
基于堆疊自編碼網絡的航空發(fā)動機壽命預測方法結合了堆疊自編碼網絡模型和BP分類模型,先通過堆疊自編碼網絡提取航空發(fā)動機傳感器數(shù)據(jù)特征,再對提取特征進行結果分類, 具體診斷流程如圖6所示,具體步驟如下:
1)通過多個傳感器采集航空發(fā)動機狀態(tài)參數(shù)。
2)對每一組原始信號進行預處理,以構造足夠的訓練數(shù)據(jù)集,提高網絡的訓練效果。
3)將各組樣本數(shù)據(jù)分別輸入到網絡模型中,利用逐層貪婪算法和BP反向傳播算法對網絡進行訓練。
4)堆疊自編碼網絡經過訓練后可以學習隱含在樣本數(shù)據(jù)中的知識,從而在其高層隱含層處獲得樣本數(shù)據(jù)的特征向量。
5)將所有的特征向量進行合并,組合成為一個特征向量。
6)將合并的特征向量輸入到BP模型中,在模型輸出層得到預測的發(fā)動機壽命值區(qū)間。
圖6 基于堆疊自編碼網絡的航空發(fā)動機壽命預測過程
為檢驗故障診斷方法的有效性,選擇驗證案例的數(shù)據(jù)來源于2008年PHM國際會議預測挑戰(zhàn)競賽,挑戰(zhàn)數(shù)據(jù)集包括多個多變量時間序列,這些時間序列是通過發(fā)動機系統(tǒng)的動態(tài)模擬收集的。該模型模擬了發(fā)動機的5個旋轉部件(風扇,低壓壓氣機,高壓壓氣機,高壓渦輪和低壓渦輪)中的任何一個部件損壞的情況,發(fā)動機示意圖如圖7所示。 該數(shù)據(jù)集包含了45918(218個周期劣化)組數(shù)據(jù)用于訓練,和29820組數(shù)據(jù)(218個周期劣化)用于測試。
圖7 渦扇發(fā)動機示意圖
每個發(fā)動機單元的每個循環(huán)的完整數(shù)據(jù)集包括單元ID,操作循環(huán)指數(shù),操作狀態(tài)設置和典型的傳感器測量。 總共21個傳感器(如表1所示)安裝在飛機發(fā)動機的不同部件中。
表1 飛機氣體的傳感器信號的描述渦輪發(fā)動機
R:朗肯溫度標度; psia:每平方英寸絕對磅;rpm:每分鐘轉數(shù); pps:每平方英寸的脈沖; lbm / s:磅每秒質量。
數(shù)據(jù)組的每個劣化周期內都包含了5類發(fā)動機機操作狀態(tài),包括了馬赫數(shù)、油門桿位置、大氣高度,我們提取了其中一個劣化周期內相同操作狀態(tài)的數(shù)據(jù)如圖所示,我們從圖8中的21個傳感器參數(shù)數(shù)據(jù)可以看出,有些參數(shù)在劣化過程中變化不明顯,有些參數(shù)數(shù)據(jù)隨著發(fā)動機狀態(tài)劣化變化趨勢明顯。僅憑人工分析,很難分析出發(fā)動機壽命規(guī)律。
圖8 發(fā)動機退化過程部分傳感器信號
首先為了分析網絡各層的訓練情況,做出代價函數(shù)的誤差曲線圖,如圖9所示。從圖中可以看出,第一隱含層的預訓練在迭代至150步時,代價函數(shù)的誤差值趨于零且波動性較小,可以說明此時網絡達到收斂;同理,第二隱含層約在50步時達到收斂,輸出層約在100步時達到收斂,網絡微調過程則約在200步時達到收斂。結果表明網絡各層預訓練及網絡微調的重構誤差均達到收斂,說明此時的網絡結構及超參數(shù)的設置是較為合理的。
圖9 代價函數(shù)誤差曲線圖
下面利用所提方法對航空發(fā)動機狀態(tài)數(shù)據(jù)進行分析,首先給發(fā)動機劣化數(shù)據(jù)打上壽命區(qū)間標簽,再對其進行特征提取,并實現(xiàn)壽命預測。首先是訓練樣本的構造:將每一個發(fā)動機狀態(tài)參數(shù)的操作數(shù)歸一化,將歸一化的數(shù)據(jù)分類到10個區(qū)間范圍內,構成數(shù)據(jù)壽命標簽,完成訓練樣本的構造。實驗中,選用測試集數(shù)據(jù)用于測試。然后是網絡參數(shù)設置:將訓練樣本輸入到深度網絡中進行訓練,并確定網絡隱含層神經元個數(shù),得到訓練好的網絡模型結構為24-125-75-10,即網絡共有4層,每層神經元個數(shù)分別為24、125、75、10,其他網絡參數(shù)的設置見表2。最后,訓練結束后可在第二隱含層處獲得提取的特征向量,并在輸出層得到分類結果。
表2 網絡參數(shù)設置表
為了使分類結果穩(wěn)定,分類測試共進行50次,統(tǒng)計50次的誤判樣本個數(shù),并取其平均值作為統(tǒng)計結果。同時為了對比說明,采用相同的實驗方法利用單層自編碼網絡對航空發(fā)動機數(shù)據(jù)進行特征提取,對比兩種方法的分類結果,如表3所示。
表3 分類結果對比表
表中結果顯示,與自編碼神經網絡相比,利用堆疊自編碼神經網絡提取的特征在訓練樣本集和測試樣本集上均具有較高的分類正確率,這說明在實際應用中,堆疊自編碼神經網絡提取的特征具有較好的可區(qū)分性,而且能夠減小工況干擾的影響。
文中,基于深度學習開發(fā)了一種新的數(shù)據(jù)驅動的發(fā)動機剩余方法,該方法可以自己捕獲有效的非線性特征并減少人工干預。基于堆疊自編碼神經網絡是一種深度學習模型,它不僅能夠對發(fā)動機退化過程進行較好的建模,而且能夠充分挖掘數(shù)據(jù)內部信息,提取有效特征,排除無關數(shù)據(jù)。將所提出的基于堆疊自編碼神經網絡的預測航空發(fā)動機剩余壽命方法應用于2008 PHM數(shù)據(jù)挑戰(zhàn)數(shù)據(jù)集以證明所提出方法的有效性。實驗結果顯示預測精度達到預期,并用單層自編碼神經網絡和堆疊自編碼神經網絡做了對比,對別結果顯示堆疊自編碼神經網絡在特征提取過程中有更好的效果,預測準確率更高。所研究的航空發(fā)動機壽命預測方法有助于提高飛機發(fā)動機的安全性,預測和管理飛機發(fā)動機的健康狀況,降低維護成本。