李 杰,孟凡熙,張子辰,朱 瑋
(長安大學電子與控制工程學院,陜西 西安 710064)
在飛機起動和起飛階段, 其排氣溫度(exhaust gas temperature,EGT) 和排氣溫度裕度(exhaust gas temperature margin, EGTM) 是一種與發(fā)動機狀態(tài)及性能強相關(guān)的氣路參數(shù), 是航空發(fā)動機健康管理監(jiān)測的重要參數(shù)之一[1-2]。 航空公司在實際運營中,通過監(jiān)測及預測飛機EGTM 的變化情況, 了解飛機發(fā)動機的健康狀態(tài), 對于發(fā)動機運行的安全性與經(jīng)濟性具有重要意義。 隨著人工智能技術(shù)的發(fā)展,以大數(shù)據(jù)為基礎的深度學習算法在壽命預測方向的成功應用為EGTM 的預測提供了新的思路。 例如,Ding 等[3]提出了一種基于卷積神經(jīng)網(wǎng)絡 (comvolutional nearal network,CNN)的鋰電池剩余使用壽命預測和健康管理方法,使用CNN 捕獲剩余信號中的預期成分,具有較好的預測穩(wěn)定性。Miao 等[4]設計并建立了以長短期記憶網(wǎng)絡(long-short term memery,LSTM)為基礎的雙任務深長短時記憶網(wǎng)絡, 用于航空發(fā)動機退化評估和剩余使用壽命預測的聯(lián)合學習。 Ren[5]提出了一種基于改進CNN 和LSTM 的鋰電池壽命預測方法,來挖掘有限數(shù)據(jù)中的深層信息。
經(jīng)驗模態(tài)分解 (empirical mode decomposition,EMD)[6-7]和CNN-LSTM 相融合的EGTM 預測方法,采用EMD 將原始EGTM 序列分解為多個固有模態(tài)分量和殘差分量, 從而從不同模態(tài)上, 進一步解釋了EGTM 信號的物理含義,將所得分量作為卷積長短期記憶網(wǎng)絡模型輸入,加深了神經(jīng)網(wǎng)絡對EGTM 信號的理解。 為了驗證該方法的有效性,設計了多層感知機(multi-layer perceptron,MLP)、CNN、 循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)、LSTM 和CNNLSTM作為競爭模型,對比驗證了所提出模型的性能。
EGTM 定義為航空發(fā)動機在海平面壓力以及拐點溫度條件下,全功率起飛時發(fā)動機排氣溫度(EGT)與EGT 最大值之間的差值TEGM計算方法為
式中:TEmax為發(fā)動機最大排氣溫度,℃,即發(fā)動機工作過程中,所容許出現(xiàn)的排氣溫度最大值,是該型發(fā)動機設計廠商給定的重要設計參數(shù);TEa為發(fā)動機處于全功率狀態(tài)時的排氣溫度值,℃,當發(fā)動機處于起飛狀態(tài)時,應對其進行檢測,為反映發(fā)動機健康狀態(tài)的關(guān)鍵參數(shù)之一,即EGTM 包含了該型發(fā)動機在翼劣化程度的信息。
本文采用某航空公司的某型30 臺民航發(fā)動機在采樣頻率為200 個飛行循環(huán)(Cycle)下的EGTM歷史測量數(shù)據(jù)(同一測量環(huán)境)作為數(shù)據(jù)集,以評價所提出模型的性能。 本文將隨機選取的25 臺民航發(fā)動機的EGTM 數(shù)據(jù)作為訓練集(包含1 465 個工作點,飛行循環(huán)次數(shù)為1 465×200=293 000 次),剩余5 臺民航發(fā)動機的EGTM 數(shù)據(jù)作為測試集(包含291 個工作點,飛行循環(huán)次數(shù)為291×200=58 200 次)。
圖1 展示了該30 臺民航發(fā)動機的EGTM 數(shù)值的正態(tài)分布情況,由圖可知,數(shù)據(jù)整體符合以均值為70 ℃的正態(tài)分布(對稱分布),這將有利于訓練集和測試集的劃分。 值得注意的是,當民航發(fā)動機在下發(fā)一段時間后, 排氣溫度裕度處在以均值70 ℃為中心的[60 ℃,80 ℃]范圍內(nèi)的點占比最高,可反映此時民航發(fā)動機處于穩(wěn)定的工作狀態(tài)。 若當EGTM 值下降到60 ℃附近時,可說明該型民航發(fā)動機將由穩(wěn)定工作區(qū)過渡到[50 ℃,60 ℃]的敏感工作區(qū),此時可將60 ℃作為敏感點。若當EGTM的值持續(xù)下降時,[40 ℃,50 ℃]的點的數(shù)量出現(xiàn)了驟降情況, 這意味著該型民航發(fā)動機開始出現(xiàn)了不同程度的性能衰退現(xiàn)象, 即由敏感區(qū)域過渡到衰退區(qū)。
圖1 民航發(fā)動機EGTM 的數(shù)據(jù)分布Fig.1 Data distribution of EGTM of civil aviation engine
另外,處在[105 ℃,120 ℃]范圍內(nèi)的點可作為航空發(fā)動機的出廠數(shù)據(jù), 其幅值較大且占比最小,不能準確反映實際的工作狀態(tài), 且處在30 ℃以下范圍內(nèi)的點接近于失效狀態(tài),即不在1%~99%范圍內(nèi)的數(shù)據(jù)點參與訓練時,可能會導致預測模型在過擬合,對EGTM 預測的準確度產(chǎn)生較大影響,即考慮將其在后續(xù)模型的訓練過程中予以剔除。 同時,為了提升模型的收斂速度和模型精度,本文采用線性函數(shù)歸一化(max-min normalization)方法,將EGTM數(shù)值轉(zhuǎn)換為區(qū)間(0,1)內(nèi)的小數(shù)。 歸一化方法如下
式中:X 為原始數(shù)據(jù),x?為歸一化后的數(shù)據(jù)。
由于EGTM 數(shù)據(jù)和時間有著很高的依賴關(guān)系,這種依賴關(guān)系是處理時間序列的關(guān)鍵,所以需要選擇合適的時間窗口捕獲這些依賴關(guān)系。 在原始數(shù)據(jù)中通過滑動時間窗口來生成網(wǎng)絡輸入,從而生成大小為D@S 的樣本序列進行模型訓練,其中S 表示窗口寬度,D 表示數(shù)據(jù)特征維度(本文為1)。 假設第一個輸入的樣本序列可由S1=[x1,x2,…,xS]表示,當滑動時間窗口滑動L 步之后, 可得第2 個輸入樣本序列S2=[x1+L,x2+L,…,xS+L],其中xi∈R1×D。 若當訓練數(shù)據(jù)共有φ 個采樣點時,則可獲得(φ-S×L+1)個樣本序列。
在上述序列的構(gòu)造基礎上,對每個輸入樣本序列添加相應的標簽。 設所需要預測的時間標簽的個數(shù)為N(N≥1),則S1的標簽可表示為y1=[xS+1,xS+2,…,xS+N],S2的標簽可表示為y2=[xS+L+1,xS+L+2,…,xS+L+N],不失一般性地可以為所有的樣本序列添加相應的標簽。 同時若需要預測某個時間段內(nèi)的EGTM 時,則僅需要一個寬度為S,高度為D 的時間窗口大小的數(shù)據(jù)即可。
在本文中,為了能夠及時預測出EGTM 的變化趨勢,取滑動步長L(N 與L 代表相同的含義,只是為了方便表示)的長度為1,即實時預測相鄰時刻的EGTM 值,同時考慮到EGTM 的非線性,若S 取值較大時, 則樣本序列之間的相關(guān)程度會變得稀疏,容易使得CNN 丟失有用的信息; 因此S 的取值不宜過大。 經(jīng)過多次試驗發(fā)現(xiàn),當取S 取值為7 時,可滿足相關(guān)的實驗要求。
民航發(fā)動機EGTM 受到多方面因素的影響,例如發(fā)動機氣動核心部件的氣動效率,外界大氣溫度的變化等,表現(xiàn)出了非線性、波動性的特點。 非線性和波動性會直接影響EGTM 預測的準確性,因此需要對排氣溫度裕度數(shù)據(jù)進行初步處理。EMD 可以將具有非線性和非平穩(wěn)性特點的原始信號序列,如EGTM 序列, 通過經(jīng)驗識別分解為更為穩(wěn)定的一系列內(nèi)涵模態(tài)分量(intrinsic oscillatory mode,IMF)和一個殘差項(residual model,Res),其中殘差項可作為EGTM 變化的長期趨勢模態(tài),即[6]
式中:X(t)為EGTM 原始序列;IMFi(t)為X(t)分解出來的第i 個IMF 分量;m 為IMF 分量數(shù)目,r(t)為殘差項;t 為序列的時間尺度,本文中t=15 min。 由于IMF 分量必須滿足兩個約束條件[6]:
1) 在整個時間序列上,IMF 分量的極值點和過零點的個數(shù)必須相等或相差不超過一個;
2) 任意時刻,IMF 分量的局部上、 下包絡線均值為0;因此所分解出的IMF 分量較為平穩(wěn),弱化了原始信號中包含的非線性和波動性成分,通過預測每個IMF 分量,可緩解EGTM 數(shù)據(jù)的非線性和波動性對預測結(jié)果的影響。
本文提出了一種基于CNN-LSTM 的深度融合模型用來建立EGTM 的IMF 分量預測模型,該網(wǎng)絡包括兩層卷積神經(jīng)網(wǎng)絡和兩層長短期記憶網(wǎng)絡,其中每層卷積神經(jīng)網(wǎng)絡均由卷積層和池化層組成,如圖2 所示。
圖2 CNN-LSTM 模型結(jié)構(gòu)Fig.2 Structure of the CNN-LSTM model
圖2 所示模型首先利用CNN 強大的空間提取能力從IMF 分量的時間窗信息數(shù)據(jù)中提取出隱藏特征,實現(xiàn)數(shù)據(jù)的降維,以捕獲所提取特征中的重要信息,并且可有效抑制噪聲信號;其次,EGTM 的衰退過程是有關(guān)時間序列的, 所以將CNN 提取的重要特征通過全連接層拼接后作為LSTM 的輸入;隨后充分利用LSTM 的順序敏感性提取數(shù)據(jù)中的時間特征,即根據(jù)長短期記憶層中某一時刻的單元狀態(tài)和網(wǎng)絡輸出值,進行EGTM 有關(guān)時間的衰退特征的提取,建立EGTM 預測模型;最后將測試集放入模型中,實現(xiàn)對數(shù)據(jù)的擬合,輸出預測的EGTM 值。
融合模型中的長短期記憶網(wǎng)絡如圖3 所示。 首先, 細胞狀態(tài)中的信息通過遺忘門進行選擇性遺忘,即進行選擇性記憶;其次,新的信息通過輸入門選擇性地記錄到細胞狀態(tài)中;最后將前面的信息通過輸出門保存到隱層中去。
圖3 單個LSTM 單元的內(nèi)部結(jié)構(gòu)Fig.3 Internal structure of a single LSTM unit
在t 時刻,細胞狀態(tài)的更新過程如下[8-9]
式中:it為輸入門的計算結(jié)果;ft為遺忘門的計算結(jié)果;Ot為輸出門的計算結(jié)果;xt以及ht-1分別作為t時刻的輸入以及上一時刻的LSTM 輸出值, 且將兩者進行拼接, 作為t 時刻的輸入狀態(tài);Wf、Wi、Wc和Wo分別對應遺忘門、 輸入門和輸出門的權(quán)值矩陣,bf、bi、bc和bc為相應的偏置矩陣;Ct-1為舊的細胞狀態(tài),ft×Ct-1為遺忘門決定忘記的狀態(tài)信息,為新的候選值向量,Ct為更新后的細胞狀態(tài)(t 時刻細胞狀態(tài));“×”表示兩個向量按元素相乘,σ(*)為sigmoid激活函數(shù),th(*)為tanh 激活函數(shù)。
神經(jīng)網(wǎng)絡的層數(shù)和各層神經(jīng)元數(shù)目對訓練結(jié)果有重要影響,即訓練時間和訓練難度隨著神經(jīng)網(wǎng)絡層數(shù)加深而增加,可能會出現(xiàn)過擬合問題,因此并不能依靠增加網(wǎng)絡層數(shù)和神經(jīng)元數(shù)目來提高訓練結(jié)果。 經(jīng)過多次實驗發(fā)現(xiàn),建立如表1 所示的神經(jīng)網(wǎng)絡時,可獲得最優(yōu)結(jié)果。
表1 模型參數(shù)設置Tab.1 Parameter settings of the model
本文所有算法是在Python3.7 和PyCharm 2019上運行的,計算設備是Intel Core i5-8250U CPU,8 GB RAM 計算機。
選用平均絕對誤差(mean absolute error,MAE),均方根誤差(root mean square error,RMSE)以及擬合優(yōu)度R2作為本文所提出算法的性能指標,對EGTM 的預測性能做評價。 其中MAE 和RMSE,R2分別衡量預測值與真實值之間的誤差,以及評價預測值與真實值之間預測擬合度,且定義MAE 為損失函數(shù)(Loss)。 MAE,RMSE 以及R2的計算方法為[10]
從MAE、RMSE 以及R2的表達式可知,當預測值與真實值越接近時,MAE,RMSE 的值越小,R2值越大,即誤差越小,擬合度越高,模型的準確度和精度越高。
EGMT 序列經(jīng)過EMD 進行經(jīng)驗模態(tài)分解后,得到8 個IMF 分量和1 個殘差項(Residual),如圖4 所示。 由圖4 可知,單臺發(fā)動機原始的EGTM 具有較為明顯的下降趨勢,但原始EGTM 數(shù)據(jù)仍然存在波動性和不穩(wěn)定性。 經(jīng)過EMD 分解后的殘差分量的趨勢與原始數(shù)據(jù)相符,且殘差分量具有較大的幅值,但相較于原始數(shù)據(jù)而言更加平滑穩(wěn)定。 相較而言,IMFS 分量存在不同程度的波動,包含短期波動,如IMF1~IMF4 分量;中期波動,如IMF5~IMF6,短期波動,如IMF7~IMF8,且IMFS 分量具有較小的幅值, 這說明IMFS 分量代表了原始數(shù)據(jù)中的多種波動成分, 體現(xiàn)出原始數(shù)據(jù)的波動性。 由此可見,IMFS 分量決定了原始數(shù)據(jù)的波動性, 是原始數(shù)據(jù)不穩(wěn)定的原因;殘差分量決定了原始數(shù)據(jù)的整體趨勢,是原始數(shù)據(jù)的主要組成部分。對IMFS 的精準預測有利于提高預測精度,而對殘差分量的精準預測是整體預測結(jié)果準確的關(guān)鍵。
圖4 EMD 分解結(jié)果Fig.4 The result of EMD decomposition
本節(jié)設計了MLP,CNN,RNN 和LSTM 等深度神經(jīng)網(wǎng)絡模型作為競爭模型, 對比驗證所提出的EMD-CNN-LSTM 組合預測模型的精度和可靠性,同時為了驗證EMD 的貢獻, 考慮競爭模型在EMD作用下的預測性能。
圖5 展示了上述不同模型在訓練過程中的損失函數(shù)變化情況,其中橫坐標表示模型訓練過程中的迭代次數(shù)。
圖5 訓練過程中的loss 值變化Fig.5 Iterative trend of loss value during training
由圖5 可知,競爭模型的損失函數(shù)在迭代過程中存在不同程度的波動情況,這說明競爭模型在訓練過程中陷入了局部最優(yōu)點。 而EMD-CNN-LSTM的損失函數(shù)在迭代過程中不存在波動情況,且保持較低的穩(wěn)定值。
在上述訓練的基礎上,為了全面展示所提模型的性能, 隨機從測試集中選擇一臺發(fā)動機進行分析,結(jié)果如圖6 所示。 圖6 中展示了不同的深度神經(jīng)網(wǎng)絡模型預測的EGTM 變化趨勢。 由圖6 可知,在EGTM 的早期預測時,所有模型均存在不同程度的波動, 導致其無法準確捕捉到EGTM 的變化趨勢,即敏感區(qū)域內(nèi)EGTM 的準確預測的實際意義更大,這是因為敏感區(qū)域內(nèi)的EGTM 較低,發(fā)動機會接近維修或者下發(fā)邊界,若能提前準確獲知隨后飛行循環(huán)中EGTM 的變化情況, 可為發(fā)動機及時維修、維護、飛行計劃制定提供技術(shù)依據(jù)。 在EGTM 處于敏感區(qū)域內(nèi)時,競爭模型均不同程度地偏離真實值,CNN-LSTM 也出現(xiàn)了較為嚴重的超前預測或滯后預測情況,這說明原始數(shù)據(jù)的非線性和非平穩(wěn)性對于EGTM 的準確預測具有嚴重的干擾作用。 在EMD的作用下,CNN-LSTM 的預測偏離有所改善,其在敏感區(qū)域內(nèi)展示出了最好的精確度和穩(wěn)定性。 測試集中的預測結(jié)果如表2 所示。
圖6 單一民航發(fā)動機的EGTM 預測Fig.6 EGTM prediction results of a single civil aviation engine
表2 實驗結(jié)果的比較Tab.2 Comparison of the experimental results
由表2 可知, 相較于MLP,CNN,RNN,LSTM,CNN-LSTM 等競爭模型,EMD-CNN-LSTM 的MAE分別下降了62.98%,48.40%,56.50%,47.28%,37.82% ;RMSE 分 別 下 降 了62.06% ,48.53% ,53.49%,44.44%,33.01%;R2分別上升了5.31%、2.59%,3.12%,1.95%,1.02%, 另外, 相較于EMDMLP,EMD-CNN,EMD-RNN,EMD-LSTM 等模型,EMD-CNN-LSTM 的MAE 分別下降了33.56%,37.01%,28.15%,20.49%;RMSE 分別下降了38.05%,29.29%,25.53%,24.29%;R2分別上升了1.22%,0.92%,0.71%,0.51%。 預測結(jié)果的誤差范圍在一定程度上可以反映預測結(jié)果的穩(wěn)定性。
圖7 展示了模型在測試集下的預測誤差分布圖。
圖7 不同模型的預測誤差范圍比較Fig.7 Comparison of the prediction error ranges ofdifferent models
由圖7 的箱線圖可知,EMD-CNN-LSTM 的1%~99%的預測誤差落在[-4,4]范圍內(nèi),遠小于其他模型的分布范圍,且[-0.2,0.2]范圍內(nèi)的誤差值占比最高,且更接近于0,同時并沒有出現(xiàn)異常點,這表明所提出的模型具有最佳的預測穩(wěn)定性。
為了驗證所提出模型的單點預測性能,本文對測試集的EGTM 預測值和EGTM 真實值通過回歸函數(shù)進行線性回歸分析, 回歸函數(shù)可以表示由式(13)所示。
其中:Y 為預測值;T 為真實值;θ 和b 分別為最佳線性回歸直線的截距和斜率。
由回歸函數(shù)的定義式可知,在理想條件下,5 臺發(fā)動機的所有預測值完全等于其真實值時,回歸曲線是一條斜率為1,截距為0 的直線。同時為了進一步強化回歸的可靠性,引入R(皮爾遜相關(guān)系數(shù))表示所提模型的EGTM 預測趨勢與實際的EGTM 變化趨勢的相關(guān)性,R 值越大相關(guān)性越強。
由表3 統(tǒng)計的回歸參數(shù)可知, 相較于競爭模型,所提模型的R 具有最大值,這說明,所提模型的EGTM 預測趨勢與實際的EGTM 變化趨勢具有較強的相關(guān)性,即融合模型對于EGTM 的變化趨勢具有較好的跟隨性。 同時結(jié)合斜率θ 和截距b 的指標進一步分析可知,所提出模型的回歸直線最接近于理想狀態(tài),即擬合效果最優(yōu)。
表3 擬合分析的參數(shù)比較Tab.3 Parameter comparison of fitting analysis
1) EMD 使得神經(jīng)網(wǎng)絡實現(xiàn)了對EGTM 時間序列在不同模態(tài)上的深入理解,全面提升了神經(jīng)網(wǎng)絡的預測效果。 CNN 和LSTM 兩者融合可實現(xiàn)數(shù)據(jù)的深度挖掘,從而提升了EGTM 預測的準確度、穩(wěn)定性。
2) 當EGTM 處于敏感區(qū)域時, 競爭模型的預測值與真實值出現(xiàn)了較大的偏差,即出現(xiàn)了較為嚴重的滯后或超前預測,而EMD-CNN-LSTM 仍能保持較好的預測精度及穩(wěn)定性。 這表明了所提出的融合神經(jīng)網(wǎng)絡在EGTM 預測中具有較好的適用性。