曹惠玲,徐文迪,湯鑫豪,崔科璐,王 冉
(中國民航大學航空工程學院,天津 300300)
基線方程是指同一類型發(fā)動機(或新發(fā)動機)在標準狀態(tài)下的性能參數(shù)與控制量等飛行參數(shù)之間的函數(shù)關系。在航空發(fā)動機狀態(tài)監(jiān)控和故障診斷中,性能參數(shù)換算值與基線值之間的偏差反映了發(fā)動機的健康狀態(tài),其精確度對監(jiān)控和診斷結(jié)果具有決定性影響。航空發(fā)動機的基線模型內(nèi)置于制造商的狀態(tài)監(jiān)控系統(tǒng)中,航空承運人難以獲取。目前,航空公司主要依靠飛機通信尋址與報告系統(tǒng)(ACARS,aircraft communications addressing and reporting system)報文與廠家提供的監(jiān)控軟件進行發(fā)動機狀態(tài)監(jiān)控和故障診斷。為提高監(jiān)控自主性,減少技術及數(shù)據(jù)依賴,必須自主獲取發(fā)動機基線。國內(nèi)的發(fā)動機基線挖掘方法主要有兩種:①模仿OEM(original quipment manufacturer),采用試車數(shù)據(jù)建立基線庫;②根據(jù)監(jiān)控管理系統(tǒng)返回的測量值和偏差值反求基線點并建立基線模型。其中,前者需要大量試車數(shù)據(jù),耗費大、試驗時間長,并不適用于對已投入市場的歐美發(fā)動機建立基線庫;后者可利用發(fā)動機運行數(shù)據(jù),通過監(jiān)控系統(tǒng)提供的偏差值及QAR(quick access recorder)數(shù)據(jù)反推基線方程,對于正在運營的發(fā)動機,該方法已被普遍接受。
林兆福等[1]較早開始研究發(fā)動機基線方程的建立方法,根據(jù)ECM II 系統(tǒng)提供的部分數(shù)據(jù),通過最小二乘曲線擬合方法建立基線方程,同時認為基線與飛行參數(shù)有很大關系,并受發(fā)動機操作狀態(tài)的影響。另有學者采用監(jiān)控管理系統(tǒng)返回數(shù)據(jù)建立基線,應用函數(shù)逼近法建立二次多項式函數(shù)待定系數(shù)求解模型,然后采用高斯迭代算法求解多元非線性超靜定方程[2-6]。付金華等[7]、閆鋒等[8-9]針對機載ACARS 系統(tǒng)下載的飛行原始數(shù)據(jù),基于神經(jīng)網(wǎng)絡進行基線建模。曹惠玲等[10]根據(jù)QAR 數(shù)據(jù)通過支持向量回歸機(SVR,support vector regression)進行基線挖掘,有效提高了發(fā)動機基線監(jiān)控的準確性。對比歸納上述各類方法的適用條件及效果,可為利用基線進行航空發(fā)動機狀態(tài)監(jiān)控提供理論參考。
由于發(fā)動機生產(chǎn)廠家和各航空公司實行數(shù)據(jù)保密,真實數(shù)據(jù)較難獲取,不同學者在進行基線挖掘時采用的數(shù)據(jù)源并不相同,使得基線挖掘的步驟及準確性受到影響。可采用以下3 種數(shù)據(jù)來源進行基線擬合:ACARS 數(shù)據(jù)、QAR 數(shù)據(jù)和模擬數(shù)據(jù)。
ACARS 是航空器和地面站之間通過無線電或衛(wèi)星傳輸報文的數(shù)字數(shù)據(jù)鏈系統(tǒng)[11],每次空地循環(huán)均產(chǎn)生一定數(shù)量的報文數(shù)據(jù),利用該數(shù)據(jù)進行基線擬合是較為準確的數(shù)據(jù)挖掘方法。首先獲取ACARS 報文數(shù)據(jù)并進行相似修正,同時通過監(jiān)控軟件獲取相應的偏差值。然后通過得到的修正值與偏差值反求基線點。再用不同時刻的基線點通過不同擬合方法得到發(fā)動機基線方程。
發(fā)動機工作時各部件不同位置的傳感器可獲取大量運行數(shù)據(jù),除少數(shù)經(jīng)DMU(data management unit)通過VHF(very high frequency)通信系統(tǒng)以ACARS 數(shù)據(jù)實時傳送至地面飛行數(shù)據(jù)處理工作站外,大量運行數(shù)據(jù)以QAR 形式儲存并離線傳遞。相比需要通過OEM 以高額費用獲取的ACARS 數(shù)據(jù),QAR 數(shù)據(jù)在航后可以直接下載讀取,為運營商對飛機及發(fā)動機的狀態(tài)監(jiān)控、故障診斷、趨勢預測提供重要的數(shù)據(jù)支持。利用QAR 數(shù)據(jù)進行基線擬合時,可使用QAR 原始數(shù)據(jù)直接擬合后的常態(tài)方程,結(jié)合偏差趨勢圖中性能參數(shù)的偏差值或由飛行循環(huán)數(shù)計算得到的衰退偏差量進行整體平移[10],得到發(fā)動機基線方程。
由于難以獲取真實數(shù)據(jù),一些學者利用航空發(fā)動機原理及飛行規(guī)律建立發(fā)動機模型,通過模擬數(shù)據(jù)研究基線方程獲取方法[11],重點是擬合方法的精確性,引入更好的數(shù)理方法或改良現(xiàn)有的擬合方法,從而得到更精確的擬合結(jié)果。
上述數(shù)據(jù)來源及準備過程存在差異,通過不同擬合方法得到的基線類型也不相同。以能否得到顯性表達式為標準,可將基線方程分為顯性方程和隱性方程,同時每種方程又對應不同的擬合方法。
顯性基線方程直觀、簡潔,工程應用較廣泛。龍江等[12]根據(jù)現(xiàn)有基線模型,建立單參數(shù)的二次模型,進行相關回歸分析。鐘詩勝等[4]引入新的擬合方法,通過高斯牛頓迭代法進行回歸分析,建立單參數(shù)二次關系的發(fā)動機基線模型,并在后續(xù)研究中利用試車臺數(shù)據(jù)建立三次回歸的基線模型[2]??紤]基線受多種因素影響,林兆福等[1]利用正交實驗設計原理及最小二乘曲線擬合原理建立多元非線性方程,對實際工程技術改進具有指導意義。以下介紹上述文獻中兩種較為常用的擬合方法。
2.1.1 最小二乘法
最小二乘法用于數(shù)據(jù)處理與優(yōu)化,以數(shù)據(jù)與其平均值偏差的平方和大小來衡量擬合效果,當平方和最小時,擬合效果最好。最小二乘法不僅可以簡便地擬合出曲線,而且具有較高的計算精度。
對于超靜定方程組AX=B,其中:A 為m×n 系數(shù)矩陣;X 為n 維未知數(shù)列向量;B 為m 維列向量;為選取合適的X 使等式成立,引入殘差平方和函數(shù)S,即
如果矩陣ATA 非奇異,則得到唯一的作為近似最優(yōu)解,即
利用最小二乘法原理,龍江等[12]建立的發(fā)動機EGT基線回歸模型為
2.1.2 高斯-牛頓迭代法
除傳統(tǒng)算法之外,鐘詩勝等[4]將非線性最小二乘問題逐次化為一系列線性最小二乘問題,對超定方程進行多元非線性回歸分析來迭代求解。
高斯-牛頓迭代法的基本思想是使用泰勒級數(shù)展開式去近似代替非線性回歸模型,然后通過多次迭代、多次修正回歸系數(shù),使回歸系數(shù)不斷逼近非線性回歸模型的最佳回歸系數(shù),最后使原模型的殘差平方和達到最小,其核心思想是利用泰勒展開式。設非線性回歸模型為
其中:r 為待估回歸系數(shù);誤差項εi~N(0,σ2)。設g(0)=為待估回歸系數(shù)r=(r0,r1,…,rp-1)′的初始值,將f(xi,r)在g(0)點附近作泰勒展開,并略去非線性回歸模型二階及二階以上的偏導數(shù)項,經(jīng)代入、移項得
令
則
用矩陣形式可將式(7)表示為
用最小二乘法對式(8)估計修正因子B(0),則b(0)=(D(0)′D(0))-1D(0)′Y(0),設g(1)為初次迭代值,則
為檢驗精確度,設殘差平方和為
高斯-牛頓法的優(yōu)點是在給定的初值較為合理的情況下,收斂速度非常快。基于上述數(shù)理理論,鐘詩勝等[4]建立了包含5 個性能參數(shù)的發(fā)動機基線,以EGT回歸模型為例,得到基線方程為
以神經(jīng)網(wǎng)絡、SVR 為代表的機器學習算法幫助人們更為有效地解決數(shù)據(jù)量龐大、關系復雜的實際問題,將其應用于航空發(fā)動機基線挖掘,有助于獲取更為準確的基線方程。王聃等[13]對現(xiàn)有的SVR、BP 神經(jīng)網(wǎng)絡算法進行改進,建立多參數(shù)發(fā)動機基線模型,得到了很好的挖掘效果;閆峰等[9]設計了以高斯函數(shù)為隱含層激勵函數(shù)、以線性函數(shù)為輸出層激勵函數(shù)的多參數(shù)RBF 神經(jīng)網(wǎng)絡,通過Pearson 相關性分析確定網(wǎng)絡的輸入節(jié)點,并使用該網(wǎng)絡預測N2 基線,為建立多參數(shù)隱性基線模型提供了一種新的思路。以下是兩種常見的隱性基線方程獲得方法。
2.2.1 神經(jīng)網(wǎng)絡
神經(jīng)網(wǎng)絡(NN, neural network)具備學習、聯(lián)想、記憶和模式識別等智能信息處理功能,可在大量數(shù)據(jù)中進行非線性運算和自主學習,并將學習結(jié)果分布存儲于網(wǎng)絡的突觸連接中,從而得到對現(xiàn)實中某種算法或函數(shù)的逼近[14],在模式識別、預測估計、自動控制等諸多領域中得到了廣泛應用,目前使用最多的是BP 神經(jīng)網(wǎng)絡結(jié)構。
BP 神經(jīng)網(wǎng)絡是一種多層前饋神經(jīng)網(wǎng)絡,是在現(xiàn)代神經(jīng)科學研究成果的基礎上提出的,具有極強的學習能力、自適應能力和容錯能力,如圖1 所示。其學習規(guī)則如下:①隨機取輸入值;②估計輸出結(jié)果與目標的誤差;③改變每層各神經(jīng)元的權重(weight),以求更小誤差。
圖1 BP 神經(jīng)網(wǎng)絡拓撲結(jié)構Fig.1 Neural network topology structure
對于中間層和輸出層的各個神經(jīng)元,輸入向量x=(x1,x2,…,xn),對應權值w=(w1,w2,…,wn)T,閾值b 以及激活函數(shù)f,則輸出向量o =(o1,o2,…,om),可由以下公式得到
其誤差函數(shù)為
其中:d 為期望輸出向量;yo 為輸出層輸出向量,q 為輸出層神經(jīng)元個數(shù)。采用Sigmoid 函數(shù)激活BP 神經(jīng)網(wǎng)絡,各隱含層節(jié)點對BP 網(wǎng)絡的輸出具有同等影響,因此BP 神經(jīng)網(wǎng)絡是對非線性映射的全局逼近。
2.2.2 支持向量回歸機
SVR 建立在統(tǒng)計學習理論和結(jié)構風險最小化原理基礎上,對于數(shù)據(jù)量較少的樣本具有優(yōu)異的建模能力;通過非線性核函數(shù),將輸入樣本空間映射到高維線性特征空間,能夠成功地處理回歸問題。
SVR 模型的原理在于根據(jù)樣本數(shù)據(jù),訓練集Dn={(xi,yi),i=1,…,q,xi∈Rp,yi∈R},在高維特征空間中構造最優(yōu)決策函數(shù),即
其中:映射函數(shù)φ(x):x→H 是將樣本點映射到高維空間的非線性變換。SVR 回歸分析可表示為
式中:xi為輸入向量;w∈Rp為權值變量;C 為懲罰系數(shù),控制對超出誤差樣本的懲罰程度;ε 為不敏感損失函數(shù),其值影響支持向量的數(shù)目;ζ 為松弛變量,表示樣本偏離ε 的程度。通過求解上述模型拉格朗日方程的對偶問題獲得原問題的最優(yōu)解,即
其中:K(xi,x)稱為核函數(shù),滿足Mercer 條件且K(xi,x)=(φ(xi)φ(x))。
工程中常采用雙發(fā)差異的監(jiān)控方式,即同一架飛機上的兩臺發(fā)動機互為基線,通過比較兩者性能參數(shù)的相對變化進行監(jiān)控。外界條件相同且運行正常時,左、右發(fā)動機的工作線趨勢基本相同、差異基本穩(wěn)定,即差異初值[15]。如果運行中出現(xiàn)較大差異,則意味著其中一臺發(fā)動機出現(xiàn)了異常,需進一步進行故障定位。
以PW4056 發(fā)動機為例,分別采用兩種方式所得基礎數(shù)據(jù),利用4 種常用擬合方法進行基線挖掘和性能對比。
PW4056 發(fā)動機的基線方程是發(fā)動機性能參數(shù)EGT、N1、N2、FF 經(jīng)修正后的換算值與控制量EPR 之間的函數(shù)關系。同時飛行高度H、計算空速V、大氣總溫TAT 等飛行參數(shù)也對性能參數(shù)產(chǎn)生影響[4,10]。由于4個性能參數(shù)在基線挖掘時的具體步驟、計算方法相似,因此以EGT 基線為例展開分析。
選用平均絕對誤差(MAE, mean absolute error)作為判斷基線擬合準確性的參考量,其定義為
其中:xi為樣本值;m(xi)為樣本對應的標準值;n 為樣本容量。MAE 數(shù)值與樣本值偏離標準值的大小程度成正相關,即MAE 越小整體誤差越小。
某航空公司一臺PW4056 發(fā)動機2013年6月1日至2013年6月30日的50 條ACARS 數(shù)據(jù)以及廠家給出的對應偏差值數(shù)據(jù)如表1 所示。
表1 ACARS 及偏差趨勢圖原始數(shù)據(jù)Tab.1 Original data from ACARS message and deviation tendency chart
經(jīng)過氣路參數(shù)標準化修正,通過偏差值反推得到基線點數(shù)據(jù)后,以EPR 為自變量,EGT 為因變量,分別利用最小二乘法、高斯牛頓迭代法、BP 神經(jīng)網(wǎng)絡、SVR進行基線方程挖掘。
采用最小二乘法和高斯-牛頓迭代法得到的基線方程分別為
EGTcorrect=193.491 7EPR2-216.681 8EPR+394.793 1
EGTcorrect=159.882 0EPR2-140.837 5EPR+
其中,高斯-牛頓迭代法的氣路修正方程為
采用單參數(shù)BP 神經(jīng)網(wǎng)絡和支持向量機得到的模型計算數(shù)值與原始數(shù)據(jù)對比如圖2 所示。
4 種挖掘方法的平均絕對誤差如表2 所示。由圖2、表2 可知,基線模型預測誤差均在±4%以內(nèi),精度相差不大,可以被工程上接受。由于偏差值數(shù)據(jù)是監(jiān)控系統(tǒng)通過對比基線庫數(shù)據(jù)與ACARS 數(shù)據(jù)所得,因此通過ACARS 數(shù)據(jù)和偏差值得到的基線點較準確,用各種挖掘方法得到的基線精度均較高。其中:高斯-牛頓迭代法計算時間最短,且直觀性好,方便工程使用;SVR 預測精度最高。
圖2 BP 神經(jīng)網(wǎng)絡和SVR 預測數(shù)據(jù)對比Fig.2 Predicted data comparison between BP neural network and SVR
表2 基于ACARS 數(shù)據(jù)的基線挖掘預測誤差對比Tab.2 Predicted deviation comparison among different detection methods based on ACARS data
為充分對比4 種方法的特點并分析QAR 數(shù)據(jù)挖掘的準確性,從上述同一臺發(fā)動機同時間的數(shù)據(jù)中篩選得到219 條QAR 數(shù)據(jù),對其進行相似修正,按照文獻[10]中的加權平均法求取整體偏差值后對QAR 數(shù)據(jù)進行平移,并通過4 種方法分別進行基線方程擬合,結(jié)果如圖3、表3 所示。
圖3 基于QAR 數(shù)據(jù)的不同基線模型預測數(shù)據(jù)對比Fig.3 Predicted data comparison among different detection methods based on QAR data
表3 基于QAR 數(shù)據(jù)的基線挖掘預測誤差對比Tab.3 Predicted deviation comparison among different detection methods based on QAR data
飛行過程中的各性能參數(shù)不僅由控制量EPR 決定,還受其他飛行參數(shù)影響,基于ACARS 數(shù)據(jù)進行挖掘時,這種偏差由監(jiān)控系統(tǒng)自動修正、通過偏差值得到反映,因而基于QAR 數(shù)據(jù)進行挖掘時若只考慮性能參數(shù)與控制量之間的關系進行挖掘會增大誤差。針對這種情況,應采用多參數(shù)BP 神經(jīng)網(wǎng)絡和SVR,以EPR 及其他飛行參數(shù)為輸入量進行基線挖掘,以獲得更好的準確度。
由圖3、表3 可知,計算發(fā)現(xiàn)通過QAR 數(shù)據(jù)得到的基線模型預測誤差比上節(jié)中略有增大,但都保持在±5%以內(nèi),MAE 在1.18%~1.47%之間,說明通過與ACARS 數(shù)據(jù)同源的QAR 數(shù)據(jù)進行基線挖掘具有很好的可行性。對比發(fā)現(xiàn)單參數(shù)擬合精度相似、誤差較大,采用多參數(shù)擬合后基線預測精度更高,相對于單參數(shù)擬合時BP 神經(jīng)網(wǎng)絡、支持向量機的MAE 分別減小15%和13%,說明以QAR 數(shù)據(jù)進行基線挖掘時多參數(shù)的BP 神經(jīng)網(wǎng)絡和SVR 有很好的可行性,而不宜采取單參數(shù)、顯性方程的基線挖掘方法。
原始數(shù)據(jù)與擬合方法均對基線挖掘產(chǎn)生影響,原始數(shù)據(jù)對準確性的影響更大。運用ACARS 數(shù)據(jù)能得到準確的基線點數(shù)據(jù),基線挖掘精度比QAR 數(shù)據(jù)高,因此在狀態(tài)監(jiān)控中優(yōu)先采用ACARS 數(shù)據(jù)。但ACARS數(shù)據(jù)量少、不易獲取,在條件限制下也可考慮采用同源、數(shù)據(jù)量大且更易獲得的QAR 數(shù)據(jù)作為替代,但在挖掘時必須考慮除控制量之外其他參數(shù)的影響。
利用ACARS 數(shù)據(jù)進行基線挖掘,各種方法的擬合精度相差不大,其中最小二乘法在數(shù)據(jù)量小、離散程度不大時表現(xiàn)出較高的精度和穩(wěn)定性和較小的計算量,因此優(yōu)先考慮最小二乘法。利用QAR 數(shù)據(jù)進行基線挖掘,考慮到實際工作過程中性能參數(shù)受各種外界條件的影響,單參數(shù)擬合精度下降,而SVR 適用于挖掘多個參數(shù)之間的函數(shù)關系,且與BP 神經(jīng)網(wǎng)絡相比,可通過少量數(shù)據(jù)獲得更高的精度和穩(wěn)定性,因此優(yōu)先采用SVR 進行基線挖掘。