劉涌泉, 李巍*, 牛偉, 羅旭東
(1.中國航空工業(yè)集團有限公司第一飛機設(shè)計研究院, 西安 710089; 2.中國航空工業(yè)集團有限公司航空計算技術(shù)研究所, 西安 710068)
液壓系統(tǒng)是飛機重要機載系統(tǒng)之一,它為飛機輸出能源驅(qū)動,其性能、穩(wěn)定性和可靠性直接影響飛機的安全性。流量是飛機液壓系統(tǒng)的重要參數(shù),實時監(jiān)測液壓系統(tǒng)管路流量可對系統(tǒng)特性分析、故障診斷提供有力的支持。在地面平臺或大型地面工業(yè)系統(tǒng)中通常使用流量傳感器測量管路流量,常見的流量傳感器有渦輪式和齒輪式。但由于流量傳感器需要串接在系統(tǒng)管路中,其造成的流阻對系統(tǒng)特性有顯著影響,而航空液壓系統(tǒng)對管路要求更為嚴格,因此目前在航空液壓系統(tǒng)中鮮有應(yīng)用。缺少流量參數(shù)的實時監(jiān)測,將嚴重影響航空液壓系統(tǒng)的故障診斷水平,因而對飛行保障能力帶來巨大考驗[1]。
針對液壓系統(tǒng)的健康管理技術(shù),近年來呈現(xiàn)出診斷對象多樣化、診斷技術(shù)多元化、故障診斷與預測實時性、診斷預測與維護一體化、診斷系統(tǒng)的網(wǎng)格化、診斷信息的信息化和綜合保障評價一體化的發(fā)展趨勢[2-3],目前液壓系統(tǒng)的故障預測與健康管理(prognostics and health management,PHM)使用機載電子設(shè)備和飛機狀態(tài)監(jiān)控采集記錄飛機的各項數(shù)據(jù)并進行轉(zhuǎn)化篩選,提取故障數(shù)據(jù)格式化,形成不同等級的故障告警信息,輔助地面維修人員進行故障診斷,而對流量進行準確測量可以有效增加故障原始數(shù)據(jù)種類,從而對液壓系統(tǒng)故障定位及后期維修帶來便利[4]。
目前機上傳感器配置條件下的流量難以監(jiān)測,使用物理模型計算流量時由于實際管路具有大量耦合參數(shù)和時變參數(shù),且管路雷諾數(shù)處于動態(tài)變化中,計算流量時會帶來較大誤差,而對于某個確定的管路段,其管路流量與管路兩端的壓差及管內(nèi)溫度理論上具有確定的函數(shù)關(guān)系,因此可以根據(jù)PHM思想,利用現(xiàn)有傳感器數(shù)據(jù)進行重構(gòu),獲取流量值。通過機器學習模型擬合構(gòu)建輸入輸出間的復雜關(guān)系進行流量預測[5]。流量預測可以為飛機故障預測與健康管理服務(wù),預測的結(jié)果合理準確,速度滿足實時性需求,配合系統(tǒng)其余參數(shù),就能夠輕易地反映出系統(tǒng)工作狀態(tài),為飛行安全提供保障,提升系統(tǒng)PHM能力。
相比于傳統(tǒng)的物理模型與概念模型,機器學習模型更加善于挖掘系統(tǒng)與數(shù)據(jù)間的隱形關(guān)聯(lián),更能抓住微妙變化,理論上只要擁有足夠的訓練樣本,即樣本空間無限大,機器學習模型所模擬的流量關(guān)系就更加接近現(xiàn)實的全部可能集合,但其中的隱性關(guān)系屬于可觀測但不可解釋形式,阻礙了流量預測模型預測結(jié)果的應(yīng)用,將物理模型與概念模型的成因機理與機器學習預測模型融合,可以提高模型適應(yīng)變化的能力、增強模型解析透明度[6]。
GBRT算法作為一種重要的分類預測方法,其模型配置簡單,對噪聲數(shù)據(jù)有很好的適應(yīng)性且模型解釋性強,通過對近幾年相關(guān)文獻的研究發(fā)現(xiàn),部分學者逐漸將此類方法應(yīng)用于對交通車流量預測、旅游人流量預測及機組能耗預測等領(lǐng)域,都取得了較好的預測結(jié)果[7-8]。為此,針對變化工況下的飛機液壓系統(tǒng)流量預測問題,建立了流量相關(guān)驅(qū)動因子挖掘方法,提出、構(gòu)建并實現(xiàn)了基于梯度提升回歸樹(gradient boosting regression tree,GBRT)算法的流量預測模型,使用已有數(shù)據(jù)利用智能算法進行數(shù)據(jù)挖掘重構(gòu)預測流量,為后續(xù)液壓系統(tǒng)、機電系統(tǒng)的故障預測與健康管理水平提升提供了支持。
圖1 集成學習方法Fig.1 Integrated learning method
集成學習方法(圖1)是Dasarathy等[9]于1979年首次提出的一種處理決策問題的思路,集成學習是整合了多個以基礎(chǔ)算法為核心的基學習器的強學習器算法,通過集成整合對訓練樣本進行更加準確的分類預測。
目前,以決策樹為基學習器的分類方法主要分為Bagging方法和Boosting方法:Bagging算法(裝袋算法)是一種團體學習框架方法,特點在于隨機有放回采樣,可以降低結(jié)果方差,避免過擬合,提升準確率與穩(wěn)定性;Boosting算法是一種線性方法,通過對基學習器的加權(quán)組合,得到最終聚合模型,提高預測準確性。
GBRT模型是一種在Boosting算法基礎(chǔ)上進行改進的算法,同樣是以多個基學習器開展弱訓練,其基學習器的核心是回歸樹算法[10]?;貧w樹即使用樹結(jié)構(gòu)的模型進行回歸問題求解,將樣本空間進行每次一分為二的劃分,劃分為有限個區(qū)域,當決策時根據(jù)輸入樣本的特征進行劃分,直到樣本落入有限個區(qū)域中的一個,獲得輸入樣本對應(yīng)的預測結(jié)果。
GBRT是Friedman[11]于2000年提出的一種機器學習Boosting方法,核心思想是將弱學習器學習結(jié)果的殘差作為下個學習器的訓練任務(wù),沿損失函數(shù)負梯度方向訓練,多次迭代后將各個弱學習器的學習結(jié)果進行線性累加形成強學習器的過程。每棵樹對部分數(shù)據(jù)做好預測,后生成的樹糾正前一棵樹的錯誤,隨著樹的數(shù)量越來越多,不斷提高迭代性能。
GBRT算法主要實現(xiàn)過程為:輸入量為訓練數(shù)據(jù)集D={(x1,y1),(x2,y2),…,(xN,yN)}和損失函數(shù)L[y,f(x)],輸出為回歸樹H(x),其中,(xi,yi)為系統(tǒng)輸入與系統(tǒng)輸出,i=1,2,…,N,f(x)為預測輸出值。
首先進行初始化,將首預測值f0(x)定義為
(1)
式(1)中:μ為使損失函數(shù)極小化的常數(shù)值,描述在空間內(nèi)是一個只含有根節(jié)點無分支的樹。
對于所有的樣本N,fori=1 toN,其中i為第i個樣本,假設(shè)迭代次數(shù)為M,m為第m棵樹,計算當前損失函數(shù)的負梯度值,并將它作為與實際值的殘差的估計值rim,可表示為
(2)
式(2)中:fm-1為第m-1棵故障樹模型。
針對殘差生成回歸樹Hm(x),計算梯度下降的步長ρm,其計算公式為
(3)
不斷迭代后最終生成的模型為
fm(x)=fm-1(x)+ρmHm(x)
(4)
根據(jù)生成的每棵樹模型分配權(quán)重,漸進逼近最佳模型為
fm(x)=fm-1(x)+lrρmHm(x)
(5)
式(5)中:lr為學習率,即對每個基學習器分配的權(quán)重縮減系數(shù)。
設(shè)置學習率可以避免模型過擬合,提高模型泛化能力,同時GBRT算法的精度還與回歸樹復雜程度,即樹的數(shù)量相關(guān)。
液壓系統(tǒng)油液在管道中流動,油液與管壁的摩擦、管道截面積的變化、油液流向的變化等,都會導致管路中油液壓力的損失。
單管路中的壓力損失ΔPtotal包含沿程壓力損失ΔPalong和局部壓力損失ΔPpart,其相應(yīng)的理論計算公式分別為
(6)
(7)
式中:L為導管長度,m;d為導管內(nèi)徑,m;ρ為油液密度,kg/m3;Q為油液流量,m3/s;λ為沿程阻力系數(shù);ξ為局部阻力系數(shù)。
針對單一管路,有一系列局部損失,并且又由不同管徑的管串聯(lián)起來,其總阻力損失等于沿程損失與局部損失之和的疊加,即
=KQ2
(8)
式(8)中:Δp為壓力損失,Pa;K為管路流量模數(shù),N·s2/m8;λi為第i段管路的沿程阻力系數(shù);Li為第i段導管長度;di為第i段導管內(nèi)徑;Fi為管路內(nèi)截面積,m3;vi為平均流速,m/s。
管路模數(shù)K與液壓油種類、管材、管徑、管路走向、液壓附件等均有關(guān)聯(lián),而當管路各項參數(shù)均確定的情況下,可通過管路流阻反推管路流量,即
(9)
但由于管路的雷諾數(shù)一直處于動態(tài)變化的過程中,進而動態(tài)影響K值的相關(guān)參量:沿程阻力系數(shù)與局部阻力系數(shù);同時在溫度的影響下,管路內(nèi)流體的黏度也在持續(xù)變化中,因此管路流量的逆推導求解變得極其困難。而使用GBRT方法,可以將整個系統(tǒng)考慮為動態(tài)變化的黑箱模型,構(gòu)建多輸入(壓力、溫度、壓差等參數(shù))單輸出(流量)關(guān)系,通過數(shù)據(jù)驅(qū)動的方式擬合預測流量值。模型訓練與預測過程如圖2所示。
圖2 模型訓練與預測過程Fig.2 Model training and prediction process
以梯度提升回歸樹算法建立液壓系統(tǒng)管路流量預測模型,建模過程包括數(shù)據(jù)預處理,特征選擇,模型訓練評估決策,建模流程如圖3所示,具體步驟如下。
圖3 流量預測模型建模流程圖Fig.3 Flow prediction model modeling flow chart
步驟1按照機上管路布置狀況搭建液壓試驗平臺并加裝參數(shù)測量傳感器,同時根據(jù)監(jiān)督學習思想加裝流量傳感器,使其測量值作為訓練標簽值,獲取模型訓練所需數(shù)據(jù)集合。
步驟2將測得的數(shù)據(jù)進行探索分析、預處理。
步驟3特征工程,篩選出與流量預測強相關(guān)的參數(shù)集合,剔除流量的弱相關(guān)參數(shù)。
步驟4選取多種機器學習監(jiān)督學習算法建立流量預測的數(shù)據(jù)驅(qū)動模型。
步驟5對模型評估選優(yōu),選取對流量預測結(jié)果準確率較高的算法。
通過對流量的相關(guān)參量進行研究,并以此為基礎(chǔ)進行試驗設(shè)計[12-13]。以實際管路分布狀態(tài)為標準,進行系統(tǒng)試驗臺架搭建,并在不同位置加裝溫度、壓力、流量傳感器,考慮到流量傳感器帶來的較大流阻,選擇在各支路供壓端、回油端和總回路匯流端加裝流量傳感器,減少對系統(tǒng)正常功能帶來的影響的同時獲取流量數(shù)據(jù),試驗結(jié)構(gòu)示意圖如圖4所示。
圖4 液壓系統(tǒng)試驗結(jié)構(gòu)示意圖Fig.4 Schematic diagram of hydraulic system test structure
在各泵吸油口與殼體回油口安裝壓力、流量、溫度傳感器,對系統(tǒng)加裝負載模擬組件,限定某飛行任務(wù)工況下調(diào)節(jié)負載,模擬實際過程的供壓、流量、溫度等參數(shù)變化情況[11],對管路中動態(tài)變化的主要參數(shù)進行連續(xù)測量,主要測量參數(shù)類型如表1所示。
通過調(diào)整負載模擬系統(tǒng)流量,單開、多開液壓泵分類進行系統(tǒng)參數(shù)測量,得到包含上述變量的共計7種不同工況下的31類數(shù)據(jù)。
針對數(shù)據(jù)采集中出現(xiàn)的缺失值與異常值進行預處理可以有效提升分析結(jié)果準確性,由于本試驗數(shù)據(jù)來自系統(tǒng)試驗臺傳感器的連續(xù)采樣[14-15],各個工況下的待求負載模擬流量的范圍、變化趨勢都有很大的差別,試驗選取的不同工況的負載流量曲線,如圖5所示。
圖5 不同工況下負載模擬流量變化曲線Fig.5 Load simulation flow curve under different working conditions
因此選擇將不同工況下的數(shù)據(jù)集整合為一個大數(shù)據(jù)集,即采用類似數(shù)據(jù)擴增的方法,可以有效提高特征維度,減少模型訓練次數(shù)提升效率,同時盡量避免模型訓練結(jié)果的過擬合問題。最終得到數(shù)據(jù)規(guī)模(672 181,32),31個傳感器特征加1個時間特征。
對采集到的全部參數(shù)進行Pearson相關(guān)性分析并生成熱力圖,相關(guān)性分析結(jié)果如圖6所示。
圖6 Pearson相關(guān)系數(shù)值圖Fig.6 Absolute value of Pearson correlation coefficient
從圖6可以看出,多個特征之間的相關(guān)性較強,需要根據(jù)情況進行特征選擇,避免多重共線性??紤]到負載模擬壓力、反壓模擬裝置壓力、流量負載模擬回油壓力與待求負載模擬流量的強相關(guān)性,選擇的每種方法均訓練兩種模型:Model-t模型接受這3個參數(shù)作為模型輸入,Model-3模型不接受其作為模型輸入,以應(yīng)對未來運用中工況,參數(shù)條件變化后的預測要求。
表1 系統(tǒng)管路測量參數(shù)類型
試驗采用液壓試驗臺采集的數(shù)據(jù)集對模型進行訓練,調(diào)整輸入特征種類以獲取最佳組合,并使用測試數(shù)據(jù)集對模型進行驗證。將實際與預測值的差值轉(zhuǎn)換成回歸評價指標,對模型以及模型屬性進行分析。
試驗中使用交叉驗證的方法對原始樣本進行隨機拆分數(shù)據(jù)集,其中67%的數(shù)據(jù)作為訓練數(shù)據(jù),33%的數(shù)據(jù)作為測試數(shù)據(jù)。
本試驗使用的回歸評價指標包括:平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)、擬合優(yōu)度決定系數(shù)R2,以及訓練時間與測試時間。計算公式分別為
(10)
(11)
(12)
將所建立的模型與最小二乘線性回歸模型、樹模型、極端提升樹等模型的預測精度進行對比,以驗證其在液壓系統(tǒng)流量預測方面有效性[16-17]。對每種模型分別建立Model-t與Model-3兩種訓練輸入條件,并驗證預測準確性,以藍色為真實值,紅色為預測值分別繪制訓練結(jié)果圖。
最小二乘回歸模型預測結(jié)果如圖7、圖8所示,可以看出,接受3個強相關(guān)參數(shù)為模型訓練輸入條件的Model-t模型對流量的預測結(jié)果明顯好于去掉強相關(guān)參數(shù)作為輸入的Model-3模型。使用回歸評價指標對模型結(jié)果進行評估,表2為最小二乘回歸預測結(jié)果。
決策樹回歸預測結(jié)果如圖9、圖10所示。決策樹回歸預測指標如表3所示。GBRT模型預測結(jié)果如圖11、圖12所示。梯度提升回歸樹模型預測指標如表4所示。對比傳統(tǒng)最小二乘回歸、決策樹與GBRT三類模型可知,相較于傳統(tǒng)數(shù)學方法、機器學習流量模型在預測精度上更有優(yōu)勢,但需要更長的訓練時間,但在不包含強相關(guān)參數(shù)的輸入條件下具有更好的預測效果。選取算法更為復雜的極端梯度提升樹(XGBoot)模型作為對照,訓練結(jié)果如圖13、圖14所示。極端梯度提升樹模型預測指標如表5所示。
圖7 最小二乘回歸預測結(jié)果(Model-t)Fig.7 Least square regression prediction results (Model-t)
圖8 最小二乘回歸預測結(jié)果(Model-3)Fig.8 Least square regression prediction results (Model-3)
表2 最小二乘回歸預測結(jié)果
圖9 決策樹回歸預測結(jié)果(Model-t)Fig.9 Decision tree regression prediction results(Model-t)
圖10 決策樹回歸預測結(jié)果(Model-3)Fig.10 Decision tree regression prediction results (Model-3)
表3 決策樹回歸預測結(jié)果
圖11 GBRT預測結(jié)果(Model-t)Fig.11 GBRT prediction results (Model-t)
圖12 梯度提升回歸樹GBRT預測結(jié)果(Model-3)Fig.12 Gradient lifting regression tree GBRT prediction results (Model-3)
Model-t與Model-3不同回歸算法預測模型的結(jié)果精度對比如表6、表7所示。
表4 GBRT預測結(jié)果
XGBoot為極端梯度提升樹圖13 XGBoost預測結(jié)果(Model-t)Fig.13 Prediction results of XGBoost (Model-t)
圖14 XGBoost預測結(jié)果(Model-3)Fig.14 Prediction results of XGBoost (Model-3)
表5 XGBoost預測結(jié)果
表6 Model-t不同回歸算法預測結(jié)果精度對比
表7 Model-3不同回歸算法預測結(jié)果精度對比
通過分析結(jié)果可知,最小二乘線性回歸方法預測準確度相對較差,但在可接受范圍內(nèi),其模型訓練時間明顯小于其他方法;決策樹,GBRT算法具有較高的模型精度,同時相比于極端梯度提升樹具有較短的模型運行時間;隨機森林與其他機器學習方法相比,模型精度沒有優(yōu)勢,且訓練時間過長。去除與負載模擬流量強相關(guān)的3個特征后,幾乎所有模型的準確度均有所降低,最小二乘線性回歸方法的預測誤差相對較大,但模型訓練時間最短;隨機森林與其他機器學習方法相比,模型精度沒有優(yōu)勢,且訓練時間過長。同時考慮預測精度與訓練時間,最優(yōu)模型為GBRT,五類算法的模型測試時間均較短。
(1)相較于傳統(tǒng)的數(shù)據(jù)預測算法,提出的機理與智能數(shù)據(jù)挖掘算法結(jié)合的系統(tǒng)流量預測模型具有較高的準確性,能夠根據(jù)目前機上已部署的傳感設(shè)備,對無法測量的狀態(tài)量進行準確的估計預測,符合預期效果。
(2)基于液壓系統(tǒng)流量機理及成因規(guī)律,開展流量預測機器學習模型構(gòu)建、地面液壓試驗平臺搭建、實例驗證與對比評價研究?;谶x取的機器學習中的監(jiān)督學習算法,結(jié)合飛機液壓系統(tǒng)流量產(chǎn)生機理與相關(guān)參數(shù)關(guān)聯(lián)關(guān)系,建立了基于液壓試驗平臺的預測算法驗證框架,對該框架進行不同模型間的實例驗證與對比評價,為后續(xù)研究工作提出一種新的思路。