夏存江, 詹于游
(中國民用航空飛行學(xué)院航空工程學(xué)院, 廣漢 618300)
在民航領(lǐng)域,飛行安全是不可忽視的重要環(huán)節(jié),而保障飛行安全的重點之一就是對航空發(fā)動機故障的避免、維護和預(yù)測。在航空發(fā)動機故障損耗維護成本中,發(fā)動機氣路故障的維修費用占發(fā)動機總體維修費用的60%[1-2]。且航空發(fā)動機氣路情況復(fù)雜,其內(nèi)部相應(yīng)氣路參數(shù)受工作循環(huán)數(shù)、內(nèi)部壓氣機或渦輪磨損、腐蝕和侵蝕以及外來物等因素[3-4]影響,偏離其正常工作狀態(tài)從而引起氣路故障、導(dǎo)致發(fā)動機性能退化乃至重大事故的發(fā)生。所以采用先進、科學(xué)和可靠的方法對發(fā)動機的氣路故障做出更好的診斷,維護以及預(yù)測是業(yè)界一直努力的方向。而數(shù)據(jù)驅(qū)動方法則是其中一項重要手段。
現(xiàn)通過綜述數(shù)據(jù)驅(qū)動方法在航空發(fā)動機氣路故障診斷的研究現(xiàn)狀和發(fā)展趨勢,總結(jié)各項技術(shù)在氣路故障研究上的適用場景和優(yōu)缺點,并對未來相關(guān)研究的數(shù)據(jù)預(yù)處理化、診斷系統(tǒng)集成化、模塊化和診斷結(jié)果的可信度提升的發(fā)展趨勢進行討論和梳理。旨在為未來利用數(shù)據(jù)驅(qū)動方法研究相關(guān)方向提供系統(tǒng)性的參考,促進航空發(fā)動機氣路故障研究。
對于故障信息(即發(fā)動機氣路故障導(dǎo)致的偏離正常值的參數(shù))的獲取,目前航空公司使用的民用航空飛機數(shù)據(jù)獲取方式主要有三種。
傳統(tǒng)的民用航空飛機機載數(shù)據(jù)來源是根據(jù)飛機維修日志和記錄數(shù)據(jù),并對相應(yīng)的數(shù)據(jù)進行整理和分析,然后結(jié)合工程師經(jīng)驗和飛機故障原理以及特點,對其系統(tǒng)所發(fā)生的氣路故障進行診斷和預(yù)測[5-6]。但這種方式以相關(guān)經(jīng)驗為基礎(chǔ),對工程師的排故能力有一定的考驗,且預(yù)測的準(zhǔn)確性有限,沒有得到廣泛的應(yīng)用。
飛機通信尋址和報告系統(tǒng)(aircraft communications addressing and reporting system,ACARS)有多種類型,其中飛機運行控制信息則是用來預(yù)測故障的主要類型。而現(xiàn)階段已有許多成熟的軟件可用于存儲和分析ACARS數(shù)據(jù),并且既可以用來實時監(jiān)視飛機健康數(shù)據(jù),還可以預(yù)測一些故障的發(fā)生[7]。但實際飛航過程中,用ACARS數(shù)據(jù)報獲取的故障信息存在數(shù)據(jù)不連續(xù)并且記錄參數(shù)不足的缺點,不適用于關(guān)于時間序列的故障診斷和預(yù)測[8]。
快速訪問記錄器(quick access recorder,QAR)提供對飛航階段的原始數(shù)據(jù)的快速和更方便的獲取和訪問,對于飛行原始數(shù)據(jù)可使用USB、閃存或直接利用蜂窩數(shù)據(jù)即可下載。QAR克服了以往飛行數(shù)據(jù)記錄的缺點,其記載參數(shù)豐富翔實、數(shù)據(jù)連續(xù)、易導(dǎo)出易處理,賦予了可利用QAR數(shù)據(jù)對故障進行分析、診斷和預(yù)測的能力[9]。
在民用航空領(lǐng)域,對待故障有包含事后和定期維修的傳統(tǒng)維修方式和視情維修方式。目前以視情維修的主流維修方式是指“以可靠性為中心”的核心思想的方式。從而衍生出的預(yù)測與健康管理技術(shù)(prognosties and health management,PHM),并且有效提高了飛航的安全性、可靠性和經(jīng)濟性[10-11]。
現(xiàn)階段中國主流的故障診斷方法主要分為傳統(tǒng)診斷方法即基于傳統(tǒng)模型的方法和數(shù)據(jù)驅(qū)動的故障診斷方法。傳統(tǒng)方法主要有線性和非線性模型的故障診斷方法。傳統(tǒng)方法的本質(zhì)是根據(jù)傳統(tǒng)故障經(jīng)驗以及根據(jù)發(fā)動機的參數(shù)特性[12-13]建立發(fā)動機的物理模型,參照實際值和基線值的差值的變化幅度和范圍來判斷是否發(fā)生故障,以及具體是什么故障[14]。
但在實際的生產(chǎn)和工程實踐中,利用傳統(tǒng)的方式進行故障診斷和預(yù)測,需要精確的物理模型,和真實的基線值。但航空發(fā)動機精確的物理模型難以獲得,且真實有效的基線值常常掌握在原始設(shè)備制造商(original equipment manufacturer,OEM)手中。所以在民航領(lǐng)域,通過數(shù)據(jù)驅(qū)動的方式對基線值的預(yù)測也是一個方向。在民航領(lǐng)域,飛機飛行參數(shù)類型復(fù)雜,數(shù)據(jù)量眾多,獲取方式多樣化,在對原始數(shù)據(jù)進行有效處理后,便可使用數(shù)據(jù)驅(qū)動的方式,來建立相關(guān)模型對故障進行診斷和預(yù)測[15]。利用數(shù)據(jù)驅(qū)動的方式可以克服傳統(tǒng)方式對精確物理模型的需要,對準(zhǔn)確基線值的需要,只需利用公司或工廠獲取的飛行數(shù)據(jù)并對數(shù)據(jù)進行合適的處理和清洗即可,且準(zhǔn)確度高,有實際應(yīng)用價值,可以在工業(yè)生產(chǎn)和工程實際應(yīng)用領(lǐng)域,對故障進行診斷或輔助診斷。
雙轉(zhuǎn)子渦扇發(fā)動機常見的氣路故障有風(fēng)扇、低壓壓氣機、高壓壓氣機、高低渦輪、低壓渦輪故障,其故障并不只是單一故障,有時也伴隨多重故障。但發(fā)動機氣路故障總伴隨著具體的參數(shù)變化,及其所引起的風(fēng)扇、壓氣機和渦輪效率的下降、壓氣機增壓比下降和流量下降等[16-17]。所以利用數(shù)據(jù)驅(qū)動的方式,在獲取飛機飛行數(shù)據(jù),并對數(shù)據(jù)進行合理處理過后,通過將參數(shù)的實際值輸入數(shù)據(jù)模型,便可得知是否發(fā)生氣路故障以及氣路故障的種類。
在上述基礎(chǔ)上通過民航故障診斷技術(shù)的不斷發(fā)展,可以得知現(xiàn)階段數(shù)據(jù)驅(qū)動的故障診斷方法主要有聚類、回歸、神經(jīng)網(wǎng)絡(luò)、支持向量機、關(guān)聯(lián)規(guī)則和深度學(xué)習(xí)等方式,并在這些基本方法基礎(chǔ)上衍生和改進的各種故障診斷方法。
2.3.1 聚類
根據(jù)觀測值中特征的相似度或距離,將觀測值歸并到若干個類別。同一類的數(shù)據(jù)具有相似的屬性或特征,是一種常用的無監(jiān)督分類算法。其目的是通過算法運算后得到的類別,進而發(fā)現(xiàn)同一類別數(shù)據(jù)的相似性和特點,一般在數(shù)據(jù)處理中使用。
常用的聚類算法主要有K-means、DBSCAN、聚集聚類、BIRCH、均值漂移、相似性傳播和譜聚類等。但K-means又稱K均值算法,是最常用的聚類算法。具有快速、高效對未標(biāo)記數(shù)據(jù)集進行聚類的能力,迭代次數(shù)少,只需幾次即可,且可解釋性強[18-20]。一般首先通過繪圖后手動選擇超參數(shù)集群數(shù)K,然后隨機選取K個中心,每個數(shù)據(jù)選取距離其最近的中心點為其類別。然后基于每個類別的點計算所有點的向量均值在重新選取中心,并迭代重復(fù)以上步驟即可完成對算法的訓(xùn)練。K-means算法示例如圖1所示。
圖1 K-means算法示例圖Fig.1 K-means algorithm example diagram
K-means算法具有快速可擴展性強的優(yōu)點,當(dāng)簇為密集型或成團時,類別預(yù)類別之間的區(qū)別明顯,效果較好。該算法時間復(fù)雜度為O(tKmn),其中,t為迭代次數(shù),K為簇的數(shù)目,m為記錄數(shù),n為維數(shù),與樣本數(shù)量線性相關(guān),所以,對于處理大數(shù)據(jù)集合,該算法非常高效,且伸縮性較好。但同時也存在一定的缺點。主要就是關(guān)于集群數(shù)K的選取,K的選擇會大大影響分類效果,因為K為超參數(shù),當(dāng)無法判斷K時則會影響算法性能,且迭代次數(shù)足夠才能達到最優(yōu)解。但經(jīng)常也以局部最優(yōu)解結(jié)束,同時對“噪聲”和孤立點敏感。另外如果數(shù)據(jù)集處理不合適[21],呈現(xiàn)出集群大小,密度不同,形狀不規(guī)則非球形時,K-means算法不一定有良好的性能。
在航空發(fā)動機故障診斷中,蘇志剛等[22]通過對QAR數(shù)據(jù)采用改進的K-means聚類算法,對分類的QAR數(shù)據(jù)的類別屬性進行判斷將異常數(shù)據(jù)劃分為單獨的類別,以判定是否發(fā)生故障。鄒思漢[23]通過采用聚類算法構(gòu)建故障現(xiàn)象和故障成品的多對多關(guān)系,完成屬于同一故障現(xiàn)象的多條故障描述。而楊天林等[24]也使用K-means聚類算法對實際發(fā)參數(shù)據(jù)進行離群點檢測,并對泵調(diào)系統(tǒng)故障進行診斷,誤報率為0,為實現(xiàn)發(fā)動機泵調(diào)系統(tǒng)健康監(jiān)測自動化提供了有效的技術(shù)途徑。 杜力偉等[25]也將聚類算法聚焦于對復(fù)雜產(chǎn)品的模塊化,并將其應(yīng)用高壓壓氣機的產(chǎn)品研發(fā)中。
2.3.2 線性回歸或多項式回歸
對基于時間序列的數(shù)據(jù)擬合直線和曲線,以預(yù)測未來的趨勢。常用于關(guān)鍵部件的和參數(shù)的趨勢,也可用來預(yù)測氣路性能的趨勢。主要觀測數(shù)據(jù)的變化率是否超出的正常的波動范圍。預(yù)測出的趨勢直觀,但模型的泛化誤差需要充分考慮方差和偏差之間的平衡。模型復(fù)雜度的增加有可能會很好的擬合訓(xùn)練集,提升了模型的方差并減小了模型的偏差,但有可能導(dǎo)致過擬合。反之,降低模型的復(fù)雜度,可以提升模型的偏差降低方差,但有可能導(dǎo)致模型欠擬合。同樣模型正則化方式的選擇也對預(yù)測的準(zhǔn)確性有相當(dāng)?shù)挠绊?。但對于趨勢進行快速預(yù)測和表達十分有效。
在航空領(lǐng)域,李書明等[26]使用高斯牛頓迭代法對發(fā)動機基線做非線性回歸預(yù)測,并將成果應(yīng)用在發(fā)動機維修部分。彭云飛[27]利用非線性回歸分析方法建立航空發(fā)動機狀態(tài)參數(shù)的基線模型,用于分析和評估發(fā)動機的健康狀態(tài)。過超強等[28]對航空發(fā)動機的成本管理采用多元線性回歸建立了發(fā)動機出廠費用估算模型,且與實際費用進行對比,達到了8%的相對誤差?;貧w模型范例如圖2所示。
圖2 多項式回歸范例Fig.2 Examples of polynomial regression
2.3.3 支持向量機
支持向量機(support vector machine,SVM)是常用的機器學(xué)習(xí)方法,其建立在統(tǒng)計學(xué)習(xí)和結(jié)構(gòu)風(fēng)險最小原理的基礎(chǔ)上,適用于線性問題或者利用核技巧處理非線性問題[29-30]。SVM的推廣SVR也適用于回歸問題[31-32],在面臨多分類問題時,也可以組合多個SVM。
其以最大間隔理論為依據(jù)對數(shù)據(jù)進行分類如圖3所示,可解釋性強,能找出對分類具有重要影響的關(guān)鍵數(shù)據(jù)即支持向量,且對新樣本的計算復(fù)雜性只取決于已經(jīng)訓(xùn)練完成的支持向量的數(shù)量,與樣本的空間維數(shù)無關(guān)以避免“維數(shù)災(zāi)難”[33]。且由于SVM是一個凸優(yōu)化問題,所以求得問題解為全局最優(yōu)而非局部最優(yōu)。但SVM對特征的縮放非常敏感,所以對數(shù)據(jù)的歸一化顯得比較重要。且SVM的時間復(fù)雜度較高,支持核技巧的訓(xùn)練時間復(fù)雜度通常在O(m2×n)~O(m3×n)[34],但是如果訓(xùn)練實例的數(shù)量太大,顯然SVM的訓(xùn)練時間將會很長,所以SVM非常適用于復(fù)雜但是中小型的訓(xùn)練集。但飛機飛行數(shù)據(jù)又具有數(shù)據(jù)規(guī)模龐大的特點,所以如果要使用SVM對氣路故障進行診斷,那么需對數(shù)據(jù)規(guī)模和訓(xùn)練時間進行取舍。
曹惠玲等[35]基于SVM建立最小二乘支持向量機回歸模型建立快速診斷喘振方法,根據(jù)發(fā)動機低壓壓氣機轉(zhuǎn)速、壓比和燃油流量真實參數(shù)數(shù)據(jù)與模型的預(yù)測值的相對誤差率來分析發(fā)動機是否發(fā)生喘振故障。胡超等[36]在SVM的基礎(chǔ)上引入量子自適應(yīng)粒子群優(yōu)化算法(quantum adaptive particle swarm optimization,QAPSO),提高了發(fā)動機故障診斷的平均診斷準(zhǔn)確度和抗噪能力,并且在不同情況下展現(xiàn)出較強的適應(yīng)能力。同時,楊婧等[37]通過網(wǎng)格搜索算法(grid search optimization,GSO)對SVM的超參數(shù)尋參,找出相對最優(yōu)的軸承故障診斷模型的超參數(shù),具有較強的實用性。且馬晨佩等[38]利用麻雀搜索算法(sparrow search algorithm,SSA)對支持向量機的懲罰因子C與核函數(shù)g進行優(yōu)化,使得模型收斂速度加快,準(zhǔn)確性更高,在發(fā)動機軸承故障診斷領(lǐng)域也有一定的指導(dǎo)意義。
圖3 SVM分隔范例Fig.3 Examples of SVM separation
2.3.4 關(guān)聯(lián)分析
在民航領(lǐng)域,關(guān)聯(lián)規(guī)則被用于發(fā)現(xiàn)對QAR數(shù)據(jù)進行分析以預(yù)測飛機是否出現(xiàn)故障或故障趨勢,雖然關(guān)聯(lián)分析具有易實現(xiàn)的優(yōu)點,但是其當(dāng)數(shù)據(jù)規(guī)模龐大時的表現(xiàn)能力較差,耗時較長,且對頻率出現(xiàn)較低的信息無法分析使信息丟失。所以在此基礎(chǔ)上提出數(shù)據(jù)立方體的多維關(guān)聯(lián)規(guī)則[39],周劍波等[40]將粒子群優(yōu)化算法(PSO)和灰色關(guān)聯(lián)分析有機結(jié)合起來,設(shè)計發(fā)動機氣路部件兩層診斷結(jié)構(gòu),則適當(dāng)解決這些問題,并提高了關(guān)聯(lián)分析的精度,減少了計算的耗費成本。而劉小峰等[41]為有效對發(fā)動機剩余壽命進行預(yù)測,采用灰色理論得到了較高的預(yù)測準(zhǔn)確度,為發(fā)動機的故障預(yù)測和健康管理提供了一種新思路。
2.3.5 人工神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)
神經(jīng)網(wǎng)絡(luò)是由具有適應(yīng)性的簡單單元組成的廣泛并行連接的網(wǎng)絡(luò),其自己的組織能夠模擬生物神經(jīng)系統(tǒng)對現(xiàn)實輸入所做出的的交互式反應(yīng)[42]。神經(jīng)網(wǎng)絡(luò)以神經(jīng)元為單位,接受來自n個其他神經(jīng)元或者外界的帶權(quán)重的輸入信號,隨后用過“激活函數(shù)”(activation function)進行處理并傳入下一層的m個神經(jīng)元或輸出。其基本模型如圖4所示。
圖4 神經(jīng)網(wǎng)絡(luò)基本模型Fig.4 Basic model of neural networks
人工神經(jīng)網(wǎng)絡(luò)一般自學(xué)習(xí)、尋找最優(yōu)解快速,對非線性數(shù)據(jù)具有很好的擬合能力,而且非常適應(yīng)在航空發(fā)動機氣路故障診斷過程中對應(yīng)參數(shù)數(shù)據(jù)從輸入層輸入到輸出層輸出故障診斷數(shù)據(jù)輸出的映射。同時,應(yīng)用深度學(xué)習(xí),在一般神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上增加網(wǎng)絡(luò)的深度,每一層節(jié)點的數(shù)量,參數(shù)越多、模型越復(fù)雜,算法就能完成更復(fù)雜的學(xué)習(xí)任務(wù)。另外,端到端可以忽略大部分傳統(tǒng)機器學(xué)習(xí)算法特征工程的部分。特別是航空發(fā)動機的氣路故障診斷其自身就是一個復(fù)雜的非線性模型[43-45]。除了一般的輸入?yún)?shù)到輸出參數(shù)的深度學(xué)習(xí)模型,使用循環(huán)神經(jīng)網(wǎng)絡(luò),恰當(dāng)將長短期記憶(long short-term memory,LSTM)和門控循環(huán)單元(gated recurrent unit,GRU)應(yīng)用在時間序列相關(guān)或者振動頻率相關(guān)的數(shù)據(jù)上,也能得到很好的連續(xù)性相關(guān)的訓(xùn)練模型[46-48]。除此之外,利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)對圖像處理的優(yōu)異性能,將其應(yīng)用在孔探技術(shù)上,輔助分析氣路通道的故障和損傷,也能提高維修效率,降低維護成本[49-51]。
但是訓(xùn)練復(fù)雜度很高的模型,訓(xùn)練的效率會降低而且最重要的是容易有過擬合的風(fēng)險,導(dǎo)致模型的泛化能力差,不能適應(yīng)新的數(shù)據(jù)。所以此時增加訓(xùn)練集的數(shù)量可以有效緩解這種問題[52],同時采用多種優(yōu)化手段如Batch Normalization、Dropout、使用Adam優(yōu)化器代替SGD等,則也可以增加模型的泛化能力,加速模型訓(xùn)練。且現(xiàn)階段計算力的大幅提升也可忽略一些模型復(fù)雜度高、訓(xùn)練集規(guī)模龐大的所導(dǎo)致的訓(xùn)練成本高的問題。因此,利用深度學(xué)習(xí)(deep learning)的方法來解決氣路故障診斷的問題乃至研究發(fā)動機其他部件和系統(tǒng)的控制邏輯是業(yè)內(nèi)的一種趨勢。
但是人工神經(jīng)網(wǎng)絡(luò)卻有“黑箱”特性,缺少如樸素貝葉斯、決策樹和邏輯斯蒂回歸(logistic regression)等機器學(xué)習(xí)方法的可解釋性。且需要的數(shù)據(jù)量和計算成本與傳統(tǒng)的機器學(xué)習(xí)方法比要更多更昂貴。但數(shù)據(jù)量的需求正好與飛機飛行的QAR數(shù)據(jù)的海量和多樣性契合[53],且高昂的計算成本也因為高速發(fā)展的計算機性能而逐漸得以解決以至于在可接受范圍內(nèi)。另外,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的模型設(shè)計復(fù)雜,對于新算法和模型的開發(fā)和調(diào)配往往需要投入大量的人力物力和時間。所以針對模型設(shè)計復(fù)雜的問題,大部分人采用遷移學(xué)習(xí)的技術(shù)適配當(dāng)下的數(shù)據(jù)建立自己的模型[54-55]。
目前,國內(nèi)已有很多使用神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)對航空發(fā)動機故障診斷的研究和范例。例如,在早期探索中,使用淺層神經(jīng)網(wǎng)絡(luò)對發(fā)動機故障進行診斷[56-57],侯鳳陽[58]在此基礎(chǔ)上將神經(jīng)網(wǎng)絡(luò)應(yīng)用于發(fā)動機單部件故障和多部件故障的檢測、隔離和量化,并取得了比較準(zhǔn)確的故障診斷率。另外,陳恬等[59]采用自組織神經(jīng)網(wǎng)絡(luò)(self-organizing feature map)在早期的發(fā)動機氣路故障進行診斷中,說明了自組織網(wǎng)絡(luò)在帶有噪聲環(huán)境的較高魯棒性。后來,閆鋒等[60]采用多輸入、單輸出的徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò),在輸入層應(yīng)用Pearson相關(guān)性以選定輸入層的參數(shù),并得以預(yù)測N2基線。以及采用概率神經(jīng)網(wǎng)絡(luò)(probabilistic neural networks)以定性的方法對發(fā)動機既定的原型故障快速診斷。而劉利軍等[61]使用結(jié)合了雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(bidirectional recurrent neural network,RBNN)和LSTM優(yōu)點的雙向LSTM網(wǎng)絡(luò),研究表明其在氣路故障診斷方面,更適合處理與時間序列有高度相關(guān)性的數(shù)據(jù),克服了LSTM對后文信息不能有效處理以及循環(huán)神經(jīng)網(wǎng)絡(luò)梯度消失的問題。付旭云等[62]對發(fā)動機排氣溫度的氣路參數(shù)的預(yù)測精度的研究表明,可以用時變模糊網(wǎng)絡(luò)來提高。對于航空發(fā)動機的高度非線性,為了避免使用傳統(tǒng)線性方法建模帶來的不可接受的誤差,Kiakojoori等[63]使用動態(tài)神經(jīng)網(wǎng)絡(luò)(dynamic neural networks)建模以獲得很好的非線性相關(guān)參數(shù)數(shù)據(jù)的模擬性能。元尼東珠等[64]可利用CNN在大規(guī)模數(shù)據(jù)中擅長對局部數(shù)據(jù)特征進行分析、自動分析全局的訓(xùn)練特征和分類等優(yōu)點,對航空發(fā)動機的氣路故障進行診斷。吳斌等[65]和李本威等[66]根據(jù)深度置信網(wǎng)絡(luò)(deep belief networks, DBN)可有效解決淺層神經(jīng)網(wǎng)絡(luò)泛化性不足,不易得到全局最優(yōu)解等問題,利用DBN進行氣路故障診斷,研究結(jié)果表明模型提高了氣路故障診斷的精度、效率和魯棒性。但是對DBN的隱藏層的層數(shù)和每層的受限玻爾茲曼機(restricted Boltzmann machine, RBM)個數(shù)需再深入研究。
科學(xué)家發(fā)現(xiàn),這種急劇變化正在持續(xù),從20世紀(jì)六十年代晚期開始,冰島和巴倫支海域海水的PH值大約每十年下降0.02%。白令海峽和北冰洋中部加拿大海盆的表層海水也出現(xiàn)了因化學(xué)影響造成的酸化現(xiàn)象。酸化很可能導(dǎo)致北冰洋的海洋生態(tài)系統(tǒng)出現(xiàn)巨大變化。
2.3.6 融合診斷的方法
融合算法將不同的類型的算法在相同或不同的層面進行結(jié)合,彌補了單一算法自身的存在的缺陷,提高了故障診斷的準(zhǔn)確度。比如,將物理模型的算法和數(shù)據(jù)驅(qū)動的算法在特征層面進行定量結(jié)合可有效彌補將基于數(shù)據(jù)算法融合沒有考慮部件物理特性,而導(dǎo)致的泛化能力不足的缺點[67-68]。
在業(yè)內(nèi),李業(yè)波等[67]利用改進的迭代約簡最小二乘SVM(IRR-LSSVR)對ELM和基于SVD的Kalman濾波器在特征層進行融合,提高了氣路部件的故障診斷精度。陳恬等[69]將利用粗糙集減少神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點,用神經(jīng)網(wǎng)絡(luò)對故障分類的融合方法,以提高氣路部件故障診斷系統(tǒng)整體的抗噪能力。另外,陳恬等[70]也利用改進的D-S(Dempster-Shafer)證據(jù)理論,對自組織競爭網(wǎng)絡(luò)和反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)的診斷結(jié)果進行決策及融合,通過調(diào)整兩個子系統(tǒng)的權(quán)重從而使氣路故障診斷系統(tǒng)整體的抗噪能力獲得提升。另外,曲建嶺等[71]采用特定的融合算法對廣義回歸神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)的診斷結(jié)果進行融合,以提升氣路故障診斷的精度。最后,王修巖等[72]使用支持向量機對故障進行初篩,再利用脈沖神經(jīng)網(wǎng)絡(luò)(spiking neural networks, SNN)對難以區(qū)分的相似故障進一步細分使氣路故障診斷的準(zhǔn)確度更佳。
通過以上對國內(nèi)數(shù)據(jù)驅(qū)動的方法在氣路故障診斷以及其他方面的應(yīng)用,可以看出基于數(shù)據(jù)驅(qū)動的診斷方法在業(yè)內(nèi)的廣泛性,以及其自身的優(yōu)點所帶來的對氣路故障診斷的重要性。但是,除了以上所論述的關(guān)于數(shù)據(jù)驅(qū)動方法所展現(xiàn)的優(yōu)秀性能,還有一些在使用這類方法時需注意的重點和難點。
對于航空發(fā)動機氣路故障診斷具體問題,如果要使用數(shù)據(jù)驅(qū)動的方式去處理,那么需要確定選取模型的類別,有監(jiān)督或無監(jiān)督,在線或者離線等。針對不同的場景實時診斷或者視情維護等,選擇氣路故障診斷的處理類別,以為后續(xù)工作的順利展開定性分析。同時對于性能衡量的指標(biāo)也是需要重點考量的,是根據(jù)驗證集的準(zhǔn)確度,還是與基線的偏離程度或者使用均方誤差等。因為性能指標(biāo)的選取也為了對標(biāo)最后應(yīng)用的過程是否符合了業(yè)務(wù)的目標(biāo)。針對具體的業(yè)務(wù)目標(biāo),選取適當(dāng)?shù)男阅芎饬恐笜?biāo),同時劃定達到業(yè)務(wù)目標(biāo)所需的最低性能衡量指標(biāo),對于氣路故障系統(tǒng)建立的整體思路具有重大的指導(dǎo)意義。
飛機飛行數(shù)據(jù)的獲取有多種途徑和多種類型,但對氣路故障進行以數(shù)據(jù)驅(qū)動的方式診斷時,由于QAR中,數(shù)據(jù)存儲豐富,參數(shù)繁復(fù),從QAR中獲取所需的數(shù)據(jù)也是常用的手段。但如果訓(xùn)練集和測試機都通過仿真模型獲得,則最后模型的診斷結(jié)果相比于真實飛行數(shù)據(jù)所訓(xùn)練的模型,會缺乏一定的可信度。但是數(shù)據(jù)對象、數(shù)據(jù)量的選擇則需要慎重考慮。是選取同一飛機、同一飛行航段、同時間段的數(shù)據(jù),還是選取不同飛機、不同時間的數(shù)據(jù),但飛行階段相同的數(shù)據(jù)。飛行數(shù)據(jù)的間隔短,以及發(fā)動機循環(huán)數(shù)少是否對模型的建模精度有一定程度的提高。這些數(shù)據(jù)對結(jié)果準(zhǔn)確度的影響,整個系統(tǒng)可信程度的影響需要考慮在內(nèi)。同時不同機器學(xué)習(xí)方法對數(shù)據(jù)量的需求也不盡相同,過多的數(shù)據(jù)可能造成模型計算成本過多,新數(shù)據(jù)更新周期較長,與之所提升的精確度程度相比太大。而數(shù)據(jù)量過低,則會導(dǎo)致模型準(zhǔn)確度過低,泛化能力、魯棒性低于業(yè)務(wù)目標(biāo)。
在對航空發(fā)動機氣路故障診斷的過程中,對于模型的關(guān)注度過高,而對數(shù)據(jù)的關(guān)注度過低,往往也是導(dǎo)致診斷結(jié)果誤差大、性能提升低的重要原因。比如,對于淺層神經(jīng)網(wǎng)絡(luò),兩層隱藏層雖優(yōu)于單層,但對整體的性能提升不大,反而增加了模型訓(xùn)練的時間成本。且4個或8個輸入信號都能達到90%以上的診斷準(zhǔn)確度,此時對系統(tǒng)影響系數(shù)較大的參數(shù)選擇則能比調(diào)整系統(tǒng)參數(shù)帶來更多得性能提升和優(yōu)良表現(xiàn)[73]。
對于所收集的氣路參數(shù)進行準(zhǔn)備和分析,一般包括:①研究每個參數(shù)的屬性以及特征,即類型(數(shù)值型、文本型、結(jié)構(gòu)化等)、缺失值占比、噪聲及其類型(隨機、異常值或是舍入誤差等)、參數(shù)實用性、分布類型(高斯分布、均勻分布或泊松分布等);②數(shù)據(jù)可視化;③參數(shù)之間的相關(guān)性;④異常值和缺失值處理;⑤模型參數(shù)選擇;⑥特征工程和特征縮放。
在進行數(shù)據(jù)分析之時,對于數(shù)據(jù)的處理雖然重要,但是對數(shù)據(jù)背后與之相關(guān)的物理意義以及模型參數(shù)之間的關(guān)聯(lián)性也要敏銳察覺。優(yōu)秀的數(shù)據(jù)處理結(jié)果雖然能降低訓(xùn)練成本,平滑訓(xùn)練過程,但是了解和理解數(shù)據(jù)與現(xiàn)實物理模型之間的相關(guān)性則更能有助于是機器學(xué)習(xí)模型與物理模型貼合,使之更合理,模型更健壯。同時注重統(tǒng)計學(xué)知識的應(yīng)用,對參數(shù)與模型聯(lián)系的度量可以使用支持度和置信度兩個參數(shù)進行量化,有利于調(diào)整模型,但是對如何組合參數(shù),如何考量量化參數(shù)以及訓(xùn)練成本則提出了挑戰(zhàn)[74]。但需要強調(diào)的是,任何參數(shù)自身不一定代表單一特定的故障,其可能是許多故障衡量的參數(shù)之一。對于參數(shù)和氣路故障之間的聯(lián)系應(yīng)有二者是復(fù)雜、交錯和互相影響的概念[75]。再者,雖然利用可視化技術(shù)可以人為對參數(shù)之間的相關(guān)性有一個直觀和清晰的認識,但氣路參數(shù)常為多維,所以如何更準(zhǔn)確度量參數(shù)之間和參數(shù)與模型之間的相關(guān)性也是需要解決的重要問題[76]。如果對數(shù)據(jù)降維如利用PCA方法,以達到可視化的目的,那么如何最小化損失信息也是需要考慮的。另外,雖然從QAR中容易獲得氣路故障診斷所需的參數(shù)數(shù)據(jù)。但是傳感器所收集的數(shù)據(jù)也不一定都是準(zhǔn)確無誤的,數(shù)據(jù)的噪聲水平也是需要處理的。否則,高噪聲數(shù)據(jù)會使診斷的準(zhǔn)確率偏低。若要使用神經(jīng)網(wǎng)絡(luò)的方法診斷氣路故障,過高的噪聲水平是導(dǎo)致訓(xùn)練過程難度加大、診斷測試集準(zhǔn)確率低、使模型泛化能力偏低的主要原因。最后,傳感器所收集的參數(shù)之間量綱不同,如果不對參數(shù)進行歸一化處理和修正,那么模型訓(xùn)練有可能會加大大數(shù)值數(shù)據(jù)權(quán)重,使訓(xùn)練成本增加,且反映出的結(jié)果也不清晰。
對于所有擁有的參數(shù)數(shù)據(jù)量選擇合適的訓(xùn)練模型。如果數(shù)據(jù)量巨大,可將數(shù)據(jù)集分割為合適大小以快速訓(xùn)練不同的數(shù)據(jù)模型用來和研究對象形成對比,加快研究速度。但是如果對比對象為深度學(xué)習(xí)類別的復(fù)雜模型,則要考慮到分割數(shù)據(jù)量所導(dǎo)致的單個模型的數(shù)據(jù)集減少而引起的訓(xùn)練不足的影響。同時,可以采用K折交叉驗證充分衡量和比對模型之間的性能。對于超參數(shù)的合理選擇也尤為重要,因為超參數(shù)由人為手動選擇,那么超參數(shù)的選擇范圍過大會引起模型結(jié)果變化率大,而縮小超參數(shù)選擇范圍則會增加訓(xùn)練時間。利用網(wǎng)格搜索尋找合適的超參數(shù)也只適用于超參數(shù)值較少的情況,若超參數(shù)值較多則最好利用隨機搜索確定各個超參數(shù)優(yōu)良值的大致范圍,而采用貝葉斯優(yōu)化方法可以適當(dāng)減少訓(xùn)練時間[77]。
當(dāng)模型訓(xùn)練完畢,且泛化性能和魯棒性都達到業(yè)務(wù)指標(biāo)的情況下,在工業(yè)生產(chǎn)或?qū)嶋H應(yīng)用的情境中,若只考慮固定的輸入?yún)?shù),那么遇到新設(shè)備、新部件或新系統(tǒng)的情境下有可能會出現(xiàn)所訓(xùn)練的模型無法復(fù)用的情況。而此時重新開發(fā)算法又會增加維護成本,若優(yōu)化原模型又需要重定義接口,考慮新數(shù)據(jù)是否適用于新模型等問題。所以,在實際應(yīng)用中不僅要考慮模型診斷的性能,也要解決對于不同應(yīng)用下的適應(yīng)能力。
為了解決現(xiàn)有基于數(shù)據(jù)驅(qū)動方法的氣路故障診斷所出現(xiàn)的問題,未來的研究方向和發(fā)展趨勢如下。
(1)數(shù)據(jù)預(yù)處理標(biāo)準(zhǔn)化。在對航空發(fā)動機的氣路故障以數(shù)據(jù)驅(qū)動的方式進行診斷時。往往對模型關(guān)注度過高,而對數(shù)據(jù)的預(yù)處理不夠。若能建立標(biāo)準(zhǔn)化的數(shù)據(jù)預(yù)處理流程,則能更加高效地完成數(shù)據(jù)預(yù)處理工作,使數(shù)據(jù)能適用于不同的模型。同時,注重于數(shù)據(jù)的預(yù)處理工作能減少模型受到數(shù)據(jù)干擾導(dǎo)致的誤差(缺失值、異常值、噪聲數(shù)據(jù)以及未標(biāo)準(zhǔn)歸一化等),使針對氣路故障的診斷工作能更專注于模型的調(diào)整和優(yōu)化。所以,建立標(biāo)準(zhǔn)化的數(shù)據(jù)預(yù)處理流程,能更好地服務(wù)于后續(xù)關(guān)于模型的工作。
(2)診斷系統(tǒng)集成化。如今,越來越多的氣路故障診斷方法在基于一般的數(shù)據(jù)驅(qū)動方法基礎(chǔ)上,采用了能提升基礎(chǔ)系統(tǒng)性能的算法并將其融合于系統(tǒng)。針對不同機器學(xué)習(xí)方法的缺點,在參數(shù)維度、建模速度、結(jié)果結(jié)合分析等層面采取能有效提升過程性能的優(yōu)化方法,或利用傳統(tǒng)方法以及物理層面的技術(shù)措施(振動監(jiān)測、動力學(xué)分析和狀態(tài)監(jiān)控等)與數(shù)據(jù)驅(qū)動方法集成,取長補短,不僅滿足了基本的業(yè)務(wù)需求,還增加了系統(tǒng)整體的診斷準(zhǔn)確度和系統(tǒng)健壯性。
(3)診斷系統(tǒng)模塊化。航空發(fā)動機的氣路故障診斷系統(tǒng)還應(yīng)具備對部件或者設(shè)備更新的自適應(yīng)能力。在不同的環(huán)境或者新部件的情況下,也能具有自優(yōu)化,主動適應(yīng)或選擇適應(yīng)該環(huán)境下的故障診斷的能力。建議將航空發(fā)動機的氣路故障診斷系統(tǒng)進行模塊化,建立統(tǒng)一標(biāo)準(zhǔn),針對不同的處理過程和應(yīng)用環(huán)節(jié),分立為相同階段統(tǒng)一輸出的模塊。因此,在不同的環(huán)境下,在同一環(huán)節(jié)選擇適應(yīng)于此環(huán)境下的不同模塊,也能具有相同輸出給下一環(huán)節(jié)的上一環(huán)境的模塊。以診斷系統(tǒng)模塊化為前提,以增加系統(tǒng)整體對不同環(huán)境的適應(yīng)性,提高系統(tǒng)的魯棒性和工業(yè)應(yīng)用能力。但將診斷系統(tǒng)模塊化需要考慮如何將各個處理環(huán)節(jié)標(biāo)準(zhǔn)化和模塊化,同時如何將各個環(huán)節(jié)的輸出統(tǒng)一處理、統(tǒng)一度量以至于可用于下一環(huán)節(jié)不同模塊的輸入也是需要解決的一大難點。
(4)診斷結(jié)果可信度提升。診斷系統(tǒng)結(jié)果的準(zhǔn)確率和可信度雖然在訓(xùn)練時在有監(jiān)督和測試集的情況下可以預(yù)估,但如何提升系統(tǒng)在實際應(yīng)用場景面對無標(biāo)注數(shù)據(jù)的診斷結(jié)果的可信度也是需要商榷的問題。除了在模型構(gòu)建的場景使用交叉驗證等技術(shù)手段,在生產(chǎn)場景中也可使用物理仿真、發(fā)動機試車等方法收集數(shù)據(jù),不斷改進模型提升實際應(yīng)用結(jié)果可信度。應(yīng)當(dāng)在早期發(fā)現(xiàn)系統(tǒng)的缺陷以便于及時的改進和優(yōu)化,同時考慮實際應(yīng)用時診斷結(jié)果的置信水平以及采取輔助手段以解決錯誤診斷時及時發(fā)現(xiàn)錯誤診斷的結(jié)果,提高實際應(yīng)用的工作效率,降低運行成本。
介紹了航空發(fā)動機氣路故障的含義以及如何獲取故障信息的方法,總結(jié)了針對氣路故障業(yè)界的排故方法,重點敘述了以數(shù)據(jù)驅(qū)動方法對航空發(fā)動機進行氣路故障診斷的各種方式及其優(yōu)缺點,并對未來以數(shù)據(jù)驅(qū)動方法對氣路故障診斷展望了數(shù)據(jù)預(yù)處理化、診斷系統(tǒng)集成化、模塊化和診斷結(jié)果的可信度提升的發(fā)展趨勢。以助于業(yè)界對目前以數(shù)據(jù)驅(qū)動方法對航空發(fā)動機氣路故障診斷現(xiàn)狀的主要方法和面臨的主要問題有比較清晰的認知,并且在這一研究方向上對未來出現(xiàn)的新的診斷方法、診斷思路具有一定的參考價值。