劉 振, 張小軍,2, 潘 俊, 葉 茂, 苗 揚,2
(1.北京工業(yè)大學(xué) 材料與制造學(xué)部, 北京 100124; 2.北京工業(yè)大學(xué) 先進制造北京市重點實驗室, 北京 100124;3.中國航空工業(yè)集團 南京機電液壓工程研究中心,江蘇 南京 211102; 4.上海機電工程研究所,上海 200050)
飛機燃油系統(tǒng)是為飛機動力系統(tǒng)和其他輔助動力系統(tǒng)儲存、供給燃油的裝置,是整個飛機系統(tǒng)中極為重要的一部分。其中,燃油泵是飛機燃油系統(tǒng)的核心,它是否具有良好的健康狀態(tài)決定著飛機是否能夠正常安全地飛行。因此,為了保障飛機燃油系統(tǒng)的正常工作,對燃油泵的健康監(jiān)測是十分必要的。
目前,許多研究人員對飛機燃油系統(tǒng)故障進行了研究。姜偉華[1]通過小波分析法對油位傳感器的數(shù)據(jù)進行處理,通過尋找系數(shù)的極大值來確定故障嚴(yán)重程度;龍浩等[2]通過構(gòu)建專家系統(tǒng)和推理機對飛機燃油系統(tǒng)進行故障診斷,并通過仿真實驗驗證了專家系統(tǒng)的智能性及提出的重構(gòu)方案的有效性;馮驚雷等[3]利用粗糙集理論中的決策表簡化方法,將條件屬性進行約簡,建立了一種新的飛機燃油系統(tǒng)故障分類規(guī)則的形成方法;周云龍等[4-5]提出了一種EMD和邊際譜帶能量結(jié)合的方法,提取實驗壓力信號的低頻和高頻特征,并用BP網(wǎng)絡(luò)進行識別,在此基礎(chǔ)之上,通過將小波去噪與EMD能量熵相結(jié)合形成一個新方法,并將其引入到離心泵汽蝕故障診斷中,并取得了較好的效果;李偉光等[6]針對柔性薄壁軸承在發(fā)生故障產(chǎn)生的非平穩(wěn)、非線性信號,采用希爾伯特-黃變換方法進行分析,同時針對噪聲信號會污染整個希爾伯特譜的問題,提出了一種基于SVR譜的PCA降噪算法。郭衍峰等[7]對燃油系統(tǒng)活門進行仿真,證實了在流量和壓力增大時活門關(guān)閉容易出現(xiàn)結(jié)構(gòu)變形,導(dǎo)致活門出現(xiàn)卡死或者無法關(guān)閉的現(xiàn)象。
近年來,隨著計算機技術(shù)、傳感器技術(shù)的發(fā)展,數(shù)據(jù)驅(qū)動的機械智能故障診斷受到了廣泛的關(guān)注。機器學(xué)習(xí)因其強大的故障分類和預(yù)測能力被應(yīng)用到許多領(lǐng)域的故障診斷當(dāng)中,如風(fēng)力發(fā)電機、機床、機器人等。WANG Ziwei等[8]提出了一種基于小波包和隨機森林的旋轉(zhuǎn)機械故障診斷方法,通過小波包分解提取故障特征參數(shù),將5個無量綱指標(biāo)作為輸入,并利用隨機算林算法進行分類,取得了較好的結(jié)果;YANG Xiaoan等[9]采用統(tǒng)計分析、FFT、VMD三種方法多角度挖掘軸承的多域故障特征信息,并用拉普拉斯積分算法去除冗余信息,最后通過基于粒子群優(yōu)化的支持向量機分類模型對故障進行分類,并得到了較高的診斷精度;CHEN Qiuan等[10]為解決傳統(tǒng)機器學(xué)習(xí)算法對多類型并發(fā)故障的診斷準(zhǔn)確率較低的問題,提出了分層機器學(xué)習(xí)算法,第一層利用傳統(tǒng)機器學(xué)習(xí)模型識別具有明顯可分特征的故障,并過濾出具有不可分特征的故障,第二層模型識別上一層過濾掉的故障,并在齒輪箱仿真實驗中驗證了算法的有效性。JIANG Yuncheng等[11]利用SVM實現(xiàn)了飛機燃油系統(tǒng)間歇故障的檢測與診斷。
要訓(xùn)練出性能良好的故障診斷模型,需要有充足的故障數(shù)據(jù)進行訓(xùn)練,同時也要保障用于模型訓(xùn)練的數(shù)據(jù)與檢測對象有著相似的分布。但在飛機燃油泵的故障診斷當(dāng)中,故障數(shù)據(jù)存在以下幾個問題:
(1) 燃油泵數(shù)據(jù)有較強的噪聲干擾。飛機燃油系統(tǒng)的工作環(huán)境異常復(fù)雜,燃油泵的數(shù)據(jù)信息采集常常伴隨著其他器件信息的干擾,在提取可用故障信息時造成了較大的阻礙;
(2) 故障數(shù)據(jù)比較稀缺。飛機燃油泵的一些故障具有隨機性、偶發(fā)性的特點。因此,歷史故障數(shù)據(jù)是非常有限的,所以導(dǎo)致機器學(xué)習(xí)模型的訓(xùn)練數(shù)據(jù)十分有限,從而達不到較好的故障分類準(zhǔn)確度;
(3) 源域和目標(biāo)域數(shù)據(jù)之間存在較大的分布差異。由于燃油泵的現(xiàn)存數(shù)據(jù)有限,不足以完成模型訓(xùn)練與測試的任務(wù),所以需要借助其他結(jié)構(gòu)類似的燃油泵的故障數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。而其他燃油泵與飛機燃油泵的工況不同,這就導(dǎo)致兩種泵的故障信息的特征分布并不完全一致,所以如何消除該分布差異產(chǎn)生的影響是本研究需要解決的問題。
遷移學(xué)習(xí)的提出很好的解決了源域與目標(biāo)域分布差異問題,其主要目的是充分利用源域的知識來提高在目標(biāo)域的學(xué)習(xí)性能。典型的遷移學(xué)習(xí)方法主要有基于實例的、基于特征的、基于參數(shù)的和基于關(guān)系的算法[12],最初用在計算機視覺、自然語言處理上[13-14]。目前,已有很多學(xué)者將遷移學(xué)習(xí)應(yīng)用到多種設(shè)備的故障診斷領(lǐng)域,并取得了較好的效果[15-17]。QIU Zaihui[18]、MIAO Yang等[19]為解決飛機燃油泵、海水軸向柱塞液壓泵故障數(shù)據(jù)不足的問題,利用Tradaboost遷移學(xué)習(xí)算法將油泵數(shù)據(jù)作為輔助數(shù)據(jù)訓(xùn)練模型,完成目標(biāo)泵的故障診斷,證實了遷移學(xué)習(xí)的可行性。
一般來說,飛機燃油泵與其他類似結(jié)構(gòu)的燃油泵具有相似的力學(xué)性質(zhì)與工作狀態(tài),其故障數(shù)據(jù)中能體現(xiàn)出部分相似的特征。利用遷移學(xué)習(xí)把在其他類似結(jié)構(gòu)燃油泵上學(xué)習(xí)到的知識應(yīng)用到飛機燃油泵上,在此基礎(chǔ)之上,本研究提出了一種基于最大均值差異遷移學(xué)習(xí)的飛機燃油系統(tǒng)故障診斷算法,主要工作如下:
(1) 利用小波包分解提取燃油泵的故障信息特征,同時將這些特征作為故障診斷模型的輸入;
(2) 通過SMOTE過采樣算法對故障信息進行擴充,增加源域、目標(biāo)域的數(shù)據(jù)量,以減少在模型訓(xùn)練階段數(shù)據(jù)稀缺所導(dǎo)致的問題;
(3) 將最大均值差異(MMD)作為描述源域與目標(biāo)域分布差異的度量準(zhǔn)則。選取1維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN)中的部分層作為域自適應(yīng)層,將最大均值差異算法嵌入到域自適應(yīng)層當(dāng)中,從而解決源域與目標(biāo)域間的分布差異問題。
小波變換具有靈活的時頻分辨率特性,但在高頻區(qū)域變現(xiàn)不佳。小波包的提出[20]彌補了這一缺陷。小波包函數(shù)是一個有3個指標(biāo)的函數(shù):
(1)
其中,整數(shù)j和k分別是索引尺度和平移操作。前2個小波包函數(shù)分別是常用的尺度函數(shù)和母小波函數(shù):
(2)
(3)
對于n=2,3,…的小波包函數(shù)由下面的遞歸關(guān)系定義:
(4)
(5)
h(k)和g(k)是與預(yù)定的尺度函數(shù)和母小波函數(shù)相關(guān)的正交鏡像濾波器。為了測量信號中特定的時頻信息,只需取信號和特定基函數(shù)的內(nèi)積。函數(shù)f的小波包系數(shù)可以通過下式得出:
(6)
計算離散時間信號的小波包分解涉及到對離散時間信號應(yīng)用2個濾波器[x1,x2,…,xn],然后遞歸到中間信號。小波包分解原理如圖1所示。
S0,0.分解前的信號 Si,j.第i層第j個節(jié)點的分解信號圖1 小波包分解原理Fig.1 Wavelet packet decomposition principle
合成少數(shù)類過采樣技術(shù)(Synthetic Minority Oversampling Technique,SMOTE)是基于隨機過采樣算法的一種改進方案,由于隨機過采樣采取簡單復(fù)制樣本的策略來增加少數(shù)類樣本,這樣容易產(chǎn)生模型過擬合的問題,即使得模型學(xué)習(xí)到的信息過于特別而不夠泛化,SMOTE算法的基本思想是對少數(shù)類樣本進行分析并根據(jù)少數(shù)類樣本人工合成新樣本添加到數(shù)據(jù)集中,具體如圖2所示,算法流程如下:
圖2 SMOTE原理Fig.2 Principle of SMOTE
(2) 根據(jù)樣本不平衡比例設(shè)置一個采樣比例,以確定采樣倍率N,對于每一個少數(shù)類樣本x,從其K近鄰中隨機選擇n個樣本,即xn;
(3) 對于每一個隨機選擇出的xn,分別與初始樣本按如下公式來創(chuàng)建新樣本:
xnew=x+λ(xn-x)
(7)
其中,λ為0~1之間的隨機數(shù)。
在傳統(tǒng)的機器學(xué)習(xí)中,一般假設(shè)源域和目標(biāo)域的數(shù)據(jù)分布是相同的,這是一個理想的狀態(tài),但是在實際工況中,兩者的數(shù)據(jù)分布是不同的。以本研究的飛機燃油泵為例,不同型號的燃油泵所面臨的工況環(huán)境、噪聲情況以及運行形況都是不同的,這就導(dǎo)致即使是相同的故障模式,在不同的燃油泵中提取的信息會有明顯的差異。為解決這個問題,引入遷移學(xué)習(xí)的概念,即從已有的數(shù)據(jù)中學(xué)習(xí)經(jīng)驗知識,將此經(jīng)驗知識運用到未知的數(shù)據(jù)當(dāng)中。如圖3所示, 左圖為沒有遷移學(xué)習(xí)的情況下,分類會有分錯的現(xiàn)象;右圖是有遷移學(xué)習(xí)的情況下的分類結(jié)果,相比于左圖,在數(shù)據(jù)分布有差異的前提下,分類效果更好。
圖3 域差異問題Fig.3 Problem of domain discrepancy
我們總是喜歡苛責(zé)別人的過錯,用各種條件去要求他人,自己卻不遵守準(zhǔn)則。我們能輕易發(fā)現(xiàn)他人的錯誤,卻很少能揪出自己的不足。這正是因為我們?nèi)笔Я素?zé)己的自覺性。
(8)
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)在提取數(shù)據(jù)信息的深層特征方面有著較大優(yōu)勢,但這種優(yōu)勢僅在源域和目標(biāo)域數(shù)據(jù)分布極為相似時才能體現(xiàn)。源域和目標(biāo)域分布有差異時,CNN無法將相同故障數(shù)據(jù)的不同特征分布一一對應(yīng)起來,這導(dǎo)致了其遷移性能較弱,對于最終不同故障模式的判別有著非常嚴(yán)重的影響。MMD可以很好的解決這一問題,所以,本研究將MMD作為衡量深層特征分布差異的模塊嵌入到CNN的部分層中,構(gòu)建了基于最大均值差異遷移學(xué)習(xí)的智能診斷算法(M-CNN),該算法的網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。
圖4 M-CNN結(jié)構(gòu)圖Fig.4 Structure of M-CNN
M-CNN由若干層組成,每一層由一個一維卷積層、一個最大池化層和一個批歸一化層(BN)組成。在中間層,通過MMD模塊進行域分布信息的交互,再使用AdaptiveAvgPool層將經(jīng)過卷積之后的高維矩陣展平成一個一維數(shù)據(jù)列,最后通過Linear層對一維數(shù)據(jù)列壓縮,分別輸出類別標(biāo)簽和分類損失。
實驗平臺原理如圖5所示,本平臺可模擬燃油泵從儲油箱向供油箱輸送燃油的任務(wù)。如圖6a和圖6b分別為儲油箱輸油管和供油箱。
1.齒輪燃油泵 2.過濾器 3.節(jié)流閥 4.安全閥 5.壓力傳感器 6.開關(guān)閥 7.流量計 8.換向閥 9.油耗單元 10.傳感器圖5 實驗原理圖Fig.5 Schematic diagram of experiment
圖6 實驗裝置Fig.6 Installation diagram of experiment
本實驗使用加速度傳感器和壓力傳感器,加速度傳感器以磁吸方式安裝在電機殼頂部和側(cè)面,壓力傳感器安裝在燃油泵的出油口處。采集燃油泵健康狀態(tài)與8種故障狀態(tài)的信號,采樣頻率為2 kHz。詳細(xì)信息如表1所示。
表1 故障類別明細(xì)
將實驗采集的9種數(shù)據(jù)進行小波包去噪,使用SMOTE算法增加數(shù)據(jù)量,再將這些數(shù)據(jù)作為輸入送入網(wǎng)絡(luò)進行訓(xùn)練,具體實驗流程如圖7所示。
圖7 實驗流程圖Fig.7 Experimental flow chart
本研究所運行算法在Windows10系統(tǒng)上運行,處理器為AMD Ryzen 7 4800H,顯卡為GTX 1650Ti,網(wǎng)絡(luò)模型在Pytorch深度學(xué)習(xí)框架中搭建。
本研究的具體網(wǎng)絡(luò)參數(shù)如表2所示。
表2 網(wǎng)絡(luò)具體參數(shù)Tab.2 Network specific parameter
在網(wǎng)絡(luò)的訓(xùn)練中,優(yōu)化器選取SGD,學(xué)習(xí)率設(shè)置為0.01,動量設(shè)置為0.5,損失函數(shù)選用交叉熵?fù)p失函數(shù),訓(xùn)練集和測試集的batch_size分別設(shè)置為64和16,共訓(xùn)練100輪。
為了驗證驗證M-CNN的遷移性能,選用了以下2個模型進行對比分析:
(1) BP神經(jīng)網(wǎng)絡(luò),BP神經(jīng)網(wǎng)絡(luò)是一種多層的前饋神經(jīng)網(wǎng)絡(luò),其主要的特點是信號前向傳播,而誤差是反向傳播的。
(2) 長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM),LSTM是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)。
對比模型在實驗設(shè)置上與M-CNN保持一致,均采用大量訓(xùn)練數(shù)據(jù)和少量目標(biāo)數(shù)據(jù)作為訓(xùn)練集,將其余目標(biāo)數(shù)據(jù)作為測試集,學(xué)習(xí)率及訓(xùn)練集、測試集的batch_size設(shè)置為0.01,64,16。
將經(jīng)過小波包分解后的實驗數(shù)據(jù)分別送入BP神經(jīng)網(wǎng)絡(luò)、LSTM,CNN以及M-CNN中進行訓(xùn)練,分別得到4種模型的損失曲線,具體如圖8所示。
圖8 模型訓(xùn)練損失圖Fig.8 Variation plot of model training loss
由圖可以看出,BP,LSTM和CNN在訓(xùn)練過程中,損失由1.7~2.6下降至0.6附近,并出現(xiàn)較大波動。相較于BP,LSTM和CNN, M-CNN在訓(xùn)練過程中更快的收斂,損失也從2.3迅速下降,最在0.1附近趨近穩(wěn)定。
模型訓(xùn)練結(jié)束后,對4種模型進行測試,分別得到模型對應(yīng)的混淆矩陣。混淆矩陣體現(xiàn)了模型在分類過程中判斷正確的概率以及判斷錯誤為其他類別的概率,具體如圖9所示。
圖9 模型混淆矩陣結(jié)果Fig.9 Results of confuses matrix
由圖9可以看出,BP神經(jīng)網(wǎng)絡(luò)和LSTM存在很多分錯類別的現(xiàn)象,盡管有一些類別判斷正確,但判斷正確的準(zhǔn)確率也相對較低;CNN的表現(xiàn)略好于BP和LSTM,很多故障類別都判斷正確且正確率較高,這種現(xiàn)象主要歸功于CNN在處理非線性信息的能力以及深層特征挖掘的能力,但也有一些類別存在分錯、正確率低的現(xiàn)象,因為本實驗的訓(xùn)練集和測試集相同故障的數(shù)據(jù)分布不同,并且CNN沒有處理域分布不同數(shù)據(jù)的能力,所以導(dǎo)致了這種結(jié)果。反觀M-CNN,由于MMD模塊的引入,能很好的處理存在分布差異的數(shù)據(jù),區(qū)分每一類別的正確率都比較高,這也體現(xiàn)出M-CNN在處理多分類任務(wù)且數(shù)據(jù)分布存在差異的問題時有著較強的能力。
混淆矩陣體現(xiàn)了4種模型在某一類別的判斷能力,為了更好的評估模型,還需要從測試集整體上來分析。本研究引入正確率、精確度、召回率、F1分?jǐn)?shù)4個模型評價指標(biāo)來評估M-CNN的能力:
(1) 準(zhǔn)確率:預(yù)測正確的結(jié)果占總樣本的百分比;
(2) 精確度:在被所有預(yù)測為正的樣本中實際為正樣本的概率;
(3) 召回率:在實際為正的樣本中被預(yù)測為正樣本的概率;
(4) F1分?jǐn)?shù):同時考慮精確率和召回率,讓兩者同時達到最高,取得平衡。
具體結(jié)果如表3所示。
表3 各模型評價指標(biāo)結(jié)果Tab.3 Evaluation index results of each model
從表3可以看出,M-CNN在準(zhǔn)確率、精確度、召回率和F1分?jǐn)?shù)4個指標(biāo)的表現(xiàn)均遠(yuǎn)優(yōu)于BP、LSTM和CNN,所以,更能說明M-CNN在多分類問題、數(shù)據(jù)分布差異問題上表現(xiàn)優(yōu)異。
本研究提出了一種基于最大均值差異的遷移學(xué)習(xí)算法用來處理一維數(shù)據(jù)信息,實現(xiàn)故障模式的判別。主要工作總結(jié)如下:
(1) 利用小波包算法去除數(shù)據(jù)的噪聲,避免了在模型訓(xùn)練過程中噪聲的干擾;
(2) 通過SMOTE過采樣,對小樣本數(shù)據(jù)進行擴充,使得模型得到充分的訓(xùn)練,實現(xiàn)更好的分類效果;
(3) 構(gòu)建了基于最大均值差異的遷移學(xué)習(xí)算法(M-CNN),將MMD模塊嵌入CNN中,用來解決數(shù)據(jù)分布差異問題。同時將此方法與BP神經(jīng)網(wǎng)絡(luò)、LSTM和CNN進行實驗對比,結(jié)果表明,M-CNN的準(zhǔn)確率為99.40%,遠(yuǎn)優(yōu)于其他3種算法,體現(xiàn)了其處理多分類、域差異問題的良好能力。