張俊紅, 孫詩(shī)躍, 朱小龍, 周啟迪, 戴胡偉, 林杰威
(1. 天津大學(xué) 內(nèi)燃機(jī)燃燒學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,天津 300072;2. 天津大學(xué) 仁愛(ài)學(xué)院,天津 301636)
柴油機(jī)作為工業(yè)、農(nóng)業(yè)、核電及其他領(lǐng)域的主要?jiǎng)恿υ?,由于其?nèi)部結(jié)構(gòu)復(fù)雜,工作環(huán)境惡劣,容易誘發(fā)故障[1],而振動(dòng)分析法因其適用范圍廣,信號(hào)檢測(cè)便捷而被大量應(yīng)用于柴油機(jī)故障診斷當(dāng)中。傳統(tǒng)基于振動(dòng)分析的柴油機(jī)故障診斷方法主要包含信號(hào)處理、特征提取、模式識(shí)別3個(gè)過(guò)程。文獻(xiàn)[2]提出了自適應(yīng)參數(shù)選取的改進(jìn)集合經(jīng)驗(yàn)?zāi)B(tài)分解信號(hào)分解方法并進(jìn)行了柴油機(jī)氣缸磨損診斷。文獻(xiàn)[3]采用自適應(yīng)可調(diào)品質(zhì)因子小波變換濾波器進(jìn)行了微弱故障的特征提取。文獻(xiàn)[4]提出了基于人工神經(jīng)網(wǎng)絡(luò)、信念規(guī)則推理以及證據(jù)推理的集成模式識(shí)別算法。傳統(tǒng)故障診斷方法需要對(duì)振動(dòng)信號(hào)進(jìn)行大量前處理,且難以表征被測(cè)信號(hào)與故障之間的復(fù)雜映射關(guān)系[5],特征提取與模式識(shí)別部分并不連貫,不利于實(shí)現(xiàn)柴油機(jī)的在線故障診斷。
近年來(lái),為了解決傳統(tǒng)故障診斷提取的特征對(duì)故障敏感性低、模塊不連貫的問(wèn)題,卷積神經(jīng)網(wǎng)絡(luò) (convolutional neural network,CNN)因其自適應(yīng)特征提取能力被廣泛應(yīng)用于柴油機(jī)故障診斷。文獻(xiàn)[6]研究了基于加窗與CNN的柴油機(jī)拉缸故障診斷方法。文獻(xiàn)[7]提出了基于一維卷積長(zhǎng)短期記憶網(wǎng)絡(luò)的柴油機(jī)工況識(shí)別方法,識(shí)別精度達(dá)到了99.08%。文獻(xiàn)[8]針對(duì)柴油機(jī)失火故障提出了基于隨機(jī)丟棄與批標(biāo)準(zhǔn)化的深度CNN,取得了較高的準(zhǔn)確率。CNN優(yōu)異的機(jī)械故障分類能力是建立在海量訓(xùn)練樣本基礎(chǔ)之上的,工程實(shí)際中可用的故障樣本往往十分有限,此時(shí)CNN的訓(xùn)練常常伴隨著參數(shù)量過(guò)大、過(guò)擬合、收斂速度較慢的問(wèn)題。
基于此,本文提出了一種基于小批量訓(xùn)練與全局平均池化的CNN(mini-batch training and global average pooling based convolutional neural network,MGCNN)作為柴油機(jī)故障診斷方法,該方法直接將一維振動(dòng)信號(hào)作為輸入,利用兩個(gè)卷積模塊自適應(yīng)提取故障特征,采用全局平均池化(global average pooling,GAP)層進(jìn)行特征整合,采用指數(shù)線性單元(exponential linear units,ELU)作為激活函數(shù)及小批量訓(xùn)練方法加速模型收斂,實(shí)現(xiàn)了“端到端”的故障診斷。以柴油機(jī)典型故障試驗(yàn)為例,與未改進(jìn)的CNN算法、傳統(tǒng)的時(shí)頻特征提取方法以及Jiang等和張康等的深度學(xué)習(xí)模型進(jìn)行對(duì)比,驗(yàn)證了所提方法的有效性。
CNN一般由卷積層、池化層(也稱降采樣)、全連接層以及輸出層構(gòu)成[9],其中,卷積層與池化層一般會(huì)視具體問(wèn)題而取若干個(gè)來(lái)提取樣本的局部特征,激活函數(shù)使模型能夠提取非線性特征,這些特征隨著卷積層與池化層的堆疊而從低級(jí)轉(zhuǎn)向高級(jí),之后由全連接層整合這些局部特征,輸出層根據(jù)這些特征判定樣本的類別[10]。
1.1.1 卷積層
卷積層由多個(gè)特征面組成,特征面由多個(gè)神經(jīng)元組成,而神經(jīng)元通過(guò)卷積核與上一層的輸出相連,其中卷積核等同于一個(gè)權(quán)值矩陣,一維CNN卷積過(guò)程示意圖,如圖1所示。
圖1 一維CNN卷積過(guò)程
圖1左側(cè)為單個(gè)卷積核的卷積過(guò)程,卷積核大小為3×1,卷積步長(zhǎng)為1。卷積及激活運(yùn)算過(guò)程可以用式(1)表示。
xout,nk=fcov(xin,1h×w1(h)n(k)+xin,1(h+1)×w1(h+1)n(k)+xin,1(h+2)×w1(h+2)n(k)+…+bn)
(1)
式中:xout,nk為卷積層中輸出特征面n第k個(gè)神經(jīng)元的輸出值;xin,mh為其輸入特征面m第h個(gè)神經(jīng)元的輸出值;bn為輸出特征面n的偏置值;fcov(·)為激活函數(shù)。
1.1.2 池化層
卷積層的輸出即為池化層的輸入。池化層旨在降低特征的分辨率來(lái)獲得具有空間不變性的特征。常見(jiàn)的池化方法有最大池化、平均池化,最大池化是指取局部接受域中值最大的點(diǎn);平均池化,即取局部接受域中所有值的均值。池化運(yùn)算過(guò)程可以用式(2)表示。
tout,nl=fsub[tin,nq,tin,n(q+1)]
(2)
式中:tout,nl為池化層中第n個(gè)輸出特征面第l個(gè)神經(jīng)元的輸出值;tin,nq為池化層中第n個(gè)輸入特征面第q個(gè)神經(jīng)元輸入值;fsub(·)為取最大值或者取均值操作。
1.1.3 全連接層與輸出層
在卷積模塊之后,往往會(huì)添加一層或多層全連接層,全連接層之后會(huì)添加一層輸出層,全連接層和輸出層的每個(gè)神經(jīng)元都與前一層的所有神經(jīng)元進(jìn)行全連接,二者的區(qū)別在于采用的激活函數(shù)以及神經(jīng)元個(gè)數(shù)的不同,輸出層的激活函數(shù)一般為Softmax,其作用是將分類概率進(jìn)一步放大,輸出層的神經(jīng)元個(gè)數(shù)一般為預(yù)測(cè)的類別數(shù)量。全連接層的神經(jīng)元個(gè)數(shù)以及激活函數(shù)則需依據(jù)具體問(wèn)題類型人為設(shè)定。
盡管CNN訓(xùn)練時(shí)有批標(biāo)準(zhǔn)化、隨機(jī)丟棄等技巧來(lái)提高網(wǎng)絡(luò)訓(xùn)練速度,但在處理小規(guī)模數(shù)據(jù)集時(shí)依然存在收斂速度較慢、容易過(guò)擬合等問(wèn)題。針對(duì)這一問(wèn)題,提出了基于小批量訓(xùn)練與全局平均池化的卷積神經(jīng)網(wǎng)絡(luò)MGCNN。
MGCNN的基本結(jié)構(gòu),如圖2所示。其由兩層卷積模塊組成,每一個(gè)卷積模塊又由卷積層、激活層以及最大池化層構(gòu)成。其輸入為原始一維振動(dòng)信號(hào),第一個(gè)卷積層設(shè)置規(guī)格為64×1的卷積核,設(shè)置卷積步長(zhǎng)為4以降低模型對(duì)高頻噪聲的敏感性;第二個(gè)卷積層設(shè)置3×1的卷積核,卷積步長(zhǎng)為1以提取更細(xì)微的局部特征[11]。全局平均池化層將卷積模塊提取的特征整合。最后由Softmax分類器完成分類。
圖2 MGCNN結(jié)構(gòu)
工程實(shí)際中采集到的柴油機(jī)故障數(shù)據(jù)量往往有限,不利于深度學(xué)習(xí)模型的訓(xùn)練。因此MGCNN在結(jié)構(gòu)以及訓(xùn)練方法上均作了改進(jìn)。
1.2.1 數(shù)據(jù)增強(qiáng)
根據(jù)柴油機(jī)工作特點(diǎn),一個(gè)工作循環(huán)長(zhǎng)度的信號(hào)即可反映其工作狀況,所以可在測(cè)得的一段振動(dòng)信號(hào)中截取一個(gè)工作循環(huán)長(zhǎng)度的信號(hào)作為一個(gè)樣本。據(jù)此,本文采取了如圖3所示的數(shù)據(jù)增強(qiáng)方式。
圖3 數(shù)據(jù)增強(qiáng)方式
通過(guò)一個(gè)發(fā)動(dòng)機(jī)工作循環(huán)長(zhǎng)度的窗口從信號(hào)的一端以一定的步長(zhǎng)滑動(dòng)到另一端,窗口所經(jīng)過(guò)的地方即為篩選出來(lái)的樣本。這種增強(qiáng)方式可以增加訓(xùn)練樣本的數(shù)量,使得模型訓(xùn)練更加穩(wěn)定,同時(shí)又能符合柴油機(jī)工作特點(diǎn),使得模型具有更強(qiáng)的魯棒性。
1.2.2 小批次訓(xùn)練
在深度學(xué)習(xí)模型的訓(xùn)練中,訓(xùn)練批次大小是一個(gè)很重要的超參數(shù),因?yàn)榕蔚慕y(tǒng)計(jì)信息決定了梯度下降的方向,進(jìn)而決定了模型的收斂速度。小批次訓(xùn)練可以降低計(jì)算機(jī)的內(nèi)存占用,又能使批統(tǒng)計(jì)值波動(dòng)范圍更大,給訓(xùn)練過(guò)程增加隨機(jī)性,進(jìn)而增強(qiáng)模型的泛化性能。訓(xùn)練批次大小的選擇往往取決于數(shù)據(jù)規(guī)模以及計(jì)算機(jī)性能。
1.2.3 ELU激活函數(shù)
激活操作旨在將卷積的結(jié)果進(jìn)行一次非線性變換從而提高模型的非線性擬合能力。MGCNN所采用的激活函數(shù)為ELU[12],相比線性激活單元(rectified linear unit,ReLU),ELU存在負(fù)值,對(duì)輸入變化或噪聲更具魯棒性,可以將激活函數(shù)的輸出均值向0推進(jìn),起到批標(biāo)準(zhǔn)化效果的同時(shí)具有更低的計(jì)算復(fù)雜程度,從而使模型快速收斂。ELU的定義為
(3)
1.2.4 全局平均池化
常見(jiàn)的全局池化方式有兩種:全局最大池化(global max pooling,GMP)以及全局平均池化(global average pooling,GAP)。本文用到的GAP操作指的是取卷積模塊后每一個(gè)特征面的平均值。GAP等于在整個(gè)網(wǎng)絡(luò)架構(gòu)上做正則化進(jìn)而防止全連接層的參數(shù)過(guò)多導(dǎo)致的過(guò)擬合同時(shí)又避免了隨機(jī)丟棄等正則化方法的超參數(shù)引入,通過(guò)加強(qiáng)特征面與類別間對(duì)應(yīng)關(guān)系賦予每個(gè)特征面具體意義[13]。
綜上所述,針對(duì)柴油機(jī)故障數(shù)據(jù)集特點(diǎn),MGCNN采用淺層的網(wǎng)絡(luò)提取信號(hào)故障特征;采用ELU代替?zhèn)鹘y(tǒng)CNN中的激活函數(shù)ReLU,起到激活與批標(biāo)準(zhǔn)化的雙重作用同時(shí)不用引入多余可訓(xùn)練參數(shù);采用全局平均池化代替全連接層將可訓(xùn)練參數(shù)個(gè)數(shù)進(jìn)一步從40 630降低到2 806;此外,MGCNN采用的小批量訓(xùn)練方式使其在處理柴油機(jī)振動(dòng)信號(hào)這種小樣本數(shù)據(jù)集時(shí),能擁有較快的收斂速度且進(jìn)一步提升模型的準(zhǔn)確率與穩(wěn)定性。
試驗(yàn)對(duì)象為某六缸柴油機(jī),通過(guò)PCB 356A26型三向加速度傳感器采集缸蓋和缸體振動(dòng)信號(hào),采用光電轉(zhuǎn)速傳感器測(cè)量上止點(diǎn)信號(hào)以對(duì)振動(dòng)信號(hào)進(jìn)行時(shí)間定位[14]。為了降低高轉(zhuǎn)速下噴油量、燃燒爆壓和轉(zhuǎn)速波動(dòng)對(duì)故障試驗(yàn)的影響,本次測(cè)試在怠速950 r/min下進(jìn)行。采樣頻率為25 kHz,試驗(yàn)系統(tǒng)如圖4所示。三向加速度傳感器“1”和加速度傳感器“2”安裝在第六缸缸蓋和缸體上;反光標(biāo)簽粘貼在飛輪盤(pán)與第六缸上止點(diǎn)對(duì)應(yīng)位置,利用光電傳感器“3”檢測(cè)柴油機(jī)上止點(diǎn)信號(hào)。
圖4 試驗(yàn)裝置及傳感器布置
本試驗(yàn)?zāi)M的燃油系統(tǒng)故障包括:供油提前角偏大、偏小,失火故障和燃燒不良故障,其中失火故障通過(guò)切斷供油實(shí)現(xiàn)。配氣機(jī)構(gòu)故障包括:進(jìn)氣門(mén)間隙異常和排氣門(mén)間隙異常,氣門(mén)間隙異常通過(guò)塞卡尺調(diào)節(jié)氣門(mén)螺栓實(shí)現(xiàn),氣門(mén)間隙調(diào)整方式如圖5所示,正常的進(jìn)、排氣門(mén)間隙為0.25 mm、0.5 mm,其中氣門(mén)間隙偏大故障是指比正常間隙大0.1 mm。
圖5 氣門(mén)間隙調(diào)整方案
試驗(yàn)還模擬了進(jìn)氣濾清器阻塞和排氣管阻塞等故障,其中進(jìn)氣濾清器堵塞通過(guò)硬紙板遮擋進(jìn)氣口實(shí)現(xiàn)。故障設(shè)置具體如表1所示。實(shí)測(cè)振動(dòng)信號(hào)的時(shí)域波形如圖6所示。
表1 故障類型設(shè)置
圖6 部分工況時(shí)域波形
基于MGCNN的故障診斷流程如圖7所示。主要包括以下3個(gè)步驟。
圖7 MGCNN故障診斷流程
步驟1獲取柴油機(jī)的原始振動(dòng)信號(hào),將采集的故障數(shù)據(jù)以一定的數(shù)據(jù)增強(qiáng)方式劃分為訓(xùn)練集、驗(yàn)證集與測(cè)試集。
步驟2用訓(xùn)練集對(duì)MGCNN進(jìn)行訓(xùn)練,反復(fù)調(diào)整模型參數(shù)。用驗(yàn)證集驗(yàn)證訓(xùn)練后的模型性能,直到符合停止準(zhǔn)則,保存此時(shí)訓(xùn)練好的模型。
步驟3用測(cè)試集測(cè)試訓(xùn)練好的模型,得到最終診斷結(jié)果。
停止準(zhǔn)則指的是達(dá)到了一定的訓(xùn)練代數(shù)或者在連續(xù)兩代訓(xùn)練時(shí)模型在訓(xùn)練集上的準(zhǔn)確率提升不超過(guò)0.001。本文所有診斷結(jié)果均為20次試驗(yàn)測(cè)試準(zhǔn)確率的平均值。
選擇3.1節(jié)中的發(fā)動(dòng)機(jī)6種工況為診斷對(duì)象,最終每種工況下測(cè)得長(zhǎng)度為94 560的振動(dòng)信號(hào),選擇窗口規(guī)格為3 160×1,滑動(dòng)步長(zhǎng)為500截取試驗(yàn)樣本,按照8∶1∶1的比例劃分訓(xùn)練集,驗(yàn)證集以及測(cè)試集,具體情況如表2所示。
表2 數(shù)據(jù)集劃分
為了驗(yàn)證訓(xùn)練批次大小對(duì)網(wǎng)絡(luò)性能的影響,考慮數(shù)據(jù)集的規(guī)模,選取了從4~128 6種不同批次的訓(xùn)練方式進(jìn)行對(duì)比,6種模型除了訓(xùn)練批次設(shè)置不同之外,其余參數(shù)均相同。試驗(yàn)平臺(tái)為i5-4570,8 GB內(nèi)存,試驗(yàn)環(huán)境為python3.7.4,后端為tensorflow2.0,取30代訓(xùn)練后模型在測(cè)試集上的表現(xiàn),最終結(jié)果如圖8所示。
圖8 不同訓(xùn)練批次模型性能表現(xiàn)
當(dāng)訓(xùn)練批次過(guò)小時(shí),樣本之間的差異性導(dǎo)致批次的統(tǒng)計(jì)特征變化范圍很大,使得梯度下降的方向不穩(wěn)定,所以診斷準(zhǔn)確率波動(dòng)幅度也很大,又因?yàn)檫^(guò)小的訓(xùn)練批次會(huì)增加計(jì)算機(jī)運(yùn)算次數(shù),其訓(xùn)練時(shí)間相對(duì)較長(zhǎng)。相反,當(dāng)訓(xùn)練批次過(guò)大時(shí),由于訓(xùn)練集規(guī)模的限制,其梯度下降次數(shù)過(guò)少,不容易找到全局最優(yōu)解,而且此時(shí)考慮的是大規(guī)模樣本的統(tǒng)計(jì)特征,并不能準(zhǔn)確地代表訓(xùn)練集的梯度更新方向。當(dāng)訓(xùn)練批次大小為8時(shí),模型訓(xùn)練時(shí)間相對(duì)較長(zhǎng),但其準(zhǔn)確率與穩(wěn)定性均最高,故MGCNN模型最終確定的訓(xùn)練批次大小為8。
為了驗(yàn)證所提方法的先進(jìn)性,用多列卷積神經(jīng)網(wǎng)絡(luò)(multi-column convolutional neural network,MCNN)(全連接層代替全局平均池化層)以及MGCNN(ReLU)算法(ReLU作為激活函數(shù)替代ELU)作為對(duì)照,兩種方法的其余參數(shù)均保持一致。亦用Jiang等研究中的1D-CLSTM(one-dimensionalconvolutional long short-term network)以及張康等研究中的DBDCNN模型作為對(duì)比,取30代訓(xùn)練后模型在測(cè)試集上的準(zhǔn)確率。各算法的表現(xiàn)如圖9所示。
圖9 不同模型的平均性能對(duì)比
5種深度學(xué)習(xí)模型中,MCNN全連接層的每個(gè)神經(jīng)元都與前一層的所有神經(jīng)元相連接,增大了模型參數(shù)量進(jìn)而產(chǎn)生了過(guò)擬合現(xiàn)象。DBDCNN的模型復(fù)雜度過(guò)高,雖然采用了隨機(jī)丟棄與批歸一化方法來(lái)降低過(guò)擬合,但其5層卷積網(wǎng)絡(luò)以及3層全連接層的總可訓(xùn)練參數(shù)量達(dá)到了將近10萬(wàn),降低了收斂速度,模型穩(wěn)定性也有所下降。1D-CLSTM方法增加了長(zhǎng)短期記憶網(wǎng)絡(luò)單元(long short-term memory, LSTM)來(lái)提取信號(hào)的時(shí)序相關(guān)性特征,相比前兩種方法這些特征對(duì)柴油機(jī)故障敏感性更高,但LSTM的缺陷在于其參數(shù)量過(guò)大,訓(xùn)練時(shí)間過(guò)長(zhǎng),收斂速度慢,而且準(zhǔn)確率波動(dòng)也較大。用ReLU替代ELU作為激活函數(shù)時(shí),算法的準(zhǔn)確率與運(yùn)算時(shí)間均稍有下降。MGCNN模型的可訓(xùn)練參數(shù)僅為2 806個(gè),模型體積最小,在保證良好的擬合性能的同時(shí)極大地縮短了訓(xùn)練時(shí)長(zhǎng),模型穩(wěn)定性也最高,對(duì)硬件算力的要求更低,因此也更適用于柴油機(jī)在線故障診斷系統(tǒng)的研發(fā)開(kāi)發(fā)。
為了更加清晰地展示MGCNN的訓(xùn)練過(guò)程,導(dǎo)出1~200代訓(xùn)練時(shí)MGCNN模型在驗(yàn)證集上的準(zhǔn)確率并用MGCNN(ReLU)、DBDCNN、1D-CLSTM算法作為對(duì)照,4種方法的具體準(zhǔn)確率波動(dòng)如圖10所示。其中MGCNN方法可以快速收斂,前30代訓(xùn)練在驗(yàn)證集上的準(zhǔn)確率已經(jīng)達(dá)到了100%且穩(wěn)定性最高;MGCNN(ReLU)也能做到快速收斂,但訓(xùn)練過(guò)程中其準(zhǔn)確率波動(dòng)較大;而DBDCNN與1D-CLSTM方法收斂速度均較慢且更加不穩(wěn)定。
圖10 前200代訓(xùn)練模型在驗(yàn)證集的準(zhǔn)確率
為了更加直觀地展示MGCNN特征提取到最終模式識(shí)別的過(guò)程,用T-SNE算法將訓(xùn)練好的MGCNN模型特定層的數(shù)據(jù)維度降至二維。MGCNN的特征提取及分類過(guò)程如圖11所示。
圖11 MGCNN特征提取及分類過(guò)程
可以發(fā)現(xiàn),數(shù)據(jù)通過(guò)第一個(gè)卷積模塊的最大池化層后,由起始的雜亂無(wú)章的排列到有了小規(guī)模的聚類。通過(guò)第二層卷積以及池化,相同工況的數(shù)據(jù)開(kāi)始了更大規(guī)模的聚集,網(wǎng)絡(luò)開(kāi)始學(xué)習(xí)到各種模式特有的內(nèi)蘊(yùn)流形分布。全局平均池化層綜合32個(gè)特征圖的信息,基本完成各種故障模式分類,此時(shí)各工況樣本已無(wú)交疊。最后由多分類函數(shù)進(jìn)一步放大分類效果,通過(guò)擴(kuò)大不同模式數(shù)據(jù)的空間距離完成最終識(shí)別。
為了檢驗(yàn)所提出方法自適應(yīng)特征提取的有效性,選用11種時(shí)域特征(time domain features,T_features),12種頻域特征(frequency domain features,F(xiàn)_features),以及總共23種特征(ALL_features)作為對(duì)比[15],幾種算法僅特征提取部分存在區(qū)別。不同方法平均診斷性能的對(duì)比,如圖12所示。
頻域特征組診斷準(zhǔn)確率最低。單獨(dú)提取時(shí)域特征做診斷能達(dá)到將近90%的準(zhǔn)確率,準(zhǔn)確率的波動(dòng)也較F_features組下降很多。ALL_features組診斷準(zhǔn)確率只有81.525%,這說(shuō)明這些人工提取的時(shí)域、頻域特征之間存在著一定量的信息冗余,進(jìn)而導(dǎo)致準(zhǔn)確率以及穩(wěn)定性下降。最后本文所提出的MGCNN模型在20次試驗(yàn)中有10次在測(cè)試集的準(zhǔn)確率達(dá)到了100%,20次診斷的平均準(zhǔn)確率達(dá)到了99.18%,其自適應(yīng)提取的特征故障敏感性更高且準(zhǔn)確率波動(dòng)最小。
MGCNN方法與T_F方法對(duì)所有樣本分類的具體情況,如圖13、圖14所示。A1~A6分別代表正常、進(jìn)氣門(mén)間隙偏大、排氣門(mén)間隙偏大、進(jìn)氣濾清器堵塞、第五缸失火、第六缸失火。
圖13 T_features的預(yù)測(cè)混淆矩陣
圖14 MGCNN的預(yù)測(cè)混淆矩陣
從具體分類情況看,時(shí)域特征對(duì)失火故障以及正常工況敏感性較強(qiáng),但不足以準(zhǔn)確區(qū)分配氣機(jī)構(gòu)故障。而MGCNN模型能夠更加精確地識(shí)別6種發(fā)動(dòng)機(jī)工況,其診斷準(zhǔn)確率均保持在97%以上。
為了檢驗(yàn)所提方法對(duì)小樣本數(shù)據(jù)集的識(shí)別效果,減小數(shù)據(jù)增強(qiáng)程度,以500為單位長(zhǎng)度增大滑動(dòng)步長(zhǎng),分別取6種不同規(guī)模的數(shù)據(jù)集,各增強(qiáng)方式及所得樣本數(shù)量如表3所示。各算法在不同規(guī)模數(shù)據(jù)集上的測(cè)試結(jié)果,如圖15所示。
表3 不同數(shù)據(jù)增強(qiáng)方式及樣本量
圖15 各模型在不同規(guī)模數(shù)據(jù)集上診斷效果
隨著樣本數(shù)量的減小,各種方法精確度均出現(xiàn)不同程度的下降,說(shuō)明各模型尤其深度學(xué)習(xí)方法的訓(xùn)練需要大量樣本的支持。其中MCNN方法診斷精度最低且受數(shù)據(jù)規(guī)模影響最大,全連接層不能有效地整合卷積層特征而產(chǎn)生過(guò)擬合現(xiàn)象,在處理小規(guī)模數(shù)據(jù)集時(shí)此弊端更加明顯;1D-CLSTM與DBDCNN算法亦均存在過(guò)擬合現(xiàn)象且其收斂速度均過(guò)慢,不適合作為柴油機(jī)診斷系統(tǒng)的內(nèi)置算法;而T_features模型則存在欠擬合現(xiàn)象,由于人為設(shè)定的特征故障敏感性較差且具有一定程度的信息冗余,其在訓(xùn)練集、驗(yàn)證集上的準(zhǔn)確率均較低;MGCNN(ReLU)算法適用于小樣本故障診斷,但其精度與穩(wěn)定性較MGCNN均有降低;隨著樣本量減少,MGCNN算法的準(zhǔn)確率最穩(wěn)定,當(dāng)訓(xùn)練集樣本量?jī)H為150時(shí),其在測(cè)試集上仍能取得大于94%的診斷精度,因此也更適用于實(shí)際工程應(yīng)用中的柴油機(jī)故障診斷系統(tǒng)開(kāi)發(fā)。
針對(duì)傳統(tǒng)方法提取的柴油機(jī)故障特征敏感性差、現(xiàn)有基于CNN的故障診斷算法收斂速度慢且易于過(guò)擬合、不適用于小樣本數(shù)據(jù)集等問(wèn)題,本文提出了一種 “端到端”的柴油機(jī)故障診斷方法MGCNN。
(1) 模型采用小批量訓(xùn)練及ELU激活函數(shù)提高了擬合效果,加快了收斂速度,采用全局平均池化代替全連接層減少了模型參數(shù),避免了過(guò)擬合現(xiàn)象。MGCNN的平均診斷精度達(dá)到了99.18%。
(2) 與時(shí)/頻域特征的對(duì)比證明了提出的MGCNN具備自適應(yīng)特征提取能力;在縮減數(shù)據(jù)集規(guī)模后,與未改進(jìn)算法、時(shí)域特征算法、DBDCNN以及1D-CLSTM模型進(jìn)行對(duì)比,證明了MGCNN處理小樣本數(shù)據(jù)集的優(yōu)勢(shì)。
(3) MGCNN具有模型體積小、收斂速度快、診斷精度與穩(wěn)定性高、可處理小樣本數(shù)據(jù)集等優(yōu)點(diǎn),對(duì)實(shí)現(xiàn)深度學(xué)習(xí)在柴油機(jī)狀態(tài)監(jiān)測(cè)上的工程應(yīng)用,提升工業(yè)裝備可靠性與安全性有重要意義。