劉 嵐,侯立群
(華北電力大學(xué) 自動(dòng)化系,河北 保定 071003)
故障特征提取和故障分類是設(shè)備故障診斷的兩個(gè)主要步驟。故障特征提取方法可分為時(shí)域法、頻域法和時(shí)頻分析法。時(shí)域法和頻域法的統(tǒng)計(jì)參數(shù)很難充分反映設(shè)備運(yùn)行狀態(tài)的動(dòng)態(tài)變化,而時(shí)頻分析法獲得的故障特征通常維度較高、數(shù)據(jù)量大。此外,設(shè)備運(yùn)行環(huán)境和工況的變化也會(huì)增加故障特征的復(fù)雜性。這無(wú)疑增加了常用故障分類器(如支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò))的訓(xùn)練難度[1]。
深度學(xué)習(xí)具有超強(qiáng)的學(xué)習(xí)能力。卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為深度學(xué)習(xí)的重要模型之一,得到了廣泛應(yīng)用[2,3]。由于2D CNN在圖像識(shí)別領(lǐng)域的成功應(yīng)用,許多研究者利用2D CNN進(jìn)行故障診斷[4,5]。也有文獻(xiàn)發(fā)現(xiàn),與單獨(dú)使用CNN相比,利用組合方法,先對(duì)故障信號(hào)進(jìn)行處理,再進(jìn)行故障分類,能提高分類精度[6-8]。但是,振動(dòng)信號(hào)是時(shí)域下的一維信號(hào),上述方法可能會(huì)導(dǎo)致原始振動(dòng)信號(hào)部分特征信息的丟失。此外,信號(hào)變換過程往往需要依賴專家經(jīng)驗(yàn),這可能造成原始特征的丟失。因此,適用于圖像處理的2D CNN并不是最適合1D信號(hào)處理的網(wǎng)絡(luò)模型。
一維卷積神經(jīng)網(wǎng)絡(luò)(1D CNN)的卷積核是一維的,振動(dòng)信號(hào)無(wú)需復(fù)雜的信號(hào)處理就可直接輸入1D CNN。近年來(lái),研究者們開始嘗試?yán)?D CNN進(jìn)行故障診斷[9-12]。例如,Turker Ince等人[12]將電機(jī)電流信號(hào)輸入1D CNN,同時(shí)實(shí)現(xiàn)故障特征提取與故障分類。
然而,上述網(wǎng)絡(luò)也存在一些問題。1D CNN直接輸入高維信號(hào)時(shí),需要增加網(wǎng)絡(luò)層數(shù)來(lái)增強(qiáng)對(duì)輸入信號(hào)深層特征的提取能力,這明顯增加了網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)量[13]、計(jì)算復(fù)雜度和計(jì)算資源消耗量,還容易導(dǎo)致梯度消失或梯度爆炸等問題[14]。Kaiming He等人提出的深度殘差網(wǎng)絡(luò)[15](ResNet)解決了上述問題,并成功地應(yīng)用于圖像處理領(lǐng)域。傳統(tǒng)深度殘差網(wǎng)絡(luò)(ResNet)的卷積核是二維的,其殘差塊僅有一條殘差連接通道,可通過殘差學(xué)習(xí)訓(xùn)練網(wǎng)絡(luò)權(quán)重,從而有效地解決了深度CNN梯度爆炸和性能下降問題,提高了網(wǎng)絡(luò)訓(xùn)練效率,并成功地應(yīng)用于故障診斷領(lǐng)域[16-18]。Li等人[18]提出用一維的卷積核代替?zhèn)鹘y(tǒng)殘差網(wǎng)絡(luò)卷積核的一維殘差卷積神經(jīng)網(wǎng)絡(luò)(1D-RCNN)進(jìn)行軸承故障診斷,以便直接從原始信號(hào)中提取特征。
雖然,殘差網(wǎng)絡(luò)展現(xiàn)了訓(xùn)練深層網(wǎng)絡(luò)的優(yōu)越性,但也存在一些問題。例如,需要倍增網(wǎng)絡(luò)層來(lái)提高識(shí)別準(zhǔn)確率[19]、參數(shù)量大。因此,如何減少特征重用,提高訓(xùn)練效率是訓(xùn)練深層網(wǎng)絡(luò)需要解決的重要問題。針對(duì)上述問題,本文將一維卷積網(wǎng)絡(luò)與改進(jìn)的殘差網(wǎng)絡(luò)相結(jié)合,提出了一種基于改進(jìn)一維殘差網(wǎng)絡(luò)的軸承故障診斷方法。該方法對(duì)傳統(tǒng)殘差網(wǎng)絡(luò)的殘差塊連接方式進(jìn)行了改進(jìn),通過添加一條殘差連接通道的方式來(lái)增加殘差網(wǎng)絡(luò)寬度,減少網(wǎng)絡(luò)層數(shù),提高網(wǎng)絡(luò)診斷準(zhǔn)確率。該方法無(wú)需額外的信號(hào)處理和專家經(jīng)驗(yàn),便能有效提取軸承故障特征。
一維卷積網(wǎng)絡(luò)的卷積層能夠從原始信號(hào)中提取特征,避免了信號(hào)處理算法帶來(lái)的誤差。但是,分類較長(zhǎng)的原始信號(hào)往往需要更多的卷積層。為了提高故障特征提取效率,簡(jiǎn)化網(wǎng)絡(luò)權(quán)值的訓(xùn)練過程,本文將一維卷積網(wǎng)絡(luò)與改進(jìn)的殘差網(wǎng)絡(luò)結(jié)合,提出了一種基于改進(jìn)一維殘差網(wǎng)絡(luò)的軸承故障診斷方法。
本文所用CNN的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 本文所用CNN的網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Network structure of this paper
輸入層:將不同工況下的一維振動(dòng)信號(hào)作為輸入信號(hào),并采用滑動(dòng)分割法,獲得更多的實(shí)驗(yàn)樣本。滑動(dòng)分割法的基本原理如圖2所示。該方法可保持信號(hào)的連續(xù)性,使模型具有更強(qiáng)的魯棒性,并有效減少過擬合現(xiàn)象。其分段計(jì)算公式如下所示:
圖2 滑動(dòng)分割法Fig.2 Sliding segmentation method
其中,n為振動(dòng)信號(hào)的采樣點(diǎn)數(shù);L0為重疊的數(shù)據(jù)點(diǎn);L為每個(gè)樣本所包含的數(shù)據(jù)點(diǎn)數(shù);N為每類樣本數(shù)量。
本文中L0為256,L為1024,N為150。本文共采用6種軸承狀態(tài),每種軸承狀態(tài)150個(gè)樣本,共900個(gè)樣本。
卷積層:卷積層通過卷積核與其覆蓋區(qū)域的數(shù)據(jù)進(jìn)行點(diǎn)積運(yùn)算來(lái)提取高維特征。一維卷積運(yùn)算輸出特征圖的大小如下所示:
其中,H0是輸出特征圖大小;Hi是輸入特征圖大小;K是卷積核大小;P是補(bǔ)零層大??;S是卷積步長(zhǎng)。本文所用網(wǎng)絡(luò)的第一層卷積核大小為1×30,核數(shù)為24,步長(zhǎng)為2。
全局平均池化層:由于全連接層參數(shù)量較大,在深度學(xué)習(xí)中常采用全局平均池化層代替全連接層,本文所用全局平均池化層大小為1×23,步長(zhǎng)為1。
在訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)時(shí),由于其初始權(quán)值一般接近零,淺層參數(shù)可能無(wú)法更新,容易產(chǎn)生梯度消失問題。隨著訓(xùn)練的加深,冗余的網(wǎng)絡(luò)層學(xué)習(xí)了不是恒等映射的參數(shù),就會(huì)產(chǎn)生退化現(xiàn)象。深度殘差網(wǎng)絡(luò)[15](ResNet)的提出可使網(wǎng)絡(luò)的信息跨層流動(dòng),能減少因多層非線性變換造成的原始特征流失,充分發(fā)揮深層CNN強(qiáng)大的學(xué)習(xí)能力。殘差網(wǎng)絡(luò)將由多個(gè)非線性層擬合的復(fù)函數(shù)L(x)轉(zhuǎn)化為殘差函數(shù)(R(x)=L(x)-x),其中,x是這些層的輸入。殘差連接輸出為:
其中,yl是殘差連接的輸出;xi是輸入;F(xi,Wi)表示神經(jīng)網(wǎng)絡(luò)的非線性變換層;h(xi)表示旁路的傳遞函數(shù)。
傳統(tǒng)殘差網(wǎng)絡(luò)(ResNet)的殘差塊如圖3所示,輸出Y由卷積層的輸出與殘差通道的輸出相加求得。卷積層之后加入批量歸一化(BN)規(guī)范化前一層輸出,ReLu函數(shù)添加在卷積層之后。如果兩層卷積層的輸出與殘差通道的輸出維度相同,則只需要簡(jiǎn)單地線性相加,如圖3(a)所示。若維度大小不相同,需要設(shè)置殘差連接上1×1卷積核的步長(zhǎng),如圖3(b)所示,來(lái)更改低層網(wǎng)絡(luò)輸出的維度大小。
圖3 傳統(tǒng)殘差網(wǎng)絡(luò)的殘差塊Fig.3 Residual blocks of traditional residual network
傳統(tǒng)殘差網(wǎng)絡(luò)(ResNet)的殘差塊只有一個(gè)殘差連接通道將低層網(wǎng)絡(luò)的特征輸入到高層網(wǎng)絡(luò)。當(dāng)誤差反向傳播時(shí),殘差塊并沒有足夠的權(quán)重來(lái)學(xué)習(xí)特征,大部分殘差塊只能共享少量信息,這就造成了故障特征重用的減少[19]。
本文設(shè)計(jì)了一種加寬的一維殘差塊,其結(jié)構(gòu)如圖4所示,圖4(a)適用于輸入輸出數(shù)據(jù)維度相同的情況,圖4(b)適用于輸入輸出維度不同的情況。
和傳統(tǒng)的殘差塊相比,該加寬一維殘差塊的卷積核都是一維的,并增加了一條殘差連接通道。1×3卷積核的參數(shù)量?jī)H為傳統(tǒng)3×3卷積核的1/3。一個(gè)加寬一維殘差塊的參數(shù)量也僅為一個(gè)傳統(tǒng)殘差塊的2/3。因此,該殘差塊能夠有效減少網(wǎng)絡(luò)參數(shù)量,提高網(wǎng)絡(luò)訓(xùn)練效率。此外,加寬的網(wǎng)絡(luò)結(jié)構(gòu)能使每一層網(wǎng)絡(luò)獲得更加豐富的故障特征[20]。因此,無(wú)需增加殘差塊的數(shù)量便可提高故障分類的正確率。本文所提網(wǎng)絡(luò)的4個(gè)寬殘差塊采用圖4(b)所示的結(jié)構(gòu),殘差塊中每一個(gè)通道的卷積步長(zhǎng)分別為2、1,1×1卷積核的步長(zhǎng)為2。核數(shù)分別為24、12、6、n。其中,n是待分類的軸承狀態(tài)數(shù)。本文是對(duì)6種軸承狀態(tài)進(jìn)行分類,因此殘差單元核數(shù)為6。
圖4 加寬的一維殘差塊Fig.4 Widened 1D residual blocks
實(shí)驗(yàn)采用凱斯西儲(chǔ)(CWRU)軸承數(shù)據(jù)中心[21]驅(qū)動(dòng)端故障和風(fēng)機(jī)端故障的數(shù)據(jù)。兩種數(shù)據(jù)的軸承型號(hào)分別為SKF6205和SKF6203。安裝在驅(qū)動(dòng)端的加速度傳感器負(fù)責(zé)采集振動(dòng)數(shù)據(jù),采樣頻率為12kHz。電機(jī)轉(zhuǎn)速為1797r/min,載荷是0HP。
CNN在故障診斷方面的應(yīng)用往往基于海量數(shù)據(jù)的訓(xùn)練學(xué)習(xí),實(shí)際應(yīng)用中可供網(wǎng)絡(luò)訓(xùn)練的樣本數(shù)往往較少。為了研究所提網(wǎng)絡(luò)在不同訓(xùn)練樣本與測(cè)試樣本數(shù)量比下所能達(dá)到的分類正確率,將900個(gè)樣本打亂并從中隨機(jī)劃分訓(xùn)練樣本與測(cè)試樣本。其比率設(shè)置為7:3,5:5,3:7,1:9。
本實(shí)驗(yàn)對(duì)正常與故障尺寸為0.007英寸的驅(qū)動(dòng)端故障和正常與故障尺寸為0.021英寸的驅(qū)動(dòng)端故障進(jìn)行診斷。每次實(shí)驗(yàn)選取6種軸承狀態(tài),具體見表1。
表1 軸承實(shí)驗(yàn)數(shù)據(jù)集Table 1 Experimental data set of bearing
每種軸承狀態(tài)取150個(gè)樣本,共900個(gè)樣本。由于外圈故障是靜止故障,因而故障相對(duì)于軸承負(fù)載區(qū)的位置直接影響軸承系統(tǒng)的振動(dòng)響應(yīng)。為了測(cè)試網(wǎng)絡(luò)是否能明確區(qū)分外圈不同位置的故障,本實(shí)驗(yàn)選用了外圈6點(diǎn)、外圈3點(diǎn)和外圈12點(diǎn),3種外圈故障。為了增強(qiáng)數(shù)據(jù)表現(xiàn),提高網(wǎng)絡(luò)訓(xùn)練效率,使用min-max標(biāo)準(zhǔn)化方法預(yù)處理正常與故障尺寸為0.007英寸的數(shù)據(jù),將其映射到[-1,1]區(qū)間。采用Z-score標(biāo)準(zhǔn)化方法預(yù)處理正常與故障尺寸為0.021英寸的數(shù)據(jù),使之均值為0,標(biāo)準(zhǔn)差為1。
實(shí)驗(yàn)結(jié)果見表2。可見,本文所提網(wǎng)絡(luò)在4種訓(xùn)練與測(cè)試樣本比率下的正確率均在99%以上,當(dāng)訓(xùn)練樣本數(shù)僅為總樣本數(shù)的10%時(shí)(樣本總數(shù)900,訓(xùn)練樣本數(shù)90),兩個(gè)數(shù)據(jù)集的錯(cuò)分樣本數(shù)也不超過3個(gè)。上述結(jié)果表明,在分類正常和驅(qū)動(dòng)端故障數(shù)據(jù)時(shí),本文所提網(wǎng)絡(luò)在樣本數(shù)量較少時(shí)仍有不俗的表現(xiàn)。
表2 不同比率下兩個(gè)軸承數(shù)據(jù)集的測(cè)試結(jié)果Table 2 Test results of two bearing datasets at different ratios
兩次實(shí)驗(yàn)中,訓(xùn)練樣本與測(cè)試樣本為1:9的混疊矩陣如圖5所示。
由于從打亂的900個(gè)樣本中隨機(jī)劃分訓(xùn)練樣本與測(cè)試樣本,因而各種軸承狀態(tài)的測(cè)試樣本數(shù)量并不全是總測(cè)試樣本數(shù)的1/6。例如,圖5(a)中并不是每種軸承狀態(tài)的測(cè)試樣本個(gè)數(shù)都是135,其中NOR是137,DE-IR是135、DE-B是 141、DE-OR6是 127、DE-OR3是 138、DEOR12是 131。
圖5 比率為1:9時(shí)兩個(gè)數(shù)據(jù)集的混疊矩陣Fig.5 Confusion matrix of two datasets with ratios of 1:9
為了測(cè)試網(wǎng)絡(luò)對(duì)風(fēng)機(jī)端故障的分類效果,利用1797r/min轉(zhuǎn)速下的正常狀態(tài)(NOR)和故障尺寸為0.007英寸的風(fēng)機(jī)端的內(nèi)圈故障(FE-IR)、滾珠故障(FE-B)、外圈6點(diǎn)故障(FE-OR6)、外圈3點(diǎn)故障(FE-OR3)、外圈12點(diǎn)故障(FE-OR12)數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行測(cè)試,每種軸承狀態(tài)取150個(gè)樣本。使用min-max標(biāo)準(zhǔn)化方法預(yù)處理數(shù)據(jù),將其映射到[-1,1]區(qū)間。實(shí)驗(yàn)結(jié)果見表3。
1:9比率下的混疊矩陣如圖6所示。
圖6 比率為1:9時(shí)正常和風(fēng)機(jī)端故障的混疊矩陣Fig.6 Confusion matrix for normal and fan end failure at ratios of 1:9
由表3可知,當(dāng)樣本比率為1:9時(shí)故障診斷正確率為90.49%;但當(dāng)訓(xùn)練樣本數(shù)達(dá)到總樣本數(shù)的30%以上時(shí),分類正確率能達(dá)到97.3%以上。
表3 不同比率下正常和風(fēng)機(jī)端故障的測(cè)試結(jié)果Table 3 Test results of normal and fan end failure under different ratios
本節(jié)采用5倍交叉驗(yàn)證技術(shù)對(duì)網(wǎng)絡(luò)泛化能力進(jìn)行進(jìn)一步評(píng)估,測(cè)試數(shù)據(jù)為上述2.1節(jié)、2.2節(jié)所用的測(cè)試數(shù)據(jù)。5倍交叉驗(yàn)證是將所有樣本數(shù)據(jù)平均分為5份,每次取其中的4份用來(lái)訓(xùn)練網(wǎng)絡(luò)剩下的1份進(jìn)行測(cè)試。通過對(duì)5次不同數(shù)據(jù)分類結(jié)果取平均值的方法,避免了因隨機(jī)劃分訓(xùn)練樣本與測(cè)試樣本對(duì)網(wǎng)絡(luò)分類正確率的影響,能夠更好地評(píng)估網(wǎng)絡(luò)在該組數(shù)據(jù)下的泛化能力。
經(jīng)實(shí)驗(yàn)驗(yàn)證,網(wǎng)絡(luò)在這3類測(cè)試數(shù)據(jù)下的5倍交叉驗(yàn)證的平均結(jié)果均能達(dá)到100%,說(shuō)明所提網(wǎng)絡(luò)在這3種測(cè)試數(shù)據(jù)下,能夠正確區(qū)分各類軸承狀態(tài),有顯著的泛化能力。
為了進(jìn)一步驗(yàn)證網(wǎng)絡(luò)的優(yōu)越性,將傳統(tǒng)的一維卷積網(wǎng)絡(luò)(1D CNN)、一維深度殘差網(wǎng)絡(luò)(1D ResNet)與本文提出的網(wǎng)絡(luò)進(jìn)行對(duì)比。測(cè)試數(shù)據(jù)為0.007英寸故障的驅(qū)動(dòng)端和風(fēng)機(jī)端數(shù)據(jù),即2.1節(jié)中的數(shù)據(jù)集1和2.2節(jié)所用數(shù)據(jù)。1D ResNet的卷積核是一維的,每個(gè)殘差塊只有1個(gè)殘差連接通道,參數(shù)與本文提出的網(wǎng)絡(luò)參數(shù)相同。為了避免隨機(jī)劃分測(cè)試集和訓(xùn)練集的不均衡問題和初始化對(duì)實(shí)驗(yàn)結(jié)果的影響,比率為1:9時(shí),取10次運(yùn)行結(jié)果的平均值作為最終結(jié)果。實(shí)驗(yàn)結(jié)果見表4、表5。
表4 3種網(wǎng)絡(luò)正常和驅(qū)動(dòng)端故障的正確率Table 4 Correct rate of normal and drive end failure of three kinds of networks
表5 3種網(wǎng)絡(luò)正常和風(fēng)機(jī)端故障的正確率Table 5 Correct rate of normal and fan end failure of three kinds of networks
可見,雖然當(dāng)樣本比率為1:9時(shí),3種網(wǎng)絡(luò)的正確率均較低,但是本文所提網(wǎng)絡(luò)的故障分類正確率高于1D CNN和1D ResNet的正確率。
本文將一維卷積網(wǎng)絡(luò)與改進(jìn)的殘差網(wǎng)絡(luò)結(jié)合,提出了一種基于改進(jìn)一維殘差網(wǎng)絡(luò)的軸承故障診斷方法,并利用6種軸承狀態(tài)對(duì)所提方法進(jìn)行了實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)結(jié)論如下:
1)該方法能從原始振動(dòng)信號(hào)中直接提取有效故障特征,避免了依靠人工經(jīng)驗(yàn)提取故障特征的影響。
2)加寬的殘差網(wǎng)絡(luò)改善了殘差網(wǎng)絡(luò)特征重用減少的問題,能夠從較長(zhǎng)的原始信號(hào)中學(xué)習(xí)更豐富的特征,提高了診斷精度,簡(jiǎn)化故障診斷過程。
3)利用6種軸承狀態(tài)對(duì)所提方法進(jìn)行了分類效果測(cè)試。當(dāng)訓(xùn)練樣本為90,測(cè)試樣本為810(訓(xùn)練與測(cè)試樣本比為1:9)時(shí),驅(qū)動(dòng)端故障診斷的正確率為99.6%;當(dāng)訓(xùn)練樣本為270,測(cè)試樣本為630(訓(xùn)練與測(cè)試樣本比為3:7)時(shí),風(fēng)機(jī)端故障的正確率為97.3%。本文所提網(wǎng)絡(luò)的故障診斷正確率高于1D CNN和1D ResNet。此外,5倍交叉驗(yàn)證實(shí)驗(yàn)的結(jié)果,證明了所提網(wǎng)絡(luò)具有較強(qiáng)的泛化能力。