劉 鑫 ,任海莉
(太原科技大學(xué)電子信息工程學(xué)院,太原 030024)
滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械中最重要的部件,也是一種易損件[1,2]。因此,為了減少部件損壞或設(shè)備意外停機(jī)帶來(lái)的經(jīng)濟(jì)損失,軸承工作狀態(tài)的識(shí)別變得越來(lái)越重要。傳統(tǒng)的專(zhuān)家診斷方法不適用于目前的多傳感監(jiān)測(cè)、大數(shù)據(jù)量、高集成度的智能診斷條件。智能診斷能夠有效分析海量數(shù)據(jù)中的關(guān)聯(lián)特征,自動(dòng)提供客觀、可靠的診斷結(jié)果[3-4]。
傳統(tǒng)的故障診斷方法為淺層網(wǎng)絡(luò)結(jié)構(gòu),若模型輸入特征表示不足,對(duì)診斷結(jié)果產(chǎn)生較大影響,人工提取特征造成計(jì)算復(fù)雜度增加以及特征間冗余信息過(guò)多的問(wèn)題。深度學(xué)習(xí)是人工智能的一個(gè)巨大突破,它擺脫了對(duì)人工特征提取的依賴,可以自動(dòng)從原始數(shù)據(jù)中學(xué)習(xí)基本特征。自動(dòng)編碼器[5]是一種無(wú)監(jiān)督的深度學(xué)習(xí)算法,它可以從輸入數(shù)據(jù)中自動(dòng)提取數(shù)據(jù)的特征,擺脫了對(duì)大量標(biāo)簽的依賴,降低了特征提取的復(fù)雜性,提高了分類(lèi)的準(zhǔn)確性。郭亮等[6]采用稀疏自動(dòng)編碼器對(duì)輸入數(shù)據(jù)進(jìn)行特征學(xué)習(xí),并采用SOFTMAX分類(lèi)器實(shí)現(xiàn)故障分類(lèi),驗(yàn)證了該方法對(duì)故障的識(shí)別能力。敦泊森等[7]采用稀疏自動(dòng)編碼器與SVM結(jié)合的滾動(dòng)軸承故障診斷方法,實(shí)現(xiàn)了智能、準(zhǔn)確分類(lèi)。稀疏自動(dòng)編碼器只是簡(jiǎn)單地對(duì)輸入數(shù)據(jù)進(jìn)行重構(gòu),學(xué)習(xí)的特征不具有很好的泛化性能。Vincent P等[8]提出一種堆疊降噪自動(dòng)編碼器,該算法在輸入數(shù)據(jù)中加入損傷噪聲,通過(guò)從損壞的數(shù)據(jù)中重構(gòu)出原始數(shù)據(jù),學(xué)習(xí)到更加具有魯棒性的特征。趙春華等[9]采用堆疊降噪自動(dòng)編碼器的深度學(xué)習(xí)方法提取故障特征,并通過(guò)WOA-SVM進(jìn)行故障識(shí)別,最后獲得較好的故障識(shí)別。Shao Haidong等[10]提出一種基于極限學(xué)習(xí)機(jī)的深度小波自動(dòng)編碼器的滾動(dòng)軸承智能故障診斷方法,使用極限學(xué)習(xí)機(jī)進(jìn)行故障診斷,與支持向量機(jī)以及SOFTMAX分類(lèi)器相比,極限學(xué)習(xí)機(jī)分類(lèi)效果更優(yōu)。
由于極限學(xué)習(xí)機(jī)(Extreme Learning Machine ,ELM)[11]是基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的原則,因此只考慮了經(jīng)驗(yàn)風(fēng)險(xiǎn)而未考慮結(jié)構(gòu)風(fēng)險(xiǎn),容易出現(xiàn)過(guò)擬合,并且當(dāng)ELM的隱含層數(shù)目過(guò)多時(shí),也容易出現(xiàn)過(guò)擬合現(xiàn)象,從而會(huì)導(dǎo)致ELM的泛化性能降低。正則化通常讓權(quán)值盡可能的小,構(gòu)造一個(gè)所有參數(shù)值比較小的模型,一般參數(shù)值小的模型結(jié)構(gòu)簡(jiǎn)單,能適應(yīng)不同的數(shù)據(jù)集,在一定程度上避免了過(guò)擬合的問(wèn)題。
針對(duì)上述問(wèn)題,本文提出一種基于正則化極限學(xué)習(xí)機(jī)在降噪自動(dòng)編碼器中實(shí)現(xiàn)滾動(dòng)軸承故障診斷的方法。首先將振動(dòng)信號(hào)進(jìn)行快速傅里葉變換得出頻域系數(shù)作為高維特征數(shù)據(jù)集,然后將該特征集輸入到三層降噪自動(dòng)編碼器中進(jìn)行降維以及特征提取,最后將提取的特征輸入到正則化極限學(xué)習(xí)中進(jìn)行故障診斷。針對(duì)RELM中仍然存在正則化參數(shù)的選擇困難的問(wèn)題,本文采用QPSO優(yōu)化算法對(duì)RELM參數(shù)進(jìn)行尋優(yōu),實(shí)驗(yàn)結(jié)果表明,提出的故障診斷方法具有良好的魯棒性和泛化性,能夠獲得更準(zhǔn)確的診斷結(jié)果。
DAE[12]是一種接收損壞的數(shù)據(jù)點(diǎn)作為輸入,并經(jīng)過(guò)訓(xùn)練來(lái)預(yù)測(cè)原始的未損壞的數(shù)據(jù)點(diǎn)。傳統(tǒng)的自動(dòng)編碼器的判斷標(biāo)準(zhǔn)是簡(jiǎn)單地將輸入復(fù)制到輸出,但是,這幾乎不能提取有用的特征。DAE是一種正則化的自編碼器,它通過(guò)減少測(cè)試誤差、增加訓(xùn)練誤差來(lái)使模型學(xué)習(xí)有意義的特征。
DAE的訓(xùn)練過(guò)程如下:
(1)原始輸入通過(guò)添加一些概率為v(噪聲)和qD分布的隨機(jī)噪聲構(gòu)成含噪聲的輸入信號(hào):
(1)
(2)
式中,fθ為編碼網(wǎng)絡(luò)的激活函數(shù),gθ′為解碼網(wǎng)絡(luò)的激活函數(shù),θ和θ′分別為編碼與解碼的權(quán)值矩陣W和偏置向量b的參數(shù)集。
(3)通過(guò)梯度下降算法優(yōu)化下面的損失函數(shù):
(3)
降噪自動(dòng)編碼器的結(jié)構(gòu)示意圖如圖1所示。
圖1 降噪自動(dòng)編碼器結(jié)構(gòu)圖
將多個(gè)DAE模型疊加成具有N個(gè)隱含層的堆疊降噪自動(dòng)編碼器(SDAE)[13],對(duì)于給定的振動(dòng)信號(hào)輸入向量X,輸入節(jié)點(diǎn)數(shù)為維數(shù)M,將第二層隱含層作為第二個(gè)DAE,重構(gòu)前一層數(shù)據(jù)。同樣,SDAE中的下一層隱含層由前一層初始化,因此這個(gè)過(guò)程是按照順序進(jìn)行的,直到第n個(gè)DAE被訓(xùn)練完畢。
ELM與傳統(tǒng)的分類(lèi)算法相比具有很大的優(yōu)勢(shì),但是ELM也存在不足。ELM是通過(guò)廣義Moore-Penrose逆矩陣來(lái)求解輸出的權(quán)值矩陣,當(dāng)隱含層的節(jié)點(diǎn)數(shù)目過(guò)多時(shí)容易出現(xiàn)過(guò)擬合的現(xiàn)象,就會(huì)降低ELM的泛化性能。并且該網(wǎng)絡(luò)模型是通過(guò)最小二乘損失函數(shù)構(gòu)建的,因此只考慮了經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化,未加入結(jié)構(gòu)風(fēng)險(xiǎn),容易出現(xiàn)過(guò)擬合。為了克服以上的缺點(diǎn),構(gòu)建RELM[14-15],增強(qiáng)ELM的泛化性能。
RELM的目標(biāo)函數(shù)為:
(4)
(5)
式中,βj代表第j個(gè)隱含層與輸出節(jié)點(diǎn)的連接權(quán)重,αi為非負(fù)的拉格朗日乘子,分別對(duì)公式(5)中的各個(gè)向量求偏導(dǎo)并合并得:
(6)
式中,I為單位矩陣,H為隱含層的輸出矩陣,輸出的權(quán)重矩陣β可以計(jì)算為:
(7)
(8)
由公式(7)可知,正則化極限學(xué)習(xí)機(jī)只需要確定一個(gè)正則化參數(shù)C,而且由于輸入?yún)?shù)的隨機(jī)泛化,能夠使ELM的波動(dòng)性能大大降低,因此RELM的泛化性能優(yōu)于ELM。為了選擇最優(yōu)的正則化參數(shù),本文采用量子粒子群優(yōu)化算法進(jìn)行參數(shù)優(yōu)化。
QPSO[16]是一種新的粒子群算法,它是受量子力學(xué)的啟發(fā)而產(chǎn)生的。本文將QPSO應(yīng)用于正則化極限學(xué)習(xí)中,對(duì)正則化參數(shù)進(jìn)行優(yōu)化。
(9)
(10)
(11)
式中,M為粒子數(shù)。
綜上所述,QPSO中只有一個(gè)創(chuàng)新參數(shù)α設(shè)置,一般α的值不大于1,因此解決了PSO設(shè)定參數(shù)過(guò)多的缺點(diǎn),并且QPSO算法還取消了粒子的移動(dòng)方向?qū)傩?,因此粒子的位置更新與之前的粒子無(wú)關(guān),這就增加了粒子位置更新的隨機(jī)性,解決了PSO算法因粒子位置變換缺少隨機(jī)性,容易陷入局部最優(yōu)的缺點(diǎn)。
本文采用正則化極限學(xué)習(xí)機(jī)在堆疊降噪自動(dòng)編碼器中的應(yīng)用實(shí)現(xiàn)故障分類(lèi)。與傳統(tǒng)的自動(dòng)編碼器相比,降噪自動(dòng)編碼器通過(guò)從損壞的數(shù)據(jù)中重構(gòu)出原始數(shù)據(jù),學(xué)習(xí)到更加具有魯棒性的特征,通過(guò)多個(gè)降噪自動(dòng)編碼器可以有效提取到信號(hào)中的高維特征,再采用RELM對(duì)提取出的特征進(jìn)行分類(lèi)識(shí)別,與極限學(xué)習(xí)機(jī)相比,正則化極限學(xué)習(xí)能夠避免出現(xiàn)過(guò)擬合問(wèn)題,并且提高極限學(xué)習(xí)機(jī)的泛化性能。為了選擇最優(yōu)的正則化參數(shù),采用QPSO進(jìn)行參數(shù)優(yōu)化,提高分類(lèi)精度。
QPSO-RELM尋優(yōu)過(guò)程為:首先,在搜索空間中隨機(jī)產(chǎn)生N個(gè)粒子組成隨機(jī)粒子群,將粒子位置賦值給參數(shù)C,然后計(jì)算RELM平均適應(yīng)度值,根據(jù)適應(yīng)度值確定粒子當(dāng)前和全局最優(yōu)位置,當(dāng)?shù)螖?shù)達(dá)到設(shè)定次數(shù)時(shí)停止更新,最后輸出最優(yōu)適應(yīng)度值和優(yōu)化的參數(shù)C。流程圖如圖2所示。
圖2 QPSO-RELM方法流程圖
基于QPSO-RELM在降噪自動(dòng)編碼器中狀態(tài)識(shí)別分類(lèi)模型如圖3所示。具體步驟表示為:
(1)獲取滾動(dòng)軸承的振動(dòng)信號(hào),然后將信號(hào)樣本劃分為訓(xùn)練集及測(cè)試集;
(2)將振動(dòng)信號(hào)進(jìn)行快速傅里葉變換,并獲得頻域系數(shù),使用頻域系數(shù)構(gòu)建高維數(shù)據(jù)樣本x;
(3)將所有樣本歸一化為[0,1],初始化SDAE中的不同參數(shù),包括數(shù)據(jù)大小,去噪概率v以及訓(xùn)練迭代次數(shù);
(4)將高維數(shù)據(jù)樣本x輸入到N個(gè)SDAE中進(jìn)行訓(xùn)練,獲得融合后的特征h;
(5)初始化RELM的模型參數(shù),包括隱含層數(shù)S,正則化參數(shù)C;初始化QPSO中的參數(shù),包括粒子數(shù)M,創(chuàng)新參數(shù)α;
(6)將融合后的特征輸入到RELM模型中進(jìn)行訓(xùn)練;
(7)使用量子粒子群優(yōu)化算法優(yōu)化RELM模型中的正則化參數(shù)C,獲得最優(yōu)的診斷模型,得出診斷結(jié)果。
圖3 QPSO-RELM在降噪自動(dòng)編碼器中狀態(tài)識(shí)別分類(lèi)模型
本文的實(shí)驗(yàn)數(shù)據(jù)采用的是美國(guó)西儲(chǔ)大學(xué)實(shí)驗(yàn)室的滾動(dòng)軸承實(shí)驗(yàn)室數(shù)據(jù)[18]進(jìn)行了滾動(dòng)軸承實(shí)驗(yàn)研究,該裝置主要由輸入電機(jī)、測(cè)試軸承以及加載電機(jī)組成的。軸承故障是使用電火花加工技術(shù)在SKF軸承上布置了單點(diǎn)故障,并且故障直徑分別為0.007 in、0.014 in和0.021 in。數(shù)據(jù)樣本采用的是轉(zhuǎn)速為1797 r/min,采樣頻率為12 kHz下收集的振動(dòng)數(shù)據(jù)。
數(shù)據(jù)包含了4種不同健康類(lèi)型,分別為正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動(dòng)體故障。除了正常狀態(tài),數(shù)據(jù)還包含了每種故障類(lèi)型分別在三種故障程度下的狀態(tài),因此總共有10種不同的狀態(tài)類(lèi)型。每種狀態(tài)包含1000 個(gè)樣本,每個(gè)樣本包含了2048 個(gè)數(shù)據(jù)點(diǎn),每種狀態(tài)隨機(jī)抽取800 個(gè)樣本進(jìn)行訓(xùn)練,其余200 個(gè)樣本進(jìn)行測(cè)試,表1展示了所用數(shù)據(jù)集的信息。
對(duì)采樣數(shù)據(jù)進(jìn)行預(yù)處理后,采用頻域處理方法,利用快速傅里葉變換算法將原始振動(dòng)信號(hào)轉(zhuǎn)換為頻域信號(hào)[11],由于頻譜分析圖是對(duì)稱的,每個(gè)樣本信號(hào)中1024個(gè)點(diǎn)足以表示頻域特征,因此輸入模型中的每個(gè)樣本為1024 個(gè)頻域系數(shù)。
表1 滾動(dòng)軸承狀態(tài)描述
將上述的頻域系數(shù)組成的向量與相應(yīng)的故障類(lèi)別輸入到網(wǎng)絡(luò)結(jié)構(gòu)中,采用三層降噪自動(dòng)編碼器與正則化極限學(xué)習(xí)機(jī)作為模型訓(xùn)練。經(jīng)過(guò)前期研究以及多次試驗(yàn)確定降噪自動(dòng)編碼器模型結(jié)構(gòu)為1024-128-64-32,噪聲系數(shù)為0.009,懲罰項(xiàng)系數(shù)為10-8,訓(xùn)練迭代次數(shù)為120。采用的量子粒子群優(yōu)化算法優(yōu)化RELM模型,并得到的RELM中正則化參數(shù)為4.668 6。為了驗(yàn)證提出方法的有效性,將該方法分別與降噪自動(dòng)編碼器和SOTEMAX分類(lèi)器[18]、ELM進(jìn)行對(duì)比,還與未加噪聲的稀疏自動(dòng)編碼器和SVM[7]進(jìn)行對(duì)比。經(jīng)過(guò)4次試驗(yàn),實(shí)驗(yàn)結(jié)果對(duì)比如圖4和表2所示。
圖4 4次診斷結(jié)果圖
表2 診斷平均準(zhǔn)確率
對(duì)比實(shí)驗(yàn)中,其他模型中的降噪自動(dòng)編碼器模型的參數(shù)與SDAE-RELM中的降噪自動(dòng)編碼器中的參數(shù)設(shè)置相同,其中,SDAE-SOFTMAX模型中的訓(xùn)練迭代次數(shù)設(shè)為100,SAE-SVM模型中的SAE參數(shù)與SDAE中自動(dòng)編碼器模型參數(shù)設(shè)置相同,SVM模型采用徑向基核函數(shù)進(jìn)行分類(lèi),SDAE-ELM模型中的ELM模型的網(wǎng)絡(luò)層數(shù)為80。
通過(guò)表2和圖4可以得出,SDAE-RELM的4次診斷結(jié)果的準(zhǔn)確率分別為:98.8%,98.35%,97.55%以及98.15%,平均準(zhǔn)確率為98.21%,標(biāo)準(zhǔn)差為0.44%,所提出方法平均準(zhǔn)確率高于SDAE-ELM模型的97.52%, SDAE-SOFTMAX深度診斷模型的診斷率只有85.64%,診斷結(jié)果遠(yuǎn)遠(yuǎn)低于所提出的方法。未加噪聲的稀疏自動(dòng)編碼器與SVM結(jié)合的模型與所提出的方法相比,SAE-SVM的平均準(zhǔn)確率為97.25%,所提出的方法診斷結(jié)果更優(yōu)。由計(jì)算的標(biāo)準(zhǔn)差可以看出SDAE-RELM四次診斷結(jié)果的波動(dòng)性比其他幾種方法要小,穩(wěn)定性更好。因此,降噪自動(dòng)編碼器與正則化極限學(xué)習(xí)機(jī)結(jié)合可以增加模型的魯棒性和泛化性,得到更好的診斷結(jié)果。
為了表示SDAE-RELM網(wǎng)絡(luò)對(duì)每類(lèi)故障的具體診斷情況,采用所提出的方法的第1次試驗(yàn)的混淆矩陣如圖5所示。由圖可知,在實(shí)際故障類(lèi)別0錯(cuò)分為類(lèi)別8的比例為0.02,實(shí)際故障類(lèi)別1錯(cuò)分到類(lèi)別0的比例為0.01,實(shí)際故障類(lèi)別2錯(cuò)分到類(lèi)別4的比例為0.04,實(shí)際故障類(lèi)別4錯(cuò)分到類(lèi)別8的比例為0.03,其他類(lèi)別的分類(lèi)準(zhǔn)確率幾乎為100%,整個(gè)測(cè)試集的平均分類(lèi)準(zhǔn)確率為98.8%,因此所提出的方法具有很好的分類(lèi)識(shí)別效果。
圖5 SDAE-RELM第一次試驗(yàn)混淆矩陣圖
為了說(shuō)明量子粒子群優(yōu)化算法的尋優(yōu)能力,本文將量子粒子群優(yōu)化算法與粒子群優(yōu)化算法進(jìn)行對(duì)比,選取初始粒子數(shù)都為10, 迭代次數(shù)為50。量子粒子群算法中創(chuàng)新參數(shù)為0.8,粒子群算法中學(xué)習(xí)因子c1和c2都為2,慣性因子為0.8。RELM的正則化參數(shù)優(yōu)化區(qū)間為0.001~50,經(jīng)過(guò)QPSO優(yōu)化后的RELM中正則化參數(shù)為4.668 6,PSO優(yōu)化后的RELM中正則化參數(shù)為11.020 05。分別對(duì)此參數(shù)進(jìn)行訓(xùn)練,經(jīng)過(guò)4次的診斷結(jié)果如圖6和表3所示。
圖6 優(yōu)化算法對(duì)比結(jié)果圖
表3 改進(jìn)前后粒子群算法診斷平均準(zhǔn)確率
由圖6和表3可知,量子粒子群優(yōu)化算法4次試驗(yàn)結(jié)果分別為98.8%、98.35%、97.55%和98.15%,平均準(zhǔn)確率為98.21%,而粒子群優(yōu)化算法4次的試驗(yàn)結(jié)果分別為97.05%、97.15%、96.7%和96.65%,平均準(zhǔn)確率為96.88%,量子粒子群算法得到的優(yōu)化參數(shù)的診斷準(zhǔn)確率要高于粒子群算法所得的參數(shù)。由計(jì)算的標(biāo)準(zhǔn)差可以看出,雖然粒子群優(yōu)化算法相對(duì)于量子粒子群優(yōu)化算法的波動(dòng)較小,但兩者整體穩(wěn)定性相差不大。因此采用量子粒子群優(yōu)化算法與粒子群算法相比設(shè)定參數(shù)少,優(yōu)化性能更好,可以獲得更準(zhǔn)確的診斷結(jié)果。
本文提出一種基于QPSO正則化極限學(xué)習(xí)機(jī)在降噪自動(dòng)編碼器中對(duì)滾動(dòng)軸承進(jìn)行故障診斷的方法。首先將提取的原始振動(dòng)信號(hào)頻域系數(shù)作為網(wǎng)絡(luò)輸入,通過(guò)SDAE網(wǎng)絡(luò)獲得深層次的特征表示,QPSO優(yōu)化后的RELM根據(jù)提取特征進(jìn)行故障分類(lèi)識(shí)別,主要結(jié)論如下:
(1)提出RELM對(duì)SDAE融合后的特征進(jìn)行故障分類(lèi),與SOFTMAX、SVM以及ELM相比,能夠獲得更好的分類(lèi)效果,并且解決了ELM容易出現(xiàn)過(guò)擬合的問(wèn)題。
(2)對(duì)于RELM中正則化參數(shù)選取困難的問(wèn)題,提出基于QPSO對(duì)RELM網(wǎng)絡(luò)參數(shù)選取方法,該方法相比于PSO,設(shè)定參數(shù)少,并且解決了PSO 容易陷入局部最優(yōu)的問(wèn)題。通過(guò)QPSO優(yōu)化RELM模型中的待定參數(shù),相比于PSO,能夠獲得更準(zhǔn)確的分類(lèi)結(jié)果。