梁敏健, 彭曉軍, 劉德陽
(廣東省特種設(shè)備檢測研究院珠海檢測院,廣東 珠海 519002)
近年來,自動扶梯數(shù)量逐年攀升,老舊扶梯的安全形勢嚴(yán)峻,定期檢驗(yàn)和監(jiān)督檢驗(yàn)往往不容易發(fā)現(xiàn)扶梯內(nèi)部的潛在風(fēng)險和故障,如梯級滾輪磨損、曳引鏈磨損、減速箱齒輪箱磨損、驅(qū)動鏈條過松、減速箱油量不足等。這些故障勢必會影響扶梯乘坐人員的安全,提高扶梯的維護(hù)成本,降低扶梯的使用年限。目前上述故障往往借助定期檢驗(yàn)和維護(hù)保養(yǎng)階段扶梯的拆解才得以被發(fā)現(xiàn),且目的性差、效率低下、成本高昂、自動化程度低。
電梯含有大量的振動信號,目前常常采用振動加速度傳感器來監(jiān)測扶梯部件以反映其運(yùn)行狀態(tài),進(jìn)而人工提取故障特征,用于安全隱患的識別。例如,徐金海等[1]利用小波包和經(jīng)驗(yàn)?zāi)B(tài)分解的方法提取故障特征,實(shí)現(xiàn)了對扶梯機(jī)械部件在不拆機(jī)條件下的狀態(tài)監(jiān)測和潛在故障源識別。簡龍藝[2]利用時頻域分析法提取振動信號的頻譜圖,找到電梯異常振動的根本原因。
隨著機(jī)器學(xué)習(xí)算法的發(fā)展,研究人員開始應(yīng)用機(jī)器學(xué)習(xí)的方法進(jìn)行電梯的故障診斷研究。例如,孟慶宇[3]利用集合經(jīng)驗(yàn)?zāi)B(tài)分解提取自動扶梯主驅(qū)動軸軸承的振動信號,并構(gòu)建支持向量機(jī)模型對故障信號進(jìn)行診斷。易士琳[4]利用時頻域分析法提取反映電梯故障的特征向量,并利用PSO-LSSVM識別故障類型??梢姶蠖鄶?shù)傳統(tǒng)的智能診斷是采用“信號處理的特征提取+機(jī)器學(xué)習(xí)”的方法。雖然識別率有一定的提高,本質(zhì)上仍然依賴人工設(shè)計(jì)與選擇特征,難以獲得最接近故障屬性特征的自然表達(dá),導(dǎo)致訓(xùn)練時間長且誤差率較高,沒有實(shí)現(xiàn)真正意義上的智能診斷。
隨著Hilton提出深度學(xué)習(xí)理論,人工智能技術(shù)得到了進(jìn)一步地發(fā)展,最著名的就是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN),它通過引入局部連接、權(quán)值共享、最大池化、非線性激活等方法,允許神經(jīng)網(wǎng)絡(luò)從圖像中自動學(xué)習(xí)特征,避免對圖像進(jìn)行復(fù)雜的邊緣檢測、閾值分割等前期預(yù)處理,比傳統(tǒng)機(jī)器學(xué)習(xí)方法具有更強(qiáng)大的特征學(xué)習(xí)和表達(dá)能力,因而在圖像分類、目標(biāo)檢測等方面得到了越來越廣泛的應(yīng)用。近年來,越來越多的學(xué)者將該種深度學(xué)習(xí)方法引入到故障診斷領(lǐng)域[5-6],例如,羅鵬等[7]利用AFDCNN算法,無需提取時頻域特征即可實(shí)現(xiàn)對齒輪故障的診斷。胡蔦慶等[8]采用經(jīng)驗(yàn)?zāi)B(tài)分解和深度CNN實(shí)現(xiàn)了對行星齒輪故障的診斷。邵思羽[9]利深度學(xué)習(xí)理論同樣實(shí)現(xiàn)了對旋轉(zhuǎn)機(jī)械的故障診斷的識別。這類方法在旋轉(zhuǎn)機(jī)械中獲得了較好的效果,但是CNN的提出主要針對的是二維圖像數(shù)據(jù),而旋轉(zhuǎn)機(jī)械的故障數(shù)據(jù)多是一維時域信號,并不能完全應(yīng)用于深度CNN。因此,本研究擬基于一維深度卷積神經(jīng)網(wǎng)絡(luò)(1DCNN)的自動扶梯機(jī)械故障分類模型,以期實(shí)現(xiàn)通過直接輸入原始振動信號,便能快速獲得自動扶梯機(jī)械故障的分類結(jié)果。
由于平時收集故障扶梯的數(shù)據(jù)比較困難,采用公開的故障數(shù)據(jù)集和現(xiàn)場收集的數(shù)據(jù)相融合的方式進(jìn)行故障數(shù)據(jù)集的準(zhǔn)備。公開的數(shù)據(jù)集采用凱斯西儲大學(xué)軸承數(shù)據(jù)集和東南大學(xué)嚴(yán)如強(qiáng)團(tuán)隊(duì)整理的齒輪故障數(shù)據(jù)集,之所以融合3種故障診斷的數(shù)據(jù)集是因?yàn)?,凱斯西儲大學(xué)軸承數(shù)據(jù)集所使用的軸承故障相對損傷比較大,故障特征比較顯著,容易實(shí)現(xiàn)診斷,而且其只包含軸承故障,不含齒輪故障,故而為了增加對扶梯齒輪和扶梯梯級滾輪的診斷能力,進(jìn)一步提高所提出模型的泛化能力,融合了包含軸承、齒輪和扶梯滾輪3種類型的數(shù)據(jù)。上述數(shù)據(jù)集提供了豐富的故障類型,涉及齒輪、軸承兩種元件的故障,總共包含齒輪的磨損、斷齒、裂紋故障,軸承的內(nèi)圈、外圈、滾動體等類型的故障。凱斯西儲大學(xué)軸承故障數(shù)據(jù)集平臺如圖1所示[9],故障數(shù)據(jù)取自軸承內(nèi)圈、外圈、滾動體3個位置。每類故障在1730 r/min、1750 r/min、1772 r/min、1797 r/min 4種負(fù)載工況下進(jìn)行數(shù)據(jù)采集。東南大學(xué)齒輪故障數(shù)據(jù)集的實(shí)驗(yàn)平臺包括齒輪箱、驅(qū)動電機(jī)、電機(jī)控制器和制動器控制器,如圖2所示[10]。實(shí)驗(yàn)設(shè)置有五類齒輪故障,每類故障在轉(zhuǎn)速1200 r/min且空載、1800 r/min低載兩種工況下進(jìn)行振動信號的采集。仿照該試驗(yàn)數(shù)據(jù)的采集方式利用開發(fā)出的基于LabVIEW的自動扶梯機(jī)械振動數(shù)據(jù)采集系統(tǒng)采集某市區(qū)大型商場的自動扶梯的故障信號,采集現(xiàn)場如圖3所示[11]。
圖1 CWRU滾動軸承數(shù)據(jù)采集系統(tǒng)
圖2 東南大學(xué)齒輪箱數(shù)據(jù)采集系統(tǒng)
圖3 labVIEW自動扶梯機(jī)械振動數(shù)據(jù)采集系統(tǒng)
選取凱斯西儲大學(xué)的正常信號、軸承滾子故障、軸承內(nèi)圈故障、軸承外圈故障和東南大學(xué)齒輪裂紋故障以及采集的某自動扶梯滾輪磨損故障,各類型的振動信號如圖4所示。
樣本的數(shù)量和質(zhì)量直接影響深度神經(jīng)網(wǎng)絡(luò)的檢測精度,為獲得具有更好泛化能力的模型,提高分類的準(zhǔn)確率,CNN需要大量的訓(xùn)練樣本,而目前扶梯故障并沒有諸如ImageNet等龐大的公共圖像數(shù)據(jù)庫,僅有一些著名的公開旋轉(zhuǎn)機(jī)械數(shù)據(jù)集,而且未包含扶梯一些特有的故障:如梯級滾輪的磨損、梯級鏈輪的松動。因此為提高模型的泛化能力對試驗(yàn)數(shù)據(jù)集進(jìn)行數(shù)據(jù)集增強(qiáng),以擴(kuò)充數(shù)據(jù)樣本。
本研究采用現(xiàn)場試驗(yàn)所收集與東南大學(xué)和凱斯西儲大學(xué)的機(jī)械故障數(shù)據(jù)集的振動數(shù)據(jù)作為用于模型訓(xùn)練和測試的原始數(shù)據(jù)集,包括正常與齒輪故障、軸承內(nèi)/外圈/滾動體故障、梯級滾輪磨損故障。圖像增強(qiáng)的方法為幾何變換(包括旋轉(zhuǎn)、翻轉(zhuǎn)和平移等)、像素調(diào)整(亮度調(diào)節(jié)、對比度調(diào)節(jié)和添加噪聲等),通過增加數(shù)據(jù)樣本來提高模型的魯棒性與泛化能力,仿照圖像增強(qiáng)的方式采取重疊采樣的方法對扶梯振動信號進(jìn)行如圖5所示的數(shù)據(jù)增強(qiáng)[12],即用相等長度的窗口對振動信號劃分,得到樣本信號,當(dāng)窗口移動步長小于單個樣本的信號長度時,樣本之間就會有重疊,長度為Lsignal的振動信號被劃分為Nsample=(Lsignal-Nin)/s個樣本,樣本長度為Nin,切片窗口的移動距離為s。最后按照通用數(shù)據(jù)集劃分策略,將數(shù)據(jù)集隨機(jī)分配成訓(xùn)練集(70%)、測試集(10%)和驗(yàn)證集(20%)。
圖4 各故障類型的振動信號
圖5 數(shù)據(jù)增強(qiáng)方式示意圖
最終融合每類數(shù)據(jù)8000個共48000個數(shù)據(jù)樣本,其中訓(xùn)練樣本個數(shù)為每類5600個共33600個樣本,驗(yàn)證樣本為每類1600個共9600個樣本,測試樣本為每類800個共4800個樣本。 各類樣本個數(shù)和標(biāo)簽如表1所示。
表1 6種不同故障的樣本個數(shù)組成
根據(jù)自動扶梯振動信號的特點(diǎn)以及現(xiàn)場檢驗(yàn)所需的快速高精度要求,本研究采用1DCNN的網(wǎng)絡(luò)用于特征提取,構(gòu)建自動扶梯機(jī)械故障診斷系統(tǒng)。該網(wǎng)絡(luò)在東南大學(xué)和凱斯西儲大學(xué)數(shù)據(jù)集和現(xiàn)場采集的扶梯振動信號融合的數(shù)據(jù)集上獲得了95%的精度。
CNN是深度學(xué)習(xí)領(lǐng)域應(yīng)用最多的網(wǎng)絡(luò)類型,其典型的結(jié)構(gòu)如圖6所示。
圖6 典型CNN的結(jié)構(gòu)圖
典型的CNN模型包括:輸入層、卷積和池化層、全連接層和輸出層等。輸入層一般是某一尺寸的二維數(shù)據(jù),通常是三通道的彩色圖像或單通道的灰度圖像;卷積層和池化層是CNN的核心層,卷積層通過一系列的卷積核對輸入層的圖像進(jìn)行卷積從而獲得相應(yīng)數(shù)量的特征圖,即特征提取。池化層對卷積層得到的特征圖進(jìn)行最大值池化或平均值池化等操作,從而大幅減少卷積層的空間維度,降低計(jì)算成本,控制過擬合;經(jīng)過若干次的卷積和池化層,緊接著將池化操作后的數(shù)據(jù)展開并輸入到全連接層,全連接層連接一個隱藏層,最后由softmax函數(shù)將數(shù)據(jù)映射到輸出層。
softmax函數(shù)的定義如下。
softmax(zi)=yi
(1)
因?yàn)檎駝有盘柺且痪S數(shù)據(jù),圖像數(shù)據(jù)是二維數(shù)據(jù),常見的二維卷積如圖7所示。常用的VGGNET、ResNet和谷歌的Inception,都是3×3或5×5的較小的卷積核。
圖7 二維卷積示意圖
而CNN是針對二維圖像數(shù)據(jù)提出來的,所以要將CNN的模型適當(dāng)改造為一維CNN。如圖8所示將二維卷積核改為一維[13],即卷積核的行數(shù)和信號的行數(shù)要保持一致,均為一維,且卷積核的移動方向只沿著序列前進(jìn)的方向。具體卷積層的運(yùn)算方式如式(2)所示。
(2)
圖8 一維卷積示例圖
另外改進(jìn)了卷積核的寬度,常規(guī)二維卷積核一般均為3×3或5×5的小卷積核,卷積核寬度為20,以獲取較大的感受野,達(dá)到提取短時特征的效果,其目的和STFT(短時傅里葉變換)相似。區(qū)別在于,STFT的窗函數(shù)是sin函數(shù),設(shè)計(jì)的寬卷積核是通過優(yōu)化算法獲取的,能自適應(yīng)學(xué)習(xí)故障信號的特征。
改造后的1DCNN的結(jié)構(gòu)如圖9所示。
圖9 改造后的1DCNN模型結(jié)構(gòu)
該網(wǎng)絡(luò)包括輸入層、特征提取層(卷積和池化)、全連接層、輸出層等部分,輸入層是經(jīng)過重疊采樣增強(qiáng)處理過的振動信號,每個樣本1024個點(diǎn),重疊滑移步長設(shè)為14。特征提取單元中的卷積層的卷積核的大小為20×1,增大了模型輸入的感受野,增大了輸入的信息量。卷積后進(jìn)行批歸一化處理,具體參數(shù)如表2所示。
表2 1DCNN的網(wǎng)絡(luò)參數(shù)
1DCNN扶梯機(jī)械故障診斷模型使用Python編程語言及Keras深度學(xué)習(xí)框架實(shí)現(xiàn),模型訓(xùn)練的硬件環(huán)境為Intel i5 CPU,16GB RAM,NVIDIA GTX1050 GPU。
設(shè)置模型訓(xùn)練的超參數(shù)學(xué)習(xí)率為0.0001,批尺寸為128,最大迭代數(shù)為40。訓(xùn)練的損失值及準(zhǔn)確率曲線如圖10、圖11所示。
圖10 訓(xùn)練損失值曲線
圖11 驗(yàn)證集準(zhǔn)確率曲線
從圖10、圖11中可以看出,訓(xùn)練的損失值在迭代10次之后就已收斂并且毛刺波動較小,經(jīng)過5輪訓(xùn)練后準(zhǔn)確率也達(dá)到了95%,這也進(jìn)一步證明了該模型能有效提高訓(xùn)練效率。
為準(zhǔn)確分析評級模型的性能,除使用準(zhǔn)確率A(Accuracy)作為評價指標(biāo)外,針對每一類采用精確率P(Precision)、召回率R(Recall)以及F1值對評價結(jié)果進(jìn)行全面評估,具體計(jì)算標(biāo)準(zhǔn)如式(3)~式(5)所示,其中F1值是精確率和召回率的調(diào)和均值。上述指標(biāo)的取值范圍均在0%~100%之間,并且越大越好。
(3)
(4)
(5)
式中:TPi為樣本實(shí)際屬于第i類且模型將其分到第i類;FPi為樣本實(shí)際不屬于第i類但模型錯將其分到第i類;FNi為樣本實(shí)際屬于第i類但模型未正確將其分到第i類。
將測試集樣本輸入分類模型,根據(jù)分類結(jié)果得到混淆矩陣如圖12所示,進(jìn)而計(jì)算出模型處理振動信號的性能指標(biāo)如表3所示。
圖12 自動扶梯機(jī)械故障診斷分類結(jié)果的混淆矩陣
表3 自動扶梯機(jī)械故障診斷模型的精度性能指標(biāo)
通過表3可以發(fā)現(xiàn),各類扶梯機(jī)械故障的預(yù)測精確率在85%以上,召回率在75%之上,整體準(zhǔn)確率達(dá)到了95%,滿足扶梯故障診斷現(xiàn)場檢測的精度要求。
表4總結(jié)了基于相同數(shù)據(jù)集、本研究方案與傳統(tǒng)機(jī)器學(xué)習(xí)算法SVM、決策樹、K近鄰等算法的試驗(yàn)對比結(jié)果。其中對于傳統(tǒng)機(jī)器學(xué)習(xí)算法,人工提取了平均值、均方根、峰值因子、脈沖因子、裕度因子、峭度因子、波形因子、偏度等14種時域波形特征。其中SVM使用了RBF作為核函數(shù),決策樹的最大深度為3,K近鄰的節(jié)點(diǎn)數(shù)為3。
表4 提出的方法與SVM/決策樹/K近鄰性能比較結(jié)果
可以看出,提出的基于1DCNN的診斷方法明顯優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)算法。
針對自動扶梯機(jī)械故障診斷問題,基于一維卷積卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了應(yīng)用于扶梯振動信號的自動分類模型。借助凱斯西儲大學(xué)的軸承數(shù)據(jù)集和東南大學(xué)齒輪箱數(shù)據(jù)集以及現(xiàn)場采集的扶梯振動數(shù)據(jù),建立了自動扶梯機(jī)械故障數(shù)據(jù)集。通過數(shù)據(jù)增強(qiáng)的方法對數(shù)據(jù)集進(jìn)行預(yù)處理。采用測試數(shù)據(jù)集對模型的精度與復(fù)雜度進(jìn)行評價,實(shí)驗(yàn)結(jié)果顯示,在僅需2.4 MB內(nèi)存的情況下,該模型能夠?qū)崿F(xiàn)自動扶梯機(jī)械故障分類的準(zhǔn)確率達(dá)到95%以上,能夠準(zhǔn)確對自動扶梯機(jī)械故障進(jìn)行準(zhǔn)確分類。設(shè)計(jì)的算法比人工提取特征+傳統(tǒng)機(jī)器學(xué)習(xí)方式有著更高的準(zhǔn)確率,省去了人工提取特征的過程,降低了扶梯機(jī)械故障診斷的專業(yè)性,節(jié)約了時間和設(shè)計(jì)成本。在下一步的工作中,將繼續(xù)收集扶梯其他部位的故障數(shù)據(jù)集,提高模型識別準(zhǔn)確率,同時將探究如何研制基于移動終端的扶梯機(jī)械故障智能診斷系統(tǒng),提升模型的實(shí)用價值。