許子非, 金江濤, 李 春,2
(1.上海理工大學 能源與動力工程學院,上海 200093;2.上海市動力工程多項流動與傳熱重點實驗室,上海 200093)
工業(yè)發(fā)展迅速致使旋轉機械的作業(yè)環(huán)境日趨復雜。軸承作為旋轉機械重要零部件之一,長期工作于變頻變載的復雜環(huán)境中導致其故障率居高不下[1-3]。軸承故障不僅增加維修成本,且會中斷機械設備連續(xù)、穩(wěn)定及高效的運作。因此,開發(fā)有效的滾動軸承狀態(tài)監(jiān)測與故障診斷方法十分重要[4-5]。
完整的故障診斷過程由信號采集、特征提取及狀態(tài)分類組成。提取特征的準確性對狀態(tài)分類的精度影響顯著,故特征提取為故障診斷成功的必要條件。當軸承的滾動體、內(nèi)圈及外圈等部位發(fā)生故障時,疵點產(chǎn)生的振動較為復雜,易被環(huán)境、結構噪聲淹沒。為此,采用各種信號處理方法進行預處理,提取更純凈的故障特征。Zhang等[6]采用變分模態(tài)分解對滾動軸承振動信號進行分解,并結合快速傅里葉變換和包絡分析進行故障識別,結果顯示此方法可以提升故障診斷精度。為了實現(xiàn)智能故障診斷,Chen等[7]基于變分模態(tài)分解對軸承振動信號進行解耦,采用各狀態(tài)的能量熵作為特征值輸入支持向量機進行故障分類。Li等[8]以軸承原始振動信號為研究對象,將變分模態(tài)分解與神經(jīng)網(wǎng)絡方法相結合,實現(xiàn)動4種工況的智能故障診斷。結果表明:以振動信號作為學習樣本的方法比基于特征值所構建的診斷模型具有更好的魯棒性。
以上研究均基于各種信號處理方法并結合淺層機器學習技術實現(xiàn)故障診斷。然而,機器學習算法的性能上限取決于被提取特征或表示的準確性[9]。特征提取及分類過程的獨立設計不僅影響模型最終性能,且特征提取過程需要大量專業(yè)知識以及各種信號處理手段,既耗時也依賴人為經(jīng)驗。致使基于淺層學習構建的智能診斷模型具有一定的局限性。而采用深度學習技術可解決上述問題。非線性處理單元使深度學習方法具有對數(shù)據(jù)高級表示的建模能力,并且其網(wǎng)絡可直接與數(shù)據(jù)相對接[10]。封閉的特征提取與狀態(tài)分類過程使模型具有更強的學習能力。因此,深度學習已被應用于計算機視覺、語言處理和故障診斷等工程領域。
其中卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)由于其權值共享和稀疏連接特點,適合故障診斷的工程應用[11]。
Chen等[12]采用256個統(tǒng)計量構建CNN的輸入矩陣,以建立智能故障診斷模型。結果表明此模型的泛化能力比傳統(tǒng)機器學習法更佳。Wang等[13]和Chen等[14]以振動信號的小波頻譜為CNN的輸入源,分別實現(xiàn)轉子和軸承系統(tǒng)的工作狀態(tài)識別,研究表明:基于二維頻譜圖所構建的CNN診斷模型比采用特征值時性能更出色。但2D CNN也存在一定缺陷,圖像以像素作為CNN的輸入源導致模型缺乏特征自學習能力[15],當環(huán)境發(fā)生變化時,模型泛化能力較差。而振動信號具有易采集、蘊含信息豐富且處理技術成熟等優(yōu)點,已成為故障診斷及狀態(tài)監(jiān)測中最普遍的目標信號[16]。為此,Ince等[17]基于1D CNN實現(xiàn)基于原始振動信號的損傷定位,結果顯示比以圖像作為輸入的CNN模型具有更好的性能。Zhang等[18]也基于1D CNN實現(xiàn)以原始振動信號作為輸入源的故障診斷,其研究表明,該模型在復雜環(huán)境中亦具有較高精度。然而,僅憑深層網(wǎng)絡是無法捕獲因各種機械旋轉及往復頻率所造成的振動信號多尺度性質(zhì)[19]。豐富、準確地特征提取可提升模型的泛化能力及魯棒性。為此,Huang等[20]提出多尺度級聯(lián)CNN,嘗試通過互異尺寸的卷積核捕獲多尺度軸承故障特征頻率。研究發(fā)現(xiàn):卷積核尺寸與頻域分辨率存在一定關聯(lián)。而Liu等[21]研究發(fā)現(xiàn)軸承振動信號呈現(xiàn)時間多尺度特征,雖然Huang等欲通過控制卷積核尺寸獲取不同故障特征頻率,但忽略了振動信號的固有時間尺度,導致模型在多變的復雜背景下診斷性能下降。
為解決特征提取與狀態(tài)分類獨立而導致診斷模型性能受限、基于振動圖像為CNN輸入源所搭建模型缺乏特征自學習能力及工程中所采集的振動信號復雜,僅采用1D CNN因為無法捕捉振動的時間多尺度特征,導致模型泛化性能低的問題,本文考慮振動信號的時間多尺度特性以及故障頻率特征多尺度的特點,提出基于多尺度卷積神經(jīng)網(wǎng)絡模型開發(fā)的故障診斷方法,該方法無需額外信號處理技術,直接作用于振動信號,具有良好的泛化性能及魯棒性。為旋轉機械故障診斷實際工程應用提供一定的技術手段。
卷積神經(jīng)網(wǎng)絡用于處理具有類似網(wǎng)格結構的數(shù)據(jù)神經(jīng)網(wǎng)絡,例如包含具時間采樣規(guī)律的一維網(wǎng)格或具二維像素網(wǎng)格的圖像。CNN對輸入樣本數(shù)據(jù)進行逐層卷積與池化,提取數(shù)據(jù)結構中拓撲結構特征,具有旋轉、平移不變形的特點,并廣泛應用于工程及數(shù)學領域。
CNN因具備稀疏連接、參數(shù)共享及等變表示的能力,可降低模型訓練參數(shù)個數(shù)、避免算法過擬合及減少數(shù)據(jù)維度等優(yōu)點。傳統(tǒng)CNN具備輸入層、卷積層、池化層、全連接層和輸出層。
卷積神經(jīng)網(wǎng)絡前期通過交替進行的卷積與池化,對輸入特征張量進行提取,而靠近輸出層部分則采用傳統(tǒng)多層神經(jīng)網(wǎng)絡。其過程如下所示:
步驟1采用卷積核與輸入目標進行卷積運算,基于偏置,通過激活函數(shù)獲取特征張量[22]。卷積過程數(shù)學表達式為
式中:i為第i個卷積核;g(i)為第i個經(jīng)卷積所習得的特征張量;u為輸入數(shù)組;v為卷積核偏置;x,y,z為輸入目標維度,若為二維像素,則去x,y即可。
步驟2完成卷積運算后,采用激活函數(shù)實現(xiàn)非線性變換,而ReLU[23]為CNN中應用最廣泛的激活函數(shù)之一
池化層為對上層數(shù)據(jù)縮放與映射,池化過程包括最大值及均值池化
式中:ul(i,t)為第l層中第i個特征張量的第t個神經(jīng)元;ω為卷積核寬度;j為第j個池化層。
全連接層包含對應多層感知機的隱含層,該層中所有神經(jīng)元與前一層中神經(jīng)元全連接,進而整合處理卷積、池化處理后的數(shù)據(jù)信息,其激活函數(shù)一般為Sigmoid。
輸出層采用Softmax分類器對全連接層給予的結果進行分類輸出,實現(xiàn)狀態(tài)分類。
Dropout正則化技術被用于防止模型過擬合,以一定比例隨機關閉神經(jīng)單元使神經(jīng)元之間敏感性降低,其標準過程由式(6)給出。
式中:f為激活函數(shù);x為輸入量;W為權值矩陣;y為輸出。
旋轉機械各部件振動耦合會導致振動信號表現(xiàn)多尺度特性,且包含多時間尺度的復雜模式。獲取更全面特征可提升智能診斷模型性能,提高故障識別準確度。為此,本文提出時間多尺度特征提?。╩ultiple time scales characteristics,MTSC)概念,從單一振動時域信號中提取具有不同時間尺度的子信號。
由若干池化操作及Dropout(DR)技術聯(lián)合開發(fā)的MTSC框架,如圖1所示。
如圖1所示,輸入層中一維振動信號數(shù)據(jù)長度為2 048,通過N個尺寸為[2n,1]的池化操作以獲取多尺度子信號。 其中n∈(1,2,3,…,N)。N取決于輸入層序列的長度,也決定子信號的數(shù)量。為增強MTSC層提取信息的抗干擾性,子信號在每輪迭代中僅有75%的數(shù)據(jù)實行卷積操作。
圖1 MTSC層Fig.1 The MTSClayer
軸承受振動耦合影響,時域信號具有時間多尺度特性;當其損傷時,故障特征也呈現(xiàn)多尺度性質(zhì)。此外,被采信號中有效成分常因噪聲而淹沒,為從各時間尺度的子信號中濾過噪聲成分,提取有效故障特征成為主要目標。為此,本文提出采用不同尺寸的卷積核,從子信號中提取多尺度故障特征頻率,搭配多對卷積池化層,通過并行學習搭建多尺度卷積神經(jīng)網(wǎng)絡(multiple time scales characteristics extracted convolutional neural network,MTSC-CNN)。其結構如圖2所示。
圖2 MTSC-CNN結構Fig.2 The structure of MTSC-CNN
如圖2所示,假設輸入層樣本含2 048個數(shù)據(jù)點,MTSC可至多提取長度為2 048,1 024,512與128的子序列。為保證模型在第二卷積層內(nèi)具有相同尺寸的數(shù)據(jù)并捕捉多尺度故障特征:針對長序列,采用大卷積尺度擴大模型的感受野,反之使用小尺寸卷積核進行取樣?;诙鄬矸e、池化層完成并行學習,后將各尺度所學特征匯總至全連接層,通過Softmax函數(shù)實現(xiàn)多目標分類。MTSC-CNN亦引入Dropout與Batch Normalization技術以避免過擬合導致的泛化能力不足。
基于MTSC-CNN結構,建立智能故障診斷系統(tǒng),如圖3所示。此系統(tǒng)無需任何其他信號處理技術,調(diào)整MTSC層參數(shù)以匹配不同尺寸的模型輸入信號,保證模型具有最佳的診斷精度。
如圖3所示,軸承振動信號經(jīng)數(shù)據(jù)采集系統(tǒng),通過樣本構造技術分為訓練樣本與測試樣本。將訓練樣本輸入至MTSC-CNN模型中進行訓練,并與軸承各工作狀態(tài)相匹配。測試、訓練樣本間的數(shù)據(jù)相互獨立,將測試樣本導入含參MTSC-CNN模型中,輸出診斷結果。
圖3 MTSC-CNN故障診斷系統(tǒng)Fig.3 The fault diagnosis of MTSC-CNN
實際工程中,模型需在復雜背景下識別不同故障類型、故障位置及損傷程度的軸承工作狀態(tài)。為此,采用CWRU(Case Western Reserve University)公開軸承振動數(shù)據(jù)[24]以及XJTU(Xi’an Jiaotong University)西安交通大學[25]軸承混合故障實驗,構造多種場景以驗證提出算法的優(yōu)越性、可靠性及準確性,實驗臺及實驗布置由圖4所示。
圖4 XJTU實驗詳情Fig.4 Photographs of the XJTU bearings and lab
XJTU與CWRU實驗參數(shù)詳情由表1和表2給出。
表1 CWRU軸承:6205 SKFTab.1 Bearing parameters of 6205 SKF mm
表2 XJTU軸承Tab.2 Parameters of the XJTU tested bearings
為增強樣本數(shù)量,在保證訓練、測試集數(shù)據(jù)獨立性的情況下,對各數(shù)據(jù)集中的數(shù)據(jù)進行重采樣以增多樣本個數(shù),重采樣技術如圖5所示。
圖5 數(shù)據(jù)重采樣Fig.5 Data augment with overlap
CWRU與XJTU數(shù)據(jù)的訓練、測試集詳情見表3與表4。其中“外圈@3”代表外圈損傷位置為3點方向。
表3 CWRU滾動軸承樣本劃分Tab.3 Details of rolling bearing datasets of CWRU
表4 XJTU樣本劃分Tab.4 Details of XJTU rolling bearing datasets
由表3可知,采用11種軸承狀態(tài)進行故障診斷,包括不同故障類型與損傷程度,由于所提出方法屬有監(jiān)督學習,將正常、內(nèi)圈、滾珠以及外圈故障與類別標簽對應;由表4可知,采用4種故障類型(包含混合故障)并與4個標簽對應,標簽0~3分別表示內(nèi)圈、保持架、外圈以及含內(nèi)圈、外圈和保持架的混合故障情況。
基于實驗數(shù)據(jù)采樣頻率,選取樣本數(shù)據(jù)長度為2 048,以驗證模型。MTSC-CNN模型中,可對時間尺度進行調(diào)節(jié),獲得長短不一的子信號。將不同等級的噪聲加入測試樣本中,研究不同尺度的MTSC-CNN的有效性,擬獲取最佳時間尺度。加入噪聲前后的振動信號如圖6所示。
圖6 加入噪聲的振動信號對比Fig.6 The comparison between original signal and noisy signal
采用信噪比為-4~12 dB的測試信號驗證4種不同尺度的MTSC-CNN模型,結果如圖7所示。其中,“尺度=1”表示MTSC層中時間尺度N=1;“尺度=2”表示MTSC層中時間尺度N=2。
圖7 不同尺度的模型診斷準確率Fig.7 The diagnosis accuracy of the MTSC-CNN with different scales
由圖7(a)可知,在處理CWRU數(shù)據(jù),含故障類型、損傷程度不同的11種狀態(tài)時,4種不同尺度的MTSC-CNN模型在低信噪比下(-4 dB)準確度分別為60%,68%,71%與68%;隨測試數(shù)據(jù)的信噪比增大準確度升高;當信噪比為0時,“尺度=3”的MTSC-CNN表現(xiàn)出超過90%的準確度;在高信噪比下,4種模型均表現(xiàn)良好。由圖7(b)可知,在處理XJTU數(shù)據(jù),含混合故障數(shù)據(jù)的4種狀態(tài)數(shù)據(jù)時,4種不同尺度的MTSC-CNN模型在低信噪比下(-4 dB)準確度均高于90%,這是由于4分類任務較11分類時復雜度低。同時考慮計算復雜度與準確度,“尺度=2”的MTSC-CNN在處理XJTU數(shù)據(jù)時效果更佳。
由圖7可知,由于尺度過大導致信息過提取,為此,在后續(xù)研究中,本文選取“尺度=3”與“尺度=2”的MTSC-CNN模型分別處理基于CWRU數(shù)據(jù)所建立的11分類任務與XJTU數(shù)據(jù)建立的4分類任務,給出“尺度=3”模型具體參數(shù)如表5所示。
表5 “尺度=3”MTSC-CNN參數(shù)Tab.5 The details of MTSC-CNN with 3 scales
實際工程中,所測數(shù)據(jù)常含有不同程度的噪聲,為驗證算法在噪聲環(huán)境中的優(yōu)勢,分別與CNN,TICNN,MC-CNN,SVM[26]和WT-CNN[27]進行對比,基于CWRU數(shù)據(jù)集所進行的噪聲驗證結果由圖8所示,基于XJTU數(shù)據(jù)集所進行的噪聲驗證如表6所示。
由圖8與表6可知,當RSN=-4 dB時,由于WT-CNN輸入源為頻譜圖,導致模型不具備特征自學習能力,因此在噪聲較大時準確度較低。SVM雖屬淺層學習,但由于模型中被采用特征值(能量熵)具有一定的魯棒性,使SVM在噪聲環(huán)境具有五成的準確度。MC-CNN,CNN,TICNN及MTSC-CNN都具備特征自學習能力,但MTSC-CNN因具備深層網(wǎng)絡及同時考慮振動信號時間多尺度特性及故障多尺度振動特征,在RSN=-4 dB時,仍然具備較好的穩(wěn)定性與準確性。
圖8 不同方法準確率對比Fig.8 The accuracy comparison of different methods
表6 不同方法準確率及波動對比Tab.6 Comparison of accuracy and fluctuation of different methods
為應對時變的負載工況,模型需具備處理在不同載荷情況下診斷能力。模型變載荷場景設置由表7給出,6種試驗的平均診斷準確率如圖9所示。
表7 變載荷試驗安排Tab.7 The details of our setting of load environments W
由圖9可知,由于MSTC-CNN模型不僅考慮振動信號的多尺度特性,且在MSTC中對子信號數(shù)據(jù)進行隨機舍棄,從而增強了模型的魯棒性,故在6種不同載荷試驗下,平均準確度最高,達86%。WT-CNN雖在噪聲實驗下表現(xiàn)不佳,但對于變載荷工況具有良好的適應性,是因為相比較負載變化而言,頻譜圖對噪聲更加敏感。SVM作為淺層學習的一種,在變載情況下具有75%的準確度,表明特征值的選取直接影響模型性能。
圖9 變載荷情況下準確率對比Fig.9 Accuracy comparison under variable loads
為進一步驗證模型的可靠性及優(yōu)越性?;贑WRU實驗數(shù)據(jù)構造噪聲與負載均不同的場景。在此場景中,訓練集從0,1 W,2 W及3 W數(shù)據(jù)中隨機選取;在保證數(shù)據(jù)獨立性的情況下,測試集從0,1 W,2 W及3 W數(shù)據(jù)中隨機選取,并加入不同RSN的噪聲,測試結果如圖10所示。
圖10 負載與噪聲混合場景測試結果Fig.10 The results of the scenario with load and noise
如圖10所示,在該場景下所有模型的診斷準確率均低于單純噪聲場景測試的準確度,這是由于負載數(shù)據(jù)集的混合所構建的場景具有更大的數(shù)據(jù)差異性所引起,也更貼合實際工程。所提出MTSC-CNN模型在強噪聲環(huán)境中(RSN=-4 dB),其準確率達65%,比現(xiàn)有模型高出約10%。MTSC-CNN模型在強噪聲背景與負載混合的場景中具有良好表現(xiàn),說明該模型具有較優(yōu)的泛化性能。
為驗證所提出模型的可靠性及優(yōu)越性?;赬JTU實驗數(shù)據(jù)構造損傷演化場景。在此場景中,測試集與訓練集分別為具有不同損傷程度的數(shù)據(jù),保證了測試、訓練集之間數(shù)據(jù)的獨立性。場景設置由表8給出,其中階段1、階段2和階段3分別為XJTU數(shù)據(jù)集中按時間順序所截取的數(shù)據(jù)。損傷演化測試結果如圖11所示。
表8 損傷演化場景設置Tab.8 The details of our setting of load environments
圖11 軸承損傷演化場景測試結果Fig.11 The results tested in the scenario of the degradation processes of bearings
由圖11所示,所提出的MTSC-CNN模型在軸承損傷演化場景測試中表現(xiàn)良好,其平均診斷準確率高達87.84%,比MC-CNN高3.26%。由于該場景中,數(shù)據(jù)的訓練集與測試集處于軸承損傷演化的不同階段,因此,在該場景下MTSC-CNN的診斷表現(xiàn)說明其具有良好的外推性能。
為深入了解MSTC-CNN學習內(nèi)在機理,采用t-SNE技術對各尺度下全連接層進行可視化,結果如圖12所示。
如圖12(d)所示,在“全連接層4”中,不同故障類型及損傷程度的11種狀態(tài)已被分為點簇。雖在“全連接層1”、“全連接層2”和“全連接層3”有部分類別未被識別。但是三個尺度層之間存在互相彌補關系,如:“全連接層2”和“全連接層3”未識別0.177 8 mm的內(nèi)圈故障數(shù)據(jù),但在“全連接層1”中被清晰的區(qū)分。“全連接層3”未識別0.533 4 mm與0.177 8 mm的滾珠故障,但在“全連接層2”中實現(xiàn)故障分類。且未發(fā)生相同損傷程度的不同故障或位置識別失敗情況。綜上表明,MSTC-CNN模型因提取不同時間尺度的信息具有互補性,從而使模型具備良好的魯棒性與泛化性能。
圖12 多尺度特征可視化Fig.12 Multi-scale feature visualization
因所提出MSTC-CNN模型作用于1D振動信號,故可將MSTC層中所學習的時域特征提取并進行傅里葉變換,以分析MSTC-CNN模型所學習的時間、振動多尺度頻譜特征。不同卷積核獲取的振動頻譜如圖13所示。其中時間多尺度表示所提出MTSC中的均值池化層所提取的特征;振動多尺度表示所提出MTSC中不同卷積核所提取的振動特征。
圖13 MTSC故障特征頻譜Fig.13 The fault characteristics in MTSClayer in frequency domain
如圖13所示,MTSC所捕獲的時間多尺度與振動多尺度特征頻譜有所不同。在圖13(a)中,“尺度3”在捕捉外圈故障特征頻率時(107 Hz)效果較好,但其余尺度未凸顯出響應故障的特征頻率。在圖13(b)中,內(nèi)圈故障、滾珠故障以及外圈故障均在不同尺度凸顯出其特征頻率,分別為162 Hz,142 Hz以及107 Hz。其中滾珠故障與內(nèi)圈故障能較好的體現(xiàn)所提出MTSC的可靠性與優(yōu)越性:在單一時間尺度中被掩蓋的故障特征頻率均在不同“尺度”的MTSC層中凸顯。
針對實際工程可變載荷環(huán)境與所采數(shù)據(jù)的大噪聲背景,由于振動信號具有時間多尺度特性,基于多尺度神經(jīng)網(wǎng)絡開發(fā)故障診斷智能模型,以1D振動信號為模型輸入源,實現(xiàn)故障模式、損傷程度的混合識別,結論如下:
(1)MTSC-CNN在處理固定長度的振動信號時,單一時間尺度因信息缺失會導致模型性能欠佳;過多的時間尺度也會因信息過提取而增加計算量并弱化模型診斷能力。
(2)相比于現(xiàn)有算法,MTSC-CNN在大噪聲背景下仍超過70%的準確度,在測試集信噪比從-4 dB變化至12 dB時,均具備最佳的準確度與穩(wěn)定性。
(3)相比于現(xiàn)有算法,MTSC-CNN在變載荷試驗中有接近86%的準確度,體現(xiàn)模型在變載環(huán)境中的魯棒性。
(4)所提出模型在處理故障類型、損失程度不同以及存在混合故障時均具有良好表現(xiàn)??勺兊臅r間尺度大大提升模型魯棒性與自由度。
(5)通過可視化模型神經(jīng)層,表明不同尺度下所學特征之間在一定程度上呈現(xiàn)互補作用,使模型具備較好的泛化能力。