余 震 何留杰 王 峰
(①黃河科技學院信息工程學院計算機系,河南 鄭州 450063;②河南理工大學軟件學院,河南 焦作 454000)
生產過程中需要使用多種類型的設備,這些設備的健康狀態(tài)對運行安全性具有直接影響,如果能夠提前準確診斷機械設備故障問題,將有助于確保生產系統(tǒng)的安全穩(wěn)定運行的要求,同時實現(xiàn)產品質量的大幅提升[1-2]?,F(xiàn)階段,針對機械設備實施故障診斷基本都是從信號分析以及智能診斷兩個層面考慮??紤]到實際工況下產生的振動信號具有明顯的非線性特征,受到外部噪聲信號的較大干擾,導致故障特征容易被淹沒于設備振動頻率信號中,此時如果采用傳統(tǒng)信號處理方法則難以獲得理想診斷效果[3-5]。
采用傳統(tǒng)模式的智能算法進行故障診斷時通常是對2層以內的模型結構進行函數(shù)擬合,都是一種“淺層學習”模式,并未對數(shù)據(jù)本身包含的故障參數(shù)進行全面挖掘[6-7]。深度學習[8-9]屬于近些年獲得廣泛應用的“深層”算法,對于圖像數(shù)據(jù)與語音信息的識別起到了關鍵作用,目前已形成了許多顯著的科研成果,同時對于故障診斷行業(yè)也開始獲得更加廣泛的應用[10-12]。深度信念網(wǎng)絡(DBN)是根據(jù)深度學習算法構建的網(wǎng)絡,利用低層特征組合的方式獲得抽象高層結構,從而快速分辨數(shù)據(jù)的分布特征,目前已在數(shù)據(jù)分析與深度挖掘方面成為一項重要算法[13-14]。但也需注意采用DBN網(wǎng)絡處理高維樣本時,訓練高維輸入層和多隱層網(wǎng)絡時需消耗大量運算時間,從而占用很大比例的算力。文獻[15]建立了一種五層網(wǎng)絡進行滾動軸承時域參數(shù)的診斷分析,上述方法雖然可以實現(xiàn)很高的識別精度,但進行訓練時需要占用大量時間。文獻[16]先采用雙樹復小波的算法實現(xiàn)特征提取,再通過DBN完成分類過程,由此實現(xiàn)模型的簡化效果,但該處理方式同樣需要獲得一定的專家經驗支持。
本文選擇SLE算法提取高維振動信號的流形參數(shù),顯著簡化了模型復雜度,從而消除人為因素對特征選取結果產生的干擾。以半監(jiān)督模式進行處理時,只設置少數(shù)有標簽樣本以及加入大量無標簽樣本的條件下對DBN網(wǎng)絡進行訓練,之后在DBN內輸入流形學習數(shù)據(jù)實現(xiàn)特征數(shù)據(jù)二次挖掘的過程,同時完成不同故障的分類。采用上述模型診斷軸承運行故障缺陷特征,表明此模型能夠滿足可靠性要求,并且具備更高的處理效率。
本文進行DBN訓練時同時引入無監(jiān)督模式與有監(jiān)督模式的學習方法,設置了大量無標簽樣本以及少數(shù)標簽樣本作為訓練對象,屬于一種半監(jiān)督學習模式。
網(wǎng)絡最高隱層輸出如下。
利用反向傳播(back propagation,BP) 算法優(yōu)化參數(shù)w,確保DBN網(wǎng)絡輸出符合實際分類效果。
BP算法由前向與反向兩種傳播形式組成,誤差以最后一層作為初始條件反向傳播,再通過梯度下降算法對DBN權值參數(shù)實施調節(jié)。
按照同樣的方式也可以調整參數(shù)集θ的剩余參數(shù),由此獲得DBN網(wǎng)絡模型,有效滿足特征挖掘與樣本分類的需求。
SLE算法能夠對初期高維流形內包含的低維流形參數(shù)進行準確挖掘。從本質層面分析是要采集一個平均數(shù)據(jù)點局部近鄰信息,對于高維空間中間距很小的點,投影到低維空間時也會形成很小的間距。采用SLE算法與DBN網(wǎng)絡對故障診斷算法結構見圖1。該算法處理流程為根據(jù)流形學習原理,使計算成本獲得有效控制。相對單一結構DBN網(wǎng)絡,本文設計的組合算法除了可以保持流形學習的靈活降維優(yōu)勢以外,還可以使DBN網(wǎng)絡可見層獲得自由度的明顯提升,能夠避免“維數(shù)災難”引起的干擾。算法診斷步驟如下:
圖1 基于SLE和DBN算法的故障診斷流程
(1)構建高維模式空間。通過傳感器檢測設備故障信號,并對信號實施標準歸一化獲得時域振動信號,從而得到更高維度的振動時間序列集合。
(2)以SLE算法對特征數(shù)據(jù)采集。并完成高維故障分析,獲得更小的維度。
在日益嚴峻的生存壓力之下,個體間的競爭也愈發(fā)激烈。 當升學、就業(yè)等一場場非此即彼的角逐來臨之時,昔日同窗將會成為強勁對手。 面對這樣的情景,大學生群體極易產生不當競爭心理和行為,不但會影響個體的健康發(fā)展,還會對大學生群體的人際關系產生威脅,繼而破壞集體凝聚力,集體和集體主義原則就這樣“被消解在競爭的酸浴中。”[10]38
(3)DBN網(wǎng)絡故障診斷。采用二值化方法計算流形數(shù)據(jù),再把結果輸入DBN網(wǎng)絡內實現(xiàn)數(shù)據(jù)的深度挖掘,利用Soft-max分類器診斷故障信號。
本實驗針對某設備動力系統(tǒng)的滾動軸承運行過程中產生的故障進行分析,測試平臺的組成結構包含1個功率達到1 490 W的三相電動機、1個加載電機以及1個扭矩信號檢測儀。為電機驅動端配備了6205-2RSJEMSKF型軸承,再將加速度傳感器粘貼至上部機殼處。進行測試時設定下述條件:負載為 0~3 HP,轉速為 1 800 r/min。記錄儀按照12 kHz頻率進行采樣。根據(jù)以上測試條件,設定不同負載參數(shù)測試算法模型故障診斷性能,設定了下述兩組試驗條件:第一組是保持故障尺寸不變的條件下,采用本文算法驗證故障種類;第二組是在同樣故障類型下對各類受損程度進行分類。要求每次試驗都符合MATLAB R2014a標準,處理器型號為INTEL CORE I7-8550U和16G RAM。
為SLE算法設置低維嵌入維數(shù)50,輸入層中共包含50個神經元,DBN網(wǎng)絡中存在50個隱含層節(jié)點。設定學習率為0.1,動量為0.9。迭代上限為200,每組試樣測試12次,取均值。
訓練本文的算法模型,圖2給出了經過不同次數(shù)迭代后得到的均方誤差EMS。通過前后對比可知,初期階段模型對誤差可以快速削減,進入后期尋優(yōu)階段時則產生了一定程度的停滯。逐漸提高迭代次數(shù)以及優(yōu)化模型參數(shù)后,獲得了更小的均方誤差。迭代140次后獲得了較低訓練誤差,并在迭代至150次時獲得了收斂的誤差,可以達到0.01以內。因此采用上述算法模型能夠獲得理想的訓練集擬合結果,經過合適次數(shù)迭代后,模型進入收斂狀態(tài),顯著提升訓練效率。
圖2 算法迭代變化
將本文算法與SLE+KNN(K nearest neighbors)、KPCA( kernelbased principle component analysis) +KNN、DBN模型實施對比,得到表1所示的準確度。其中,采用SLE-DBN模型可以實現(xiàn)比其他模型更優(yōu)的性能。只選擇DBN網(wǎng)絡進行計算時所需的時間為86 s,相對本文SLE-DBN模型計算時間達到了近58倍,因此采用SLE算法可以顯著縮短SLE-DBN組合模型運算時間。
表1 試驗方法對比
圖3是利用齒輪狀態(tài)監(jiān)控系統(tǒng)[12]進行故障數(shù)據(jù)集測試所得的結果。
圖3 齒輪箱試驗平臺
將減速箱的主從動齒輪各項參數(shù)列于表2中,對主動輪齒輪進行線切割處理獲得4種裂紋缺陷,分別為無裂紋、1/4、1/2與3/4裂紋,根據(jù)下式計算裂紋長度。
表2 齒輪箱參數(shù)
其中:i取值為0,1,2,3;R和r依次對應主動輪齒根圓半徑與中心孔半徑,尺寸分別是28 mm與46.5 mm。
利用算法測試工況如表3所示。選擇NIPXI-1042型數(shù)據(jù)采集卡。
表3 多工況下試驗參數(shù)設置
為了消除樣本選擇與模型訓練過程受偶然因數(shù)的影響,按照相同條件進行10次測試,獲得每次試驗對應的準確率。根據(jù)圖4可知,訓練集樣本進行識別得到的準確率接近100%,表明模型能夠對訓練數(shù)據(jù)起到良好的擬合效果。逐漸增加樣本數(shù)后,模型達到了更高識別準確率。圖4中訓練時間是算法經過100次迭代消耗的時間,增加標記樣本后所需的訓練時間也明顯延長。因而進行實際使用的過程中,需對算法耗時和準確率進行綜合考慮,由此確定最優(yōu)的訓練樣本數(shù)。
圖4 樣本數(shù)對識別準確率影響
依次通過主成分分析(principal component analysis, PCA)、多重對應分析(multiple correspondence analysis, MCA)、SLE算法進行降維處理,在不同嵌入維度下提取原始信號特征參數(shù),再將其輸入DBN網(wǎng)絡內進行診斷分析。利用 Kennard-Stone算法對標簽樣本處理,再對剩余樣本開展測試。對各組樣本分別測試12次再計算均值,不同降維處理下網(wǎng)絡運行效果結果見圖5所示。經圖5發(fā)現(xiàn),SLE算法相對MCA與PCA算法表現(xiàn)出了更優(yōu)特征提取性能,當設置合適參數(shù)時,獲得了近100%的準確率。為了同時提高分類精度與計算效率,控制嵌入維度介于24~30,使SLE-DBN模型的綜合性能達到最優(yōu)。
圖5 不同算法運行效果對比
通過KPCA和SLE算法提取單個傳感器信號特征,設定DBN輸入維度90。根據(jù)圖6可知,以實線表示的SLE算法達到了很高準確率,對本實驗中的各傳感器進行信號特征提取時都表現(xiàn)出了比KPCA算法更優(yōu)的性能。因此SLE-DBN模型在單一與多傳感器信號診斷方面都具備更強診斷性能。分析圖6則可以發(fā)現(xiàn),以多個傳感器進行特征融合時可以獲得比單個傳感器更優(yōu)信號診斷能力。
圖6 對單個傳感器信號特征提取
卷積神經網(wǎng)絡(CNN)也屬于當前獲得廣泛使用的一類深度學習網(wǎng)絡。表4給出了CNN網(wǎng)絡的各項參數(shù)條件,C表示卷積層,S表示池化層,F(xiàn)C是全連接層。
表4 CNN 網(wǎng)絡參數(shù)設置
對樣本集進行測試得到與圖5相近的測試結果,將訓練集分成有標簽與無標簽兩種樣本。以隨機方式選擇有標簽樣本,之后在不同數(shù)據(jù)條件下測試DBN、CNN算法分類性能。對各樣本分別測試10次,得到表5的算法準確率,δ表示上述算法的準確率偏差。
表5 不同樣本數(shù)下算法的準確率
根據(jù)準確率之差可以發(fā)現(xiàn),當有標簽樣本數(shù)量介于60~120時,DBN網(wǎng)絡相對CNN網(wǎng)絡表現(xiàn)出了更優(yōu)分類性能。這是因為DBN網(wǎng)絡可通過大量無標簽數(shù)據(jù)實現(xiàn)無監(jiān)督條件下的層間預訓練,相對只通過少數(shù)標簽進行訓練的CNN網(wǎng)絡達到了更高的模型精度。增加有標簽樣本數(shù)量后,兩種算法達到了相近的分類準確率。從整體層面考慮,SLE-DBN模型對于有標簽樣本不足情況下具備更高的準確率,對于故障診斷方面具備更優(yōu)的處理效果。
根據(jù)以上測試結果可知,SLE-DBN模型對于別軸承故障診斷方面都達到了理想分類精度以及實現(xiàn)快速識別的要求。尤其是采用本文模型無需設置大量有標簽樣本進行模型訓練,可以通過加入少量標簽樣本與大量無標簽樣本來實現(xiàn)半監(jiān)督學習過程,有效克服因樣本標簽數(shù)量少以及標簽類型差異大的問題。
采用本文SLE-DBN模型進行處理時達到了比其余模型更優(yōu)性能。采用SLE算法可以顯著縮短SLE-DBN組合模型運算時間。
訓練集樣本進行識別得到的準確率接近100%,表明模型能夠對訓練數(shù)據(jù)起到良好的擬合效果。SLE算法相對PCA與KPCA算法表現(xiàn)出了更優(yōu)特征提取性能,當設置合適參數(shù)時可以獲得近100%的準確率。
當有標簽樣本數(shù)量介于60~120時,DBN網(wǎng)絡相對CNN網(wǎng)絡表現(xiàn)出了更優(yōu)分類性能。SLE-DBN模型對于別軸承故障診斷方面都達到了理想分類精度以及實現(xiàn)快速識別的要求。