毛文濤 田思雨 竇 智 張 迪 丁 玲
隨著科技發(fā)展,各類工程設(shè)備的工作和運(yùn)行環(huán)境變得越來越復(fù)雜.作為機(jī)械設(shè)備的關(guān)鍵零部件,滾動(dòng)軸承在長(zhǎng)期大載荷、強(qiáng)沖擊等復(fù)雜工況下,極易產(chǎn)生各種故障,導(dǎo)致機(jī)械工作狀況惡化.針對(duì)軸承的故障預(yù)測(cè)與健康管理(Prognostics and health management,PHM)技術(shù)應(yīng)運(yùn)而生.若能在故障發(fā)生初期即進(jìn)行準(zhǔn)確、可靠的檢測(cè)和診斷,則有助于進(jìn)行及時(shí)維修,避免嚴(yán)重事故的發(fā)生.早期故障檢測(cè)已成為PHM 的關(guān)鍵技術(shù)環(huán)節(jié)之一[1].近年來,隨著傳感技術(shù)和機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,數(shù)據(jù)驅(qū)動(dòng)的智能化故障檢測(cè)和診斷技術(shù)受到廣泛關(guān)注.如何利用歷史采集的狀態(tài)監(jiān)控?cái)?shù)據(jù)、提高目標(biāo)軸承早期故障檢測(cè)結(jié)果的準(zhǔn)確性和穩(wěn)定性成為研究熱點(diǎn)和難點(diǎn),具有明確的學(xué)術(shù)價(jià)值和應(yīng)用需求.
本文關(guān)注的是不停機(jī)情況下的早期故障在線檢測(cè)問題.這種方式有助于實(shí)時(shí)評(píng)估軸承工作狀態(tài),避免因等待停機(jī)檢查而產(chǎn)生延誤、造成經(jīng)濟(jì)損失,因此對(duì)早期故障的在線檢測(cè)越來越受到工業(yè)界的重視.由于在線應(yīng)用場(chǎng)景的制約,與一般故障檢測(cè)相比,早期故障在線檢測(cè)具有如下需求:1)檢測(cè)結(jié)果應(yīng)具有較好的實(shí)時(shí)性,能盡可能快速準(zhǔn)確地識(shí)別出早期故障;2)檢測(cè)結(jié)果應(yīng)具有較好的魯棒性,能盡可能避免正常狀態(tài)下輕微異常波動(dòng)的影響,相比于漏報(bào)警(現(xiàn)有方法對(duì)成熟故障檢測(cè)已較成熟),更需避免誤報(bào)警;3)檢測(cè)模型應(yīng)具有較高的可靠性,在線檢測(cè)過程中無需反復(fù)進(jìn)行閾值設(shè)定和模型優(yōu)化.上述需求對(duì)檢測(cè)方法提出了新的挑戰(zhàn).
目前,在線場(chǎng)景下的早期故障檢測(cè)基本是采用現(xiàn)有的早期故障檢測(cè)方法、直接用于在線環(huán)境,其通常做法包括:從振動(dòng)信號(hào)等監(jiān)測(cè)數(shù)據(jù)中提取時(shí)頻特征[2]、小波特征[3]、包絡(luò)譜特征[4]等早期故障特征,進(jìn)而構(gòu)建支持向量機(jī)(Support vector machine,SVM)[2]、樸素Bayes 分類器[5]、Fisher 判別分析[6]、人工神經(jīng)網(wǎng)絡(luò)[7],單類(One-class) SVM[8]等機(jī)器學(xué)習(xí)模型進(jìn)行異常檢測(cè),取得了一定結(jié)果.但是,上述方法通常無法自適應(yīng)提取特征,同時(shí)需要一定的離線數(shù)據(jù)訓(xùn)練得到檢測(cè)模型,但目標(biāo)對(duì)象在線場(chǎng)景下采集到的數(shù)據(jù)有限,且其數(shù)據(jù)分布與訓(xùn)練數(shù)據(jù)的分布可能因隨機(jī)噪聲、變工況等原因而存在差異,導(dǎo)致離線訓(xùn)練的模型并不完全適合于在線數(shù)據(jù),容易降低檢測(cè)結(jié)果的準(zhǔn)確性;其次,上述方法通常采用基于異常點(diǎn)的檢測(cè)算法,未充分考慮樣本前后的時(shí)序關(guān)系,容易因數(shù)據(jù)微小波動(dòng)而產(chǎn)生誤報(bào)警,降低檢測(cè)結(jié)果的魯棒性;再次,為降低誤報(bào)警,這類方法需要反復(fù)調(diào)整報(bào)警閾值.此外,基于系統(tǒng)分析的故障診斷方法[9]利用狀態(tài)空間描述建立機(jī)理模型,可獲得理想的診斷和檢測(cè)結(jié)果,但這類方法通常需要提前知道系統(tǒng)運(yùn)動(dòng)方程等信息,對(duì)于軸承運(yùn)行過程來說,這類信息通常不易獲知.近年來,深度神經(jīng)網(wǎng)絡(luò)已被成功應(yīng)用于早期故障特征的自動(dòng)提取和識(shí)別[10?11],可自適應(yīng)地提取信息豐富和判別能力強(qiáng)的深度特征,因此具有較好的普適性.但是,這類方法一方面需要大量的輔助數(shù)據(jù)進(jìn)行模型訓(xùn)練,而歷史采集的輔助數(shù)據(jù)與目標(biāo)對(duì)象數(shù)據(jù)可能存在較大不同,直接訓(xùn)練并不能有效提升在線檢測(cè)的特征表示效果;另一方面,在訓(xùn)練過程中未能針對(duì)早期故障引發(fā)的狀態(tài)變化而有目的地強(qiáng)化相應(yīng)特征表示.因此,深度學(xué)習(xí)方法在早期故障在線檢測(cè)中的應(yīng)用仍存在較大的提升空間.
綜合上述分析,提升早期故障在線檢測(cè)效果的關(guān)鍵在于:1)提高早期故障特征的表示能力,尤其是增強(qiáng)正常狀態(tài)特征與早期故障特征的區(qū)分度;2)合理利用不同工況、甚至不同來源的輔助數(shù)據(jù)進(jìn)行模型訓(xùn)練;3)構(gòu)建簡(jiǎn)單有效的報(bào)警策略,降低正常狀態(tài)中的誤報(bào)警率.考慮上述需求特點(diǎn),本文擬從時(shí)序異常檢測(cè)的角度出發(fā),引入深度遷移學(xué)習(xí)方法,為早期故障在線檢測(cè)問題提供一個(gè)有效的解決方案.作為機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)之一,遷移學(xué)習(xí)是一類運(yùn)用已有知識(shí)對(duì)不同但相關(guān)領(lǐng)域問題求解的機(jī)器學(xué)習(xí)方法.通過利用一個(gè)領(lǐng)域數(shù)據(jù)(稱為源域)所蘊(yùn)含的先驗(yàn)信息、提升另一個(gè)相關(guān)但不同的領(lǐng)域(稱為目標(biāo)域)中預(yù)測(cè)模型的性能,遷移學(xué)習(xí)已被證明可有效解決可用訓(xùn)練樣本不足的學(xué)習(xí)問題[12].其中,領(lǐng)域自適應(yīng)方法[13]是遷移學(xué)習(xí)方法的一種,通過學(xué)習(xí)源域和目標(biāo)域的公共特征映射,從而實(shí)現(xiàn)領(lǐng)域知識(shí)的跨域傳遞,實(shí)現(xiàn)不同來源輔助數(shù)據(jù)的跨領(lǐng)域信息傳遞.尤其是近年來深度學(xué)習(xí)技術(shù)快速發(fā)展,構(gòu)建在深度神經(jīng)網(wǎng)絡(luò)之上的遷移學(xué)習(xí)方法開始受到國內(nèi)外學(xué)者的重點(diǎn)關(guān)注.借助于深度模型自適應(yīng)的特征提取能力和端到端的訓(xùn)練方法,深度遷移學(xué)習(xí)已經(jīng)成功用于解決物體識(shí)別[14]、電池壽命預(yù)測(cè)[15]、疾病檢測(cè)[16]等問題,證明利用深度模型提取不同領(lǐng)域數(shù)據(jù)的公共特征、提高目標(biāo)域數(shù)據(jù)量較少情況下建模效果的做法是可行的.有學(xué)者采用深度自編碼網(wǎng)絡(luò)、深度卷積網(wǎng)絡(luò)等構(gòu)建遷移學(xué)習(xí)模型,并在故障診斷[17?20]領(lǐng)域取得了初步應(yīng)用.這表明深度遷移學(xué)習(xí)方法可以在不同工況、不同噪聲環(huán)境之間有效傳遞故障信息,彌補(bǔ)不同工況下軸承可用數(shù)據(jù)不足的限制,提高診斷精度.這類工作的關(guān)鍵在于利用深度模型自動(dòng)學(xué)習(xí)跨領(lǐng)域狀態(tài)監(jiān)測(cè)數(shù)據(jù)的可遷移故障特征[17],并形成對(duì)故障發(fā)生模式的抽象描述信息.這一思路同樣適合于早期故障的在線檢測(cè)問題,即利用不同工況下輔助數(shù)據(jù)所蘊(yùn)含的故障發(fā)生模式信息,提高在線環(huán)境下的時(shí)序異常檢測(cè)精度.而從時(shí)序角度構(gòu)建異常檢測(cè)模型,以序列片段(而非樣本點(diǎn))作為檢測(cè)對(duì)象,有助于提高異常狀態(tài)的識(shí)別準(zhǔn)確率,也利于提升故障報(bào)警的穩(wěn)定性.
基于此,本文提出了一種基于深度遷移學(xué)習(xí)的早期故障在線檢測(cè)方法.具體來說,本文通過在多層自編碼器的目標(biāo)函數(shù)中添加域間差異正則項(xiàng)與權(quán)重系數(shù)的Laplace 正則項(xiàng),獲得更具有表示能力的早期故障特征,并在此基礎(chǔ)上,利用離線數(shù)據(jù)正常狀態(tài)的排列熵值構(gòu)建報(bào)警閾值,通過異常序列匹配,實(shí)現(xiàn)在線數(shù)據(jù)中時(shí)序故障模式的快速檢測(cè).最后,在滾動(dòng)軸承實(shí)驗(yàn)上驗(yàn)證了本文方法的有效性.本文貢獻(xiàn)可概括為:
1)提出了一種多域遷移深度自編碼網(wǎng)絡(luò)模型.與現(xiàn)有絕大多數(shù)深度遷移學(xué)習(xí)模型不同,該模型所提取特征可在有效減少多個(gè)源域數(shù)據(jù)分布差異的同時(shí),放大時(shí)序數(shù)據(jù)的變化趨勢(shì),從而提高早期故障特征與正常狀態(tài)特征的區(qū)分度,因此更適用于故障檢測(cè)問題.根據(jù)作者文獻(xiàn)調(diào)研,目前尚未發(fā)現(xiàn)深度遷移學(xué)習(xí)方法在早期故障檢測(cè)問題上的應(yīng)用.
2)提出了一種基于深度遷移學(xué)習(xí)的故障在線檢測(cè)模型.該模型依托于不同工況數(shù)據(jù)提取的公共特征,將故障報(bào)警策略與在線檢測(cè)相融合,直接通過異常序列的自適應(yīng)匹配,完成故障報(bào)警.與現(xiàn)有研究主要依賴異常點(diǎn)識(shí)別的做法相比,這一做法可有效提高在線環(huán)境下故障檢測(cè)的準(zhǔn)確率和魯棒性,同時(shí)降低誤報(bào)警率.
設(shè)在不同工況下對(duì)同一型號(hào)的軸承進(jìn)行重復(fù)實(shí)驗(yàn),可得多工況下的狀態(tài)監(jiān)測(cè)數(shù)據(jù)集每個(gè)工況下包含nk個(gè)樣例.樣本屬于樣本空間χk,數(shù)據(jù)生成服從邊緣概率分布.由于受測(cè)量環(huán)境多樣、操作條件存在差異等復(fù)雜因素的影響,不同工況下采集的數(shù)據(jù)分布有很大的差異.從統(tǒng)計(jì)分析角度可認(rèn)為,不同工況的監(jiān)測(cè)數(shù)據(jù)服從不同的邊緣概率分布.
參考遷移學(xué)習(xí)相關(guān)概念和故障診斷領(lǐng)域相關(guān)術(shù)語[17],本文涉及的在線早期故障檢測(cè)問題應(yīng)滿足以下條件:
1)所有數(shù)據(jù)都包括從正常狀態(tài)到故障狀態(tài)的退化過程,不同工況下的實(shí)驗(yàn)數(shù)據(jù)從正常狀態(tài)到早期故障狀態(tài)的演變具有內(nèi)在的一致性.
2)監(jiān)測(cè)數(shù)據(jù)集中,只有運(yùn)行的初期階段被認(rèn)為是正常狀態(tài)數(shù)據(jù),其余數(shù)據(jù)不存在健康標(biāo)記;同時(shí),正常狀態(tài)數(shù)據(jù)與早期故障數(shù)據(jù)變化幅度較小,相對(duì)較難以區(qū)分.
3)目標(biāo)域Dt由在線檢測(cè)的目標(biāo)對(duì)象數(shù)據(jù)的樣本空間χt及其服從的數(shù)據(jù)分布P(χt) 組成,即Dt={χt,P(χt)},由于在線場(chǎng)景限制,目標(biāo)域數(shù)據(jù)量通常較少,同時(shí)需要實(shí)現(xiàn)快速、準(zhǔn)確的檢測(cè).
4)源域Ds由與在線檢測(cè)環(huán)境不同的工況下軸承數(shù)據(jù)樣本空間χs及其服從的數(shù)據(jù)分布P(χs) 組成,即Ds={χs,P(χs)},為目標(biāo)對(duì)象的在線檢測(cè)提供所需的正常狀態(tài)到早期故障狀態(tài)的演化知識(shí).
與故障診斷不同,在線故障檢測(cè)本質(zhì)為異常檢測(cè)問題,即只有開始運(yùn)行階段的數(shù)據(jù)為正常狀態(tài)標(biāo)記,根據(jù)異常數(shù)據(jù)與正常狀態(tài)數(shù)據(jù)的偏差實(shí)現(xiàn)檢測(cè).通過源域監(jiān)測(cè)數(shù)據(jù)進(jìn)行訓(xùn)練,可以建立其樣本空間χs至正常狀態(tài)標(biāo)記空間γs的非線性映射關(guān)系f:χsγs,即為軸承的異常檢測(cè)知識(shí).由于目標(biāo)域數(shù)據(jù)量通常較少,所建立的異常檢測(cè)模型f:χtγt檢測(cè)相對(duì)較難區(qū)分的早期故障數(shù)據(jù)存在一定困難,因此,本文旨在利用源域的異常檢測(cè)知識(shí),提高目標(biāo)域的檢測(cè)準(zhǔn)確度.上述過程中,遷移學(xué)習(xí)的作用體現(xiàn)在:1)適配源域與目標(biāo)域的監(jiān)測(cè)數(shù)據(jù)分布,建立正常狀態(tài)公共特征表示;2)借助源域中正常狀態(tài)數(shù)據(jù)與早期故障數(shù)據(jù)之間的區(qū)分度信息,促進(jìn)目標(biāo)域檢測(cè)模型的有效性和魯棒性.
整體而言,本文所提方法包括離線訓(xùn)練和在線檢測(cè)兩個(gè)階段.其中,離線階段的主要任務(wù)是深度遷移學(xué)習(xí)模型的構(gòu)建和異常檢測(cè)模型的構(gòu)建,在線階段則直接利用公共特征表示提取目標(biāo)對(duì)象的特征并進(jìn)行異常識(shí)別.為了表述方便,表1 給出了本文常用的符號(hào)總結(jié).
表1 本文所用符號(hào)與對(duì)應(yīng)描述Table 1 Symbols and corresponding descriptions used in this paper
不失一般性,本文首先選取多層自編碼器作為基礎(chǔ)的深度網(wǎng)絡(luò)模型.自編碼器由編碼器和解碼器組成.編碼器用于從輸入數(shù)據(jù)中提取特征,表示為:H=f(WX+b);其中W為輸入層與隱層的權(quán)重矩陣.解碼器用于從提取的特征中重構(gòu)輸入數(shù)據(jù),表示為:Z=g(W′H+b′):激活函數(shù)通常可使用sigmoid函數(shù)sigmoid(x)=1/(1+e?x).自動(dòng)編碼器的目標(biāo)是使下列重構(gòu)誤差最小化:
其中,∥·∥F表示Frobenius范數(shù).
其次,為了消除源域和目標(biāo)域數(shù)據(jù)分布的差異,本文在損失函數(shù)中引入最大均值差異(Maximum mean discrepancy,MMD)正則項(xiàng).MMD 是估計(jì)分布差異的一個(gè)準(zhǔn)則,與KL 散度等參數(shù)化準(zhǔn)則不同,MMD 基于再生核希爾伯特空間來度量誤差,適合估計(jì)不同分布之間的非參數(shù)化距離,從而避免計(jì)算中間密度,減少計(jì)算工作量[18].以Ds,Dt為例,MMD 距離定義為[12]:
其中,H表示再生核希爾伯特空間,Xs和Xt分別表示源域和目標(biāo)域中的輸入樣本集,ns和nt分別表示源域和目標(biāo)域的樣本個(gè)數(shù).式(2)表示兩個(gè)域的原始樣本在非線性映射φ(·) 上的均值差異.尋找一個(gè)φ(·) 使得式(2)最小化,即可誘導(dǎo)得到兩個(gè)域之間的公共特征空間.
需要注意的是,式(2)度量的是兩個(gè)域之間的分布差異.而在故障檢測(cè)問題中,由于主要采用正常狀態(tài)數(shù)據(jù)構(gòu)建檢測(cè)模型,因此便于引入多種工況下的監(jiān)測(cè)數(shù)據(jù)來訓(xùn)練遷移學(xué)習(xí)模型.若利用式(2)進(jìn)行域間差異最小化,則需要兩兩操作,計(jì)算過于復(fù)雜;若將多種工況的數(shù)據(jù)統(tǒng)一作為源域Xs,又忽略了不同工況數(shù)據(jù)之間的分布差異.因此,本文對(duì)式(2)進(jìn)行改進(jìn),以適配多個(gè)域的數(shù)據(jù)分布,得到具有普適性的公共特征表示,以便目標(biāo)域中新采集的在線數(shù)據(jù)直接提取特征.首先,計(jì)算源域和目標(biāo)域Xt中每組監(jiān)測(cè)數(shù)據(jù)在φ(·) 上的函數(shù)值均值其中nj表示第j個(gè)軸承的樣本數(shù),sc表示工況數(shù)量;然后計(jì)算所有監(jiān)測(cè)數(shù)據(jù)的均值其中m表示所有源域與目標(biāo)域的軸承數(shù);最后,計(jì)算上述兩個(gè)均值的差,作為整體分布偏離程度的度量.考慮到異常檢測(cè)的特點(diǎn),故此處計(jì)算僅使用正常狀態(tài)數(shù)據(jù),其目的是解決不同工況下正常狀態(tài)數(shù)據(jù)的分布差異.具體表達(dá)如下:
再次,由于最小化式(3)會(huì)迫使權(quán)重W下降至接近于零,從而導(dǎo)致信息丟失,為了使權(quán)值不為零并加強(qiáng)正常狀態(tài)數(shù)據(jù)與早期故障數(shù)據(jù)的區(qū)分度,本文參考文獻(xiàn)[21]中圖像平滑的原理,構(gòu)建權(quán)值矩陣的拉普拉斯(Laplace)正則項(xiàng),如下所示:
其中,K表示多層自編碼器中的權(quán)重矩陣的個(gè)數(shù),σ表示懲罰因子,?=D1?I2+I1?D2,I1和I2是單位矩陣,D1和D2是Laplace算子.此處D1和D2采用修正Neuman 離散化算子[21],其作用是對(duì)權(quán)重矩陣W進(jìn)行二階差分,使得W中相鄰權(quán)重差異性變小,因此,最小化Lweight即可放大相鄰權(quán)重的變化.此處計(jì)算使用從正常狀態(tài)到故障狀態(tài)的全部數(shù)據(jù),雖然相鄰權(quán)重差距變大會(huì)導(dǎo)致所有樣本對(duì)應(yīng)的隱層特征差異性變大,但對(duì)于早期故障樣本,其數(shù)據(jù)幅值波動(dòng)要大于正常狀態(tài)樣本,因此,對(duì)應(yīng)權(quán)重的放大作用也要高于正常狀態(tài)樣本.由此,最小化Lweight可突出信號(hào)波動(dòng)趨勢(shì),得到對(duì)早期故障更為敏感的特征表示.
將這三部分集成到一起,最終得到多域遷移深度自編碼器的目標(biāo)函數(shù):
其中,λ,μ>0 為正則化參數(shù).λ值越大,意味著對(duì)多域公共特征的提取能力要求越高,反之對(duì)不同域之間數(shù)據(jù)分布差異的容忍度越高;μ值越大,可更加突出相鄰權(quán)重的差距,反之將減弱對(duì)信號(hào)波動(dòng)的突出效果.最小化式(5)可采用小批量梯度下降法[20].多域遷移的深度自編碼網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示:
圖1 多域遷移深度自編碼網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 Architecture of deep auto-encoder network with multi-domain transferring
對(duì)于式(5)所給出的目標(biāo)函數(shù),優(yōu)化步驟如下:
2) 前向傳播:a)從訓(xùn)練集中選取小批量數(shù)據(jù)執(zhí)行式(1),計(jì)算重構(gòu)誤差;b)取訓(xùn)練集中全壽命數(shù)據(jù)的初始部分的正常數(shù)據(jù),通過公式H=f(W0X+b0)計(jì)算該正常期數(shù)據(jù)的隱藏層特征表示,并根據(jù)式(3)計(jì)算不同域之間的MMD 值;c)取訓(xùn)練集中全壽命數(shù)據(jù),執(zhí)行式(4),計(jì)算訓(xùn)練參數(shù)W的波動(dòng)情況;d)執(zhí)行式(5)計(jì)算該網(wǎng)絡(luò)的目標(biāo)函數(shù)值,然后進(jìn)行迭代,若迭代次數(shù)小于設(shè)定值κ則執(zhí)行步驟3),反之執(zhí)行步驟4).
3) 反向傳播:a)采用GradientDescent 優(yōu)化算法,反向逐層更新帶訓(xùn)練參數(shù)W,b;b)返回步驟2).
4) 特征提取:保存訓(xùn)練參數(shù)W,b,輸入訓(xùn)練數(shù)據(jù)集頻譜數(shù)據(jù)以及目標(biāo)檢測(cè)軸承的頻譜數(shù)據(jù),根據(jù)公式H=f(W0X+b0) 提取兩者的隱藏層特征,進(jìn)而進(jìn)行異常檢測(cè)模型的構(gòu)建.
在線場(chǎng)景下,故障檢測(cè)模型應(yīng)具有較好的準(zhǔn)確性和實(shí)時(shí)性,同時(shí)應(yīng)盡可能簡(jiǎn)單.本節(jié)擬采用異常序列檢測(cè)的方式,利用排列熵構(gòu)建魯棒的檢測(cè)模型.排列熵是一種動(dòng)力學(xué)突變檢測(cè)方法,對(duì)信號(hào)的微小變化有放大作用,具體原理參考文獻(xiàn)[19].這里以第3 節(jié)實(shí)驗(yàn)數(shù)據(jù)中軸承1 為例進(jìn)行簡(jiǎn)要說明.首先,對(duì)于第2.1 節(jié)提取的深度特征,劃分成長(zhǎng)度為100個(gè)樣本的序列,對(duì)每一段序列計(jì)算其排列熵的值,其中滑動(dòng)窗口為10 個(gè)樣本,嵌入維數(shù)為3,延遲時(shí)間為3,對(duì)應(yīng)排列熵值的變化如圖2 所示,為便于觀察,對(duì)圖2 局部放大如圖3 所示.
圖3 圖2 的局部放大圖Fig.3 Partial enlarged view of Fig.2
圖2 中可以看出,雖然排列熵可以放大數(shù)據(jù)的局部變化趨勢(shì),但需要設(shè)置一個(gè)合理的閾值進(jìn)行在線異常檢測(cè).采用深度遷移學(xué)習(xí)方法,不同工況下的監(jiān)測(cè)數(shù)據(jù)可以提取到公共特征,在此基礎(chǔ)上,本文借助這些離線數(shù)據(jù),計(jì)算更為合理的報(bào)警閾值.檢測(cè)過程如下.
圖2 本文方法所提取的公共特征及其對(duì)應(yīng)的排列熵值Fig.2 The extracted common features and their corresponding permutation values
首先,利用第2.1 節(jié)中H=f(WX+b) 所提取的公共特征,計(jì)算不同工況軸承數(shù)據(jù)正常狀態(tài)的排列熵值.具體步驟為[22]:1)對(duì)序列片段L={L(k),k=1,2,···,n}進(jìn)行相空間重構(gòu),得到矩陣Kij;2)對(duì)Kij的每行進(jìn)行升序排列,構(gòu)建相應(yīng)的索引矩陣Sij;3)計(jì)算序列L的排列熵:lnPi,其中Pi為Sij中每種排列出現(xiàn)的概率.本文中,為了便于計(jì)算,對(duì)HP E進(jìn)行歸一化處理,即0≤=HP E/ln(j!)≤1,其中j!為Sij中j列數(shù)據(jù)的總排列數(shù).其次,確定上述排列熵的最小值作為閾值標(biāo)準(zhǔn).最后,對(duì)在線檢測(cè)數(shù)據(jù),采用滑動(dòng)窗口生成在線序列片段,并利用多域遷移深度自編碼網(wǎng)絡(luò)直接提取深度特征,再計(jì)算對(duì)應(yīng)的排列熵值,將其與閾值標(biāo)準(zhǔn)進(jìn)行匹配,匹配不上則意味異常發(fā)生.具體流程如圖4 所示.
圖4 所提方法流程圖Fig.4 Flow chart of the proposed method
為了驗(yàn)證本文所提方法的效果,本節(jié)在XJTUSY 數(shù)據(jù)集上進(jìn)行對(duì)比實(shí)驗(yàn).實(shí)驗(yàn)基本流程如下:用XJTU-SY 數(shù)據(jù)集[23]中的兩個(gè)工況作為源域,另一個(gè)工況作為目標(biāo)域,構(gòu)建深度遷移學(xué)習(xí)模型,提取得到公共特征表示;在此基礎(chǔ)上,將源域中兩種工況下的10 個(gè)軸承加上目標(biāo)域的4 個(gè)軸承作為離線數(shù)據(jù),計(jì)算其排列熵值,確定異常檢測(cè)閾值;最后,將剩余的一個(gè)軸承作為目標(biāo)對(duì)象進(jìn)行在線檢測(cè),利用訓(xùn)練好的公共特征表示直接提取特征,并按滑動(dòng)窗口的方式逐序列計(jì)算排列熵值,與閾值進(jìn)行比較,判斷軸承是否異常.
本文所使用的算法環(huán)境是Python 3.6,實(shí)驗(yàn)電腦配置為Intel i5 7 300 處理器,8 GB 內(nèi)存.所有數(shù)據(jù)在處理之前均線性歸一化到[?1,+1].軸承振動(dòng)信號(hào)均采用FFT 轉(zhuǎn)換為頻譜數(shù)據(jù),作為各深度學(xué)習(xí)模型的輸入.
本實(shí)驗(yàn)選取的數(shù)據(jù)集是XJTU-SY 數(shù)據(jù)集[23].采集該數(shù)據(jù)集的實(shí)驗(yàn)平臺(tái)如圖5 所示,該平臺(tái)能夠?qū)S承進(jìn)行加速退化實(shí)驗(yàn),提供15 個(gè)型號(hào)為L(zhǎng)DK UER204 的滾動(dòng)軸承在整個(gè)使用壽命內(nèi)的實(shí)際退化數(shù)據(jù),如表2 所示.兩個(gè)PCB 352C33 加速度計(jì)分別放置在垂直軸和水平軸上,用來測(cè)試振軸承動(dòng)信號(hào).采樣頻率為25.6 kHz,每分鐘采樣32 768 個(gè)樣本點(diǎn)(相當(dāng)于1.28 秒).由于加載方向?yàn)樗椒较?因此放置在水平方向的加速度計(jì)能夠捕捉到更多被測(cè)軸承的退化信息.本文選擇水平振動(dòng)信號(hào)來完成本實(shí)驗(yàn)的異常檢測(cè).
表2 XJTU-SY 數(shù)據(jù)集中三種工況描述Table 2 Description of three working conditions in XJTU-SY dataset
圖5 實(shí)驗(yàn)平臺(tái)[23]Fig.5 Experiment platform[23]
本節(jié)主要給出所提深度遷移學(xué)習(xí)模型的效果.考慮到訓(xùn)練樣本較多,為保證模型的可靠性,本實(shí)驗(yàn)中訓(xùn)練次數(shù)設(shè)為10 000 次,或訓(xùn)練損失小于0.01時(shí)終止訓(xùn)練.首先,以所有三種工況中的15 個(gè)軸承的正常狀態(tài)信號(hào)為例,圖6 和圖7 分別給出了采用多層深度自編碼器[24]和采用第2.1 節(jié)所提方法所得深度特征的概率密度分布圖及特征分布圖.如圖6(a)可以看出,不同工況下軸承正常狀態(tài)數(shù)據(jù)的分布存在較大差別,即使是相同工況下,軸承數(shù)據(jù)分布也有一些波動(dòng).而采用本文方法,如圖7(a)所示,所有工況下的數(shù)據(jù)分布趨于一致.同時(shí),對(duì)比圖6(c)和圖7(c),本文方法所提特征明顯有聚合現(xiàn)象.這表明本文方法可有效提取不同工況下軸承正常狀態(tài)數(shù)據(jù)的公共特征.
圖6 采用多層深度自編碼器提取的三種工況下軸承正常狀態(tài)數(shù)據(jù)的特征分布Fig.6 Feature distribution of bearing normal state data extracted by multi-layer deep auto-encoder under three working conditions
圖7 采用本文方法提取的三種工況下軸承正常狀態(tài)數(shù)據(jù)的特征分布Fig.7 Feature distribution of bearing normal state data extracted by the proposed method under three working conditions
為驗(yàn)證本文方法的收斂效果,圖8 給出了上述訓(xùn)練過程中訓(xùn)練誤差的變化圖.為了提高顯示效果,圖8 僅截取前1 000 訓(xùn)練輪次進(jìn)行展示.可以看到,在訓(xùn)練次數(shù)100 左右,訓(xùn)練誤差已經(jīng)明顯收斂,此后的訓(xùn)練輪次中,訓(xùn)練誤差雖仍繼續(xù)下降,但下降速度逐漸放緩,整體趨于收斂.
圖8 本文方法訓(xùn)練損失變化趨勢(shì)圖Fig.8 Changing trend of training loss of the proposed method
為進(jìn)一步驗(yàn)證深度遷移學(xué)習(xí)對(duì)于故障檢測(cè)結(jié)果的效果,我們分別采用圖6 和圖7 所提特征,計(jì)算正常狀態(tài)數(shù)據(jù)的排列熵,如圖9 所示.
限于篇幅,此處不再提供每個(gè)軸承的特征序列和對(duì)應(yīng)的排列熵值.由圖9(a)可知,未采用遷移學(xué)習(xí)之前,由于正常狀態(tài)數(shù)據(jù)存在一定的分布差異,導(dǎo)致其排列熵值幾乎跨越從0 到1 的全部范圍.而采用深度遷移學(xué)習(xí)提取公共特征之后,如圖9(b)所示,正常狀態(tài)數(shù)據(jù)的排列熵值保持在較小范圍內(nèi)波動(dòng),這意味著可根據(jù)波動(dòng)范圍設(shè)置一個(gè)合理的閾值作為異常檢測(cè)的標(biāo)準(zhǔn),為構(gòu)建簡(jiǎn)單快速的在線異常檢測(cè)模型提供了基礎(chǔ).
其次,為驗(yàn)證式(4)所示Laplace 正則項(xiàng)對(duì)于提取早期故障特征的作用,本文隨機(jī)選取工況1 下軸承5 和工況2 下軸承4 為對(duì)象,分別計(jì)算本文方法加入Laplace 正則項(xiàng)前后所提特征及對(duì)應(yīng)的排列熵值,如圖10 和圖11 所示.可以看出,對(duì)于兩個(gè)目標(biāo)軸承,采用Laplace 正則項(xiàng)后所提的公共特征(紅線)在狀態(tài)發(fā)生變化時(shí)波動(dòng)幅度更大,其所對(duì)應(yīng)的排列熵值更具有明顯的階躍現(xiàn)象.這表明式(4)所示Laplace 正則項(xiàng)可以有效增強(qiáng)正常狀態(tài)與早期故障狀態(tài)的區(qū)分度,提取的特征更為敏感,同時(shí)也表明,排列熵具有更好的判別效果.
圖11 工況2 下軸承4 的特征走勢(shì)及對(duì)應(yīng)的排列熵值 (其中紅線與藍(lán)線分別為加入和未加入Laplace 正則項(xiàng)的本文方法所對(duì)應(yīng)效果)Fig.11 Feature trend and the corresponding permutation entropy value of bearing 4 under working condition 2(where the red and blue curves show the effect with or without Laplace regularizer,respectively)
本節(jié)分別選擇兩個(gè)軸承作為目標(biāo)檢測(cè)軸承,剩余14 個(gè)軸承用作離線訓(xùn)練,目標(biāo)軸承所屬工況即為目標(biāo)域,另兩個(gè)工況為源域.
實(shí)驗(yàn)1.Bearing1-5 為目標(biāo)檢測(cè)軸承
對(duì)工況1 下軸承5 的檢測(cè)結(jié)果如圖12 所示.可以看出,14 個(gè)離線訓(xùn)練軸承正常狀態(tài)數(shù)據(jù)的排列熵值基本處于同一范圍,這表明深度遷移學(xué)習(xí)有助于得到正常狀態(tài)數(shù)據(jù)的公共特征表示.根據(jù)圖12(a)所示離線軸承正常狀態(tài)數(shù)據(jù)的排列熵值,得到報(bào)警閾值為0.7199,進(jìn)而檢測(cè)第1 090 個(gè)樣本出現(xiàn)早期故障.這一結(jié)果與圖12(b)中特征走勢(shì)的變動(dòng)也是吻合的.
實(shí)驗(yàn)2.Bearing2-4 為目標(biāo)檢測(cè)軸承
對(duì)工況2 下軸承4 的檢測(cè)結(jié)果如圖13 所示.與圖12 相似,即使調(diào)整了源域和目標(biāo)域的設(shè)定,本文方法依然可以得到14 個(gè)離線訓(xùn)練軸承在較小范圍內(nèi)的排列熵值,這再次驗(yàn)證了深度遷移學(xué)習(xí)在提取公共特征方面的效果.根據(jù)圖13(a),得到報(bào)警閾值為0.6824,第960 個(gè)樣本被檢測(cè)為發(fā)生早期故障.
圖12 Bearing1-5 軸承的檢測(cè)結(jié)果Fig.12 Detection results of bearing 1-5
圖13 Bearing2-4 軸承的檢測(cè)結(jié)果Fig.13 Detection results of bearing 2-4
為了進(jìn)一步驗(yàn)證所提方法的優(yōu)勢(shì),表3 給出了所提方法與6 種代表性早期故障檢測(cè)方法的對(duì)比結(jié)果.這6 種方法既包括了兩個(gè)最新的弱信號(hào)分析方法和兩個(gè)代表性的異常檢測(cè)算法,同時(shí)還包括了一種基于深度遷移學(xué)習(xí)的故障診斷方法和一種深度特征匹配的故障檢測(cè)方法.下面首先給出這6 種方法的原理和實(shí)現(xiàn)細(xì)節(jié).
1) BEMD-AMMA[25]:該方法利用弱信號(hào)分析來檢測(cè)早期故障.該方法先用帶寬經(jīng)驗(yàn)?zāi)B(tài)分解(BEMD)重構(gòu)原始振動(dòng)信號(hào),再用自適應(yīng)多尺度形態(tài)分析(AMMA)對(duì)重構(gòu)信號(hào)解調(diào)得到時(shí)域信號(hào),經(jīng)FFT 變換得到頻譜信號(hào),通過觀察故障特征頻率來判斷是否發(fā)生早期故障.
2) LOF[26]:該方法是一種典型的基于距離的異常檢測(cè)算法.本實(shí)驗(yàn)中,采用目標(biāo)軸承初始階段500 個(gè)樣本作為正常狀態(tài)數(shù)據(jù),計(jì)算每個(gè)樣本的LOF 值,并選擇最大值作為異常檢測(cè)的閾值,其中K 值設(shè)為10.采用多層自編碼器提取特征,網(wǎng)絡(luò)結(jié)構(gòu)為[500,100,30],即最終提取的特征維度為30.
3) iFOREST[27]:該方法是一種基于數(shù)據(jù)切割的集成算法,通常被認(rèn)為是最具有代表性的異常檢測(cè)算法.該方法基本思路是根據(jù)每個(gè)數(shù)據(jù)被分割開需要的次數(shù)來判斷異常程度,次數(shù)越少則越可能是異常數(shù)據(jù).樹的數(shù)目設(shè)為100,每棵樹隨機(jī)選擇256個(gè)樣本進(jìn)行訓(xùn)練.采用多層自編碼提取特征,網(wǎng)絡(luò)結(jié)構(gòu)為[500,100,30],即最終特征維度為30.
4) SDFM[28]:該方法是一種基于深度學(xué)習(xí)和異常序列匹配的早期故障在線檢測(cè)方法.該方法通過滑動(dòng)窗口的方式,對(duì)貫序采集的樣本塊采用深度自編碼提取特征,并根據(jù)匹配精度的變化確定故障發(fā)生位置.本實(shí)驗(yàn)中,所采用自編碼器的網(wǎng)絡(luò)結(jié)構(gòu)為[800,512,10],輸出維度為10.滑動(dòng)窗口大小設(shè)為100.
5) DAFD[18]:該方法是一種基于深度遷移學(xué)習(xí)的軸承故障診斷方法,通過在多層自編碼器中添加MMD 正則項(xiàng),提高不同工況下故障數(shù)據(jù)的診斷準(zhǔn)確度.該方法適合解決源域中正常狀態(tài)樣本和故障樣本已知、目標(biāo)域只知道正常狀態(tài)樣本的故障診斷問題,因此也適用于在線檢測(cè)問題.在本實(shí)驗(yàn)中,利用源域數(shù)據(jù)和目標(biāo)域初始階段少量正常狀態(tài)樣本訓(xùn)練診斷模型,此后貫序輸入目標(biāo)軸承的100 個(gè)樣本識(shí)別是否發(fā)生故障.自編碼器的網(wǎng)絡(luò)結(jié)構(gòu)為[500,100,50],MMD 正則項(xiàng)參數(shù)設(shè)為1,權(quán)重正則項(xiàng)參數(shù)設(shè)為10.
6) SRD[29]:該方法適合進(jìn)行多工況下的故障檢測(cè),采用稀疏字典編碼的方式,重構(gòu)數(shù)據(jù)近似值與測(cè)量值的殘差,并構(gòu)建K 近鄰距離統(tǒng)計(jì)量實(shí)現(xiàn)檢測(cè).由于該方法流程已包含對(duì)多工況數(shù)據(jù)的混合建模,因此本實(shí)驗(yàn)中,直接將源域和目標(biāo)域共三種工況的數(shù)據(jù)輸入模型,得到置信水平為95%的控制限,由此實(shí)現(xiàn)對(duì)目標(biāo)軸承的早期故障檢測(cè).原始信號(hào)通過多層自編碼器提取30 維特征.
由于上述方法2,3,5 和6 是針對(duì)樣本進(jìn)行故障檢測(cè),本實(shí)驗(yàn)中將連續(xù)出現(xiàn)3 個(gè)異常樣本認(rèn)定為故障發(fā)生,在該樣本前出現(xiàn)的異常點(diǎn)即為誤報(bào)警.方法1 和4 分別采用信號(hào)分析和故障模式匹配的方式,首次出現(xiàn)異常即認(rèn)定為故障,不存在誤報(bào)警.對(duì)比結(jié)果分析如下:
1) BEMD-AMMA:表3 中,該方法對(duì)于Bearings2-4 的檢測(cè)結(jié)果不存在,故取最后一個(gè)樣本為檢測(cè)結(jié)果.出現(xiàn)該結(jié)果的原因有兩個(gè):1)軸承故障頻率的計(jì)算值與實(shí)際值存在一定的差別;2)該方法本質(zhì)上是一種去噪算法,若去噪效果不好則檢測(cè)結(jié)果也會(huì)受影響,因此應(yīng)用于在線檢測(cè)時(shí)結(jié)果存在一定限制.
2) LOF:該方法的檢測(cè)結(jié)果雖與本文方法基本一致,沒有延后,但是誤報(bào)警的情況卻很嚴(yán)重.究其原因,異常檢測(cè)結(jié)果受正常狀態(tài)數(shù)據(jù)波動(dòng)影響較大.圖14 給出了與本文方法的對(duì)比效果圖,可以看出,正常數(shù)據(jù)的輕微波動(dòng)都會(huì)被LOF 檢測(cè)為異常而觸發(fā)誤報(bào)警,而本文方法采用異常序列(而非異常點(diǎn))檢測(cè)的策略,可以很好地解決該問題.
圖14 本文方法與LOF 算法的檢測(cè)結(jié)果對(duì)比圖 (其中,本文方法橫坐標(biāo)為序列編號(hào)(即樣本號(hào)除以100),標(biāo)簽值大于0 表示樣本識(shí)別為正常樣本,小于0 表示識(shí)別為異常樣本)Fig.14 Comparative detection results between the proposed method and LOF algorithm (while x-coordinate of the proposed method denotes sequence number (equal to the sample number divided by 100),the label value greater than 0 means the corresponding sample is recognized as normal sample,else as anomaly)
3) iFOREST:由表3 可以看到,該方法不僅檢測(cè)結(jié)果略靠后,誤報(bào)警也相對(duì)嚴(yán)重.這是因?yàn)閷?duì)于在線檢測(cè)問題,隨著樣本數(shù)的增多,iFOREST 切割次數(shù)隨之增大,因此無法提供穩(wěn)定的在線檢測(cè)結(jié)果.由于iFOREST 方法被認(rèn)為不適用于高維數(shù)據(jù),本實(shí)驗(yàn)中分別在5 至50 維特征上進(jìn)行實(shí)驗(yàn),發(fā)現(xiàn)檢測(cè)結(jié)果區(qū)別并不大,最終選擇30 維特征的結(jié)果進(jìn)行對(duì)比.
4) SDFM:從表3 可以看出,該方法檢測(cè)結(jié)果較為理想,同時(shí)沒有誤報(bào)警,這驗(yàn)證了時(shí)序異常檢測(cè)策略的有效性.但相比本文方法,在Bearing1-5的檢測(cè)結(jié)果略有延遲.分析原因,這是因?yàn)樵摲椒ㄖ苯訉⑺须x線訓(xùn)練軸承數(shù)據(jù)直接輸入深度神經(jīng)網(wǎng)絡(luò)提取特征,并未考慮數(shù)據(jù)分布不一致的問題.由此表明,對(duì)于分布存在差異的不同來源數(shù)據(jù),直接輸入深度學(xué)習(xí)模型存在一定限制,經(jīng)過領(lǐng)域適配則有助于進(jìn)一步提高深度特征的表示能力.
5) DAFD:該方法的診斷結(jié)果相對(duì)靠后.雖然該方法同樣采用深度遷移學(xué)習(xí)技術(shù),但其出發(fā)點(diǎn)是對(duì)正常狀態(tài)與故障狀態(tài)數(shù)據(jù)進(jìn)行診斷,所采用的MMD 距離也是對(duì)正常狀態(tài)數(shù)據(jù)尋找公共特征子空間.如果數(shù)據(jù)區(qū)分度較大,該方法效果較好,但對(duì)于早期故障數(shù)據(jù),故障發(fā)生界限并不明顯,此時(shí)該方法無法有效地識(shí)別數(shù)據(jù)的緩慢變化.相反,本文方法在深度遷移模型中構(gòu)建Laplace 正則項(xiàng),在尋找不同工況正常狀態(tài)數(shù)據(jù)公共特征表示的同時(shí),增大正常狀態(tài)與早期故障狀態(tài)特征的區(qū)分度,因此檢測(cè)結(jié)果對(duì)于早期故障更為敏感.
6) SRD:該方法采用概率密度估計(jì)計(jì)算異常檢測(cè)閾值,檢測(cè)結(jié)果與置信區(qū)間的設(shè)定密切相關(guān),置信區(qū)間增大,誤報(bào)警數(shù)降低,但檢測(cè)結(jié)果后移.該方法檢測(cè)結(jié)果與其他對(duì)比方法結(jié)果相近,同時(shí)誤報(bào)警數(shù)較低,尤其與DAFD 相比,其檢測(cè)結(jié)果明顯提前.這表明該方法對(duì)多工況下的監(jiān)測(cè)數(shù)據(jù)實(shí)現(xiàn)了有效融合,所采用的稀疏字典編碼的方式可以起到類似于遷移學(xué)習(xí)的效果.但與本文方法相比,其檢測(cè)結(jié)果仍相對(duì)靠后,這是因?yàn)樵摲椒ú⑽床捎眯蛄袡z測(cè)的方式、也沒有充分考慮增強(qiáng)早期故障特征的區(qū)分度.
本文針對(duì)軸承早期故障的在線檢測(cè)問題,提出了一種基于深度遷移學(xué)習(xí)的異常序列檢測(cè)方法.該方法可有效適配多工況下的軸承監(jiān)測(cè)數(shù)據(jù),同時(shí)也利用Laplace 正則項(xiàng)生成更為敏感的早期故障特征,不僅有助于進(jìn)行基于排列熵的時(shí)序異常檢測(cè),同時(shí)增強(qiáng)了檢測(cè)模型的魯棒性,降低誤報(bào)警率.該方法模型簡(jiǎn)單、結(jié)果可靠,因此更適用于早期故障的在線檢測(cè).
在下一步工作中,擬計(jì)劃引入時(shí)序深度學(xué)習(xí)模型,有針對(duì)性提取時(shí)序特征并進(jìn)行異常序列檢測(cè);此外,在線檢測(cè)本質(zhì)是一種半監(jiān)督分類問題,如何實(shí)現(xiàn)跨工況、多來源數(shù)據(jù)上的在線半監(jiān)督分類,是需要理論上重點(diǎn)考慮的問題.