劉嘉煜,夏曉毛,宋予熙
(博世汽車部件(長沙)有限公司,湖南 長沙 410100)
隨著工業(yè)4.0時代的到來,日益增長的對于質(zhì)量和產(chǎn)量需求及更復(fù)雜的制造系統(tǒng),使得現(xiàn)代制造業(yè)對加工設(shè)備的穩(wěn)定性和可靠性的要求日趨嚴格。為了提升生產(chǎn)效率,減少制造成本,合理維修策略的制定及對于設(shè)備運行狀態(tài)的實時把控尤為重要。
20世紀90年代開始,兩種維修策略在實際生產(chǎn)過程中運用較為廣泛,一種是修復(fù)性維護,也被稱為故障驅(qū)動的維修,是一種在設(shè)備故障已經(jīng)出現(xiàn)后進行維修的方式,這種方式可能導(dǎo)致生產(chǎn)過程中非計劃性的停機;另一種是按照固定的時間周期性進行預(yù)防性維護,維修計劃主要根據(jù)工程師的經(jīng)驗決定[1]。Nowlan和Heap提出,89%的航空設(shè)備故障不存在狀態(tài)急劇惡化階段,故障可能按照某種模式隨機出現(xiàn)[2],所以基于時間的周期性維護可能由于維修計劃制定不合理造成生產(chǎn)資源的浪費或?qū)е略O(shè)備在兩次維護間隔之間損壞。近年來,基于設(shè)備狀態(tài)的預(yù)測性維護[3]由于其在降低維修成本,減少故障停機時間和延長設(shè)備使用壽命方面的潛力,在制造業(yè)的應(yīng)用逐步增加。
預(yù)測性維護實現(xiàn)的核心在于通過非破壞性的方式對設(shè)備運行過程中能夠反映其健康狀態(tài)的數(shù)據(jù)進行監(jiān)控,并基于實時數(shù)據(jù)進行診斷性分析和預(yù)測性分析,輔助維修計劃的制定。診斷性分析旨在對特定故障進行探測,并確定其產(chǎn)生的根本原因,而預(yù)測性分析主要基于當前數(shù)據(jù)和歷史數(shù)據(jù)對未來設(shè)備的工作狀況和剩余使用壽命(Remaining Useful Life,RUL)進行預(yù)測。
設(shè)備狀態(tài)的分析可依據(jù)其故障過程的物理公式,也可由數(shù)據(jù)驅(qū)動,通過數(shù)據(jù)挖掘的手段對其狀態(tài)進行識別。由于設(shè)備的復(fù)雜性逐漸提高,其狀態(tài)衰退機制難以明確,物理模型在實際生產(chǎn)過程中的準確應(yīng)用受到了限制,因此,在先進的傳感器技術(shù)和提升的計算機算力的幫助下,數(shù)據(jù)驅(qū)動下,運用傳統(tǒng)機器學(xué)習(xí)和深度學(xué)習(xí)方法的預(yù)測性分析模式逐漸占據(jù)主要地位。
在基于傳統(tǒng)機器學(xué)習(xí)方法的預(yù)測性分析模式中,對采集的數(shù)據(jù)進行特征提取并進行特征篩選得到設(shè)備狀態(tài)的特征表示,這些特征被送入后續(xù)模型,如邏輯回歸,決策樹、支持向量機等,用于模型的訓(xùn)練。訓(xùn)練好的模型最后將用于設(shè)備健康狀態(tài)預(yù)測。然而特征工程的好壞對模型的表現(xiàn)起到關(guān)鍵作用,這一過程需要較豐富的領(lǐng)域知識,數(shù)據(jù)預(yù)處理和不完全的特征提取可能導(dǎo)致原始數(shù)據(jù)中能夠反映設(shè)備狀態(tài)的信息丟失。
近年來,日益蓬勃發(fā)展的深度學(xué)習(xí)網(wǎng)絡(luò),如在自然語言處理(Natural Language Processing,NLP),圖像描述等方面起重要作用的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN),為本質(zhì)為時間序列的產(chǎn)線傳感器采集信號的表征提供了新思路。這些方法直接通過深度神經(jīng)網(wǎng)絡(luò)從原始的時域信號中自適應(yīng)地提取設(shè)備狀態(tài)特征表示,無需額外的領(lǐng)域知識,可端到端地實現(xiàn)設(shè)備故障的預(yù)測。
為解決傳統(tǒng)RNN梯度消失和梯度爆炸問題提出的長短時記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)中引入了門的操作,其對于歷史信息的記憶能力使其在捕捉傳感器數(shù)據(jù)中的時序信息方面更具優(yōu)勢。Zhao R[4]等發(fā)現(xiàn)使用基于LSTM的網(wǎng)絡(luò)可以獲取傳感器信號中的有效特征,并在刀具磨損預(yù)測任務(wù)上進行了驗證。Zhao R[5]認為,除了時間上的信息外,不同維度傳感器數(shù)據(jù)之間包含的空間關(guān)系和數(shù)據(jù)中的噪音會使得僅僅使用LSTM變得不夠魯棒,所以選擇采取先使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)提取局部特征。文獻[6]中結(jié)合使用LSTM和CNN對原始信號進行特征提取后送入回歸層,實現(xiàn)對刀具后刀面磨損值的預(yù)測。
常用的非破壞性設(shè)備狀態(tài)監(jiān)測方式包括采集聲信號、紅外信號及振動信號等[7],在Mourbray提出的P-F曲線中,振動信號能夠以相對較早的提前量幫助識別設(shè)備的潛在故障[8],文獻[9]中利用振動信號分別對設(shè)備的磨損,故障及剩余使用壽命進行了預(yù)測。同時考慮到實際生產(chǎn)環(huán)境中的噪聲影響,傳感器的成本及安裝的難易程度,本文中選擇采用振動信號進行設(shè)備故障的探測。
本文通過在車削機臺刀桿上加裝加速度傳感器,以26 000 Hz的頻率采集x,y,z三個方向的振動信號。利用車削機臺不同的故障狀態(tài)下,產(chǎn)品加工過程中的數(shù)據(jù)進行基于特征提取的機器學(xué)習(xí)模型和長短時記憶網(wǎng)絡(luò)的訓(xùn)練,實現(xiàn)在真實生產(chǎn)環(huán)境下對機臺的不同故障類別的實時探測。
由于傳統(tǒng)機器學(xué)習(xí)模型對于特征工程的要求較高,為提高模型的擬合準確度,首先要對特征值進行篩選,去除無關(guān)冗余特征。本文基于Fisher Score進行關(guān)鍵特征的選取,其主要思想為對不同類別區(qū)分能力較強的特征應(yīng)該具有類內(nèi)方差較小,而類間方差較大的特點[10]。記總樣本數(shù)為n,第i類樣本數(shù)為ni,i∈[1,...C],C為樣本類別總數(shù),第i類樣本集為ωi,x(k)表示樣本x在特征k上的取值, 表示第i類樣本特征k取值的均值,
表示所有樣本特征k取值的均值。則特征k的類間方差
類內(nèi)方差
特征k在數(shù)據(jù)集上的Fisher Score
Fisher Score越大,則特征對于不同類別的區(qū)分能力越強。通過保留Fisher Score較大的特征進行特征篩選。
LSTM是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),通過不同的門結(jié)構(gòu)來控制信息的傳遞。通過細胞狀態(tài)的使用,使得模型對不同時間間隔前后的數(shù)據(jù)具有記憶功能。這一點為在時間上具有明顯依賴性的設(shè)備狀態(tài)監(jiān)控提供了有力的幫助。
式中,i t為輸入門,f t為遺忘門,o t為輸出門,⊙表示逐元素相乘,σ(·)表示sigmoid激活函數(shù)。參數(shù)W f、為隱藏層神經(jīng)元個數(shù))、U f、和通過模型學(xué)習(xí)得到,且在所有時刻取相同值。
LSTM層最后時刻的輸出 作為樣本xi的特征表示,通過全連接層和softmax層預(yù)測得到不同類別的概率softmax的計算公式為
為使得模型學(xué)習(xí)到不同時間維度信息,通過堆疊多個非線性LSTM層的方式得到深層LSTM,模型隱層的輸出在時間方向傳遞的同時也作為下一LSTM層的輸入。在僅考慮過去時間步長信息的LSTM的基礎(chǔ)上提出的雙向長短時記憶網(wǎng)絡(luò),由于其信息流可雙向傳遞的特點,為模型同時考慮過去與未來信息的影響提供了一種可行方式。
由于模型結(jié)構(gòu)復(fù)雜,參數(shù)量巨大,而實際生產(chǎn)過程中可獲取的樣本量較小,為了避免模型過擬合,通過在全連接層之前引入dropout層的方式,在訓(xùn)練過程中隨機隱藏部分隱層輸出,對模型進行正則化。
對于深度學(xué)習(xí)模型,為獲取最優(yōu)權(quán)重,模型訓(xùn)練過程中,通過最小化損失函數(shù)交叉熵(Cross Entropy,CE),使用Adam進行模型權(quán)重的更新,并使用階梯式的方式調(diào)整訓(xùn)練過程的學(xué)習(xí)率。交叉熵的計算公式為
為對比基于特征提取與傳統(tǒng)機器學(xué)習(xí)算法的模型和深度學(xué)習(xí)模型對真實生產(chǎn)環(huán)境下運行設(shè)備的故障探測能力,本文通過在不同時間段進行的兩次實驗,分別采集了車削機臺在兩種不同故障狀態(tài)及正常狀態(tài)下的產(chǎn)品加工過程中的振動數(shù)據(jù),其中,第一次實驗的數(shù)據(jù)用作訓(xùn)練集,第二次實驗數(shù)據(jù)用作測試集,故障狀態(tài)及訓(xùn)練集與測試集劃分見表1。振動數(shù)據(jù)來源于車削機臺刀桿上安裝的加速度傳感器,傳感器以26 000Hz的頻率采集產(chǎn)品加工過程中x,y,z三個方向振動數(shù)據(jù)。
表1 數(shù)據(jù)集描述
對于本文研究的車削工藝,一片產(chǎn)品的加工過程大致可分為進刀段、粗車段、精車段與退刀段,其x軸方向的振動信號如圖1所示。由于進刀與退刀段的過程表現(xiàn)受周圍環(huán)境影響較大,故本文中僅提取與當前工序狀態(tài)相關(guān)性較強的粗車段與精車段數(shù)據(jù)進行后續(xù)的分析。同時,為消除加工不同型號產(chǎn)品引入的振動強度差異,將x,y,z軸數(shù)據(jù)處理為對于三軸總振幅的相對值。在數(shù)據(jù)預(yù)處理后,對表2所示模型進行了訓(xùn)練。
表2 模型及訓(xùn)練數(shù)據(jù)描述
圖1 產(chǎn)品加工過程中的x軸方向振動數(shù)據(jù)及加工階段劃分
對于傳統(tǒng)機器學(xué)習(xí)模型LR,SVC,DT和RF,首先對x,y,z三個方向振動數(shù)據(jù)提取時域、頻域、時-頻域特征。樣本數(shù)據(jù)記為樣本數(shù)據(jù)的快速傅里葉變換,結(jié)果記為p(f),短時傅里葉變換,結(jié)果記為S(t,f),HHT(Hilbert-Huang Transform,希爾伯特黃變換)后得到的解析信號的實部與虛部分別記為a(t)與b(t)。其中,對于頻譜偏度取均值,最大值對應(yīng)頻率及過95%置信區(qū)間的點個數(shù)作為特征值;頻段的劃分取用0Hz,
3 500Hz,5 000Hz,65 00Hz,8 000Hz,9 500Hz,11 000Hz,26 000Hz,HHT作用于經(jīng)驗?zāi)B(tài)分解處理后得到的1~10層本征模態(tài)函數(shù)。由此,每個產(chǎn)品數(shù)據(jù)由264維特征向量表征,經(jīng)特征篩選降維處理后,用于上述四類模型的訓(xùn)練。對于SVC、DT和RF,模型超參數(shù)的選擇采用在訓(xùn)練集上進行5折交叉驗證,最大化加權(quán)f1 score的方法。
對于可直接處理時序數(shù)據(jù)的LSTM模型,為減少采樣過程中引入的隨機性[11],以100個樣本點為一組,對粗車段和精車段不同軸信號分別求取均值、標準差、最大值和最小值,保留100個時間步長,每個時間步長由32維向量構(gòu)成。由于原始數(shù)據(jù)樣本量較小而模型結(jié)構(gòu)相對復(fù)雜,為防止過擬合的情況發(fā)生,對于每個產(chǎn)品的數(shù)據(jù),通過隨機截斷的方式,生成1 000個樣本,經(jīng)過二次采樣處理的訓(xùn)練集大小擴充為278 000。所用模型結(jié)構(gòu)見表3和表4,對每種結(jié)構(gòu)的模型分別嘗試了單向與雙向傳遞的網(wǎng)絡(luò)。最后的輸出均接入節(jié)點個數(shù)為3的全連接層和softmax層,得到不同類別的概率。
表3 隱藏層神經(jīng)元個數(shù)相同的LSTM模型結(jié)構(gòu)
表4 隱藏層神經(jīng)元個數(shù)不同的LSTM模型結(jié)構(gòu)
最終模型的表現(xiàn)使用加權(quán)精確率(precision),召回率(recall)和f1 score來衡量。對于每種機臺狀態(tài)類別i,其樣本個數(shù)記為則對于類別i
式中,M代表混淆矩陣,M[i,j]為真實值為i,預(yù)測值為j的樣本個數(shù)。模型總體的加權(quán)準確率、精確率、召回率和f1 score為
不同模型在測試集上的加權(quán)平均精確率、召回率與f1 score,以及其分類結(jié)果的混淆矩陣見表5和如圖2所示,其中LSTM(128)代表神經(jīng)元個數(shù)為128的單層單向LSTM網(wǎng)絡(luò),deepLSTM(8-8-8)代表每層神經(jīng)元個數(shù)均為8的三層單向LSTM網(wǎng)絡(luò),biLSTM(8-8-8)代表每層神經(jīng)元個數(shù)均為8的三層雙向LSTM網(wǎng)絡(luò)。在Logistic回歸、支持向量機、決策樹與隨機森林中,隨機森林取得最高的精確率、召回率與f1 score,但其傾向于將設(shè)備正常狀態(tài)誤判為故障狀態(tài)。在不同結(jié)構(gòu)的LSTM模型中,3層隱藏層,每層8個神經(jīng)元的結(jié)構(gòu)取得了最好的表現(xiàn),在測試集上的f1 score為0.875。導(dǎo)致人工構(gòu)造特征進行訓(xùn)練的傳統(tǒng)機器學(xué)習(xí)模型表現(xiàn)整體劣于不同結(jié)構(gòu)的LSTM模型的原因,一方面可能在于模型擬合能力的限制,無法捕捉不同工況下采集的振動模式的差異,另一方面可能在于人為構(gòu)造特征導(dǎo)致的有效信息丟失。
圖2 不同模型預(yù)測結(jié)果的混淆矩陣
表5 不同類別模型表現(xiàn)對比
(續(xù))
圖3和表6對比了使用不同LSTM模型結(jié)構(gòu)得到的f1 score。在所有本文中嘗試的結(jié)構(gòu)中,每層神經(jīng)元個數(shù)均為8的三層單向LSTM網(wǎng)絡(luò)得到了最高的預(yù)測準確度。其中對于單向傳遞的LSTM,當每層神經(jīng)元個數(shù)均為8或16時,隱層從一層到三層,模型的預(yù)測準確度逐步提高,但四層模型的表現(xiàn)劣于一層。當模型層數(shù)為2,3,4層時,雙向LSTM的準確度反而低于單向LSTM。對于三層LSTM,隱藏層使用相同神經(jīng)元個數(shù)的模型預(yù)測能力優(yōu)于每層使用不同神經(jīng)元個數(shù)的模型。
表6 不同神經(jīng)元個數(shù)的3層LSTM準確度對比
圖3 不同LSTM模型結(jié)構(gòu)預(yù)測結(jié)果的f1 score
本文使用產(chǎn)品加工過程中的振動數(shù)據(jù),嘗試對車削機臺的兩種常見故障進行預(yù)測,以實現(xiàn)生產(chǎn)過程中的預(yù)測性維護功能。在綜合對比了Logistic回歸、支持向量機、決策樹及隨機森林等使用數(shù)字信號處理方法所提取特征進行訓(xùn)練的傳統(tǒng)機器學(xué)習(xí)模型,與不同結(jié)構(gòu)的使用原始數(shù)據(jù)進行訓(xùn)練的LSTM在不同時間段采集的生產(chǎn)數(shù)據(jù)上的預(yù)測表現(xiàn)后得出,能有效捕獲時序信息的深度學(xué)習(xí)網(wǎng)絡(luò)LSTM,對車削機臺故障預(yù)測的能力整體高于傳統(tǒng)機器學(xué)習(xí)模型,最高的準確率可達87.5%。
為提高預(yù)測結(jié)果的準確度,多源異質(zhì)數(shù)據(jù)融合已成為設(shè)備健康度監(jiān)測的主要趨勢。由于本文中僅考慮振動數(shù)據(jù),后續(xù)工作中會結(jié)合更多數(shù)據(jù)源,如伺服電機數(shù)據(jù)及外部環(huán)境溫度數(shù)據(jù)等,向更多類別的故障預(yù)測方向進行探索。