馬明駿 趙海心 姜孝謨 成驍彬
(1.大連理工大學(xué)運(yùn)載工程與力學(xué)學(xué)部 2.大連理工大學(xué)能源與動(dòng)力學(xué)院,工業(yè)裝備結(jié)構(gòu)分析國(guó)家重點(diǎn)實(shí)驗(yàn)室,工業(yè)裝備數(shù)字孿生遼寧省重點(diǎn)實(shí)驗(yàn)室)
風(fēng)電機(jī)組通常建造在如近海、草原和山區(qū)等偏遠(yuǎn)地帶,受天氣變化影響,其運(yùn)行存在很大的隨機(jī)性,且工況多變,加之自然環(huán)境極端惡劣,導(dǎo)致機(jī)組故障頻發(fā),運(yùn)行成本居高不下[1]。對(duì)于在陸上偏遠(yuǎn)地區(qū)或海上的機(jī)組,維修時(shí)運(yùn)輸和吊裝風(fēng)機(jī)部件需要耗費(fèi)較長(zhǎng)時(shí)間,這使得機(jī)組停機(jī)時(shí)間長(zhǎng),維護(hù)成本高,降低了風(fēng)機(jī)發(fā)電量和可靠性[2],從而降低了風(fēng)場(chǎng)的實(shí)際經(jīng)濟(jì)效益。因此,如何降低風(fēng)電機(jī)組運(yùn)營(yíng)和維護(hù)成本是風(fēng)電廣泛應(yīng)用和進(jìn)一步發(fā)展的重大挑戰(zhàn)[3]。剩余運(yùn)行壽命預(yù)測(cè)可實(shí)現(xiàn)機(jī)組故障的早期預(yù)警和失效時(shí)間預(yù)估,幫助工作人員提前制定合理的維護(hù)計(jì)劃,減少風(fēng)機(jī)因故障導(dǎo)致的非正常停機(jī),因而成為降低風(fēng)電機(jī)組運(yùn)維成本的有效手段。
軸承是傳動(dòng)鏈系統(tǒng)的關(guān)鍵部件之一,承擔(dān)風(fēng)機(jī)運(yùn)行時(shí)的載荷傳遞。風(fēng)機(jī)軸承在惡劣環(huán)境下運(yùn)行,受變轉(zhuǎn)速和變工況的影響,存在比其它工業(yè)軸承更高的故障率[4]。因此,對(duì)風(fēng)機(jī)軸承開展壽命預(yù)測(cè)研究,實(shí)現(xiàn)軸承的故障預(yù)測(cè),并制定出合理有效的維護(hù)策略,有助于降低風(fēng)電機(jī)組的運(yùn)維成本,提高風(fēng)場(chǎng)的經(jīng)濟(jì)效益。
軸承壽命預(yù)測(cè)可分為基于物理機(jī)理和基于數(shù)據(jù)驅(qū)動(dòng)的兩類方法。前者根據(jù)失效機(jī)理建立相應(yīng)的數(shù)學(xué)模型來描述軸承退化模式,并預(yù)測(cè)出剩余壽命,常用的方法包括基于裂紋擴(kuò)展[5-6]和疲勞損傷[7-8]等機(jī)理模型。此類方法建模復(fù)雜,計(jì)算時(shí)間長(zhǎng),側(cè)重于理論和試驗(yàn)研究,適用于軸承單一故障的壽命預(yù)測(cè)研究。后者基于海量歷史數(shù)據(jù),構(gòu)建軸承壽命與關(guān)鍵變量之間的函數(shù)映射關(guān)系,實(shí)現(xiàn)對(duì)剩余壽命的預(yù)測(cè),其預(yù)測(cè)精度依賴于數(shù)據(jù)和模型質(zhì)量。此類方法通??煞譃榛诟怕式y(tǒng)計(jì)、機(jī)器學(xué)習(xí)和人工智能的三類方法。第一類方法根據(jù)大量軸承歷史壽命數(shù)據(jù),建立可靠性模型來預(yù)測(cè)軸承壽命,其中威布爾(Weibull)分布作為一種普適性的概率分布函數(shù)[9],常應(yīng)用于軸承的可靠性建模和分析[10],來描述部件的不同失效模式。但該方法僅能反映軸承壽命的一般分布規(guī)律,對(duì)其在復(fù)雜運(yùn)行工況下進(jìn)行壽命預(yù)測(cè)時(shí),會(huì)產(chǎn)生較大的偏差。第二和第三類方法都是根據(jù)軸承運(yùn)行多變量監(jiān)測(cè)數(shù)據(jù),構(gòu)建軸承壽命與多個(gè)關(guān)鍵變量的非線性關(guān)系來實(shí)現(xiàn)壽命預(yù)測(cè)。第二類方法通?;诒壤L(fēng)險(xiǎn)、加速失效、邏輯回歸和支持向量機(jī)等機(jī)器學(xué)習(xí)模型[11-14]來實(shí)現(xiàn)軸承壽命預(yù)測(cè),這種方法在壽命預(yù)測(cè)領(lǐng)域發(fā)展相對(duì)比較成熟,適用性非常廣泛。其中威布爾比例風(fēng)險(xiǎn)模型(Weibull Proportional Hazards Model,WPHM)[15]可對(duì)設(shè)備在不同狀態(tài)下進(jìn)行可靠性建模分析,被廣泛應(yīng)用于不同工業(yè)領(lǐng)域[16-18]。而第三類方法通?;诟鞣N人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)模型[19-21],此類方法在近幾年迅速發(fā)展,其中長(zhǎng)短期記憶(Long Short Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò),能考慮多維變量的相關(guān)性和時(shí)序前后依賴性,自動(dòng)提取特征進(jìn)行預(yù)測(cè)。本文發(fā)展一種融合WPHM 模型和LSTM 深度神經(jīng)網(wǎng)絡(luò)的混合方法,實(shí)現(xiàn)對(duì)風(fēng)機(jī)軸承剩余壽命的準(zhǔn)確預(yù)測(cè)。
目前,基于SCADA 數(shù)據(jù)的風(fēng)電機(jī)組狀態(tài)監(jiān)測(cè)研究已取得不錯(cuò)的效果[22-23],而基于SCADA數(shù)據(jù)的風(fēng)機(jī)剩余壽命預(yù)測(cè)研究還處于初步階段。在SCADA 數(shù)據(jù)中,溫度能直觀反映出軸承故障受復(fù)雜惡劣的運(yùn)行環(huán)境和復(fù)雜工況影響,其表現(xiàn)不明顯,給傳統(tǒng)方法實(shí)現(xiàn)壽命預(yù)測(cè)帶來困難。軸承溫度通常與其它變量存在復(fù)雜的非線性關(guān)系,若根據(jù)健康狀態(tài)下的數(shù)據(jù),建立軸承溫度與相關(guān)變量的映射關(guān)系,模擬出軸承溫度在健康狀態(tài)下的變化,便能識(shí)別出軸承的異常狀態(tài)。
LSTM 神經(jīng)網(wǎng)絡(luò)作為循環(huán)神經(jīng)網(wǎng)路(Recurrent Neural Network,RNN)的變體,在時(shí)序數(shù)據(jù)預(yù)測(cè)建模中表現(xiàn)出極強(qiáng)的適應(yīng)性和很高的精度,同時(shí)解決了RNN的長(zhǎng)期記憶能力不足、梯度消失和梯度爆炸等問題,因此在基于SCADA數(shù)據(jù)的風(fēng)機(jī)狀態(tài)監(jiān)測(cè)方面取得了良好的效果[24-25]。但目前這些研究還沒發(fā)展用于風(fēng)電軸承剩余壽命預(yù)測(cè)。
本文針對(duì)風(fēng)電軸承,發(fā)展基于SCADA 多維變量數(shù)據(jù)的無縫融合LSTM和WPHM的建模方法,實(shí)現(xiàn)軸承的故障預(yù)警和壽命預(yù)測(cè)有機(jī)結(jié)合。利用LSTM 預(yù)測(cè)模型集成風(fēng)場(chǎng)環(huán)境和風(fēng)機(jī)運(yùn)行特性對(duì)軸承溫度數(shù)據(jù)的影響,并根據(jù)預(yù)測(cè)得到的軸承運(yùn)行狀態(tài)指標(biāo),建立WPHM可靠性模型,實(shí)現(xiàn)對(duì)風(fēng)機(jī)軸承的可靠性分析。根據(jù)分析結(jié)果,給出機(jī)組故障預(yù)警,同時(shí)對(duì)當(dāng)前的可靠性變化趨勢(shì)進(jìn)行擬合,預(yù)測(cè)出機(jī)組未來的可靠性變化趨勢(shì),實(shí)現(xiàn)機(jī)組的剩余壽命預(yù)測(cè)。本文使用實(shí)際海上風(fēng)場(chǎng)的發(fā)電機(jī)驅(qū)動(dòng)端軸承運(yùn)行數(shù)據(jù)和故障案例,驗(yàn)證所提出方法的有效性和準(zhǔn)確性。
風(fēng)電機(jī)組運(yùn)行環(huán)境復(fù)雜,存在變轉(zhuǎn)速、變工況等特性,導(dǎo)致軸承溫度會(huì)出現(xiàn)周期性的波動(dòng),影響傳統(tǒng)WPHM模型的可靠性分析精度。考慮到軸承溫度與其它影響因素存在非線性關(guān)系,本研究建立LSTM多變量時(shí)序預(yù)測(cè)模型,擬合機(jī)組健康狀態(tài)下軸承溫度與相關(guān)變量的關(guān)系,由此預(yù)測(cè)軸承溫度在健康狀態(tài)下的理論值,并以實(shí)際值與預(yù)測(cè)值的殘差作為軸承狀態(tài)指標(biāo)進(jìn)行可靠性分析,實(shí)現(xiàn)更準(zhǔn)確的剩余壽命預(yù)測(cè)。
根據(jù)風(fēng)電領(lǐng)域的工程經(jīng)驗(yàn)和專家知識(shí),軸承溫度主要與2 個(gè)方面的因素相關(guān),一是與軸承自身轉(zhuǎn)速相關(guān),轉(zhuǎn)速受運(yùn)行工況影響,風(fēng)速越大,功率越高,軸承轉(zhuǎn)速就越快其溫度也就高。二是與風(fēng)機(jī)運(yùn)行環(huán)境相關(guān),軸承溫度受晝夜交替、季節(jié)變化等外界環(huán)境的影響。對(duì)于發(fā)電機(jī)軸承,其溫度還會(huì)受繞組溫度的影響。發(fā)電機(jī)繞組和軸承位置相近,且繞組溫度高于軸承溫度,因此,發(fā)電機(jī)繞組的熱量會(huì)傳遞給軸承,當(dāng)繞組溫度過高時(shí),會(huì)導(dǎo)致軸承溫度升高。
綜上,本研究選取繞組溫度、轉(zhuǎn)速、風(fēng)速、有功功率、環(huán)境溫度和機(jī)艙溫度6 個(gè)SCADA 系統(tǒng)變量作為模型輸入,表示為X={x1,x2,…,x6} ,用于預(yù)測(cè)發(fā)電機(jī)軸承溫度,表示為y。圖1展示了LSTM-WPHM模型結(jié)構(gòu)和算法流程,其中LSTM 軸承溫度預(yù)測(cè)模型由2 層LSTM神經(jīng)網(wǎng)絡(luò),2 層Dropout 層和1 層全連接層組成,每層LSTM后添加的Dropout層,在每次迭代訓(xùn)練中隨機(jī)減掉20%的神經(jīng)元,以減少模型出現(xiàn)過擬合的概率。
圖1 LSTM-WPHM模型結(jié)構(gòu)和應(yīng)用流程Fig.1 Architecture and application process of LSTMWPHM
LSTM 神經(jīng)網(wǎng)絡(luò)是一種遞歸神經(jīng)網(wǎng)絡(luò),其通過引入輸入門、遺忘門和輸出門來實(shí)現(xiàn)刪除或增加信息到細(xì)胞狀態(tài),對(duì)處理長(zhǎng)時(shí)間序列數(shù)據(jù)問題上更具優(yōu)勢(shì)[30]。模型中Ct為細(xì)胞狀態(tài)單元,表征長(zhǎng)期記憶,ht為隱層狀態(tài)單元,表征短期記憶,ft,it和Ot分別為遺忘門控單元、輸入門控單元和輸出門控單元,代入某個(gè)時(shí)刻的SCADA變量Xt,ft,it和Ot可表示為:
式中,Wf,Wi和WO為各門控單元的權(quán)值矩陣,bf,bi和bO為各門控單元的偏置矩陣。模型中遺忘門是將長(zhǎng)期記憶中的不相關(guān)信息進(jìn)行遺忘,保留重要信息,其中遺忘門控單元ft用于調(diào)節(jié)長(zhǎng)期記憶Ct的遺忘程度。輸入門是對(duì)短期記憶中的信息進(jìn)行更新,并從中篩選出重要信息作為候選記憶單元添加進(jìn)長(zhǎng)期記憶,其中輸入門控單元it用于調(diào)節(jié)候選記憶單元的添加程度,可表示為:
式中,WC為候選記憶單元的權(quán)值矩陣,bC為候選記憶單元的偏置矩陣。輸出門是對(duì)遺忘門和輸入門的信息進(jìn)行匯總,更新細(xì)胞狀態(tài)單元Ct和隱層狀態(tài)單元ht,并給出模型輸出yt,表達(dá)式如下
式中,符號(hào)?表示矩陣乘法運(yùn)算;ft?Ct-1表示記憶遺忘階段;it?表示記憶更新階段。選取風(fēng)機(jī)軸承健康階段的運(yùn)行數(shù)據(jù),訓(xùn)練LSTM軸承溫度預(yù)測(cè)模型,建立軸承溫度與6個(gè)影響因素的映射關(guān)系。利用LSTM模型預(yù)測(cè)出軸承正常運(yùn)行的溫度值,當(dāng)軸承發(fā)生異常時(shí),預(yù)測(cè)值與實(shí)際值會(huì)發(fā)生較大偏差。因此,本文以預(yù)測(cè)值與實(shí)際值的殘差δ作為表征軸承狀態(tài)的指標(biāo),計(jì)算公式如下:
式中,ytrue和ypre分別為軸承溫度實(shí)際值和預(yù)測(cè)值。
傳統(tǒng)的比例風(fēng)險(xiǎn)模型(Proportional Hazards Model,PHM),又稱Cox 模型,是由英國(guó)統(tǒng)計(jì)學(xué)家D.R.Cox 提出的一種半?yún)?shù)統(tǒng)計(jì)回歸模型。該模型假設(shè)設(shè)備在t時(shí)刻的失效率λ(t,X)由兩個(gè)影響函數(shù)組成,即基線失效率λ0(t)和監(jiān)測(cè)變量X影響的指數(shù)函數(shù)g(X)。本研究將式(8)得到的軸承狀態(tài)指標(biāo)δ代入模型,得到LSTMPHM的失效率表達(dá)為:
式中,λ0(t)為僅與歷史壽命t有關(guān)的基線失效率函數(shù),g(δ)=eαδ為影響軸承故障的關(guān)鍵變量函數(shù),α為對(duì)應(yīng)的回歸系數(shù),反映狀態(tài)指標(biāo)對(duì)機(jī)械設(shè)備失效的影響程度。相較于傳統(tǒng)PHM 模型,本研究提出的模型通過LSTM 模型融合6 個(gè)關(guān)鍵變量X={x1,x2,…,x6} 為軸承狀態(tài)指標(biāo)δ,不僅有效地集成了多個(gè)關(guān)鍵變量的影響,而且極大地簡(jiǎn)化了PHM模型參數(shù)的估計(jì)。
傳統(tǒng)的PHM模型不假定λ0()t的分布形式,僅根據(jù)現(xiàn)有數(shù)據(jù)給出離散型的基線失效率,無法給出隨歷史壽命變化的連續(xù)型基線失效率??紤]到不同機(jī)械設(shè)備在特定工況下都有其相應(yīng)的失效分布函數(shù),本研究將可靠性函數(shù)中常用的Weibull分布引入式(9),建立全參數(shù)統(tǒng)計(jì)回歸的LSTM-WPHM 模型,來對(duì)機(jī)械設(shè)備進(jìn)行更準(zhǔn)確地分析,其失效率函數(shù)表達(dá)式為:
式中,η和β分別為Weibull分布的尺度參數(shù)和形狀參數(shù),其中β<1表示故障發(fā)生在早期階段,通常由材料或制造等因素導(dǎo)致;β>1表示故障發(fā)生在老化階段,由設(shè)備長(zhǎng)時(shí)間運(yùn)行引起的磨損、疲勞和腐蝕等因素導(dǎo)致;β=1表示在運(yùn)行過程中故障發(fā)生是隨機(jī)的。
LSTM-WPHM 軸承可靠性模型中的未知參數(shù)采用極大似然法進(jìn)行估計(jì),其對(duì)數(shù)似然函數(shù)為如下:
式中,q為樣本失效個(gè)數(shù);n為數(shù)據(jù)樣本總數(shù)。對(duì)lnL(β,η,α)中的未知參數(shù)β,η和α分別求偏導(dǎo),并令各偏導(dǎo)數(shù)等于零得到非線性方程組,利用BFGS 迭代算法求解該方程組,得到參數(shù)估計(jì)值,和。
根據(jù)可靠性原理,LSTM-WPHM模型的累積失效概率為:
根據(jù)式(12)對(duì)給定機(jī)組進(jìn)行可靠性分析,計(jì)算風(fēng)機(jī)軸承隨運(yùn)行時(shí)間變化的累積失效概率F(t,δ)。累積失效概率能夠表征軸承的故障程度,其數(shù)值越大,說明軸承損傷的程度越大。因此,以累積失效概率作為軸承的失效指標(biāo),并根據(jù)故障機(jī)組和健康機(jī)組的分析結(jié)果,確定出機(jī)組的報(bào)警閾值Fa和失效閾值Ff,用于機(jī)組的故障報(bào)警和壽命預(yù)測(cè)。
圖2 為L(zhǎng)STM-WPHM 混合模型對(duì)機(jī)組故障報(bào)警和壽命預(yù)測(cè)的示意圖。首先通過LSTM 模型融合多維變量數(shù)據(jù),計(jì)算出軸承狀態(tài)指標(biāo),然后根據(jù)式(12)計(jì)算出軸承的累積失效概率F,當(dāng)F達(dá)到報(bào)警閾值Fa時(shí),給出機(jī)組故障預(yù)警,并開始對(duì)機(jī)組進(jìn)行壽命預(yù)測(cè)分析。本研究對(duì)F變化趨勢(shì)進(jìn)行曲線擬合,預(yù)測(cè)機(jī)組F未來的變化趨勢(shì),當(dāng)預(yù)測(cè)的F值達(dá)到失效閾值Ff時(shí),判定軸承完全失效。軸承運(yùn)行出現(xiàn)報(bào)警時(shí),通常認(rèn)為其出現(xiàn)了早期故障征兆,在沒有維修的情況下,軸承失效概率會(huì)隨著運(yùn)行時(shí)長(zhǎng)呈現(xiàn)非線性單調(diào)上升趨勢(shì)。因此,本研究采用指數(shù)函數(shù)來擬合失效概率趨勢(shì),表達(dá)式為:
圖2 故障報(bào)警與剩余壽命預(yù)測(cè)相結(jié)合的示意圖Fig.2 Schematic diagram of fault alarming and remaining life estimation simultaneously
式中,t為機(jī)組軸承運(yùn)行時(shí)長(zhǎng)。當(dāng)達(dá)到失效閾值Ff時(shí),軸承的剩余壽命tRUL為
式中,ta是機(jī)組報(bào)警時(shí)間;tpf是預(yù)測(cè)出的軸承失效時(shí)間。
風(fēng)電機(jī)組運(yùn)行存在很大的隨機(jī)性,這導(dǎo)致風(fēng)機(jī)軸承實(shí)際運(yùn)行壽命也存在較大的不確定性。本研究通過擬合曲線參數(shù)估計(jì)的置信區(qū)間,給出失效指標(biāo)趨勢(shì)變化的上下限,從而得到機(jī)組軸承的剩余壽命區(qū)間,進(jìn)而定量化剩余壽命的不確定性。由此,通過LSTMWPHM 混合模型,同時(shí)實(shí)現(xiàn)對(duì)風(fēng)機(jī)軸承運(yùn)行故障報(bào)警和剩余壽命預(yù)測(cè)的有機(jī)結(jié)合。
本文所提出的軸承故障報(bào)警和壽命預(yù)測(cè)相結(jié)合的算法流程如圖3所示,具體步驟如下:
圖3 故障報(bào)警及壽命預(yù)測(cè)算法流程Fig.3 Algorithm flow of fault alarm and life prediction
1)數(shù)據(jù)提取:從機(jī)組SCADA系統(tǒng)中提取建模所需的7個(gè)相關(guān)變量數(shù)據(jù)作為機(jī)組原始數(shù)據(jù)。
2)數(shù)據(jù)預(yù)處理:對(duì)數(shù)據(jù)中的空缺值和停機(jī)數(shù)據(jù)進(jìn)行處理,其中對(duì)空缺值采用中位數(shù)進(jìn)行填充,對(duì)有功功率小于0 或風(fēng)速小于3m/s 的風(fēng)機(jī)停機(jī)數(shù)據(jù)進(jìn)行刪除。對(duì)不同變量數(shù)據(jù)進(jìn)行歸一化處理,使數(shù)據(jù)映射到0~1之間,以消除變量間的量綱影響。
3)LSTM建模:利用前面所述的LSTM建模方法構(gòu)建健康狀態(tài)下各關(guān)鍵變量與軸承溫度的非線性映射關(guān)系。
4)狀態(tài)指標(biāo)計(jì)算:以LSTM模型給出的軸承溫度預(yù)測(cè)值和實(shí)際值的殘差作為表征軸承運(yùn)行狀態(tài)的指標(biāo),以此融合各類因素對(duì)軸承溫度的影響。
5)可靠性建模:選取故障機(jī)組在故障發(fā)生時(shí)刻和健康機(jī)組在多個(gè)不同時(shí)刻下的變量數(shù)據(jù)作為建模數(shù)據(jù),根據(jù)式(10)建立LSTM-WPHM 混合可靠性模型,并利用極大似然估計(jì)方法估計(jì)模型參數(shù)。
6)可靠性分析:基于LSTM-WPHM模型,根據(jù)等式(11)對(duì)機(jī)組進(jìn)行可靠性分析,給出機(jī)組隨時(shí)間變化的累積失效概率。
7)報(bào)警閾值確定:通過分析訓(xùn)練集中故障機(jī)組和健康機(jī)組的累積失效概率差異,確定報(bào)警閾值Fa和失效閾值Ff。
8)機(jī)組故障報(bào)警:基于LSTM-WPHM 模型對(duì)機(jī)組的分析結(jié)果,根據(jù)報(bào)警閾值和故障閾值,實(shí)現(xiàn)機(jī)組的實(shí)時(shí)監(jiān)測(cè)和多級(jí)故障報(bào)警。
9)剩余壽命預(yù)測(cè):當(dāng)模型給出機(jī)組故障預(yù)警時(shí),根據(jù)機(jī)組的可靠性分析結(jié)果,利用式(13)擬合機(jī)組的累積失效概率變化趨勢(shì)?;跀M合曲線預(yù)測(cè)機(jī)組該指標(biāo)的未來變化,并根據(jù)式(14)計(jì)算出機(jī)組故障剩余壽命區(qū)間,從而實(shí)現(xiàn)機(jī)組故障報(bào)警和壽命預(yù)測(cè)的有機(jī)結(jié)合。
10)預(yù)測(cè)維護(hù):基于LSTM-WPHM得到的故障報(bào)警和預(yù)測(cè)的剩余壽命,提前規(guī)劃軸承維修范圍和策略,準(zhǔn)備維修資源和備件,實(shí)現(xiàn)基于設(shè)備運(yùn)行條件的預(yù)測(cè)性維護(hù)。這樣減少軸承因故障導(dǎo)致的非計(jì)劃停機(jī),提高風(fēng)機(jī)軸承的可靠性,減少維修停機(jī)時(shí)間,降低維修成本。
以某海上風(fēng)場(chǎng)4MW風(fēng)電機(jī)組中的發(fā)電機(jī)驅(qū)動(dòng)端軸承故障為例,利用24 臺(tái)故障機(jī)組和75 臺(tái)健康機(jī)組從2016年到2019年的SCADA數(shù)據(jù)作為訓(xùn)練集,24臺(tái)故障機(jī)組和20 臺(tái)健康機(jī)組2020 年的SCADA 數(shù)據(jù)作為測(cè)試集,對(duì)模型和方法進(jìn)行驗(yàn)證。首先從SCADA 系統(tǒng)中提取驅(qū)動(dòng)端軸承溫度、繞組溫度、轉(zhuǎn)速、風(fēng)速、有功功率、環(huán)境溫度和機(jī)艙溫度7 個(gè)變量的數(shù)據(jù),并根據(jù)上述流程,對(duì)變量數(shù)據(jù)進(jìn)行預(yù)處理,包括填充空缺值、刪除停機(jī)數(shù)據(jù)和數(shù)據(jù)歸一化。同時(shí),對(duì)采樣間隔為10 分鐘的原始SCADA 數(shù)據(jù)進(jìn)行降頻,通過計(jì)算每1 小時(shí)內(nèi)的數(shù)據(jù)均值,得到采樣間隔為1小時(shí)的降頻數(shù)據(jù)。
受變轉(zhuǎn)速、變工況以及環(huán)境變化的影響,軸承溫度會(huì)呈現(xiàn)周期性的波動(dòng)。圖4 展示了3 個(gè)相關(guān)溫度變量的變化趨勢(shì),可以看出驅(qū)動(dòng)端軸承溫度變化趨勢(shì)與繞組溫度和環(huán)境溫度的趨勢(shì)相同,說明驅(qū)動(dòng)端軸承溫度會(huì)受到繞組溫度和環(huán)境溫度的影響。
圖4 溫度變量變化趨勢(shì)Fig.4 Temperature variable trends
選取預(yù)處理后的每臺(tái)機(jī)組至少6 個(gè)月的健康運(yùn)行數(shù)據(jù)作為訓(xùn)練集,建立LSTM 軸承溫度預(yù)測(cè)模型,構(gòu)建健康狀態(tài)下各影響因素與驅(qū)動(dòng)端軸承溫度的映射關(guān)系。圖5為訓(xùn)練集中部分機(jī)組的模型訓(xùn)練過程,可以看出,隨著迭代次數(shù)的增加,訓(xùn)練誤差和驗(yàn)證誤差均逐漸趨于平穩(wěn),說明LSTM模型已經(jīng)收斂。
圖5 LSTM模型訓(xùn)練過程Fig.5 Training error of LSTM model
利用非訓(xùn)練集的健康運(yùn)行數(shù)據(jù)對(duì)LSTM 模型進(jìn)行驗(yàn)證,圖6 為訓(xùn)練集中99 臺(tái)機(jī)組的模型決定系數(shù)(RSquare,R2)和均方誤差(Mean Squared Error,MSE)分析結(jié)果,可以看出,訓(xùn)練集中97%機(jī)組的R2大于0.8,R2的平均值為0.881,91.9%機(jī)組的MSE小于0.001,MSE的平均值為0.00067,說明LSTM模型的擬合精度非常高。
圖6 LSTM模型驗(yàn)證結(jié)果Fig.6 Validation results of LSTM model
利用LSTM 模型計(jì)算出健康狀態(tài)下的驅(qū)動(dòng)端軸承溫度預(yù)測(cè)值,并以預(yù)測(cè)值與實(shí)際值的殘差作為表征驅(qū)動(dòng)端軸承運(yùn)行狀態(tài)的新指標(biāo),來消除驅(qū)動(dòng)端軸承溫度的波動(dòng)性,進(jìn)而突顯出驅(qū)動(dòng)端軸承溫度異常。圖7展示了驅(qū)動(dòng)端軸承原始溫度和LSTM 模型計(jì)算出的軸承狀態(tài)指標(biāo)數(shù)據(jù),可以看出,新的軸承狀態(tài)指標(biāo)相比于原始軸承溫度更為平穩(wěn),且能夠更明顯地反映出機(jī)組運(yùn)行過程中的軸承異常。
圖7 驅(qū)動(dòng)端軸承原始溫度和狀態(tài)指標(biāo)Fig.7 Drive-end bearing original temperature and condition indicator
選取訓(xùn)練集中的24臺(tái)故障機(jī)組在故障時(shí)刻和75臺(tái)健康機(jī)組在多個(gè)任意時(shí)刻下的變量數(shù)據(jù),分別建立發(fā)電機(jī)驅(qū)動(dòng)端軸承故障的WPHM模型和LSTM-WPHM模型。表1 為兩種模型的參數(shù)估計(jì)結(jié)果,可以看出,兩種模型的參數(shù)β均大于1,α均大于0,說明兩種模型均模擬該故障為退化失效模式,且驅(qū)動(dòng)端軸承溫度越高,故障程度越大,符合軸承故障機(jī)理。兩種模型的p值均為0,說明建立的兩種模型均有較高的擬合精度。
表1 模型參數(shù)估計(jì)結(jié)果Tab.1 Parameter estimation results of models
利用得到的WPHM和LSTM-WPHM模型分別對(duì)故障機(jī)組A和健康機(jī)組B進(jìn)行分析。圖8和圖9分別展示了兩種模型對(duì)故障機(jī)組A和健康機(jī)組B的分析結(jié)果,紅色垂直虛線為SCADA系統(tǒng)故障報(bào)警時(shí)刻,可以看出,兩種模型均能識(shí)別出軸承故障,且能捕捉到軸承的失效退化階段,實(shí)現(xiàn)機(jī)組故障預(yù)警,但LSTM-WPHM 模型對(duì)機(jī)組健康階段計(jì)算出的累積失效概率更低,更符合軸承的健康運(yùn)行狀態(tài),特別是對(duì)于健康機(jī)組,可以明顯地減少對(duì)機(jī)組的誤報(bào)。
圖8 故障機(jī)組A累積失效概率分析結(jié)果Fig.8 Cumulative failure probability analysis of faulty unit A
圖9 健康機(jī)組B累積失效概率分析結(jié)果Fig.9 Cumulative failure probability analysis of healthy unit B
根據(jù)式(12)對(duì)訓(xùn)練集中的24臺(tái)故障機(jī)組和75臺(tái)健康機(jī)組進(jìn)行分析,通過對(duì)比故障機(jī)組和健康機(jī)組的分析結(jié)果,確定驅(qū)動(dòng)端軸承故障的報(bào)警閾值和故障閾值。圖10為訓(xùn)練集機(jī)組累積失效概率分析結(jié)果的統(tǒng)計(jì)特征散點(diǎn)圖,可以看出,80%故障機(jī)組的累積失效概率最大值大于0.5(紅色虛線),而所有健康機(jī)組的最大值小于0.2(黃色點(diǎn)劃線)。因此本研究分別選取0.2和0.5作為報(bào)警閾值Fa和故障閾值Ff,實(shí)現(xiàn)軸承故障的多級(jí)報(bào)警。從圖10 中還可以看出,全部機(jī)組的累積失效概率均值均小于0.05(藍(lán)色點(diǎn)線),而大部分健康機(jī)組的累積失效概率最大值大于0.05(藍(lán)色點(diǎn)線),表明部分健康機(jī)組可能已經(jīng)存在故障的風(fēng)險(xiǎn),所以本研究選取0.05作為識(shí)別軸承可靠性出現(xiàn)異常的閾值,開始捕捉軸承異常變化趨勢(shì),實(shí)現(xiàn)軸承故障預(yù)測(cè)。
圖10 機(jī)組累積失效概率分析結(jié)果的統(tǒng)計(jì)特征Fig.10 Statistical characteristics of cumulative failure probability analysis results for all units
當(dāng)累積失效概率超過0.2 時(shí),軸承進(jìn)入失效退化階段,給出軸承故障預(yù)警,并根據(jù)報(bào)警前6 個(gè)月的數(shù)據(jù)對(duì)軸承進(jìn)行壽命預(yù)測(cè)分析?;谧R(shí)別到的軸承異常數(shù)據(jù),利用式(13)擬合機(jī)組累積失效概率隨運(yùn)行時(shí)間的變化趨勢(shì),預(yù)測(cè)軸承未來的累積失效概率,利用式(14)估計(jì)出軸承的剩余壽命??紤]到運(yùn)行過程中機(jī)組壽命存在較大的不確定性,本文基于擬合曲線參數(shù)估計(jì)的99.5%置信區(qū)間,給出累積失效概率變化趨勢(shì)曲線的上下限,從而給出機(jī)組剩余壽命的預(yù)測(cè)區(qū)間。
利用2 臺(tái)故障機(jī)組C 和D 對(duì)提出的故障報(bào)警及壽命預(yù)測(cè)方法進(jìn)行驗(yàn)證,圖11 展示了LSTM-WPHM 模型對(duì)2 臺(tái)故障機(jī)組的故障預(yù)警和壽命預(yù)測(cè)分析結(jié)果。故障機(jī)組C在2019/06/02 16:11發(fā)生故障,模型在2019/04/05 22:00 給出機(jī)組故障預(yù)警,并預(yù)測(cè)機(jī)組在606 小時(shí)到1562小時(shí)之間發(fā)生故障,提前了57天18小時(shí)預(yù)測(cè)出機(jī)組故障(圖11a)。故障機(jī)組D 在2020/06/02 07:53 發(fā)生故障,模型在2020/04/30 22:00給出故障預(yù)警,并預(yù)測(cè)機(jī)組在599 小時(shí)到963 小時(shí)之間發(fā)生故障,提前32 天9 小時(shí)預(yù)測(cè)出機(jī)組故障(圖11b)。由此說明,本文提出的故障報(bào)警和壽命預(yù)測(cè)相結(jié)合算法能夠提前給出預(yù)警,并可以準(zhǔn)確地預(yù)測(cè)出機(jī)組發(fā)生故障前的剩余壽命。
圖11 LSTM-WPHM模型故障報(bào)警與壽命預(yù)測(cè)分析結(jié)果Fig.11 Analysis results of LSTM-WPHM fault alarm and life prediction
為進(jìn)一步驗(yàn)證所提方法的準(zhǔn)確性和有效性,利用上述方法對(duì)測(cè)試集中的24臺(tái)故障機(jī)組和20臺(tái)健康機(jī)組進(jìn)行故障報(bào)警和壽命預(yù)測(cè)分析。表2 為測(cè)試集機(jī)組報(bào)警結(jié)果,可以看出,對(duì)24 臺(tái)故障機(jī)組給出19 次故障報(bào)警,其中3 次為機(jī)組健康階段的誤報(bào),報(bào)警準(zhǔn)確率為66.7%,對(duì)20 臺(tái)健康機(jī)組給出7 次誤報(bào),報(bào)警準(zhǔn)確率為65%??梢姡瑱C(jī)組報(bào)警整體準(zhǔn)確率為65.9%,準(zhǔn)確率較低,且測(cè)試集機(jī)組報(bào)警中的誤報(bào)率也相對(duì)較高,整體誤報(bào)率為25.6%。
表2 測(cè)試集機(jī)組報(bào)警結(jié)果Tab.2 Alarm analysis results of test units
針對(duì)上述誤報(bào)和漏報(bào)情況,選取典型機(jī)組進(jìn)行分析。圖12 為測(cè)試集中誤報(bào)機(jī)組的兩個(gè)分析案例,對(duì)于故障機(jī)組E,模型在2020 年3 月給出故障報(bào)警,而系統(tǒng)并未發(fā)生報(bào)警,但從原始軸承溫度可以看出,溫度存在異常,但由于沒有達(dá)到系統(tǒng)設(shè)置的90℃的報(bào)警閾值,所以系統(tǒng)沒有給出警報(bào),因此考慮該誤報(bào)為模型識(shí)別出的系統(tǒng)漏報(bào)。同理,對(duì)于健康機(jī)組F,模型在2020年10月至11 月給出故障報(bào)警,但由于原始軸承溫度并未達(dá)到系統(tǒng)報(bào)警閾值,所以沒有給出警報(bào)。
圖12 誤報(bào)機(jī)組的分析結(jié)果Fig.12 Analysis results of false alarms
測(cè)試集中的機(jī)組誤報(bào)大多為系統(tǒng)未識(shí)別出的漏報(bào),若考慮上述情況,測(cè)試集的10次誤報(bào)中有8個(gè)為系統(tǒng)漏報(bào),其中3 個(gè)為故障機(jī)組,5 個(gè)為健康機(jī)組,由此重新計(jì)算測(cè)試集的機(jī)組報(bào)警結(jié)果,如表3 所示,機(jī)組報(bào)警整體準(zhǔn)確率為78.7%,誤報(bào)率為4.3%,故障預(yù)測(cè)平均提前時(shí)間為13天7小時(shí)。
表3 測(cè)試集機(jī)組報(bào)警結(jié)果Tab.3 Alarm analysis results of test units
圖13為測(cè)試集中漏報(bào)機(jī)組的2個(gè)分析案例,可以看出,模型未在機(jī)組故障時(shí)刻給出報(bào)警,從原始軸承溫度可以看出,溫度確定超過了系統(tǒng)報(bào)警預(yù)警,但經(jīng)模型分析后,軸承狀態(tài)指標(biāo)在故障發(fā)生時(shí)刻未有明顯變化,原因可能是軸承溫度超限主要受其它因素影響,并不是模型考慮的影響因素或機(jī)組自身故障所致。
圖13 漏報(bào)機(jī)組的分析結(jié)果Fig.13 Analysis results of missing alarms
綜上,本文所提出的方法能夠高精度地實(shí)現(xiàn)機(jī)組的故障報(bào)警和壽命預(yù)測(cè),同時(shí)模型能夠識(shí)別出受環(huán)境因素影響而導(dǎo)致的系統(tǒng)漏報(bào),說明本文提出的模型和方法具有很高的準(zhǔn)確性。
針對(duì)風(fēng)機(jī)軸承溫度異常監(jiān)測(cè)報(bào)警和預(yù)測(cè),本文提出一種基于SCADA數(shù)據(jù)的LSTM-WPHM混合模型。通過引入LSTM 模型,融合關(guān)鍵因素對(duì)軸承溫度的影響,提高軸承溫度異常的識(shí)別精度,并結(jié)合給出的軸承狀態(tài)指標(biāo),發(fā)展LSTM-WPHM 模型,提出一種風(fēng)機(jī)軸承故障報(bào)警和壽命預(yù)測(cè)相結(jié)合算法,提高風(fēng)機(jī)軸承異常報(bào)警、可靠性分析和剩余壽命預(yù)測(cè)的精度。考慮風(fēng)機(jī)軸承因多種因素影響導(dǎo)致的運(yùn)行壽命的不確定性,給出剩余壽命預(yù)測(cè)區(qū)間,以便制定合理的維修計(jì)劃。利用實(shí)際海上風(fēng)場(chǎng)SCADA 系統(tǒng)的發(fā)電機(jī)驅(qū)動(dòng)端軸承數(shù)據(jù),通過比較研究,驗(yàn)證了本文所提模型和方法的有效性和準(zhǔn)確性,具體結(jié)果如下:
1)以1臺(tái)故障機(jī)組和1臺(tái)健康機(jī)組為例,對(duì)LSTMWPHM 模型和傳統(tǒng)WPHM 模型進(jìn)行對(duì)比分析,結(jié)果表明,LSTM-WPHM模型可以更準(zhǔn)確地得到機(jī)組可靠性分析結(jié)果,并減少機(jī)組誤報(bào)情況。
2)以測(cè)試集中的2臺(tái)故障機(jī)組為例,對(duì)所提出的方法進(jìn)行驗(yàn)證,結(jié)果表明,該方法能夠基于LSTM-WPHM模型分析結(jié)果,根據(jù)報(bào)警閾值和故障閾值,準(zhǔn)確地實(shí)現(xiàn)機(jī)組故障報(bào)警,并根據(jù)指標(biāo)變化趨勢(shì),準(zhǔn)確預(yù)測(cè)出故障發(fā)生時(shí)間,實(shí)現(xiàn)故障報(bào)警和壽命預(yù)測(cè)有機(jī)結(jié)合。
3)利用測(cè)試集中的全部機(jī)組對(duì)所提出的基于LSTM-WPHM 的方法進(jìn)行驗(yàn)證,結(jié)果表明,該方法能夠以較高精度實(shí)現(xiàn)故障報(bào)警和壽命預(yù)測(cè),故障報(bào)警整體準(zhǔn)確率為78.7%,并可以平均提前13天7小時(shí)給出故障預(yù)測(cè),從而驗(yàn)證了本文所提方法的準(zhǔn)確性和有效性。