向 玲,王朋鶴,李京蓄
(華北電力大學(xué)(保定) 機(jī)械工程系,河北 保定 071003)
風(fēng)能作為一種清潔環(huán)保的可再生資源受到了全球各國的極大關(guān)注[1],中國也十分重視風(fēng)能技術(shù)的發(fā)展,如今中國已成為全球最大的風(fēng)電發(fā)展區(qū)域市場[2-3]。然而,由于惡劣的工作環(huán)境與復(fù)雜多變的工作條件,風(fēng)電機(jī)組發(fā)生故障的頻率較高,導(dǎo)致風(fēng)電機(jī)組維護(hù)運(yùn)行成本較高[4-5]。因此,研究風(fēng)電機(jī)組的異常識別技術(shù),及時發(fā)現(xiàn)風(fēng)電機(jī)組的早期潛在故障,對風(fēng)電場的檢修維護(hù)和風(fēng)電機(jī)組的安全運(yùn)行具有重要意義[6]。
數(shù)據(jù)采集與監(jiān)視控制(supervisory control and data acquisition,SCADA)系統(tǒng)作為監(jiān)測風(fēng)電機(jī)組運(yùn)行狀態(tài)的主要技術(shù)手段,采集了大量與風(fēng)電機(jī)組運(yùn)行狀態(tài)相關(guān)的變量,但風(fēng)電機(jī)組受風(fēng)速變化和季節(jié)性氣溫變化的影響,運(yùn)行狀態(tài)變化劇烈,SCADA系統(tǒng)采集到的正常數(shù)據(jù)幅值變化范圍很大,難以通過單一的參數(shù)判斷風(fēng)電機(jī)組的運(yùn)行狀態(tài),因此需要提取隱含在眾多參數(shù)中的故障特征從而做到對風(fēng)電機(jī)組的運(yùn)行狀態(tài)的準(zhǔn)確判斷[7]。文獻(xiàn)[8]以SCADA系統(tǒng)的部分?jǐn)?shù)據(jù)作為輸入?yún)?shù),以有功功率作為輸出參數(shù)建立了基于支持向量回歸(support vector regression,SVR)的預(yù)測模型,實(shí)現(xiàn)了對風(fēng)電機(jī)組運(yùn)行狀態(tài)的在線監(jiān)測。文獻(xiàn)[9]通過非線性狀態(tài)估計(jì)方法建立溫度預(yù)測模型,然后通過人為模擬故障對模型進(jìn)行驗(yàn)證,證明了該模型可以及時發(fā)現(xiàn)風(fēng)電機(jī)組的異常變化。文獻(xiàn)[10]采用支持向量回歸建立溫度模型研究齒輪箱異常,并利用趨勢云模型判斷風(fēng)電機(jī)組運(yùn)行狀態(tài)。文獻(xiàn)[11]結(jié)合反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network, BPNN)和遺傳算法(genetic algorithm,GA)構(gòu)建了風(fēng)電機(jī)組異常識別模型并應(yīng)用于1.5 MW風(fēng)電機(jī)組,證明了該方法的可行性。文獻(xiàn)[12]通過人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)預(yù)測模型對風(fēng)電機(jī)組主軸承故障進(jìn)行檢測,成功識別出主軸承早期故障。上述文獻(xiàn)有些沒有考慮輸入項(xiàng)狀態(tài)參數(shù)和輸出項(xiàng)狀態(tài)參數(shù)的相關(guān)性,將過多的不太相關(guān)或者相關(guān)性較低的狀態(tài)參數(shù)輸入模型,影響了預(yù)測模型的故障檢測性能。
近年來,深度學(xué)習(xí)在設(shè)備狀態(tài)檢測領(lǐng)域取得了很好的效果,受到的眾多學(xué)者的關(guān)注。深度學(xué)習(xí)具有強(qiáng)大的特征提取和非線性表達(dá)能力,利用深度學(xué)習(xí)建模能夠準(zhǔn)確的建立多參數(shù)之間的邏輯關(guān)系,提高對設(shè)備狀態(tài)檢測的準(zhǔn)確性。文獻(xiàn)[13]提出了基于平移不變卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)的機(jī)械故障診斷方法,以單點(diǎn)和多點(diǎn)軸承故障為例進(jìn)行診斷,驗(yàn)證了其方法的有效性和優(yōu)越性。文獻(xiàn)[14]基于改進(jìn)多特征提取(variational mode decomposition,VMD)和深度置信網(wǎng)絡(luò)(deep belief networks,DBN)建立了風(fēng)電機(jī)組易損部件早期故障診斷模型,該方法成功提取試驗(yàn)數(shù)據(jù)與風(fēng)電機(jī)組現(xiàn)場數(shù)據(jù)的故障特征并表現(xiàn)出更高的識別準(zhǔn)確性。文獻(xiàn)[15]針對傳統(tǒng)的DBN在行星齒輪箱診斷應(yīng)用上的不足,提出了基于PCA-EDT-DBN的行星齒輪箱故障診斷方法,試驗(yàn)證明所提方法診斷的準(zhǔn)確率更高、性能更穩(wěn)定、訓(xùn)練時間更短。文獻(xiàn)[16]基于長短期記憶網(wǎng)絡(luò)建立了風(fēng)電機(jī)組故障診斷模型,建立了多元時間序列的邏輯關(guān)系,提高了對故障分類的準(zhǔn)確性。文獻(xiàn)[17]設(shè)計(jì)了基于深度自編碼網(wǎng)絡(luò)和XGBoost的故障診斷算法,實(shí)現(xiàn)了對風(fēng)電機(jī)組發(fā)電機(jī)早期故障的捕獲和對不同故障類型的識別。
為了挖掘SCADA數(shù)據(jù)中的有用信息并快速提取特征,及時準(zhǔn)確發(fā)現(xiàn)風(fēng)電機(jī)組的早期潛在故障,本文提出了基于級聯(lián)深度學(xué)習(xí)(CNN-LSTM)的風(fēng)電機(jī)組狀態(tài)檢測方法,通過華北某風(fēng)電場的SCADA數(shù)據(jù)驗(yàn)證了所提方法的有效性。
將深度學(xué)習(xí)引入預(yù)測模型檢測風(fēng)電機(jī)組的運(yùn)行狀態(tài),能夠更快更準(zhǔn)確提取隱藏在SCADA數(shù)據(jù)中的特征。CNN能快速的提取風(fēng)電機(jī)組各個部件之間狀態(tài)的空間特征,但是對于輸入數(shù)據(jù)的順序不敏感,無法提取數(shù)據(jù)的時間特征,通過在CNN層后連接LSTM神經(jīng)網(wǎng)絡(luò)完成時間特征的提取和預(yù)測回歸。
CNN是一種深層前饋網(wǎng)絡(luò),常用于處理多個陣列數(shù)據(jù),例如時間序列、圖像和音頻頻譜圖等[18]。它由卷積層、池化層和完全連接層構(gòu)成,不同種類的層具有不同的功能,卷積層通過卷積核在輸入向量上卷積,生成特征向量。池化層分為最大池化和均值池化,池化層可以減少特征向量和CNN參數(shù)的大小,減少訓(xùn)練時間和內(nèi)存需求,并控制過度擬合。完全連接層用于將輸入轉(zhuǎn)換為向量,并實(shí)現(xiàn)不同任務(wù)。
CNN的本質(zhì)是構(gòu)造多個過濾器,通過對輸入數(shù)據(jù)進(jìn)行逐層卷積和池化操作,提取數(shù)據(jù)間隱藏的空間特征。CNN卷積層原理如圖1所示,在每個時刻,每個卷積核都會將變量1~變量N合并成一個值,該值可視為研究數(shù)據(jù)的空間特征。利用M個卷積核,將輸入數(shù)據(jù)重新編碼成M個空間特征,這些特征隨時間積累,形成時間序列,因而SCADA中的時間特征能夠保存在空間特征中。
圖1 CNN卷積層原理
CNN對輸入數(shù)據(jù)的順序不敏感無法準(zhǔn)確捕捉時間特性[19],因此在CNN層后連接循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)。RNN具有記憶性和參數(shù)共享等特點(diǎn),對于時間序列的特征學(xué)習(xí)具有一定的優(yōu)勢;然而RNN在訓(xùn)練時會出現(xiàn)梯度消失和梯度爆炸的問題,影響模型的預(yù)測結(jié)果,而基于RNN改進(jìn)的LSTM網(wǎng)絡(luò)能夠解決梯度消失和爆炸的問題,所以用LSTM替代RNN。
LSTM模型如圖2所示,LSTM單元的前向傳播可以表示為
圖2 LSTM模型的結(jié)構(gòu)
ft=σ[wf·(ht-1,xt)+bf]
(1)
it=σ[wi·(ht-1,xt)+bi]
(2)
(3)
(4)
ot=σ[Wo(ht-1,xt)+bo]
(5)
ht=ot*Relu(Ct)
(6)
LSTM前向傳播計(jì)算每個單元的輸出值,然后由損失函數(shù)求得誤差。反向傳播時,誤差向上一時刻和上一方向進(jìn)行反向傳播并更新參數(shù)以減小預(yù)測誤差。
本文提出了基于CNN和LSTM,利用SCADA數(shù)據(jù)對風(fēng)電機(jī)組進(jìn)行狀態(tài)檢測的方法。首先利用CNN空間特征的提取,經(jīng)過預(yù)處理的SCADA數(shù)據(jù)被輸入到模型中,CNN提取SCADA數(shù)據(jù)每個時間點(diǎn)空間特征并輸入到下一層,如圖3所示。其次是時間特征的提取,LSTM層提取隱藏在空間特征序列中的時間特征,將時間和空間特征輸入下一層,神經(jīng)網(wǎng)絡(luò)可以對SCADA數(shù)據(jù)序列進(jìn)行非線性變換確定輸入與輸出參數(shù)之間的邏輯關(guān)系。最后,全連通層輸出目標(biāo)參數(shù)的預(yù)測值。計(jì)算預(yù)測值與實(shí)際值之間的殘差,識別出風(fēng)電機(jī)組的運(yùn)行狀態(tài)。
圖3 CNN-LSTM網(wǎng)絡(luò)結(jié)構(gòu)
結(jié)合CNN提取空間特征和LSTM提取時間特征的優(yōu)點(diǎn)建立了CNN-LSTM預(yù)測模型。目標(biāo)參數(shù)為齒輪箱軸承溫度,通過相關(guān)性分析選取與齒輪箱軸承溫度相關(guān)性較大的參數(shù)作為輸入?yún)?shù),建立預(yù)測模型具體步驟如下:
步驟1選取風(fēng)電機(jī)組正常運(yùn)行狀態(tài)下的SCADA數(shù)據(jù)并做預(yù)處理。首先選取風(fēng)電機(jī)組運(yùn)運(yùn)行狀態(tài)正常的數(shù)據(jù)并剔除停機(jī)數(shù)據(jù)以及有功功率小于0的數(shù)據(jù)等無關(guān)的干擾數(shù)據(jù),然后選取與齒輪箱軸承溫度較大的參數(shù)作為輸入?yún)?shù)。
步驟2建立預(yù)測模型。模型主要基于CNN和LSTN搭建,CNN的層數(shù)為1層,CNN卷積核的大小設(shè)置為1,卷積核數(shù)設(shè)置為32。LSTM隱藏層為兩層,每層的隱藏神經(jīng)元數(shù)設(shè)置為128。選擇平均絕對誤差(mean absolute error,MAE)作為損失函數(shù),優(yōu)化器選擇能夠使用自適應(yīng)學(xué)習(xí)率加快模型訓(xùn)練收斂速度的Adam。
步驟3訓(xùn)練預(yù)測模型。將預(yù)處理后的正常運(yùn)行狀態(tài)的SCADA數(shù)據(jù)輸入預(yù)測模型,對CNN-LSTM模型進(jìn)行反復(fù)訓(xùn)練得到輸入?yún)?shù)與目標(biāo)參數(shù)之間的邏輯映射關(guān)系。
異常檢測是在樣本數(shù)據(jù)集中找到與正常數(shù)據(jù)不同的樣本,將需要檢測的數(shù)據(jù)輸入訓(xùn)練好的CNN-LSTM預(yù)測模型并求得預(yù)測值與真實(shí)值的殘差,然后通過分析殘差序列找到與正常運(yùn)行狀態(tài)數(shù)據(jù)不同的樣本,發(fā)現(xiàn)風(fēng)電機(jī)組的異常狀態(tài)。對殘差序列的分析采用SE和RMSE兩項(xiàng)指標(biāo),SE是一種度量時間序列復(fù)雜性的方法,越復(fù)雜的序列對應(yīng)的熵值越大。它與具體機(jī)組的SCADA數(shù)據(jù)無關(guān),因此適用于判斷風(fēng)電機(jī)組的運(yùn)行狀態(tài)。RMSE可以衡量預(yù)測值與真實(shí)值之間的偏差,常用來作為預(yù)測結(jié)果衡量的標(biāo)準(zhǔn),其表達(dá)式為
(7)
式中:xt為真實(shí)值;yt為預(yù)測值。
為了消除預(yù)測結(jié)果的偶然性,綜合RMSE和SE兩個指標(biāo)對風(fēng)電機(jī)運(yùn)行狀態(tài)進(jìn)行檢測,當(dāng)將正常運(yùn)行狀態(tài)的SCADA數(shù)據(jù)輸入預(yù)測模型時,真實(shí)值與預(yù)測值的殘差序列RMSE和SE差別不大。反之,當(dāng)異常運(yùn)行狀態(tài)的SCADA數(shù)據(jù)輸入預(yù)測模型時,數(shù)據(jù)與模型參數(shù)不匹配,誤差很大,RMSE和SE的值都增大。當(dāng)殘差序列的RMSE和SE值均超過設(shè)定的安全閾值時,說明風(fēng)電機(jī)組狀態(tài)異常?;贑NN-LSTM的狀態(tài)檢測流程,如圖4所示。
圖4 基于CNN-LSTM的狀態(tài)檢測流程圖
研究對象為華北某風(fēng)場并網(wǎng)雙饋風(fēng)電機(jī)組,該風(fēng)電機(jī)組切入風(fēng)速4 m/s,切出風(fēng)速為25 m/s。取2015年1月—2015年9月的SCADA監(jiān)測數(shù)據(jù)作為風(fēng)電機(jī)組的狀態(tài)參數(shù)。SCADA數(shù)據(jù)包含44個與風(fēng)電機(jī)組運(yùn)行狀態(tài)相關(guān)的參數(shù),其中主要部件參數(shù)為齒輪箱、發(fā)電機(jī)、電網(wǎng)環(huán)境、機(jī)艙、自然環(huán)境等參數(shù),如表1所示。
表1 風(fēng)電機(jī)組主要部件參數(shù)
風(fēng)電機(jī)組的SCADA系統(tǒng)記錄了設(shè)備壽命周期內(nèi)的所有狀態(tài),包括正常運(yùn)行、故障、停機(jī)、檢修等狀態(tài)。所以需要對SCADA數(shù)據(jù)進(jìn)行預(yù)處理,去除數(shù)據(jù)中的無關(guān)的干擾信息。
首先將SCADA數(shù)據(jù)中顯示異常狀態(tài)的數(shù)據(jù)剔除,然后根據(jù)風(fēng)速和有功功率對SCADA數(shù)據(jù)進(jìn)行處理。由圖5(a)可以看出風(fēng)速范圍集中分布在0~20 m/s,由圖5(b)可以看到有功功率數(shù)據(jù)主要分布在風(fēng)速為4~20 m/s內(nèi),因此篩選出風(fēng)速為4~20 m/s的數(shù)據(jù)。風(fēng)電機(jī)組因停機(jī)等狀態(tài)會記錄一些有功功率為零的數(shù)據(jù),如果將其作為訓(xùn)練數(shù)據(jù)會影響模型訓(xùn)練的精確度,所以數(shù)據(jù)預(yù)處理時刪除有功功率為零的數(shù)據(jù)。
圖5 風(fēng)速和有功功率的分布
風(fēng)電機(jī)組的正常運(yùn)行是通過風(fēng)電機(jī)組的不同部件緊密配合來完成的,部件之間相互耦合以及部件之間的狀態(tài)參數(shù)都會相互影響。如果輸入模型的狀態(tài)參數(shù)過多,會造成信息的冗余,降低模型預(yù)測的準(zhǔn)確性。因此,需要對各部件狀態(tài)參數(shù)進(jìn)行相關(guān)性分析選取輸入狀態(tài)參數(shù)。以齒輪箱軸承溫度作為目標(biāo)參數(shù),采用距離相關(guān)系數(shù)(distance correlation coefficient,DCC)計(jì)算出與其他狀態(tài)參數(shù)的相關(guān)系數(shù),選取DCC>0.5的狀態(tài)參數(shù),獲得的結(jié)果如表2所示。
表2 齒輪箱軸承溫度與其他部件狀態(tài)參數(shù)距離相關(guān)系數(shù)
以風(fēng)電機(jī)組2015年1—4月的正常運(yùn)行的數(shù)據(jù)對上述檢測方法進(jìn)行驗(yàn)證。圖6(a)為1—4月齒輪箱軸承溫度,可知在正常工作狀態(tài)下齒輪箱軸承溫度最高溫度可達(dá)80 ℃左右而最低溫度只10 ℃左右,其幅值變化范圍比較大。通過設(shè)定簡單的閾值判斷風(fēng)電機(jī)組的運(yùn)行狀態(tài)可能出現(xiàn)誤判的情況,需要將風(fēng)電機(jī)組的其他狀態(tài)參數(shù)考慮在內(nèi),進(jìn)行進(jìn)一步的分析,提高檢測的準(zhǔn)確性。
圖6 正常月份齒輪箱軸承溫度和預(yù)測殘差
用CNN-LSTM模型對正常齒輪箱軸承溫度進(jìn)行預(yù)測,此學(xué)習(xí)率設(shè)置為0.001,經(jīng)過多次訓(xùn)練迭代次數(shù)最終確定為1 000,批量數(shù)設(shè)置為100,得到如圖6(b)所示的預(yù)測殘差序列圖。從圖中可知預(yù)測殘差分布在-5 ℃~5 ℃,由于SCADA數(shù)據(jù)存在一些干擾數(shù)據(jù),預(yù)測殘差存在過大的點(diǎn),所以不能根據(jù)突變的殘差(見圖6(b))判斷風(fēng)電機(jī)組運(yùn)行狀態(tài),需要進(jìn)一步采用殘差分析指標(biāo)判定機(jī)組狀態(tài)。
計(jì)算獲得正常齒輪箱軸承溫度的RMSE和SE值,如圖7所示,通過這兩個殘差分析指標(biāo)可以判斷風(fēng)電機(jī)組的運(yùn)行狀態(tài)。RMSE和SE值是以天為單位計(jì)算的,由圖7(a)可知RMSE值主要分布在1.5 ℃以下,由圖7(b)可知SE值主要分布在0.1以下,故設(shè)定RMSE閾值為1.5,SE的閾值為0.1,RMSE和SE的閾值用來判定風(fēng)電機(jī)組的異常狀態(tài)。當(dāng)機(jī)組沒有故障即為正常狀態(tài)時,RMSE和SE都小于設(shè)定的閾值(見圖7)。
圖7 正常狀態(tài)時RMSE和SE值
該風(fēng)電機(jī)組于2015年7月14號發(fā)生齒輪箱故障,風(fēng)電場維修得知該故障是由齒輪磨損嚴(yán)重?cái)帻X造成。取1月—9月SCADA數(shù)據(jù)(共計(jì)219 d)作為研究數(shù)據(jù),其中第1天~第190天的SCADA數(shù)據(jù)為1月1號—7月14號采集的數(shù)據(jù),第191天為停機(jī)維修后9月份重新啟機(jī)后的第1天。剔除該研究數(shù)據(jù)中的異常值、停機(jī)數(shù)據(jù)等無關(guān)干擾數(shù)據(jù)。將處理后的數(shù)據(jù)輸入預(yù)測模型得到預(yù)測值和殘差序列,如圖8所示,因樣本量比較大,只截取第一次檢測到故障時樣本的預(yù)測值、殘差和滑動窗口為100的滑差。通過對預(yù)測殘差序列進(jìn)一步分析得到其RMSE和SE序列。由圖9(a)可知RMSE在開始至第126天都處在設(shè)定閾值1.5 ℃以下,在第127天第一次超過設(shè)定的閾值達(dá)到了1.57 ℃。在第127天~第190天RMSE在設(shè)定閾值范圍上下劇烈波動并且超過閾值較大,在第191天后回落到閾值以下。由圖9(b)可知SE值在第127天以前也保持在設(shè)定閾值以下,在第127天時第一次超過設(shè)定的閾值達(dá)到0.11,在第127天~第190天SE多次超過設(shè)定的閾值,在第191天后回落到閾值以下。第190天(7月14號)左右RMSE和SE均有劇烈變化,這與該風(fēng)電機(jī)組齒輪箱發(fā)生故障在7月14號停機(jī)維修并在9月份重新啟機(jī)是一致的?;贑NN-LSTM模型和SE的檢測方法能夠提前發(fā)現(xiàn)風(fēng)電機(jī)組齒輪箱的潛在故障,對風(fēng)電場工作人員進(jìn)行日常維護(hù)和檢修提供了參考依據(jù),避免造成更大的損失。
圖8 CNN-LSTM預(yù)測模型預(yù)測結(jié)果
圖9 異常狀態(tài)時RMSE和SE值
將LSTM模型、雙向長短期神經(jīng)網(wǎng)絡(luò)(bidirectional long short-term memory,BILSTM)模型與本方法的CNN-LSTM模型進(jìn)行比較,比較結(jié)果如圖10所示。從圖10可以看出CNN-LSTM模型預(yù)測結(jié)果在風(fēng)電機(jī)組運(yùn)行狀態(tài)正常時RMSE和SE幅值波動更小,偶然性的突起更少,在風(fēng)電機(jī)組運(yùn)行狀態(tài)異常時RMSE和SE值相對狀態(tài)正常時變化更加明顯。由圖11可以看出CNN-LSTM模型隨著迭代次數(shù)的增加損失逐漸變小,而BILSTM和LSTM則是在較大損失時即趨于穩(wěn)定,通過比較可以看出本文所提模型的損失更小。計(jì)算三種模型RMSE和SE的平均值,結(jié)果如表3所示,由表3可以看出CNN-LSTM模型的各項(xiàng)評價(jià)指標(biāo)均優(yōu)于其他兩個模型的評價(jià)指標(biāo)。綜上,該模型所建立的輸入?yún)?shù)與目標(biāo)參數(shù)之間的邏輯關(guān)系更加精確可靠,能夠減少誤報(bào)警的次數(shù),證明了基于CNN-LSTM的檢測方法優(yōu)于基于LSTM和BILSTM的檢測方法。
圖10 CNN-LSTM,BILSTM,LSTM模型預(yù)測結(jié)果對比
圖11 CNN-LSTM,BILSTM,LSTM模型損失變化
表3 不同模型預(yù)測結(jié)果對比
針對風(fēng)電機(jī)組因工作環(huán)境復(fù)雜多變齒輪箱故障頻發(fā)的問題,引入深度學(xué)習(xí)理論,利用DCC選取與目標(biāo)參數(shù)齒輪箱軸承溫度密切相關(guān)的狀態(tài)參數(shù),建立了CNN-LSTM狀態(tài)檢測模型,用于識別風(fēng)電機(jī)組的異常運(yùn)行狀態(tài)。當(dāng)風(fēng)電機(jī)組運(yùn)行狀態(tài)異常時,齒輪箱軸承溫度變化偏離正常趨勢,CNN-LSTM模型預(yù)測的殘差的RMSE和SE值均會產(chǎn)生較大的波動,從而監(jiān)測風(fēng)電機(jī)組的異常狀態(tài)。通過華北某風(fēng)場的SCADA數(shù)據(jù)分析,并將所提的CNN-LSTM模型與LSTM和BILSTM模型進(jìn)行比較,結(jié)果表明CNN-LSTM模型的各項(xiàng)評價(jià)指標(biāo)均優(yōu)于其他兩個模型,誤報(bào)警次數(shù)更少;基于級聯(lián)CNN-LSTM模型能夠有效檢測風(fēng)電機(jī)組的異常狀態(tài),對保障風(fēng)電機(jī)組安全運(yùn)行具有重要意義。