孟憲梁,梁 偉,楊 志,馮文新,柯 超,尹立軍
(1. 國電電力新疆新能源開發(fā)有限公司,烏魯木齊 830000;2. 華風(fēng)數(shù)據(jù)(深圳)有限公司,深圳 518110)
由于風(fēng)電機(jī)組長期處于復(fù)雜的工作環(huán)境中,因此開展風(fēng)電機(jī)組故障預(yù)警可以有效降低風(fēng)電機(jī)組的維護(hù)成本,提高風(fēng)電機(jī)組的可用性,進(jìn)而提高風(fēng)力發(fā)電項目的經(jīng)濟(jì)效益。變槳系統(tǒng)是風(fēng)電機(jī)組的關(guān)鍵設(shè)備,其可在不同工況下控制風(fēng)電機(jī)組功率與轉(zhuǎn)速的平衡[1],而變槳系統(tǒng)故障是風(fēng)電機(jī)組故障中最常見的故障之一。
當(dāng)前,針對風(fēng)電機(jī)組變槳系統(tǒng)故障預(yù)警的研究主要集中在對SCADA系統(tǒng)數(shù)據(jù)進(jìn)行分析[2],以及機(jī)器學(xué)習(xí)算法可有效應(yīng)用于風(fēng)電機(jī)組變槳系統(tǒng)的故障預(yù)警這些方面[3]。河北工業(yè)大學(xué)的學(xué)者成功使用SCADA系統(tǒng)數(shù)據(jù)進(jìn)行了變槳系統(tǒng)的狀態(tài)預(yù)測[4];南京理工大學(xué)的學(xué)者利用支持向量機(jī)進(jìn)行機(jī)器學(xué)習(xí),實現(xiàn)了對齒形帶斷裂故障的智能檢測[5];北京交通大學(xué)的田彤彤[6]采用SCADA系統(tǒng)與機(jī)器學(xué)習(xí)算法結(jié)合的方法,針對風(fēng)電機(jī)組變槳系統(tǒng)的狀態(tài)評估與預(yù)測進(jìn)行了研究,為消除風(fēng)電場的環(huán)境隨機(jī)因素對風(fēng)電機(jī)組運行的干擾,其采用滑動時間窗的方法處理模型殘差,并以殘差閾值作為變槳系統(tǒng)狀態(tài)的判斷依據(jù)。上海機(jī)電學(xué)院的梅曉娟[7]研究和分析了變槳系統(tǒng)的SCADA系統(tǒng)數(shù)據(jù),對機(jī)器學(xué)習(xí)算法SVM進(jìn)行了改進(jìn),并將其應(yīng)用于變槳系統(tǒng)的SCADA系統(tǒng)數(shù)據(jù)建模方面。
變槳系統(tǒng)變頻器是變槳系統(tǒng)中故障發(fā)生率最高的部件,為了減少因變槳系統(tǒng)變頻器故障而導(dǎo)致的變槳系統(tǒng)故障,研究變槳系統(tǒng)變頻器的故障預(yù)警十分必要。針對電動變槳系統(tǒng)變頻器的故障預(yù)警,本文提出一種基于機(jī)器學(xué)習(xí)算法與SCADA系統(tǒng)結(jié)合的方法,建立變槳系統(tǒng)變頻器故障預(yù)警模型,并采用滑動時間窗殘差估計方法處理模型溫度殘差,計算得出故障預(yù)警的溫度殘差值閾值,依此判斷變槳系統(tǒng)變頻器的狀態(tài),進(jìn)而評估變槳系統(tǒng)的運行狀態(tài);然后以新疆維吾爾自治區(qū)某風(fēng)電場實際的運行數(shù)據(jù)為例,驗證了該方法對風(fēng)電機(jī)組變槳系統(tǒng)變頻器故障預(yù)警的可行性,從而可為風(fēng)電機(jī)組的檢修提供依據(jù)。
風(fēng)電機(jī)組當(dāng)前的風(fēng)速及電機(jī)轉(zhuǎn)速與其歷史風(fēng)速、電機(jī)轉(zhuǎn)速存在著關(guān)聯(lián)關(guān)系。本研究以北京華電天仁電力控制技術(shù)有限公司生產(chǎn)的電動變槳系統(tǒng)為例,其分別給每個葉片配備單獨的變頻器。根據(jù)風(fēng)電專家和相關(guān)資料的指導(dǎo),選取SCADA系統(tǒng)的相關(guān)變量作為算法的特征變量,將風(fēng)速、轉(zhuǎn)子轉(zhuǎn)速、發(fā)電功率、3個變槳輪轂溫度、3個葉片偏角、3個變槳軸承箱柜溫度、3個變槳電機(jī)溫度、3個變槳電池溫度、3個變槳電機(jī)電流、3個變槳電容溫度,共計24個特征參數(shù)作為機(jī)器學(xué)習(xí)模型輸入?yún)?shù),以各個變槳系統(tǒng)變頻器的溫度作為機(jī)器學(xué)習(xí)模型輸出參數(shù)。使用先進(jìn)的機(jī)器學(xué)習(xí)算法進(jìn)行模型訓(xùn)練,從而對變槳系統(tǒng)變頻器的運行狀態(tài)進(jìn)行預(yù)測,通過與實際的風(fēng)電機(jī)組SCADA系統(tǒng)數(shù)據(jù)進(jìn)行對比,驗證該方法的可行性。
當(dāng)前所有機(jī)器學(xué)習(xí)算法中,Xgboost算法與LightGBM算法為2種熱門的機(jī)器學(xué)習(xí)算法。在很多應(yīng)用中,2種算法都表現(xiàn)出了優(yōu)異的性能。但在風(fēng)電領(lǐng)域,利用LightGBM算法的研究較少,因此,本研究嘗試使用2種算法并進(jìn)行對比分析。
Xgboost算法是組合算法中的提升方法,是一種可擴(kuò)展的強(qiáng)大的機(jī)器學(xué)習(xí)算法,應(yīng)用非常廣泛。LightGBM算法是基于直方圖的決策樹算法,其支持并行學(xué)習(xí),學(xué)習(xí)速度快。
本文提出的故障預(yù)警模型是基于機(jī)器學(xué)習(xí)算法和SCADA系統(tǒng)的風(fēng)電機(jī)組變槳系統(tǒng)變頻器故障預(yù)警模型。該故障預(yù)警模型的邏輯示意圖如圖1所示。
圖1 本故障預(yù)警模型的邏輯示意圖Fig. 1 Logic schematic diagram of fault early warning model proposed in this paper
對于篩選好的特征參數(shù),從SCADA系統(tǒng)中抽取相關(guān)的數(shù)據(jù)輸入機(jī)器學(xué)習(xí)算法中進(jìn)行機(jī)器學(xué)習(xí)模型訓(xùn)練。在故障預(yù)警時,從SCADA系統(tǒng)中抽取相關(guān)的數(shù)據(jù)輸入訓(xùn)練好的機(jī)器學(xué)習(xí)模型,得到變槳系統(tǒng)變頻器的溫度預(yù)測值;另外,從SCADA系統(tǒng)獲取變槳系統(tǒng)變頻器的溫度實際值;以預(yù)測值減去實際值,可得到溫度殘差值;將溫度殘差值與提前計算得到的溫度殘差值閾值(即預(yù)警閾值)進(jìn)行比較,從而可得出當(dāng)前變槳系統(tǒng)狀態(tài)的結(jié)論;為了消除由于風(fēng)電機(jī)組復(fù)雜的工作環(huán)境帶來的隨機(jī)因素對該模型計算結(jié)果的影響,采用滑動時間窗殘差估計方法對溫度殘差值分布進(jìn)行計算和處理。
風(fēng)電場的工程師通過將變槳系統(tǒng)變頻器的實際溫度曲線與由故障預(yù)警模型計算得到的溫度曲線進(jìn)行對比和分析,來判斷變槳系統(tǒng)變頻器的工作是否正常。然而實際的風(fēng)電場環(huán)境復(fù)雜,風(fēng)電機(jī)組工作時會受到多種隨機(jī)因素的干擾,進(jìn)而會影響風(fēng)電機(jī)組變槳系統(tǒng)的工作狀態(tài),導(dǎo)致變槳系統(tǒng)變頻器的實際溫度曲線與由故障預(yù)警模型計算得到的溫度殘差曲線均會受干擾信號的影響,這就為利用變槳系統(tǒng)變頻器故障預(yù)警模型對變槳系統(tǒng)故障進(jìn)行預(yù)測帶來了困難。
滑動時間窗殘差估計方法可以消除上述多種隨機(jī)因素對風(fēng)電機(jī)組的干擾,提高模型的可靠性,并提高預(yù)測的準(zhǔn)確度。因此,本文提出的基于機(jī)器學(xué)習(xí)算法和SCADA系統(tǒng)的風(fēng)電機(jī)組變槳系統(tǒng)變頻器故障預(yù)警模型采用滑動時間窗殘差估計的方法來反映其溫度殘差分布特性的變化。
基于滑動時間窗的預(yù)警閾值的設(shè)定方法(以Xgboost算法為例)具體為:
1)通過計算風(fēng)電機(jī)組變槳系統(tǒng)變頻器溫度的歷史觀測向量Xi與由Xgboost模型得到的回歸預(yù)測向量得到溫度殘差。假設(shè)在某段時間內(nèi),Xgboost模型得到的變槳系統(tǒng)變頻器的溫度殘差ε的序列ε=[ε1,ε2,ε3, …,εN],對該序列取1個寬度為n(n為1個窗口內(nèi)溫度殘差數(shù)據(jù)的數(shù)量)的滑動窗口;對窗口內(nèi)的連續(xù)n個溫度殘差計算溫度殘差均值和溫度殘差標(biāo)準(zhǔn)差Sε,公式為:
式中,i為第i個時間窗;εi為第i個窗口的均值。
殘差滑動窗口的示意圖如圖2所示。
圖2 殘差滑動窗口的示意圖Fig. 2 Schematic diagram of residual sliding window
2)確定溫度殘差均值和溫度殘差標(biāo)準(zhǔn)差的故障預(yù)警閾值,記為EY和SY。假設(shè)風(fēng)電機(jī)組正常工作時故障預(yù)警模型的溫度殘差絕對值的均值的最大值為ET,溫度殘差絕對值的標(biāo)準(zhǔn)差的最大值為ST,則變槳系統(tǒng)變頻器的故障預(yù)警閾值為:
式中,k1和k2均為系數(shù),取值由實際的實驗數(shù)據(jù)計算得到。
為了驗證本文所提出的故障預(yù)警方法的準(zhǔn)確性,選擇新疆維吾爾自治區(qū)某風(fēng)電場中1.5 MW風(fēng)電機(jī)組的SCADA系統(tǒng)歷史數(shù)據(jù)進(jìn)行驗證。數(shù)據(jù)的持續(xù)時間為2017年1月~2019年12月,共計3年的歷史運行數(shù)據(jù),數(shù)據(jù)采集頻率為1 min。經(jīng)過去噪、過濾異常狀況數(shù)據(jù)后,共剩余40萬條數(shù)據(jù),按照8:2的比例將所有數(shù)據(jù)劃分為訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。另外,還選取了包含該風(fēng)電機(jī)組故障運行狀態(tài)的數(shù)據(jù)共計1810條作為故障檢測數(shù)據(jù),這些數(shù)據(jù)取自風(fēng)電機(jī)組發(fā)生故障停機(jī)前30 h的數(shù)據(jù)。
Xgboost模型涉及樹的深度、樹的數(shù)量、葉子節(jié)點、學(xué)習(xí)率等參數(shù)的調(diào)優(yōu)。本文是利用強(qiáng)大的網(wǎng)格搜索的方法尋找潛在最優(yōu)參數(shù)組合,首先通過人為設(shè)定一些參數(shù)組合,從中找尋最佳組合,然后再通過人工微調(diào)該最佳組合中的參數(shù),最終確定最優(yōu)參數(shù)組合。Xgboost模型的最優(yōu)參數(shù)組合如表1所示。
表1 Xgboost模型的最優(yōu)參數(shù)組合Table 1 Optimal parameters combination of Xgboost model
LightGBM模型涉及樹的深度、樹的數(shù)量、葉子數(shù)等參數(shù)的調(diào)優(yōu)。本文經(jīng)過多次參數(shù)調(diào)優(yōu),最終選定相對較優(yōu)的參數(shù),如表2所示。
表2 LightGBM模型的參數(shù)組合Table 2 Parameters combination of LightGBM model
為了評價機(jī)器學(xué)習(xí)回歸模型的準(zhǔn)確度,引入了實際均值(指某段時間內(nèi)變槳系統(tǒng)變頻器溫度的實際值的均值)、預(yù)測均值(指某段時間內(nèi)變槳系統(tǒng)變頻器溫度的預(yù)測值的均值)、均方差(MSE)、平均絕對誤差(MAE)、平均絕對誤差百分比(MAPE)、決定系數(shù)R2共6項評價指標(biāo)。這6項評價指標(biāo)的計算公式分別如式(5)~式(8)所示。
MSE的值越小越好,其公式為:
式中,yi為測試數(shù)據(jù)集的第i號數(shù)據(jù);yi為測試數(shù)據(jù)集第i號數(shù)據(jù)的預(yù)測值。
MAE的值越小越好,其公式為:
MAPE的值也是越小越好,其公式為:
R2的取值在0~1之間,且在此范圍內(nèi)越大越好,其公式為:
在正常運行的40萬條數(shù)據(jù)中,按照8:2的比例選取其中的8萬條數(shù)據(jù)作為測試數(shù)據(jù)集樣本,將這些數(shù)據(jù)分別輸入到Xgboost模型與LightGBM模型,提取模型輸出,然后對比模型輸出與從SCADA系統(tǒng)獲取的變槳系統(tǒng)變頻器溫度的實際輸出。
分別將8萬條測試數(shù)據(jù)集樣本輸入Xgboost模型和LightGBM模型后,計算得到機(jī)器學(xué)習(xí)回歸模型的評價指標(biāo),具體如表3所示。
表3 回歸模型的評價指標(biāo)Table 3 Evaluation index of regression model
從表3可以看出,由Xgboost模型得到的回歸模型的評價指標(biāo)均優(yōu)于由LightGBM模型得到的。因此,本文提出采用Xgboost算法作為風(fēng)電機(jī)組變槳系統(tǒng)變頻器故障預(yù)警模型的機(jī)器學(xué)習(xí)算法。
由式(3)、式(4)可知,確定預(yù)警溫度殘差均值閾值和溫度殘差標(biāo)準(zhǔn)差閾值與滑動時間窗的大小有關(guān)。查閱文獻(xiàn)[8]后,將滑動時間窗的寬度n設(shè)為20,將測試數(shù)據(jù)集樣本輸入模型,通過滑動時間窗殘差估計方法計算得到了滑動時間窗內(nèi)溫度殘差均值最大值ET和溫度殘差標(biāo)準(zhǔn)差最大值ST,結(jié)果如表4所示。
圖3、圖4分別為經(jīng)過滑動時間窗殘差估計方法處理后得到的溫度殘差均值直方圖和溫度殘差標(biāo)準(zhǔn)差直方圖。
表4 測試數(shù)據(jù)集中的滑動時間窗最大值Table 4 Maximum value of sliding time window in test dataset
圖3 滑動時間窗殘差估計方法處理后的溫度殘差均值的分布Fig. 3 Distribution of temperature residual mean value obtained by residual estimation method of sliding time window
圖4 滑動時間窗殘差估計方法處理后的溫度殘差標(biāo)準(zhǔn)差的分布Fig. 4 Distribution of temperature residual standard deviation obtained by residual estimation method of sliding time window
由圖3、圖4可以看出,經(jīng)過滑動時間窗殘差估計方法處理后得到的溫度殘差均值分布和溫度殘差標(biāo)準(zhǔn)差分布均接近高斯分布。由于正常訓(xùn)練數(shù)據(jù)樣本集足夠大,使用3σ原則能夠達(dá)到理想的處理效果。
測試數(shù)據(jù)集的滑動時間窗溫度殘差分布如表5所示。
表5 測試數(shù)據(jù)集的滑動時間窗溫度殘差分布Table 5 Temperature residual distribution of sliding time window in test dataset
根據(jù)3σ原則,結(jié)合式(3)、式(4),可以得到系數(shù)k1的取值為0.7,k2的取值為0.65。因此,EY的取值為0.51,SY的取值為1.35。
將異常運行數(shù)據(jù)輸入故障預(yù)警模型,經(jīng)過滑動時間窗殘差估計方法處理后,得到異常運行數(shù)據(jù)的殘差均值和殘差標(biāo)準(zhǔn)差的分布情況,分別如圖5、圖6所示。圖中,橫實線為預(yù)警閾值線,數(shù)據(jù)間隔時間為1 min。
圖5 滑動窗口殘差估計方法處理后的異常運行數(shù)據(jù)殘差均值分布Fig. 5 Distribution of residual mean value of abnormal data obtained by residual estimation method of sliding time window
圖6 滑動窗口殘差估計方法處理后的異常運行數(shù)據(jù)殘差標(biāo)準(zhǔn)差分布Fig. 6 Distribution of residual standard deviation of abnormal data obtained by residual estimation method of sliding time window
根據(jù)該風(fēng)電場檢修記錄表中的記錄,該風(fēng)電機(jī)組由于變槳系統(tǒng)故障,于2019年9月18日14:29停機(jī)檢修,故障原因是IGBT組件損壞。觀察圖5和圖6可以看出,從第1500號數(shù)據(jù)開始,殘差均值超過了均值預(yù)警閾值,殘差標(biāo)準(zhǔn)差也超過了標(biāo)準(zhǔn)差預(yù)警閾值,可說明變槳系統(tǒng)變頻器將出現(xiàn)故障。由此可以得出,本文提出的基于Xgboost算法和SCADA系統(tǒng)的風(fēng)電機(jī)組變槳系統(tǒng)變頻器的故障預(yù)警方法能在風(fēng)電機(jī)組發(fā)生事故停機(jī)前5 h預(yù)測出變槳系統(tǒng)故障。
本文基于SCADA系統(tǒng),分別應(yīng)用2種機(jī)器學(xué)習(xí)算法Xgboost和LightGBM進(jìn)行了風(fēng)電機(jī)組變槳系統(tǒng)變頻器的故障預(yù)警模型的訓(xùn)練,對2種算法模型的效果進(jìn)行對比后,選取了Xgboost算法作為故障預(yù)警模型的算法;然后結(jié)合滑動時間窗殘差估計方法,分析處理模型的溫度殘差分布,得到了預(yù)警閾值。
故障預(yù)警的意義在于提前發(fā)現(xiàn)、提前處理、將損失最小化,但現(xiàn)行的“響應(yīng)式維護(hù)”和“定期維護(hù)”方式所產(chǎn)生的維護(hù)成本,嚴(yán)重影響了風(fēng)力發(fā)電產(chǎn)業(yè)的經(jīng)濟(jì)效益和技術(shù)進(jìn)步。與其他的故障預(yù)警方法相比,本文提出的基于Xgboost算法和SCADA系統(tǒng)的風(fēng)電機(jī)組變槳系統(tǒng)變頻器的故障預(yù)警方法簡潔、結(jié)果可信,且排除了人為因素的影響,更適用于風(fēng)電機(jī)組變槳系統(tǒng)的故障預(yù)警。