收稿日期:2022-01-01
通信作者:馬良玉(1972—),男,博士、教授,主要從事智能技術(shù)在火電機(jī)組和新能源系統(tǒng)建模、優(yōu)化控制及故障診斷中的應(yīng)用等方面的研究。
maliangyu@ncepu.edu.cn
DOI:10.19912/j.0254-0096.tynxb.2022-0001 文章編號(hào):0254-0096(2023)05-0401-06
摘 要:提出一種基于快速密度峰值聚類(CFSFDP)和LightGBM模型結(jié)合的風(fēng)電機(jī)組異常狀態(tài)監(jiān)測(cè)方法。首先采用CFSFDP算法對(duì)風(fēng)電機(jī)組監(jiān)控與數(shù)據(jù)采集(SCADA)數(shù)據(jù)中的異常工況數(shù)據(jù)與噪聲數(shù)據(jù)進(jìn)行清洗;之后利用貝葉斯優(yōu)化算法搜索LightGBM的最優(yōu)超參數(shù)并建立風(fēng)電機(jī)組正常運(yùn)行工況預(yù)測(cè)模型。針對(duì)風(fēng)速隨機(jī)性的特點(diǎn),利用時(shí)移滑動(dòng)窗口方法構(gòu)建異常狀態(tài)識(shí)別指標(biāo),并結(jié)合核密度估計(jì)法計(jì)算指標(biāo)閾值以實(shí)現(xiàn)異常工況預(yù)警。應(yīng)用某風(fēng)場(chǎng)的真實(shí)歷史故障數(shù)據(jù)進(jìn)行實(shí)驗(yàn),結(jié)果表明LightGBM預(yù)警模型能在故障發(fā)生前對(duì)風(fēng)電機(jī)組的異常工況進(jìn)行及時(shí)正確的預(yù)警,驗(yàn)證了方法的有效性。
關(guān)鍵詞:風(fēng)電機(jī)組;CFSFDP;LightGBM;核密度估計(jì);異常工況;早期預(yù)警
中圖分類號(hào):TK83" " " " " " " " "文獻(xiàn)標(biāo)志碼:A
0 引 言
近年來,風(fēng)能作為一種清潔的可再生能源逐漸受到各國政府的青睞,風(fēng)力發(fā)電成為傳統(tǒng)發(fā)電的一種新的替代方式。截止到2022年底,中國風(fēng)電已累計(jì)裝機(jī)3.65億kW,占全國電源總裝機(jī)容量的14.2%。由于大多數(shù)風(fēng)電機(jī)組安裝在風(fēng)能資源豐富的偏遠(yuǎn)地區(qū),且多為山區(qū)、荒原、海洋等地貌,易受到極端溫差和強(qiáng)風(fēng)的影響,導(dǎo)致其相比于其他機(jī)電設(shè)備存在故障率和維護(hù)成本較高的問題。因此,為確保風(fēng)電機(jī)組安全高效運(yùn)行避免重大財(cái)產(chǎn)損失,對(duì)風(fēng)電機(jī)組進(jìn)行性能評(píng)估、異常工況預(yù)警及早期故障檢測(cè)顯得尤為必要[1]。
數(shù)據(jù)采集與監(jiān)控(superoisory control and data acquisition,SCADA)系統(tǒng)持續(xù)記錄風(fēng)電機(jī)組眾多核心參數(shù)(如溫度、速度、角度、振動(dòng)等)。隨機(jī)組運(yùn)行時(shí)間增加,其龐大的數(shù)據(jù)足以反映機(jī)組不同運(yùn)行狀況,這給運(yùn)用SCADA數(shù)據(jù)進(jìn)行風(fēng)電機(jī)組狀態(tài)監(jiān)測(cè)與故障預(yù)警提供了可能[2]。但是,由于風(fēng)電機(jī)組工作條件多變、受力情況復(fù)雜,使其包含大量的不良數(shù)據(jù)和噪聲數(shù)據(jù),只有清洗掉這些數(shù)據(jù)才能建立準(zhǔn)確的風(fēng)電機(jī)組預(yù)測(cè)模型。在數(shù)據(jù)清洗方面,文獻(xiàn)[3]提出基于變點(diǎn)分組與四分位法相結(jié)合的異常數(shù)據(jù)清洗方法,通過監(jiān)測(cè)風(fēng)速區(qū)間內(nèi)有功功率突變點(diǎn)進(jìn)行清洗;文獻(xiàn)[4]提出一種結(jié)合四分位法與k-均值聚類算法的異常數(shù)據(jù)清洗模型,但k-均值算法為球形數(shù)據(jù)聚類算法,不適用于不規(guī)則高維度的風(fēng)電數(shù)據(jù);文獻(xiàn)[5]提出一種基于具有噪聲的基于密度的聚類算法的(density-based spactial clustering of applications with noise,DBSCAN)清洗方法實(shí)現(xiàn)了對(duì)高維風(fēng)電數(shù)據(jù)的清洗,但該聚類算法的清洗效果依賴于手動(dòng)設(shè)置的聚類中心和聚類半徑。
在故障預(yù)警模型方面,因風(fēng)電機(jī)組各變量相互關(guān)聯(lián)、相互耦合,通過發(fā)掘多個(gè)SCADA變量之間的非線性和時(shí)間依賴性,可顯著提高故障預(yù)警能力[6]。文獻(xiàn)[7]通過廣義回歸網(wǎng)絡(luò)(general regression neural network,GRNN)建立風(fēng)電機(jī)組故障預(yù)警模型實(shí)現(xiàn)了,異常工況識(shí)別,但該方法預(yù)測(cè)性能依賴于平滑參數(shù)的選??;文獻(xiàn)[8]使用自組織映射聚類算法劃分風(fēng)電機(jī)組運(yùn)行工況并通過支持向量機(jī)建立各工況預(yù)警模型以實(shí)現(xiàn)異常狀態(tài)的檢測(cè),但支持向量機(jī)在大樣本數(shù)據(jù)上的表現(xiàn)較差。
針對(duì)目前風(fēng)電數(shù)據(jù)清洗和故障預(yù)警模型方面的不足,本文提出一種基于快速密度峰值聚類(clustering by fast search and find of density peaks,CFSFDP)和LightGBM的故障異常狀態(tài)預(yù)警模型。首先,使用CFSFDP算法對(duì)風(fēng)電機(jī)組運(yùn)行狀態(tài)數(shù)據(jù)進(jìn)行清洗,剔除掉棄風(fēng)限電和噪聲數(shù)據(jù);然后采用貝葉斯優(yōu)化對(duì)LightGBM超參數(shù)進(jìn)行尋優(yōu)以建立具有較高精度的風(fēng)電機(jī)組正常性能預(yù)測(cè)模型。以上述模型為基礎(chǔ),運(yùn)用滑動(dòng)窗口模型構(gòu)建狀態(tài)指標(biāo)并結(jié)合核密度估計(jì)方法計(jì)算預(yù)警閾值以降低異常狀態(tài)預(yù)警的誤報(bào)率;最后采用現(xiàn)場(chǎng)真實(shí)歷史故障數(shù)據(jù)驗(yàn)證所提方法的可行性和有效性。
1 算法分析
1.1 CFSFDP算法
Rodriguez等[9]提出一種適用于非球形數(shù)據(jù)分布的CFSFDP算法,與其他密度聚類算法采用全局密度作為密度衡量尺度的方法不同,該算法采用局部密度作為衡量尺度,可快速、高效地進(jìn)行樣本點(diǎn)分類和離群點(diǎn)剔除。CFSFDP算法建立在兩個(gè)基本假設(shè)的基礎(chǔ)上:
1)聚類中心被具有較低局部密度的鄰居包圍;
2)這些鄰居點(diǎn)與其他密度更高點(diǎn)的中心距離較遠(yuǎn)。
假設(shè)數(shù)據(jù)集為[X=x1,x2,…,xi,…,xn],數(shù)據(jù)點(diǎn)之間的距離采用歐式距離計(jì)算方法。對(duì)于[X]中的每個(gè)數(shù)據(jù)點(diǎn)[xi]都需要計(jì)算局部密度[ρi]以及距離[δi]。這兩個(gè)量的值僅取決于各數(shù)據(jù)點(diǎn)之間的距離。數(shù)據(jù)點(diǎn)[xi]在高斯核(Gaussian kernel)下局部密度[ρi]的定義為:
[ρi=jexp-dijdc2] (1)
式中:[dij]——數(shù)據(jù)點(diǎn)[i]到數(shù)據(jù)點(diǎn)[j]的距離;[dc]——截?cái)嗑嚯x,是計(jì)算局部密度的重要參數(shù),需人工確定。
距離[δi]的計(jì)算公式為:
[δi=minj:ρjgt;ρidij,ρilt;ρjlt;ρmaxmaxjdij,ρi=ρmax] (2)
根據(jù)式(2)可知,若數(shù)據(jù)點(diǎn)[xi]的局部密度非最大值則距離[δi]表示為該點(diǎn)與局部密度比其大的所有點(diǎn)的最小距離;若數(shù)據(jù)點(diǎn)[xi]的局部密度為最大值,則距離[δi]表示為該點(diǎn)與其他數(shù)據(jù)點(diǎn)的最大距離。
計(jì)算樣本點(diǎn)的局部密度和距離,將局部密度和距離去量綱化處理后相乘并按降序排列,結(jié)合變點(diǎn)檢測(cè)方法便可得到各聚類中心。
1.2 LightGBM模型
LightGBM(light gradient boosting machine)[10]是一種以決策樹為基學(xué)習(xí)器的梯度提升模型。通過引進(jìn)降低內(nèi)存占用的直方圖算法和提高訓(xùn)練效率的帶深度限制的葉子生長策略、互斥特征捆綁等創(chuàng)新方法,加快模型在大數(shù)據(jù)訓(xùn)練集下的訓(xùn)練速度[11],訓(xùn)練時(shí)間僅為XG-Boost模型[12]的[110],非常適合處理預(yù)測(cè)問題。
1.2.1 直方圖算法
直方圖算法是先將連續(xù)的浮點(diǎn)特征值數(shù)據(jù)做裝箱處理,即將浮點(diǎn)數(shù)據(jù)區(qū)間映射為離散的整數(shù)值,如將[0,0.3]預(yù)設(shè)為0、[0.3,0.7]預(yù)設(shè)為1。之后對(duì)裝箱處理后的整數(shù)值遍歷并統(tǒng)計(jì)整數(shù)值的分布以尋找最優(yōu)的分割點(diǎn),如圖1所示。直方圖算法通過將浮點(diǎn)型數(shù)據(jù)轉(zhuǎn)化為整數(shù)型,使內(nèi)存消耗降低[18],提高模型訓(xùn)練速度。
1.2.2 帶深度限制的按葉生長策略
傳統(tǒng)GBDT[13]框架使用按層生長的決策樹生長策略,運(yùn)行效率較低。為克服這一缺點(diǎn),LightGBM模型使用按葉生長策略,如圖2所示。每次從當(dāng)前所有葉子中找出分裂增益最大的葉子進(jìn)行分裂,其他葉子不再分裂,如此循環(huán)。同按層生長策略相比,在分裂次數(shù)相同情況下,按葉生長可減少更多誤差,提高模型精度。但按葉生長可能生長出較深的決策樹,產(chǎn)生過擬合。因此,LightGBM在按葉生長之上增加了最大深度(max_depth)這一參數(shù)以限制決策樹的深度,在保證高效率的同時(shí)降低過擬合的風(fēng)險(xiǎn)。
2 LightGBM狀態(tài)預(yù)測(cè)模型
2.1 預(yù)測(cè)模型參數(shù)選取
風(fēng)電機(jī)組SCADA系統(tǒng)中記錄溫度、角度、速度、振動(dòng)、電氣等百余個(gè)信號(hào)參數(shù)。本文旨在發(fā)掘風(fēng)電機(jī)組運(yùn)行參數(shù)之間的潛在關(guān)系以判定各子系統(tǒng)是否處于異常工作狀態(tài),因此對(duì)溫度、振動(dòng)等參數(shù)不予考慮。風(fēng)電機(jī)組的發(fā)電機(jī)轉(zhuǎn)速和有功功率是表征機(jī)組是否處于正常工況狀態(tài)的重要依據(jù),故將其作為模型輸出進(jìn)行狀態(tài)監(jiān)測(cè)。依據(jù)風(fēng)電機(jī)組工作原理,選取7個(gè)與模型輸出密切相關(guān)的SCADA變量作為預(yù)測(cè)模型輸入變量,輸入?yún)?shù)有發(fā)電機(jī)組扭矩(設(shè)定值,單位為N·m)、風(fēng)速(m/s)、風(fēng)向([°])、機(jī)艙中軸線與風(fēng)向夾角([°])、槳距角(設(shè)定值,([°])),輸出參數(shù)有發(fā)電機(jī)有功功率(kW)、發(fā)電機(jī)轉(zhuǎn)速([r/min])。
2.2 SCADA數(shù)據(jù)清洗
本文使用某1.5 MW風(fēng)電機(jī)組2018年1—3月份的SCADA歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與建模實(shí)驗(yàn)。首先對(duì)原始數(shù)據(jù)進(jìn)行初篩:1)剔除含有空值的數(shù)據(jù);2)剔除切入風(fēng)速(風(fēng)速≤3 [ms])以下的數(shù)據(jù);3)剔除停機(jī)狀態(tài)(有功功率≤0 kW)的數(shù)據(jù)。使用初篩后的數(shù)據(jù)繪制風(fēng)速-發(fā)電機(jī)轉(zhuǎn)速-有功功率三維曲線,如圖3a所示。初篩后的數(shù)據(jù)中含有棄風(fēng)限電數(shù)據(jù)和較多的噪聲數(shù)據(jù)。若不清洗掉這些數(shù)據(jù)直接使用會(huì)使預(yù)測(cè)模型發(fā)生畸變,從而影響模型對(duì)機(jī)組運(yùn)行狀態(tài)和運(yùn)行特性的分析結(jié)果。根據(jù)聚類算法思想,風(fēng)電數(shù)據(jù)可看成由兩個(gè)大簇(正常工況出力簇、棄風(fēng)限電出力簇)和離群點(diǎn)構(gòu)成的若干個(gè)小簇組成。使用CFSFDP聚類算法將棄風(fēng)限電出力簇和離群小簇識(shí)別并清洗掉便能得到風(fēng)電機(jī)組正常運(yùn)行時(shí)的數(shù)據(jù)。聚類清洗后的結(jié)果如圖3b所示。CFSFDP聚類算法可有效識(shí)別限功率數(shù)據(jù)和噪聲數(shù)據(jù)。
2.3 風(fēng)電機(jī)組預(yù)測(cè)模型建立
LightGBM模型超參數(shù)較多,這使得對(duì)模型進(jìn)行手動(dòng)調(diào)參比較困難。為了獲得較為理想的模型參數(shù),本文基于貝葉斯優(yōu)化算法對(duì)LightGBM主要超參數(shù)進(jìn)行調(diào)參。LightGBM為單輸出模型,為使模型同時(shí)預(yù)測(cè)轉(zhuǎn)速與功率,需引入SKlearn包中的混合輸出模型(multioutput-regressor)。按表1所示設(shè)置輸入輸出參數(shù),選取3萬組正常工況下的數(shù)據(jù)進(jìn)行建模預(yù)測(cè),訓(xùn)練集和測(cè)試集的比例為7∶3。以模型輸出的平均絕對(duì)誤差(MAE)作為目標(biāo)函數(shù)對(duì)主要超參數(shù)進(jìn)行尋優(yōu)。尋優(yōu)結(jié)果為:學(xué)習(xí)率0.055,決策樹數(shù)量258,樹最大深度9,葉子數(shù)77。參數(shù)尋優(yōu)后,測(cè)試集測(cè)試結(jié)果(部分)如圖4所示。
為驗(yàn)證模型的優(yōu)越性,將文中所提模型與同樣進(jìn)行過超參數(shù)優(yōu)化的其他機(jī)器學(xué)習(xí)模型回歸性能進(jìn)行比較。其中,支持向量機(jī)(SVM)模型正則化參數(shù)設(shè)置為8;隨機(jī)森林(RF)模型最大深度和迭代次數(shù)設(shè)置為13、262;梯度提升樹(GBDT)模型學(xué)習(xí)率、最大深度和迭代次數(shù)設(shè)置為0.052、6、299。對(duì)比結(jié)果如表1所示。
經(jīng)對(duì)比,從評(píng)價(jià)指標(biāo)來看,LightGBM模型和GBDT模型表現(xiàn)較好,SVM模型和RF模型表現(xiàn)較差;從訓(xùn)練時(shí)間來看,LightGBM模型表現(xiàn)明顯優(yōu)于其他機(jī)器學(xué)習(xí)模型。綜合考慮模型精度和計(jì)算速度,LightGBM具有明顯的優(yōu)越性,模型精度滿足工程應(yīng)用要求。
3 基于滑動(dòng)窗口的狀態(tài)預(yù)警指標(biāo)
3.1 滑動(dòng)窗口模型
將LightGBM狀態(tài)預(yù)測(cè)模型輸出的預(yù)測(cè)值與實(shí)際值之間的絕對(duì)誤差作為評(píng)價(jià)指標(biāo)。當(dāng)機(jī)組處于正常工況時(shí)評(píng)價(jià)指標(biāo)較??;若機(jī)組處于異常工況,如影響機(jī)組發(fā)電性能的設(shè)備發(fā)生故障、傳感器測(cè)量參數(shù)異常、保護(hù)系統(tǒng)動(dòng)作等,評(píng)價(jià)指標(biāo)將會(huì)顯著增大,可以此作為判斷風(fēng)電機(jī)組處于異常狀態(tài)的依據(jù)。但由于風(fēng)速、風(fēng)向具有隨機(jī)性使得風(fēng)電機(jī)組調(diào)控系統(tǒng)始終處于動(dòng)態(tài)過程,增大了單一時(shí)刻評(píng)價(jià)指標(biāo)的誤報(bào)概率。為此,引入時(shí)移滑動(dòng)窗口模型,通過計(jì)算窗口內(nèi)絕對(duì)誤差的平均值起到濾波作用,從而降低因變量的隨機(jī)性而導(dǎo)致模型誤報(bào)的概率[14]。
假定原始數(shù)據(jù)集[X]是含有[n]個(gè)按時(shí)間序列排列的數(shù)據(jù),其時(shí)間序列構(gòu)造為[Xn=x1,x2,…,xt,…,xn]。[xi]代表數(shù)據(jù)集[X]在第[t]時(shí)刻的檢測(cè)值。設(shè)當(dāng)前時(shí)刻為[t],則評(píng)價(jià)指標(biāo)在[t]時(shí)刻的窗口可表示為[Xt=xt-q+1,…,xt-1,xt],[t]時(shí)刻的下一窗口為[Xt+h=xt+h-q+1,…,xt+h-1,xt+h],其中,[q]為滑動(dòng)窗口大小,[h]為窗口增量。滑動(dòng)窗口模型如圖5所示。
3.2 狀態(tài)指標(biāo)閾值確定
基于上述滑動(dòng)窗口模型,在[t]時(shí)刻,窗口中將會(huì)有[q]組數(shù)據(jù),可通過這些數(shù)據(jù)計(jì)算出預(yù)測(cè)值和實(shí)際值的平均絕對(duì)誤差(MAE)作為預(yù)測(cè)模型的狀態(tài)指標(biāo),其表達(dá)式為:
[Ct=1qm=1qVpm-Vam] (3)
式中:[Vpm、][Vam]——窗口內(nèi)第m組的參數(shù)的預(yù)測(cè)值和實(shí)際值。
當(dāng)機(jī)組處于故障發(fā)展階段時(shí),狀態(tài)指標(biāo)將處于顯著上升的狀態(tài),因此可通過設(shè)置告警閾值來判定機(jī)組是否處于異常狀態(tài)。閾值的大小直接影響模型的預(yù)警效果,過大會(huì)導(dǎo)致漏報(bào),過小則會(huì)增加誤報(bào)概率。本文使用統(tǒng)計(jì)學(xué)方法對(duì)告警閾值進(jìn)行設(shè)置,因狀態(tài)指標(biāo)的分布函數(shù)未知,故采取非參數(shù)核密度估計(jì)(kernel density estimation,KDE)方法[15]。假設(shè)機(jī)組正常運(yùn)行時(shí)狀態(tài)指標(biāo)的概率密度函數(shù)為[ftC],則在[t]時(shí)刻狀態(tài)指標(biāo)[C]的概率密度函數(shù)可表示為:
[ftC=1ndi=1nKC-Cid] (4)
式中:[n]——時(shí)間序列[t]下的樣本數(shù)目;[d]——帶寬;[Ci]——第[i]時(shí)刻的狀態(tài)指標(biāo);[K" "]——核函數(shù)。
本文采用高斯核作為非參數(shù)核密度估計(jì)的核函數(shù),其計(jì)算公式為:
[Kx=12πe-x22] (5)
設(shè)置合適的窗口大小和窗口增量,根據(jù)式(3)計(jì)算正常工況下的狀態(tài)識(shí)別指標(biāo)并進(jìn)行非參數(shù)核密度估計(jì)。為降低誤報(bào)率,以累積概率99.8%為界設(shè)置閾值,經(jīng)計(jì)算有功功率和發(fā)電機(jī)轉(zhuǎn)速的閾值分別為53.18 kW和45.84 [rmin]。
4 實(shí)例分析
為驗(yàn)證預(yù)測(cè)狀態(tài)預(yù)警方法的有效性,選取上述風(fēng)電場(chǎng)同型號(hào)1.5 MW風(fēng)電機(jī)組SCADA歷史數(shù)據(jù)進(jìn)行測(cè)試。因預(yù)測(cè)模型建立在正常工況的基礎(chǔ)上,故需將測(cè)試數(shù)據(jù)中的停機(jī)狀態(tài)數(shù)據(jù)清洗掉以保證預(yù)警模型的準(zhǔn)確性。通過實(shí)驗(yàn)對(duì)比,滑動(dòng)窗口大小設(shè)置為10,即每個(gè)窗口包含10 min的歷史數(shù)據(jù);窗口增量設(shè)置為1,即每分鐘滑動(dòng)一次。
4.1 故障預(yù)警案例一
查詢風(fēng)電場(chǎng)首發(fā)故障記錄表,某機(jī)組于2018年9月6日07:05發(fā)出“PCH的振動(dòng)過大繼電器斷開導(dǎo)致安全鏈斷開”故障信息。以2018年9月6日00:00為起點(diǎn),故障時(shí)間為終點(diǎn)提取數(shù)據(jù)進(jìn)行實(shí)驗(yàn),預(yù)測(cè)模型輸出與狀態(tài)指標(biāo)變化情況(部分)如圖6所示。
根據(jù)圖6可看出,大約在第38個(gè)窗口,發(fā)電機(jī)轉(zhuǎn)速和有功功率狀態(tài)指標(biāo)均超過設(shè)定閾值發(fā)出報(bào)警信息,此時(shí)程序提示時(shí)間為2018年9月6日06:19,比故障發(fā)生時(shí)間提前46 min,表明本文預(yù)警方法可以實(shí)現(xiàn)對(duì)異常工況提前預(yù)警。
4.2 故障預(yù)警案例二
以某機(jī)組2018年1月28日00:00為起點(diǎn)進(jìn)行預(yù)警實(shí)驗(yàn),模型于2018年1月28日08:42發(fā)出故障告警信息,預(yù)測(cè)模型輸出與狀態(tài)指標(biāo)變化情況(部分)如圖7所示。經(jīng)查閱,機(jī)組于2018年1月28日11:55出現(xiàn)“主控沒有收到變槳EFC反饋信號(hào)”的故障記錄,模型預(yù)警信息比故障發(fā)出時(shí)間提前約3 h,進(jìn)一步驗(yàn)證了預(yù)測(cè)方法的可行性。
5 結(jié) 論
針對(duì)風(fēng)電機(jī)組SCADA原始數(shù)據(jù)為高維數(shù)據(jù)且含有較多異常工況和噪聲數(shù)據(jù)的問題,采用CFSFDP聚類算法對(duì)數(shù)據(jù)進(jìn)行清洗,該方法可有效剔除不能反映機(jī)組特性的異常數(shù)據(jù)。利用清洗后的數(shù)據(jù)建立了基于LightGBM的正常工況性能預(yù)測(cè)模型,并基于貝葉斯優(yōu)化算法對(duì)模型超參數(shù)進(jìn)行優(yōu)化。通過與其他機(jī)器學(xué)習(xí)模型對(duì)比,證實(shí)LightGBM模型在訓(xùn)練時(shí)間和訓(xùn)練精度上的優(yōu)越性。建立滑動(dòng)窗口模型用于計(jì)算故障預(yù)警指標(biāo)。以該模型為基礎(chǔ),采用滑動(dòng)窗方法構(gòu)建故障預(yù)警指標(biāo)。以窗口內(nèi)的平均絕對(duì)誤差作為預(yù)警指標(biāo),采用核密度估計(jì)法計(jì)算預(yù)警指標(biāo)的閾值,可有效降低預(yù)警模型的誤報(bào)率。通過現(xiàn)場(chǎng)真實(shí)的歷史故障實(shí)例數(shù)據(jù)進(jìn)行驗(yàn)證,表明使用該方法可做到對(duì)風(fēng)電機(jī)組異常工況進(jìn)行提前預(yù)警,有助于運(yùn)維人員及早發(fā)現(xiàn)和處理故障,提高風(fēng)電機(jī)組運(yùn)行的可靠性。
[參考文獻(xiàn)]
[1] SHI Y L, LIU Y R, GAO X. Study of wind turbine fault diagnosis" and" early" warning" based" on" SCADA" data[J]. IEEE access, 2021: 124600-124615.
[2] 金曉航, 許壯偉, 孫毅, 等. 基于SCADA數(shù)據(jù)分析和稀疏自編碼神經(jīng)網(wǎng)絡(luò)的風(fēng)電機(jī)組在線運(yùn)行狀態(tài)監(jiān)測(cè)[J]. 太陽能學(xué)報(bào), 2021, 42(6): 321-328.
JIN X H, XU Z W, SUN Y, et al. Online condition monitoring for wind turbines based on SCADA data analysis and sparse auto-encoder neural network[J]. Acta energiae solaris sinice, 2021, 42(6): 321-328.
[3] 沈小軍, 付雪姣, 周沖成, 等. 風(fēng)電機(jī)組風(fēng)速-功率異常運(yùn)行數(shù)據(jù)特征及清洗方法[J]. 電工技術(shù)學(xué)報(bào), 2018, 33(14): 3353-3361.
SHEN X J, FU X J, ZHOU C C, et al. Characteristics of outliers in wind speed-power operation data of wind turbines and its cleaning method[J]. Transactions of China Electrotechnical Society, 2018, 33(14): 3353-3361.
[4] 趙永寧, 葉林, 朱倩雯. 風(fēng)電場(chǎng)棄風(fēng)異常數(shù)據(jù)簇的特征及處理方法[J]. 電力系統(tǒng)自動(dòng)化, 2014, 38(21): 39-46.
ZHAO Y N, YE L, ZHU Q W. Characteristics and processing method of abnormal data clusters caused by wind curtailments in wind farms[J]. Automation of electric power systems, 2014, 38(21): 39-46.
[5] 馬良玉, 孫佳明, 於世磊, 等. 基于DBSCAN和SDAE的風(fēng)電機(jī)組異常工況預(yù)警研究[J]. 動(dòng)力工程學(xué)報(bào), 2021, 41(9): 786-793.
MA L Y, SUN J M, YU S L, et al. DBSCAN and SDAE-based abnormal condition early warning for a wind turbine unit[J]. Journal of Chinese Society of Power Engineering, 2021, 41(9): 786-793.
[6] 趙洪山, 閆西慧, 王桂蘭, 等. 應(yīng)用深度自編碼網(wǎng)絡(luò)和XG-Boost的風(fēng)電機(jī)組發(fā)電機(jī)故障診斷[J]. 電力系統(tǒng)自動(dòng)化, 2019, 43(1): 81-86.
ZHAO H S, YAN X H, WANG G L, et al. Fault diagnosis of wind turbine generator based on deep autoencoder network" and" XGBoost[J]." Automation" of" electric" power systems, 2019, 43(1): 81-86.
[7] 崔愷, 許宜菲, 李雪松, 等. 基于廣義回歸神經(jīng)網(wǎng)絡(luò)的風(fēng)電機(jī)組性能預(yù)測(cè)模型及狀態(tài)預(yù)警[J]. 科學(xué)技術(shù)與工程, 2020, 20(32): 13220-13228.
CUI K, XU Y F, LI X S, et al. Wind turbine performance prediction model and early warning of abnormal condition based on GRNN[J]. Science technology and engineering, 2020, 20(32): 13220-13228.
[8] 睦浩淼. 基于支持向量機(jī)回歸的風(fēng)電機(jī)組運(yùn)行狀態(tài)異常檢測(cè)方法研究[D]. 成都: 西南交通大學(xué), 2018.
MU H M. Research on abnormality detection method of wind turbine operating state based on support vector machine" "regression[D]." Chengdu:" "Southwest" "Jiaotong University, 2018.
[9] RODRIGUEZ A, LAIO A. Clustering by fast search and find of density peaks[J]. Science, 2014, 344(6191): 1492-1496.
[10] GUO L K, QI M, FINLEY T, et al. LightGBM: a highly efficient gradient boosting decision tree[C]//Proceedings of the 2017 Advances in Neural Information Processing Systems, California: NIPS, 2017: 3146-3154.
[11] 顏詩旋, 朱平, 劉釗. 基于改進(jìn)LightGBM模型的汽車故障預(yù)測(cè)方法研究[J]. 汽車工程, 2020, 42(6): 815-819.
YAN S X, ZHU P, LIU Z. Research on vehicle fault prediction scheme based on improved LightGBM model[J]. Automotive engineering, 2020, 42(6): 815-819.
[12] CHEN T, GUESTRIN C. Xgboost: a scalable tree boosting system[C]//Proceedings of the 22nd ACM Sigkdd International Conference on Knowledge Discovery and Data Mining, San Francisco, California, USA, 2016: 785-794.
[13] FRIEDMAN J H. Greedy function approximation: a gradient boosting machine[J]. Annals of statistics, 2001, 29(5): 1189-1232.
[14] 張帆, 劉德順, 戴巨川, 等. 一種基于SCADA參數(shù)關(guān)系的風(fēng)電機(jī)組運(yùn)行狀態(tài)識(shí)別方法[J]. 機(jī)械工程學(xué)報(bào), 2019, 55(4): 1-9.
ZHANG F, LIU D S, DAI J C, et al. An operating condition recognition method of wind turbine based on SCADA" parameter" relations[J]." Journal" of" mechanical engineering, 2019, 55(4): 1-9.
[15] 楊楠, 周崢, 陳道君, 等. 基于非參數(shù)核密度估計(jì)的風(fēng)功率波動(dòng)性概率密度建模方法[J]. 太陽能學(xué)報(bào), 2019, 40(7): 2028-2035.
YANG N, ZHOU Z, CHEN D J, et al. Research of modeling method based on non-parametric kernel density estimation" of" probability" of" wind" power" fluctuations[J]. Acta energiae solaris sinice, 2019, 40(7): 2028-2035.
RESEARCH ON ABNORMAL CONDITION EARLY WARNING
FOR WIND TURBINE BASED ON CFSFDP AND LIGHTGBM
Ma Liangyu,Yuan Naizheng
(Department of Automation, North China Electric Power University, Baoding 071003, China)
Abstract:A combination of clustering by fast search and find of density peaks(CFSFDP) and light gradient boosting machine(LightGBM) method is proposed for wind turbine abnormal condition monitoring. Firstly, the CFSFDP algorithm is employed to clean the abnormal condition data and noise data in the supervisory control and data acquisition system(SCADA). Secondly, by using Bayesian optimization algorithm to search the optimal hyper-parameters of LightGBM, a LightGBM prediction model of wind turbine normal operation condition is established. Aiming at the randomness of wind speed, the time shift sliding window method is adopted to construct the abnormal state identification index and the kernel density estimation is employed to determine its threshold value. Finally, the actual historical faults data of a wind farm are used for experimental verification. The results show the LightGBM_model based early warning approach can warn the abnormal operation conditions of wind turbine timely before a fault occurs.
Keywords:wind turbines; CFSFDP; LightGBM; kernel density estimation; abnormal operating condition; early warning