劉博嵩,郭 鵬,雷 萌
(華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院,北京 102206)
近年來,風(fēng)力發(fā)電規(guī)模在我國(guó)迅速增長(zhǎng)[1]。風(fēng)電機(jī)組 SCADA運(yùn)行數(shù)據(jù)可以用來評(píng)估機(jī)組發(fā)電性能和健康狀態(tài)[2-4]。建立風(fēng)電機(jī)組健康劣化監(jiān)測(cè)系統(tǒng),實(shí)時(shí)分析 SCADA運(yùn)行數(shù)據(jù),及時(shí)發(fā)現(xiàn)風(fēng)電機(jī)組健康劣化,對(duì)保障機(jī)組安全、提高發(fā)電量有重要意義。
風(fēng)電機(jī)組運(yùn)行狀態(tài)隨風(fēng)速時(shí)變,其異常數(shù)據(jù)類型復(fù)雜,所以對(duì)風(fēng)電機(jī)組進(jìn)行健康劣化監(jiān)測(cè)具有一定難度。文獻(xiàn)[5]采用隨機(jī)森林的袋外估計(jì)進(jìn)行特征選擇,使用XGBoost算法搭建風(fēng)電機(jī)組故障分類模型,取得了較好的效果。文獻(xiàn)[6]使用深度全連接神經(jīng)網(wǎng)絡(luò)構(gòu)建分類模型,以判斷葉片結(jié)冰狀態(tài);但由于風(fēng)電機(jī)組故障類型繁多,不同故障的數(shù)據(jù)特征各不相同,所以模型訓(xùn)練集很難包含所有種類故障數(shù)據(jù)的全部特征。因此,使用分類模型對(duì)機(jī)組健康狀態(tài)進(jìn)行監(jiān)測(cè)具有一定缺陷。文獻(xiàn)[7]利用機(jī)組正常運(yùn)行數(shù)據(jù)建立了馬氏(Mahalanobis)參考空間,通過比較模型預(yù)測(cè)值與參考空間的相對(duì)關(guān)系來監(jiān)測(cè)機(jī)組運(yùn)行情況。此方法只能判斷單個(gè)運(yùn)行數(shù)據(jù)的異常狀態(tài),未引入時(shí)間尺度對(duì)風(fēng)電機(jī)組健康劣化情況進(jìn)行整體判斷。文獻(xiàn)[8]采用偏最小二乘法建立功率曲線模型,應(yīng)用模糊綜合評(píng)價(jià)指數(shù)對(duì)機(jī)組每日發(fā)電性能進(jìn)行評(píng)價(jià);但其以“日”為單位的發(fā)電性能評(píng)價(jià)實(shí)時(shí)性較差。文獻(xiàn)[9]分別采用線性和威布爾分布模型建立了風(fēng)電機(jī)組功率曲線模型,在監(jiān)測(cè)階段采用控制圖和殘差分析方法對(duì)發(fā)電性能異常進(jìn)行檢測(cè);但使用該方法需大量異常數(shù)據(jù)才能使線性或威布爾分布指標(biāo)產(chǎn)生明顯異常變化,實(shí)時(shí)性一般。文獻(xiàn)[10]采用高斯過程監(jiān)督學(xué)習(xí)建立多變量功率曲線模型,使用序貫概率比檢驗(yàn)(SPRT)分析模型預(yù)測(cè)殘差,并對(duì)發(fā)電性能劣化進(jìn)行監(jiān)測(cè)預(yù)警。文獻(xiàn)[11]采用兩步法對(duì)風(fēng)電機(jī)組發(fā)電性能進(jìn)行監(jiān)測(cè):第一步,針對(duì)風(fēng)電機(jī)組歷史數(shù)據(jù)采用極限學(xué)習(xí)機(jī)建立發(fā)電性能基準(zhǔn)模型并對(duì)待監(jiān)測(cè)數(shù)據(jù)進(jìn)行功率預(yù)測(cè)。第二步,使用風(fēng)速與預(yù)測(cè)功率2變量建立Copula相關(guān)模型,采用Copula模型參數(shù)作為衡量發(fā)電性能的指標(biāo)。文獻(xiàn)[10,11]所述方法受風(fēng)電機(jī)組數(shù)據(jù)質(zhì)量影響較大,實(shí)際應(yīng)用時(shí)需設(shè)計(jì)前置算法對(duì)原始 SCADA數(shù)據(jù)中的正常數(shù)據(jù)進(jìn)行提取。
文獻(xiàn)[12]對(duì)比了 4種異常值檢測(cè)算法對(duì)風(fēng)電機(jī)組數(shù)據(jù)的識(shí)別效果。實(shí)驗(yàn)表明,相比于其他算法,孤立森林算法具有更高的精度。孤立森林算法可以判斷每一數(shù)據(jù)點(diǎn)的孤立情況,無需前置算法即可實(shí)現(xiàn)風(fēng)電機(jī)組正常數(shù)據(jù)提取并判斷實(shí)時(shí)運(yùn)行數(shù)據(jù)的健康劣化程度。但是,文中孤立森林算法對(duì)高密度異常數(shù)據(jù)識(shí)別的效率還有待提高。為解決此問題,本文設(shè)計(jì)一種基于孤立森林的MKIF算法,并將其與滑動(dòng)窗口算法相結(jié)合,建立MKIF健康劣化監(jiān)測(cè)預(yù)警模型,實(shí)現(xiàn)風(fēng)電機(jī)組實(shí)時(shí)工作狀態(tài)評(píng)估。
本文的實(shí)驗(yàn)機(jī)組為某風(fēng)電場(chǎng)編號(hào)為 E17的1.5 MW變槳變速機(jī)組。機(jī)組SCADA系統(tǒng)以10 min為間隔,記錄重要傳感器測(cè)量數(shù)據(jù)。運(yùn)行數(shù)據(jù)中,風(fēng)速-功率特征最能反映機(jī)組的工作狀態(tài)。將每一條運(yùn)行數(shù)據(jù)中的風(fēng)速和功率構(gòu)成一個(gè)數(shù)據(jù)對(duì),于是形成風(fēng)速-功率坐標(biāo)系下的一個(gè)功率散點(diǎn)。E17機(jī)組2019年1月至4月共產(chǎn)生16 335條運(yùn)行數(shù)據(jù),功率散點(diǎn)分布情況如圖1所示。
圖1 E17機(jī)組數(shù)據(jù)分布情況Fig. 1 Data distribution of E17 unit
風(fēng)電機(jī)組功率散點(diǎn)分布特征如下:
(1)風(fēng)電機(jī)組正常運(yùn)行數(shù)據(jù)散點(diǎn)密集分布,構(gòu)成“功率主帶”。額定風(fēng)速以下,機(jī)組處于最大風(fēng)能追蹤階段,風(fēng)速和功率特征呈現(xiàn)三次方關(guān)系。在額定風(fēng)速以上,機(jī)組調(diào)節(jié)槳距角大小控制輸出功率在額定值附近變化。功率主帶呈現(xiàn)水平分布。在實(shí)際應(yīng)用中,可以直接將輸出功率大于等于額定功率的數(shù)據(jù)標(biāo)記為正常值。
(2)異常功率點(diǎn)類型。①底部堆積數(shù)據(jù)。風(fēng)電機(jī)組停機(jī)檢修或風(fēng)速低于切入風(fēng)速時(shí),機(jī)組理論輸出功率為零。如果數(shù)據(jù)表現(xiàn)為“大量異常數(shù)據(jù)圍繞功率零值附近密集分布”,可將其直接去除。②欠發(fā)異常數(shù)據(jù):風(fēng)電機(jī)組老化、葉片受損、葉片結(jié)冰等問題會(huì)造成機(jī)組發(fā)電性能劣化,產(chǎn)生欠發(fā)異常數(shù)據(jù)。與功率主帶中正常數(shù)據(jù)相比,欠發(fā)異常點(diǎn)在同風(fēng)速下發(fā)出的有功功率明顯偏小,分布在功率主帶右側(cè)。③限負(fù)荷異常數(shù)據(jù):當(dāng)機(jī)組因電網(wǎng)調(diào)度需求人為限功率或因部分部件溫度異常自動(dòng)限功率時(shí),風(fēng)電機(jī)組會(huì)提前變槳,并將實(shí)發(fā)有功功率限制在一個(gè)較低的設(shè)定值附近。限負(fù)荷異常數(shù)據(jù)位于功率主帶右側(cè),呈水平分布,通常密度較高且槳距角不為零。④傳感器故障異常數(shù)據(jù):持續(xù)的傳感器故障會(huì)產(chǎn)生大量密集分布的異常點(diǎn)。風(fēng)速計(jì)異常數(shù)據(jù)密度較高,且數(shù)據(jù)中槳距角變量與正常數(shù)據(jù)無異、異常特征不明顯,識(shí)別難度較大。
MKIF風(fēng)電機(jī)組健康劣化監(jiān)測(cè)預(yù)警模型如圖2所示,分為建立健康基準(zhǔn)模型和在線健康評(píng)估2部分。
圖2 MKIF風(fēng)電機(jī)組健康劣化監(jiān)測(cè)預(yù)警模型Fig. 2 MKIF wind turbine health deterioration monitoring and early warning model
(1)建立健康基準(zhǔn)模型:考慮功率散點(diǎn)的總體分布特性,設(shè)計(jì)一種基于孤立森林的MKIF算法。該算法使用小批量K均值聚類確定MKIF搜索樹分裂節(jié)點(diǎn)的數(shù)量和位置,并定義MKIF異常得分以判斷數(shù)據(jù)的異常程度。MKIF算法不需對(duì)原始數(shù)據(jù)進(jìn)行區(qū)間劃分,可以通過綜合距離和密度特征,依照功率散點(diǎn)的總體分布形狀識(shí)別出全局稀疏點(diǎn),進(jìn)而提取出風(fēng)電機(jī)組功率主帶并生成拒絕閾值。功率主帶和拒絕閾值構(gòu)成了風(fēng)電機(jī)組健康基準(zhǔn)模型。
(2)在線健康評(píng)估:在監(jiān)測(cè)階段,使用MKIF算法將實(shí)時(shí)待監(jiān)測(cè)數(shù)據(jù)與功率主帶數(shù)據(jù)相比較,使用MKIF異常得分評(píng)判每一條實(shí)時(shí)數(shù)據(jù)偏離功率主帶的程度。當(dāng)實(shí)時(shí)數(shù)據(jù)異常得分大于基準(zhǔn)模型拒絕閾值時(shí),認(rèn)定該數(shù)據(jù)為健康劣化數(shù)據(jù)。同時(shí)為了避免如偶發(fā)傳感器故障、通訊異常、啟停機(jī)等產(chǎn)生的偶發(fā)異常數(shù)據(jù)造成的誤報(bào)警,引入滑動(dòng)窗口算法監(jiān)測(cè)時(shí)間序列數(shù)據(jù)的健康劣化率。當(dāng)窗口內(nèi)數(shù)據(jù)健康劣化率大于設(shè)定閾值時(shí),發(fā)出風(fēng)電機(jī)組健康劣化預(yù)警。
孤立森林(isolation forest)算法可以提取出風(fēng)電機(jī)組功率主帶數(shù)據(jù)作為健康基準(zhǔn),并以得分的形式量化每一數(shù)據(jù)點(diǎn)偏離功率主帶的程度。
異常值檢測(cè)主要分為2步,即使用原始數(shù)據(jù)構(gòu)建二叉搜索樹(孤立樹,iTree)和異常得分計(jì)算。算法的核心在于構(gòu)建孤立樹。
孤立樹的構(gòu)建過程如下:給定一個(gè)數(shù)據(jù)集D={d1,d2,···,dn},隨機(jī)選擇D中數(shù)據(jù)的一個(gè)屬性H和它的分裂臨界點(diǎn)r。使用臨界點(diǎn)r將數(shù)據(jù)集D劃分為左子樹和右子樹2部分。以此方法構(gòu)造孤立樹,直到每一子樹中只剩下一條數(shù)據(jù)或樹達(dá)到最大深度。
孤立森林算法通過隨機(jī)采樣提取D的子集來保證孤立樹的多樣性。一定數(shù)量的孤立樹便可組成孤立森林。
對(duì)于每一個(gè)數(shù)據(jù)點(diǎn)di,遍歷每一顆孤立樹,di的總體異常得分為:
式中:t為樹的數(shù)量;M為樹T的深度;k為出口節(jié)點(diǎn)包含數(shù)據(jù)的個(gè)數(shù);c(ψ)為二叉搜索樹失敗查詢的平均路徑長(zhǎng)度,由式(3)及式(4)給出。
式中:H(ψ-1)為調(diào)和數(shù),其中ψ為采樣規(guī)模;ζ為歐拉常數(shù),取值約為0.577 216。
數(shù)據(jù)異常得分S(di,ψ)越高,其為異常值的可能性越大。當(dāng)所有數(shù)據(jù)的異常得分均約為0.5時(shí),認(rèn)為數(shù)據(jù)集D中沒有明顯異常值。
傳統(tǒng)孤立森林算法中的孤立樹是使用二叉樹的結(jié)構(gòu)構(gòu)建的,且其分裂臨界點(diǎn)r是隨機(jī)選擇的。由于原始數(shù)據(jù)具有多樣性,二叉樹結(jié)構(gòu)無法很好地表征原始數(shù)據(jù)分布情況,且其引入的隨機(jī)因素可能會(huì)造成算法精度低、穩(wěn)定性差。
針對(duì)這些問題,文獻(xiàn)[13,14]提出使用聚類的概念來擴(kuò)充樹,使孤立樹脫離經(jīng)典的二叉搜索樹結(jié)構(gòu)。文中使用了肘部法則來判斷最佳聚類個(gè)數(shù)。但是,用肘部法則對(duì)聚類效果進(jìn)行評(píng)價(jià)時(shí)僅能考慮簇內(nèi)和方差(SSE),未能針對(duì)簇間距離進(jìn)行評(píng)判;文獻(xiàn)[13]中定義的數(shù)據(jù)異常得分取值范圍不固定且普遍為負(fù)值,無法直觀地從異常得分來準(zhǔn)確判斷一個(gè)樣本的孤立程度。
為克服以上缺點(diǎn),本文設(shè)計(jì)了基于孤立森林的MKIF算法:將小批量K均值引入孤立森林搜索樹的劃分過程中。
MKIF使用聚類算法確定孤立樹分裂節(jié)點(diǎn)的數(shù)量和位置,在構(gòu)造孤立樹的過程中調(diào)用聚類算法的次數(shù)極高;所以,聚類算法的時(shí)間復(fù)雜度大大影響了MKIF算法的運(yùn)行效率。小批量K均值聚類使用部分?jǐn)?shù)據(jù)來更新模型參數(shù),其收斂速度比K均值算法更快[15];但小批量K均值算法同樣需要事先確定K的個(gè)數(shù)。本文使用輪廓系數(shù)(silhouette coefficient)來解決這個(gè)問題。
對(duì)于數(shù)據(jù)集中樣本di,假設(shè)樣本di被聚類到簇A,其輪廓系數(shù)si定義為:
式中:ai為樣本di與同一類別中所有其他點(diǎn)之間的平均距離,以體現(xiàn)凝聚度;bi為樣本di與下一個(gè)距離最近的簇中的所有其他點(diǎn)之間的平均距離,以體現(xiàn)分離度。
樣本di的輪廓系數(shù)si的取值范圍為[-1,1]。輪廓系數(shù)越大,樣本越適合所在簇,聚類效果越好。
本文采用輪廓系數(shù)來監(jiān)督小批量K均值聚類,可以在保障聚類效果的基礎(chǔ)上降低聚類時(shí)間復(fù)雜度,非常適合風(fēng)電機(jī)組這樣的大規(guī)模數(shù)據(jù)的分析處理。
MKIF算法孤立樹的構(gòu)建流程如如下:在數(shù)據(jù)集D中隨機(jī)選擇一個(gè)特征H,并將D劃分為C個(gè)子樹。根據(jù)文獻(xiàn)[13]給出的經(jīng)驗(yàn),子樹的個(gè)數(shù)從2~4中選取。使用小批量K均值算法在不同子樹個(gè)數(shù)(K個(gè)數(shù))情況下分別對(duì)數(shù)據(jù)集D的特征H進(jìn)行聚類,并計(jì)算對(duì)應(yīng)子樹個(gè)數(shù)的輪廓系數(shù)。選取輪廓系數(shù)最大的作為最終的子樹個(gè)數(shù),并記下此時(shí)聚類中心和聚類邊界的位置。如此構(gòu)造孤立樹,直到每一子樹中只剩下一條數(shù)據(jù)或樹達(dá)到最大深度。
MKIF算法異常得分定義如下:
對(duì)于數(shù)據(jù)點(diǎn)di,在第j次劃分子樹時(shí)產(chǎn)生的異常得分值為:
式中:d(di,cc)為di到cc的歐氏距離;dmax(cl,cc)為cc到cl的最大距離;cc為樣本di所屬類的中心;cl為di所屬類的邊界。
數(shù)據(jù)點(diǎn)di的最終異常得分為:
式中:N為樹的最大深度;t為搜索樹的數(shù)量;M為第T顆搜索樹劃分子樹的次數(shù)。
樣本點(diǎn)MKIF得分的取值范圍為S(di)∈[0,N]。MKIF異常得分越高,則說明樹的平均深度越高、樣本點(diǎn)與聚類中心的平均距離越遠(yuǎn),樣本點(diǎn)的孤立程度越高。
在用MKIF算法建立風(fēng)電機(jī)組健康基準(zhǔn)模型時(shí),首先按本節(jié)所述方法構(gòu)建孤立樹,并計(jì)算每一數(shù)據(jù)點(diǎn)的異常得分;然后根據(jù)預(yù)先設(shè)定的置信度B(本文選擇90%和80%),選擇異常得分較低的B數(shù)據(jù)作為正常數(shù)據(jù)組成功率主帶,并取功率主帶中最大的異常得分值作為拒絕閾值。功率主帶和MKIF拒絕閾值即構(gòu)成了風(fēng)電機(jī)組健康基準(zhǔn)模型,可作為判斷風(fēng)電機(jī)組健康狀態(tài)的標(biāo)尺。
為了更加直觀地展示出MKIF算法的優(yōu)勢(shì),使用傳統(tǒng)孤立森林算法和 MKIF算法對(duì)一組隨機(jī)生成的二維數(shù)據(jù)進(jìn)行分析。圖3示出了對(duì)于一個(gè)位于邊界的紅色方形目標(biāo)點(diǎn),2算法對(duì)笛卡爾坐標(biāo)系的劃分過程以及生成的樹結(jié)構(gòu)。①傳統(tǒng)孤立森林算法隨機(jī)選取分裂節(jié)點(diǎn),交替對(duì)數(shù)據(jù)集的橫縱坐標(biāo)進(jìn)行劃分,最終產(chǎn)生的孤立樹深度為9。其二叉樹的結(jié)構(gòu)與樣本分布情況關(guān)聯(lián)性不高,相似樣本數(shù)據(jù)往往會(huì)被劃分到不同子葉。該算法異常得分值與孤立樹深度密切相關(guān),對(duì)分割點(diǎn)的位置非常敏感,不確定性強(qiáng)。②MKIF算法孤立樹分割點(diǎn)的數(shù)量和位置均由聚類算法得出,穩(wěn)定性強(qiáng)。在實(shí)際應(yīng)用中使用少量孤立樹組成孤立森林即可獲得較好的異常值和新奇值檢測(cè)效果。最終產(chǎn)生的孤立樹深度為4,遠(yuǎn)低于傳統(tǒng)算法,運(yùn)算時(shí)間大幅縮短。圖3中MKIF孤立樹的結(jié)構(gòu)能很好地表征樣本分布情況。
圖3 孤立樹構(gòu)建示意圖Fig. 3 Schematic diagram of isolation tree construction
在劣化監(jiān)測(cè)階段,對(duì)每一個(gè)新的監(jiān)測(cè)數(shù)據(jù),MKIF算法實(shí)時(shí)計(jì)算其在孤立樹中的位置及異常得分,進(jìn)而實(shí)現(xiàn)對(duì)比分析監(jiān)測(cè)數(shù)據(jù)與功率主帶健康基準(zhǔn)模型的位置關(guān)系。當(dāng)監(jiān)測(cè)數(shù)據(jù)異常得分大于基準(zhǔn)模型拒絕閾值時(shí),認(rèn)定該數(shù)據(jù)為健康劣化數(shù)據(jù)。
風(fēng)電機(jī)組運(yùn)行過程中,隨機(jī)、偶發(fā)傳感器故障、信號(hào)噪聲、啟停機(jī)過渡過程等會(huì)產(chǎn)生偶發(fā)劣化數(shù)據(jù)。為發(fā)現(xiàn)風(fēng)電機(jī)組系統(tǒng)持續(xù)的健康問題,減少誤報(bào)警率并保證健康監(jiān)測(cè)的實(shí)時(shí)性,采用滑動(dòng)窗口對(duì)時(shí)間序列運(yùn)行數(shù)據(jù)進(jìn)行劣化監(jiān)測(cè)。設(shè)滑動(dòng)窗口內(nèi)監(jiān)測(cè)數(shù)據(jù)的個(gè)數(shù)為Nwin,滑動(dòng)窗口內(nèi)監(jiān)測(cè)數(shù)據(jù)更新個(gè)數(shù)為Nupd,如圖4所示。
圖4 滑動(dòng)窗口算法原理Fig. 4 Principle of sliding window algorithm
對(duì)滑動(dòng)窗口內(nèi)的每個(gè)監(jiān)測(cè)數(shù)據(jù)采用拒絕閾值進(jìn)行劣化判別。定義窗口內(nèi)運(yùn)行數(shù)據(jù)劣化率為:
式中:Ndeg為窗口內(nèi)劣化數(shù)據(jù)個(gè)數(shù)。
設(shè)定風(fēng)電機(jī)組健康劣化報(bào)警閾值為Valm。當(dāng)滑動(dòng)窗口內(nèi)劣化率高于報(bào)警閾值時(shí),即Rdeg>Valm時(shí),發(fā)出風(fēng)電機(jī)組劣化預(yù)警。預(yù)警時(shí)刻為該滑動(dòng)窗口內(nèi)最后一個(gè)監(jiān)測(cè)數(shù)據(jù)對(duì)應(yīng)的時(shí)間。
為檢驗(yàn)本文設(shè)計(jì)的MKIF算法在建立風(fēng)電機(jī)組健康基準(zhǔn)模型方面的效果,將E17機(jī)組2019年1月至4月的運(yùn)行數(shù)據(jù)送入傳統(tǒng)孤立森林和MKIF算法進(jìn)行識(shí)別。首先,將功率小于零的運(yùn)行數(shù)據(jù)直接剔除,并將高于額定功率的數(shù)據(jù)標(biāo)記為正常值。同時(shí),為了更加準(zhǔn)確地分離出限功率異常數(shù)據(jù),將每條運(yùn)行數(shù)據(jù)中的風(fēng)速、功率、槳距角 3個(gè)特征作為傳統(tǒng)孤立森林和MKIF算法的輸入,功率主帶提取結(jié)果如圖5所示。
圖5(a)為用孤立森林算法識(shí)別異常數(shù)據(jù)提取功率主帶建立健康基準(zhǔn)模型的結(jié)果。圖中的限功率和風(fēng)速計(jì)異常數(shù)據(jù)點(diǎn)密度高,在二叉搜索樹中具有較高的平均深度,被識(shí)別為正常值。
由圖 5(b)可知:MKIF的搜索樹結(jié)構(gòu)可以更好地表達(dá)出數(shù)據(jù)分布情況。在異常得分?jǐn)?shù)據(jù)中引入了點(diǎn)到聚類中心的距離,降低了算法對(duì)密度的敏感程度,將遠(yuǎn)離功率主帶的分布密度高的限功率和風(fēng)速計(jì)異常數(shù)據(jù)點(diǎn)準(zhǔn)確識(shí)別為異常,準(zhǔn)確提取出功率主帶作為健康基準(zhǔn)。
圖5 MKIF算法功率主帶提取結(jié)果Fig. 5 Power main band extraction result of MKIF
圖5(c)所示為置信度B=80%時(shí),MKIF算法功率主帶提取效果??梢钥闯?,置信度取值對(duì)功率主帶提取效果影響較小。當(dāng)置信度較低時(shí),算法會(huì)將大量零功率附近的數(shù)據(jù)點(diǎn)識(shí)別為異常。實(shí)際應(yīng)用中,可適當(dāng)設(shè)置一個(gè)較小的置信度(如85%)以提高算法的適用性。
考慮到用傳統(tǒng)孤立森林算法建立的基準(zhǔn)模型精度較低且包含大量異常數(shù)據(jù),不能滿足劣化監(jiān)測(cè)的需求,故本文僅使用MKIF健康基準(zhǔn)模型對(duì)風(fēng)電機(jī)組健康劣化情況進(jìn)行監(jiān)測(cè)預(yù)警。
針對(duì)E17機(jī)組,在提取出功率主帶并建立風(fēng)電機(jī)組健康基準(zhǔn)模型之后(B=90%),將5月9日0:00時(shí)開始的120條運(yùn)行數(shù)據(jù)作為監(jiān)測(cè)數(shù)據(jù)執(zhí)行健康劣化預(yù)警,其中的劣化數(shù)據(jù)分布情況如圖 6所示,均位于功率主帶右側(cè)。
圖6 劣化數(shù)據(jù)分布情況Fig. 6 Deterioration data distribution
實(shí)驗(yàn)機(jī)組運(yùn)行數(shù)據(jù)采樣間隔為10 min。由于采樣間隔較長(zhǎng),為提高檢測(cè)的實(shí)時(shí)性,設(shè)置滑動(dòng)窗口內(nèi)監(jiān)測(cè)數(shù)據(jù)的個(gè)數(shù)Nwin為18個(gè)(3 h),窗口更新數(shù)據(jù)個(gè)數(shù)Nupd為3個(gè)(0.5 h),劣化報(bào)警閾值Valm=30%。圖7為5月9日0:00時(shí)開始的各滑動(dòng)窗口劣化率變化趨勢(shì)。圖8為第12、14、19和第25個(gè)滑動(dòng)窗口監(jiān)測(cè)運(yùn)行數(shù)據(jù)與健康基準(zhǔn)模型的對(duì)比圖。
在圖7中,實(shí)驗(yàn)機(jī)組從第12個(gè)滑動(dòng)窗口開始出現(xiàn)健康劣化。在第14個(gè)滑動(dòng)窗口劣化率達(dá)到38.9%,超過報(bào)警閾值Valm=30%,即在第60個(gè)監(jiān)測(cè)數(shù)據(jù),也即9日10:00時(shí),發(fā)出風(fēng)電機(jī)組劣化預(yù)警,距離首次出現(xiàn)健康劣化數(shù)據(jù)的第12個(gè)滑動(dòng)窗口僅滯后6個(gè)數(shù)據(jù)點(diǎn)約1 h。若SCADA系統(tǒng)的數(shù)據(jù)采集間隔更短,則本劣化預(yù)警模型的實(shí)時(shí)性更強(qiáng)。
圖7 滑動(dòng)窗口健康劣化監(jiān)測(cè)Fig. 7 Degradation monitoring in sliding windows
圖8 滑動(dòng)窗口內(nèi)數(shù)據(jù)分布情況Fig. 8 Data distribution in sliding windows
將風(fēng)電機(jī)組健康劣化數(shù)據(jù)各參數(shù)與功率主帶中正常數(shù)據(jù)的各個(gè)參數(shù)進(jìn)行比對(duì)分析,能夠確定機(jī)組健康劣化的原因。如圖9所示,5月9日健康劣化數(shù)據(jù)的齒輪箱油溫均超過70 ℃,明顯高于同工況下功率主帶數(shù)據(jù)的齒輪箱油溫:推斷為此時(shí)實(shí)驗(yàn)機(jī)組齒輪箱運(yùn)行異常,齒輪箱油溫超過設(shè)定報(bào)警值導(dǎo)致機(jī)組被迫在額定風(fēng)速以下提前變槳限制機(jī)組出力,進(jìn)而使風(fēng)電機(jī)組出現(xiàn)健康劣化。
圖9 齒輪箱油溫劣化數(shù)據(jù)Fig. 9 Gearbox oil temperature of deterioration data
為驗(yàn)證本文劣化報(bào)警閾值設(shè)置的合理性,使用MKIF風(fēng)電機(jī)組健康劣化預(yù)警模型對(duì)E17機(jī)組2019年10月運(yùn)行狀態(tài)進(jìn)行長(zhǎng)期監(jiān)測(cè),結(jié)果如圖10所示。圖中,10月9日15時(shí)左右,風(fēng)電機(jī)組產(chǎn)生了4組偶發(fā)異常數(shù)據(jù),導(dǎo)致機(jī)組健康劣化率增加到22%。MKIF健康劣化監(jiān)測(cè)預(yù)警模型在10月12日10時(shí)與10月28日16時(shí)2次報(bào)警。查閱機(jī)組運(yùn)行日志:風(fēng)電機(jī)組在10月13日02時(shí)與10月29日20時(shí)2次故障停機(jī),其余時(shí)間工作正常。機(jī)組運(yùn)行情況與模型監(jiān)測(cè)預(yù)警結(jié)果相符。因此,本文將劣化報(bào)警閾值Valm設(shè)置為30%,這樣即可在保證靈敏度的基礎(chǔ)上降低偶發(fā)異常數(shù)據(jù)對(duì)劣化監(jiān)測(cè)的影響,使模型具有較好的預(yù)警效果。
圖10 健康劣化長(zhǎng)期監(jiān)測(cè)結(jié)果Fig. 10 Results of long-term monitoring of health deterioration
提出了基于孤立森林的MKIF算法:應(yīng)用小批量K均值聚類自適應(yīng)確定MKIF搜索樹的結(jié)構(gòu),并采用異常得分從全局的角度判斷每一數(shù)據(jù)點(diǎn)的孤立程度。使用MKIF算法提取出高質(zhì)量的風(fēng)電機(jī)組功率主帶作為健康基準(zhǔn),以標(biāo)識(shí)單個(gè)數(shù)據(jù)的運(yùn)行狀態(tài)。引入滑動(dòng)窗口算法判斷時(shí)間序列數(shù)據(jù)的健康劣化率,確定機(jī)組健康劣化時(shí)段。針對(duì)不同故障類型,比對(duì)正常數(shù)據(jù)與劣化數(shù)據(jù)參數(shù),分析健康劣化原因。
實(shí)例驗(yàn)證表明,MKIF算法具有更高的建模精度,算法提取出的功率主帶數(shù)據(jù)能夠更好地表征風(fēng)電機(jī)組正常工作狀態(tài)。構(gòu)造的風(fēng)電機(jī)組健康劣化監(jiān)測(cè)模型能夠?qū)崟r(shí)監(jiān)測(cè)機(jī)組工作狀態(tài),并準(zhǔn)確識(shí)別出實(shí)驗(yàn)機(jī)組齒輪箱異常。