龔亞雄 高佳浩 李逸 黃志華
(1 中機國際工程設(shè)計研究院有限責(zé)任公司 湖南長沙 410000 2 哈電風(fēng)能有限公司 湖南湘潭 411101)
風(fēng)能作為1 種重要的綠色能源,已被世界各國廣泛利用,對于各國化解能源危機、減污降碳、提高清潔能源占比具有重要意義[1-3]。隨著風(fēng)能裝機容量的增加,風(fēng)電場的運維成本也相應(yīng)提高。監(jiān)測風(fēng)電機組發(fā)電性能,有利于合理安排維護計劃,防止故障發(fā)生及降低運維成本[4-5]。為評估風(fēng)力發(fā)電機組的發(fā)電性能,常采用風(fēng)功率曲線對風(fēng)電機組凈功率輸出與風(fēng)速間的關(guān)系及風(fēng)機運行特點進(jìn)行準(zhǔn)確描述。但在風(fēng)電數(shù)據(jù)采集過程中,受檢測裝置故障、傳輸過程受到干擾、強制棄風(fēng)等因素影響,可能會產(chǎn)生大量的風(fēng)電-功率異常數(shù)據(jù),而該異常數(shù)據(jù)將會對風(fēng)電預(yù)測準(zhǔn)確度造成嚴(yán)重影響,因此需對異常數(shù)據(jù)進(jìn)行精確識別和有效清洗[6-7]。
目前,針對風(fēng)電機組異常數(shù)據(jù)識別和清洗的研究工作主要集中在突變點檢測、建立等效邊界、對異常數(shù)據(jù)進(jìn)行重構(gòu)等方面。
文獻(xiàn)[8]將異常數(shù)據(jù)按照數(shù)據(jù)位置劃分為不同類型的數(shù)據(jù),并在數(shù)據(jù)分類基礎(chǔ)上,采用變點分組算法和四分位算法進(jìn)行數(shù)據(jù)處理。該方法清洗效率高,但容易產(chǎn)生過度清洗,即數(shù)據(jù)中心聚集區(qū)域呈鋸齒狀。此外,目前較多采用基于距離或密度檢測算法進(jìn)行數(shù)據(jù)清洗,如k-means 聚類[9]、局部離群因子(LOF)[10]、Thompson tau-[11]等,但此類方法識別效果較差。為解決該類算法的不足,文獻(xiàn)[12]根據(jù)生成機制對異常數(shù)據(jù)進(jìn)行分類,采用DBSCAN 算法、截斷法、斜率控制法、核密度估計等方法進(jìn)行分類識別。該方法對特定類別下的異常數(shù)據(jù)清洗效果明顯,但需依靠人工干預(yù),數(shù)據(jù)清洗步驟繁瑣。文獻(xiàn)[13]采用最優(yōu)組內(nèi)方差算法根據(jù)排序數(shù)據(jù)計算滑移值,以此識別異常數(shù)據(jù)。但該方法場景特征相對有限,在異常數(shù)據(jù)與正確數(shù)據(jù)差異不明顯的情況下,其可行性尚未得到有效驗證。參考文獻(xiàn)[14]提出了1 個置信度等效功率邊界模型,該模型利用風(fēng)速與功率之間的相關(guān)性,通過Copula 函數(shù)對數(shù)據(jù)進(jìn)行清洗,但該方法得到的置信度等效邊界線因風(fēng)速區(qū)間不同而有較大差異且計算復(fù)雜度較高。此外,文獻(xiàn)[15]和[16]提出了消除異常數(shù)據(jù)的圖像識別方法,為數(shù)據(jù)清洗提供了另一種可行的解決思路。
然而,上述方法需一定程度的數(shù)據(jù)預(yù)處理過程,算法復(fù)雜程度較高,且清洗效果不佳。為此,本文綜合考慮異常數(shù)據(jù)識別清洗的時間、模型建立的復(fù)雜程度以及識別清洗方法的效率,將卷積神經(jīng)網(wǎng)絡(luò)和Bi-LSTM 方法相結(jié)合,利用卷積神經(jīng)網(wǎng)絡(luò)特征提取能力強與Bi-LSTM 分類效果佳的特點對采集的風(fēng)電機組異常數(shù)據(jù)進(jìn)行有效識別和清洗,通過貴州電網(wǎng)某風(fēng)電場的實際數(shù)據(jù)為算例進(jìn)行實驗和結(jié)果分析,并對比幾種現(xiàn)存的風(fēng)電異常數(shù)據(jù)識別和清洗方法。
基于實測風(fēng)速和功率的風(fēng)功率曲線可用于評價風(fēng)電機組的性能和運行狀態(tài),對風(fēng)電機組故障的檢測具有重要價值。而風(fēng)電機組相當(dāng)一部分異常數(shù)據(jù)是由棄風(fēng)、維護、通信故障等不可控因素產(chǎn)生的,必須進(jìn)行清洗。
風(fēng)力發(fā)電的原理是風(fēng)電機組將流經(jīng)風(fēng)機葉輪轂處的風(fēng)能吸收并帶動機組發(fā)電機運轉(zhuǎn)轉(zhuǎn)化為電能。單位時間內(nèi)作用于葉輪的理論輸出功率[17]E 可表示為式(1):
式中:ρ0為參考空氣密度;A 為風(fēng)輪掃掠面積;v 為風(fēng)速。
因受到氣動特性等因素的限制,風(fēng)電機組風(fēng)輪只能將其中部分風(fēng)能轉(zhuǎn)化為發(fā)電機運轉(zhuǎn)的機械能[20],根據(jù)風(fēng)力機葉片的空氣動力特性,風(fēng)能轉(zhuǎn)換效率Cp是尖速比λ 和槳距角β 的函數(shù)[18],即Cp=f(λ,β)。風(fēng)電機組捕獲的風(fēng)能Pm可以表示為式(2):
式中:R 為風(fēng)輪轉(zhuǎn)子半徑;Cp(λ,β)為風(fēng)機的功率系數(shù)。
根據(jù)貝茲極限理論,在理想條件下,作用于葉輪的理論輸出最大功率Pmax為式(3):
根據(jù)以上可得風(fēng)電機組的理論最大效率Cp見式(4),其中Cp也被稱為理論風(fēng)能利用系數(shù)[19]。
根據(jù)以上推斷,即在理想情況下,風(fēng)輪吸收風(fēng)能的最大值只占總風(fēng)能的59.3%。而風(fēng)電機組實際有用功率為式(5):
風(fēng)電機組實際輸出功率P 隨流經(jīng)輪轂高度處風(fēng)速v 變化而呈現(xiàn)一定的關(guān)系如式(6):
式中:v 為風(fēng)速;vi為切入風(fēng)速;vr為額定風(fēng)速;v0為切出風(fēng)速;P為額定功率。
風(fēng)速功率曲線是描述風(fēng)速與機組輸出功率之間的函數(shù)關(guān)系曲線。它不僅是風(fēng)電機組控制系統(tǒng)設(shè)計和開發(fā)的重要參考依據(jù),還是研判風(fēng)電機組發(fā)電性能和風(fēng)電場運行狀況的重要指標(biāo)。
本文采用貴州電網(wǎng)某風(fēng)電場的實際數(shù)據(jù),該風(fēng)電場的裝機容量為2 000 kW,切入風(fēng)速3.5 m/s,額定風(fēng)速12 m/s,切出風(fēng)速25 m/s,風(fēng)速與出力數(shù)據(jù)采樣時間間隔為10 min。1 號風(fēng)電機組原始數(shù)據(jù)v-p 散點圖如圖1 所示。
圖1 風(fēng)電機組原始數(shù)據(jù)v-p 散點圖
CNN 是一種前饋神經(jīng)網(wǎng)絡(luò),可有效地應(yīng)用于風(fēng)電機組風(fēng)功率數(shù)據(jù)時間序列特征的準(zhǔn)確提取。從圖2 所示的卷積神經(jīng)網(wǎng)絡(luò)模型框架可知,典型的CNN 是由可訓(xùn)練的多層架構(gòu)組成,其中包括卷積層、池化層、全連接層等[20]。在CNN 的結(jié)構(gòu)中,卷積層通過卷積運算學(xué)習(xí)輸入數(shù)據(jù)的特征,池化層學(xué)習(xí)卷積運算得到的特征并進(jìn)行降維和二次特征提取操作,全連接層對池化運算后得到的輸入數(shù)據(jù)特征進(jìn)行聚合。本文可以提取輸入數(shù)據(jù)的隱式信息,實現(xiàn)對時間序列的更快、更穩(wěn)定的特征提取功能。
圖2 卷積神經(jīng)網(wǎng)絡(luò)模型框架
在卷積層,對采集風(fēng)功率輸入數(shù)據(jù)進(jìn)行卷積核卷積,激活函數(shù)生成輸出特征向量,本文采用相同的卷積核,式(7)為卷積層的計算過程:
式中:Yc表示卷積層的輸出;f 表示ReLU 激活函數(shù);Wc表示權(quán)重因子;?表示卷積核;Xc表示輸入數(shù)據(jù);bc表示偏置值。
卷積神經(jīng)網(wǎng)絡(luò)擁有表征學(xué)習(xí)能力,其對輸入數(shù)據(jù)能夠按其網(wǎng)絡(luò)結(jié)構(gòu)層層學(xué)習(xí),且基于卷積神經(jīng)網(wǎng)絡(luò)提取特征效果明顯以及對數(shù)據(jù)沒有額外的特征工程要求,因此本文采用卷積神經(jīng)網(wǎng)絡(luò)對用戶用電數(shù)據(jù)特征自適應(yīng)提取。
長短時記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)為1 種改進(jìn)循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Netural Network,RNN),相比于CNN 有更好的局部特征提取能力,既能關(guān)注用戶負(fù)荷數(shù)據(jù)的時序特征,又能通過特殊的“門”內(nèi)部機制有效解決了RNN 中用電數(shù)據(jù)長序列訓(xùn)練時梯度消失和梯度爆炸缺陷[21]。
為更有效且更全面獲取時間序列數(shù)據(jù)上下文信息,雙向長短時記憶(Bidirectional Long Short Term Memory,Bi-LSTM)為基于LSTM 優(yōu)勢上,集合了輸入時間序列在前向和后向方向信息,將RNN 神經(jīng)元分為兩個方向,即前向狀態(tài)和后向狀態(tài),輸出層可同時從前向和后向狀態(tài)獲取信息,如圖3 所示為Bi-LSTM 模型結(jié)構(gòu)圖。前向LSTM 讀取輸入時間序列數(shù)據(jù)從x=(x1,x2,…,xn),并計算前向隱藏狀態(tài)序列。前后LSTM 以相反的順序讀取輸入時間序列數(shù)據(jù),即x=(xn,xn-1,…,x1),并生成反向隱藏狀態(tài)序列。通過連接前向隱藏狀態(tài)和后向隱藏狀態(tài),可得最終輸出序列數(shù)據(jù)為y=(y1,y2,…,yt,…,yn)。
圖3 Bi-LSTM 模型結(jié)構(gòu)圖
CNN-BiLSTM 異常檢測模型結(jié)構(gòu)如圖4 所示,風(fēng)功率數(shù)據(jù)實質(zhì)上為一維的時間序列數(shù)據(jù),其中一維的卷積神經(jīng)網(wǎng)絡(luò)CNN 用于提取分功率數(shù)據(jù)的特征以產(chǎn)生特征向量,Bi-LSTM用于提取周期性時序特征,以此增強風(fēng)速-功率特征敏感度;全連接層的全連接神經(jīng)網(wǎng)絡(luò)對Bi-LSTM 獲取的每個特征向量進(jìn)行預(yù)測,將得到的輸出神經(jīng)元sigmoid 函數(shù)σ(·)的分類器完成最終分類預(yù)測。
圖4 CNN-BiLSTM 模型結(jié)構(gòu)
基于CNN-BiLSTM 的風(fēng)功率異常數(shù)據(jù)檢測模型的具體網(wǎng)絡(luò)參數(shù)設(shè)置如表1 所示。
表1 CNN-BiLSTM 模型的參數(shù)設(shè)置
為驗證本文所提的風(fēng)電機組異常數(shù)據(jù)識別和清洗方法的有效性,本文采用貴州電網(wǎng)某風(fēng)電場某一年1 月至12 月整年的實際數(shù)據(jù)進(jìn)行驗證。該風(fēng)電場的裝機容量為2 000 kW,切入風(fēng)速3.5 m/s,額定風(fēng)速12 m/s,切出風(fēng)速25 m/s,風(fēng)速與出力數(shù)據(jù)采樣時間間隔為10 min。隨機采用1 號機組數(shù)據(jù)為研究對象,如圖5 為去除在散點圖中表現(xiàn)為橫向堆積型數(shù)據(jù)的預(yù)處理后的原始數(shù)據(jù)圖。
圖5 預(yù)處理后的原始數(shù)據(jù)圖
根據(jù)2.3 節(jié)的識別和清洗流程,針對1 號機組的異常數(shù)據(jù)進(jìn)行識別、清洗。清洗后散點圖如圖6 所示。
圖6 清洗異常數(shù)據(jù)后的散點圖
為了進(jìn)一步驗證本文所提方法的有效性,對比幾種現(xiàn)存的風(fēng)電異常數(shù)據(jù)識別和清洗方法。本文通過比較現(xiàn)存的2 種常見的風(fēng)電機組異常數(shù)據(jù)清洗方法,即局部離群因子LOF 方法和四分位法。此外,本文將文獻(xiàn)[11]中Thompson tau-識別清洗方法參與比較,利用上述采用的1 號機組,以及相同風(fēng)電場的14 號和20 號機組為研究對象進(jìn)行驗證。驗證結(jié)果如表2所示。
表2 不同方法數(shù)據(jù)清洗結(jié)果
由表2 可知,本文所采用方法在不同機組數(shù)據(jù)下,均能有效地實現(xiàn)異常數(shù)據(jù)刪除,且刪除率均大于30%,與表中其他方法相比,本文方法對異常數(shù)據(jù)刪除率均更優(yōu),因此可以驗證本文所提方法的有效性。
針對傳統(tǒng)風(fēng)速-功率異常數(shù)據(jù)識別和清洗算法所建立的模型復(fù)雜,而現(xiàn)有基于人工智能的算法清洗效果有待進(jìn)一步提高等問題。本文以風(fēng)速-功率數(shù)據(jù)為對象,提出了基于CNNBiLSTM 的機器學(xué)習(xí)算法對風(fēng)速-功率異常數(shù)據(jù)識別方法。實驗結(jié)果和分析表明,基于CNN-BiLSTM 的風(fēng)速-功率異常數(shù)據(jù)識別和清洗算法在不同的風(fēng)電場均可有效識別和清洗。與其他方法相比,該方法對異常數(shù)據(jù)的去除精度更高,進(jìn)一步驗證了該方法的有效性和優(yōu)越性。在今后的工作中,作者將進(jìn)一步對風(fēng)電領(lǐng)域的其他變量進(jìn)行數(shù)據(jù)清理,并對缺失數(shù)據(jù)進(jìn)行重構(gòu),以保證數(shù)據(jù)的完整性。