逯登龍,高 鵬,范麗鋒,郭彥飛,周維文
(1.中國廣核新能源控股有限公司華北分公司,河北 石家莊 050011;2.南瑞集團有限公司(國網電力科學研究院有限公司),江蘇 南京 211106)
隨著科學技術的不斷發(fā)展,環(huán)境問題越來越被重視。在保持發(fā)展速度的情況下,納入清潔、可再生能源的環(huán)境問題也要考慮。風力發(fā)電是解決能源環(huán)境問題的關鍵技術之一。風力發(fā)電是通過自然界中的風,使風力發(fā)電機的葉片產生動能,進而轉化成電能。而風作為自然界中一種波動、不穩(wěn)定的能源,如何提升風電功率預測,以及處理風力發(fā)電過程中的異常數據是風電工程的重要組成部分之一。
為了克服風力發(fā)電中產生異常數據、提高風電功率預測水平,國內外有多種技術方法。文獻[1]在數據預處理階段對數據進行了一致性檢驗,并對異常數據進行了簡單消除,以得到一個無延時的功率預測曲線模型。該模型的風電功率預測結果較為準確,但其在處理大量的分散型數據時的風電功率預測準確度較低。文獻[2]設計了基于小波模的極大值技術方法。該方法能夠識別風力相關數據中的奇異點,并且通過自回歸滑動平均(auto regressive moving average,ARMA)模型對奇異點進行修正,以提高風電功率預測準確率。但是該方法僅通過單一的ARMA模型修正,效果不理想。文獻[3]結合了風電場的風速數據以及風電機的功率數據,通過向量機進行機器學習模型的構建,對中長期的風電功率預測較為準確。但是其異常數據的識別能力不佳,容易受到異常數據干擾,對短期情況下的風電功率預測準確度不高。
本文創(chuàng)新性地考慮多種異常數據,提出了一種基于遺傳算法-反向傳播(genetic algorithm-back propagation,GA-BP)神經網絡的風電功率預測方法。該方法通過設計風電功率預測系統整體架構,實現風電功率的預測;通過包含Web服務器、數據庫服務器、應用服務器、氣象服務器等組成的服務器模塊提高數據信息計算能力;通過構建四分位算法以區(qū)分正常數據和異常數據,并有效提高數據序列或者偏態(tài)分布的能力。
本文研究的風電功率預測系統整體框架結構如圖1所示。
圖1 風電功率預測系統整體框架結構
由圖1可知,風電功率預測系統整體框架結構主要包括:由Web服務器、數據庫服務器、應用服務器、氣象服務器等組成的服務器模塊[4-5];基于四分位算法和帶通濾波電路的異常數據識別及剔除模塊[6-7];由計算機控制器、風電功率預測算法等組成的風電功率預測模塊;由風力感應儀組成的風電場風力數據采集模塊。
圖1系統的整體工作流程如下:首先,風電場內置的監(jiān)控器將風電場的數據上傳至數據庫,為風電功率預測提供數據支撐;然后,在風電場的數據分析中心,對所采集到的風力數據、天氣預報的數據信息及環(huán)境影響等進行綜合考慮,通過使用數學模型中的四分位算法識別風電功率預測過程中可能產生干擾的異常數據;最后,通過數據分析與風電功率預測模塊中的GA-BP神經網絡對風電功率預測模型進行風電功率的預測。
風電場在進行風電功率預測時,風力發(fā)電機會受到自然界因素(氣溫、氣壓等)、設備自身因素(電壓、電流、頻率等)等的影響。這些因素往往會導致風力發(fā)電機組不能正常工作[8-10]。風電機組發(fā)出的實際功率大小通常會與預設的理論發(fā)電值有很大誤差,會降低風電功率預測的準確度。本文選用四分位算法區(qū)分正常數據和異常數據。四分位算法指按照大小對任意一個風電功率數據組合進行排序,并將它們平均分成四個等份。當其中的某個風電功率數據處于排序后風電功率數據組的分界處時,稱之為四分位數[11-12]。四分位數間距適用于表示數據序列或者偏態(tài)分布。因此,四分位算法較為穩(wěn)定、精確。
四分位算法如圖2所示。
圖2 四分位算法示意圖
這些位于分界點的風電功率數據分別被稱為第一四分位數、中位數(第二四分位數)、第三四分位數。從下限到上限,風電功率數據越來越大。這些四分位數的間距代表了數據大小的差值。
四分位算法流程如圖3所示。
圖3 四分位算法流程圖
一個區(qū)間內的風速對應著n個風電功率數據。對這些風電功率數據進行升序排列,可以得到樣本P={P1,P2,…,Pn}。四分位數的計算如下。
中位數的值P2的計算式為:
(1)
①如果風電功率數據總數n為偶數的時候,將升序排列后的樣本PV以中位數P2為界限拆分成兩個數據集(P2獨立且不包含在這兩個數據集中)。對拆分后的兩個數據集,分別計算它們的中位數P′2和P″2,那么由四分位的定義可知第一四分位數P1=P′2、第三四分位數P3=P″2。
②當風電功率數據總數n=4k+3時,有:
(2)
③當風電功率數據總數n=4k+1時,有:
(3)
通過上述過程計算出P1和P3,就可以獲得四分位間距:
IQR=P3-P1
(4)
依據四分位間距IQR,可以確定數據樣本PV中的異常數據值內限的范圍為:
[F1,F2]=[Q1-1.5IQR,Q3+1.5IQR]
(5)
式中:F1為序列的下限值;F2為序列的上限值。
由式(5)可知,處于下限到上限范圍以外的數據就是異常數據。
為了準確預測風電功率,必須剔除通過四分位算法識別出的異常數據。在異常數據識別及剔除模塊中,本文針對正常數據與異常數據的不同頻率區(qū)間設計了帶通濾波電路。
帶通濾波電路由四個LM324運算放大器配合不同容值的電容以及不同阻值的電阻共同構成。該帶通濾波電路工作時,首先由A1、A2運算器配合電阻、電容進行二次濾波操作,過濾掉系統不需要的頻率段信號;然后通過A3、A4運算器配合電阻、電容,對處理后的電流信號進行整流放大;最后將處理后的信號由輸出端輸送至數據分析中心進行風電功率預測。
帶通濾波電路如圖4所示。
圖4 帶通濾波電路圖
通過四分位算法可以識別出風力發(fā)電過程中的正常數據和異常數據,并在此基礎上設計帶通濾波電路以過濾掉無用的異常數據。這樣能夠為風電預測提供有效、真實的數據,有助于提高風電功率預測的準確度。
帶通濾波器的幅頻和相頻特性曲線如圖5所示。
圖5 帶通濾波器的幅頻和相頻特性曲線
為了提高風電功率預測的準確度,本文通過對相關技術文獻的研究,設計了GA-BP神經網絡風電功率預測方法。反向傳播(back propagation,BP)神經網絡是一種由數據信號正向傳播以及數據誤差信號反向傳播而形成多層前反饋的神經網絡,有較強的適應學習能力。
典型的BP神經網絡模型如圖6所示。
圖6 BP神經網絡模型圖
BP神經網絡有輸入層、隱含層、輸出層這三個層次。每個層次之間的神經元都采用了全連接的形式。BP神經網絡對數據信號處理的整體過程如下:首先,風電功率預測所需要的相關數據信息從輸入層進入BP神經網絡;其次,在BP神經網絡內部通過隱含層對輸入的相關數據信息進行處理和計算[13-14];最后,將輸出的數據值與預設值進行對比。
BP神經網絡對風力數據信息處理的相關計算式如下。
在隱含層對風力數據處理時,所采用的函數為:
(6)
在風電功率預測的相關數據信號進行正向傳播時,本文將輸入BP神經網絡的數據表示為XP={Xpt,Xpg,…,Xpm}。經BP神經網絡輸出的數據與預設的數據值之間的誤差E(n)滿足:
(7)
如果誤差E(n)的值大于用戶事先預設的閾值,系統就會將輸出值按照輸出層、隱含層、輸入層的順序進行BP。在這個過程進行的同時,BP神經網絡會依據誤差,通過計算式更新權值。所依據的計算式為:
Wij(n+1)=ΔWkj(n+1)+Wkj(n)
(8)
式中:Wij為輸入層到隱含層的數據權值;Wkj為隱含層到輸出層的數據權值。
雖然BP神經網絡技術有很好的風電數據處理能力,但是如果在數據處理的過程中選擇的初始權值、閾值不當的話,就會造成數據處理訓練效率低下、收斂速度慢等問題,使風電功率預測的準確率下降。因此,本文加入了遺傳算法(genetic algorithm,GA)以對BP神經網絡進行優(yōu)化,構成了GA-BP神經網絡模型。
GA優(yōu)化BP神經網絡的步驟如下。
①將BP神經網絡中的風電功率權值和閾值的初始值進行編碼。
②根據BP神經網絡輸出值與預設值的誤差來確定適應函數。適應函數S為:
(9)
S是進行接下來計算的依據。
(10)
③在每次迭代過程中,依據適應度函數最終計算得到的值的大小,對集群當中的樣本個體進行排序,并通過交叉和變異的操作生成新的風電功率數據種群。
④在上述步驟完成的情況下,返回步驟②進行循環(huán)計算。只有當最后的種群個體滿足預期要求的指標時計算才會停止,以輸出精確的風電功率預測結果。
通過GA-BP神經網絡對風電功率預測,能夠有效避免環(huán)境和設備自身的干擾。同時,GA-BP神經網絡自我調節(jié)性良好,能通過適應函數以及對風電相關數據信息進行循環(huán)處理來消除誤差,從而獲得準確的風電功率預測結果。
為了驗證所設計方法在異常數據識別及風電功率預測方面的性能,本文通過縱向對比進行了相關試驗。該試驗在西藏風電場進行。試驗主機的配置為:處理器選用E5700@3.00 GHz;安裝內存設置為8.00 GB;操作系統為Windows10 64位;驅動器為ST3320410SV ATA Device。
試驗分別采用文獻[1]、文獻[2]、文獻[3]以及本文方法,根據分布式風力數據采集設備采集到的風力數據以及天氣預報預測的自然環(huán)境條件信息,執(zhí)行異常數據識別及風電功率預測。試驗通過Matlab軟件進行仿真。
試驗架構如圖7所示。
圖7 試驗架構示意圖
在試驗設備中,本文設置一定量的異常數據與標準情況下風電機輸出的功率,通過對比異常數據量與風電功率的預測值,反映試驗方法各自的異常數據識別能力和風電功率預測的準確度。本文將西藏風電場以往獲取的實際記錄數據作為本次試驗的測試數據。這保證了試驗數據的真實性和豐富性。
采用文獻[1]、文獻[2]、文獻[3]以及本文方法,得到的異常數據量如表1所示。
表1 異常數據量
由表1可知,文獻[1]、文獻[2]、文獻[3]方法識別異常數據的能力逐漸落后于本文所設計的方法。尤其是:文獻[2]方法識別異常數據的準確度大幅度下降;文獻[3]方法準確度一直低于其他三種方法,僅有50.5%左右;本文所設計的方法對異常數據識別的準確度一直保持在90%以上。
在試驗幾種方法對風電功率的預測能力時,本文通過以預設條件下系統所能輸出的功率的標準值為參考,對比輸出功率預測值來反映風電功率預測能力的強弱。
四種方法風電功率預測值如表2所示。
表2 四種方法風電功率預測值
由表2可知:文獻[1]方法預測風電功率的準確度逐漸上升,最終穩(wěn)定在80%左右;文獻[2]方法的預測準確度維持在75%~85%區(qū)間;文獻[3]方法對風電功率預測的準確度隨功率的增加而降低,僅達到46%左右,證明其無法應對大規(guī)模短期風電功率的預測;本文方法對風電功率預測的準確度一直保持在90%以上,證明了本文方法在風電功率預測上的優(yōu)越性。
針對風電場對風電功率的預測容易受到異常數據影響,造成預測準確度不高的難題,本文設計了帶通濾波器配合數學模型中的四分位算法來實現對異常數據的識別及剔除的方法。本文方法能夠為風電功率的預測提供精準的相關數據信息。為了提高風電功率預測的準確度、滿足風電場的管理需要,本文在一般的BP神經網絡上加入了GA,以此提高風電預測的準確度。通過試驗對比,證明了本文方法無論是在異常數據的識別及剔除能力上還是在風電功率預測的準確度上都有很大的優(yōu)越性。