郭玉立,文澤軍
(湖南科技大學 機械設備健康維護湖南省重點實驗室,湘潭 411201)
開發(fā)利用清潔無污染的風能是當今趨勢所在。風電場往往選址在環(huán)境復雜多變的高海拔區(qū)域,受環(huán)境的不確定性因素影響導致風力機產(chǎn)能低下甚至事故頻發(fā)。分析影響風力機性能的不確定性因素并依據(jù)短期歷史運行數(shù)據(jù)實現(xiàn)功率的精準預測對風力機狀態(tài)預警具有重要意義。
國內外學者圍繞風力機運行狀態(tài)的不確定性進行了大量研究:Jordan等[1]采用人工網(wǎng)格機器學習方法,將風切作為輸入?yún)?shù)進行風電機月發(fā)電量的預測;張帆等[2]提出一種基于SCADA參數(shù)關系的風電機組運行狀態(tài)識別方法,采用時間滑動窗口模型進行輸入輸出參數(shù)的多項式回歸擬合進行風力機運行狀態(tài)識別;梁穎等[3]利用數(shù)據(jù)挖掘技術考慮風電機組各部分與子系統(tǒng)之間的相互作用與耦合關系,建立風電機組整體運行狀態(tài)的評估模型;謝研等[4]利用MATLAB對測風數(shù)據(jù)進行擬合并驗證了ZephlrLider實時監(jiān)測數(shù)據(jù)的實效性;Tinghui等[5]將風向數(shù)據(jù)轉換成正弦值和余弦值時間序列參數(shù),提出一種風力機偏航范圍最大風能的提?。籐uis等[6]利用神經(jīng)網(wǎng)格建立監(jiān)測系統(tǒng)進行風力機疲勞載荷預測用于成本效益的替代方案;Yu等[7]提出一種描述時空變化過程特性的時空特征,將風力機采集的數(shù)據(jù)映射到飛機上根據(jù)相對位置行測場景圖并通過深卷積網(wǎng)格應用于風力機發(fā)電量的預測;肖桂雨等[8]利用風力機SCADA數(shù)據(jù)提出一種基于小波分析和神經(jīng)網(wǎng)格的智能算法通過分析風力機故障信號的特性,從而實現(xiàn)風力機故障診斷與預測;Fouzi等[9]采用決策樹的套袋方法進行風力機發(fā)電量預測,此方法具有合并多個模型減少總體誤差的優(yōu)點;張毅等[10]提出了基于灰色模型的風電功率預測方法,適用于風電系統(tǒng)在線預測;張滕等[11]通過我國西北地區(qū)某風場近三年風機失效情況采用貝葉斯估計建立大型風電機可靠性變化模型。以上研究主要是依據(jù)風力機SCADA數(shù)據(jù)的實時運行數(shù)據(jù)進行在線狀態(tài)識別;依據(jù)風電場歷史故障數(shù)據(jù)采用概率統(tǒng)計的方法進行故障率分析與預測。在采用機器學習的方法分析風力機主要輸入因素、基于風力機SCADA系統(tǒng)的歷史小樣本數(shù)據(jù)實現(xiàn)功率的精準預測方面有待進一步研究。
針對以上不足,本文提出一種基于孿生支持向量回歸的風力機功率預測方法。首先在孿生支持向量回歸中分別采用線性核函數(shù)與多項式核函數(shù)建立預測模型,參數(shù)尋優(yōu)上采用遺傳算法,并以平均預測精度作為評價指標;基于SCADA數(shù)據(jù)分析了風力機運行環(huán)境的不確定性并確定影響其運行狀態(tài)的輸入因素,分析風力機工作原理進行數(shù)據(jù)預處理并選取能夠直觀的表示風力機性能的輸出因素;以2MW風力機為研究對象分別采用線性核函數(shù)與多項式核函數(shù)孿生支持向量回歸方法進行功率預測。通過比較平均預測精度得出多項式核函數(shù)孿生支持向量回歸預測方法的預測精度較高。實現(xiàn)了依據(jù)風力機SCADA系統(tǒng)中歷史小樣本數(shù)據(jù)對功率的精準預測,對風力機運行狀態(tài)預警方面具有重要作用。
孿生支持向量回歸是在孿生支持向量機的基礎上提出的。孿生支持向量機基本思想是在兩類別中產(chǎn)生兩個不平行的超平面,使得每一個超平面盡可能地接近兩類中的一個,并盡可能地遠離另一類;Peng[12]在孿生支持向量機的基礎上提出將兩個不平行的超平面進行分類并構建一對不敏感的上下界函數(shù),使得每個界函數(shù)求解過程中計算量大大減小。該方法不僅計算速度快,且具有良好的泛化性。
將風力機的輸入與輸出分別定義為x和y,則樣本集可表示為:(x1,y1),…,(x1,y1),假設樣本是一個n維向量,樣本數(shù)為l,將輸入定義為矩陣A=[x1,…xl]T,輸出為Y=[y1,…yl]T;向量e=[1,…,1]T為適應樣本維度的單位向量。其表達式為:
其中:C1,C2是影響因子,ε1,ε2是參數(shù);C1,C2≥0;ε1,ε2≥0;ξ,η是松弛變量。
考慮到樣本可能存在非線性關系,將K定義為非線性核函數(shù),令K(A,AT)是維數(shù)為l的核矩陣,其中第(i,j)個元素(i,j=1,2,…l)為式(3)所示。
核函數(shù)有線性核函數(shù)和多項式核函數(shù)表達式分別為式(4)與式(5):
其中:α>0,c>0,d∈N。
利用拉格朗日函數(shù)KKT約束條件,將式(1)與式(2)轉化為對偶關系如式(6)和式(7)所示[12]:
其中:H=[K(A,AT),e];f=Y-ε1e;h=Y+ε2e。經(jīng)計算得式(8)和式(9):
構建風力機輸入的回歸函數(shù)如式(10)所示:
孿生支持向量回歸方法中核函數(shù)參數(shù)尋優(yōu)上可利用遺傳算法來解決。
遺傳算法是模仿自然界生物進化和遺傳機制發(fā)展起來的隨機全局搜索方法,并自適應得控制搜索過程并提供最優(yōu)的解決方案,首先從目標問題的可能潛在解集的一個種群開始,通過選擇、交叉和相互變異產(chǎn)生新的具有代表解的種群[12]。調取R語言中的GA(Genetic Algorithm)包,設置種群數(shù)目為50,迭代次數(shù)為100,選取均方差作為迭代過程中的適應度值。
風力機功率作為預測模型的輸出因素。分析孿生支持向量回歸方法的預測功率值與實際功率值的偏差,偏差量占實際功率的比重為預測功率的偏差率。將平均預測精度作為評價兩種預測方法精準度的指標。如式(11)所示:
式中,M為預測功率的平均精度;yt為風力機實際功率值,為預測功率值,N是預測樣本總數(shù)。
風力機的工作原理是通過捕獲的風能促使葉輪的旋轉,由旋轉的機械能轉化為電能的能量轉換過程。本文采取的研究對象是我國南方某風電場2MW直驅式風力機。風力機SCADA數(shù)據(jù)是通過設置在風力機各個重要部位上的傳感器進行在線監(jiān)測并數(shù)據(jù)儲存的系統(tǒng)。數(shù)據(jù)記錄周期從1s~n min,本文采取的SCADA數(shù)據(jù)是我國南方某風電場秒級記錄的10min內的平均值。風力機SCADA數(shù)據(jù)記錄的主要參數(shù)有:風速、風向、功率、主軸溫度、輪轂轉矩、機艙溫度等。
風力機的自由狀態(tài)是指完全不受人為控制的工作狀態(tài)。停機狀態(tài)是因風力機所處的環(huán)境條件不適合工作或其他原因引起的停機;風力機限功率狀態(tài)分兩種:1)由于電力系統(tǒng)儲存接近飽滿不能夠接納風力機產(chǎn)生的電能;2)風力機的最高功率為2000W。風力機SCADA數(shù)據(jù)中以下情況記錄的數(shù)據(jù)應去除:
1)標準風速3m/s~22m/s以外;
2)停機、維修時的數(shù)據(jù)。
風力機的輸入因素有風速、風向、環(huán)境溫度共3個變量;輸出為功率。選取風力機SCADA系統(tǒng)連續(xù)記錄的500組數(shù)據(jù),采用機器學習的方法訓練前300組數(shù)據(jù),依據(jù)后200組數(shù)據(jù)的輸入并預測其輸出。預測時將輸入作為影響因素,輸出為功率。風力機SCADA數(shù)據(jù)預處理后選取的500組連續(xù)數(shù)據(jù)中時序-功率折線圖如圖1所示:
圖1 數(shù)據(jù)篩選后的時序-功率折線圖
歸一化處理是機器學習常用的方法,可以提升計算結果的精度以及減少計算量加快計算速度。功率歸一化如式(12)所示:
其中:yt為風力機功率實際值;ymax為功率最大值;yi為功率歸一化值。歸一化的風力機時序-功率折線圖如圖2所示。
圖2 數(shù)據(jù)篩選后的時間-功率歸一化折線圖
以R語言為計算工具,抓取風力機SCADA數(shù)據(jù)中輸入因素:風速、風向和環(huán)境溫度;輸出為功率。調取GA包和Psoptim包分別采用遺傳算法進行參數(shù)尋優(yōu)。選取風力機預處理過的SCADA數(shù)據(jù)中500組數(shù)據(jù),訓練前300組預測后200組。預測結果如圖3、圖4所示。
圖3 實際功率與線性核函數(shù)預測功率對比圖
圖4 實際功率與多項式核函數(shù)預測功率對比圖
由此可知:多項式核函數(shù)孿生支持向量回歸方法的預測功率折線與實際功率折線重合度較高,且線性核函數(shù)孿生支持向量回歸方法的功率預測精準度與實際功率相比明顯偏低。
圖5 時間-線性核函數(shù)與多項式核函數(shù)預測功率偏差折線圖
由圖6、圖7可知,隨著環(huán)境溫度與風速的增大,多項式核函數(shù)孿生支持向量回歸方法預測功率值的偏差量相對于線性核函數(shù)孿生支持向量回歸預測方法偏小且總體趨勢較為穩(wěn)定。
圖6 風速-線性核函數(shù)、多項式核函數(shù)預測功率偏差散點圖
圖7 環(huán)境溫度-線性核函數(shù)、多項式核函數(shù)預測功率偏差散點圖
分別對比實際功率值與線性核函數(shù)、多項式核函數(shù)孿生支持向量回歸的預測功率值,以平均預測精度作為評判預測功率精度高低的標準。圖8為線性核函數(shù)與多項式核函數(shù)孿生支持向量回歸預測方法的預測精度折線圖;表1為兩種預測方法的平均預測精度:
圖8 線性核與多項式核預測精度折線圖
表1 線性核函數(shù)與多項式核函數(shù)預測精度
以上分析可以看出,線性核函數(shù)與多項式核函數(shù)孿生支持向量回歸方法并運用遺傳算法進行參數(shù)尋優(yōu)對風力機功率預測的可行性。通過對比平均預測精度得出多項式核函數(shù)孿生支持向量回歸預測方法的精準度較高。實現(xiàn)了依據(jù)風力機SCADA系統(tǒng)歷史小樣本數(shù)據(jù)對功率的精準預測。對風力機性能退化、狀態(tài)預警等方面帶來幫助。
1)在孿生支持向量機的基礎上選用孿生支持向量回歸,分別采用線性核函數(shù)對多項式核函數(shù)孿生支持向量回歸預測,參數(shù)尋優(yōu)上運用遺傳算法進行風力機功率預測。
2)分析風力機的性能特性與運行環(huán)境,選取SCADA數(shù)據(jù)中影響風力機運行狀態(tài)的輸入因素、能夠直觀的展現(xiàn)出風力機運行狀態(tài)的輸出因素。進行數(shù)據(jù)預處理并提取有效的連續(xù)數(shù)據(jù)。驗證了基于孿生支持向量回歸方法對風力機功率預測可行性,其中多項式核函數(shù)孿生支持向量回歸方法預測精度較高。
3)提取風力機SCADA系統(tǒng)中歷史小樣本數(shù)據(jù)采用機器學習方法實現(xiàn)了對風力機功率的精準預測。將風電場氣象信息作為輸入因素可精準預測風力機的輸出功率。對風力機狀態(tài)預警、性能退化等方面具有重要意義。