摘" 要:風能作為一種可再生清潔能源,得到了高速發(fā)展。高精度的風力發(fā)電量預測可為電力調度以及平抑并網波動提供重要依據。文章基于ARIMA模型,分別進行超短期、短期和中長期風力發(fā)電量預測,探討其可行性和有效性。使用某風電場2019年1月1日至2020年12月31日的風電功率數據進行建模,并開展不同時間長度的預測。在此基礎上,考慮數據的周期性特征以及實際氣候因素對發(fā)電功率的影響,優(yōu)化模型的預測效果。實驗結果表明,考慮數據周期性與外生變量的影響能夠顯著提升對實際功率的預測精度。超短期、短期和中長期預測的均方根誤差分別為7.16、12.63和17.98。
關鍵詞:風力發(fā)電;發(fā)電量預測;ARIMA;皮爾遜系數
中圖分類號:TP39;TM614 文獻標識碼:A 文章編號:2096-4706(2025)04-0157-06
Power Generation Forecasting of Wind-generated Electricity Based on ARIMA
LIU Jixiong1, ZOU Rui2, XU Siwei2
(1.Wuhan Electric Apparatus Research Institute Co., Ltd., Wuhan" 430050, China; 2.Hubei University, Wuhan" 430062, China)
Abstract: Wind energy, as a renewable and clean energy source, is developing at a high speed. High-precision wind power generation forecasting can provide an important basis for power dispatching and mitigating grid-connection fluctuations. Based on the ARIMA model, this paper conducts ultra-short-term, short-term, and medium-to-long-term wind power generation forecasts to explore its feasibility and effectiveness. The wind power data of a wind farm from January 1, 2019 to December 31, 2020 is used for modeling and forecasting over different time lengths. On this basis, considering the periodic characteristics of the data and the influence of actual climate factors on power generation, the forecasting effect of the model is optimized. The experimental results show that considering the influence of periodic data and exogenous variables can significantly improve the forecasting accuracy of actual power. The RMSE of ultra-short-term, short-term, and medium-to-long-term forecasts are 7.16, 12.63 and 17.98, respectively.
Keywords: wind power generation; power generation forecasting; ARIMA; Pearson correlation coefficient
0" 引" 言
隨著全球對清潔能源的需求不斷增長,風力發(fā)電作為一種可再生、清潔且環(huán)保的能源形式,越來越受到人們的關注和重視。風力發(fā)電通過將風能轉化為電能,為能源行業(yè)提供了一種可持續(xù)發(fā)展的解決方案[1]。然而,與其他形式的能源相比,風力發(fā)電的特點之一是其波動性和不確定性,風速的隨機波動、氣象條件的變化以及地理位置的差異都會導致風力發(fā)電量的波動。風力發(fā)電功率預測即利用當前的信息對未來一段時間的風電功率大小進行預測,這對于風電場的運營規(guī)劃和管理,以及電力的調度與系統的維護至關重要[2]。
預測風力發(fā)電量的準確性直接影響到風電場的經濟效益和電網運行的穩(wěn)定性。在實際生產中,精準的風力發(fā)電量預測可以幫助電網管理者合理安排發(fā)電計劃、調配電力資源,避免供需不平衡引發(fā)的電力負荷問題。此外,對風力發(fā)電量的準確預測還有助于降低電力系統的運營成本,并優(yōu)化電力市場的運行。
針對風電的預測方法,國內外已有諸多研究。學者們對于用風電發(fā)電量的預測方法大致分為兩大類:基于時間序列模型的預測方法和基于機器學習的預測方法。時間序列是指一組在連續(xù)時間上測得的數,可分為單變量時間序列和多變量時間序列[3]?;跁r間序列模型的預測方法主要包括自回歸移動平均模型(Autoregressive Integrated Moving Average, ARIMA)、自回歸條件異方差模型(Autoregressive Conditional Heteroskedasticity, ARCH)、廣義自回歸條件異方差模型(GARCH)等。曹俊波[4]等運用ARIMA模型進行風功率預測,提出一種確定最優(yōu)差分次數的方法對模型進行優(yōu)化。機器學習方法通過對大量數據的學習和模式識別,能夠更靈活地適應不同的數據特征,并在一定程度上提高預測的準確性。向勇[5]等將深度學習引入了循環(huán)神經網絡,進行大規(guī)模風電功率的預測,發(fā)現組合模型明顯降低了預測的相對誤差。李相俊[6]等采用LSTM(Long Short Term Memory)算法進行風電功率預測,發(fā)現對于各季節(jié)的周發(fā)電功率與日發(fā)電功率都表現良好。部分學者還針對不同的時間尺度進行了深入的研究。
風功率預測從時間尺度上可以分為3類:超短期預測(時/分/秒)、短期預測(時/天)、中長期預測(天/周/月/季)。超短期預測通常是指0到4小時的風力發(fā)電量預測,主要用于電力系統實時調整。韓朋[7]等使用深度學習框架,結合LSTM與注意力模型,預測未來4小時的風電功率。短期預測是指預測未來0到72小時的風電功率,主要用于擬定發(fā)電計劃,通常需要考慮風速、風向等氣象條件。余錚[8]等對原始風電數據進行分解,得到低頻、中頻、高頻和趨勢特征,對高頻采用LSTM進行預測,其余選擇支持向量機的方法,最終得到短期風電預測結果。中長期預測通常是三天到數周的功率預測及月度、年度的電量預測,中期預測主要用于對機組組合優(yōu)化、常規(guī)電源開機計劃制訂、海上風電檢修,長期預測主要用于年、月電量平衡及制訂燃料計劃等。對于中長期的風電預測,由于數據的時間尺度較大,學者們多使用非線性學習能力較強的模型,陳子含[2]等在進行中長期風功率預測時,搭建圖卷積神經網絡模型,并采用差分擬合降低模型擬合難度,使用粒子群優(yōu)化算法優(yōu)化整體目標函數。何健偉[9]等結合LSTM與RF(Random Forest)進行中期發(fā)電功率預測,RF用于修正短期誤差,有效提升了中長期預測精度。
風力發(fā)電功率預測目前已取得不少研究成果,但大多數文獻只選擇一種時間尺度進行預測,并且在基于時間序列的預測方法中,僅考慮了發(fā)電功率的單一變量。本文將著重介紹利用ARIMA模型進行風力發(fā)電量預測的方法,在此基礎上考慮風電功率的周期性以及影響風電功率的外生變量,分別構建SARIMA和SARIMAX模型,探究是否提高預測精度。并根據實際應用的需要,將基于ARIMA模型的預測分為超短期、短期和中長期。對比分析模型在超短期,短期,中期以及長期預測的效果,為不同的應用提供合適預測方法,以促進風電場的可持續(xù)發(fā)展和電力系統的穩(wěn)定運行。
1" 理論介紹
1.1" ARIMA
ARIMA(自回歸積分移動平均)是一種經典的時間序列分析方法,用于預測未來的數據。ARIMA模型結合了自回歸(AR)模型、差分(I)和移動平均(MA)模型的特性。ARIMA模型的基本原理如式(1)所示:
ARIMA(p,d,q)=AR(p)+I(d)+MA(q)" " (1)
其中,AR(p)表示自回歸模型,I(d)表示差分模型,MA(q)表示移動平均模型。
自回歸(AR):ARIMA模型基于自回歸,即當前時間點的值與前面若干時間點的值有關,即回歸的階數。自回歸階數p表示當前時間點與前面p個時間點的值有關。
差分(I):為了消除時間序列數據的非平穩(wěn)性,ARIMA模型通常需要進行差分操作,即將原始數據轉化為差分數據,消除趨勢和季節(jié)性等影響。差分階數d表示需要對時間序列數據進行差分的次數。
移動平均(MA):ARIMA模型基于移動平均,即當前時間點的值與前面若干時間點的誤差有關,即移動平均的階數。移動平均階數q表示當前時間點與前面q個時間點的誤差有關。
ARIMA模型的核心思想是通過對時間序列數據進行差分操作,將非平穩(wěn)的時間序列轉化為平穩(wěn)的時間序列,然后利用自回歸和移動平均的組合來捕捉數據的自相關性和移動平均性。它可以通過對時間序列數據進行分析和擬合,估計出合適的模型參數,從而進行數據預測和建模。
1.2" SARIMA
SARIMA在ARIMA的基礎上考慮了季節(jié)性因素[10],能夠有效捕捉趨勢與周期性變化。
假設{Xt}是一個時間序列,x1,x2…xn為n個有序觀測值。B是滯后算子,用于表示序列的滯后關系,式(2)表示t時間點的觀測值xt經過B的作用后,得到t-1時間點的觀測值xt-1。
B·xt = t-1" " " " " " " " " " " " " " "(2)
非平穩(wěn)的時間序列通常要進行差分運算,計算當前觀測值與前一個觀測值之差,以消除數據的非平穩(wěn)性。時間序列的d階差分可以表示為:
(3)
當數據每隔s個時間點就呈現出相似特征時,就可以認為其存在周期性。s表示季節(jié)性的周期長度,季節(jié)性差分算子表示為式(4):
(4)
SARIMA模型中自回歸描述變量與自身在不同時間點的相關關系,自回歸算子可表示為式(5),模型可以表示為式(6)。其中εt表示誤差項,?表示每個滯后值的權重。
(5)
(6)
移動平均描述當前觀測值與過去隨機誤差之間的關系,用過去q個時期的隨機誤差來線性表達當前的預測值。令q階移動平均算子為式(7),則移動平均模型可以表示為式(8),其中θ表示權重。
(7)
(8)
季節(jié)性自回歸差分移動平均模型可以記為SARIMA(p,d,q)×(P,D,Q)s,模型的結構表示為式(9):
(9)
1.3" 評價指標
對于文中風力發(fā)電量預測的實例,為對模型性能進行客觀的判斷,本文選擇的評價指標是平均絕對誤差(MAE)和均方根誤差(RMSE),這些指標可以直觀地反映模型預測的準確性,適用于連續(xù)數值型數據的評估。其公式分別為(10)和(11):
(10)
(11)
2" 算例分析
2.1" 數據及實驗方法
文中數據為某風電場的數據集,涵蓋了該風電場在2019年1月1日至2020年12月31日期間的運行數據,采樣間隔為15分鐘,該數據集包含了多個特征。
天氣特征包括:10米高度處風速(m/s),10米高度處風向(°),30米高度處風速(m/s),30米高度處風向(°),50米高度處風速(m/s),50米高度處風向(°),70米高度處風速(m/s),70米高度處風向(°),氣溫(℃),氣壓(hPa),相對濕度(%)等。這些特征提供了風力發(fā)電的關鍵環(huán)境因素,可以幫助理解和預測風力發(fā)電量的變化。其中,風速和風向是最直接影響風力發(fā)電量的因素,而氣溫、氣壓和相對濕度等氣象因素也可能對風力發(fā)電產生一定影響。
為準確預測風力發(fā)電量,對于數據集中的大量數據,通過可視化了解其基本特征,篩選出對發(fā)電量有顯著影響的外生變量,并將數據劃分為訓練集和測試集,分別構建ARIMA、SARIMA和SARIMAX模型。為了更清晰地展示實驗方法的具體步驟,建模流程如圖1所示。
2.2" 數據預處理
在建立模型之前,觀察原始數據,發(fā)現每天的實際發(fā)電功率均存在較大波動,且波動趨勢相似。為驗證數據是否存在周期性,本文對序列進行基于加權回歸的季節(jié)趨勢(seasonal-trend decomposition using Loess, STL)分解,由于數據集中的“實際功率”包含負值,此處使用加法模型分解數據,即原始數據由趨勢、周期和殘差三個部分相加組成:
原始數據 = 趨勢+周期+殘差" " " " (12)
發(fā)現風電功率數據的周期是以天為單位的,每天采樣的數據具有96個時間點,即周期S = 96。由于訓練設備的算力限制,對于此類較長的周期難以添加到模型當中進行運算,因此對原始數據進行聚合,通過取平均值的方式將原始數據的多個時間點聚合為整點時間的數據,轉換為較高層次的時間間隔。經處理后的數據每天有24個采樣點,再次進行STL分解,展示部分數據的分解結果如圖2所示,此時的數據以24小時為周期,即S = 24,利于進一步進行時間序列的分析。
2.3" 相關性分析
在實際的情境中,風電功率與風向、風速以及各種氣候因素之間有著較為緊密的相關性,在進行預測時,將高相關性變量的輸入到模型當中可以提高預測精度,而低相關性的數據往往會干擾訓練過程,影響模型預測效果。為了篩選出合適的特征,此處進行相關性分析。
皮爾遜系數(Pearson correlation coefficient)是一種衡量兩個連續(xù)變量之間線性關系強度和方向的統計量,通常用符號“r”表示。其計算公式如式(13)所示,xi和yi分別表示第i個觀測值的兩個變量,和分別表示兩個變量的均值,n表示觀測值的數量。
(13)
皮爾遜相關系數的取值范圍在-1到1之間,其值的大小表示了線性相關程度的強弱,越接近于1或-1表示相關性越強,當相關系數r大于0.8時,認為變量間有極強的相關性[11]。為了更直觀的表示各特征值之間的相關性關系,采用熱力圖可視化相關性,如圖3所示。
通過相關性分析結果可得,與風電功率相關程度最高的氣候特征為風速,其中30米高度處風速的相關系數為0.88,具有極強的相關性,其次以此為50米高度處風速、10米高度處風速和70米高度處風速。不同高度處風速之間存在著較強的正相關性,為簡化輸入到訓練模型的特征數量,避免特征冗余,將30米高度處風速作為外生變量加入模型進行進一步的訓練。
2.4" 模型構建
本研究對風電功率進行超短期、短期和中長期預測,分別選擇4 h、24 h、72 h作為預測長度。由于原始數據集的數據量巨大,共包含17 524條數據,不適合直接應用于ARIMA模型進行訓練,因此在確定訓練集的樣本數時,按照10:1的比例確定數據量用于模型擬合,例如短期預測取40個時間步長的數據輸入模型,得到未來4小時數據的輸出。在模型的選擇上,本文基于ARIMA模型進行預測,并利用數據的周期性特征以及引入外生變量對模型進行優(yōu)化,構建SARIMAX模型,此處主要說明SARIMAX模型的構建過程。
建模初期,首先需要檢驗數據的平穩(wěn)性。分別對用于不同時間長度預測的數據進行ADF檢驗,并通過差分消除其周期性與趨勢,結果如表1所示。通過平穩(wěn)性檢驗結果,可以確定在用于建模的數據分別需要的差分次數。
在建模前,還需要驗證已平穩(wěn)的數據是否為白噪聲。使用Ljung-Box檢驗法,檢驗發(fā)現已處理平穩(wěn)的序列不是白噪聲序列,可用于建模分析。
模型定階為建模的重要環(huán)節(jié),將訓練集的數據與外生變量數據同時輸入模型,采用網格搜索法的方式遍歷參數組合,確定模型的最優(yōu)參數,以赤池信息準則(AIC)作初步判斷依據,統計量越小,表示模型的性能越好。對AIC較小的幾個參數組合不斷篩選與調整,最終確定的模型參數如表2所示,可用于預測。
3" 預測結果對比
分別運用ARIMA、SARIMA、SARIMAX模型進行超短期、短期和中長期風電預測。其中,ARIMA模型使用風電場歷史發(fā)電功率數據進行預測,SARIMA模型考慮了數據的周期性特征,SARIMAX模型在捕捉數據周期性的基礎上,考慮了風速對于實際發(fā)電功率的影響。匯總模型的預測效果如表3所示,此處采用MAE和RMSE作為模型的評價指標。
從表3的對比結果可以看出,ARIMA模型更適用于較少時間步的預測,對于超短期風電功率預測的平均絕對誤差和均方根誤差都相對較低??紤]數據的周期性能夠在一定程度上提升預測精度,對比ARIMA模型,超短期和短期預測的MAE分別降低了42.7%和27.0%。風速對于發(fā)電功率也有著較大影響,當添加風速作為外生變量以后,超短期、短期和中長期的預測效果都明顯提升,超短期預測的RMSE為7.16,驗證了優(yōu)化后的ARIMA模型能夠提升功率的預測準確度。
4" 結" 論
本文基于ARIMA模型分別對風力發(fā)電功率進行超短期、短期以及中長期的預測,在觀察模型對于不同時間長度的數據預測效果的基礎上,考慮了數據的周期性與外生變量的影響性,優(yōu)化ARIMA模型。實驗發(fā)現考慮周期性和外生變量能夠顯著提升預測精度。
參考文獻:
[1] 楊乘勝.面向新建風電場的短期風電預測方法 [J].中國科技信息,2022(19):104-106.
[2] 陳子含,滕偉,胥學峰,等.基于圖卷積網絡和風速差分擬合的中長期風功率預測 [J].中國電力,2023,56(10):96-105.
[3] 陳孝文,蘇攀,吳彬溶,等.基于改進長短期記憶網絡的時間序列預測研究 [J].武漢理工大學學報:信息與管理工程版,2022,44(3):487-494+499.
[4] 曹俊波,周任軍,鄧學華,等.考慮優(yōu)化ARIMA模型差分次數的風功率預測 [J].電力系統及其自動化學報,2019,31(1):105-111.
[5] 向勇,王一軍,孔寅恪.基于深度循環(huán)神經網絡的大規(guī)模風力發(fā)電功率預測 [J].資源信息與工程,2021,36(2):136-139.
[6] 李相俊,許格健.基于長短期記憶神經網絡的風力發(fā)電功率預測方法 [J].發(fā)電技術,2019,40(5):426-433.
[7] 韓朋,張曉琳,張飛,等.基于AM-LSTM模型的超短期風電功率預測 [J].科學技術與工程,2020,20(21):8594-8600.
[8] 余錚,金波,焦堯毅,等.基于混合深度學習的短期風電預測研究 [J].武漢理工大學學報:信息與管理工程版,2024,46(1):170-174.
[9] 何健偉,曹渝昆.LSTM-RF的中長期風電功率組合預測方法 [J].上海電力大學學報,2020,36(4):341–350.
[10] 丁銳,李偉,王若舟.基于SARIMA和LSTM組合預測模型 [J].計算機與數字工程,2020,48(2):304-307+337.
[11] 程杰,陳鼎,李春,等.基于GWO-CNN-BiLSTM的超短期風電預測 [J].科學技術與工程,2023,23(35):15091-15099.
作者簡介:劉吉雄(1971—),男,漢族,湖北荊州人,工程師,本科,研究方向:風機空氣性能;鄒瑞(1999—),女,漢族,陜西寶雞人,碩士,研究方向:數據分析、數據挖掘;許思為(1999—),男,漢族,湖北天門人,碩士,研究方向:數據挖掘、機器學習。
收稿日期:2024-07-24