文 | 劉震,劉丹,王彥文,孫書貝,劉冰
隨著風(fēng)電并網(wǎng)規(guī)模的快速擴(kuò)大,風(fēng)電的不確定性對(duì)電力系統(tǒng)與電力市場(chǎng)的穩(wěn)定性、充裕性及經(jīng)濟(jì)學(xué)的影響也日益增大,故及時(shí)和準(zhǔn)確地預(yù)測(cè)風(fēng)電 功率(Wind Power,WP)的 意義重大。風(fēng)電功率預(yù)測(cè)(Wind Power Prediction,WPP)根據(jù)風(fēng)速及相關(guān)因素的歷史數(shù)據(jù),演化其后續(xù)的過程。具體需要建立數(shù)學(xué)模型來反映WP與相關(guān)因素的關(guān)系,外推WP值。WPP可按時(shí)間尺度分為中長(zhǎng)期、短期和超短期預(yù)測(cè)。用于風(fēng)電場(chǎng)規(guī)劃及年度發(fā)電計(jì)劃的長(zhǎng)期預(yù)測(cè)以年為時(shí)效;用于檢修計(jì)劃的中期預(yù)測(cè)以周或月為時(shí)效。中長(zhǎng)期預(yù)測(cè)對(duì)精度的要求不嚴(yán)格,但需要長(zhǎng)時(shí)間的歷史數(shù)據(jù)積累。短期預(yù)測(cè)則要求較高的精度,以減少棄風(fēng),優(yōu)化常規(guī)電源的日發(fā)電計(jì)劃與冷熱備用,以及調(diào)整檢修計(jì)劃。超短期預(yù)測(cè)則有助于優(yōu)化調(diào)頻及旋轉(zhuǎn)備用容量,以及在線優(yōu)化機(jī)組組合與經(jīng)濟(jì)負(fù)荷調(diào)度。本文主要關(guān)注超短期預(yù)測(cè)。
超短期預(yù)測(cè)方法可以分為物理方法和統(tǒng)計(jì)方法。已有研究表明,對(duì)于超短期風(fēng)電功率預(yù)測(cè)方法應(yīng)采用統(tǒng)計(jì)方法。超短期風(fēng)電功率預(yù)測(cè)中所用到統(tǒng)計(jì)預(yù)測(cè)方法有支持向量機(jī)、卡爾曼濾波法、自回歸滑動(dòng)平均(Auto Regressive Integrated Moving Average,ARIMA)模型、回歸模型,人工神經(jīng)網(wǎng)絡(luò)(ANN)等人工智能算法。
超短期預(yù)測(cè)考核第4h點(diǎn)已是一種趨勢(shì),以上所提到的單體算法均不能很好擬合超短期第4h點(diǎn)的狀態(tài)?;诖?,本文提出組合算法進(jìn)行超短期預(yù)測(cè)的研究。目前對(duì)組合算法的研究甚少,一般的研究思路是先對(duì)原始序列信號(hào)進(jìn)行分解,再利用一些方法對(duì)子序列進(jìn)行分類,最后對(duì)不同的子序列分別預(yù)測(cè),再將預(yù)測(cè)值合并。所以說,此類組合方法體現(xiàn)在預(yù)測(cè)的不同階段選取不同的算法進(jìn)行處理,但原始序列相對(duì)單一,從而所攜帶的信息量也相對(duì)較少。本文是從影響目標(biāo)各因素的角度出發(fā),考慮了天氣預(yù)報(bào)的影響,考慮了序列趨勢(shì)和規(guī)律性的影響,考慮了系統(tǒng)預(yù)測(cè)誤差的影響;選取了多元回歸算法、自回歸滑動(dòng)平均(ARIMA)模型和卡爾曼濾波算法。本文將對(duì)這3種算法分別做獨(dú)立的預(yù)測(cè)工作,得到3組預(yù)測(cè)結(jié)果,并給出3組預(yù)測(cè)結(jié)果的評(píng)價(jià)指標(biāo);最終將3種算法所得預(yù)測(cè)結(jié)果通過最小方差法做加權(quán)組合,得到一組新的預(yù)測(cè)結(jié)果,并給出相應(yīng)的評(píng)價(jià)指標(biāo)。
回歸分析是預(yù)測(cè)最常用的方法之一。在實(shí)際工作中,某種現(xiàn)象或結(jié)果的產(chǎn)生通常與某些因素有關(guān),我們通過數(shù)據(jù)分析可以看出其中存在的某種趨勢(shì)和規(guī)律。
假設(shè)存在一個(gè)因變量y,n個(gè)自變量 (x1,x2, ,xn),則可建立它們之間的回歸方程:
其中β0,β1,β2, ,βn為待定系數(shù)B,稱為回歸系數(shù)。若實(shí)驗(yàn)測(cè)得m組相互獨(dú)立的數(shù)據(jù),假設(shè)每次觀測(cè)時(shí)的隨機(jī)誤差ε為白噪聲,即ε~N(0,σ2)。為了求解系數(shù)B,則可利用最小二乘法來計(jì)算回歸系數(shù),使得殘差平方和達(dá)到最小,求得待定系數(shù)為:
時(shí)間序列分析的主要目的是根據(jù)已有的歷史數(shù)據(jù)對(duì)未來進(jìn)行預(yù)測(cè),時(shí)間序列中的時(shí)間可以是年份、季度、月份或其他任何時(shí)間形式;其次,其預(yù)測(cè)時(shí)效一般不會(huì)太長(zhǎng),且隨著預(yù)報(bào)時(shí)長(zhǎng)的增加,預(yù)測(cè)精度逐漸下降。時(shí)間序列模型主要包括穩(wěn)定模型和非穩(wěn)定模型。常用的穩(wěn)定模型有自回歸(Auto Regressive,AR)模型、滑動(dòng)平均(Moving Average,MA)模型、自回歸滑動(dòng)平均(ARIMA)模型幾種。非穩(wěn)定模型可以經(jīng)過差分或相應(yīng)變換處理,將其轉(zhuǎn)換成平穩(wěn)序列,然后再使用上述常用的時(shí)間序列模型;一般對(duì)于非平穩(wěn)序列比較常用的有差分自回歸滑動(dòng)平均(ARIMA)模型等。其中,ARIMA(p,d,q)模型的表達(dá)式為:
式中,{Xt}(t=1,2,3, )為時(shí)間序列;{εt}是均值為0、方差為σ2的白噪聲過程;?i(i=1,2, ,p)和θi(i=1,2, ,q)為模型的系數(shù);B為滯后算子;k=1-B;?(B)=1-?1B-?2B2- -?pBp;θ(B)= 1 -θ1B-θ2B2- -θqBq。
在模型建立時(shí),首先,根據(jù)訓(xùn)練數(shù)據(jù)的自相關(guān)系數(shù)ρk和偏相關(guān)系數(shù)?kk進(jìn)行模型定階;同時(shí),選取最小信息準(zhǔn) 則(Akaike Information Criterion,AIC)和BIC進(jìn)行模型定階,確定出p,q。通過訓(xùn)練數(shù)據(jù)得出模型系數(shù)估計(jì)值,得出模型表達(dá)式。
卡爾曼于1960年提出卡爾曼濾波算法,后來,此算法在許多領(lǐng)域得到廣泛的應(yīng)用。卡爾曼濾波的本質(zhì)是通過觀測(cè)值重新構(gòu)建了系統(tǒng)狀態(tài)變量;通過以預(yù)測(cè)-觀測(cè)-修正的流程依次迭代實(shí)現(xiàn)。所以,卡爾曼算法是一種動(dòng)態(tài)修正的算法。
在卡爾曼濾波算法中,分為狀態(tài)方程和測(cè)量方程,其數(shù)學(xué)表達(dá)式如下:
式中,x(k)為在k時(shí)刻的狀態(tài)向量;z(k)為k時(shí)刻的觀測(cè)向量;Φ(k+1,k)和H(k+1)分別為系統(tǒng)狀態(tài)轉(zhuǎn)移矩陣和輸出轉(zhuǎn)移矩陣;Γ(k+1,k)為激勵(lì)轉(zhuǎn)移矩陣;ω(k)和v(k)分別為系統(tǒng)噪聲以及測(cè)量噪聲,假定為相互獨(dú)立且服從高斯分布的白噪聲;對(duì)應(yīng)的協(xié)方差矩陣為W(k)和V(k)。
假設(shè)給定初始狀態(tài)向量x(0)=[0],則是由下面的遞推公式?jīng)Q定的,即:
式中,K(k+1)為卡爾曼增益(Kalman Gain),其計(jì)算公式如下:
為了使濾波器不斷更新下去,還要更新k+1時(shí)刻下狀態(tài)x(k+1)的協(xié)方差:
組合預(yù)測(cè)方法的基本思想是將不同的預(yù)測(cè)方法結(jié)合起來,組合預(yù)測(cè)方法能夠利用每個(gè)單體預(yù)測(cè)方法的信息;組合預(yù)測(cè)方法一般能增加系統(tǒng)預(yù)測(cè)的準(zhǔn)確性和穩(wěn)定性。
本文選取了三種單體算法,分別為多元回歸算法、時(shí)間序列算法以及卡爾曼濾波算法,考慮因變量和自變量之間影響因素,選擇了多元回歸算法;從預(yù)測(cè)的時(shí)效性考慮選用了時(shí)間序列算法(ARIMA);從動(dòng)態(tài)修正的思想和系統(tǒng)誤差的角度考慮使用了卡爾曼濾波算法。
目前常用的組合預(yù)測(cè)方法包括最小方差法、無約束(約束)最小二乘方法、Bayes方法等。在實(shí)際應(yīng)用和理論研究中使用最多的是最小方差法,一般采用絕對(duì)誤差作為準(zhǔn)則來計(jì)算組合預(yù)測(cè)方法的權(quán)重系數(shù)。
假設(shè)第i個(gè)單體模型的誤差為ei,方差為Var(ei);組合預(yù)測(cè)模型的誤差為e,方差為Var(e),則:
組合預(yù)測(cè)的方差可以寫成:
要使得Var(e)達(dá)到最小,可以轉(zhuǎn)化為如下優(yōu)化問題來求解:
對(duì)這類約束優(yōu)化問題一般采用拉格朗日乘數(shù)法來求解,最終得出:
可以證明Var(e)min≤min(Var(ei)),所以說,一般組合預(yù)測(cè)方法的效果會(huì)優(yōu)于每種單體算法的效果。
本文以中國(guó)云南省某8個(gè)風(fēng)電場(chǎng)2016年的實(shí)際運(yùn)行數(shù)據(jù)為例,數(shù)據(jù)主要包括實(shí)際功率和短期預(yù)測(cè)功率;實(shí)際功率數(shù)據(jù)是指現(xiàn)場(chǎng)實(shí)時(shí)的出力;短期預(yù)測(cè)功率數(shù)據(jù)由功率預(yù)測(cè)廠家提供;每種數(shù)據(jù)的分辨率均為15min,一天有96條記錄。
根據(jù)國(guó)家能源局2011年對(duì)現(xiàn)行風(fēng)電場(chǎng)風(fēng)電功率預(yù)測(cè)預(yù)報(bào)的管理規(guī)定:風(fēng)電實(shí)時(shí)預(yù)測(cè)(超短期預(yù)測(cè))考核指標(biāo)一般僅采用準(zhǔn)確率指標(biāo),實(shí)時(shí)預(yù)測(cè)一般只是指未來15min~4h的預(yù)測(cè)。
(1)均方根誤差RMSE:
(2)準(zhǔn)確率r1:
式中,r1為預(yù)測(cè)計(jì)劃曲線準(zhǔn)確率;PMk為k時(shí)段的實(shí)際平均功率;PPk為k時(shí)段的預(yù)測(cè)平均功率;N為日考核總時(shí)段數(shù)(取96點(diǎn)-免考核點(diǎn)數(shù));Cap為風(fēng)電場(chǎng)開機(jī)容量。
月(年)平均風(fēng)電預(yù)測(cè)計(jì)劃曲線準(zhǔn)確率(%)為日平均預(yù)測(cè)計(jì)劃曲線準(zhǔn)確率的算術(shù)平均值。
(一)各單體算法訓(xùn)練樣本量的選取
本文將采用的3種單體算法分別進(jìn)行研究,首先對(duì)其最優(yōu)訓(xùn)練樣本量進(jìn)行選擇和測(cè)試。測(cè)試訓(xùn)練樣本量的選取從4h訓(xùn)練數(shù)據(jù)至40h訓(xùn)練數(shù)據(jù),時(shí)間跨度為4h。分別對(duì)未來15min、1h、2h、3h以及4h時(shí)刻(分別對(duì)應(yīng)第一個(gè)、第二個(gè)、第三個(gè)、第四個(gè)以及第五個(gè)點(diǎn))的預(yù)測(cè)數(shù)據(jù)進(jìn)行分析。以卡爾曼算法為例,圖1為卡爾曼算法五個(gè)點(diǎn)的預(yù)測(cè)均方根誤差與訓(xùn)練樣本量之間的關(guān)系。
由圖1可以看出,第一個(gè)點(diǎn)和第二個(gè)點(diǎn)的均方根誤差隨著訓(xùn)練樣本量的增加,基本上是逐漸增大的;而到第三個(gè)點(diǎn)時(shí),此規(guī)律就沒有這么明顯;第四和第五個(gè)點(diǎn)的均方根誤差隨著訓(xùn)練樣本量的增加,幾乎沒有明顯變化,呈現(xiàn)出相對(duì)穩(wěn)定的狀態(tài)。因?yàn)榭柭惴ǖ脑砭褪切拚到y(tǒng)誤差,所以對(duì)鄰近時(shí)刻的數(shù)據(jù)比較敏感。綜合穩(wěn)定性和各單體算法的原理,將3種單體算法的訓(xùn)練樣本量設(shè)定為32(8h)個(gè)數(shù)據(jù)點(diǎn)。
(二)各單體算法的實(shí)現(xiàn)與驗(yàn)證
本文選取的自變量為短期預(yù)測(cè)功率和時(shí)間向前推4h歷史實(shí)際功率,因變量為當(dāng)前歷史實(shí)際功率。同時(shí),對(duì)回歸模型殘差服從標(biāo)準(zhǔn)正態(tài)分布的這一假設(shè)進(jìn)行了驗(yàn)證。圖2是多元回歸殘差的分布圖,從圖中可以看出殘差基本是以0為中心,向左右兩邊均勻分布的。
圖1 卡爾曼算法預(yù)測(cè)結(jié)果(不同預(yù)測(cè)點(diǎn))的誤差和訓(xùn)練樣本量之間的關(guān)系
圖2 多元回歸模型所得殘差頻數(shù)分布直方圖
圖3 多元回歸模型所得預(yù)測(cè)結(jié)果和實(shí)際功率曲線圖
圖3展示了回歸模型的預(yù)測(cè)效果,可以看出,回歸模型的預(yù)測(cè)在整體上是把握了整體趨勢(shì)的變化;但在局部點(diǎn)上還是存在較大的差異。風(fēng)電功率預(yù)測(cè)誤差主要分為兩種,第一種是縱向誤差,第二種為橫向誤差;其中縱向誤差主要描述了某一時(shí)段的預(yù)測(cè)結(jié)果在豎直方向與實(shí)際結(jié)果的差別,可以用偏大或偏小來衡量;而橫向誤差則主要描述預(yù)測(cè)結(jié)果在水平時(shí)間軸上與實(shí)際結(jié)果的差別??梢娀貧w模型的優(yōu)點(diǎn)就是降低了橫向誤差,但對(duì)縱向誤差并沒有明顯的效果。
圖4為訓(xùn)練數(shù)據(jù)經(jīng)過平穩(wěn)化后的ACF和PACF圖,從圖中可以看出,ACF和PACF都是1階截尾的,所以可以初步確定模型為ARMA(1,1)。
最后,對(duì)未來4h的實(shí)際出力進(jìn)行預(yù)測(cè)。圖5是ARIMA算法所得的超短期預(yù)測(cè)結(jié)果和實(shí)際出力的對(duì)比圖,可以看出,該模型能夠降低預(yù)測(cè)功率和實(shí)際功率的縱向誤差,較好地?cái)M合未來4h實(shí)際功率的縱向波動(dòng)。
卡爾曼算法主要從動(dòng)態(tài)修正的思想和系統(tǒng)誤差這一方向來解決問題??柭惴ǖ妮斎霐?shù)據(jù)為歷史實(shí)際功率和短期預(yù)測(cè)功率,通過實(shí)時(shí)數(shù)據(jù)動(dòng)態(tài)修正短期預(yù)測(cè)功率。圖6展示了卡爾曼算法的修正效果,從圖中可以看出,經(jīng)過卡爾曼算法對(duì)誤差的動(dòng)態(tài)修正,使得超短期的預(yù)測(cè)更能“貼近”實(shí)際功率。因此,與多元回歸模型不同的是卡爾曼算法對(duì)降低縱向誤差有著顯著的效果。
(三)組合算法的實(shí)現(xiàn)與驗(yàn)證
通過對(duì)每個(gè)單體算法的分析與驗(yàn)證,給出了本文選取此3種算法的依據(jù)。將這3種算法通過最小方差組合算法進(jìn)行組合。
圖4 平穩(wěn)數(shù)據(jù)的ACF和PACF圖
圖5 ARIMA超短期功率預(yù)測(cè)結(jié)果和實(shí)際功率曲線圖
圖6 卡爾曼模型所得預(yù)測(cè)結(jié)果和實(shí)際功率以及短期預(yù)測(cè)功率曲線圖
圖7 各單體算法和組合算法預(yù)測(cè)誤差對(duì)比圖
圖7是3種單體算法和組合算法預(yù)測(cè)誤差的對(duì)比圖。其中ARIMA算法和卡爾曼算法所得誤差的變化較劇烈;組合算法在每個(gè)點(diǎn)上的誤差幾乎都能達(dá)到最小。通過計(jì)算得組合預(yù)測(cè)誤差的方差為4.2519,ARIMA算法誤差的方差12.7935,多元回歸算法誤差的方差為6.2052,卡爾曼算法誤差的方差為11.8062。所以,可以驗(yàn)證Var(e)min≤min(Var(ei))。
圖8是各單體算法和組合算法的超短期預(yù)測(cè)結(jié)果對(duì)比圖??梢娮钚》讲罱M合算法所得預(yù)測(cè)結(jié)果均優(yōu)于3種單體算法預(yù)測(cè)結(jié)果。
本文采用云南省份8個(gè)風(fēng)電場(chǎng)近半年的數(shù)據(jù)對(duì)每種算法進(jìn)行訓(xùn)練,每種方法選取不同的預(yù)測(cè)長(zhǎng)度進(jìn)行分析,預(yù)測(cè)長(zhǎng)度分為 15min、1h、2h、3h、4h。表1展示了不同預(yù)測(cè)長(zhǎng)度下每種算法的預(yù)測(cè)誤差和準(zhǔn)確率。
實(shí)驗(yàn)結(jié)果表明,當(dāng)預(yù)測(cè)時(shí)長(zhǎng)小于2h時(shí),單體算法ARIMA算法表現(xiàn)最優(yōu);當(dāng)預(yù)測(cè)時(shí)長(zhǎng)在2~4h時(shí),組合算法表現(xiàn)最優(yōu)。
圖8 各單體算法和組合算法的超短期功率預(yù)測(cè)結(jié)果對(duì)比圖
表1 不同預(yù)測(cè)步長(zhǎng)不同算法的預(yù)測(cè)誤水平
風(fēng)電場(chǎng)的輸出功率在一定程度上呈現(xiàn)隨機(jī)性和波動(dòng)性的特點(diǎn),并且隨著預(yù)測(cè)時(shí)長(zhǎng)的變大,這種隨機(jī)性和波動(dòng)性的特點(diǎn)表現(xiàn)尤為突出。單體算法會(huì)導(dǎo)致某些預(yù)測(cè)點(diǎn)存在較大的誤差,組合算法會(huì)在某種程度上降低誤差。單體預(yù)測(cè)算法是組合算法的基礎(chǔ),其預(yù)測(cè)結(jié)果的好壞直接影響組合預(yù)測(cè)的效果,本文將不同的輸入信息分別輸入到3種單體算法中,并利用了單體算法自身的預(yù)測(cè)優(yōu)勢(shì),有效避免了采用相似的單體預(yù)測(cè)算法進(jìn)行組合帶來的模型冗余。在預(yù)測(cè)時(shí)段較長(zhǎng)時(shí),本文提出組合算法彌補(bǔ)了單體算法建模預(yù)測(cè)的不足。在進(jìn)行超短期預(yù)測(cè)時(shí),多元回歸算法能較準(zhǔn)確預(yù)測(cè)出實(shí)際功率未來4h的變化趨勢(shì),但在縱向上多元回歸所產(chǎn)生的預(yù)測(cè)功率和實(shí)際功率還存在較大的誤差;ARIMA算法能夠較好地?cái)M合未來4h實(shí)際功率的縱向波動(dòng),從而在多元回歸算法的基礎(chǔ)上,降低預(yù)測(cè)功率和實(shí)際功率的縱向誤差,卡爾曼算法能較好地對(duì)未來4h的實(shí)際功率預(yù)測(cè)值進(jìn)行動(dòng)態(tài)修正。針對(duì)西北和部分南方區(qū)域,超短期考核第4h點(diǎn),組合算法表現(xiàn)較優(yōu)。