鄒 文,丁巧林,楊 宏,張 偉
(華北電力大學(xué) 電氣與電子工程學(xué)院,河北 保定 071003)
基于Mycielski算法的風(fēng)電場風(fēng)速預(yù)測
鄒 文,丁巧林,楊 宏,張 偉
(華北電力大學(xué) 電氣與電子工程學(xué)院,河北 保定 071003)
對已有的風(fēng)速預(yù)測方法進行了總結(jié)歸類,并使用一種新穎的基于Mycielski算法進行風(fēng)電場風(fēng)速預(yù)測,建立了基于該算法的預(yù)測模型,并且同持續(xù)法風(fēng)速預(yù)測進行對比,同時對二者的誤差進行了分析。實驗結(jié)果表明,基于Mycielski風(fēng)速預(yù)測模型在風(fēng)速平滑段有著非常高的預(yù)測精度,其均方根誤差與誤差方差均小于持續(xù)法,誤差為零的概率高于持續(xù)法。
風(fēng)電場;風(fēng)速預(yù)測;Mycielski算法
目前,風(fēng)電場風(fēng)速預(yù)測的主要方法有:持續(xù)法[1]、時間序列法、卡爾曼濾波法、人工神經(jīng)網(wǎng)絡(luò)法、模糊邏輯法等。持續(xù)法是以上方法中最簡單的預(yù)測模型,該方法將最近一點的風(fēng)速作為下一點的預(yù)測值[2],模型簡單,但十分有效,通常被用作評價其他風(fēng)速預(yù)測模型的標(biāo)準(zhǔn)。時間序列法是在持續(xù)法的基礎(chǔ)上進行改進,主要利用自回歸滑動平均模型 (ARMA)或差分自回歸滑動模型 (ARIMA) 進行預(yù)測[3,4],預(yù)測精度有一定的提升,但預(yù)測時有明顯的延時誤差??柭鼮V波法[5],該方法與時間序列法混合建模,改進了時間序列法預(yù)測時出現(xiàn)延時的問題,并且提高了預(yù)測精度。人工神經(jīng)網(wǎng)絡(luò)法是一種智能方法[6,7],目前許多學(xué)者采用BP神經(jīng)網(wǎng)絡(luò)進行風(fēng)速序列的建模,由于該方法有很強的自學(xué)習(xí)、自組織、自適應(yīng)能力,從而使得預(yù)測結(jié)果能達(dá)到一定的精度。模糊邏輯法[2]主要是應(yīng)用模糊邏輯和預(yù)報人員的專業(yè)知識將數(shù)據(jù)和語言形成模糊規(guī)則庫,然后選用一個線性模型逼近非線性動態(tài)變化的風(fēng)速,由于模糊預(yù)測的學(xué)習(xí)能力較弱,從而預(yù)測效果不佳,有待進一步完善。
本文使用一種全新的理念來進行風(fēng)速預(yù)測——基于 Mycielski算法[8]的風(fēng)速預(yù)測。該算法由Ehrenfeucht和Mycielski于1992年提出,是一種基于模式匹配的預(yù)測算法。2002年,P.Jacquet等又在其基礎(chǔ)上進行了改進[9],提出了基于該算法的通用預(yù)測算法,并且證明該算法可應(yīng)用于非線性預(yù)測領(lǐng)域。目前該算法已應(yīng)用于蛋白質(zhì)的DNA序列的預(yù)測,信號預(yù)測編碼等領(lǐng)域[10]。該算法主要思想是將歷史數(shù)據(jù)作為一個樣本序列,通過對這個序列從后向前搜索,找出在該樣本序列中存在的與該序列尾部子序列相同的最長樣本子序列,然后將該樣本子序列的下一個或幾個樣本值作為預(yù)測值。
本文使用Mycielski算法[11]對風(fēng)速序列建模,并與持續(xù)法對風(fēng)速序列建模預(yù)測進行對比。
在一日內(nèi)風(fēng)向風(fēng)速有周期性的變化,稱為風(fēng)速的日變化。風(fēng)速的日變化規(guī)律,是隨著溫度升高而增大,隨溫度降低而減小。因此白天風(fēng)速大于夜間。取我國某地風(fēng)速數(shù)據(jù)觀察得知,該地區(qū)風(fēng)速一般從8點以后風(fēng)速逐漸加大,到15點前后達(dá)頂峰,以冬春季最為明顯。如果沒有特殊原因,重復(fù)性較為明顯。
風(fēng)速隨季節(jié)變化也有一定的規(guī)律,一般來說冬春季北半球氣壓梯度大,風(fēng)速也大,尤其是春季,冷暖氣團頻繁交替,風(fēng)速達(dá)全年最大,夏秋季節(jié)風(fēng)小一些。除去特殊原因如夏季由于強烈的太陽輻射,局部受熱不均導(dǎo)致短時雷暴大風(fēng)外,風(fēng)速數(shù)據(jù)有著很強的重復(fù)性。
將歷史數(shù)據(jù)作為一個樣本序列,在這個樣本序列中搜索最長的子序列,然后將該樣本序列的下一個或幾個樣本值作為當(dāng)前子序列的預(yù)測值。首先從該序列的尾部開始,當(dāng)序列長度最小時 (即長度length=1),在樣本序列中對其進行匹配,當(dāng)匹配成功后便增加尾部子序列的長度,繼續(xù)進行下次匹配。例如對一長度為n的序列X分析,從該序列尾部(xn)開始,匹配成功后增加長度變?yōu)?(xn,xn-1)繼續(xù)匹配,經(jīng)過不斷增加長度進行查找,最終會找出在樣本序列中與其相同的最長樣本子序列,而后,該樣本子序列的右側(cè)元素就是所要的預(yù)測值。
在對樣本序列從后向前搜索的過程中,尾部子串的長度隨著匹配的進行而不斷變長,終會遇到這種情況,當(dāng)查找完全部歷史序列而不能找到與其匹配的歷史子序列時,意味著從此以后已不可能找到更長的子序列,從而循環(huán)結(jié)束。在查找過程中也會遇到這樣的情況,在歷史序列中會有不止一個子序列與最大尾部子序列相同,選擇距離尾部最近的子序列作為匹配序列,同時將其右側(cè)的風(fēng)速模式提取出作為預(yù)測值。
以上算法可以用下式來表示:
其中fn+1為一匹配函數(shù),其具體匹配過程如下所示:
從上述算法簡介中可以看出,該算法是對一定范圍內(nèi)有限個離散的點進行搜索,而后進行匹配,而風(fēng)速每小時的實測數(shù)據(jù)是位于最大風(fēng)速vmax與最小風(fēng)速vmin之間的隨機數(shù),由于其所處于一個連續(xù)的區(qū)間 [vmin,vmax]該區(qū)間內(nèi)有無限個點,從而風(fēng)速數(shù)據(jù)可以是其中的任一點,這樣便造成了組成風(fēng)速序列的元素趨于無窮,增加了后期相同風(fēng)速進行匹配的難度。因此,在進行搜索匹配前,應(yīng)先對區(qū)間 [vmin,vmax]進行離散化處理,將該區(qū)間離散為有限個點,稱之為風(fēng)速模式,然后將風(fēng)速歷史數(shù)據(jù)依照就近原則,轉(zhuǎn)化為與之相對應(yīng)的風(fēng)速模式,而后進行匹配。
離散化的具體方法如下:風(fēng)速模式為vR,取其最大值為大于vmax的最小整數(shù),記為vRmax=min{n∈Z|x≥n},最小值 vRmin=vmin=0。將區(qū)間 [0,vRmax]m等分 (m=αvRmax,α為任意數(shù)),則各等分點分別為kvRmax/m(k=0,1,…,m),本文取α=1,則有vRmax個等分點,而后將這些等分點分別作為風(fēng)速模式子區(qū)間的中點,將風(fēng)速模式分成vRmax-1個子區(qū)間,如果實測風(fēng)速值落入相同的子區(qū)間中,則認(rèn)為該實測風(fēng)速近似等于該子區(qū)間風(fēng)速模式。
實測風(fēng)速經(jīng)過模式化后,進而可以依照Mycielski算法進行匹配。
本文選取國內(nèi)某地2006年3月至2007年3月的實測風(fēng)速作為原始數(shù)據(jù)。該地實測風(fēng)速與模式化后的風(fēng)速如圖1所示,其統(tǒng)計規(guī)律如表1所示,從表中可以看出二者有著相同的統(tǒng)計學(xué)規(guī)律。
使用持續(xù)法與基于Mycielski預(yù)測的方法分別進行建模。同時,為了確定兩種方法的特點,使用持續(xù)法得出的預(yù)測風(fēng)速與實測風(fēng)速作對比,如圖2所示?;贛ycielski法得出的預(yù)測風(fēng)速與實測風(fēng)速對比如圖3所示。從兩圖中可以看出,使用持續(xù)法預(yù)測,預(yù)測與實測曲線雖然有著相同的形狀,但預(yù)測曲線由于時延,造成每點都或多或少存在誤差,完全正確預(yù)測的點極為稀少,在風(fēng)速突變的點更容易產(chǎn)生較大的誤差。而后者在風(fēng)速平滑段有極高的預(yù)測精度。
圖1 實測風(fēng)速與模式風(fēng)速Fig.1 Measured wind speed and model wind speed
表1 實測風(fēng)速與模式風(fēng)速的統(tǒng)計學(xué)數(shù)據(jù)Tab.1 Statistical data of measured wind speed and model wind speed
兩種方法預(yù)測的誤差如圖4,5所示,圖4為持續(xù)法預(yù)測誤差,圖5為基于模式匹配預(yù)測誤差,從圖中可以看出,二者最大誤差相似,但后者的預(yù)測誤差較為集中。
二者的統(tǒng)計學(xué)規(guī)律如表2所示。表2中最后一列均方根誤差是評價預(yù)測方法的主要依據(jù)之一,該誤差公式如下:
表2 兩種方法預(yù)測誤差統(tǒng)計Tab.2 Error statistics of two methods
從該表中可以看出,二者預(yù)測誤差的最大值相差無幾,但后者誤差的方差與均方根誤差均小于前者。
圖6,圖7為兩種方法誤差的概率密度圖,從圖中可以看出,兩種方法的預(yù)測誤差都符合標(biāo)準(zhǔn)正態(tài)分布,但Mycielski算法預(yù)測的誤差為零的概率高于持續(xù)法預(yù)測。
本文使用了一種新穎的風(fēng)速預(yù)測方法——基于Mycielski算法的風(fēng)速預(yù)測,并且在此方法基礎(chǔ)上構(gòu)建出具有較高精度的風(fēng)速預(yù)測模型。該模型與其他智能方法相比簡單明了,但預(yù)測精度卻非常高,因此具有高精度、低復(fù)雜度的特性。
[1]Brown B G,Katz R W,Murphy A H.Time series models to simulate and forecast wind speed andwind power[J].Journal of Climate and Applied Meteorology,1984(23):1184-1195.
[2] Alexiadis M C,Dokopoulos D S,Sahsamanoglou H S,et al.Short term forecasting of wind speed and related electrical power[J].Solar Energy,1998,63(1):61 -68.
[3]楊秀媛,肖洋,陳樹勇.風(fēng)電場風(fēng)速和發(fā)電功率預(yù)測研究[J].中國電機工程學(xué)報,2005,25(11):1-5.
Yang Xiuyuan,Xiao Yang,Chen Shuyong.Wind speed and generated power forecasting in wind farm [J].Proceedings of the CSEE,2005,25(11):1-5.
[4]丁明,張立軍,吳義純.基于時間序列分析的風(fēng)電場風(fēng)速預(yù)測模型 [J].電力自動化設(shè)備,2005,25(8):32-34.
Ding Ming,Zhang Lijun,Wu Yichun.Wind speed forecast model for wind farms based on time series analysis[J].Electric Power Automation Equipment,2005,25(8):32-34.
[5]潘迪夫,劉輝,李燕飛.基于時間序列分析和卡爾曼濾波算法的風(fēng)電場風(fēng)速預(yù)測優(yōu)化模型 [J].電網(wǎng)技術(shù),2008,32(7):82-86.
Pan Difu,Liu Hui,Li Yanfei.A wind speed forcasting optimization model for wind farms based on time series analysis and kalman filter algorithm [J].Power System Technology,2008,32(7):82 -86.
[6]肖永山,王維慶,霍曉萍.基于神經(jīng)網(wǎng)絡(luò)的風(fēng)電場風(fēng)速時間序列預(yù)測研究 [J].節(jié)能技術(shù),2007,25(2):106-108,175.
Xiao Yongshan,Wang Weiqing,Huo Xiaoping.Study on the time-series wind speed forecasting of the wind farm based on neural networks[J] .Energy Conservation Technology,2007,25(2):106-108,175.
[7]范高峰,王偉勝,劉純,等,基于人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測 [J].中國電機工程學(xué)報,2008,34(28):118-123.
Fan Gaofeng,Wang Weisheng,Liu Chun,et al,Wind power prediction based on artificial neural network[J].Proceedings of the CSEE,2008,34(28):118-123.
[8] Ehrenfeucht A,Mycielski J,A pseudorandom sequencehow random is it,American Mathematical Monthly, [J]1992,99(4):374-375.
[9] Jacquet P,Szpankowski W Apostol I,A universal predictor based on pattern matching[J].IEEE Trans Inform Theory,2002,48(6):1462 -1472.
[10] M Fidan,N Gerek.A time improvement over the Mycielski algorithm for predictive signal coding:Mycielski-78[C].Proc 14th European Signal Processing Conference EUSIPCO 2006,F(xiàn)lorence,Sep.2006.
[11] Fatih O ,Mehmet Fidan,N Gerek.Mycielski approach for wind speed prediction [J].Energy Conversvon and Management,2009,50(6):1436 -1443.
Wind Speed Prediction Based on Mycielski Algorithm
Zou Wen,Ding Qiaolin,Yang Hong,Zhang Wei
(School of Electrical and Electronic Engineering,North China Electric Power University,Baoding 071003,China)
Wind speed prediction has an important significance on large scale wind power integration.In this paper,wind speed prediction methods have been summarized and categorized,and a novel prediction model based on the Mycielski algorithm for wind speed forecast is established.The method is compared with persistence algorithm,and their errors are analyzed.The results show that,Mycielski wind speed prediction model has very high prediction accuracy at wind speed smooth section,whose RMSE and Error Variance are all less than persistence method,and zero-error probability is higher than persistence method.
wind farm;wind speed prediction;Mycielski algorithm
TM614
A
2010-08-01。
鄒文 (1986-),男,碩士研究生,主要研究方向為電力系統(tǒng)信息分析處理,E-mail:atf125@163.com。