江漢大學(xué)人工智能學(xué)院 陳 巖 周 晨 侯 群
風(fēng)電功率的預(yù)測(cè)對(duì)風(fēng)力發(fā)電系統(tǒng)具有重要意義,然而,風(fēng)力發(fā)電的輸出功率具有較大的波動(dòng)性和間歇性,這對(duì)制定發(fā)電計(jì)劃、調(diào)度運(yùn)行帶來(lái)了巨大的挑戰(zhàn)。本文介紹了一種基于SVM算法對(duì)風(fēng)電功率進(jìn)行預(yù)測(cè)的方法,將風(fēng)電功率的歷史數(shù)據(jù)作為因變量,將其對(duì)應(yīng)的影響風(fēng)電功率的主要因素?cái)?shù)據(jù)作為自變量,使用SVM回歸方法建立預(yù)測(cè)模型,找出最佳的模型參數(shù),將需要預(yù)測(cè)的數(shù)據(jù)自變量輸入到模型中,有效并準(zhǔn)確地預(yù)測(cè)出風(fēng)電功率數(shù)據(jù),預(yù)測(cè)準(zhǔn)確度可達(dá)到94%以上。
隨著地球環(huán)境的污染和不可再生資源的過(guò)度消耗,人們把更多的目光投在了可再生資源身上。風(fēng)資源作為一種清潔能源,取之不盡,用之不竭,和目前常見(jiàn)的火力發(fā)電相比,沒(méi)有污染排放,也沒(méi)有煤炭資源消耗。中國(guó)作為風(fēng)資源儲(chǔ)量巨大的國(guó)家,裝機(jī)量逐年提高,從保護(hù)環(huán)境和節(jié)約資源的角度來(lái)看,風(fēng)力發(fā)電具有良好的未來(lái)發(fā)展前景。
風(fēng)電功率是風(fēng)力發(fā)電系統(tǒng)中最為重要的指標(biāo)之一,然而,風(fēng)電功率會(huì)受到風(fēng)速、風(fēng)向角等因素的影響,因此對(duì)風(fēng)電功率預(yù)測(cè)的準(zhǔn)確性成為了關(guān)鍵。
國(guó)外風(fēng)電功率預(yù)測(cè)研究工作起步較早,比較有代表性的方法主要有:丹麥的Riso國(guó)家實(shí)驗(yàn)室的Prediktor預(yù)測(cè)系統(tǒng)、西班牙的LocalPred預(yù)測(cè)系統(tǒng)和德國(guó)AWPT預(yù)測(cè)系統(tǒng)等。其主要思想均是利用數(shù)值天氣預(yù)測(cè)提供風(fēng)機(jī)輪轂高度的風(fēng)速、風(fēng)向等預(yù)測(cè)信息,然后利用風(fēng)電功率預(yù)測(cè)模塊提供風(fēng)電功率。
我國(guó)風(fēng)力發(fā)電起步雖然較晚,但是在數(shù)十年來(lái)的發(fā)展趨勢(shì)不容忽視,過(guò)快的發(fā)展速度導(dǎo)致了風(fēng)電行業(yè)質(zhì)量跟不上速度的結(jié)果。在近些年,我國(guó)的風(fēng)力發(fā)電領(lǐng)域開(kāi)始由快速導(dǎo)向型發(fā)展轉(zhuǎn)向質(zhì)量導(dǎo)向型發(fā)展。正是因?yàn)檫@種原因,我國(guó)風(fēng)電功率預(yù)測(cè)在二十一世紀(jì)才開(kāi)始受到行業(yè)重視,目前仍處于起步階段。
我國(guó)目前正在開(kāi)展基于人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法的風(fēng)電功率預(yù)測(cè)模型研究,以及基于線性化和計(jì)算流體力學(xué)的物理模型方法,同時(shí)正在進(jìn)行多種統(tǒng)計(jì)方法聯(lián)合應(yīng)用研究及統(tǒng)計(jì)方法與物理方法混合預(yù)測(cè)模型的研究。
本文采用機(jī)器學(xué)習(xí)中的支持向量機(jī)(SVM)算法,探討其在風(fēng)力發(fā)電機(jī)功率預(yù)測(cè)中的應(yīng)用研究,將有功功率的歷史數(shù)據(jù)及其對(duì)應(yīng)的變量數(shù)據(jù)進(jìn)行訓(xùn)練建模,并使用測(cè)試數(shù)據(jù)集對(duì)預(yù)測(cè)模型進(jìn)行檢驗(yàn)。
支持向量機(jī)(Support Vector Machine,SVM)是一種按監(jiān)督學(xué)習(xí)(supervised learning)方式對(duì)數(shù)據(jù)進(jìn)行二元分類(lèi)的廣義線性分類(lèi)器(generalized linear classifier),其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面(maximum-margin hyperplane)。
SVM使用鉸鏈損失函數(shù)(hinge loss)計(jì)算經(jīng)驗(yàn)風(fēng)險(xiǎn)(empirical risk)并在求解系統(tǒng)中加入了正則化項(xiàng)以?xún)?yōu)化結(jié)構(gòu)風(fēng)險(xiǎn)(structural risk),是一個(gè)具有稀疏性和穩(wěn)健性的分類(lèi)器,SVM可以通過(guò)核方法進(jìn)行非線性分類(lèi),是常見(jiàn)的核學(xué)習(xí)方法之一。
SVM在1964年被提出,在二十世紀(jì)90年代后得到快速發(fā)展并衍生出一系列改進(jìn)和擴(kuò)展算法,在人像識(shí)別、文本分類(lèi)等模式識(shí)別問(wèn)題中得到應(yīng)用。
影響風(fēng)力發(fā)電機(jī)功率的變量有很多,如風(fēng)速,空氣密度,發(fā)電機(jī)扇葉半徑,風(fēng)向角等等,如果將這些因素都考慮進(jìn)去來(lái)預(yù)測(cè)風(fēng)電功率則需要大量數(shù)據(jù),所以?xún)H選取影響較大的幾個(gè)變量對(duì)風(fēng)電功率進(jìn)行預(yù)測(cè)。
根據(jù)風(fēng)電功率計(jì)算公式:
其中,p為風(fēng)電功率,A為掃風(fēng)面積,V為風(fēng)速,Cp為風(fēng)能轉(zhuǎn)化率值,D為空氣密度,φ為功率因子。
在風(fēng)電功率計(jì)算公式中,掃風(fēng)面積與風(fēng)機(jī)葉片半徑和風(fēng)向角有關(guān),風(fēng)能轉(zhuǎn)化率值與風(fēng)機(jī)生產(chǎn)廠家技術(shù)的不同而有所高低,所以在單臺(tái)風(fēng)機(jī)的風(fēng)速預(yù)測(cè)中,最直接的影響因素為風(fēng)速、風(fēng)向角和功率因子。
本文選取風(fēng)力發(fā)電機(jī)連續(xù)12h的有功功率數(shù)據(jù),采樣間隔為30s,共計(jì)1440條數(shù)據(jù),其中前1080條設(shè)置為訓(xùn)練集,后360條設(shè)置為測(cè)試集。
訓(xùn)練集和測(cè)試集數(shù)據(jù)均分為自變量和因變量?jī)刹糠郑蜃兞繛榘l(fā)電機(jī)有功功率,自變量為功率因子、瞬時(shí)風(fēng)速、30s平均風(fēng)速、10min平均風(fēng)速、風(fēng)向角和60s平均風(fēng)向角六個(gè)變量,首先對(duì)歷史數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
在建模訓(xùn)練的過(guò)程中,不同的評(píng)價(jià)指標(biāo)往往具有不同的量綱和量綱單位,這樣的情況會(huì)對(duì)數(shù)據(jù)分析的結(jié)果造成影響,為了消除這種影響,需要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,以解決數(shù)據(jù)指標(biāo)之間的可比性問(wèn)題。原始數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)標(biāo)準(zhǔn)化處理后,各指標(biāo)處于同一數(shù)量級(jí),適合進(jìn)行綜合對(duì)比評(píng)價(jià)。在這里,本文選用數(shù)據(jù)歸一化來(lái)對(duì)數(shù)據(jù)進(jìn)行處理。利用公式:
其中,y為歸一化后的目標(biāo)值,x為原始數(shù)據(jù),xmax為原始數(shù)據(jù)最大值,xmin為原始數(shù)據(jù)最小值。
支持向量回歸(Support Vector Regression)是支持向量機(jī)的重要分支,目的是找到一個(gè)平面,使一個(gè)集合的所有數(shù)據(jù)到該平面的距離最近,以達(dá)到預(yù)測(cè)的目的。
式中,ε為常數(shù),C為懲罰因子,ζi和為松弛因子。
對(duì)上述公式引入拉格朗日乘子ai和,轉(zhuǎn)化為對(duì)偶問(wèn)題,則優(yōu)化函數(shù)為:
構(gòu)造支持向量回歸模型需要借助算法計(jì)算對(duì)偶參數(shù),本文選取徑向基核函數(shù)(RBF),這里需要確定SVM算法的懲罰因子C和RBF核函數(shù)參數(shù)γ。
懲罰因子C代表模型重視離群點(diǎn)的程度,C越大表示越不能容忍出現(xiàn)誤差,容易出現(xiàn)過(guò)擬合的情況,而C越小則容易出現(xiàn)欠擬合的情況。C值的過(guò)大或過(guò)小都表示其泛化能力變差。
伽馬值γ是選擇RBF函數(shù)作為核函數(shù)后,自帶的一個(gè)參數(shù),隱含地決定了數(shù)據(jù)映射到新的特征空間后的分布,伽馬值越大,支持向量越少,伽馬值越小,支持向量越多,其影響著訓(xùn)練與預(yù)測(cè)的速度。
在訓(xùn)練樣本數(shù)據(jù)的過(guò)程中,時(shí)常會(huì)遇到數(shù)據(jù)缺失的情況,也就是缺失了特征數(shù)據(jù),導(dǎo)致向量數(shù)據(jù)不完整。SVM算法沒(méi)有處理缺失值的策略,并且希望樣本在特征空間中線性可分,所以特征空間的好壞會(huì)對(duì)SVM的性能有較大影響,會(huì)直接導(dǎo)致訓(xùn)練結(jié)果乃至預(yù)測(cè)精度。針對(duì)這種情況,有兩種解決方法,一是選取正常工況下連續(xù)的、質(zhì)量較高的數(shù)據(jù),二是對(duì)不完整的數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理,通過(guò)數(shù)據(jù)清理來(lái)填寫(xiě)缺失值、識(shí)別并刪除離群點(diǎn)的方式使數(shù)據(jù)集達(dá)到較高的質(zhì)量。結(jié)合實(shí)際情況,本文選擇第一種方法選取了正常工況下的連續(xù)風(fēng)電數(shù)據(jù)。
通過(guò)對(duì)樣本數(shù)據(jù)的訓(xùn)練,調(diào)整最適合模型的C值和伽馬值,即可得到風(fēng)電功率預(yù)測(cè)模型。在這里使用一款SVM模式識(shí)別與回歸的工具包LIBSVM,使用回歸模型函數(shù)svmtrain,函數(shù)參數(shù)為訓(xùn)練集數(shù)據(jù),得到最優(yōu)的懲罰因子C為4,伽馬值γ為0.3536。整個(gè)預(yù)測(cè)模型的流程圖如圖1所示。
圖1 預(yù)測(cè)模型流程圖
圖2 訓(xùn)練集數(shù)據(jù)及其預(yù)測(cè)值曲線
圖3 測(cè)試集數(shù)據(jù)及其預(yù)測(cè)曲線
圖4 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)曲線
原始數(shù)據(jù)為國(guó)內(nèi)某風(fēng)力發(fā)電機(jī)2018年7月14日21:00——2018年7月15日9:00的30s采樣間隔數(shù)據(jù),在對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià)時(shí),使用RBF核函數(shù)自帶的svmpredict方法,加入誤差參數(shù)。如圖2所示,在訓(xùn)練結(jié)束后得到訓(xùn)練集預(yù)測(cè)的擬合程度為0.94861,其中,參數(shù)C為4,γ為0.3536。
將測(cè)試集數(shù)據(jù)輸入到已經(jīng)確定參數(shù)的模型中去,從圖3所示可以看出,采用SVM算法對(duì)連續(xù)時(shí)間的風(fēng)電功率進(jìn)行預(yù)測(cè),其預(yù)測(cè)曲線與實(shí)際的曲線基本一致,擬合程度達(dá)到0.94725,擬合程度較高,證明使用SVM在風(fēng)電功率預(yù)測(cè)場(chǎng)景中的可行性。
使用BP神經(jīng)網(wǎng)絡(luò)的方法對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行訓(xùn)練,得到該數(shù)據(jù)集的BP神經(jīng)網(wǎng)絡(luò),并使用該神經(jīng)網(wǎng)絡(luò)對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè),可以得到如圖4所示的預(yù)測(cè)曲線,擬合程度為0.94506,略低于基于SVM訓(xùn)練的預(yù)測(cè)模型。
結(jié)論:風(fēng)電功率預(yù)測(cè)是風(fēng)力發(fā)電系統(tǒng)中重要的一環(huán),受外界因素影響,風(fēng)電功率具有不穩(wěn)定性,需要將主要因素考慮進(jìn)來(lái)并對(duì)結(jié)果進(jìn)行預(yù)測(cè)。本文首先對(duì)樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,將歸一化后的數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,選取RBF核函數(shù)對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,得到模型參數(shù),再將測(cè)試集數(shù)據(jù)輸入到預(yù)測(cè)模型中,得到最終預(yù)測(cè)結(jié)果。該模型的預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)相比,擬合度可以達(dá)到94.7%。同時(shí),使用BP神經(jīng)網(wǎng)絡(luò)的方法對(duì)風(fēng)電功率進(jìn)行預(yù)測(cè),可以得到略低于SVM方法的擬合精度,再次印證了SVM算法在風(fēng)電功率預(yù)測(cè)領(lǐng)域的可行性。此外,對(duì)于SVM的一些其他改進(jìn)算法對(duì)風(fēng)電功率預(yù)測(cè)精度的效果,可以期待后續(xù)的探討。