祁 樂,唐 健,江 平,鄭芳雯,劉德志
(1.廣西電網(wǎng)電力調(diào)度控制中心,廣西 南寧 530023;2.北京心知科技有限公司,北京 100102)
隨著海上風(fēng)電制造、安裝、并網(wǎng)成本的逐步下降,海上風(fēng)電開發(fā)不斷向深海拓展,預(yù)計中國海上風(fēng)電累計裝機容量將在2025年達(dá)到2 500萬kW[1]。海上風(fēng)電場裝機規(guī)模大、風(fēng)能質(zhì)量高,但因海上存在風(fēng)流熱效應(yīng)和放大的尾流效應(yīng)等,且海上風(fēng)電功率預(yù)測技術(shù)發(fā)展較晚,故海上風(fēng)電功率預(yù)測一般以陸上風(fēng)電模型為基準(zhǔn),并結(jié)合海上特征加以改進,相關(guān)研究證明該做法切實可行[2]。
傳統(tǒng)的風(fēng)功率預(yù)測方法可分為物理模型、統(tǒng)計模型和將二者結(jié)合的方法[3]。隨著氣象數(shù)值模式性能的提高,目前主流采用結(jié)合法,即使用機器學(xué)習(xí)方法對數(shù)值天氣預(yù)報(Numerical Weather Prediction,NWP)風(fēng)速預(yù)測結(jié)果進行誤差訂正后處理,得到較為準(zhǔn)確的風(fēng)速,并基于優(yōu)化后的風(fēng)速進行風(fēng)電功率預(yù)測[4]。
通過引入多位置NWP 信息,可有效避免出現(xiàn)單位置NWP 無法準(zhǔn)確描述風(fēng)電場氣象信息的問題,提高預(yù)測精度[5-6]。文獻(xiàn)[7]同時考慮多位置NWP 與非典型氣象特征,基于最大相關(guān)-最小冗余原則和主成分分析進行特征選擇,減少整體冗余性,有效降低了預(yù)測模型的訓(xùn)練時間。此外,考慮風(fēng)機數(shù)據(jù)的時間相關(guān)性,用聚類分析方法生成不同天氣類型數(shù)據(jù),針對不同天氣類型進行NWP 數(shù)據(jù)訂正后處理,能進一步提升預(yù)報能力[8]。文獻(xiàn)[9]考慮功率變化趨勢,獲取更優(yōu)的性能,可在一定程度上解決功率波動大的問題,即爬坡問題。然而上述研究只針對風(fēng)電場的單一風(fēng)速,缺乏對大型風(fēng)電場內(nèi)部差異的充分考慮,沒有利用機組各風(fēng)機的歷史信息。
機組分類是研究大型風(fēng)電場發(fā)電規(guī)律的重要手段,相關(guān)研究也表明基于風(fēng)電場機組分類的功率輸出模型能有效代表實際功率輸出情況,可降低功率建模過程的復(fù)雜度和時間[10]。近年來,考慮機組分類的短期功率預(yù)測的研究表明,風(fēng)電場內(nèi)不同風(fēng)機受地形、尾流、湍流影響而差異明顯,基于機組分類的功率預(yù)測優(yōu)于單一風(fēng)速的功率預(yù)測[11-13]。但遺憾的是,此類研究均僅簡單對機組的所有子類進行功率預(yù)測建模,并采用疊加法對將預(yù)測功率累加求和,受到各個子類預(yù)測精度的影響,模型誤差累計造成其精度偏低。
綜上所述,提出一種考慮多NWP 和機組分類的功率預(yù)測校正模型,基于多NWP 信息和單一風(fēng)速進行風(fēng)速訂正后處理,并通過理想功率曲線,生成初始預(yù)測功率。然后基于層次聚類[14],將風(fēng)電場內(nèi)風(fēng)力發(fā)電機組分類成若干代表組,生成若干組預(yù)測風(fēng)速;通過正則化極限學(xué)習(xí)機(Regularized Extreme Learning Machine,RELM)建立代表預(yù)報風(fēng)速與初始預(yù)測功率殘差的關(guān)系,最終校正初始預(yù)測功率。通過算例分析,所提出的模型能有機結(jié)合多NWP 和機組內(nèi)部信息,有效避免極端誤報,提高考核天的準(zhǔn)確率,減少短期功率預(yù)測考核電量。
建立的海上風(fēng)電功率模型主要由初步預(yù)測功率模型和考慮機組分類的校正模型兩部分組成。
初步預(yù)測功率模型采用經(jīng)典的兩步法,首先使用物理模型和統(tǒng)計模型結(jié)合的方法預(yù)測風(fēng)速,為了考慮多位置的NWP信息,采用適合處理高維樣本的極限梯度提升樹(Extreme Gradient Boosting,XGBoost)模型作為統(tǒng)計學(xué)模型,然后將訂正后的NWP 預(yù)測風(fēng)速代入理想功率曲線(曲線由風(fēng)機信息所得),得到初始預(yù)測功率。
為引入風(fēng)場內(nèi)部差異信息,基于層次聚類將機組S 臺風(fēng)機風(fēng)速分類為G 組,生成G 組子類平均風(fēng)速,經(jīng)訂正后處理模塊生成G 組預(yù)測風(fēng)速,作為RELM 模型的輸入,模擬初始預(yù)測功率與實際觀測功率的差值,最終校正初始預(yù)測功率。
如圖1所示,設(shè)置3組實驗。
圖1 風(fēng)功率預(yù)測流程
1)單一風(fēng)速:將風(fēng)電場平均風(fēng)速作為優(yōu)化目標(biāo),經(jīng)XGBoost 模型得優(yōu)化預(yù)報風(fēng)速,代入理想功率曲線,得預(yù)測功率P1。
2)機組分類:基于層次聚類,將S 臺風(fēng)機分為G組,分別以G 組平均風(fēng)速作為優(yōu)化目標(biāo),得G 組優(yōu)化預(yù)報風(fēng)速W,代入理想功率曲線得各組預(yù)測功率,累加得風(fēng)電場預(yù)測功率P2。
3)RELM 校正:設(shè)預(yù)測功率P1與真實功率的差距為殘差D,以D 為優(yōu)化目標(biāo),W 為RELM 模型輸入,預(yù)測殘差與P1之和即為最終預(yù)測功率P3。
為覆蓋風(fēng)電場更大范圍、涵蓋各種地形,應(yīng)選取風(fēng)電場周邊典型4~9 個位置的NWP 的氣象數(shù)據(jù),每個位置包含4 個高度層的經(jīng)向風(fēng)、緯向風(fēng)、溫度、濕度、氣壓等5 個參數(shù)信息,即每個時刻最多含180 維數(shù)據(jù)。NWP 為未來72 h 預(yù)報數(shù)據(jù),每天進行一次更新,時間分辨率插值至15 min。
對機組分類時,層次聚類法無須先驗地指定子類的個數(shù)。相較k 點均值中心法kmeans、模糊C 點均值中心法(Fuzzy C Means,F(xiàn)CM)等方法,可添加約束,調(diào)整子類的個數(shù)?;诖耍捎脤哟尉垲惙ㄖ械哪鄯?,采用自底向上策略,輸入數(shù)據(jù)機組內(nèi)所有風(fēng)機的相似性度量向量矩陣,逐步合并相似距離相近的風(fēng)機為一類,直至將所有風(fēng)機聚為一個大類。具體流程為:
1)設(shè)N 為樣本數(shù),M 為風(fēng)機數(shù),選取同一時間段參與并網(wǎng)的M1臺風(fēng)機,構(gòu)建N×M1階矩陣;
2)基于歐式距離、皮爾遜相關(guān)系數(shù)、熵相關(guān)系數(shù),計算M1個風(fēng)機兩兩間的相似性度量矩陣。
3)利用離差平方和法[15]計算不通類之間的距離d,每縮小一類,離差平方和SX就要增大,選擇使SX增加最小的兩類合并,如式(1)所示。
4)若類的個數(shù)不等于1,則重復(fù)執(zhí)行步驟3),否則執(zhí)行步驟5)。
5)保證類內(nèi)的風(fēng)機數(shù)不超過總風(fēng)機數(shù)一半,取子類個數(shù)的最大值。
6)計算聚類評判標(biāo)準(zhǔn)指數(shù)[16],確定計算相似性度量的方法。
設(shè)Y 為歷史功率,X 為歷史氣象數(shù)據(jù),則上述提及相似度距離公式為:
①歐式距離DXY為
式中:xi、yi分別為樣本i的氣象數(shù)據(jù)和功率數(shù)據(jù)。
②皮爾遜相關(guān)系數(shù)ρXY為
③熵相關(guān)系數(shù)IXY為
式中:H(X)為X 的信息熵;H(X,Y)為X、Y 聯(lián)合熵;I(X;Y)為互信息,表示X 和Y 之間共享信息量的多少。信息熵和聯(lián)合熵分別定義為:
式中:p(·)為落入?yún)^(qū)間的頻率;MX、Np分別為X、Y 升序排列等分的子區(qū)間的個數(shù),對于等分區(qū)間個數(shù)可參考式(7)。
④另外,聚類評價標(biāo)準(zhǔn)選取基于標(biāo)準(zhǔn)差指數(shù)(Standard Deviation Based Index,STDI)ISTD,其定義為類間距離與類內(nèi)距離之比,如式(8)所示,其值越大代表聚類效果越好。
式中:ck為第k類的質(zhì)心;為所有樣本的質(zhì)心;xi為第k類中的第i個樣本;nk為第k類中所有樣本數(shù)。
NWP 作為輸入特征,經(jīng)XGBoost 模型后獲得預(yù)測風(fēng)速,而預(yù)測風(fēng)速的準(zhǔn)確性是預(yù)測功率是否準(zhǔn)確的關(guān)鍵。XGBoost 為梯度提升樹(Gradient Boosting,GBoost)算法的改良版本,Boosting 屬于串行的集成方法,第t 個弱學(xué)習(xí)器優(yōu)化學(xué)習(xí)前t-1 個學(xué)習(xí)器的殘差部分,逐步引入學(xué)習(xí)器而最大化地降低目標(biāo)函數(shù),進而得到一個強學(xué)習(xí)器。由于多NWP 數(shù)據(jù)具有多維(180 個)特征,XGBoost 構(gòu)建學(xué)習(xí)器時會對特征采樣,并添加正則項,防止過擬合,同時訓(xùn)練速度快,十分適合NWP風(fēng)速訂正后處理[17]。
XGBoost 算法以CART 回歸樹為弱學(xué)習(xí)器,預(yù)測函數(shù)輸出y′為
式中:gt(·)為CART回歸樹;xi為輸入特征,i=1,…,N;T 為XGBoost 超參數(shù),指共有T 個弱學(xué)習(xí)器;F 為搜索空間。
正則化目標(biāo)函數(shù)為
式中:yi為真值樣本,i=1,…,N;J 為葉子節(jié)點的個數(shù);ω為各葉子節(jié)點權(quán)重,δ、γ、λ為超參數(shù)。
則訓(xùn)練過程如下:
1)對所有樣本,初始化一顆CART 樹,同時得預(yù)測輸出g0為
式中:c為預(yù)測輸出集合
2)對所有樣本計算負(fù)梯度rti為
3)利用負(fù)梯度,擬合一顆CART回歸樹,得到第t顆回歸樹,其對應(yīng)的葉子節(jié)點區(qū)域為Rtj,j=1,2,…,J。其中J為回歸樹t的葉子節(jié)點的個數(shù)。
4)對葉子區(qū)域j=1,2,…,J,計算最佳擬合值ctj為
5)經(jīng)T輪更新得強學(xué)習(xí)器,最終預(yù)測輸出為
國家能源局規(guī)定,所有并網(wǎng)運行的風(fēng)電場須每日定時向電網(wǎng)調(diào)度機構(gòu)提供次日00:00—24:00 發(fā)電功率曲線,稱為日前功率預(yù)測,屬短期功率預(yù)測范疇。評價標(biāo)準(zhǔn)如式(17)—式(18)所示。
式中:Ad為日前準(zhǔn)確率;Qd為日前考核電量;n為一天的預(yù)測個數(shù)(一般取96,即預(yù)測時間分辨率為15 min);PMi為i 時刻的實際功率;PPi為i 時刻的日前功率預(yù)測值;CAP為風(fēng)電場可用容量;PN為風(fēng)電場裝機容量。
對于長時間(nd天),其評價函數(shù)為準(zhǔn)確率ACC和考核電量QCE,計算公式為:
式中:Adi為第i天日前準(zhǔn)確率;Qdi為第i天日前考核電量。
相較于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),極限學(xué)習(xí)機(Extreme Learning Machine,ELM)具有結(jié)構(gòu)簡單、學(xué)習(xí)能力好、泛化能力強等優(yōu)點。如圖2,RELM 網(wǎng)絡(luò)在傳統(tǒng)ELM 模型的基礎(chǔ)上引入正則化系數(shù),可一定程度上提高功率預(yù)測模型的精度[18]。
圖2 RELM結(jié)構(gòu)
風(fēng)電場各風(fēng)機風(fēng)速進行機組分類后,經(jīng)XGBoost模型得多組子類的預(yù)測風(fēng)速,視該若干組風(fēng)速為風(fēng)電場內(nèi)的差異特征,作為RELM 模型的輸入。同時由初步功率預(yù)測模型獲取預(yù)測功率計算預(yù)測功率與實際功率之差,將功率殘差作為RELM 模型的學(xué)習(xí)目標(biāo),預(yù)測需校正的功率,獲得最終的預(yù)測功率。
設(shè)xa為“機組分類”實驗的預(yù)報風(fēng)速,d′為“單一風(fēng)速”實驗的預(yù)測功率與真實功率的殘差,f 為激活函數(shù),則RELM的輸出函數(shù)為:
式中:ωi和βi分別為輸入、輸出向量與第i 個隱含層神經(jīng)元之間的連接權(quán)值;bi為第i 個隱含層神經(jīng)元對應(yīng)的偏置值,L為隱含層個數(shù)。
將式(21)寫成矩陣形式,有:
式中:β為輸出向量與隱含層神經(jīng)元之間的連接權(quán)值向量;D′為殘差矩陣;H為激活函數(shù)矩陣。
引入正則項,得RELM的目標(biāo)函數(shù)為
隨機確定輸入權(quán)值矩陣ω 以及偏置向量b,由式(23)—式(25)可得最優(yōu)輸出權(quán)值矩陣為
式中:I為單位矩陣。
根據(jù)初始預(yù)測功率P1與最優(yōu)殘差預(yù)報,得最終預(yù)測功率P3為
對浙江某海上風(fēng)電場開展研究,其中有效試驗數(shù)據(jù)為2019-07-10至2020-04-24期間的實測風(fēng)速、功率數(shù)據(jù),采樣周期為15 min。該場站如圖3 所示,處于近海區(qū)域,北部臨近我國第一大群島,西部為大陸架,海面糙率變化各向異質(zhì),故選擇周邊9個NWP信息(NWP1—NWP 3 為群島位置)作為初步預(yù)測模型的輸入特征,剔除風(fēng)電場內(nèi)嚴(yán)重缺數(shù)的風(fēng)機后,本研究共篩選59 臺風(fēng)機數(shù)據(jù)進行研究,圖3 中鏤空圓點為風(fēng)機所在位置。
圖3 風(fēng)場風(fēng)機排布與周圍NWP位置
計算59 臺風(fēng)機2019 年風(fēng)速數(shù)據(jù)的3 種相似性度量,并將不同的度量矩陣進行層次聚類,對聚類結(jié)果計算STDI評判標(biāo)準(zhǔn)值,如表1所示。
表1 不同聚類下的STDI值
由表1 可知皮爾遜相關(guān)系數(shù)為最優(yōu)聚類的相似性度量,基于皮爾遜相關(guān)系數(shù)的聚類結(jié)果如圖4 所示,最終機組分類成4 類,每一類分布情況如圖5 所示,最終獲得4組子類平均風(fēng)速及其累計功率。
圖4 基于皮爾遜相關(guān)系數(shù)的聚類結(jié)果
圖5 不同機組子類的分布
采用2019 年數(shù)據(jù)作為初步預(yù)測功率模型的訓(xùn)練數(shù)據(jù),將2020-01-01至2020-03-01的數(shù)據(jù)同時作為初步功率模型的驗證數(shù)據(jù)和校正模型訓(xùn)練數(shù)據(jù),并利用2020-03-01 至2020-03-24 的數(shù)據(jù)對RELM模型進行參數(shù)調(diào)優(yōu),最終以2020-03-25至2020-04-24的數(shù)據(jù)驗證模型的功率預(yù)測效果。
“單一風(fēng)速”實驗將風(fēng)電場平均風(fēng)速v0作為初步預(yù)測功率模型的輸入,記為A0 組?!皺C組分類”實驗將4 組子類(A1、A2、A3、A4)平均風(fēng)速作為初步預(yù)測功率模型的輸入。最后“單一風(fēng)速”所得預(yù)測功率經(jīng)校正模型,得“RELM 校正”實驗的最終預(yù)測功率。
機組分類后,經(jīng)XGBoost 的預(yù)測風(fēng)速結(jié)果見表2。由于組內(nèi)信息較為一致,各項評價指標(biāo)較“單一風(fēng)速”的風(fēng)速預(yù)測結(jié)果要好,各類內(nèi)的風(fēng)速規(guī)律更容易被模型學(xué)習(xí)出來。由圖6 可見,各子類的預(yù)報風(fēng)速存在差異,在所選取的樣本點中,同一時刻預(yù)報風(fēng)速差異可達(dá)3~4 m/s。由此可知,風(fēng)電場內(nèi)存在差異信息,可利用該信息進行預(yù)測功率校正。
表2 風(fēng)速模擬結(jié)果評價指標(biāo)
圖6 四組子類預(yù)測風(fēng)速對比
3 組實驗功率預(yù)測結(jié)果對比如表3 所示,在訓(xùn)練集(為初步預(yù)測功率模型的測試集)中,“機組分類”預(yù)測功率較優(yōu),考核電量QCE下降5.36%,可見提高預(yù)測風(fēng)速的準(zhǔn)確性能有效提高預(yù)測功率的精度。經(jīng)校正模型后,“REML 校正”模型長期準(zhǔn)確率ACC有略微提升,而考核電量QCE有明顯下降,相較“單一風(fēng)速”下降19.24%。
表3 不同實驗的功率模擬結(jié)果對比
由于“單一風(fēng)速”實驗沒有考慮風(fēng)電場內(nèi)部差異,導(dǎo)致個別天會極端誤報,由此產(chǎn)生較大的考核電量。選取4月1日和4月13日典型考核天分析,如表4 所示。可知“REML 校正”可利用各機組的差異信息,有效提高預(yù)測功率的準(zhǔn)確性,提升幅度可達(dá)3.59%。
表4 選取天的功率模擬結(jié)果情況
由此表明,對于大規(guī)模風(fēng)電場內(nèi)部差異信息的利用有助于提高功率模型精度,避免極端誤報,保證功率預(yù)測的穩(wěn)定性,從而降低運行成本。
考慮多位置NWP 數(shù)據(jù)構(gòu)建初始功率預(yù)測模型,風(fēng)電短期功率預(yù)測結(jié)果準(zhǔn)確度較高,結(jié)果顯示機組分類的預(yù)測功率略優(yōu)于單一風(fēng)速。
引入機組內(nèi)部差異信息,考慮機組分類的RELM 校正預(yù)測功率,有效改善極端誤報情況,降低了風(fēng)電場功率預(yù)測偏差考核電量,能有效降低風(fēng)電場運營成本。