田 德, 張 琦
(廣東工業(yè)大學(xué) 自動化學(xué)院,廣東 廣州 510006)
基于優(yōu)化核極限學(xué)習(xí)機的光伏出力短期預(yù)測
田 德, 張 琦
(廣東工業(yè)大學(xué) 自動化學(xué)院,廣東 廣州 510006)
光伏出力的精確預(yù)測有利于確保電力系統(tǒng)的可靠運行,減小投資者的利益風(fēng)險。考慮到光伏出力的不確定性和非平穩(wěn)性,首先采用自適應(yīng)白噪聲的完整集合經(jīng)驗?zāi)B(tài)分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)將原始光伏出力序列分解為一系列相關(guān)性較強、較平穩(wěn)的子序列,再使用核極限學(xué)習(xí)機(Kernel Extreme Learning Machine,KELM)分別對每一子序列進行預(yù)測。由于KELM學(xué)習(xí)參數(shù)選取對其預(yù)測性能有較大影響,提出了基于改進蝙蝠算法(Improved Bat Algorithm, IBA)對KELM模型參數(shù)進行尋優(yōu)。最后,將每一子序列預(yù)測結(jié)果通過求和相加獲取最終的預(yù)測值。實際算例表明,該IBA算法收斂速度快,全局搜索能力強,所提的CEEMDAN-IBA-KELM組合方法能有效提高光伏出力的預(yù)測精度。
光伏出力預(yù)測; 自適應(yīng)白噪聲;集合經(jīng)驗?zāi)B(tài)分解; 核極限學(xué)習(xí)機; 參數(shù)優(yōu)化; 改進蝙蝠算法
綠色清潔能源特別是太陽能和風(fēng)能是目前最具商業(yè)發(fā)展前景的發(fā)電方式之一,已受到了越來越多的重視。然而,隨著并網(wǎng)光伏發(fā)電技術(shù)的不斷發(fā)展,給電力系統(tǒng)的運行穩(wěn)定性帶來了嚴(yán)峻的挑戰(zhàn)。因此,并網(wǎng)光伏出力的準(zhǔn)確預(yù)測不僅能有效降低大規(guī)模光伏發(fā)電接入對電網(wǎng)的影響,提高電網(wǎng)對光伏的接納能力,而且太陽能資源的充分利用可以獲得較高的經(jīng)濟效益和社會效益。
目前,光伏輸出功率預(yù)測方法主要集中于單一的人工智能預(yù)測方法,包括人工神經(jīng)網(wǎng)絡(luò)、支持向量機等。但以上單一預(yù)測的方法均受到自身特性的限制,根據(jù)相似日原理選取預(yù)測樣本,建立徑向基神經(jīng)網(wǎng)絡(luò)預(yù)測模型,雖然徑向基神經(jīng)網(wǎng)絡(luò)優(yōu)于一般的BP神經(jīng)網(wǎng)絡(luò),但其仍存在中心矢量和隱層節(jié)點數(shù)難以確定的問題[1-3]。文獻[4-5]根據(jù)光伏出力及其影響因素建立了基于支持向量機回歸預(yù)測模型,適合于多變的復(fù)雜天氣情況下光伏預(yù)測,但支持向量機模型參數(shù)選取對預(yù)測性能存在較大影響。組合預(yù)測方法結(jié)合了各單一預(yù)測方法的優(yōu)勢,因此受到了越來越多的關(guān)注。現(xiàn)階段,組合預(yù)測方法主要有:1)將各單一模型預(yù)測值根據(jù)某種權(quán)重關(guān)系篩選出最佳的權(quán)重組合系數(shù),從而建立權(quán)重組合預(yù)測模型[6]。2)基于單一預(yù)測模型參數(shù)優(yōu)化的組合方法,如文獻[7]采用遺傳算法對人工神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進行優(yōu)化。3)基于信號分解技術(shù)的組合預(yù)測方法,其中,信號分解技術(shù)主要包括小波分解[8-9](Wavelet Decomposition,WD)、經(jīng)驗?zāi)B(tài)分解[10](Empirical Mode Decomposition,EMD)和集合經(jīng)驗?zāi)B(tài)分解[11](Ensemble Empirical Mode Decomposition,EEMD)等,即通過將原始數(shù)據(jù)信號分解為一系列子序列,對其分別采用人工智能算法進行預(yù)測并求和得到最終的預(yù)測結(jié)果。
考慮到光伏出力序列的波動性和隨機性特點,本文采用一種自適應(yīng)白噪聲的完整集合經(jīng)驗?zāi)B(tài)分解[12](Complete Ensemble Empirical Mode Decomposition with Adaptive Noise, CEEMDAN) 方法,通過在分解的各個階段添加自適應(yīng)白噪聲,并根據(jù)計算剩余的余量信號以得到各個分量信號,該方法克服了傳統(tǒng)EMD方法模態(tài)混疊缺點以及EEMD分解低效率的問題,且可以有效降低光伏序列的非平穩(wěn)性?;诖?,提出一種基于CEEMDAN與IBA-KELM組合預(yù)測方法, 充分考慮了KELM模型參數(shù)選取對預(yù)測結(jié)果精度的影響[13],采用改進的蝙蝠算法對其參數(shù)進行優(yōu)化。最后,以美國俄勒岡州某光伏電站數(shù)據(jù)為例,驗證了本文采用的CEEMDAN-IBA-KELM組合預(yù)測方法具有優(yōu)良的預(yù)測精度。
光伏功率預(yù)測[14-16]是一個復(fù)雜的非線性問題,因此決定功率大小的因素有許多。實際工程中,光伏輸出功率可表示為[17]:
P=ηIsA[1-0.005(T+25)]
(1)
式中:η為光伏陣列的轉(zhuǎn)化效率;Is為輻照強度,(W/m2);A為陣列的總面積,(m2);T為大氣溫度,(℃)。
通常對既定的光伏電站其安裝角度及光伏陣列轉(zhuǎn)換效率已包含在歷史輸出功率數(shù)據(jù)中,因而無需考慮。因此,從上式可知光伏功率輸出受太陽輻照強度和環(huán)境溫度的影響。而實際中,除了這2個影響因素外,對于光伏出力預(yù)測還需考慮天氣類型、風(fēng)速、季節(jié)等。
為分析太陽輻照、環(huán)境溫度和風(fēng)速對光伏輸出功率的影響,以美國某光伏電站的歷史數(shù)據(jù)為例,隨機選取2015年某3天的歷史數(shù)據(jù)繪制光伏輸出功率與太陽輻照強度、溫度和風(fēng)速的關(guān)系示意圖,如圖1~3所示。由圖可知,太陽輻照強度與光伏輸出功率曲線變化趨勢基本一致,耦合程度高,說明太陽輻照是影響光伏功率輸出最為主要的因素;圖2和圖3中溫度、風(fēng)速均與光伏輸出功率呈現(xiàn)一定的相關(guān)性,且風(fēng)速隨機性較強,對光伏輸出功率影響較弱。因此,本文將光伏輻照強度、溫度均作為IBA-KELM模型的輸入變量[18-19]。
圖1 光伏輸出功率與太陽輻照曲線圖
圖2 光伏輸出功率與溫度曲線圖
圖3 光伏輸出功率與風(fēng)速曲線圖
圖4為2015年5~6月某3天的晴天、突變天氣、雨天3種主要天氣類型下的光伏輸出功率。從圖中可以看出,晴天的光伏輸出功率曲線相對平穩(wěn);而突變天氣、雨天的光伏功率曲線波動性、隨機性較強,這一情況不僅增加了光伏功率預(yù)測的難度,而且對光伏電站運行的安全穩(wěn)定性造成影響[20]。因此,針對不同天氣類型數(shù)據(jù)分別進行預(yù)測尤為重要。
圖4 不同天氣類型下的光伏功率曲線
以晴天為例,選取春、夏、秋、冬四季下的光伏功率曲線如圖5所示。由圖可知,春季與夏季日照時間長,其光伏功率輸出值相對較大;秋季與冬季溫度低、日照時間相對較短,其光伏功率輸出值相對較小。因此,不同季節(jié)的光伏輸出功率對預(yù)測存在一定的影響。
圖5 不同季節(jié)下的光伏功率曲線
考慮到光伏輸出功率在不同天氣類型下差別較大,為準(zhǔn)確選取與預(yù)測日最為相似的歷史功率輸出日以減小預(yù)測誤差,采用數(shù)據(jù)挖掘中應(yīng)用較廣泛的K-means算法[21]。
假設(shè)原始光伏功率數(shù)據(jù)樣本為xi={x1,x2,…,xn},將樣本聚類為c類,其具體過程如下[22]:
(1)從原始樣本中隨機選取c個輸入樣本作為初始聚類中心,c即代表1.2節(jié)中3種不同天氣類型。
(2)以距離中心最近原則,計算樣本xi與kc間的歐氏距離,將該樣本分配至最鄰近聚類集合εk中。
(3)計算εk中各樣本的平均值,重新生成新的聚類中心。
(4)重復(fù)步驟(2)、(3),直至相鄰2次計算中的聚類中心不變時算法結(jié)束。
(2)
因此,根據(jù)CEEMDAN將原始u(t)信號分解為:
(3)
式中:i=1,2,…,K,K為模態(tài)分量的總數(shù)。
KELM算法[24]是依據(jù)傳統(tǒng)極限學(xué)習(xí)機(Extreme Learning Machine, ELM)的基礎(chǔ)而提出的。因傳統(tǒng)ELM的輸入層權(quán)值及隱層權(quán)值均隨機設(shè)定,其預(yù)測性能較差,因此,根據(jù)支持向量機的原理引入核函數(shù),從而提出了KELM算法,其具體證明過程可參見文獻[25]。其中,KELM模型的輸出及其核函數(shù)公式為:
(4)
K(μ,ν)=exp(-(μ-ν2/g))
(5)
式中:C為懲罰系數(shù);I為單位稀疏矩陣;核函數(shù)K(μ,ν)一般采用為RBF核;g為核系數(shù)。
該算法克服了傳統(tǒng)ELM在處理低維數(shù)據(jù)時線性不可分的缺點并提高了算法的學(xué)習(xí)速率和泛化能力。但KELM模型的預(yù)測性能仍受其學(xué)習(xí)參數(shù)的影響較大,所以本文采用全局搜索能力強的IBA進行參數(shù)優(yōu)化。
fi=fmin+(fmax-fmin)·rand
(6)
(7)
(8)
(9)
式中:ωini、ωter分別為慣性系數(shù)的初始值和最終值;c為慣性權(quán)重相關(guān)系數(shù);τ為當(dāng)前迭代次數(shù);τmax為最大迭代次數(shù)。
根據(jù)改進后的BA優(yōu)化KELM的步驟描述如下:
1)設(shè)置IBA相關(guān)參數(shù),主要包含:種群數(shù)目N,最大迭代次數(shù)τmax,最小頻率fmin、最大頻率fmax,最大音量A,最大脈沖率r,慣性系數(shù)的初始值ωini和最終值ωter;慣性權(quán)重相關(guān)系數(shù)c1。
2)隨機初始化蝙蝠位置xi,其由懲罰因子C和核參數(shù)g組成,并根據(jù)適應(yīng)度函數(shù)f(xi)值尋找當(dāng)前最優(yōu)位置x*。
3)位置更新。根據(jù)公式(6)~(9)更新每一個體脈沖頻率、速度與位置。
4) 設(shè)定隨機數(shù)rand,若rand>r,則隨機產(chǎn)生新解。
克什米爾地區(qū)一直是印度和巴基斯坦的爭議地區(qū),其歸屬權(quán)之爭由來已久,導(dǎo)致政局一直不穩(wěn)定。20世紀(jì)中期的兩次印巴戰(zhàn)爭使得礦區(qū)無法勘探和開掘,本計劃于1990年實施的新礦區(qū)開發(fā)項目也因政治動亂而沒能進行。同時由于地理環(huán)境也比較特殊——平均海拔超過4000米,人類生存條件惡劣,常年處于低溫嚴(yán)寒狀態(tài),適宜開采的時間每年僅2-3個月。加之山上基本設(shè)施匱乏,大型開采機械又無法運到山上,這些因素都造成克什米爾藍寶石開采成本巨大。以至于克什米爾矢車菊、皇家藍,很多人也只聞其名不見其物!