徐建平 ,胡濟(jì)恒 ,孫衛(wèi)哲
(1.國網(wǎng)浙江省電力有限公司金華供電公司,浙江 金華 321000;2.北京眾智新能科技有限公司,北京 100080)
電力負(fù)荷不僅受到氣象因素例如氣候、溫度、濕度的影響,也會受到消費(fèi)者居住模式和生活方式的影響。氣象因素的變化莫測加上消費(fèi)者的隨機(jī)和非線性行為均為電力負(fù)荷的預(yù)測工作帶來巨大的阻礙。在文獻(xiàn)中,電力負(fù)荷的預(yù)測方法主要分為兩類:經(jīng)典的統(tǒng)計(jì)模型,具有預(yù)測效率高、模型構(gòu)建容易的優(yōu)點(diǎn),但是也存在處理非線性時(shí)間序列能力較差、對數(shù)據(jù)質(zhì)量要求高以及需要基于一定假設(shè)條件的缺點(diǎn);機(jī)器學(xué)習(xí)模型,具有預(yù)測精度高,善于處理非線性時(shí)間序列的優(yōu)點(diǎn),但是其在處理非線性時(shí)間序列時(shí)也具有學(xué)習(xí)能力有限、容易陷入局部最優(yōu)和過度擬合、靈活參數(shù)過多等問題。
鑒于以上問題,混合預(yù)測模型逐漸發(fā)展起來,郭威麟等人為了降低負(fù)荷序列的非線性,提出了基于集成經(jīng)驗(yàn)?zāi)B(tài)分解法(EEMD),BP神經(jīng)網(wǎng)絡(luò)和遺傳算法的短期負(fù)荷預(yù)測法,實(shí)驗(yàn)結(jié)果表明該模型預(yù)測精度更高,穩(wěn)定性更強(qiáng)[1]。龍金蓮采用粒子群算法優(yōu)化最小二乘支持向量機(jī)對短期電力負(fù)荷進(jìn)行了預(yù)測,并得到了滿意的實(shí)驗(yàn)結(jié)果[2]。李冬輝等人提出了一種將多種群的果蠅優(yōu)化算法(MFOA)和廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)相結(jié)合的混合年電力負(fù)荷預(yù)測模型,實(shí)驗(yàn)證明提出的模型預(yù)測性能優(yōu)于其它對比模型[3]。
本文結(jié)合了分解技術(shù)與優(yōu)化算法的優(yōu)勢,提出了基于具有自適應(yīng)噪聲的完整集合經(jīng)驗(yàn)?zāi)J椒纸?CEEMDAN)、多目標(biāo)花授粉算法(MOFPA)和ELM 的混合模型。首先,利用CEEMDAN 將原始序列分解成若干IMF,然后剔除其中的高頻噪聲分量,重構(gòu)負(fù)荷序列。最后以預(yù)測精度和預(yù)測穩(wěn)定性為2個(gè)優(yōu)化目標(biāo),用MOFPA 優(yōu)化ELM,對江蘇省月度電力負(fù)荷進(jìn)行預(yù)測。
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)是Huang等人[4]提出的一種自適應(yīng)信號時(shí)頻處理方法,該方法根據(jù)數(shù)據(jù)本身在時(shí)間尺度上的特征對信號進(jìn)行分解,而無需預(yù)先設(shè)置任何基函數(shù)。它將序列分解為有限數(shù)量的本征模態(tài)函數(shù)(IMF)。每個(gè)IMF分量在不同時(shí)間尺度上代表原始信號的不同特征。
EMD在處理非平穩(wěn)和非線性信號方面具有很大的優(yōu)勢,但是仍然存在“模態(tài)混疊”問題。通過將高斯白噪聲添加到信號中,集成經(jīng)驗(yàn)?zāi)J椒纸?EEMD)算法,在很大程度上消除了EMD 算法中的模態(tài)混疊問題。但是,EEMD算法無法在信號重構(gòu)后完全消除高斯白噪聲,從而導(dǎo)致重構(gòu)誤差。CEEMDAN作為EEMD的改進(jìn)版本,更有效地消除了模態(tài)混疊,重構(gòu)誤差幾乎為零,大大降低了計(jì)算成本[4]。
定義通過EMD獲得的第j個(gè)模態(tài)分量的算子E j(·),將w i(t) 設(shè)為具有正態(tài)分布N(0,1)的白噪聲。CEEMDAN算法的步驟如下。
式中:M表示IMF的總數(shù)量,IMF在不同的時(shí)間尺度上共同構(gòu)成原始信號的特征。
與解決單目標(biāo)問題不同,多目標(biāo)優(yōu)化問題無法通過算術(shù)關(guān)系運(yùn)算符比較不同解決方案的優(yōu)劣。為此,通常定義包括帕累托占優(yōu)、帕累托最優(yōu)性、帕累托最優(yōu)集和帕累托最優(yōu)前沿來解決多目標(biāo)優(yōu)化問題[5]。為了提高預(yù)測精度和穩(wěn)定性,本文定義了2個(gè)目標(biāo)函數(shù)如下:
極限學(xué)習(xí)機(jī)由Huang等人開發(fā),是一種緊湊高效的單層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,其學(xué)習(xí)效率和泛化能力均高于傳統(tǒng)的前饋網(wǎng)絡(luò)[6]。它具有結(jié)構(gòu)簡單、預(yù)測準(zhǔn)確性高、預(yù)測能力和實(shí)時(shí)學(xué)習(xí)能力強(qiáng)、計(jì)算速度快和訓(xùn)練樣本需求少的特點(diǎn)。假定X是一個(gè)單標(biāo)簽樣本,Y表示分類,其中X∈R d且Y∈R C。極限學(xué)習(xí)機(jī)的輸入層,隱藏層和輸出層分別有d、h和C個(gè)節(jié)點(diǎn)。該網(wǎng)絡(luò)的獨(dú)特之處在于,輸入層的權(quán)重和偏差會隨機(jī)初始化,并且不會進(jìn)一步更新。模型過程可表示為:
式中:Y={y1,y2,…,y C},Z={z1,z2,…,z h} 表示隱藏層輸出;β表示隱藏層和輸出層之間維數(shù)為h×C的權(quán)重矩陣。進(jìn)而,權(quán)重矩陣β可以表示如下:
式中:Z?表示Z的摩爾-彭羅斯逆。一旦獲得了權(quán)重矩陣β,極限學(xué)習(xí)機(jī)方法就已經(jīng)完成了訓(xùn)練階段,并準(zhǔn)備進(jìn)入測試階段。
機(jī)器學(xué)習(xí)模型通過對觀測值進(jìn)行訓(xùn)練學(xué)習(xí),來擬合序列的復(fù)雜特征,進(jìn)而提供較為精確的預(yù)測結(jié)果。因此,建立機(jī)器學(xué)習(xí)模型時(shí)往往需要基于一定量的歷史觀測值,具體觀測值的數(shù)量通常依據(jù)多次實(shí)驗(yàn)經(jīng)驗(yàn)確定。現(xiàn)有研究證明混合預(yù)測模型在電力負(fù)荷預(yù)測方面具有良好的預(yù)測性能,基于文獻(xiàn)[7]的研究,本文提出了基于機(jī)器學(xué)習(xí)的混合預(yù)測模型,其在數(shù)據(jù)處理方面能更好地消除隨機(jī)噪聲的影響,且基于ELM 的機(jī)器學(xué)習(xí)預(yù)測模型計(jì)算效率顯著提高。提出的基于機(jī)器學(xué)習(xí)的混合預(yù)測模型框架主要可以分為2個(gè)階段.
第1階段:由于電力負(fù)荷數(shù)據(jù)固有的非線性和不穩(wěn)定性特征增加了電力負(fù)荷預(yù)測的難度,為了減弱原始負(fù)荷數(shù)據(jù)中噪聲的負(fù)面影響并進(jìn)一步提高最終的預(yù)測精度,提出的混合預(yù)測框架首先對電力負(fù)荷數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理。利用CEEMADAN 技術(shù)將原始序列分解為多個(gè)子系列,以捕獲和挖掘負(fù)荷時(shí)間序列的主要特征。通過剔除高頻成分來剔除噪聲影響,得到重構(gòu)的負(fù)荷序列,為提高模型整體的預(yù)測精度做出了重要貢獻(xiàn)。
第2階段:模型的預(yù)測準(zhǔn)確性和穩(wěn)定性對于電力系統(tǒng)的平穩(wěn)運(yùn)行和高效調(diào)度是必不可少的,因此本文將預(yù)測精度和預(yù)測穩(wěn)定性被定義為多目標(biāo)花授粉算法的2個(gè)優(yōu)化目標(biāo),具體如式(4)。鑒于ELM 出色的模擬與預(yù)測能力,本文利用優(yōu)化的ELM 通過滾動(dòng)預(yù)測形式對重構(gòu)負(fù)荷序列的未來變化趨勢進(jìn)行預(yù)測,預(yù)測過程中通過多目標(biāo)優(yōu)化確保最終預(yù)測結(jié)果的準(zhǔn)確性和穩(wěn)定性。
選取2011年1 月至2018 年12 月江蘇省月度工業(yè)用電量作為實(shí)驗(yàn)數(shù)據(jù)集來驗(yàn)證提出模型的良好性能。根據(jù)多次實(shí)驗(yàn),將訓(xùn)練集與測試集的比例設(shè)為7:3。江蘇省工業(yè)用電量曲線見圖1,從圖1可以看出,序列整體呈上升趨勢,非線性特征和不穩(wěn)定性特征顯著。
圖1 江蘇省工業(yè)用電量曲線
本文應(yīng)用4個(gè)常見的誤差指標(biāo),包括平均絕對百分比誤差(MAPE),平均絕對誤差(MAE),均方根誤差(RMSE)和預(yù)測誤差標(biāo)準(zhǔn)差(Std),來評估提出模型的預(yù)測準(zhǔn)確性和預(yù)測穩(wěn)定性。具體地,MAPE,MAE和RMSE越小,表明預(yù)測準(zhǔn)確度越高;Std越小表明預(yù)測穩(wěn)定性越高。
從傳統(tǒng)的統(tǒng)計(jì)模型、機(jī)器學(xué)習(xí)模型和混合模型中選取了5個(gè)對比模型,來證明提出的混合預(yù)測模型優(yōu)于傳統(tǒng)模型,不同預(yù)測模型負(fù)荷預(yù)測結(jié)果評價(jià)見表1,且提出的混合預(yù)測模型的每一個(gè)組成部分均為最終預(yù)測精度的提高做出了重大貢獻(xiàn)。
表1 不同預(yù)測模型負(fù)荷預(yù)測結(jié)果評價(jià)
表1列出了不同預(yù)測模型的預(yù)測精度與預(yù)測穩(wěn)定性對比情況。從表1可以看出,BP,ELM 和ARIMA 的MAPE值分別為18.956 3%,18.304 2%和24.414 3%,BP 和ELM 表現(xiàn)相近,但是優(yōu)于ARIMA 模型,說明機(jī)器學(xué)習(xí)模型在處理非線性時(shí)間序列方面具有一定優(yōu)勢,ARIMA 模型不擅長預(yù)測非線性趨勢明顯且波動(dòng)劇烈的時(shí)間序列。CEEMDAN-ELM 的MAPE為14.086 2%顯 著低于單模型,且與ELM 模型相比,降低了ELM模型MAPE的34.57%,說明CEEMDAN 在提取原始時(shí)間序列特征,剔除噪聲因素負(fù)面影響方面具有顯著成效,且非常有利于提高模型的預(yù)測精度。MOFPA-ELM 的MAPE,MAE和RMSE分別為14.382 8%,52.711 5億kWh和68.439 5億kWh,顯著優(yōu)于ELM 模型,說明MOFPA 算法對于提高ELM 的預(yù)測性能具有重要的幫助作用。CEEMDAN-MOFPA-ELM 模型具有最小的MAPE,MAE和RMSE值,說明在眾多對比模型中,提出的模型具有最高的預(yù)測精度。
從Std的值可看出模型預(yù)測的穩(wěn)定性,具體地,MOFPA-ELM 的Std為53.785 5 億kWh,而ELM 模型的Std為64.112 0億kWh,說明多目標(biāo)優(yōu)化算法在提高模型預(yù)測精度的同時(shí)提高了模型預(yù)測的穩(wěn)定性。CEEMDAN-MOFPA-ELM 模型的Std為38.554 7億kWh,顯著低于其他對比模型的方差,說明提出的模型的預(yù)測穩(wěn)定性最高。
圖2描繪了不同對比模型和提出模型的預(yù)測值情況。從圖2 可以看出,提出的CEEMDANMOFPA-ELM 模型的預(yù)測值與真實(shí)值更加接近,擬合效果更好。其它對比模型的預(yù)測值與真實(shí)值偏離較遠(yuǎn),說明模型的訓(xùn)練與學(xué)習(xí)能力有限,無法提供準(zhǔn)確的預(yù)測結(jié)果。
圖2 不同預(yù)測模型電力負(fù)荷預(yù)測結(jié)果折線
本文提出了一種基于機(jī)器學(xué)習(xí)的電力負(fù)荷混合預(yù)測模型,它結(jié)合了CEEMDAN 分解技術(shù)和MOFPA 優(yōu)化算法,改進(jìn)了傳統(tǒng)的極限學(xué)習(xí)機(jī)的缺陷,剔除了數(shù)據(jù)中的隨機(jī)噪聲對預(yù)測結(jié)果的負(fù)面影響。從實(shí)驗(yàn)結(jié)果可以看出,混合預(yù)測模型的預(yù)測效果顯著優(yōu)于傳統(tǒng)的統(tǒng)計(jì)模型ARIMA 以及機(jī)器學(xué)習(xí)模型BP和ELM,同時(shí),提出的模型在所有混合對比模型中表現(xiàn)最優(yōu)。因此,提出的混合模型顯著提高了預(yù)測精度和預(yù)測穩(wěn)定性,可以為電網(wǎng)調(diào)度提供有力的信息支撐。