馮桂玲 鄭曉暉 李思韜 莊大海
1(國(guó)網(wǎng)福建省電力有限公司福州供電公司 福建 福州 350009) 2(國(guó)網(wǎng)信通億力科技有限責(zé)任公司 福建 福州 350003)
電力負(fù)荷的可預(yù)測(cè)性受到氣候變化、分布式可再生能源發(fā)電、電動(dòng)汽車、能源效率和需求響應(yīng)的不確定性的影響[1]。因此,提高概率凈負(fù)荷(即微電網(wǎng)和公用電網(wǎng)之間的交易負(fù)荷)預(yù)測(cè)的準(zhǔn)確度對(duì)于捕捉這些巨大的不確定性非常重要,有助于未來(lái)智能低碳能源系統(tǒng)的運(yùn)行和規(guī)劃。
傳統(tǒng)的點(diǎn)預(yù)測(cè)方法[2]能夠有效實(shí)現(xiàn)系統(tǒng)峰值負(fù)荷預(yù)測(cè)和節(jié)點(diǎn)負(fù)荷預(yù)測(cè)。然而,由于電動(dòng)汽車充電、可再生能源發(fā)電、氣候變化等都具有不確定性,點(diǎn)預(yù)測(cè)只能為嚴(yán)重依賴期望值的決策過(guò)程提供單時(shí)間步長(zhǎng)輸出,適用性很弱。理想的預(yù)測(cè)模型應(yīng)該能夠通過(guò)分位數(shù)、區(qū)間或概率密度函數(shù)來(lái)表示不確定性,并能應(yīng)用于電力市場(chǎng)概率潮流分析、可靠性規(guī)劃和最優(yōu)報(bào)價(jià)等。概率負(fù)荷預(yù)測(cè)主要方法有直接建立概率預(yù)測(cè)模型[3]或?qū)Χ鄠€(gè)場(chǎng)景進(jìn)行確定性模型,得到概率預(yù)測(cè)結(jié)果[4-5]。文獻(xiàn)[6]提出了一種混合型概率負(fù)荷預(yù)測(cè)模型,基于改進(jìn)的小波神經(jīng)網(wǎng)絡(luò),經(jīng)過(guò)廣義極值學(xué)習(xí)機(jī)的訓(xùn)練,在捕獲預(yù)測(cè)模型和數(shù)據(jù)噪聲不確定性的同時(shí),為負(fù)荷預(yù)測(cè)提供一個(gè)概率區(qū)間。
凈負(fù)荷預(yù)測(cè)對(duì)智能電網(wǎng)的管理、運(yùn)營(yíng)、資源分配和電力市場(chǎng)等非常重要[7]。考慮分布式可再生能源(如本地光伏發(fā)電)的凈負(fù)荷,需要考慮更多的不確定性,特別是當(dāng)光伏發(fā)電部分可見(jiàn)或完全不可見(jiàn)時(shí)。通過(guò)統(tǒng)計(jì)預(yù)測(cè)類方法或人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)能夠進(jìn)行凈負(fù)荷預(yù)測(cè)。文獻(xiàn)[8]為解決不可見(jiàn)的高PV滲透問(wèn)題,將凈負(fù)荷分布分解為PV輸出、實(shí)際負(fù)荷和剩余負(fù)荷,并依次進(jìn)行預(yù)測(cè)。文獻(xiàn)[9]采用一個(gè)帶有Levenberg-Marquardt訓(xùn)練算法的神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行饋線凈負(fù)荷預(yù)測(cè)。
近年來(lái),深度學(xué)習(xí)在多個(gè)領(lǐng)域受到了廣泛關(guān)注[10]。在能量相關(guān)的時(shí)間序列預(yù)測(cè)方面,文獻(xiàn)[11]使用深度學(xué)習(xí)方法進(jìn)行負(fù)荷預(yù)測(cè),并比較了兩種受限玻爾茲曼機(jī)的性能。文獻(xiàn)[12]提出了一種基于深度學(xué)習(xí)、分位數(shù)回歸和核密度估計(jì)的短期電力負(fù)荷概率預(yù)測(cè)模型。長(zhǎng)短時(shí)記憶(The Long Short-Term Memory,LSTM)網(wǎng)絡(luò)解決了原始循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)的缺陷,它具有一個(gè)可以長(zhǎng)時(shí)間保存信息并處理長(zhǎng)期依賴問(wèn)題的記憶單元。文獻(xiàn)[13]采用深度LSTM網(wǎng)絡(luò)來(lái)處理家庭負(fù)載中的高波動(dòng)性和不確定性,并驗(yàn)證了它的優(yōu)越性。文獻(xiàn)[14]通過(guò)在訓(xùn)練過(guò)程中引入高斯噪聲,提出了一種改進(jìn)的分位數(shù)回歸神經(jīng)網(wǎng)絡(luò)。雖然上述研究已說(shuō)明了深度學(xué)習(xí)在負(fù)荷預(yù)測(cè)上的優(yōu)越性,但從本質(zhì)上來(lái)說(shuō),大多數(shù)研究實(shí)際上是基于統(tǒng)計(jì)確定性模型的,缺乏捕捉認(rèn)知不確定性的能力。貝葉斯深度學(xué)習(xí)(Bayesian Deep Learning,BDL)作為一種新的概率型深度學(xué)習(xí)模型,在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、醫(yī)學(xué)診斷和自動(dòng)駕駛等領(lǐng)域得到了越來(lái)越廣泛的應(yīng)用。BDL通過(guò)概率論的視角構(gòu)建了更可解釋的深度神經(jīng)網(wǎng)絡(luò)。
本文同時(shí)考慮了認(rèn)知不確定性和隨機(jī)不確定性,將貝葉斯理論和深度LSTM網(wǎng)絡(luò)相結(jié)合,提出一種基于BDL的概率凈負(fù)荷預(yù)測(cè)方法。本文方法采用聚類對(duì)居民用戶進(jìn)行分組,并將PV輸出作為網(wǎng)絡(luò)訓(xùn)練輸入的一部分。本文充分利用了智能電表數(shù)據(jù)和部分可見(jiàn)PV輸出數(shù)據(jù),算例研究基于真實(shí)的光伏發(fā)電和來(lái)自澳大利亞電網(wǎng)的負(fù)荷數(shù)據(jù),通過(guò)聚類、預(yù)測(cè)和聚合進(jìn)行日前凈負(fù)荷概率預(yù)測(cè)。本文方法在確定性預(yù)測(cè)和概率性預(yù)測(cè)兩方面均有較好的效果,通過(guò)與其他方法比較,證明了聚類和高滲透PV可見(jiàn)性的重要性。
分布式光伏發(fā)電的廣泛應(yīng)用及其間歇性的特性大大降低了居民凈負(fù)荷的可預(yù)測(cè)性。本文主要面臨以下挑戰(zhàn):
(1) PV可見(jiàn)度:安裝在儀表后的分布式光伏對(duì)配電網(wǎng)一般是不可見(jiàn)的,這增加了凈負(fù)荷的不確定性和負(fù)荷預(yù)測(cè)的困難程度,特別是在高PV滲透率的情況。隨著計(jì)量技術(shù)的發(fā)展,一些居民用戶安裝了可以單獨(dú)測(cè)量用電量和屋頂光伏發(fā)電量的電表,使分布式光伏發(fā)電部分地呈現(xiàn)在電網(wǎng)監(jiān)控中,并提供了細(xì)粒度數(shù)據(jù)。因此,可以充分利用部分可見(jiàn)PV數(shù)據(jù)的方法來(lái)提高凈負(fù)荷預(yù)測(cè)性能。
(2) 大規(guī)模隨機(jī)不確定性:聚集型凈負(fù)荷的不確定性由負(fù)荷不確定性和分布式PV不確定性兩部分組成。凈負(fù)荷中包括不同來(lái)源(如氣候變化、間歇性發(fā)電和非周期性人為活動(dòng))注入的隨機(jī)不確定性。近年來(lái),凈負(fù)荷預(yù)測(cè)方面的研究大多只能提供含上下界的預(yù)測(cè)區(qū)間,沒(méi)有給出關(guān)于每個(gè)時(shí)間步長(zhǎng)的預(yù)測(cè)詳細(xì)信息。此外,大多數(shù)概率預(yù)測(cè)模型通常基于固有的確定性模型,要么利用殘差的概率密度函數(shù)進(jìn)行點(diǎn)密度預(yù)測(cè),要么對(duì)多個(gè)點(diǎn)預(yù)測(cè)結(jié)果進(jìn)行后處理以生成分位數(shù),在精確捕獲隨機(jī)不確定性方面能力有限。因此,構(gòu)建一個(gè)概率型深度學(xué)習(xí)模型來(lái)處理凈負(fù)荷中大量的隨機(jī)不確定性,并為電網(wǎng)運(yùn)行決策提供可靠邊界是非常重要的。
(3) 認(rèn)知不確定性:即模型的不確定性,主要體現(xiàn)在模型參數(shù)和模型結(jié)構(gòu)中的設(shè)計(jì)認(rèn)知方面。在概率凈負(fù)荷預(yù)測(cè)中,認(rèn)知不確定性直接影響到模型輸出的準(zhǔn)確性。在大量潛在的模型結(jié)構(gòu)和參數(shù)中,了解所選參數(shù)在多大程度上能夠準(zhǔn)確預(yù)測(cè)不同條件下(例如,季節(jié)、周末/工作日和社會(huì)因素)的凈負(fù)荷是很重要的。
為了有效地應(yīng)對(duì)上述挑戰(zhàn),本文提出一種基于貝葉斯深度學(xué)習(xí)的概率凈負(fù)荷預(yù)測(cè)方法。
為了解決不可讀神經(jīng)計(jì)算模型黑匣子、不確定性表征較弱和數(shù)據(jù)需求大的問(wèn)題,本節(jié)分析使用BDL進(jìn)行凈負(fù)荷預(yù)測(cè)的原因:
(1) 具有構(gòu)建考慮不確定性的概率模型的能力:傳統(tǒng)神經(jīng)網(wǎng)絡(luò)有固定的參數(shù),貝葉斯網(wǎng)絡(luò)參數(shù)(權(quán)值和偏差)為條件概率。貝葉斯模型從其參數(shù)中采樣來(lái)生成結(jié)果,本質(zhì)上是概率性的,而非確定性的。
(2) 能夠同時(shí)捕獲模型不確定性和隨機(jī)不確定性:現(xiàn)有的貝葉斯深度學(xué)習(xí)方法大多只能單獨(dú)捕獲認(rèn)知不確定性或隨機(jī)不確定性[15],而本文所提貝葉斯深度LSTM網(wǎng)絡(luò)(Bayesian deep LSTM network,BDLSTM)可以同時(shí)捕獲兩種不確定性。通過(guò)在模型的權(quán)值上給定一個(gè)先驗(yàn)分布來(lái)捕獲認(rèn)知不確定性;然后,通過(guò)推理算法對(duì)后驗(yàn)進(jìn)行近似,由權(quán)值分布的形狀來(lái)表示認(rèn)知不確定性;通過(guò)在輸出上給出一個(gè)小方差分布(通常是高斯隨機(jī)噪聲)來(lái)捕獲隨機(jī)不確定性。
(3) 可用概率論解釋:傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)利用神經(jīng)元記憶訓(xùn)練數(shù)據(jù)中的信息,其參數(shù)沒(méi)有物理意義,可以是任意值。貝葉斯網(wǎng)絡(luò)通過(guò)貝葉斯理論來(lái)計(jì)算參數(shù)值,使參數(shù)可解釋,令網(wǎng)絡(luò)能感知結(jié)果的可確定性。此外,BDL可以校準(zhǔn)預(yù)測(cè)的不確定性。例如,在凈負(fù)荷預(yù)測(cè)中,當(dāng)預(yù)測(cè)過(guò)程中遇到與歷史值極不相同或極不合理的輸入特征時(shí),會(huì)給出無(wú)法處理的信息,而不是像目前的深度學(xué)習(xí)模型那樣給出偏差較大的預(yù)測(cè),不能具體地判斷和驗(yàn)證結(jié)果的可信性。另外,可以幫助預(yù)測(cè)人員確定當(dāng)前模型是否需要使用最新數(shù)據(jù)進(jìn)行更新或重新訓(xùn)練。
(4) 小數(shù)據(jù)集的可靠性:許多實(shí)際任務(wù)的數(shù)據(jù)量有限,傳統(tǒng)的深度學(xué)習(xí)系統(tǒng)無(wú)法處理這些數(shù)據(jù)。傳統(tǒng)的深度學(xué)習(xí)通常需要數(shù)百萬(wàn)個(gè)訓(xùn)練樣本,通過(guò)智能測(cè)量系統(tǒng)采集的測(cè)量數(shù)據(jù)不足,預(yù)測(cè)性能受到限制。然而,采用BDL進(jìn)行預(yù)測(cè)所需的數(shù)據(jù)較少。通過(guò)將先驗(yàn)知識(shí)集成到學(xué)習(xí)系統(tǒng)中,BDL可以通過(guò)對(duì)隱藏單元或神經(jīng)網(wǎng)絡(luò)參數(shù)施加先驗(yàn),使網(wǎng)絡(luò)能夠利用內(nèi)置的隱式正則化的優(yōu)點(diǎn)實(shí)現(xiàn)模型復(fù)雜性自動(dòng)控制。
長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)[16]是一種特殊的遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),文獻(xiàn)[13]將其用于短期住宅負(fù)荷預(yù)測(cè)。LSTM的深層結(jié)構(gòu)可以通過(guò)一系列線性或非線性函數(shù)幫助學(xué)習(xí)輸入特征和輸出居民負(fù)荷數(shù)據(jù)之間的高度非線性關(guān)系。為描述所提貝葉斯深度神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu),首先給出一個(gè)LSTM單元的結(jié)構(gòu)如圖1所示。LSTM單元在一個(gè)特定的時(shí)間步長(zhǎng)t上的輸入是過(guò)去狀態(tài)ht-1和當(dāng)前輸入xt。通過(guò)四個(gè)完全連接的神經(jīng)元ft、gt、it和ot,使用輸入門(mén)、遺忘門(mén)和輸出門(mén)來(lái)實(shí)現(xiàn)記憶或遺忘信息的功能。輸入門(mén)控制新輸入信息,遺忘門(mén)決定將傳輸多少以前的信息,輸出門(mén)決定在這個(gè)時(shí)間步長(zhǎng)的輸出。前一時(shí)間的輸出ht作為下一個(gè)時(shí)間步的輸入,采用ct決定長(zhǎng)期的依賴關(guān)系。整體計(jì)算如下:
(1)
(2)
(3)
(4)
共同獲取認(rèn)知不確定性和隨機(jī)不確定性的BDLSTM對(duì)LSTM網(wǎng)絡(luò)權(quán)重和偏置參數(shù)進(jìn)行了先驗(yàn)分布,然后對(duì)給定的數(shù)據(jù)進(jìn)行了后驗(yàn)分布的推導(dǎo)。
Xtrain=[x1,x2,…,xTtrain]T∈RTtrain×dx、Ytrain=[y1,y2,…,yTtrain]T∈RTtrain×dy分別表示需要訓(xùn)練的BDLSTM模型的輸入數(shù)據(jù)和輸出標(biāo)簽,其中:Ttrain為訓(xùn)練數(shù)據(jù)點(diǎn)的總數(shù);dx和dy表示輸入、輸出的維數(shù)。深度LSTM網(wǎng)絡(luò)的主要目標(biāo)可以形式化為確定函數(shù)y=fW(x)的最佳參數(shù)W,該參數(shù)有可能生成輸出(即實(shí)際凈負(fù)荷)。本文y=fW(·)表示具有NL層的深度LSTM網(wǎng)絡(luò),模型參數(shù)為W=[W1,W2,…,WNL]是一組隨機(jī)變量。圖2給出了所提BDLSTM網(wǎng)絡(luò)的貝葉斯LSTM單元的示例,并在第一層放大了第t步的遺忘門(mén)。詳細(xì)的數(shù)學(xué)說(shuō)明如下。
2.2.1認(rèn)知不確定性
認(rèn)知不確定性包括結(jié)構(gòu)不確定性和模型參數(shù)不確定性。結(jié)構(gòu)不確定性是指在選擇模型結(jié)構(gòu)進(jìn)行數(shù)據(jù)外推或內(nèi)插時(shí)的不確定性。在眾多可能的模型參數(shù)中,應(yīng)選擇哪一組參數(shù)來(lái)最好地解釋觀測(cè)結(jié)果的不確定性,用模型參數(shù)不確定性表示[15]。
為了處理認(rèn)知不確定性,將先驗(yàn)分布(如N(0,I))置于W上。先驗(yàn)分布可分為無(wú)信息先驗(yàn)分布、高信息先驗(yàn)分布、中等信息層次先驗(yàn)分布[17]。對(duì)于貝葉斯深度神經(jīng)網(wǎng)絡(luò),先驗(yàn)分布應(yīng)該代表對(duì)神經(jīng)網(wǎng)絡(luò)參數(shù)(權(quán)值和偏差)分布的先驗(yàn)信念,由于這些參數(shù)的物理意義尚不明確,因此難以識(shí)別。根據(jù)文獻(xiàn)[15],當(dāng)先驗(yàn)信念難以確定時(shí),可采用標(biāo)準(zhǔn)參數(shù)分布。因此,將標(biāo)準(zhǔn)正態(tài)分布作為本文的先驗(yàn),其零均值有利于正則化。在訓(xùn)練貝葉斯深度神經(jīng)網(wǎng)絡(luò)后,將使用后驗(yàn)分布來(lái)生成預(yù)測(cè)樣本。
在確定適當(dāng)?shù)南闰?yàn)之后,模型似然p(Ytrain|fW(Xtrain))被定義為具有恒定噪聲水平σ的正態(tài)分布N(fW(Xtrain),σ2)。根據(jù)貝葉斯規(guī)則,計(jì)算后驗(yàn)p(W|Xtrain,Ytrain):
(5)
式中:p(W|Xtrain,Ytrain)為無(wú)法解析估計(jì)的邊際概率。為此,提出了變分推理和馬爾可夫鏈蒙特卡羅(Markov Chain Monte Carlo,MCMC)[18]等不同的推理方法來(lái)逼近。對(duì)于訓(xùn)練數(shù)據(jù){Xtrain,Ytrain},p(W|Xtrain,Ytrain)表示權(quán)值上的后驗(yàn)分布。給定新輸入點(diǎn)x,新輸出y,定義為一個(gè)隨機(jī)變量,可以通過(guò)積分來(lái)預(yù)測(cè):
(6)
KL(qθ(W)‖p(W|Xtrain,Ytrain))=
(7)
p(y|x,Xtrain,Ytrain)=
(8)
(9)
M(y;fW(x),σ2),得到了估計(jì)量:
(10)
MU(x,y,W)+σ2
(11)
式中:
(12)
式(12)表示認(rèn)知不確定性,用于度量模型對(duì)其輸出的不確定性的程度。
2.2.2隨機(jī)不確定性
根據(jù)不確定性與輸入之間的依賴關(guān)系,將隨機(jī)不確定性進(jìn)一步分為齊次不確定性和異方差不確定性[19]。對(duì)于齊次不確定性,觀測(cè)噪聲參數(shù)σ是固定的。在處理凈負(fù)荷時(shí),不確定性隨時(shí)間變化,需要捕捉異方差的不確定性。為此,需要將式(11)中的σ調(diào)整為輸入x的函數(shù)。令Ttrain表示訓(xùn)練觀測(cè)的個(gè)數(shù),數(shù)據(jù)相關(guān)異方差模型的損失函數(shù)可以表示為:
(13)
在這種情況下,進(jìn)行最大后驗(yàn)(Maximum A Posteriori,MAP)推理來(lái)定位參數(shù)θ。
2.2.3組合不確定度
(14)
(15)
所提BDLSTM模型的預(yù)測(cè)不確定度Var[y],由隨機(jī)不確定度和認(rèn)知不確定度組成:
(16)
貝葉斯深度學(xué)習(xí)的詳細(xì)解釋可見(jiàn)參考文獻(xiàn)[20]。
在上述BDLSTM模型的基礎(chǔ)上,本文提出一種新的概率型短期凈負(fù)荷預(yù)測(cè)方法,充分利用居民用戶數(shù)據(jù)和部分可見(jiàn)的PV數(shù)據(jù),提高預(yù)測(cè)性能。本文方法包括四個(gè)部分:聚類階段、特征構(gòu)建階段、預(yù)測(cè)階段和聚合階段,如圖3所示。
聚類階段是根據(jù)平均日凈負(fù)荷將用戶分到不同的集群中,并從每個(gè)集群中提取有代表性的凈負(fù)荷曲線。這可以揭示關(guān)于聚合負(fù)荷的更多信息,進(jìn)一步幫助提高預(yù)測(cè)精度。然而,為每個(gè)用戶構(gòu)建BDLSTM模型并將其聚合起來(lái)是不切實(shí)際的。聚類能夠平衡模型數(shù)量和預(yù)測(cè)精度,可以有效地降低計(jì)算復(fù)雜度。
設(shè)L=[L1,L2,…,LN]∈RT×N為N個(gè)居民用戶的歷史負(fù)荷數(shù)據(jù),其中T為觀測(cè)總數(shù)。首先,將所有用戶分成不可見(jiàn)光伏發(fā)電和可見(jiàn)光伏發(fā)電兩種:分別以Linv∈RT×Ninv和Lvis∈RT×Nvis表示,其聚類數(shù)量分別由Kinv和Kvis表示。基于平均日凈負(fù)荷模式Linv和Lvis,采用凝聚法分層聚類——Ward離差平方和法[21],分別定義為RLPinv∈RNinv×48和RLPvis∈RNvis×48,得到每個(gè)用戶的聚類標(biāo)簽。層次聚類具有確定性,并可根據(jù)需要,在任意數(shù)量的聚類處終止聚集過(guò)程。為不可見(jiàn)組和可見(jiàn)組聚合每個(gè)集群中的子空間,以獲得更高級(jí)別的凈負(fù)載:
(17)
特征構(gòu)建階段識(shí)別有助于預(yù)測(cè)相關(guān)變量,并為BDLSTM模型構(gòu)建訓(xùn)練和測(cè)試集。在短期負(fù)荷預(yù)測(cè)中,特征選擇是去除無(wú)效候選特征從而獲得可靠預(yù)測(cè)結(jié)果的關(guān)鍵步驟。為了自動(dòng)選擇有效特征,將輸入特征與目標(biāo)變量的相關(guān)性以及候選特征之間的冗余度作為兩個(gè)關(guān)鍵的信息判據(jù)[22]。在此基礎(chǔ)上,基于互信息(Mutual Information,MI)和交互增益(Interaction Gain,IG),文獻(xiàn)[23]提出了交互作用的概念,以度量預(yù)測(cè)過(guò)程中候選特征之間的交互作用。
深度學(xué)習(xí)技術(shù)不需要大量的專業(yè)數(shù)據(jù)和細(xì)致的特征設(shè)計(jì)。因此,本文的研究重點(diǎn)不是實(shí)現(xiàn)或提出新的特征選擇方法,而是研究新的貝葉斯深度學(xué)習(xí)技術(shù),其優(yōu)點(diǎn)是在考慮不確定性的情況下,基于原始特征自動(dòng)識(shí)別具有代表性的特征。后續(xù)可以將特征選擇方法整合到所提框架中,以進(jìn)一步提高預(yù)測(cè)性能。特征選擇應(yīng)該反映季節(jié)效應(yīng)、溫度關(guān)系和其他相互作用的影響[2],為此,手動(dòng)為可見(jiàn)組和不可見(jiàn)組選擇兩組特性。
(18)
(19)
(20)
如果A和B服從各自的高斯分布:
(21)
那么,兩個(gè)高斯分布的卷積也是一個(gè)高斯分布:
(22)
在這種情況下,因?yàn)榫垲愂歉鶕?jù)用戶的凈負(fù)荷模式來(lái)區(qū)分用戶,可假設(shè)每個(gè)集群的概率預(yù)測(cè)是相互獨(dú)立的。此外,通過(guò)所提貝葉斯深度學(xué)習(xí)方法得到的個(gè)體概率預(yù)測(cè)(不確定性分量)都服從高斯分布。因此,通過(guò)上述卷積過(guò)程可以直接估計(jì)最終聚合凈負(fù)荷的分布,其表達(dá)式為:
(23)
本研究算例分析基于從澳大利亞電網(wǎng)收集的真實(shí)智能電表數(shù)據(jù),包括悉尼的負(fù)荷中心和新南威爾士州的區(qū)域[24],數(shù)據(jù)集包括從2010年7月1日到2013年6月30日每半小時(shí)獨(dú)立的屋頂光伏發(fā)電和負(fù)荷的測(cè)量數(shù)據(jù)。算例包含300個(gè)用戶的負(fù)荷和PV數(shù)據(jù),訓(xùn)練集有21 024個(gè)觀察值,測(cè)試數(shù)據(jù)集有480個(gè)觀察值。總凈負(fù)荷直接由每個(gè)家庭的用戶用電量和PV輸出之間的差值相加得到。
為驗(yàn)證本文方法的優(yōu)越性,將其與其他負(fù)荷預(yù)測(cè)方法進(jìn)行比較。方法M1(多元線性回歸)[2]和M2(長(zhǎng)短時(shí)記憶)[13]是點(diǎn)預(yù)測(cè)技術(shù),M3(分位數(shù)回歸)[2]、M4(支持向量分位數(shù)回歸)[25]、M5(梯度增強(qiáng)分位數(shù)回歸)[4]和M6(分位數(shù)隨機(jī)森林)[4]是概率模型。本文方法M7(BDLSTM)是唯一能在單一模型中同時(shí)捕獲認(rèn)知不確定性和隨機(jī)不確定性的方法。由網(wǎng)格搜索和交叉驗(yàn)證確定的BDLSTM模型的超參數(shù)如表1所示。所有測(cè)試的算法都是用Python語(yǔ)言實(shí)現(xiàn)的,主要軟件包采用了Scikit-learn[26]、Keras[27](M1-M6)和Edward[28](M7),并在Intel Xeon PC上運(yùn)行。
表1 BDLSTM的超參數(shù)
(1) 確定性預(yù)測(cè)的度量:RMSE度量實(shí)際值與預(yù)測(cè)值之間誤差平方和平均值的平方根,表達(dá)式如下:
(24)
NRMSD可計(jì)算為:
(25)
MAE和MAPE分別以單位kW和%表示實(shí)際凈負(fù)荷與預(yù)測(cè)凈負(fù)荷的絕對(duì)差值,其表達(dá)式如下:
(26)
(27)
(2) 概率預(yù)測(cè)的度量:為了評(píng)估概率預(yù)測(cè)方法的性能,校準(zhǔn)、可靠性和銳度是表示估計(jì)分布的一致性、變化和緊密性的三個(gè)主要因素。Pinball損失函數(shù)是衡量上述因素最全面的指標(biāo)之一,其計(jì)算式表示為:
(28)
計(jì)算所有Pinball損失函數(shù)值的平均值是為了評(píng)估q=0.01,0.02,…,0.99的概率預(yù)測(cè)的總體性能,較低的值表示更好的性能。Winkler評(píng)分是概率預(yù)測(cè)的另一種綜合指標(biāo),它可以同時(shí)衡量無(wú)條件覆蓋和區(qū)間寬度,其計(jì)算式可以表示為:
(29)
式中:maxt和mint分別表示α=0.1時(shí),時(shí)間t的概率預(yù)測(cè)的上界和下界;α為比例增益系數(shù);δ為偏置系數(shù)。較低的分?jǐn)?shù)說(shuō)明概率估計(jì)結(jié)果較好。
本節(jié)將BDLSTM方法與其他方法在點(diǎn)預(yù)測(cè)和概率預(yù)測(cè)結(jié)果方面的預(yù)測(cè)性能進(jìn)行比較。M3-M7使用第50個(gè)百分位值來(lái)評(píng)估其確定性預(yù)測(cè)結(jié)果。首先,對(duì)于所有方法,假設(shè)所有用戶都屬于一個(gè)集群(即K=1),PV數(shù)據(jù)對(duì)于每個(gè)用戶都100%可用。
表2給出了RMSE、MAE、MAPE和NRMSD的點(diǎn)預(yù)測(cè)結(jié)果。結(jié)果表明,與多元線性回歸(M1)方法相比,BDLSTM模型(M7)的RMSE、MAE、MAPE和NRMSD分別降低了約60.60%、62.15%、62.28%和65.98%。與分位數(shù)隨機(jī)森林(M6)方法相比,BDLSTM模型四個(gè)評(píng)價(jià)指標(biāo)的改進(jìn)幅度分別約為14.63%、10.29%、4.80%和15.21%。
表2 不同方法的各種指標(biāo)預(yù)測(cè)對(duì)比結(jié)果
為了說(shuō)明BDLSTM方法的有效性及其捕獲不確定性的能力,得到不同概率方法的總體概率評(píng)估度量值,如表3所示。結(jié)果表明,貝葉斯深度LSTM網(wǎng)絡(luò)的預(yù)測(cè)精度最高,其次是分位數(shù)隨機(jī)森林法(M6)。M7具有最佳的預(yù)測(cè)能力這一事實(shí)說(shuō)明了同時(shí)捕獲認(rèn)知不確定性和隨機(jī)不確定性的重要性。如表3所示,M3和M4在這方面性能較差,因?yàn)橹豢紤]了凈負(fù)荷數(shù)據(jù)中的不確定性。觀察可知,不同概率預(yù)測(cè)方法的性能排序與點(diǎn)預(yù)測(cè)結(jié)果一致:M7(BDLSTM)的性能優(yōu)于其他測(cè)試方法,例如,與M3相比,Pinball損失和Winkler評(píng)分分別改進(jìn)了約64.46%和60.57%。
表3 不同方法的點(diǎn)預(yù)測(cè)結(jié)果
此外,圖4和圖5顯示了M6模型和BDLSTM模型得到的10個(gè)試驗(yàn)天的預(yù)測(cè)結(jié)果。在測(cè)試期間的實(shí)際凈負(fù)荷由帶點(diǎn)的黑色曲線表示。98%、90%、70%和50%的置信區(qū)間是由不斷加深的灰色細(xì)框表示的。一般情況下,概率預(yù)測(cè)性能主要從可靠性、清晰度和分辨率三個(gè)方面進(jìn)行評(píng)價(jià),并通過(guò)綜合評(píng)價(jià)標(biāo)準(zhǔn)Pinball損失和Winkler評(píng)分來(lái)量化。觀察可知,M6高估了10個(gè)測(cè)試日的峰值需求,并有誤導(dǎo)性的趨勢(shì),本文方法可以很好地預(yù)測(cè)每天高峰時(shí)段的凈負(fù)荷。
此外,將測(cè)試數(shù)據(jù)集從10天擴(kuò)展到4個(gè)季節(jié),以研究不同季節(jié)的概率預(yù)測(cè)性能。表4給出了所有概率預(yù)測(cè)方法(M3-M7)的平均Pinball損失值??梢钥闯觯M管不同季節(jié)的相對(duì)改善量不同,但本文方法始終優(yōu)于其他方法,例如,在年度四個(gè)季節(jié),M7與M6相比,其平均Pinball損失值低40.14%、29.99%、6.83%和26.77%。
表4 不同季節(jié)的平均Pinball損失
表5給出了所有測(cè)試方法的訓(xùn)練過(guò)程的CPU時(shí)間。BDLSTM方法比大多數(shù)其他測(cè)試方法需要更長(zhǎng)的訓(xùn)練時(shí)間。然而,模型訓(xùn)練是一個(gè)離線過(guò)程。在給定輸入特征的情況下,所提模型進(jìn)行日前預(yù)報(bào)只需幾秒鐘的時(shí)間。
表5 各方法訓(xùn)練過(guò)程的CPU時(shí)間
本節(jié)驗(yàn)證所提框架中聚類階段的有效性。假設(shè)所有PV數(shù)據(jù)仍然可見(jiàn),并且集群的數(shù)量設(shè)置為K=[1,2,3,4,5,6]。圖6為不同集群數(shù)量的預(yù)測(cè)性能。
從K=1到K=4的Pinball損失、RMSE、MAE、NRMSD和MAPE分別改善了3.39%、5.99%、8.96%、8.77%和7.40%。此外,這些獨(dú)立的集群都100%PV可見(jiàn)的情況下,由相同的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練。因此,進(jìn)一步調(diào)整每個(gè)集群的超參數(shù)可以提高聚合級(jí)別上的預(yù)測(cè)性能。
此外,為了研究由可見(jiàn)性所得用戶類別對(duì)預(yù)測(cè)模型的影響,還評(píng)估了在可見(jiàn)度為50%的情況下,Kvis和Kinv不同組合的概率預(yù)測(cè)性能。表6給出了BDLSTM方法在K=Kinv+Kvis不同情況下的平均Pinball損耗,其中:Kinv=1,2,3;Kvis=1,2,3。結(jié)果表明,最優(yōu)組合為Kinv=1、Kvis=3,與無(wú)聚類情況(Kinv=1,Kvis=1)相比,平均Pinball損失提高了約31.14%。此外,無(wú)論對(duì)于可見(jiàn)組還是不可見(jiàn)組,增加集群數(shù)量都比不聚類情況下的Pinball損失更低,這說(shuō)明了所提框架中聚類階段的有效性。如果集群的數(shù)量增加到一個(gè)相對(duì)較大的值(例如,Kinv=4,Kvis=4),計(jì)算出的Pinball損失可能會(huì)比沒(méi)有集群的情況下更大,因此,必須為Kinv/Kvis選擇一個(gè)合適的范圍,以確定最佳組合。
表6 不同集群數(shù)的平均Pinball損失
本節(jié)研究分布式光伏發(fā)電的可見(jiàn)性對(duì)凈負(fù)荷預(yù)測(cè)準(zhǔn)確性的影響。假設(shè)K=1,PV可見(jiàn)度為vis=[0,0.2,0.4,0.5,0.6,0.8,1]。vis=0和vis=1分別表示不可見(jiàn)和完全可見(jiàn)PV,其他值表示PV部分可見(jiàn)。例如,vis=0.5說(shuō)明300戶家庭中有50%的屋頂光伏發(fā)電有單獨(dú)的電表,而其余的光伏輸出無(wú)法測(cè)量。
表7包含了不同可見(jiàn)度下Pinball損失和Winkler評(píng)分的結(jié)果。由結(jié)果可知,增加可見(jiàn)的光伏發(fā)電可以提高負(fù)荷預(yù)測(cè)性能??紤]到電表安裝成本,可以根據(jù)運(yùn)營(yíng)商的需求,權(quán)衡預(yù)測(cè)準(zhǔn)確性和安裝成本。例如,如果運(yùn)營(yíng)商可以接受Pinball損失值下降約13%(vis=0.6與vis=1),那么60%的家庭屋頂光伏發(fā)電需要安裝獨(dú)立電表,從而減少其安裝的成本。
表7 不同光伏可見(jiàn)度下的凈負(fù)荷預(yù)測(cè)性能
續(xù)表7
概率預(yù)測(cè)方法不同可見(jiàn)度下的Pinball損失,如表8所示。可以看出,隨著PV可見(jiàn)度的增加,所有方法的概率凈負(fù)荷預(yù)測(cè)準(zhǔn)確性都得到了提高。結(jié)果證明BDLSTM方法在不同可見(jiàn)度下的優(yōu)越性和有效性。為進(jìn)一步提高本文方法的性能,后續(xù)可通過(guò)估算不可見(jiàn)PV發(fā)電出力,增加PV的可見(jiàn)性。
表8 各方法不同PV可見(jiàn)度下的平均Pinball損失
本文提出一種利用貝葉斯深度LSTM神經(jīng)網(wǎng)絡(luò),同時(shí)處理認(rèn)知不確定性和隨機(jī)不確定性的概率凈負(fù)荷預(yù)測(cè)方法。本文方法通過(guò)聚類為每個(gè)單獨(dú)的集群建立深度學(xué)習(xí)模型,并在最后聚合每個(gè)集群的概率預(yù)測(cè)結(jié)果,以獲得最終預(yù)測(cè)的總凈負(fù)荷,從而提高預(yù)測(cè)性能。算例分析了該方法的整體性能,并與一系列概率預(yù)測(cè)模型進(jìn)行了比較,評(píng)價(jià)結(jié)果驗(yàn)證了BDLSTM方法的優(yōu)越性,并分析了聚類和提高PV可見(jiàn)性對(duì)提高預(yù)測(cè)準(zhǔn)確性的效果。
未來(lái)將進(jìn)一步深入研究貝葉斯深度學(xué)習(xí),考慮具有更高不確定性的問(wèn)題,例如:家庭層面的凈負(fù)荷預(yù)測(cè)與更高的PV滲透率問(wèn)題。此外,如何選擇一個(gè)合適的先驗(yàn)仍然是貝葉斯深度學(xué)習(xí)值得關(guān)注的問(wèn)題。