陳衛(wèi)東,吳寧,黃彥璐,馬溪原,郭曉斌,林冬
(1. 廣西電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,南寧530013;2. 南方電網(wǎng)數(shù)字電網(wǎng)研究院,廣州510663)
微電網(wǎng)技術(shù)作為一種提高分布式電源消納、多能源互補利用、以及提高供電可靠性的關(guān)鍵解決方案,已在南方電網(wǎng)范圍內(nèi)加快推廣,在解決無電島、偏遠(yuǎn)山區(qū)供電等方面應(yīng)用潛力巨大,是南方電網(wǎng)公司“能源價值鏈整合商”轉(zhuǎn)型的重要組成部分[1 - 2]。
微電網(wǎng)的優(yōu)化調(diào)度是保證微電網(wǎng)安全、可靠、經(jīng)濟運行的重要手段,是微電網(wǎng)相關(guān)研究的熱點問題[3 - 4]。傳統(tǒng)的微電網(wǎng)優(yōu)化調(diào)度通?;谧顑?yōu)化的理論和方法,首先對微電網(wǎng)內(nèi)部各元件進行建模,然后對模型進行簡化和處理,最后研究相應(yīng)的求解算法對模型進行求解。模型的目標(biāo)函數(shù)一般為運行成本最小,也有相關(guān)研究綜合考慮經(jīng)濟、環(huán)境以及社會效益建立多目標(biāo)優(yōu)化模型[5 - 6];常用的模型建模方法包括混合整數(shù)規(guī)劃[7 - 8]、動態(tài)規(guī)劃[9]、模型預(yù)測控制[10]、分布式優(yōu)化[11]、李雅普諾夫優(yōu)化[12]等;常用的模型求解算法包括遺傳算法[13]、粒子群算法[14]、主動進化算法[15]、拉格朗日松弛法[16]等。近年來,隨著風(fēng)機、光伏等可再生能源的高比例接入,微電網(wǎng)的運行不確定性顯著加大,如何應(yīng)對不確定性因素成為微電網(wǎng)優(yōu)化調(diào)度的難點問題。此類問題常用的解決辦法是將不確定性問題轉(zhuǎn)換成確定性問題進行建模求解,主要包括基于場景的隨機優(yōu)化[17 - 18]、機會約束優(yōu)化[19]、魯棒優(yōu)化[20 - 21]等,但這些方法均存在一定的局限性,如隨機優(yōu)化計算量較大、魯棒優(yōu)化過于保守等,而且微電網(wǎng)系統(tǒng)運行不確定因素較為復(fù)雜時,其概率建模較為困難。
目前,微電網(wǎng)正逐步演變?yōu)榫哂虚_放性、不確定性和復(fù)雜性的新型系統(tǒng),強間歇性可再生能源高比例接入、高滲透率電力電子裝備、多能源耦合等新模式對微電網(wǎng)的物理特性及運行控制產(chǎn)生重要影響,上述傳統(tǒng)模型驅(qū)動的建模求解方法已難以滿足需求,主要體現(xiàn)在:
1)微電網(wǎng)各元件的精細(xì)化建模較為困難,簡化模型難以描述元件實際運行的物理特性,導(dǎo)致優(yōu)化結(jié)果可能是次優(yōu)的;
2)所建立的模型一般是非線性非凸的,其本身求解是典型的非確定性多項式難題(non-deterministic polynomial hard,NP-hard),求解效率較低;
3)模型的建立需要依據(jù)拓?fù)浣Y(jié)構(gòu)和運行方式完成,對拓?fù)浣Y(jié)構(gòu)的變化以及新型電力設(shè)備接入的適應(yīng)性不強;
4)基于“離線計算、在線匹配”的預(yù)案式控制難以適應(yīng)復(fù)雜多變的系統(tǒng)工況。
5)不能充分利用所積累的歷史決策數(shù)據(jù)信息。
此外,南方電網(wǎng)公司正在向“能源價值鏈整合商”轉(zhuǎn)型,將有可能運維數(shù)以萬計的微電網(wǎng),傳統(tǒng)的基于人工值守的調(diào)度模式將難以適應(yīng)這種新形態(tài)和新業(yè)態(tài)的出現(xiàn)。人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,研究其在系統(tǒng)調(diào)度運行的應(yīng)用有助于突破傳統(tǒng)解決方案的局限性。目前,深度學(xué)習(xí)等機器學(xué)習(xí)算法在系統(tǒng)優(yōu)化調(diào)度中的應(yīng)用主要集中在負(fù)荷預(yù)測方面,直接應(yīng)用在系統(tǒng)調(diào)度決策的相關(guān)研究較少[22 - 25]。文獻[26]基于長短期記憶網(wǎng)絡(luò),構(gòu)建了面向機組組合問題的深度學(xué)習(xí)模型,通過歷史數(shù)據(jù)的訓(xùn)練建立系統(tǒng)負(fù)荷與調(diào)度決策之間的映射關(guān)系,并以此進行機組組合決策,但所構(gòu)建的網(wǎng)絡(luò)結(jié)構(gòu)較為簡單,且缺乏對模型輸出結(jié)果的處理,導(dǎo)致調(diào)度決策很可能不滿足運行過程中復(fù)雜的約束關(guān)系。
面向人工智能在微電網(wǎng)自動運行調(diào)控領(lǐng)域的需求,針對傳統(tǒng)模型驅(qū)動、預(yù)案式控制、人工值守調(diào)度模式和方法的缺陷,本文提出基于深度學(xué)習(xí)的微電網(wǎng)自動運行調(diào)控模型和方法,該方法基于深度雙向長短期記憶網(wǎng)絡(luò)(bidirectional long-short term memory, Bi-LSTM),通過歷史運行數(shù)據(jù)的訓(xùn)練,直接構(gòu)建微電網(wǎng)系統(tǒng)運行場景與調(diào)度決策結(jié)果之間的映射關(guān)系,并提出模型輸出結(jié)果的處理原則,可實現(xiàn)微電網(wǎng)功率的快速平衡與經(jīng)濟優(yōu)化,該方法可以作為物理優(yōu)化模型方法的輔助決策方法,解決了傳統(tǒng)微電網(wǎng)運行優(yōu)化調(diào)控模型求解效率低、難以適應(yīng)復(fù)雜多變運行工況等難點問題,提升了微電網(wǎng)調(diào)度運行的智能化程度。
微電網(wǎng)日前優(yōu)化調(diào)度的目標(biāo)是一天內(nèi)系統(tǒng)的總運行成本最低。系統(tǒng)的總運行成本包括微型燃?xì)廨啓C等可控分布式發(fā)電機組的燃料成本和啟動成本、儲能電池的充放電成本以及微電網(wǎng)與大電網(wǎng)之間的購售電成本,具體可表示為:
(1)
(2)
式中:T為調(diào)度周期;N為可控機組的數(shù)量;CFuel,i,t和CSU,i,t分別為可控機組i在時段t的燃料成本和啟動成本;CES,t為儲能電池在時段t的充放電成本;CGrid,t為微電網(wǎng)與大電網(wǎng)在時段t的購售電成本;ai、bi、ci為可控機組i的燃料成本系數(shù);SUi為可控機組i的啟動成本;KES為儲能電池的單位充放電成本;pt為電網(wǎng)在時段t的電價;PG,i,t為可控機組i在時段t的出力;Pcha,t和Pdis,t分別為儲能電池在時段t的充電功率和放電功率;PGrid,t為微電網(wǎng)與大電網(wǎng)在時段t的交換功率,其中,PGrid,t>0表示微電網(wǎng)從大電網(wǎng)買電,反之為微電網(wǎng)向大電網(wǎng)賣電;non,i,t和nsu,i,t分別為指示機組運行和啟動狀態(tài)的二進制變量,non,i,t=1表示可控機組i在時段t處于運行狀態(tài),反之non,i,t=0;nsu,i,t=1為可控機組i在時段t啟動,反之nsu,i,t=0。ηcha、ηdis分別為儲能電池的充電效率和放電效率。
微電網(wǎng)日前優(yōu)化調(diào)度模型的約束條件包括系統(tǒng)功率平衡約束、可控機組運行約束、儲能電池運行約束、微電網(wǎng)與大電網(wǎng)間聯(lián)絡(luò)線的功率約束等等,具體可表示如下。
1.2.1 系統(tǒng)功率平衡約束
微電網(wǎng)優(yōu)化調(diào)度必須保證系統(tǒng)功率實時平衡,如式(3)所示。
(3)
式中:PLoad,t為系統(tǒng)在時段t的負(fù)荷;PWT,t和PPV,t分別為風(fēng)機和光伏在時段t的預(yù)測出力。等式右側(cè)為系統(tǒng)的凈負(fù)荷,表征微電網(wǎng)的運行工況,等式左側(cè)變量為微電網(wǎng)日前優(yōu)化調(diào)度的決策變量。
1.2.2 可控機組運行約束
可控機組運行約束包括可控機組的出力約束、爬坡約束、最小運行時間和停運時間約束以及機組的狀態(tài)指示變量約束等,如式(4)—(12)所示。
PG,i,min·non,i,t≤PG,i,t≤PG,i,max, ?i,t
(4)
-Pi,RD≤PG,i,t-PG,i,t-1≤Pi,RU, ?i,t
(5)
nsu,i,t-nsd,i,t=non,i,t-non,i,t-1, ?i,t
(6)
nsu,i,t+nsd,i,t≤1, ?i,t
(7)
UTi=min{T,(Ton,i-Ion,i)·non,i,0}
(8)
DTi=min{T,(Toff,i-Ioff,i)·(1-non,i,0)}
(9)
non,i,t=non,i,0,t≤UTi+DTi,?i
(10)
(11)
(12)
式中:PG,i,min和PG,i,max分別為可控機組i的最小出力和最大出力;Pi,RD和Pi,RU分別為可控機組i的最大下調(diào)出力和最大上調(diào)出力;nsd,i,t為指示機組停運狀態(tài)的二進制變量,nsd,i,t=1表示可控機組i在時段t停運,反之nsd,i,t=0;UTi為0時刻初始狀態(tài)為運行狀態(tài)時的持續(xù)時間,DTi為0時刻初始狀態(tài)為停機狀態(tài)時的持續(xù)時間;Ton,i和Toff,i分別為可控機組i的最小運行時間和最小停運時間;Ion,i和Ioff,i分別為可控機組i的初始運行時間和初始停運時間;non,i,0為可控機組i在0時刻的運行狀態(tài)。
1.2.3 儲能電池運行約束
儲能電池運行約束包括儲能電池的充放電狀態(tài)約束、充放電功率約束、儲能電池容量約束、調(diào)度周期內(nèi)儲能平衡約束等等,如式(13)—(18)所示。
ncha,t+ndis,t≤1, ?t
(13)
0≤Pcha,t≤Pcha,max·ncha,t, ?t
(14)
0≤Pdis,t≤Pdis,max·ndis,t, ?t
(15)
EES,t=EES,t-1+Pcha,t·ηcha-Pdis,t/ηdis, ?t
(16)
Ec·socmin≤EES,t≤Ec·socmax, ?t
(17)
(18)
式中:ncha,t和ndis,t為指示儲能電池充放電狀態(tài)的二進制變量,ncha,t=1表示儲能電池在時段t充電,反之non,i,t=0;ndis,t=1表示儲能電池在時段t放電,反之nsu,i,t=0;Pcha,max和Pdis,max分別為儲能變流器的最大充放電功率;EES,t為儲能電池在時段t的容量;Ec為儲能電池的最大容量;socmax和socmin分別為儲能電池的最大、最小荷電狀態(tài)。
1.2.4 聯(lián)絡(luò)線功率約束
-PGrid,max≤PGrid,t≤PGrid,max, ?t
(19)
式中PGrid,max為微電網(wǎng)與大電網(wǎng)聯(lián)絡(luò)線允許交換的最大功率。
上述模型是一個混合整數(shù)非線性規(guī)劃模型,求解效率相對較低。為了提高模型的求解效率,需要對微電網(wǎng)內(nèi)各元件的精細(xì)化數(shù)學(xué)模型進行簡化處理,使得模型的求解精度下降,進而導(dǎo)致所優(yōu)化出來的結(jié)果可能是次優(yōu)的,甚至是不可行的。此外,模型驅(qū)動的微電網(wǎng)調(diào)度決策方法忽視了歷史調(diào)度決策結(jié)果對未來調(diào)度決策結(jié)果的指導(dǎo)意義,模型和算法一旦確定,針對任一場景的微電網(wǎng)優(yōu)化調(diào)度問題,其求解精度和計算效率都不會改變。
針對模型驅(qū)動的微電網(wǎng)優(yōu)化調(diào)度模型的技術(shù)難點與缺陷,本文提出一種基于深度Bi-LSTM的微電網(wǎng)日前優(yōu)化調(diào)度輔助決策方法,該方法通過海量歷史數(shù)據(jù)的訓(xùn)練,直接構(gòu)建微電網(wǎng)運行場景與決策結(jié)果之間的映射關(guān)系,可實現(xiàn)微電網(wǎng)日前功率的快速平衡與輔助決策。
長短期記憶網(wǎng)絡(luò)LSTM由瑞士人工智能科學(xué)家Jürgen Schmidhuber在1997年提出[27],是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),廣泛應(yīng)用于序列預(yù)測、自然語言處理等任務(wù)中。
LSTM通過新增記憶單元,同時引入輸入門、遺忘門和輸出門等門控單元控制信息的遺忘與刷新,可有效解決循環(huán)神經(jīng)網(wǎng)絡(luò)在長序列訓(xùn)練過程中出現(xiàn)的梯度彌散和梯度爆炸問題,適用于處理時間序列較長的數(shù)據(jù)信息,其基本結(jié)構(gòu)單元如圖1所示。
圖1 LSTM的基本結(jié)構(gòu)單元
LSTM基本結(jié)構(gòu)單元的前向傳播過程如式(20)—(25)所示。
gf=σ(Wf[ht-1,xt]+bf)
(20)
gi=σ(Wi[ht-1,xt]+bi)
(21)
go=σ(Wo[ht-1,xt]+bo)
(22)
(23)
(24)
yt=ht=go° tanh(ct)
(25)
由LSTM的基本結(jié)構(gòu)單元可見,在每個時間戳t,LSTM只能提取當(dāng)前輸入和過去時間序列的特征信息,忽略了未來時間序列的特征信息。而Bi-LSTM在隱層同一時間戳同時包含一個正向LSTM和一個反向LSTM,并且二者都連接著一個輸出層,這樣的結(jié)構(gòu)提供給輸出層輸入序列每一個時間戳完整的過去和未來的上下文特征信息,在豐富模型表達能力的同時,并沒有增加對數(shù)據(jù)量的要求。Bi-LSTM的基本結(jié)構(gòu)單元如圖2所示。
圖2 Bi-LSTM的基本結(jié)構(gòu)單元
微電網(wǎng)系統(tǒng)負(fù)荷預(yù)測數(shù)據(jù)以及調(diào)度決策信息是典型的具有時間先后順序的序列數(shù)據(jù),且微電網(wǎng)日前優(yōu)化調(diào)度周期較長,采用擅長處理較長時間序列數(shù)據(jù)的LSTM進行輸入輸出映射關(guān)系的學(xué)習(xí)較為合適。此外,微電網(wǎng)日前優(yōu)化調(diào)度決策需要滿足可控機組爬坡約束(5)、最小運行和停運時間約束(11)—(12)、儲能電池容量與充放電功率關(guān)系約束(16)等時間耦合約束,使得微電網(wǎng)當(dāng)前時段的調(diào)度決策結(jié)果受過去和未來時段風(fēng)機出力、光伏出力以及負(fù)荷的運行工況的影響。因此,選擇Bi-LSTM神經(jīng)網(wǎng)絡(luò)構(gòu)建微電網(wǎng)日前優(yōu)化調(diào)度的深度學(xué)習(xí)模型更能有效提取微電網(wǎng)運行工況的特征信息,進而可以更準(zhǔn)確地描述微電網(wǎng)運行場景與調(diào)度決策結(jié)果之間的映射關(guān)系。
基于深度Bi-LSTM神經(jīng)網(wǎng)絡(luò)的微電網(wǎng)日前優(yōu)化調(diào)度模型通過海量歷史數(shù)據(jù)的訓(xùn)練,構(gòu)建微電網(wǎng)運行場景與調(diào)度決策結(jié)果之間的映射關(guān)系,進而針對風(fēng)電、光伏、負(fù)荷任一場景的日前預(yù)測數(shù)據(jù)即可直接映射出相應(yīng)的調(diào)度決策結(jié)果,具體網(wǎng)絡(luò)模型和詳細(xì)的決策流程如圖3所示。
圖3 網(wǎng)絡(luò)模型和決策流程示意圖
由圖3可見,微電網(wǎng)日前優(yōu)化調(diào)度的深度學(xué)習(xí)模型由雙層Bi-LSTM神經(jīng)網(wǎng)絡(luò)構(gòu)成,其中,第1層Bi-LSTM的輸出作為第2層Bi-LSTM神經(jīng)網(wǎng)絡(luò)的輸入;整體模型的輸入為日前24時段的系統(tǒng)凈負(fù)荷,可由日前24時段風(fēng)機、光伏以及負(fù)荷的預(yù)測數(shù)據(jù)得出;整體模型的輸出為日前24時段的調(diào)度決策結(jié)果,具體包括每臺可控機組各時段的出力大小、儲能電池各時段的充放電功率以及微電網(wǎng)與大電網(wǎng)聯(lián)絡(luò)線的交換功率。
在進行網(wǎng)絡(luò)訓(xùn)練之前,需要將訓(xùn)練樣本數(shù)據(jù)進行歸一化處理。具體地,系統(tǒng)凈負(fù)荷數(shù)據(jù)以及可控機組出力數(shù)據(jù)歸一化到[0,1]之間,儲能電池的充放電功率以及微電網(wǎng)與大電網(wǎng)聯(lián)絡(luò)線的交換功率歸一化到[-1,1]之間,如式(26)—(31)所示。
Pnet,t=PLoad,t-PWT,t-PPV,t
(26)
Pes,t=Pdis,t-Pcha,t
(27)
(28)
(29)
(30)
(31)
式中:Pnet,t為系統(tǒng)在時段t的凈負(fù)荷;Pes,t為儲能電池在時段t的充放電功率,Pes,t>0表示放電,反之表示充電;Pnet,t0、PG,i,t0、Pes,t0、PGrid,t0分別為系統(tǒng)凈負(fù)荷、可控機組出力、儲能充放電功率以及微電網(wǎng)與大電網(wǎng)聯(lián)絡(luò)線交換功率的歸一化值。
本文采用Adam優(yōu)化算法[28]來進行雙層Bi-LSTM神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,選取均方誤差(mean squared error, MSE)作為損失函數(shù),MSE的表達式以及Adam算法的權(quán)重更新公式如式(32)—(35)所示。
(32)
(33)
(34)
(35)
值得注意的是,基于深度學(xué)習(xí)的微電網(wǎng)日前優(yōu)化調(diào)度輔助決策方法不研究優(yōu)化調(diào)度的內(nèi)在機理,所輸出的調(diào)度決策結(jié)果很可能不滿足微電網(wǎng)系統(tǒng)功率平衡約束以及各元件的運行約束等,因此,需要對網(wǎng)絡(luò)輸出的結(jié)果進行相應(yīng)處理,具體的處理原則如下。
1)若模型輸出的可控機組出力小于0.5倍最小技術(shù)出力,則認(rèn)為可控機組出力為0;若模型輸出的可控機組出力在0.5倍最小技術(shù)出力與最小技術(shù)出力之間,則認(rèn)為可控機組出力為最小技術(shù)出力;
2)若模型輸出的可控機組出力、儲能充放電功率以及聯(lián)絡(luò)線交換功率數(shù)值超過上限,則輸出值取為上限;
3)若模型輸出的可控機組相鄰兩個時段的出力不滿足機組上下爬坡約束,則可控機組下一時段的出力等于上一時段的出力加上(減去)最大上調(diào)(下調(diào))出力;
4)若模型輸出的可控機組各時段運行狀態(tài)不滿足最小運行和停運時間約束,則未滿足最小運行(停運)時間的時段,可控機組出力為最小技術(shù)出力(0);
5)若模型輸出的儲能電池各時段運行容量不滿足容量約束,則不滿足容量約束的時段根據(jù)最大(小)荷電狀態(tài)確定儲能的充(放)電功率;
6)儲能電池調(diào)度周期最后一個時段的充放電功率數(shù)值取決于調(diào)度周期其他所有時段充放電功率的總和,以滿足調(diào)度周期內(nèi)儲能平衡約束;
7)微電網(wǎng)與大電網(wǎng)聯(lián)絡(luò)線各時段的交換功率取決于當(dāng)前時段系統(tǒng)凈負(fù)荷、可控機組出力以及儲能充放電功率,以滿足系統(tǒng)功率平衡約束。
應(yīng)按照原則的先后順序依次對網(wǎng)絡(luò)的輸出結(jié)果進行處理:先處理不等式約束,后處理等式約束;先處理元件約束,后處理系統(tǒng)約束。
此外,由圖3可見,本文微電網(wǎng)日前優(yōu)化調(diào)度深度學(xué)習(xí)模型的訓(xùn)練是隨著時間推移持續(xù)進行的,通過歷史輸入數(shù)據(jù)與輸出數(shù)據(jù)的積累可以實現(xiàn)對深度學(xué)習(xí)模型的持續(xù)修正,進而可以有效計及歷史調(diào)度決策結(jié)果對未來調(diào)度決策的指導(dǎo)意義,不斷提高微電網(wǎng)日前優(yōu)化調(diào)度的求解精度與效率。因此,本文基于深度學(xué)習(xí)的微電網(wǎng)日前優(yōu)化調(diào)度方法可以很好地作為模型驅(qū)動方法的輔助與備用。
為了驗證本文所提方法的有效性,選取一個典型的并網(wǎng)型微電網(wǎng)系統(tǒng)進行仿真測試,并將測試結(jié)果與基于混合整數(shù)規(guī)劃的模型驅(qū)動的調(diào)度決策結(jié)果進行對比分析。該并網(wǎng)型微電網(wǎng)系統(tǒng)包含1臺風(fēng)力發(fā)電機組、1臺光伏發(fā)電機組、儲能電池系統(tǒng)以及4臺微型燃?xì)廨啓C發(fā)電機組。其中,風(fēng)機和光伏的裝機容量均為800 kW,儲能電池容量為3 600 kWh,初始電池容量為1 500 kWh,變流器最大充放電功率為500 kW,最大、最小荷電狀態(tài)分別為0.95和0.15,充放電效率設(shè)為0.95,單位充放電成本為0.08 元/kWh,4臺微型燃?xì)廨啓C發(fā)電機組的技術(shù)成本參數(shù)如表1所示,該系統(tǒng)與大電網(wǎng)聯(lián)絡(luò)線交換的最大功率為1 000 kW,日前交易的分時電價如圖4所示。
表1 微型燃?xì)廨啓C技術(shù)成本參數(shù)
圖4 日前分時交易電價
本文基于Python 3.7的Tensorflow 2.0 深度學(xué)習(xí)框架完成基于深度Bi-LSTM神經(jīng)網(wǎng)絡(luò)的微電網(wǎng)日前優(yōu)化調(diào)度模型的構(gòu)建、訓(xùn)練與評估。網(wǎng)絡(luò)離線訓(xùn)練所需的輸入數(shù)據(jù)為風(fēng)機、光伏和負(fù)荷的日前預(yù)測數(shù)據(jù),來源于歐洲開放的電力系統(tǒng)數(shù)據(jù)平臺OPSD[29],輸出標(biāo)簽數(shù)據(jù)為基于混合整數(shù)規(guī)劃的模型驅(qū)動的調(diào)度決策結(jié)果,包括日前24時段的4臺微型燃?xì)廨啓C機組的出力、儲能充放電功率以及與電網(wǎng)交換的功率。選取500個訓(xùn)練樣本進行深度Bi-LSTM神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和測試,其中前450個訓(xùn)練樣本作為訓(xùn)練集,后50個訓(xùn)練樣本作為測試集,如圖5所示。為減少神經(jīng)網(wǎng)絡(luò)參數(shù)的數(shù)量,第1層Bi-LSTM的輸入為微電網(wǎng)系統(tǒng)的凈負(fù)荷,張量形狀為(24,1),第1層Bi-LSTM的輸出與第2層Bi-LSTM的輸入相同,張量形狀為(24,64),第2層Bi-LSTM的輸出為調(diào)度決策結(jié)果,張量形狀為(24,6),所建立的深度Bi-LSTM神經(jīng)網(wǎng)絡(luò)需要訓(xùn)練的總參數(shù)數(shù)量為37 200個,離線訓(xùn)練的學(xué)習(xí)率設(shè)為0.01。
圖5 訓(xùn)練集與測試集數(shù)據(jù)
微電網(wǎng)日前優(yōu)化調(diào)度的混合整數(shù)規(guī)劃模型使用GAMS 24.4調(diào)用CPLEX 12.0求解器進行求解,算法相對間隙設(shè)為1%,上述仿真測試均在處理器為Intel Core i5- 1035G4 CPU @ 1.10 GHz, 1 498 MHz,內(nèi)存為16 GB的環(huán)境下進行。
首先,將上述訓(xùn)練集再次切分為訓(xùn)練集和驗證集,選取前400個樣本作為訓(xùn)練集用于訓(xùn)練深度學(xué)習(xí)模型參數(shù),后50個樣本作為驗證集用于在訓(xùn)練過程中選擇合適的模型超參數(shù),并判斷模型是否過擬合。其中,回合大小(Epoch)為500、批量大小(Batch)為10的深度Bi-LSTM模型的訓(xùn)練過程如圖6所示。
圖6 網(wǎng)絡(luò)模型的訓(xùn)練過程
由圖5可見,在訓(xùn)練了500個回合之后,模型接近于收斂,訓(xùn)練誤差低于0.005,訓(xùn)練準(zhǔn)確率達到了0.8,此時驗證誤差為0.01,驗證準(zhǔn)確率為0.83,訓(xùn)練誤差和驗證誤差都很低,訓(xùn)練準(zhǔn)確率和驗證準(zhǔn)確率接近,說明所訓(xùn)練好的網(wǎng)絡(luò)模型并沒有出現(xiàn)欠擬合或者過擬合的現(xiàn)象。另外,在訓(xùn)練200個回合之后,驗證誤差基本不再下降,驗證準(zhǔn)確率不再上升,可以認(rèn)為此時模型達到了最佳狀態(tài),可提前終止網(wǎng)絡(luò)模型的訓(xùn)練。
利用訓(xùn)練好的網(wǎng)絡(luò)模型結(jié)合測試集中50個場景的風(fēng)機、光伏以及負(fù)荷的預(yù)測數(shù)據(jù)進行微電網(wǎng)日前優(yōu)化調(diào)度決策,并采用本文第2節(jié)中網(wǎng)絡(luò)輸出結(jié)果的處理方法對調(diào)度優(yōu)化結(jié)果進行修正,即可得出測試集50個場景的基于深度學(xué)習(xí)的微電網(wǎng)優(yōu)化調(diào)度決策結(jié)果。其中,前2個場景的微電網(wǎng)優(yōu)化調(diào)度決策結(jié)果如圖7所示。
圖7 基于深度學(xué)習(xí)的微電網(wǎng)日前優(yōu)化調(diào)度決策結(jié)果
由圖7可見,基于深度學(xué)習(xí)的微電網(wǎng)日前優(yōu)化調(diào)度模型可直接根據(jù)風(fēng)機、光伏、負(fù)荷的日前預(yù)測數(shù)據(jù)映射出微電網(wǎng)的日前優(yōu)化調(diào)度結(jié)果,其決策時間十分短,可實現(xiàn)微電網(wǎng)系統(tǒng)功率的快速平衡。另外,采用本文方法得出的調(diào)度決策結(jié)果較為合理,具體表現(xiàn)在:1)儲能電池在系統(tǒng)凈負(fù)荷低谷時充電,在系統(tǒng)凈負(fù)荷高峰時放電;2)在電網(wǎng)峰時電價時段(時段21和時段46),微電網(wǎng)向大電網(wǎng)售電;3)運行成本最低、啟動成本最高的機組4在大部分時段保持運行狀態(tài),不頻繁啟動,運行成本和啟動成本相對較低的機組2在系統(tǒng)凈負(fù)荷高峰時啟動以維持微電網(wǎng)系統(tǒng)的功率平衡。
為了進一步驗證本文方法的有效性和準(zhǔn)確性,將基于本文方法與基于混合整數(shù)規(guī)劃模型以及基于深度置信網(wǎng)絡(luò)[25]得出的調(diào)度決策結(jié)果進行對比,測試集前10個場景的計算決策時間和系統(tǒng)總運行成本的對比結(jié)果分別如表2和圖8所示。
表2 3種方法計算時間的對比結(jié)果
圖8 3種方法系統(tǒng)總運行成本的對比結(jié)果
由表2可見,深度學(xué)習(xí)方法的計算求解時間遠(yuǎn)低于模型驅(qū)動方法,且深度學(xué)習(xí)方法的計算結(jié)果是通過輸入輸出的映射關(guān)系得到的,不會隨著模型復(fù)雜度的增大導(dǎo)致計算求解時間大幅上升。此外,由圖8可見,由于在日前優(yōu)化調(diào)度中,本文將模型驅(qū)動算法的計算結(jié)果作為訓(xùn)練目標(biāo)樣本進行深度Bi-LSTM神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,使得本文方法得出的系統(tǒng)總運行成本略高于模型驅(qū)動方法優(yōu)化出的系統(tǒng)總運行成本,但結(jié)果十分接近,平均誤差僅為1.42%,而基于深度置信網(wǎng)絡(luò)方法得出的系統(tǒng)總運行成本平均誤差為4.84%,可以驗證本文方法的有效性和準(zhǔn)確性。
首先分析不同的訓(xùn)練樣本容量對于基于深度學(xué)習(xí)的微電網(wǎng)優(yōu)化調(diào)度決策結(jié)果的影響,分別對比訓(xùn)練樣本容量為50、100、150、200、250、300、350、400時深度學(xué)習(xí)模型和混合整數(shù)規(guī)劃模型在測試集的性能表現(xiàn),測試集前10個場景的總運行成本以及測試準(zhǔn)確率的對比結(jié)果如圖9所示。
圖9 不同訓(xùn)練樣本容量的對比結(jié)果
由圖9可見,基于混合整數(shù)規(guī)劃模型驅(qū)動的調(diào)度決策結(jié)果與訓(xùn)練樣本的容量無關(guān),即歷史決策結(jié)果對未來決策結(jié)果沒有指導(dǎo)意義,一旦模型和算法確定,其計算效率和求解精度均不會改變。而深度學(xué)習(xí)模型的決策精度會隨著訓(xùn)練樣本容量的增加而提高,在訓(xùn)練樣本容量為50時,深度學(xué)習(xí)模型計算出的總運行成本為243 540.23元,與最優(yōu)運行成本的相對誤差為3.35%,測試準(zhǔn)確率為0.754 2;而當(dāng)訓(xùn)練樣本容量增加到400時,深度學(xué)習(xí)模型計算出的總運行成本為235 798.89元,與最優(yōu)運行成本的相對誤差僅為0.07%,測試準(zhǔn)確率提高至0.868 3。因此,深度學(xué)習(xí)模型可以計及歷史決策結(jié)果對未來決策結(jié)果的影響,在歷史數(shù)據(jù)不斷積累的過程中不斷對模型進行修正訓(xùn)練,進而不斷提高模型的決策精度。
圖10對比了采用7種不同的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和類型訓(xùn)練100個回合的訓(xùn)練過程。可見,單層單向LSTM訓(xùn)練的收斂過程較慢,雙層單向LSTM和3層單向LSTM訓(xùn)練過程的波動性較大,較不穩(wěn)定,而相比于單向LSTM,采用雙向LSTM訓(xùn)練的收斂過程更快,同時也更穩(wěn)定,雙層雙向LSTM與3層雙向LSTM的訓(xùn)練效果類似,根據(jù)奧卡姆剃刀原理,選用雙層雙向LSTM構(gòu)建基于深度學(xué)習(xí)的微電網(wǎng)日前優(yōu)化調(diào)度模型最為合適。
圖10 不同網(wǎng)絡(luò)結(jié)構(gòu)和類型的對比結(jié)果
最后,分析不確定性對該微電網(wǎng)系統(tǒng)實時在線優(yōu)化調(diào)度決策結(jié)果的影響,不確定性的來源為系統(tǒng)內(nèi)風(fēng)機、光伏以及負(fù)荷的日前預(yù)測誤差。圖11對比了不同的預(yù)測誤差下分別采用本文算法和采用模型驅(qū)動算法進行調(diào)度決策平均運行成本。其中,本文算法在離線階段訓(xùn)練好深度神經(jīng)網(wǎng)絡(luò)并直接應(yīng)用于在線決策;模型驅(qū)動算法在離線階段得到系統(tǒng)的預(yù)調(diào)度結(jié)果,實時的不平衡量通過考慮各元件的上下調(diào)裕度和成本進行再調(diào)度從而消除。由圖11可見,隨著預(yù)測誤差的增大,即不確定性的增大,本文算法的優(yōu)勢逐漸增大,當(dāng)預(yù)測誤差達到20%時,本文算法相對于模型驅(qū)動的算法平均運行成本下降了6.2%。這是由于本文算法基于大量的樣本進行訓(xùn)練,訓(xùn)練樣本的分布能夠自適應(yīng)不確定性的變化;而模型驅(qū)動的算法由于難以對復(fù)雜的不確定性進行建模從而導(dǎo)致實時再調(diào)度成本的增加,證明了本文算法應(yīng)對不確定性的效果更好。
圖11 不同預(yù)測誤差下兩種算法平均運行成本的對比結(jié)果
針對模型驅(qū)動的微電網(wǎng)優(yōu)化調(diào)度方法的局限性,本文提出了一種基于深度學(xué)習(xí)的數(shù)據(jù)驅(qū)動的微電網(wǎng)日前優(yōu)化調(diào)度模型和輔助決策方法,通過算例分析,可得出以下結(jié)論。
1)基于深度Bi-LSTM神經(jīng)網(wǎng)絡(luò)構(gòu)建了微電網(wǎng)日前優(yōu)化調(diào)度的深度學(xué)習(xí)模型,可以直接學(xué)習(xí)微電網(wǎng)運行場景與調(diào)度決策之間的映射關(guān)系,實現(xiàn)微電網(wǎng)日前功率的快速平衡與輔助決策;
2)提出了深度學(xué)習(xí)模型輸出結(jié)果的處理原則,可以有效解決調(diào)度決策結(jié)果可能不滿足系統(tǒng)硬性運行約束條件的問題;
3)基于深度學(xué)習(xí)的微電網(wǎng)日期優(yōu)化調(diào)度模型可以充分利用歷史調(diào)度決策信息,通過歷史數(shù)據(jù)的積累,對模型持續(xù)地進行修正和訓(xùn)練,進而不斷提高模型的求解精度。