洪晨威,劉其輝,張怡冰
(1.華北電力大學(xué) 新能源電力系統(tǒng)國家重點實驗室,北京102206;2.國網(wǎng)北京市電力有限公司,北京100031)
電動汽車(electric vehicle,EV)的大量上網(wǎng)帶來的大規(guī)模負荷增長進一步加劇了配網(wǎng)的負荷峰谷差,對配網(wǎng)的安全運行產(chǎn)生了負面影響。文獻[1]—文獻[2]對EV接入對電網(wǎng)產(chǎn)生的影響進行了詳細的綜述,如何對EV進行有效調(diào)控是當前的研究熱點。
目前國內(nèi)外學(xué)者在解決EV有序充電的問題上已展開了一系列研究。目前比較可行的思想是對EV進行分層分區(qū)管理。文獻[3]引入了EV分層分區(qū)調(diào)度的概念,構(gòu)建了基于雙層優(yōu)化模型的EV充放電調(diào)度模型;文獻[4]建立了以系統(tǒng)總負荷平方差最小和可轉(zhuǎn)移充放電量最大為目標的兩階段優(yōu)化模型,并采用yalmip進行求解。文獻[5]—文獻[6]構(gòu)建了含EV與可再生能源的雙層協(xié)調(diào)優(yōu)化模型,并采用遺傳算法求解整個模型。分層分區(qū)管理方式有效降低了各代理商所調(diào)度的EV的規(guī)模,大大減少了模型求解的計算量和計算時間。上述文獻提出的算法均是一種確定性局部優(yōu)化算法,僅能考慮當前已接入的EV及電網(wǎng)狀態(tài),求解結(jié)果也僅是該時段的局部最優(yōu)解,從當日全局負荷層面考慮,其結(jié)果還存在一定的優(yōu)化空間。
考慮到電網(wǎng)負荷及EV充電負荷為時間序列數(shù)據(jù),且在一定時間尺度下呈現(xiàn)周期性規(guī)律。而深度長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)是一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)改進的深度學(xué)習(xí)算法,對處理時序數(shù)據(jù)有很好的效果[7]。可以有效地學(xué)習(xí)歷史序列數(shù)據(jù)中的規(guī)律信息。
因此,提出一種基于LSTM網(wǎng)絡(luò)深度學(xué)習(xí)的EV 3層能量管理系統(tǒng)。以電網(wǎng)負責(zé)的調(diào)度中心(電網(wǎng)層)、代理商負責(zé)的區(qū)域能量管理系統(tǒng)和充電站能量管理系統(tǒng)組成的3層能量管理架構(gòu)為依托,利用電網(wǎng)歷史基礎(chǔ)負荷及EV歷史負荷數(shù)據(jù)求解出歷史調(diào)度優(yōu)化任務(wù)最優(yōu)解,用于訓(xùn)練學(xué)習(xí)網(wǎng)絡(luò),并利用該網(wǎng)絡(luò)快速高效的指導(dǎo)當前實時EV調(diào)度任務(wù)的優(yōu)化。最后通過仿真計算驗證了提出方法的有效性、靈活性和優(yōu)越性。
基于文獻[8]提出的包括電網(wǎng)層、區(qū)域能量管理系統(tǒng)和充電站能量管理系統(tǒng)的EV充電能量管理3層架構(gòu)模型,結(jié)合LSTM學(xué)習(xí)網(wǎng)絡(luò)進行進一步的改進,架構(gòu)模型如圖1所示。
圖1 電動汽車3層管理架構(gòu)Fig.1 Three-tier management structure of electric vehicles
由于EV 3層架構(gòu)管理系統(tǒng)各層的主要功能與現(xiàn)有研究類似,其中電網(wǎng)層策略的關(guān)鍵在于制定引導(dǎo)電價或者制定充電功率閾值,目前已有較多的研究成果[9—10],因此本文研究重點為能量管理系統(tǒng)如何構(gòu)建最優(yōu)指導(dǎo)充電功率深度學(xué)習(xí)網(wǎng)絡(luò)、基于該學(xué)習(xí)網(wǎng)絡(luò)制定指導(dǎo)充電功率的方法以及充電站能量管理系統(tǒng)對指導(dǎo)充電功率的分配策略。
3層能量管理流程圖如圖2所示。
圖2 3層架構(gòu)能量管理流程Fig.2 Three-tier architecture management flow
在每日調(diào)控開始前,區(qū)域管理系統(tǒng)需執(zhí)行3個步驟:
(1)接收調(diào)度層下達的基于歷史負荷制定的該日引導(dǎo)電價c(t),元/kWh;區(qū)域充電負荷功率上限M(t),kW;該日調(diào)度目標等信息;
(2)根據(jù)歷史EV負荷模擬優(yōu)化過程,計算在已知全日EV準確接入時間及充電需求條件下的各站級管理系統(tǒng)指導(dǎo)充電功率最優(yōu)解(目標函數(shù)與調(diào)度層下達的調(diào)度目標一致);
(3)以計算得到的歷史每日的指導(dǎo)功率最優(yōu)解為學(xué)習(xí)目標,基于歷史負荷數(shù)據(jù)及歷史電價信息構(gòu)建指導(dǎo)功率深度學(xué)習(xí)網(wǎng)絡(luò),準備開始該日的調(diào)控。
在收到調(diào)度層下達的電價信息及功率限額后,由區(qū)域管理系統(tǒng)與站級管理系統(tǒng)配合,對EV充電進行實時控制。將1天劃分為96個控制時段(每個時段時長為15 min),將每個控制時段末端作為該時段的優(yōu)化計算點,對等待充電的EV的充電行為進行優(yōu)化計算。
假設(shè)在某個控制時段中區(qū)域內(nèi)所有充電站中共接入了n輛EV(均未充滿),則在該控制時段末端對這n輛EV進行優(yōu)化,計算它們在下一控制時段的充電功率,該過程需要經(jīng)歷3個步驟:
(1)各站級管理系統(tǒng)統(tǒng)計n輛EV中仍有優(yōu)化裕度的m輛車輛的電池型號及狀態(tài)信息(當前電池狀態(tài)SOCi,j,t及電池容量Bi,j)、到達時刻所在時段Ti,j,0、離開時刻所在時段Ti,j、充滿所需時段數(shù)、該車輛所屬的充電樁類型(直流充電樁或交流充電樁)及其相應(yīng)的充電額定功率PDC和PAC,并計算各充電站內(nèi)車輛的平均緊急程度系數(shù)Ri,j(t),如式(1),并將這些信息上傳給區(qū)域管理系統(tǒng)
(2)區(qū)域管理系統(tǒng)收到轄區(qū)內(nèi)各站級管理系統(tǒng)提交的信息后,將該控制時段及之前時段的區(qū)域基礎(chǔ)負荷數(shù)據(jù)、電價、EV數(shù)量及緊急程度信息輸入深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),由該網(wǎng)絡(luò)計算得出各充電站在下一控制時段的指導(dǎo)充電功率,并下達給相應(yīng)的站級管理系統(tǒng)。
(3)站級管理系統(tǒng)接收指導(dǎo)充電功率指令,以此為參照分別對本站內(nèi)m輛車中的EV進行充電功率分配,計算得到各EV在下一控制時段的充電功率,并下發(fā)到對應(yīng)的充電樁。
由于各充電站的指導(dǎo)充電功率實際上為一組時間序列,而深度學(xué)習(xí)模型中的LSTM模型恰好具有記憶能力,可以有效地學(xué)習(xí)歷史序列數(shù)據(jù)中的信息,因此采用長短期記憶深度神經(jīng)網(wǎng)絡(luò)模型。LSTM的單元結(jié)構(gòu)如圖3所示[11]。
圖3 LSTM單元結(jié)構(gòu)Fig.3 LSTM unit structure
圖3中Ct-1為前一個單元的記憶;ht-1為前一個單元的輸出;Xt為當前單元的輸入;Ct為當前單元的記憶;ht為當前單元的輸出;函數(shù)ft為遺忘門,用于選擇遺忘ht-1中的參數(shù)信息;it和C?t構(gòu)成輸入門,用來讀取和修正參數(shù),并創(chuàng)建候選向量Ct添加到單元記憶中;Ot為輸出門,用于選擇輸出部分單元記憶信息,計算公式為[12]
式中:W和b分別為對應(yīng)門的權(quán)重系數(shù)矩陣和偏置項;σ為sigmoid激活函數(shù),用于將實數(shù)映射到[0,1]內(nèi);tanh為雙曲正切函數(shù),用于將實數(shù)映射至[-1,1]內(nèi)。
在處理序列數(shù)據(jù)時,每個時間步對應(yīng)一個LSTM單元。每個單元通過考慮當前輸入、前一個單元的輸出和記憶來作出決定,同時它會產(chǎn)生一個新的輸出并改變它的記憶。當存在多個LSTM層時,第一層各時間步的單元輸出將作為第二層對應(yīng)時間步的單元的輸入,第一層最后的時間步的記憶將作為第二層的初始記憶。
本文構(gòu)建的LSTM模型包括輸入層、2個LSTM隱藏層、兩個全連接層、一個Dropout層和輸出層。輸入矩陣進入輸入層后,經(jīng)過LSTM隱藏層和Dropout層后,通過全連接的輸出層得到最終預(yù)測值,LSTM模型如圖4所示。
圖4 LSTM網(wǎng)絡(luò)模型Fig.4 LSTM network model
LSTM層的作用是為了篩選出重要的信息,同時遺忘不重要的信息。Dropout層在正向傳遞和權(quán)值更新的過程中對LSTM神經(jīng)元的輸入和遞歸連接進行概率性失活,能夠避免某一個網(wǎng)絡(luò)被過分的擬合到訓(xùn)練集,出現(xiàn)“過學(xué)習(xí)”,本文將失活概率設(shè)置為0.5。完全連接層的作用是將高維輸入轉(zhuǎn)變?yōu)榈途S輸出,同時保留上一層的信息。圖4中完全連接層2的輸出維度需要與預(yù)測結(jié)果維度相同。
2.2.1 網(wǎng)絡(luò)訓(xùn)練集輸入數(shù)據(jù)
選取以下因素作為輸入特征,分別為:各時段的基礎(chǔ)負荷、電價、停留EV數(shù)量、EV平均緊急程度系數(shù),t-1、t-2時段的EV數(shù)量及平均緊急程度系數(shù)。每組訓(xùn)練數(shù)據(jù)包含96個時段數(shù)據(jù)。訓(xùn)練集具體輸入數(shù)據(jù)如表1所示。
表1 訓(xùn)練集輸入數(shù)據(jù)Table 1 Input data of training set
表1中,在全日負荷情況已知的條件,根據(jù)尋優(yōu)算法求得區(qū)域管理系統(tǒng)轄內(nèi)各充電站在第t時段的指導(dǎo)充電功率最優(yōu)解,其目標函數(shù)的選取與調(diào)度層的指令保持一致,以96個控制時段中該區(qū)域內(nèi)M個充電站整體充電成本最小為目標[8],即
2.2.2 實時輸入輸出數(shù)據(jù)
在實時優(yōu)化調(diào)度時,網(wǎng)絡(luò)需要的輸入數(shù)據(jù)及相應(yīng)的輸出數(shù)據(jù)如表2所示。
表2 實時輸入輸出數(shù)據(jù)Table 2 Real time input and output data
2.2.3 訓(xùn)練流程
為提高訓(xùn)練速度,同時兼顧訓(xùn)練精度,采用mini-batch技術(shù)[11],并選取batchsize=20,即將20組訓(xùn)練數(shù)據(jù)作為一個整體訓(xùn)練,具體訓(xùn)練過程如下:
(1)對數(shù)據(jù)進行標準化,由表1可知每組數(shù)據(jù)包含6個輸入量,1個目標值,且時段數(shù)為96,因此每組輸入數(shù)據(jù)矩陣大小為7×96;
(2)將訓(xùn)練集的輸入量輸入到LSTM網(wǎng)絡(luò)模型中,得到初步的預(yù)測值,并計算得到與目標值的誤差;
(3)采用Adam反傳播算法,更新網(wǎng)絡(luò)權(quán)重,實現(xiàn)LSTM網(wǎng)絡(luò)的監(jiān)督學(xué)習(xí);
(4)訓(xùn)練完成后,將測試集的數(shù)據(jù)實時輸入到LSTM網(wǎng)絡(luò),得出該充電站的實時指導(dǎo)充電功率。
本文的充電站能量管理系統(tǒng)按照各車輛的緊急程度系數(shù)對區(qū)域能量管理系統(tǒng)下達的指導(dǎo)充電功率進行分配,系數(shù)越高,分配的充電功率越高。
交流慢充EV分配到的充電功率為0或額定功率PAC,直流快充的EV充電功率可以在0到PDC之間連續(xù)調(diào)節(jié)[13]。
假設(shè)第i個充電站在第t個控制時段內(nèi)接入的EV中交流充電EV的集合為ACt,直流充電EV的集合為DCt,則交流充電電動汽車分配的充電功率為
直流充電EV分配的充電功率為
假設(shè)某個區(qū)域能量管理系統(tǒng)下有3個充電站(M=3),分別設(shè)置在辦公區(qū)、商業(yè)區(qū)和居民區(qū)[8]。直流額定充電功率為45 kW,交流額定充電功率為7 kW,EV的電池容量有兩種,分別為24 kWh和32 kWh。收集101組某地區(qū)實測基礎(chǔ)負荷數(shù)據(jù)及電價信息,同時按照文獻[14]提出的基于蒙特卡洛方法的電動汽車出行鏈進行模擬,得到101組EV的出行數(shù)據(jù),共計101組初始數(shù)據(jù)。選取其中一組作為測試數(shù)據(jù)用于驗證最終結(jié)果,其余數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)訓(xùn)練LSTM學(xué)習(xí)網(wǎng)絡(luò)。圖5為該日基礎(chǔ)負荷曲線,表3為該日各充電站接入的EV信息,表4為該日調(diào)度層下達的引導(dǎo)電價。
2層LSTM層的隱藏單元數(shù)量分別設(shè)置為200、100,迭代次數(shù)為300次。
圖5 該日基礎(chǔ)負荷Fig.5 The base load of the day
表3 該日各充電站接入的電動汽車信息Table 3 EV information of each charging station of this day
表4 各時段電價信息Table 4 Electricity price of each period
將本文方法與其他文獻提出的局部優(yōu)化算法(滾動優(yōu)化策略)進行對比。圖6為該區(qū)域管理系統(tǒng)轄內(nèi)3個充電站的實際充電功率,圖7為該地區(qū)的基礎(chǔ)負荷曲線與不同控制方法下的全部負荷曲線,對應(yīng)的充電費用及峰谷差如表5所示,圖8為不同策略下不同時段的平均充電功率。
圖6 各充電站的實際充電功率Fig.6 Actual charging power of each charging station
圖7 不同策略下的負荷曲線對比Fig.7 Comparison of load curves under different strategies
表5 峰谷差、充電成本與優(yōu)化耗時對比Table 5 Comparison of peak-valley、charging cost and optimization duration
圖8 不同控制策略下各時段的平均充電功率Fig.8 Average charging power of each period under different control strategies
結(jié)合圖6、圖7、圖8和表5可以看出,若電動汽車進行無序充電,不僅充電成本高,且大幅增加了電網(wǎng)的日負荷峰谷差,不利于電網(wǎng)的安全穩(wěn)定。而本文策略和滾動優(yōu)化策略均能合理的協(xié)調(diào)各充電站的指導(dǎo)充電功率,盡可能減少在高電價時段(10:00—14:00,18:00—23:00)的充電功率,將充電負荷轉(zhuǎn)移至電價相對較低的時段,對比即時充電方式,大大降低了充電成本。
同時,由圖8可以看出,本文提出的方法在負荷高峰時段充電功率更低,在負荷低谷時段充電功率顯著增加,負荷轉(zhuǎn)移效果更加顯著。對比表5不同算法下的全日峰谷差,本文的策略的峰谷差更小,削峰填谷的效果更優(yōu)。另一方面,在對測試數(shù)據(jù)96個時段的實時仿真中,滾動優(yōu)化策略用時2 min,而本文提出的方法用時僅30 s,計算效率更高。
綜上,本文提出的策略從最終優(yōu)化結(jié)果來看確實取得了較一般算法更優(yōu)的結(jié)果,實時計算效率更高,且當管理的EV數(shù)量更加龐大時,普通的尋優(yōu)算法計算速度將進一步下降,甚至可能出現(xiàn)維數(shù)災(zāi),但對本文提出的策略則依然可以保持較高的求解效率,充分體現(xiàn)了策略的有效性及優(yōu)越性。
本文建立了包括調(diào)度層,區(qū)級管理層,站級管理層的3層EV充電負荷實時優(yōu)化管理模型,在此基礎(chǔ)上重點研究和提出了基于深度學(xué)習(xí)的區(qū)級能量管理策略,并通過仿真算例進行了驗證。主要結(jié)論如下:
(1)本文提出的基于深度學(xué)習(xí)網(wǎng)絡(luò)的區(qū)域管理系統(tǒng)管理策略可以充分利用歷史負荷數(shù)據(jù),深度挖掘歷史優(yōu)化任務(wù)的信息用于指導(dǎo)在線實時優(yōu)化,優(yōu)化效果相較于一般的局部優(yōu)化策略更好。
(2)本文策略優(yōu)化變量數(shù)較少,不會出現(xiàn)維數(shù)災(zāi)的問題,求解難度較低,實時計算效率更高,適用于大規(guī)模電動汽車接入的情形。