• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于柔性策略-評(píng)價(jià)網(wǎng)絡(luò)的微電網(wǎng)源儲(chǔ)協(xié)同優(yōu)化調(diào)度策略

    2022-01-20 07:05:20劉林鵬朱建全陳嘉俊葉漢芳
    電力自動(dòng)化設(shè)備 2022年1期
    關(guān)鍵詞:調(diào)度電網(wǎng)智能

    劉林鵬,朱建全,陳嘉俊,葉漢芳

    (華南理工大學(xué)電力學(xué)院,廣東 廣州 510640)

    0 引言

    近年來(lái),為了實(shí)現(xiàn)可再生能源的就地消納,微電網(wǎng)中可再生能源的占比日益提高[1-2]。為抑制可再生能源的間歇性和隨機(jī)性,維持微電網(wǎng)的穩(wěn)定運(yùn)行,有必要裝設(shè)一定比例的儲(chǔ)能,實(shí)現(xiàn)源儲(chǔ)協(xié)同運(yùn)行[3]。在這種背景下,如何充分地考慮可再生能源與儲(chǔ)能系統(tǒng)的特點(diǎn),對(duì)微電網(wǎng)進(jìn)行源儲(chǔ)協(xié)同優(yōu)化調(diào)度成為一個(gè)熱點(diǎn)問(wèn)題。

    目前,微電網(wǎng)的優(yōu)化調(diào)度問(wèn)題已經(jīng)得到了大量的研究。已有的方法可以分為基于模型的數(shù)學(xué)優(yōu)化算法和無(wú)模型的強(qiáng)化學(xué)習(xí)算法2 類?;谀P偷臄?shù)學(xué)優(yōu)化算法通常是通過(guò)直接求解集中式的數(shù)學(xué)優(yōu)化問(wèn)題以獲取最優(yōu)策略。例如:文獻(xiàn)[4]將微電網(wǎng)調(diào)度問(wèn)題轉(zhuǎn)化成二次型最優(yōu)控制問(wèn)題,并利用黎卡提方程解的特性對(duì)其進(jìn)行求解;文獻(xiàn)[5]將微電網(wǎng)調(diào)度問(wèn)題轉(zhuǎn)化為二階魯棒優(yōu)化模型,利用列約束生成和強(qiáng)對(duì)偶原理將原問(wèn)題分解后交替求解;文獻(xiàn)[6]使用KKT(Karush-Kuhn-Tucker)條件及二階錐松弛技術(shù)將微電網(wǎng)調(diào)度模型轉(zhuǎn)換為單層的混合整數(shù)線性規(guī)劃問(wèn)題,并調(diào)用CPLEX 求解器對(duì)其進(jìn)行求解;文獻(xiàn)[7]構(gòu)建了微電網(wǎng)雙層調(diào)度模型,并利用交替方向乘子法對(duì)其進(jìn)行求解。上述文獻(xiàn)為求解微電網(wǎng)優(yōu)化調(diào)度問(wèn)題,對(duì)原問(wèn)題中的非凸非線性約束進(jìn)行了一定簡(jiǎn)化處理。這些簡(jiǎn)化處理方法通常建立在一定假設(shè)的基礎(chǔ)上,它們求得的最優(yōu)策略與原問(wèn)題的最優(yōu)策略在某些情況下并不等價(jià)。無(wú)模型的強(qiáng)化學(xué)習(xí)算法將智能體不斷與環(huán)境進(jìn)行交互,通過(guò)觀察交互后得到的結(jié)果改進(jìn)策略。例如:文獻(xiàn)[8]使用基于值的深度Q 網(wǎng)絡(luò)DQN(Deep Q-Network)算法得到了微電網(wǎng)的在線調(diào)度策略;文獻(xiàn)[9]使用基于隨機(jī)性策略的策略-評(píng)價(jià)網(wǎng)絡(luò)AC(Actor-Critic)算法求解微電網(wǎng)的最優(yōu)調(diào)度策略;文獻(xiàn)[10]使用基于確定性策略的深度確定性策略梯度DDPG(Deep Deterministic Policy Gradient)算法求解微電網(wǎng)中共享儲(chǔ)能的最優(yōu)控制問(wèn)題。上述強(qiáng)化學(xué)習(xí)算法相較于基于模型的數(shù)學(xué)優(yōu)化算法的優(yōu)勢(shì)在于其不需要模型的信息,可通過(guò)觀察到的數(shù)據(jù)尋找最優(yōu)策略。此外,其得到的策略泛化能力強(qiáng),在強(qiáng)隨機(jī)性環(huán)境下有較好的表現(xiàn)[8-9]。盡管強(qiáng)化學(xué)習(xí)方法在微電網(wǎng)優(yōu)化調(diào)度問(wèn)題的求解過(guò)程中有較好的表現(xiàn),但由于它在訓(xùn)練過(guò)程中為保證智能體的探索性能,往往需要在策略探尋過(guò)程中加入一定的隨機(jī)性,這可能導(dǎo)致所搜尋的策略不滿足約束條件。為解決這個(gè)問(wèn)題,已有的文獻(xiàn)主要采取了以下措施:文獻(xiàn)[11]結(jié)合了壁壘函數(shù)的特性以保證智能體在滿足約束的條件下進(jìn)行策略學(xué)習(xí);文獻(xiàn)[12]通過(guò)在獎(jiǎng)勵(lì)函數(shù)中設(shè)置懲罰因子,使智能體在學(xué)習(xí)過(guò)程中避開不滿足約束條件的策略;文獻(xiàn)[13]使用元學(xué)習(xí)的方式使得策略更新過(guò)程滿足約束條件。上述方法本質(zhì)上都是通過(guò)無(wú)模型學(xué)習(xí)的方式使得智能體朝著滿足約束條件的方向?qū)Σ呗赃M(jìn)行更新,但這類方法并不能保證所得策略嚴(yán)格滿足約束條件。

    針對(duì)以上問(wèn)題,本文結(jié)合有模型的數(shù)學(xué)優(yōu)化與無(wú)模型的強(qiáng)化學(xué)習(xí)的思想,提出了一種基于柔性策略-評(píng)價(jià)網(wǎng)絡(luò)SAC(Soft Actor-Critic)的微電網(wǎng)源儲(chǔ)協(xié)同優(yōu)化調(diào)度方法。一方面,所提方法在不對(duì)原問(wèn)題進(jìn)行簡(jiǎn)化處理的前提下,利用強(qiáng)化學(xué)習(xí)算法將原問(wèn)題分解為多個(gè)子問(wèn)題進(jìn)行求解,并通過(guò)貝爾曼最優(yōu)定理保證了所得策略與原問(wèn)題最優(yōu)策略的等價(jià)性;另一方面,所提方法利用部分模型信息使得策略嚴(yán)格滿足約束條件。此外,為減少智能體在訓(xùn)練過(guò)程中與環(huán)境的交互時(shí)長(zhǎng),本文提出了一種基于深層長(zhǎng)短期記憶LSTM(Long Short-Term Memory)網(wǎng)絡(luò)的環(huán)境建模方法。

    1 微電網(wǎng)源儲(chǔ)協(xié)同調(diào)度模型

    1.1 目標(biāo)函數(shù)

    以微電網(wǎng)的運(yùn)行成本最小化為目標(biāo),則有:

    式中:Pg,t和Ps,t分別為t時(shí)段機(jī)組g和儲(chǔ)能s的有功出力,Ps,t取值為正時(shí)表示儲(chǔ)能放電,取值為負(fù)時(shí)表示儲(chǔ)能充電,其最大值為Pmaxs;Pl,t為t時(shí)段聯(lián)絡(luò)線l傳輸?shù)挠泄β?,其取值為正時(shí)表示從主網(wǎng)購(gòu)電,取值為負(fù)時(shí)表示向主網(wǎng)售電;og,t為t時(shí)段機(jī)組g狀態(tài),其取值為0時(shí)表示處于離線狀態(tài),取值為1時(shí)表示處于工作狀態(tài);ct為t時(shí)段即時(shí)成本。

    1.2 馬爾可夫決策過(guò)程

    在利用強(qiáng)化學(xué)習(xí)求解優(yōu)化問(wèn)題時(shí),需要先將原問(wèn)題構(gòu)建為一個(gè)馬爾可夫決策過(guò)程[14]。本文從時(shí)間維度對(duì)原問(wèn)題進(jìn)行解耦,構(gòu)建了以下的馬爾可夫決策過(guò)程。

    1)狀態(tài)。

    式中:Pcha,t和Pdis,t分別為t時(shí)段儲(chǔ)能的充電和放電功率;η為儲(chǔ)能的充放電效率系數(shù);μL,t+1、μwt,t+1、μpv,t+1和μp,t+1分別為分布DL、Dwt、Dpv和Dp的均值;σL,t+1、σwt,t+1、σpv,t+1和σp,t+1分別為分布DL、Dwt、Dpv和Dp的標(biāo)準(zhǔn)差。

    4)獎(jiǎng)勵(lì)。

    獎(jiǎng)勵(lì)是智能體每次與環(huán)境進(jìn)行交互時(shí)收到的反饋信號(hào),可用于指導(dǎo)策略的更新方向。為了實(shí)現(xiàn)微電網(wǎng)的運(yùn)行成本最小化,本文將獎(jiǎng)勵(lì)設(shè)置為即時(shí)成本的負(fù)值:

    式中:rt為t時(shí)段智能體在狀態(tài)st下做出動(dòng)作at獲得的獎(jiǎng)勵(lì)。

    5)環(huán)境。

    在本文的微電網(wǎng)源儲(chǔ)協(xié)同優(yōu)化調(diào)度模型問(wèn)題中,智能體所處的環(huán)境為原問(wèn)題在時(shí)間維度解耦后的單時(shí)段優(yōu)化問(wèn)題:

    在微電網(wǎng)源儲(chǔ)協(xié)同調(diào)度問(wèn)題中,決策變量包含機(jī)組出力、儲(chǔ)能充放電功率、機(jī)組的啟停狀態(tài)以及聯(lián)絡(luò)線功率。若直接用無(wú)模型的強(qiáng)化學(xué)習(xí)算法搜尋這4 個(gè)變量對(duì)應(yīng)的策略,將無(wú)法保證其搜尋的策略嚴(yán)格滿足約束條件。為解決這一問(wèn)題,將這4個(gè)變量分成了兩部分:一部分為儲(chǔ)能充放電功率和機(jī)組的啟停狀態(tài),這部分變量通過(guò)強(qiáng)化學(xué)習(xí)的策略網(wǎng)絡(luò)輸出得到;另一部分為機(jī)組的出力和聯(lián)絡(luò)線功率,這部分變量由策略網(wǎng)絡(luò)輸出儲(chǔ)能充放電功率和機(jī)組的啟停狀態(tài)后通過(guò)CPLEX 商業(yè)求解器求解式(10)—(15)組成的單時(shí)段的優(yōu)化問(wèn)題得到。通過(guò)這種方式求解這4個(gè)決策變量可以保證它們嚴(yán)格滿足約束條件。

    2 基于SAC的源儲(chǔ)協(xié)同優(yōu)化調(diào)度

    2.1 SAC優(yōu)化策略

    2.1.1 智能體的目標(biāo)函數(shù)

    SAC 算法作為無(wú)模型的強(qiáng)化學(xué)習(xí)算法之一,能夠有效地在模型未知的情況下,通過(guò)不斷地與環(huán)境進(jìn)行交互以搜尋最優(yōu)策略[15]。本文將利用SAC算法學(xué)習(xí)最優(yōu)策略的智能體稱為SAC智能體。在微電網(wǎng)源儲(chǔ)協(xié)同優(yōu)化調(diào)度問(wèn)題中,SAC 智能體的目標(biāo)可定義為最大化智能體調(diào)度周期內(nèi)的總獎(jiǎng)勵(lì)與策略熵的期望值[16]:

    通過(guò)求解式(18)所示的目標(biāo)函數(shù),所得策略便可實(shí)現(xiàn)總獎(jiǎng)勵(lì)的最大化(即運(yùn)行成本最小化)。另一方面,由于目標(biāo)函數(shù)考慮了將策略熵最大化,所得策略具有更強(qiáng)的探索性能以及更好的魯棒性。

    2.1.2 智能體結(jié)構(gòu)

    式中:γ為獎(jiǎng)勵(lì)折扣系數(shù)。

    根據(jù)貝爾曼方程,可以推導(dǎo)出狀態(tài)-動(dòng)作值函數(shù)Qπ(st,at)的遞歸方程為[14]:

    2.1.3 評(píng)價(jià)網(wǎng)絡(luò)的參數(shù)更新

    對(duì)于評(píng)價(jià)網(wǎng)絡(luò),其參數(shù)是朝著真實(shí)狀態(tài)-動(dòng)作值函數(shù)的方向更新的。因此,基于式(21)以及時(shí)序差分算法可得SAC 智能體評(píng)價(jià)網(wǎng)絡(luò)的參數(shù)更新公式為[17]:

    式中:θQ和θπ分別為評(píng)價(jià)網(wǎng)絡(luò)和策略網(wǎng)絡(luò)的參數(shù),可利用文獻(xiàn)[18]所提的小批量梯度下降法分別求解式(22)和式(24)以獲得θQ和α的更新值;H′為目標(biāo)策略熵;M為小批量更新的樣本數(shù)量;i表示樣本編號(hào),每個(gè)樣本由(si,ai,ri,s′i)構(gòu)成,其中s′i為轉(zhuǎn)移后狀態(tài);a′i為智能體在s′i下根據(jù)當(dāng)前策略所得動(dòng)作。智能體每次與環(huán)境進(jìn)行交互時(shí)均會(huì)產(chǎn)生一個(gè)樣本,并將其存入經(jīng)驗(yàn)回放池中[19]。

    2.1.4 策略網(wǎng)絡(luò)的參數(shù)更新

    對(duì)于策略網(wǎng)絡(luò),其參數(shù)是朝著最大化總獎(jiǎng)勵(lì)和策略熵的方向進(jìn)行更新的。因此,可利用梯度上升法求解式(25)對(duì)其參數(shù)θπ進(jìn)行更新。

    SAC 智能體不斷地與環(huán)境進(jìn)行交互產(chǎn)生新的樣本并存入經(jīng)驗(yàn)回放池中,且每次與環(huán)境進(jìn)行交互后都根據(jù)經(jīng)驗(yàn)回放池中的樣本對(duì)評(píng)價(jià)網(wǎng)絡(luò)和策略網(wǎng)絡(luò)進(jìn)行一次參數(shù)更新。在超參數(shù)設(shè)置合理的前提下,通過(guò)一定次數(shù)的交互訓(xùn)練后,SAC 智能體的策略最終可收斂到最優(yōu)策略[20]。

    通過(guò)這種方式,可以將原問(wèn)題分解為多個(gè)子問(wèn)題求解。根據(jù)貝爾曼最優(yōu)定理,所得策略與原問(wèn)題最優(yōu)策略具有等價(jià)性,相關(guān)證明見(jiàn)附錄B。

    2.2 基于深層LSTM網(wǎng)絡(luò)的環(huán)境建模

    由于SAC 智能體每次與環(huán)境進(jìn)行交互時(shí),都需要求解一個(gè)由式(10)—(16)組成的單時(shí)段優(yōu)化問(wèn)題,這將導(dǎo)致訓(xùn)練的時(shí)間大幅增加。為加快SAC 智能體的訓(xùn)練速度,本文利用深層LSTM 網(wǎng)絡(luò)對(duì)環(huán)境進(jìn)行建模。

    深層LSTM 神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)RNN(Recurrent Neural Network)的一種類型,其基本結(jié)構(gòu)如附錄C 圖C1所示。從圖中可以看出,RNN 的隱藏層包含了當(dāng)前時(shí)刻的輸入信息以及上一時(shí)刻的輸入信息,因此它具有記憶功能。為解決RNN 的梯度爆炸和消失問(wèn)題,LSTM 對(duì)RNN 進(jìn)行了改進(jìn),其結(jié)果如附錄C 圖C2 所示,圖中σ表示Logistic 函數(shù),輸出區(qū)間為(0,1)。LSTM 在RNN 的基礎(chǔ)上引入內(nèi)部狀態(tài)ct,用于傳遞循環(huán)信息,引入外部狀態(tài)ht用于接收內(nèi)部狀態(tài)傳遞的信息,具體如下:

    式中:⊙表示向量元素相乘;ft、it、ot分別為遺忘門、輸入門和輸出門,它們控制其對(duì)應(yīng)的信息通過(guò)比例,且ft、it、ot中各元素取值范圍為[0,1];Wc、Uc和bc為可學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)參數(shù)。

    與傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)類似,使用小批量梯度下降法更新LSTM網(wǎng)絡(luò)參數(shù)θn:

    式中:K為小批量樣本數(shù)目;xj、yj分別為樣本j的特征與標(biāo)簽;y?j為樣本j的LSTM 網(wǎng)絡(luò)輸出量;β為學(xué)習(xí)率。

    3 算例分析

    3.1 參數(shù)設(shè)置

    以圖1 所示的微電網(wǎng)為例對(duì)所提方法進(jìn)行測(cè)試,相關(guān)參數(shù)見(jiàn)附錄D。評(píng)價(jià)網(wǎng)絡(luò)與策略網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)以及用于環(huán)境建模的深層LSTM 網(wǎng)絡(luò)超參數(shù)見(jiàn)附錄E。所有算例均基于MATLAB R2021a實(shí)現(xiàn),并在64位Windows系統(tǒng)、Intel Core i7-6700K@3.7 GHz的環(huán)境下運(yùn)行。

    圖1 微電網(wǎng)結(jié)構(gòu)Fig.1 Structure of microgrid

    由于深層LSTM 網(wǎng)絡(luò)的訓(xùn)練是一種“端到端”的有監(jiān)督學(xué)習(xí)方法,因此在訓(xùn)練前,首先需要準(zhǔn)備一定數(shù)量的樣本。本文通過(guò)CPLEX 商業(yè)求解器求解1 000 個(gè)不同場(chǎng)景下由式(10)—(16)組成的優(yōu)化問(wèn)題,得到了1 000 個(gè)樣本,并將90%的樣本作為訓(xùn)練集,用于訓(xùn)練深層LSTM 網(wǎng)絡(luò);將其余10%的樣本作為測(cè)試集,用于測(cè)試模型的準(zhǔn)確性。每個(gè)樣本包含了用于訓(xùn)練的標(biāo)簽和特征,其中標(biāo)簽為ct,特征為{Ps,t,og,t+1,ES,t,pt,Pwt,t,Ppv,t,Lt,og,t}。

    3.2 智能體的離線訓(xùn)練過(guò)程

    為驗(yàn)證SAC 智能體在隨機(jī)環(huán)境下的學(xué)習(xí)能力,假設(shè)負(fù)荷、風(fēng)電出力、光伏出力和電價(jià)分別服從式(31)—(34)中均值和標(biāo)準(zhǔn)差的高斯分布。

    圖2 展示了SAC 智能體在設(shè)置的隨機(jī)環(huán)境訓(xùn)練時(shí),微電網(wǎng)的運(yùn)行成本期望隨訓(xùn)練次數(shù)增加而變化的過(guò)程,其中該期望值通過(guò)最近100 次訓(xùn)練結(jié)果的平均值近似表示。從圖2 中可以看出:在訓(xùn)練前期,微電網(wǎng)運(yùn)行成本的期望值隨著訓(xùn)練次數(shù)的增加而降低;在完成2 400 次訓(xùn)練之后,微電網(wǎng)運(yùn)行成本的期望值基本保持不變,因此可以認(rèn)為此時(shí)SAC 智能體找到了近似最優(yōu)策略。

    圖2 SAC智能體訓(xùn)練過(guò)程Fig.2 Training process of SAC agent

    為驗(yàn)證本文所提方法的優(yōu)勢(shì),圖3 展示了無(wú)模型的SAC智能體在設(shè)置的隨機(jī)環(huán)境訓(xùn)練時(shí)的運(yùn)行成本變化情況。其中,無(wú)模型的SAC 智能體采用了文獻(xiàn)[12]中的方法,在獎(jiǎng)勵(lì)函數(shù)中對(duì)于不滿足約束條件的策略設(shè)置了懲罰因子。在本算例中,對(duì)不滿足式(12)的策略增加一個(gè)值為$200 的懲罰成本。從圖3 中可以看出,這種在獎(jiǎng)勵(lì)函數(shù)中增加懲罰因子的無(wú)模型強(qiáng)化學(xué)習(xí)方法無(wú)法保證策略嚴(yán)格滿足約束條件,造成其運(yùn)行成本產(chǎn)生較大波動(dòng)。

    圖3 無(wú)模型的SAC智能體訓(xùn)練過(guò)程Fig.3 Training process of model-free SAC agent

    3.3 智能體在線決策分析

    將離線訓(xùn)練后的SAC智能體用于微電網(wǎng)源儲(chǔ)協(xié)同優(yōu)化調(diào)度的在線決策,并與短視(myopic)策略進(jìn)行對(duì)比。其中,短視策略通過(guò)求解式(35)中的單時(shí)段優(yōu)化問(wèn)題得到。

    圖4 展示了2 種策略連續(xù)進(jìn)行1 個(gè)月的在線決策的情況。從圖中可以看出,所提方法的優(yōu)化效果明顯優(yōu)于短視策略。采用短視策略時(shí),微電網(wǎng)在該月運(yùn)行成本均值為$766.90;而采用本文策略后,微電網(wǎng)在該月運(yùn)行成本均值為$726.36(比短視策略所得運(yùn)行成本降低了5.29%),這主要得益于本文所提的方法具有遠(yuǎn)視能力,能全局考慮調(diào)度周期內(nèi)的情況以獲得更優(yōu)的結(jié)果。

    圖4 運(yùn)行1個(gè)月的結(jié)果對(duì)比Fig.4 Comparison of results in a month

    進(jìn)一步地,圖5 以第一天的在線決策結(jié)果為例,詳細(xì)展示了采用本文所提方法進(jìn)行在線決策時(shí)各時(shí)段的狀態(tài)變量以及動(dòng)作變量情況??梢园l(fā)現(xiàn),在電價(jià)較低時(shí),微電網(wǎng)需要從主網(wǎng)購(gòu)電以滿足負(fù)荷需求。由于此時(shí)微電網(wǎng)自備機(jī)組的運(yùn)行成本比購(gòu)電成本高,所以發(fā)電機(jī)處于停機(jī)狀態(tài)。另一方面,儲(chǔ)能選擇在電價(jià)較低時(shí)盡可能充電,隨后在電價(jià)較高時(shí)放電以獲取更高的利益。

    圖5 日內(nèi)在線決策結(jié)果Fig.5 Intra-day online decision results

    3.4 LSTM網(wǎng)絡(luò)環(huán)境建模分析

    為測(cè)試本文所提的LSTM 網(wǎng)絡(luò)環(huán)境建模方法的有效性,將基于原環(huán)境和深層LSTM 網(wǎng)絡(luò)模型得到的微電網(wǎng)的源儲(chǔ)協(xié)同優(yōu)化調(diào)度策略進(jìn)行對(duì)比分析。

    圖6 展示了不同測(cè)試場(chǎng)景下基于原環(huán)境和深層LSTM 網(wǎng)絡(luò)模型得到的成本對(duì)比情況。從圖中可以看出,基于深層LSTM 模型的輸出成本曲線與基于原環(huán)境的成本曲線基本重合,均方根誤差僅為0.315 3,這說(shuō)明深層LSTM 模型所建的環(huán)境與原環(huán)境近似等效。

    圖6 深層LSTM網(wǎng)絡(luò)誤差分析Fig.6 Error analysis of deep LSTM network

    表1 進(jìn)一步對(duì)比了SAC 智能體在原環(huán)境與深層LSTM 網(wǎng)絡(luò)所建環(huán)境下的離線訓(xùn)練時(shí)長(zhǎng)以及在線決策的平均成本。從表中可見(jiàn),深層LSTM 網(wǎng)絡(luò)所構(gòu)建的環(huán)境減少了80.03%的離線訓(xùn)練時(shí)長(zhǎng),而在線決策平均成本僅與原環(huán)境相差0.01%。這表明所提深層LSTM 網(wǎng)絡(luò)環(huán)境建模在不影響在線決策精度的前提下,顯著減少了智能體的離線訓(xùn)練時(shí)長(zhǎng)。需要說(shuō)明的是,盡管智能體的離線訓(xùn)練時(shí)間較長(zhǎng),但在在線決策階段,由于可以直接利用離線訓(xùn)練好的策略網(wǎng)絡(luò)進(jìn)行決策,其耗時(shí)僅為0.41 s,因而可以滿足在線決策的需求。

    表1 2種環(huán)境模型效果對(duì)比Table 1 Comparison of effects between two environment models

    4 結(jié)論

    本文提出了一種基于SAC的微電網(wǎng)源儲(chǔ)協(xié)同調(diào)度策略,得到的主要結(jié)論如下:

    1)所提方法能夠通過(guò)不斷地與環(huán)境進(jìn)行交互的方式獲得最優(yōu)策略,并基于部分模型信息進(jìn)行策略搜尋,確保所得策略滿足安全約束;

    2)所提環(huán)境建模方法在不影響策略準(zhǔn)確性的前提下,減少了SAC智能體的訓(xùn)練時(shí)長(zhǎng),提高了SAC智能體的學(xué)習(xí)效率;

    3)所提方法對(duì)模型信息的依賴程度較低,僅用時(shí)0.41 s 便可獲得顯著優(yōu)于短視策略的解,可以較好地滿足微電網(wǎng)源儲(chǔ)協(xié)同調(diào)度的在線決策要求。

    附錄見(jiàn)本刊網(wǎng)絡(luò)版(http://www.epae.cn)。

    猜你喜歡
    調(diào)度電網(wǎng)智能
    穿越電網(wǎng)
    《調(diào)度集中系統(tǒng)(CTC)/列車調(diào)度指揮系統(tǒng)(TDCS)維護(hù)手冊(cè)》正式出版
    一種基于負(fù)載均衡的Kubernetes調(diào)度改進(jìn)算法
    虛擬機(jī)實(shí)時(shí)遷移調(diào)度算法
    智能前沿
    文苑(2018年23期)2018-12-14 01:06:06
    智能前沿
    文苑(2018年19期)2018-11-09 01:30:14
    智能前沿
    文苑(2018年17期)2018-11-09 01:29:26
    智能前沿
    文苑(2018年21期)2018-11-09 01:22:32
    電網(wǎng)也有春天
    河南電力(2016年5期)2016-02-06 02:11:32
    一個(gè)電網(wǎng)人的環(huán)保路
    河南電力(2015年5期)2015-06-08 06:01:46
    男的添女的下面高潮视频| 欧美精品国产亚洲| 亚洲av中文av极速乱| 亚洲精品美女久久av网站| videos熟女内射| 18禁动态无遮挡网站| 亚洲五月色婷婷综合| 美女xxoo啪啪120秒动态图| 欧美精品国产亚洲| www.色视频.com| 一区在线观看完整版| 亚洲精品日韩在线中文字幕| 大陆偷拍与自拍| 亚洲人成网站在线观看播放| 亚洲第一av免费看| 高清在线视频一区二区三区| 久久久久久久亚洲中文字幕| 美国免费a级毛片| 啦啦啦视频在线资源免费观看| av一本久久久久| 亚洲一级一片aⅴ在线观看| 日韩不卡一区二区三区视频在线| 亚洲精品乱码久久久久久按摩| 美女大奶头黄色视频| 女性生殖器流出的白浆| 国产av一区二区精品久久| 男女午夜视频在线观看 | 女人被躁到高潮嗷嗷叫费观| 秋霞在线观看毛片| 一级黄片播放器| 久久久久网色| 国产片特级美女逼逼视频| 在现免费观看毛片| 亚洲色图综合在线观看| 久久久久人妻精品一区果冻| 男女边吃奶边做爰视频| 日韩三级伦理在线观看| 久久这里只有精品19| 欧美亚洲 丝袜 人妻 在线| 男女免费视频国产| 精品国产一区二区三区久久久樱花| 欧美日本中文国产一区发布| 少妇的逼水好多| 一级爰片在线观看| 精品亚洲成a人片在线观看| 午夜精品国产一区二区电影| 欧美日韩亚洲高清精品| 国产精品国产三级国产专区5o| a级毛片黄视频| 高清欧美精品videossex| 午夜福利影视在线免费观看| av国产精品久久久久影院| 最近中文字幕高清免费大全6| 久久午夜综合久久蜜桃| 一级毛片电影观看| 亚洲欧洲日产国产| 久久ye,这里只有精品| 男女边吃奶边做爰视频| 亚洲精品色激情综合| 久久久久视频综合| 一个人免费看片子| 免费黄网站久久成人精品| 久久久国产精品麻豆| 国产欧美亚洲国产| 久久精品国产鲁丝片午夜精品| 久久久久网色| 中文乱码字字幕精品一区二区三区| 青青草视频在线视频观看| 日本av手机在线免费观看| 中文字幕最新亚洲高清| 各种免费的搞黄视频| 精品一区二区免费观看| 国产xxxxx性猛交| 久久精品久久久久久久性| 日韩 亚洲 欧美在线| 王馨瑶露胸无遮挡在线观看| 精品卡一卡二卡四卡免费| 午夜老司机福利剧场| 午夜激情久久久久久久| 亚洲天堂av无毛| 一区在线观看完整版| 国产麻豆69| 菩萨蛮人人尽说江南好唐韦庄| 麻豆精品久久久久久蜜桃| 九色成人免费人妻av| 亚洲国产精品专区欧美| 精品国产乱码久久久久久小说| 1024视频免费在线观看| 久久久久久久久久人人人人人人| 亚洲av福利一区| 精品一区二区免费观看| 99久久中文字幕三级久久日本| 亚洲欧洲国产日韩| 国产成人免费观看mmmm| 久久久久精品久久久久真实原创| 亚洲伊人久久精品综合| 两性夫妻黄色片 | 一区在线观看完整版| 两性夫妻黄色片 | 狂野欧美激情性xxxx在线观看| 伦理电影免费视频| 久久影院123| 久久99热这里只频精品6学生| 高清不卡的av网站| 亚洲精品久久久久久婷婷小说| 日本黄大片高清| 中文字幕人妻丝袜制服| 在线看a的网站| 你懂的网址亚洲精品在线观看| 亚洲av欧美aⅴ国产| 搡女人真爽免费视频火全软件| 我的女老师完整版在线观看| 日韩精品有码人妻一区| 色吧在线观看| 少妇的丰满在线观看| 亚洲精品国产色婷婷电影| 视频中文字幕在线观看| 99九九在线精品视频| 少妇 在线观看| 天天躁夜夜躁狠狠躁躁| 丝瓜视频免费看黄片| 亚洲第一av免费看| 精品少妇黑人巨大在线播放| 亚洲,欧美,日韩| 日韩熟女老妇一区二区性免费视频| 欧美日韩综合久久久久久| 亚洲成人av在线免费| 国产在线视频一区二区| 久久久久久人妻| 天堂中文最新版在线下载| av福利片在线| 大码成人一级视频| 亚洲欧美日韩另类电影网站| 老司机影院成人| 亚洲精品成人av观看孕妇| 内地一区二区视频在线| 天堂俺去俺来也www色官网| 如何舔出高潮| 热re99久久精品国产66热6| 国产日韩欧美视频二区| 黑人巨大精品欧美一区二区蜜桃 | 日本午夜av视频| 亚洲精品色激情综合| 视频中文字幕在线观看| 欧美人与性动交α欧美软件 | 交换朋友夫妻互换小说| 制服诱惑二区| 一级片'在线观看视频| 青春草亚洲视频在线观看| 午夜91福利影院| 亚洲欧美日韩另类电影网站| 韩国精品一区二区三区 | 免费不卡的大黄色大毛片视频在线观看| 欧美精品av麻豆av| 啦啦啦视频在线资源免费观看| www日本在线高清视频| 国产成人欧美| 夜夜爽夜夜爽视频| 亚洲精品美女久久av网站| 肉色欧美久久久久久久蜜桃| 超色免费av| 又粗又硬又长又爽又黄的视频| 中国国产av一级| 日韩免费高清中文字幕av| 国产乱来视频区| 乱码一卡2卡4卡精品| 人妻一区二区av| 国产免费福利视频在线观看| 中文字幕人妻熟女乱码| 啦啦啦在线观看免费高清www| 久久 成人 亚洲| 少妇 在线观看| 亚洲伊人色综图| 欧美变态另类bdsm刘玥| 亚洲成色77777| 大香蕉久久成人网| 18禁裸乳无遮挡动漫免费视频| 成人影院久久| videossex国产| 麻豆精品久久久久久蜜桃| 久久精品国产鲁丝片午夜精品| 欧美激情 高清一区二区三区| 欧美人与善性xxx| 狠狠婷婷综合久久久久久88av| 免费高清在线观看视频在线观看| 亚洲一级一片aⅴ在线观看| 欧美少妇被猛烈插入视频| 激情五月婷婷亚洲| 黄色怎么调成土黄色| 成人无遮挡网站| 青春草国产在线视频| 97在线人人人人妻| 色5月婷婷丁香| 人体艺术视频欧美日本| 在线观看免费日韩欧美大片| 亚洲伊人久久精品综合| 伦理电影免费视频| 9191精品国产免费久久| 国产乱来视频区| 国产亚洲av片在线观看秒播厂| 少妇被粗大的猛进出69影院 | 欧美精品人与动牲交sv欧美| 哪个播放器可以免费观看大片| 色吧在线观看| 欧美日韩视频高清一区二区三区二| 久久韩国三级中文字幕| 51国产日韩欧美| 久久精品国产鲁丝片午夜精品| 国产精品成人在线| 国产精品秋霞免费鲁丝片| 丰满乱子伦码专区| 春色校园在线视频观看| 国产爽快片一区二区三区| 日韩一区二区视频免费看| 亚洲欧美一区二区三区黑人 | 女人久久www免费人成看片| 永久网站在线| 欧美日韩视频精品一区| 777米奇影视久久| 91精品国产国语对白视频| 妹子高潮喷水视频| 亚洲av在线观看美女高潮| 国产成人午夜福利电影在线观看| 午夜福利在线观看免费完整高清在| 91午夜精品亚洲一区二区三区| 高清黄色对白视频在线免费看| 熟女电影av网| 亚洲av国产av综合av卡| 街头女战士在线观看网站| 少妇的逼好多水| 国产成人免费无遮挡视频| 97精品久久久久久久久久精品| 丝瓜视频免费看黄片| kizo精华| 波野结衣二区三区在线| 欧美激情极品国产一区二区三区 | 最近中文字幕高清免费大全6| 亚洲欧美一区二区三区国产| 另类精品久久| 97在线人人人人妻| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 最近的中文字幕免费完整| 日日啪夜夜爽| 九草在线视频观看| 久久久亚洲精品成人影院| 亚洲国产精品专区欧美| 校园人妻丝袜中文字幕| a 毛片基地| 涩涩av久久男人的天堂| 久久鲁丝午夜福利片| 久久99精品国语久久久| 日本wwww免费看| 最近最新中文字幕免费大全7| 日本av手机在线免费观看| 欧美xxxx性猛交bbbb| 麻豆精品久久久久久蜜桃| 亚洲精品456在线播放app| 中文字幕免费在线视频6| 高清毛片免费看| 精品人妻熟女毛片av久久网站| 男女免费视频国产| 精品一区二区三区四区五区乱码 | 亚洲美女黄色视频免费看| 免费av中文字幕在线| 国产精品熟女久久久久浪| 亚洲伊人色综图| 亚洲国产日韩一区二区| 日韩av不卡免费在线播放| 搡女人真爽免费视频火全软件| 国产综合精华液| 国产 精品1| 乱码一卡2卡4卡精品| 国产精品久久久久久久电影| 波多野结衣一区麻豆| 大片电影免费在线观看免费| 欧美人与性动交α欧美软件 | 亚洲精品日韩在线中文字幕| 黑人高潮一二区| 热99国产精品久久久久久7| 精品亚洲成国产av| 大香蕉久久网| 亚洲熟女精品中文字幕| 看免费av毛片| 美女视频免费永久观看网站| 国产在线视频一区二区| 哪个播放器可以免费观看大片| 天堂8中文在线网| 国产一级毛片在线| 国产一区二区三区综合在线观看 | 三级国产精品片| 亚洲欧美成人精品一区二区| 亚洲精品视频女| 国产片内射在线| 另类精品久久| 亚洲精品美女久久久久99蜜臀 | 欧美精品国产亚洲| 老司机亚洲免费影院| 男女无遮挡免费网站观看| 国产成人精品无人区| 高清av免费在线| 国产精品一区www在线观看| 日韩欧美一区视频在线观看| a级毛片在线看网站| 成人影院久久| 999精品在线视频| 久久久久精品人妻al黑| 看非洲黑人一级黄片| av卡一久久| 国产亚洲精品第一综合不卡 | 两个人看的免费小视频| 青春草国产在线视频| 不卡视频在线观看欧美| 免费观看a级毛片全部| 久久97久久精品| 久久久久久久大尺度免费视频| 成年人免费黄色播放视频| 国产麻豆69| 我要看黄色一级片免费的| 国产xxxxx性猛交| 交换朋友夫妻互换小说| 日韩不卡一区二区三区视频在线| 日韩欧美精品免费久久| 一级爰片在线观看| 亚洲精品自拍成人| 中文字幕av电影在线播放| 亚洲国产欧美日韩在线播放| 女性生殖器流出的白浆| 亚洲av.av天堂| 丰满少妇做爰视频| 亚洲人与动物交配视频| 不卡视频在线观看欧美| 国产一区二区在线观看日韩| 一区二区三区乱码不卡18| 欧美97在线视频| 22中文网久久字幕| 制服人妻中文乱码| 国产一级毛片在线| 亚洲人成77777在线视频| 18禁裸乳无遮挡动漫免费视频| 国内精品宾馆在线| 国产又爽黄色视频| 久久久亚洲精品成人影院| 久久久久人妻精品一区果冻| 亚洲成人一二三区av| av有码第一页| 亚洲精品色激情综合| 国产精品99久久99久久久不卡 | 国产亚洲午夜精品一区二区久久| 最近2019中文字幕mv第一页| 尾随美女入室| 免费在线观看黄色视频的| 美女内射精品一级片tv| 在线观看人妻少妇| 天天躁夜夜躁狠狠久久av| 国产日韩一区二区三区精品不卡| 999精品在线视频| 色网站视频免费| 有码 亚洲区| 人妻系列 视频| 熟女av电影| 一区在线观看完整版| 91在线精品国自产拍蜜月| 国产深夜福利视频在线观看| 香蕉丝袜av| 男女边吃奶边做爰视频| a级毛色黄片| 日本黄色日本黄色录像| 久久这里只有精品19| 在现免费观看毛片| 成年动漫av网址| 免费人妻精品一区二区三区视频| 制服人妻中文乱码| 韩国高清视频一区二区三区| 国产探花极品一区二区| 日韩不卡一区二区三区视频在线| 国产在视频线精品| 久久精品熟女亚洲av麻豆精品| 午夜日本视频在线| 精品第一国产精品| 欧美成人午夜免费资源| 人体艺术视频欧美日本| 色吧在线观看| 国产黄色视频一区二区在线观看| 色5月婷婷丁香| 日韩伦理黄色片| 久久国内精品自在自线图片| 热99久久久久精品小说推荐| 久久精品久久久久久噜噜老黄| 亚洲av免费高清在线观看| 免费人成在线观看视频色| 婷婷色综合大香蕉| 一区二区三区乱码不卡18| 两个人免费观看高清视频| 香蕉国产在线看| 卡戴珊不雅视频在线播放| 久久久a久久爽久久v久久| 男女边摸边吃奶| 国产av国产精品国产| 国产xxxxx性猛交| av播播在线观看一区| 美国免费a级毛片| a级片在线免费高清观看视频| 最新中文字幕久久久久| 亚洲欧美清纯卡通| 久久久国产欧美日韩av| 男女免费视频国产| 国产高清国产精品国产三级| 国产深夜福利视频在线观看| 日韩人妻精品一区2区三区| 久久99热这里只频精品6学生| 乱码一卡2卡4卡精品| 1024视频免费在线观看| 黄色毛片三级朝国网站| 午夜免费观看性视频| 免费在线观看黄色视频的| 一本久久精品| 久久久欧美国产精品| 少妇人妻久久综合中文| 2021少妇久久久久久久久久久| 国产毛片在线视频| 日韩大片免费观看网站| 久久久精品区二区三区| 黄色一级大片看看| 免费久久久久久久精品成人欧美视频 | 国产免费一级a男人的天堂| 丰满迷人的少妇在线观看| 亚洲美女搞黄在线观看| 国产福利在线免费观看视频| 色视频在线一区二区三区| av线在线观看网站| 久久99精品国语久久久| 美女内射精品一级片tv| 国产日韩欧美在线精品| 欧美日韩视频精品一区| www日本在线高清视频| 亚洲三级黄色毛片| 一区在线观看完整版| 欧美xxxx性猛交bbbb| 色94色欧美一区二区| 两个人看的免费小视频| 国产精品麻豆人妻色哟哟久久| 亚洲天堂av无毛| 熟女人妻精品中文字幕| 国产一区二区激情短视频 | 国产女主播在线喷水免费视频网站| 日韩成人av中文字幕在线观看| 夜夜爽夜夜爽视频| 制服诱惑二区| 色婷婷久久久亚洲欧美| 九草在线视频观看| √禁漫天堂资源中文www| 熟妇人妻不卡中文字幕| 这个男人来自地球电影免费观看 | 欧美精品人与动牲交sv欧美| 91精品伊人久久大香线蕉| 两个人免费观看高清视频| 亚洲欧洲国产日韩| 人妻系列 视频| 三级国产精品片| 熟女av电影| 大码成人一级视频| 黑人巨大精品欧美一区二区蜜桃 | 午夜激情av网站| 熟女电影av网| 天美传媒精品一区二区| 在线观看免费视频网站a站| 少妇人妻 视频| av电影中文网址| av有码第一页| 伦理电影免费视频| 91成人精品电影| 视频区图区小说| 99热全是精品| 国产欧美亚洲国产| 中文字幕制服av| 最近最新中文字幕大全免费视频 | av卡一久久| 蜜桃在线观看..| 黑人高潮一二区| 国产欧美日韩一区二区三区在线| 亚洲av国产av综合av卡| 好男人视频免费观看在线| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 国产成人精品在线电影| 色视频在线一区二区三区| 考比视频在线观看| av又黄又爽大尺度在线免费看| 18禁观看日本| 蜜臀久久99精品久久宅男| www日本在线高清视频| 久久久国产精品麻豆| 9色porny在线观看| 免费人成在线观看视频色| 极品人妻少妇av视频| 丝袜在线中文字幕| 22中文网久久字幕| 高清欧美精品videossex| 看免费成人av毛片| 久久综合国产亚洲精品| 久热这里只有精品99| 国产精品国产三级国产av玫瑰| 婷婷成人精品国产| 这个男人来自地球电影免费观看 | 亚洲精品视频女| 欧美 亚洲 国产 日韩一| 国产白丝娇喘喷水9色精品| 在线观看美女被高潮喷水网站| av视频免费观看在线观看| 九色成人免费人妻av| 国产又爽黄色视频| 国产麻豆69| 国产欧美日韩一区二区三区在线| 只有这里有精品99| 51国产日韩欧美| 国产免费一级a男人的天堂| 最后的刺客免费高清国语| 欧美+日韩+精品| 有码 亚洲区| 巨乳人妻的诱惑在线观看| 日本vs欧美在线观看视频| 精品99又大又爽又粗少妇毛片| 亚洲熟女精品中文字幕| 建设人人有责人人尽责人人享有的| 成年美女黄网站色视频大全免费| 亚洲婷婷狠狠爱综合网| 精品少妇黑人巨大在线播放| 伦理电影免费视频| 日韩一区二区视频免费看| 多毛熟女@视频| 久久国产精品男人的天堂亚洲 | 亚洲国产成人一精品久久久| 黄片无遮挡物在线观看| 韩国高清视频一区二区三区| 在线观看免费日韩欧美大片| 午夜激情av网站| 高清黄色对白视频在线免费看| 日本欧美国产在线视频| 免费女性裸体啪啪无遮挡网站| 人妻人人澡人人爽人人| 免费女性裸体啪啪无遮挡网站| 最后的刺客免费高清国语| videosex国产| 亚洲婷婷狠狠爱综合网| 夫妻性生交免费视频一级片| 中文字幕av电影在线播放| 大香蕉久久网| 在线观看免费高清a一片| 人人妻人人澡人人爽人人夜夜| 免费观看性生交大片5| 亚洲成av片中文字幕在线观看 | 亚洲av成人精品一二三区| 男人舔女人的私密视频| 哪个播放器可以免费观看大片| 婷婷成人精品国产| 男人操女人黄网站| 国产亚洲一区二区精品| 制服诱惑二区| 香蕉精品网在线| 99香蕉大伊视频| 精品99又大又爽又粗少妇毛片| av福利片在线| 女的被弄到高潮叫床怎么办| 日本与韩国留学比较| 欧美xxxx性猛交bbbb| 丝袜人妻中文字幕| 国产日韩欧美视频二区| 亚洲精品久久久久久婷婷小说| 国产精品一二三区在线看| 欧美日韩成人在线一区二区| 国产精品一二三区在线看| 街头女战士在线观看网站| 亚洲成人一二三区av| 五月伊人婷婷丁香| 女的被弄到高潮叫床怎么办| 最黄视频免费看| 亚洲国产欧美日韩在线播放| 日本午夜av视频| 婷婷色av中文字幕| 日本色播在线视频| 18禁动态无遮挡网站| 最黄视频免费看| 自线自在国产av| 国产成人免费观看mmmm| 丝袜喷水一区| 大片电影免费在线观看免费| 80岁老熟妇乱子伦牲交| 最近最新中文字幕免费大全7| 欧美成人午夜免费资源| av片东京热男人的天堂| 国产一区有黄有色的免费视频| 国产国拍精品亚洲av在线观看| 亚洲三级黄色毛片| 亚洲欧洲精品一区二区精品久久久 | 18禁国产床啪视频网站| 国产一区有黄有色的免费视频| 久久久久视频综合| 日韩电影二区| 伦理电影免费视频| 亚洲,欧美,日韩| 卡戴珊不雅视频在线播放| 人体艺术视频欧美日本| 国产老妇伦熟女老妇高清| 日韩一本色道免费dvd| 建设人人有责人人尽责人人享有的| 男人操女人黄网站| 精品99又大又爽又粗少妇毛片| 午夜日本视频在线| 激情视频va一区二区三区| 婷婷色综合大香蕉| 免费黄网站久久成人精品| 国产成人免费观看mmmm| 在线观看一区二区三区激情| 精品午夜福利在线看| 成年女人在线观看亚洲视频| 亚洲精品国产色婷婷电影|