• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多智能體深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)無功優(yōu)化策略

    2022-03-03 05:13:30鄧清唐胡丹爾蔡田田李肖博徐賢民彭勇剛
    電工電能新技術(shù) 2022年2期
    關(guān)鍵詞:檔位行動(dòng)者配電網(wǎng)

    鄧清唐, 胡丹爾, 蔡田田, 李肖博, 徐賢民, 彭勇剛

    (1.南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司, 廣東 廣州 510663; 2.浙江大學(xué)電氣工程學(xué)院, 浙江 杭州 310027)

    1 引言

    隨著大量的可再生分布式電源接入配電網(wǎng)中,風(fēng)力設(shè)備和光伏設(shè)備出力的隨機(jī)波動(dòng)、負(fù)荷的不確定性波動(dòng)會(huì)引發(fā)配電網(wǎng)運(yùn)行電壓波動(dòng)大、電壓越線、網(wǎng)損提高等問題,影響電能質(zhì)量[1]。

    配電網(wǎng)無功優(yōu)化的目標(biāo)就是在充分滿足電網(wǎng)安全運(yùn)營約束下,有效地保證各個(gè)節(jié)點(diǎn)電壓的穩(wěn)定,減少電壓波動(dòng)和減輕電網(wǎng)的網(wǎng)損。配電網(wǎng)的無功優(yōu)化往往包含了多個(gè)不同的變量、一個(gè)約束,通常被認(rèn)為是非線性計(jì)劃中的一個(gè)問題。在對于傳統(tǒng)配電網(wǎng)絡(luò)中的有功和優(yōu)化研究中,常用的計(jì)算方法包括非線性規(guī)劃[2]、二次規(guī)劃[3]、牛頓法[4]等;此外,用于非線性復(fù)雜空間中采取隨機(jī)或近似隨機(jī)方式尋找最優(yōu)求解的算法,比如遺傳算法[5,6]、模擬退火算法[7,8]、粒子群算法[9,10]等也廣泛應(yīng)用于對無功優(yōu)化的求解中。這些方法存在計(jì)算速度慢、易陷入局部最優(yōu)、依賴于模型與預(yù)測數(shù)據(jù)等問題[11-14]。隨著配電網(wǎng)規(guī)模的增加以及無功可控設(shè)備裝置數(shù)量的增多,使得傳統(tǒng)方法求解無功優(yōu)化問題的復(fù)雜度大大提高,不再適用于在線控制的無功優(yōu)化求解。

    近年來,人工智能、數(shù)據(jù)驅(qū)動(dòng)相關(guān)技術(shù)的推進(jìn),使得基于人工智能的優(yōu)化方法在配電網(wǎng)無功優(yōu)化中得到了廣泛應(yīng)用。文獻(xiàn)[15,16]針對配電網(wǎng)低感知、無模型等特點(diǎn),以降低網(wǎng)損和成本為目標(biāo),提出了一種行動(dòng)者批評家的深度強(qiáng)化學(xué)習(xí)算法,實(shí)現(xiàn)在線連續(xù)無功優(yōu)化。文獻(xiàn)[17]考慮了分布式光伏電源接入和配電網(wǎng)電壓波動(dòng)問題,建立了深度高速公路神經(jīng)網(wǎng)絡(luò)擬合的注入功率與節(jié)點(diǎn)電壓之間的關(guān)系。但上述方法無功調(diào)節(jié)方法單一,未考慮具有一定無功調(diào)節(jié)能力的設(shè)備協(xié)同優(yōu)化,以節(jié)約成本,提升電力系統(tǒng)的可靠性、安全性。

    考慮接入光伏和風(fēng)機(jī)的實(shí)際配電網(wǎng)系統(tǒng),本文提出一種基于行動(dòng)者-評論家(actor-critic)的多智能體深度強(qiáng)化學(xué)習(xí)(Multi-Agent Deep Reinforcement Learning, MADRL)方法用來解決配電網(wǎng)無功優(yōu)化和電壓波動(dòng)問題[18-21]。結(jié)合離散投切電容器(Switching Capacitor, SC)、有載調(diào)壓變壓器(On-Line Tap Changer, OLTC)、分布式電源(Distributed Generation, DG)作為多個(gè)智能體進(jìn)行協(xié)調(diào)控制和優(yōu)化。無功調(diào)節(jié)設(shè)備的動(dòng)作變量與配電網(wǎng)環(huán)境進(jìn)行交互,通過使用數(shù)學(xué)中的離散時(shí)間序列把交互過程描述成一個(gè)稱為馬爾可夫決策過程(Markov Decision Process, MDP),智能體最終能夠?qū)崿F(xiàn)對于外部環(huán)境的最優(yōu)響應(yīng),從而獲得最大的回報(bào)值[13]。用神經(jīng)網(wǎng)絡(luò)方法來分析和擬合每一個(gè)智能體的戰(zhàn)略函數(shù)和動(dòng)作價(jià)值函數(shù),并用深度確定性戰(zhàn)略梯度(Multi-Agent Deep Deterministic Policy Gradient, MADDPG)算法對模型進(jìn)行訓(xùn)練。訓(xùn)練過程不依賴于預(yù)測數(shù)據(jù)結(jié)果和精確的潮流建模,多個(gè)智能體之間完成協(xié)調(diào)優(yōu)化,實(shí)現(xiàn)在線的無功優(yōu)化。在改進(jìn)的IEEE-33配電網(wǎng)系統(tǒng)上進(jìn)行仿真模擬,驗(yàn)證了所提深度強(qiáng)化學(xué)習(xí)算法的可行性。

    2 多智能體強(qiáng)化學(xué)習(xí)

    強(qiáng)化學(xué)習(xí)方式的本質(zhì)在于互動(dòng)性學(xué)習(xí),即可以讓一個(gè)智能體(agent)與外部環(huán)境(environment)之間進(jìn)行交互。智能體根據(jù)自己所感知的環(huán)境狀態(tài)(state)選擇響應(yīng)的動(dòng)作(action),以對環(huán)境做出響應(yīng),然后通過觀測動(dòng)作所導(dǎo)致的結(jié)果,并依據(jù)該動(dòng)作的結(jié)果進(jìn)行調(diào)整,最后通過智能體的動(dòng)作選擇策略對環(huán)境做出最優(yōu)反應(yīng),使其獲得最大的獎(jiǎng)勵(lì)值(reward)。多智能體強(qiáng)化學(xué)習(xí)是指多個(gè)具有自我控制能力、能夠相互作用的智能體,在同一個(gè)環(huán)境中通過傳感器感知狀態(tài),執(zhí)行操作,其算法框架如圖1所示。

    單個(gè)函數(shù)智能體在強(qiáng)化學(xué)習(xí)中一般需要通過MDP來對其進(jìn)行描述,而多個(gè)智能體在強(qiáng)化學(xué)習(xí)中則需要用馬爾可夫博弈方法來對其進(jìn)行強(qiáng)化描述。馬爾可夫博弈的方法也被稱為隨機(jī)函數(shù)博弈(stochastic game)。一個(gè)典型的多智能體馬爾可夫博弈用元組來表示,其表達(dá)形式為〈N,s,a1,a2,…,aN,T,γ,r1,…,rN〉,其中N表示智能體的個(gè)數(shù),s表示系統(tǒng)狀態(tài),a1,a2,…,aN為智能體的動(dòng)作集合。T表示狀態(tài)轉(zhuǎn)移函數(shù),T=s×a1×…×aN×s,T∈[0,1],根據(jù)當(dāng)前系統(tǒng)狀態(tài)和聯(lián)合動(dòng)作,給出下一個(gè)狀態(tài)的概率。ri(st,a1,…,aN,st+1)表示在t時(shí)刻下,智能體i在狀態(tài)s時(shí),執(zhí)行聯(lián)合動(dòng)作a1,…,aN所得到的獎(jiǎng)勵(lì)。具體的獎(jiǎng)勵(lì)函數(shù)需要根據(jù)環(huán)境和學(xué)習(xí)目標(biāo)設(shè)計(jì)。γ是折扣因子,保證越后面的獎(jiǎng)勵(lì),對獎(jiǎng)勵(lì)函數(shù)的影響越小,包含對未來獎(jiǎng)勵(lì)的不確定性。每個(gè)智能體都有一個(gè)核心目標(biāo)是為了要求找到一個(gè)可以做到最大化的折扣回報(bào)。用期望的形式表示為:

    (1)

    MADDPG算法可以用于解決多個(gè)智能體交互的問題,是一種基于行動(dòng)者-評論家框架下的MADRL,需要同時(shí)學(xué)習(xí)一個(gè)策略和一個(gè)值函數(shù)。行動(dòng)者網(wǎng)絡(luò)能夠教會(huì)智能體如何選擇動(dòng)作,而評論家網(wǎng)絡(luò)是用來評價(jià)智能體采取行動(dòng)可能帶來的回報(bào)。行動(dòng)者網(wǎng)絡(luò)的參數(shù)通常是基于評論家網(wǎng)絡(luò)給出的回報(bào)通過策略梯度法完成的。

    對于一個(gè)具有N個(gè)智能體的任務(wù),MADDPG會(huì)包含N個(gè)策略函數(shù)和N個(gè)評價(jià)函數(shù)。π={π1,…,πN}表示智能體采用N個(gè)隨機(jī)策略,其對應(yīng)的參數(shù)為θ={θ1,…,θN}。第i個(gè)智能體在某個(gè)觀察下的動(dòng)作可以表示為πi(ai|si)。每一個(gè)動(dòng)作價(jià)值函數(shù)Qi都是單獨(dú)學(xué)習(xí)的,任何一個(gè)智能體的獎(jiǎng)勵(lì)都是可以單獨(dú)進(jìn)行設(shè)計(jì)的。MADDPG 的主要目的是已知每個(gè)智能體所執(zhí)行的動(dòng)作,如果策略進(jìn)行改變,環(huán)境也可以是穩(wěn)定的。

    3 配電網(wǎng)無功優(yōu)化強(qiáng)化學(xué)習(xí)建模

    3.1 方案描述

    結(jié)合SC、OLTC、DG作為多個(gè)智能體進(jìn)行潮流計(jì)算,通過調(diào)節(jié)無功調(diào)節(jié)設(shè)備觀測系統(tǒng)的運(yùn)行狀態(tài)??紤]到SC和OLTC是離散調(diào)節(jié),而DG的無功是連續(xù)調(diào)節(jié)。本文設(shè)計(jì)DG的逆變器運(yùn)行在母線上,其視在功率容量為SDG,bus。DG逆變器裝置在母線上提供或吸收的無功功率可表示為:

    (2)

    3.2 無功優(yōu)化模型設(shè)計(jì)

    配電網(wǎng)無功優(yōu)化的目標(biāo)是要在最小化有功網(wǎng)損的同時(shí)保證電壓能在正常范圍內(nèi)運(yùn)行(0.95pu~1.05pu)。對于無功優(yōu)化的目標(biāo)函數(shù)obj定義為

    (3)

    式中,ND為日內(nèi)指令周期的個(gè)數(shù);Plossi為配電網(wǎng)的有功網(wǎng)損。

    約束條件包括節(jié)點(diǎn)電壓、無功功率和動(dòng)作量變化的上、下限約束以及潮流方程的約束,如下所示:

    (4)

    在低感知度配電網(wǎng)中,式(4)中的潮流方程無法精確計(jì)算。Td為控制變量的上下限約束。該配電網(wǎng)中只有部分節(jié)點(diǎn)可以實(shí)時(shí)測量,式(4)只適用于可以測量到的節(jié)點(diǎn);而在部分可觀測配電網(wǎng)中,精確潮流模型是無法求解的,因此,網(wǎng)損(式(3))需要通過部分可測節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行理論推算得出[22]。

    3.3 馬爾可夫決策過程

    所有滿足馬爾可夫?qū)傩缘膹?qiáng)化學(xué)習(xí)過程稱為MDP。在學(xué)習(xí)過程中,SC、OLTC、DG被定義為智能體(agent)。agent執(zhí)行操作與配電網(wǎng)環(huán)境交互。在對agent進(jìn)行訓(xùn)練過程中會(huì)根據(jù)配電系統(tǒng)中的狀態(tài)調(diào)整策略函數(shù),針對給定的運(yùn)行條件采取控制措施,以實(shí)現(xiàn)無功優(yōu)化。隨著可控裝置數(shù)量的增多,動(dòng)作空間的維數(shù)呈爆炸式增長。由于聯(lián)合行動(dòng)空間的維數(shù)極高,單智能體強(qiáng)化學(xué)習(xí)模型很難有效地提供策略[23]。

    3.3.1 狀態(tài)和動(dòng)作

    對于多智能體給定的動(dòng)作集a,環(huán)境提供配電系統(tǒng)中所有母線上的電壓,作為MADDPG的狀態(tài),可以表示為:

    s={Ui,Wi,Ci}

    (5)

    式中,Ui為第i個(gè)決策階段的配電網(wǎng)的節(jié)點(diǎn)電壓矩陣,維度為n×m,n為可量測的節(jié)點(diǎn)個(gè)數(shù),m為調(diào)度周期的測量次數(shù);Wi為第i個(gè)調(diào)度周期內(nèi)各個(gè)調(diào)節(jié)設(shè)備的投切檔位,為了方便訓(xùn)練,本文用one hot的編碼方法[16],如圖2所示;Ci為i個(gè)調(diào)度周期內(nèi)各個(gè)調(diào)節(jié)設(shè)備已經(jīng)完成的動(dòng)作,也用one hot編碼格式。舉例說明one hot編碼方法,假設(shè)配電網(wǎng)系統(tǒng)的動(dòng)作決策周期時(shí)間為15 min,無功設(shè)備的采樣時(shí)間在15 min,OLTC的可調(diào)比在0.9 pu~1.1 pu之間,共有9個(gè)檔位;SC1和SC2分別有3、4檔可調(diào)。Wi可以用一個(gè)9+3+4=16位的one hot編碼來表示。1代表接入該檔位,0代表不接入該檔位。Wi的組成由圖2所示。

    圖2 Wi的one hot編碼組成示意圖Fig.2 Diagram of one hot coding of Wi

    假設(shè)并聯(lián)電容器最大投切次數(shù)是5,OLTC的累計(jì)變化檔位上限為8。在一個(gè)決策周期內(nèi),調(diào)節(jié)設(shè)備OLTC選擇分接頭為5號(hào)檔位,SC1和SC2檔位數(shù)分別為3檔、2檔,當(dāng)前決策周期內(nèi),OLTC、SC1、SC2的累積檔位變化分別為6、4、3,則Wi和Ci的one hot編碼為:

    Wi=[0 0 0 0 1 0 0 0 0 0 0 1 0 1 0 0]

    (6)

    Ci=[0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0]

    (7)

    動(dòng)作空間Ai定義為下一個(gè)指令周期的無功調(diào)節(jié)設(shè)備的檔位狀態(tài),也采用one hot編碼表示,即:

    ai=Wi+1

    (8)

    將配電網(wǎng)的潮流信息矩陣Ui與投切檔位矩陣Wi以及累計(jì)投切檔位矩陣Ci拼接后得到狀態(tài)矩陣的維度為33+16+18=67。

    3.3.2 獎(jiǎng)勵(lì)函數(shù)

    根據(jù)3.2節(jié)建立的無功模型,為了求解優(yōu)化模型,將電壓約束引入到目標(biāo)函數(shù)中,構(gòu)造深度強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù)。對每個(gè)智能體的獎(jiǎng)勵(lì)函數(shù)進(jìn)行準(zhǔn)確量化設(shè)計(jì),來保證強(qiáng)化學(xué)習(xí)算法高效運(yùn)行。無功優(yōu)化的目標(biāo)必須要保證所有電壓幅值在正常工作范圍內(nèi),否則該無功優(yōu)化問題就沒有可行解。因此,在計(jì)算功率損耗降低之前,所提出的獎(jiǎng)勵(lì)函數(shù)首先檢查各智能體動(dòng)作是否導(dǎo)致電壓違規(guī),智能體需盡可能避免產(chǎn)生導(dǎo)致電壓越限的操作。

    SC智能體節(jié)點(diǎn)電壓需滿足約束條件,并且在當(dāng)前幕內(nèi)沒有超過允許動(dòng)作次數(shù)情況下,將即時(shí)回報(bào)ri設(shè)定成網(wǎng)損和動(dòng)作成本之和的相反數(shù)。如果違反了約束條件(4),則會(huì)對智能體的獎(jiǎng)勵(lì)施加重大的懲罰因子,在當(dāng)前調(diào)度時(shí)刻獲得的即時(shí)獎(jiǎng)勵(lì)定義為:

    η1σ(|Bbus,j-Bbus,j-1|≤NT,max)

    (9)

    式中,σ(·)為判斷函數(shù),無功補(bǔ)償設(shè)備的調(diào)節(jié)累計(jì)檔位變化次數(shù)若超過約束調(diào)節(jié),則函數(shù)值為1,未超過時(shí),則值為0;λc為動(dòng)作調(diào)節(jié)代價(jià);Bbus,j為第j次決策時(shí)SC的投切擋位;NT,max為優(yōu)化周期內(nèi)的累計(jì)檔位變化上限;η1為懲罰因子。

    OLTC智能體在當(dāng)前調(diào)度時(shí)刻獲得的即時(shí)獎(jiǎng)勵(lì)可以定義為:

    η2σ(NL,j-NL,j-1≤NL,max)

    (10)

    式中,λo為OLTC智能體檔位動(dòng)作代價(jià);NL,j為第j次決策時(shí)OLTC的投切擋位;L為OLTC所在的節(jié)點(diǎn)序號(hào);NL,max為優(yōu)化周期內(nèi)OLTC累計(jì)檔位變化上限;η2為懲罰因子。

    DG智能體在當(dāng)前調(diào)度時(shí)刻獲得的即時(shí)獎(jiǎng)勵(lì)可以定義為:

    η3σ(Umin≤Uk,j≤Umax)

    (11)

    式中,λd為DG智能體檔位調(diào)整設(shè)定值;Uk,base為電壓基準(zhǔn)值;Uk,j為DG智能體所連母線的電壓量測值;Umax和Umin分別為電壓上、下限;Ne為可觀測的節(jié)點(diǎn)總數(shù);η3為懲罰因子。

    3.4 配電網(wǎng)多智能體深度強(qiáng)化學(xué)習(xí)算法

    3.4.1 深度神經(jīng)網(wǎng)絡(luò)算法分析

    目前常用的多智能體強(qiáng)化學(xué)習(xí)算法主要有兩種:基于值函數(shù)的多智能體深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,DRL)和基于策略的多智能體DRL?;谥岛瘮?shù)的方法是通過得到一個(gè)值函數(shù),根據(jù)該值函數(shù)可以生成相應(yīng)的策略?;诓呗缘姆椒▌t直接在策略空間利用梯度上升找出最優(yōu)的策略[24]。

    本文中采用的MADDPG算法構(gòu)建了兩個(gè)神經(jīng)網(wǎng)絡(luò):行動(dòng)者網(wǎng)絡(luò)(actor network)和評論家網(wǎng)絡(luò)(critic network)。行動(dòng)者網(wǎng)絡(luò)是將狀態(tài)-行為值函數(shù)和策略梯度法相結(jié)合。θ1和θ2分別為行動(dòng)者網(wǎng)絡(luò)和評論家網(wǎng)絡(luò)的參數(shù)。通過調(diào)節(jié)神經(jīng)網(wǎng)絡(luò)的參數(shù)θ來確定某狀態(tài)下的最佳行動(dòng)。評論家網(wǎng)絡(luò)通過計(jì)算時(shí)間差分的誤差(temporal difference error)來評估行動(dòng)者網(wǎng)絡(luò)的行為。每個(gè)行動(dòng)者網(wǎng)絡(luò)和評論家網(wǎng)絡(luò)中同時(shí)構(gòu)建了兩個(gè)結(jié)構(gòu)相同、參數(shù)不同的神經(jīng)網(wǎng)絡(luò),即估值網(wǎng)絡(luò)(evaluation network) 和目標(biāo)網(wǎng)絡(luò)(target network)。估值網(wǎng)絡(luò)的參數(shù)可以根據(jù)訓(xùn)練不斷調(diào)整更新,目標(biāo)網(wǎng)絡(luò)則不參與訓(xùn)練過程,其參數(shù)會(huì)根據(jù)估值網(wǎng)絡(luò)的參數(shù)進(jìn)行迭代更新。因此本文設(shè)計(jì)了行動(dòng)者-評論家的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。圖3中所示的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)主要由3個(gè)部分組成:①卷積神經(jīng)網(wǎng)絡(luò)用來提取關(guān)鍵特征;②行動(dòng)者網(wǎng)絡(luò)可以擬合狀態(tài)到動(dòng)作的映射;③評論家網(wǎng)絡(luò)可以擬合狀態(tài)價(jià)值函數(shù)。根據(jù)3.3.1節(jié)分析,配電網(wǎng)無功優(yōu)化的馬爾可夫決策的狀態(tài)矩陣記作[Ui,Wi,Ci],作為模型的輸入。

    圖3 MADDPG算法神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Neural network structure of MADDPG algorithm

    行動(dòng)者網(wǎng)絡(luò)是一個(gè)具有三個(gè)全連接層的神經(jīng)網(wǎng)絡(luò)。輸入維度為狀態(tài)矩陣的維度,兩個(gè)隱含層各有128個(gè)神經(jīng)元;輸出維度為矩陣Wi的維度,該層的激活函數(shù)為ReLU。評論家網(wǎng)絡(luò)與行動(dòng)者網(wǎng)絡(luò)輸入相同,且同樣是用三層全連接網(wǎng)絡(luò),與行動(dòng)者網(wǎng)絡(luò)不同的是評論家網(wǎng)絡(luò)用來擬合狀態(tài)價(jià)值函數(shù)V(s),輸出的維度是1,代表對每一個(gè)狀態(tài)-動(dòng)作的值估計(jì)。

    3.4.2 深度神經(jīng)網(wǎng)絡(luò)優(yōu)化

    在深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,第i個(gè)智能體的策略梯度可以表示為:

    (12)

    式中,s為整個(gè)環(huán)境的狀態(tài);si為智能體i的觀測值;Qi(s,a1,…,aN)為第i個(gè)中心化的評價(jià)函數(shù),其輸入是每個(gè)智能體采取的動(dòng)作ai以及環(huán)境狀態(tài)s,其輸出為第i個(gè)智能體的動(dòng)作價(jià)值函數(shù)Q值。

    由于根據(jù)概率選擇動(dòng)作會(huì)存在收斂效率低的困難,MADDPG方法將隨機(jī)策略替換為確定性策略,用μi表示第i個(gè)智能體的策略,θi表示價(jià)值網(wǎng)絡(luò)的參數(shù),則智能體的梯度可以描述為:

    (13)

    式中,D(s,a,r,s′)為經(jīng)驗(yàn)回放緩存區(qū)(experience replay buffer),記錄了所有智能體的經(jīng)驗(yàn),a={a1,…,aN},r={r1,…,rN}。

    決策主體與環(huán)境交互過程中,評論家網(wǎng)絡(luò)的損失函數(shù)定義為:

    (14)

    其中

    y=ri+γQi[st+1,at+1]|at+1=μ′(si)

    (15)

    4 算例分析

    4.1 算例系統(tǒng)介紹

    算例基于IEEE-33 節(jié)點(diǎn)配電網(wǎng)系統(tǒng)進(jìn)行改動(dòng),基準(zhǔn)電壓調(diào)整為12.66 kV。算例系統(tǒng)中包含了3個(gè)DG,每個(gè)容量為750 kW,采用下垂控制用以調(diào)節(jié)電壓,如圖4所示。將整個(gè)系統(tǒng)的觀測率設(shè)定為60%。圖4中能觀測到的節(jié)點(diǎn)標(biāo)為實(shí)心,不能觀測到的節(jié)點(diǎn)標(biāo)為空心。在系統(tǒng)中節(jié)點(diǎn)21號(hào)、32號(hào)加上并聯(lián)電容器。每個(gè)SC每日動(dòng)作次數(shù)上限是5次。SC1有6個(gè)檔位,每檔為0.4 MVar, 總?cè)萘繛? MVar,SC2有5個(gè)檔位,每檔為0.3 MVar,總?cè)萘繛?.2 MVar。OLTC的可調(diào)節(jié)比例為0.95 pu ~1.05 pu,設(shè)定10個(gè)調(diào)節(jié)檔位??紤]所有設(shè)備的動(dòng)作變量會(huì)產(chǎn)生一個(gè)高位的聯(lián)合決策空間,例如,在33節(jié)點(diǎn)的總線系統(tǒng)中,假設(shè)SC1和SC2各有5、4個(gè)檔位(各6、5種投切狀態(tài),其中包含全退狀態(tài))指定為智能體1的動(dòng)作,記作dim(ξ1)=6×5=30。OLTC有11個(gè)離散檔位指定為智能體2的動(dòng)作,記作dim(ξ2)=11。為了訓(xùn)練收斂效果更好,通過節(jié)點(diǎn)15的DG來參與調(diào)節(jié)無功功率,設(shè)置DG有20個(gè)離散檔位為智能體3的動(dòng)作,記作dim(ξ3)=20。則所有動(dòng)作通過矩陣拼接所產(chǎn)生的動(dòng)作組合共有30×11×20=6 600 個(gè)。

    圖4 配電網(wǎng)算例系統(tǒng)和分布式電源無功優(yōu)化Fig.4 Distribution network system and reactive power optimization of distributed generation

    選取浙江某地區(qū)半年的分布式光伏、風(fēng)機(jī)以及負(fù)荷出力的實(shí)際數(shù)據(jù)進(jìn)行深度強(qiáng)化學(xué)習(xí)算力分析。隨機(jī)挑選兩個(gè)典型日(冬季典型日和夏季典型日)共30天作為強(qiáng)化學(xué)習(xí)的測試集,其余時(shí)間作為訓(xùn)練集,取決策間隔時(shí)長為15 min。

    4.2 深度學(xué)習(xí)訓(xùn)練過程

    深度強(qiáng)化學(xué)習(xí)訓(xùn)練過程需要在多智能體決策和環(huán)境的交互過程下實(shí)現(xiàn)。本文設(shè)計(jì)搭建了Matlab仿真環(huán)境來代替深度強(qiáng)化學(xué)習(xí)實(shí)際配電網(wǎng)的環(huán)境,通過計(jì)算潮流的方式來代替訓(xùn)練過程中的無功優(yōu)化環(huán)境。搭建Python中的Pytorch框架完成多智能體深度強(qiáng)化學(xué)習(xí)算法,設(shè)置網(wǎng)絡(luò)中各個(gè)參數(shù)值,訓(xùn)練過程可以通過軟件之間的接口來完成,模型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練參數(shù)詳見表1。

    表1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)以及參數(shù)設(shè)定Tab.1 Neural network structure and hyperparameters

    在本文例子中,例如在圖1所示多智能體的強(qiáng)化機(jī)器學(xué)習(xí)訓(xùn)練算法中,訓(xùn)練以及學(xué)習(xí)也都應(yīng)該是統(tǒng)一進(jìn)行。在訓(xùn)練開始階段,對各個(gè)智能體的動(dòng)作進(jìn)行初始化準(zhǔn)備,仿真環(huán)境會(huì)根據(jù)行動(dòng)者評論家網(wǎng)絡(luò)給出的動(dòng)作指令進(jìn)行潮流計(jì)算,并且完成該動(dòng)作a。根據(jù)各個(gè)智能體的獎(jiǎng)勵(lì)函數(shù)得到即時(shí)的獎(jiǎng)勵(lì)ri。

    各個(gè)行動(dòng)者收集數(shù)據(jù)(s,a,r,s′,a′),并存入經(jīng)驗(yàn)回放池中,當(dāng)緩存池的數(shù)量超過了預(yù)熱的閾值,就會(huì)開始進(jìn)行學(xué)習(xí)。每個(gè)行動(dòng)者分別更新策略π,與深度確定性策略梯度(Deep Deterministic Policy Gradient, DDPG)算法相似,只需要當(dāng)前s,a=μ(s)[25],μ(s)為智能體在環(huán)境s下的策略。每個(gè)評論家分別更新動(dòng)作價(jià)值參數(shù),每個(gè)評論家都可以看到所有的行動(dòng)者收集到的數(shù)據(jù),更新參數(shù)的時(shí)候會(huì)考慮所有的行動(dòng)者自己生成的數(shù)據(jù),即優(yōu)化后的結(jié)果是每一個(gè)評論家對于全局的貢獻(xiàn)最大。在這個(gè)過程中反復(fù)地訓(xùn)練,最后神經(jīng)網(wǎng)絡(luò)會(huì)達(dá)到收斂的效果,其過程用流程圖描述如圖5所示。

    圖5 行動(dòng)者-評論家的神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程Fig.5 Training process of actor and critc neural network

    第3.3.2節(jié)中的式(9) ~式(11)中,設(shè)備動(dòng)作成本的系數(shù)λc、λo和λd分別為5、6和7。η1、η2和η3懲罰因子均為1 000。一天24 h 96個(gè)時(shí)段作為一幕,即該天結(jié)束后本回合結(jié)束。在多智能體與環(huán)境交互過程中,累計(jì)的回報(bào)值不斷地變大,在訓(xùn)練結(jié)束后智能體的動(dòng)作選擇也趨于穩(wěn)定。訓(xùn)練結(jié)果顯示如圖6所示,其中,Loss為損失函數(shù),為單個(gè)訓(xùn)練樣本與真實(shí)值之間的誤差。網(wǎng)絡(luò)的回報(bào)值在經(jīng)過2 000幕左右逐漸收斂,達(dá)到了比較理想的控制效果,也驗(yàn)證了MADDPG算法在文中對于配電網(wǎng)環(huán)境下的無功功率控制和實(shí)際應(yīng)用的可行性和有效性。

    圖6 平均累計(jì)獎(jiǎng)勵(lì)和神經(jīng)網(wǎng)絡(luò)Loss值訓(xùn)練結(jié)果Fig.6 Average cumulative reward and neural network Loss value training results

    4.3 仿真結(jié)果分析

    4.3.1 算法有效性分析

    為了驗(yàn)證MADDPG算法的有效性,本文采用以下兩種算法進(jìn)行對比:①為了證明MADDPG方法比傳統(tǒng)的無功功率優(yōu)化算法粒子群(Particle Swarm Optimization,PSO)更具有效性,利用文獻(xiàn)[26]中的算法來調(diào)節(jié)典型日下24 h內(nèi)多個(gè)無功調(diào)節(jié)設(shè)備,選擇離散的動(dòng)作方案;② 將MADDPG與其他強(qiáng)化學(xué)習(xí)算法進(jìn)行對比,選擇文獻(xiàn)[27]提出的基于值的深度Q網(wǎng)絡(luò)(Deep Q Network, DQN)無功優(yōu)化方法進(jìn)行對比,觀察網(wǎng)損和節(jié)點(diǎn)電壓的情況。

    利用所提出的不同優(yōu)化方法的典型日(夏季日和冬季日)的12:00這一典型時(shí)刻進(jìn)行電壓分布情況和電壓偏差的對比,結(jié)果如圖7和表2所示。

    圖7 典型日下電壓分布情況Fig.7 Voltage distribution under typical day

    表2 典型日電壓和網(wǎng)損對比Tab.2 Comparison of typical daily voltage and network loss

    由圖7和表2可知,本文采用的MADDPG算法優(yōu)化以后得到的電壓偏差最小,即保證了電壓運(yùn)行的穩(wěn)定性,最小化電壓波動(dòng)。本文采用深度強(qiáng)化學(xué)習(xí)算法,多智能體可以最大化獎(jiǎng)勵(lì),有效提高設(shè)備動(dòng)作的合理性。

    利用不用方法對兩個(gè)典型日下網(wǎng)絡(luò)的損耗結(jié)果進(jìn)行對比分析,如圖8和表2所示。

    從圖8和表2中可知,采用本文的MADDPG算法得到的典型日下的網(wǎng)損更低。將MADDPG算法與其他兩種方法的結(jié)果進(jìn)行對比,在夏季日的平均網(wǎng)損分別降低了14.98%和8.03%;在冬季日的平均網(wǎng)損分別降低了20.74%和5.62%。所以可以驗(yàn)證本文MADDPG算法在2種典型日下,都可以更大效率減小系統(tǒng)網(wǎng)損,即說明了本文提出算法的有效性和優(yōu)越性。

    不同算法的2個(gè)典型日下,OLTC、SC調(diào)節(jié)設(shè)備的日累計(jì)檔位變化數(shù)如圖9所示。采用本文的方法優(yōu)化以后的設(shè)備累計(jì)檔位變化比其他兩種方法更小,說明本文方法優(yōu)化設(shè)備的動(dòng)作成本更小,具備更好的經(jīng)濟(jì)性。各優(yōu)化決策算法下,日內(nèi)的DG調(diào)節(jié)設(shè)備日均補(bǔ)償無功的出力見表3。

    表3 調(diào)壓裝置參數(shù)設(shè)定Tab.3 Parameters of voltage regulation devices

    4.3.2 復(fù)雜配電網(wǎng)算法有效性對比分析

    為了驗(yàn)證該方法的可擴(kuò)展性和適用性,還對改進(jìn)的IEEE-123節(jié)點(diǎn)配電網(wǎng)進(jìn)行了仿真。調(diào)壓裝置的節(jié)點(diǎn)位置、有載調(diào)壓變壓器OLTC、離散投切電容器(Capacitor Bank,CB)和分布式電源DG的詳細(xì)參數(shù)見表4。采用本文不同算法對兩個(gè)典型日IEEE-123節(jié)點(diǎn)配電網(wǎng)的網(wǎng)絡(luò)損耗結(jié)果進(jìn)行了對比分析,如圖10所示。可以看出本文提出的MADDPG算法在兩種典型日下,在更復(fù)雜的配電網(wǎng)拓?fù)銲EEE-123中也可以更大效率地減小系統(tǒng)網(wǎng)損,再次證明了本文提出的MADDPG算法的有效性。

    圖8 典型日下IEEE-33網(wǎng)損情況Fig.8 Typical daily network loss of IEEE-33

    圖9 不同算法離散調(diào)節(jié)設(shè)備的日累計(jì)檔位變化數(shù)Fig.9 Daily change number of discrete adjustment devices

    表4 調(diào)壓裝置參數(shù)設(shè)定Tab.4 Parameters of voltage regulation devices

    圖10 典型日下IEEE-123網(wǎng)損情況Fig.10 Typical daily network loss of IEEE-123

    4.3.3 計(jì)算性能分析

    本文進(jìn)行的仿真測試硬件平臺(tái)包括:Intel(R) Core(TM) i7-7700K CPU @ 4.20GHz ; 32GB RAM; GPU: NVIDIA GTX 2080 Ti ; 軟件平臺(tái)包括:ubuntu18.04(Linux) ; Python 3.7.6; Pytorch 1.2.0。

    在線測試階段,33節(jié)點(diǎn)的配電網(wǎng)系統(tǒng)中,本文所用MADDPG算法的測試用例平均執(zhí)行時(shí)間為29.5 ms,能夠滿足電力系統(tǒng)實(shí)時(shí)性的要求。因此,本文提出的MADDPG算法在處理動(dòng)作空間為高維空間時(shí)具有一定的合理性。

    5 結(jié)論

    本文設(shè)計(jì)了一種基于多智能體深度強(qiáng)化學(xué)習(xí)MADDPG算法的配電網(wǎng)無功優(yōu)化算法。采用集中訓(xùn)練、分散執(zhí)行的方式,通過環(huán)境與多個(gè)智能體之間的交互,自適應(yīng)地選擇調(diào)度動(dòng)作指令,實(shí)現(xiàn)節(jié)點(diǎn)電壓調(diào)節(jié)和降低網(wǎng)損。主要結(jié)論如下。

    (1)設(shè)計(jì)了多個(gè)智能體,根據(jù)不同的獎(jiǎng)勵(lì)函數(shù)來訓(xùn)練調(diào)節(jié)無功補(bǔ)償裝置的動(dòng)作,通過多個(gè)智能體的協(xié)調(diào)合作,達(dá)到更好的優(yōu)化效果。

    (2)MADDPG訓(xùn)練是需要通過與電網(wǎng)交互來實(shí)現(xiàn)的。該算法可以滿足實(shí)際電網(wǎng)中無法進(jìn)行精確潮流建模的情況。完成訓(xùn)練后的網(wǎng)絡(luò)不需要預(yù)測日前的分布式電源、負(fù)荷等數(shù)據(jù),就可以進(jìn)行在線優(yōu)化決策。

    (3)與傳統(tǒng)優(yōu)化方法PSO以及強(qiáng)化學(xué)習(xí)DQN方法相比,本文使用的MADDPG算法可以使得網(wǎng)損更小、電壓平抑效果更佳,對提升配網(wǎng)安全可靠性有更顯著的效果。

    猜你喜歡
    檔位行動(dòng)者配電網(wǎng)
    與異質(zhì)性行動(dòng)者共生演進(jìn):基于行動(dòng)者網(wǎng)絡(luò)理論的政策執(zhí)行研究新路徑
    配電網(wǎng)自動(dòng)化的應(yīng)用與發(fā)展趨勢
    三繞組變壓器運(yùn)行分接頭檔位計(jì)算及電壓分析
    敬仰中國大地上的綠色行動(dòng)者
    綠色中國(2016年1期)2016-06-05 09:02:59
    基于IEC61850的配電網(wǎng)數(shù)據(jù)傳輸保護(hù)機(jī)制
    電測與儀表(2016年5期)2016-04-22 01:14:14
    配電網(wǎng)不止一步的跨越
    河南電力(2016年5期)2016-02-06 02:11:24
    網(wǎng)絡(luò)行動(dòng)者的新媒體使用特征、影響及媒介民主化
    新聞傳播(2015年3期)2015-07-12 12:22:28
    做“互聯(lián)網(wǎng)+”的積極行動(dòng)者
    引入分接頭檔位的換流變差動(dòng)保護(hù)方案研究
    河南科技(2015年2期)2015-02-27 14:20:29
    基于單片機(jī)的變壓器檔位監(jiān)測雙輸入BCD編碼器
    小蜜桃在线观看免费完整版高清| 国产精品不卡视频一区二区| 国产成人aa在线观看| 亚洲国产欧洲综合997久久,| 97碰自拍视频| 精品一区二区三区视频在线观看免费| 亚洲国产日韩欧美精品在线观看| 九色国产91popny在线| 亚洲欧美激情综合另类| 久久久久国内视频| 欧美激情在线99| 色噜噜av男人的天堂激情| h日本视频在线播放| 中文字幕久久专区| 国产日本99.免费观看| 俺也久久电影网| 日韩强制内射视频| 成人特级av手机在线观看| 哪里可以看免费的av片| 亚洲av中文av极速乱 | 天堂影院成人在线观看| 成年免费大片在线观看| 色噜噜av男人的天堂激情| 熟女电影av网| av在线亚洲专区| 国产综合懂色| 观看美女的网站| 他把我摸到了高潮在线观看| 变态另类成人亚洲欧美熟女| 91在线观看av| 午夜久久久久精精品| 美女 人体艺术 gogo| 中亚洲国语对白在线视频| 淫秽高清视频在线观看| 国产 一区精品| 97碰自拍视频| 白带黄色成豆腐渣| 精品99又大又爽又粗少妇毛片 | 国语自产精品视频在线第100页| 波多野结衣巨乳人妻| 亚洲美女搞黄在线观看 | 国产一区二区亚洲精品在线观看| 在线观看一区二区三区| 波野结衣二区三区在线| 国产老妇女一区| 国产精品国产高清国产av| 国产伦在线观看视频一区| 中文在线观看免费www的网站| x7x7x7水蜜桃| 桃红色精品国产亚洲av| 性插视频无遮挡在线免费观看| 91久久精品国产一区二区三区| 美女黄网站色视频| 欧美日本亚洲视频在线播放| 99久久久亚洲精品蜜臀av| 国产老妇女一区| 亚洲成人免费电影在线观看| 国产精品98久久久久久宅男小说| 精品福利观看| 少妇的逼水好多| 观看免费一级毛片| 一级av片app| 国产精品美女特级片免费视频播放器| 亚洲av熟女| 国产黄色小视频在线观看| АⅤ资源中文在线天堂| 十八禁网站免费在线| 又粗又爽又猛毛片免费看| 欧美激情久久久久久爽电影| 久久国产精品人妻蜜桃| 免费看av在线观看网站| 成人性生交大片免费视频hd| videossex国产| 黄色视频,在线免费观看| 国产精品,欧美在线| 亚洲成人中文字幕在线播放| 深夜a级毛片| 日韩欧美国产一区二区入口| av在线蜜桃| 亚洲成人久久性| 亚洲美女搞黄在线观看 | 制服丝袜大香蕉在线| 国产蜜桃级精品一区二区三区| 黄片wwwwww| 精品国产三级普通话版| 身体一侧抽搐| 少妇熟女aⅴ在线视频| 伊人久久精品亚洲午夜| 搞女人的毛片| 精品福利观看| 国产精品亚洲美女久久久| h日本视频在线播放| 中文字幕免费在线视频6| 久久人人精品亚洲av| 中出人妻视频一区二区| 99九九线精品视频在线观看视频| 97超视频在线观看视频| 国产伦精品一区二区三区视频9| 在线观看一区二区三区| 亚洲美女视频黄频| 久久国产乱子免费精品| 国产三级在线视频| 无遮挡黄片免费观看| 久久人人精品亚洲av| 国产一区二区三区av在线 | 舔av片在线| 久久精品影院6| 国产欧美日韩精品亚洲av| 少妇的逼好多水| 亚洲精品粉嫩美女一区| 精品久久国产蜜桃| 日韩强制内射视频| 免费看美女性在线毛片视频| 少妇裸体淫交视频免费看高清| 听说在线观看完整版免费高清| 九九久久精品国产亚洲av麻豆| 91麻豆精品激情在线观看国产| 他把我摸到了高潮在线观看| 日日撸夜夜添| 国产精品人妻久久久影院| 免费电影在线观看免费观看| 久久精品影院6| 91久久精品国产一区二区三区| 欧美性感艳星| 日本a在线网址| 少妇裸体淫交视频免费看高清| 亚洲av熟女| 一区二区三区四区激情视频 | 免费在线观看日本一区| 在线国产一区二区在线| 免费一级毛片在线播放高清视频| 日日摸夜夜添夜夜添小说| 成人精品一区二区免费| 特级一级黄色大片| 亚洲经典国产精华液单| 日韩中文字幕欧美一区二区| 12—13女人毛片做爰片一| 成人国产一区最新在线观看| 亚洲乱码一区二区免费版| 成人三级黄色视频| 九九久久精品国产亚洲av麻豆| 婷婷六月久久综合丁香| 欧美黑人欧美精品刺激| 久久人人爽人人爽人人片va| 欧美性猛交黑人性爽| 色综合站精品国产| 国产免费av片在线观看野外av| 十八禁网站免费在线| a级毛片a级免费在线| 欧美日韩中文字幕国产精品一区二区三区| 亚洲精品国产成人久久av| 欧美性感艳星| 一本久久中文字幕| 国产美女午夜福利| 麻豆av噜噜一区二区三区| 国产精品伦人一区二区| 亚洲美女搞黄在线观看 | 99在线视频只有这里精品首页| 国产淫片久久久久久久久| 欧美色欧美亚洲另类二区| 久久草成人影院| 久久精品国产亚洲av天美| a级一级毛片免费在线观看| 婷婷亚洲欧美| 免费无遮挡裸体视频| 久久精品91蜜桃| 国产午夜福利久久久久久| 不卡一级毛片| 三级国产精品欧美在线观看| 老熟妇仑乱视频hdxx| 老女人水多毛片| 天堂影院成人在线观看| 亚洲在线自拍视频| 日日摸夜夜添夜夜添小说| av在线亚洲专区| 国产精品1区2区在线观看.| 人妻夜夜爽99麻豆av| av在线观看视频网站免费| 人妻夜夜爽99麻豆av| 国内精品美女久久久久久| 国产亚洲精品久久久久久毛片| 一级黄色大片毛片| 亚洲人成网站在线播放欧美日韩| 变态另类成人亚洲欧美熟女| 日韩,欧美,国产一区二区三区 | 别揉我奶头~嗯~啊~动态视频| 麻豆成人午夜福利视频| 亚洲精华国产精华精| 欧美色视频一区免费| 国产美女午夜福利| 一本一本综合久久| 人妻少妇偷人精品九色| 一进一出抽搐动态| 成年女人毛片免费观看观看9| 亚洲av电影不卡..在线观看| 亚洲avbb在线观看| 天堂网av新在线| 在线观看舔阴道视频| 欧美不卡视频在线免费观看| 成人特级黄色片久久久久久久| 国内少妇人妻偷人精品xxx网站| 91久久精品电影网| 国内揄拍国产精品人妻在线| 精品午夜福利在线看| 嫩草影院精品99| 最近中文字幕高清免费大全6 | x7x7x7水蜜桃| 在线播放国产精品三级| 国产午夜精品论理片| 三级国产精品欧美在线观看| 亚洲国产精品sss在线观看| 国内揄拍国产精品人妻在线| 麻豆国产97在线/欧美| 欧美日韩乱码在线| 可以在线观看的亚洲视频| 欧美国产日韩亚洲一区| 日日摸夜夜添夜夜添av毛片 | or卡值多少钱| 国产精华一区二区三区| 一级黄片播放器| 亚洲图色成人| 久久久精品大字幕| 亚洲av五月六月丁香网| av.在线天堂| 日韩中文字幕欧美一区二区| 他把我摸到了高潮在线观看| 久久中文看片网| 噜噜噜噜噜久久久久久91| 免费搜索国产男女视频| 麻豆国产av国片精品| 亚洲欧美精品综合久久99| 成人欧美大片| 白带黄色成豆腐渣| 在线a可以看的网站| 国产三级在线视频| 免费高清视频大片| 欧美日韩亚洲国产一区二区在线观看| 校园春色视频在线观看| 亚洲在线自拍视频| 人人妻人人看人人澡| 熟女电影av网| 午夜影院日韩av| 亚洲av成人av| 日韩av在线大香蕉| 欧美色欧美亚洲另类二区| 免费一级毛片在线播放高清视频| 全区人妻精品视频| 久久精品久久久久久噜噜老黄 | 少妇被粗大猛烈的视频| 琪琪午夜伦伦电影理论片6080| 俺也久久电影网| 免费黄网站久久成人精品| a级一级毛片免费在线观看| 精品不卡国产一区二区三区| 欧美日本亚洲视频在线播放| 美女高潮喷水抽搐中文字幕| 最近中文字幕高清免费大全6 | 99久久成人亚洲精品观看| 在线国产一区二区在线| 国产女主播在线喷水免费视频网站 | 精品福利观看| 在线观看66精品国产| 国产真实伦视频高清在线观看 | 麻豆av噜噜一区二区三区| 日本在线视频免费播放| 午夜日韩欧美国产| 日本黄色视频三级网站网址| 国产一区二区三区av在线 | 亚洲一区高清亚洲精品| 九色国产91popny在线| 色综合色国产| 精品人妻1区二区| 国产黄a三级三级三级人| 久久久久九九精品影院| 欧美高清性xxxxhd video| 伦精品一区二区三区| 动漫黄色视频在线观看| 亚洲综合色惰| 俺也久久电影网| 久久精品国产亚洲av天美| 老司机深夜福利视频在线观看| 22中文网久久字幕| 免费高清视频大片| 午夜福利视频1000在线观看| 亚洲男人的天堂狠狠| 伦精品一区二区三区| av在线蜜桃| 97超视频在线观看视频| 夜夜爽天天搞| 人妻久久中文字幕网| 少妇熟女aⅴ在线视频| 黄片wwwwww| 午夜亚洲福利在线播放| 免费看日本二区| 国产免费男女视频| 日日啪夜夜撸| a级毛片a级免费在线| 少妇人妻精品综合一区二区 | 精品久久久久久久久久久久久| 国产精品一区二区免费欧美| 久久香蕉精品热| 久久久久久久久大av| 午夜福利在线观看吧| 日本三级黄在线观看| 亚洲av二区三区四区| 午夜福利欧美成人| 欧美激情在线99| 91麻豆av在线| 婷婷精品国产亚洲av| 久久精品久久久久久噜噜老黄 | www.色视频.com| 69人妻影院| 亚洲欧美精品综合久久99| 91狼人影院| 亚洲精品日韩av片在线观看| 制服丝袜大香蕉在线| 欧美丝袜亚洲另类 | 日韩欧美国产一区二区入口| 欧美性猛交黑人性爽| 51国产日韩欧美| 亚洲av中文字字幕乱码综合| 国产爱豆传媒在线观看| 九色成人免费人妻av| 精品人妻熟女av久视频| 天堂网av新在线| 成年女人看的毛片在线观看| 国产精品国产三级国产av玫瑰| a在线观看视频网站| 亚洲国产精品久久男人天堂| 精品福利观看| 一进一出好大好爽视频| 最近最新免费中文字幕在线| 蜜桃亚洲精品一区二区三区| netflix在线观看网站| 人人妻人人澡欧美一区二区| 综合色av麻豆| 国产日本99.免费观看| 亚洲精华国产精华液的使用体验 | 色播亚洲综合网| 精品日产1卡2卡| 国产高清不卡午夜福利| 国产91精品成人一区二区三区| 免费人成视频x8x8入口观看| 国产久久久一区二区三区| 又紧又爽又黄一区二区| 亚洲综合色惰| 一边摸一边抽搐一进一小说| 久久人妻av系列| 日本黄色视频三级网站网址| 国产男人的电影天堂91| 精品人妻熟女av久视频| 中国美白少妇内射xxxbb| 欧美bdsm另类| 性色avwww在线观看| 天堂av国产一区二区熟女人妻| 亚洲乱码一区二区免费版| 91久久精品国产一区二区成人| 最近最新中文字幕大全电影3| 国产女主播在线喷水免费视频网站 | 狂野欧美激情性xxxx在线观看| 精品欧美国产一区二区三| 国产色婷婷99| 久久热精品热| 精品国产三级普通话版| 久久天躁狠狠躁夜夜2o2o| 国产精品久久电影中文字幕| 少妇高潮的动态图| 在线观看一区二区三区| 亚洲欧美日韩卡通动漫| 日本在线视频免费播放| 动漫黄色视频在线观看| 免费看a级黄色片| or卡值多少钱| 18禁黄网站禁片午夜丰满| 免费一级毛片在线播放高清视频| 日韩人妻高清精品专区| 国内毛片毛片毛片毛片毛片| 精品久久久久久成人av| 全区人妻精品视频| 男女边吃奶边做爰视频| 国产单亲对白刺激| 熟女电影av网| 日本精品一区二区三区蜜桃| 久久久国产成人免费| 观看免费一级毛片| 亚洲 国产 在线| 国内毛片毛片毛片毛片毛片| 亚洲av不卡在线观看| 黄色配什么色好看| 五月伊人婷婷丁香| 免费观看的影片在线观看| 天堂av国产一区二区熟女人妻| 国产三级在线视频| 男女边吃奶边做爰视频| 午夜爱爱视频在线播放| 国产视频内射| 亚洲成人久久爱视频| 欧美性猛交╳xxx乱大交人| 亚洲自拍偷在线| 久久精品国产亚洲av天美| 国产成人影院久久av| 亚洲av不卡在线观看| 成人国产综合亚洲| 99热网站在线观看| 国产淫片久久久久久久久| 欧美一级a爱片免费观看看| 99国产极品粉嫩在线观看| 露出奶头的视频| 别揉我奶头 嗯啊视频| 国产精品久久久久久久电影| 国产一区二区三区在线臀色熟女| 国产单亲对白刺激| 99视频精品全部免费 在线| 国产国拍精品亚洲av在线观看| 免费看av在线观看网站| 欧美区成人在线视频| 国产精品日韩av在线免费观看| 极品教师在线视频| 白带黄色成豆腐渣| 88av欧美| 亚洲欧美激情综合另类| 亚洲经典国产精华液单| 国产一区二区激情短视频| 日本撒尿小便嘘嘘汇集6| 白带黄色成豆腐渣| 国产男人的电影天堂91| 久久99热6这里只有精品| 婷婷精品国产亚洲av| 色综合站精品国产| 精品99又大又爽又粗少妇毛片 | 国国产精品蜜臀av免费| 老司机午夜福利在线观看视频| 亚洲av二区三区四区| 国国产精品蜜臀av免费| 亚洲av不卡在线观看| 12—13女人毛片做爰片一| 免费看美女性在线毛片视频| 国产av一区在线观看免费| 在线观看av片永久免费下载| 久久久久久久精品吃奶| 日日夜夜操网爽| 少妇被粗大猛烈的视频| 久久久色成人| 国产伦在线观看视频一区| 精品乱码久久久久久99久播| 精品无人区乱码1区二区| 国产乱人伦免费视频| 丰满乱子伦码专区| 一本精品99久久精品77| 神马国产精品三级电影在线观看| 久久亚洲真实| 18+在线观看网站| 久久久久久伊人网av| 麻豆精品久久久久久蜜桃| 国内精品美女久久久久久| 欧美成人性av电影在线观看| 啦啦啦韩国在线观看视频| 日韩精品有码人妻一区| 欧美xxxx性猛交bbbb| 少妇高潮的动态图| 九色成人免费人妻av| 成人亚洲精品av一区二区| 男女啪啪激烈高潮av片| 男女视频在线观看网站免费| av专区在线播放| 最新中文字幕久久久久| 国产精品美女特级片免费视频播放器| 成人国产综合亚洲| 国产欧美日韩精品亚洲av| 欧美另类亚洲清纯唯美| 亚洲专区中文字幕在线| 欧美成人一区二区免费高清观看| 日韩欧美在线乱码| 日本黄大片高清| 中文字幕av在线有码专区| 成人国产麻豆网| av女优亚洲男人天堂| 天天一区二区日本电影三级| 亚洲国产欧美人成| 久久国产精品人妻蜜桃| 欧美bdsm另类| 中文字幕精品亚洲无线码一区| 欧美三级亚洲精品| 丝袜美腿在线中文| 亚洲午夜理论影院| 天堂√8在线中文| 国产又黄又爽又无遮挡在线| 在线观看一区二区三区| 无人区码免费观看不卡| 日本-黄色视频高清免费观看| 成人午夜高清在线视频| 在线国产一区二区在线| 免费电影在线观看免费观看| 老司机福利观看| 嫩草影视91久久| 在现免费观看毛片| 免费无遮挡裸体视频| АⅤ资源中文在线天堂| 欧美极品一区二区三区四区| 日韩精品青青久久久久久| 久久九九热精品免费| 久久精品国产亚洲av涩爱 | 女人被狂操c到高潮| 夜夜看夜夜爽夜夜摸| 夜夜爽天天搞| 精品久久久噜噜| 国内揄拍国产精品人妻在线| 最新在线观看一区二区三区| 男女啪啪激烈高潮av片| videossex国产| 一个人看视频在线观看www免费| 国产精品爽爽va在线观看网站| 欧美一级a爱片免费观看看| 人妻夜夜爽99麻豆av| 夜夜爽天天搞| 尾随美女入室| 国产精品三级大全| 国产精品一区二区免费欧美| 国产免费av片在线观看野外av| 日本黄色片子视频| 大型黄色视频在线免费观看| 99久久精品国产国产毛片| 国产精品亚洲一级av第二区| 99国产精品一区二区蜜桃av| 99精品在免费线老司机午夜| 国产成年人精品一区二区| 又爽又黄a免费视频| 一a级毛片在线观看| 欧美中文日本在线观看视频| 国产高清视频在线播放一区| 免费观看的影片在线观看| 国产老妇女一区| 亚洲精品影视一区二区三区av| 国产激情偷乱视频一区二区| 国产欧美日韩精品亚洲av| 观看免费一级毛片| 99热网站在线观看| 日本三级黄在线观看| 男女下面进入的视频免费午夜| 女人被狂操c到高潮| 人人妻,人人澡人人爽秒播| 久久午夜亚洲精品久久| 亚洲中文字幕日韩| 久久久久九九精品影院| 国产视频一区二区在线看| 嫩草影院入口| 一个人看的www免费观看视频| 69人妻影院| 久久久久国产精品人妻aⅴ院| 免费看美女性在线毛片视频| 韩国av一区二区三区四区| 综合色av麻豆| 成人精品一区二区免费| 久久精品综合一区二区三区| 国内精品久久久久精免费| 日本精品一区二区三区蜜桃| 又爽又黄a免费视频| 搡女人真爽免费视频火全软件 | 欧美性猛交黑人性爽| 国产精品电影一区二区三区| 十八禁网站免费在线| 人妻丰满熟妇av一区二区三区| 国产91精品成人一区二区三区| 尤物成人国产欧美一区二区三区| 搡女人真爽免费视频火全软件 | 69av精品久久久久久| 欧美+日韩+精品| 俄罗斯特黄特色一大片| 国产伦在线观看视频一区| 美女xxoo啪啪120秒动态图| 国产精品不卡视频一区二区| 日韩强制内射视频| netflix在线观看网站| 亚洲精品国产成人久久av| 国产在线男女| 久久精品综合一区二区三区| av专区在线播放| 国产一区二区激情短视频| 人妻丰满熟妇av一区二区三区| 欧美精品国产亚洲| 99热精品在线国产| 久久精品影院6| 看片在线看免费视频| 91久久精品国产一区二区三区| 午夜免费男女啪啪视频观看 | 波多野结衣高清作品| 十八禁国产超污无遮挡网站| 深夜精品福利| 日日夜夜操网爽| 亚洲无线在线观看| 久久久久久久久中文| 嫩草影院精品99| 国产成人一区二区在线| 一个人免费在线观看电影| 欧美日韩瑟瑟在线播放| 欧美zozozo另类| 亚洲av五月六月丁香网| 性插视频无遮挡在线免费观看| 变态另类成人亚洲欧美熟女| 日韩欧美精品免费久久| 国产视频一区二区在线看| 亚洲最大成人手机在线| 欧美一区二区精品小视频在线| 麻豆成人午夜福利视频| 日韩精品青青久久久久久| 国产视频内射| 精品久久久久久久久亚洲 | 搡老岳熟女国产| 亚洲avbb在线观看| 久久久久久久久大av| 天堂网av新在线| 欧美一区二区国产精品久久精品| 亚洲国产日韩欧美精品在线观看| 国产黄色小视频在线观看| 亚洲av五月六月丁香网|