• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于值分布的多智能體分布式深度強化學習算法①

    2022-02-15 06:40:06陳妙云
    計算機系統(tǒng)應(yīng)用 2022年1期
    關(guān)鍵詞:經(jīng)驗深度動作

    陳妙云,王 雷,盛 捷

    (中國科學技術(shù)大學 信息科學與技術(shù)學院,合肥 230027)

    1 引言

    近年來,強化學習在解決一系列順序決策問題上取得了巨大的成功.Minih 等人[1]將深度學習和強化學習結(jié)合起來,提出了深度強化學習,在眾多領(lǐng)域都得到了廣泛的應(yīng)用.比如機器人控制[2],生命科學[3],自動駕駛[4],5G 通信[5],物聯(lián)網(wǎng)[6],車聯(lián)網(wǎng)[7]等.在深度強化學習的基礎(chǔ)上眾多研究者提出了多項改進來提升算法的收斂速度和穩(wěn)定性.然而這些算法的研究和應(yīng)用大多集中在單智能體領(lǐng)域.現(xiàn)實世界中的任務(wù)和場景通常更加復(fù)雜,涉及到多個智能體之間的合作和競爭.比如工廠中的協(xié)作機器人,交通控制系統(tǒng)和自動軍事系統(tǒng)等.將單智能體強化學習算法簡單地移植到多智能體場景中通常會帶來一些問題和挑戰(zhàn)[8].比如單智能體深度強化學習算法無法表征智能體之間的合作與競爭關(guān)系以及智能體之間共同進化導(dǎo)致環(huán)境非平穩(wěn)性的問題.并且多智能體與復(fù)雜場景會帶來計算量大幅提升,算法收斂速度明顯下降等挑戰(zhàn).

    目前,Self-play[9]被證明是一種有效的多智能體訓練范式,并成功的應(yīng)用在了圍棋,象棋以及博弈競爭場景中.Palmer 等人[10]提出了一種基于寬容的DQN 算法,對同伴不合理的行為給予一定的容忍度.Foerster等人[11]提出了反事實的思想,解決了多智能體合作場景中信用分配的問題.這些算法在多智能體場景中都取得了很好的效果.但是只能應(yīng)用在離散動作空間中,并且Self-play 還增加了智能體之間動作集完全一致的限制.Lowe 等人[12]提出了一種集中式訓練,分散式執(zhí)行的算法(multi-agent deep deterministic policy gradient,MA-DDPG),解決了多智能體場景中環(huán)境非平穩(wěn)的問題.并且該算法可以同時應(yīng)用在連續(xù)和離散控制的多智能體場景中,使得應(yīng)用場景更加靈活.

    然而對于復(fù)雜的多智能體場景,目前的多智能體深度強化學習算法還有很多問題沒有解決.智能體動作策略的更新質(zhì)量非常依賴于預(yù)期回報的估計,但是多個智能體與環(huán)境交互時,其內(nèi)在的隨機性會導(dǎo)致預(yù)期回報具有不確定性,現(xiàn)有的方法將預(yù)期回報簡單地平均為期望值則會丟失完整的分布信息,導(dǎo)致智能體不能進行有效的學習.并且現(xiàn)有的方法主要基于單步回報,智能體只考慮當下的收益而忽略未來的信息,從而引發(fā)算法不穩(wěn)定.此外現(xiàn)有方法中經(jīng)驗數(shù)據(jù)生成往往和網(wǎng)絡(luò)更新耦合在一起,導(dǎo)致只能串行處理,難以有效利用更多的計算資源.為此,本文提出了基于值分布的多智能體分布式深度確定性策略梯度算法(multi-agent distributed distributional deep deterministic policy gradient,MA-D4PG),引入值分布的思想[13]對預(yù)期回報的分布建模,避免分布信息丟失,使得智能體能夠獲得更加準確的梯度更新,保證學習的有效性;引入多步回報使得智能體能夠從未來的經(jīng)驗中學習,增加智能體的預(yù)見能力,提高算法的穩(wěn)定性;引入分布式數(shù)據(jù)生成框架(APE-X)[14],將智能體與環(huán)境交互生成經(jīng)驗數(shù)據(jù)部分與網(wǎng)絡(luò)更新解耦,使得經(jīng)驗數(shù)據(jù)生成過程和網(wǎng)絡(luò)更新能夠并行進行,充分利用更多的計算資源.

    在多個不同的連續(xù)/離散控制的多智能體場景中本文算法的穩(wěn)定性和收斂速度都有了極大的提升,智能體的決策能力也有了明顯的增強.最后本文還做了消融實驗展示每個改進各自的貢獻以及相互作用.

    2 相關(guān)工作

    2.1 多智能體馬爾可夫決策過程

    多智能體馬爾可夫決策過程是馬爾可夫決策過程在多智能體場景下的擴展.其同樣由四元組構(gòu)成:

    其中,S表示所有智能體的狀態(tài)集合 {s1,s2,···,sk},k表示智能體的數(shù)量.A表示所有智能體的動作集合{A1,A2,···,Ak}.Pr(S′|S,A) 表示狀態(tài)轉(zhuǎn)移函數(shù),S×A1×···×Ak→P(S′).其中P(S′) 定義了所有智能體的下一個狀態(tài)的概率分布.R表示所有智能體的回報集合 {r1,···,rk}.本文遵循以上符號表示.

    對于每一個智能體i,學習相應(yīng)的動作選擇策略 πi:oi→P(Ai).其中oi表示智能體i的局部觀測,P(Ai) 表示選擇動作的概率分布.

    智能體的目標是學習一個動作選擇策略以最大化預(yù)期回報如下,其中 γ為折現(xiàn)因子.

    2.2 多智能體深度確定性策略梯度

    深度策略梯度算法(deep policy gradient,DPG)[15]是一種非常經(jīng)典的深度強化學習算法.該算法使用神經(jīng)網(wǎng)絡(luò)模擬動作策略函數(shù),通過梯度上升法調(diào)整網(wǎng)絡(luò)參數(shù)以最大化目標函數(shù),如式(3)所示:

    其中,Q(St,At) 表示狀態(tài)動作對的預(yù)期回報的期望值.相應(yīng)的動作策略網(wǎng)絡(luò)的梯度公式如式(4)所示:

    其中,π 表示智能體的隨機動作策略,輸出所有動作的概率分布.

    DDPG (deep deterministic policy gradient)[16]是DPG的一種變體,其中動作策略輸出的是確定性動作而不是所有動作的概率分布.可以應(yīng)用于連續(xù)控制的多智能體場景中,相應(yīng)的動作策略網(wǎng)絡(luò)梯度公式如式(5):

    其中,μ 表示智能體的確定性動作策略.

    而多智能體深度確定性策略梯度算法是DDPG 在多智能體場景的擴展,并且與actor-critic框架相結(jié)合.其中actor 模擬動作選擇策略函數(shù) μ,根據(jù)智能體i的局部觀測oi,輸出動作Ai=μi(oi|θi).critic 模擬動作價值函數(shù)Qi以輸出智能體i某一時刻的狀態(tài)動作對的預(yù)期回報的期望值.Qi是一個集中式的函數(shù),考慮了所有智能體的狀態(tài)動作信息,解決了多智能體場景中智能體共同學習以及相互作用導(dǎo)致的環(huán)境非平穩(wěn).

    在MA-DDPG 算法智能體i的actor 網(wǎng)絡(luò)的梯度公式以及critic 網(wǎng)絡(luò)的損失函數(shù)分別如式(6)和式(7):

    3 基于值分布的多智能體分布式深度確定性策略梯度算法

    本文引入了值分布的思想對預(yù)期回報的分布建模,提出了一種基于值分布的評論家(critic)更新方法;并在此基礎(chǔ)上引入多步回報衡量critic的損失;最后引入了分布式數(shù)據(jù)生成架構(gòu)(APE-X)將智能體與環(huán)境交互生成經(jīng)驗數(shù)據(jù)的部分與網(wǎng)絡(luò)更新解耦.這些將會在本節(jié)進行詳細描述.

    3.1 基于值分布的critic 更新

    基于值的多智能體深度強化學習算法直接對智能體狀態(tài)動作對的預(yù)期回報的期望建模,不考慮智能體與環(huán)境的交互的內(nèi)在隨機性對預(yù)期回報的影響.這種建模方式損失了關(guān)于預(yù)期回報的完整的分布信息.本文引入值分布的思想,強調(diào)預(yù)期回報的分布信息的重要性,對預(yù)期回報的分布建模,而非對其期望值建模.本文將預(yù)期回報看作隨機變量,記為定義如式(8)所示:

    本文使用參數(shù)化的多分類分布對預(yù)期回報的分布建模 {N∈N,Vmin,Vmax∈R},其中N表示分類個數(shù),Vmin表示最小類別值,Vmax表示最大類別值.以此模擬預(yù)期回報的近似分布.其中一系列的類別值分別如式(9):

    在actor-critic的框架下,改進的基于值分布思想的critic 網(wǎng)絡(luò)輸出預(yù)期回報的N分類分布,表示各類預(yù)期回報值的概率分布.記pi,j(St,At)為智能體i的critic網(wǎng)絡(luò)所輸出的預(yù)期回報屬于第j類zj的概率.

    其中,St={s1,t,···,sk,t} 表示所有智能體的狀態(tài)信息,At={A1,t,···,Ak,t}表示所有智能體的動作信息.

    基于值分布的critic的損失函數(shù)定義如式(11)和式 (12):

    以上所述引入了值分布的思想對critic的更新進行改進,相應(yīng)的actor 更新也引入預(yù)期回報的分布信息,本文通過引入Z分布的期望來實現(xiàn),則actor 網(wǎng)絡(luò)更新的梯度公式如式(13)所示:

    3.2 多步回報

    本小節(jié)在第3.1 節(jié)所述的基于值分布的critic 更新的基礎(chǔ)上引入多步回報來計算critic的TD (temporaldifference)誤差.利用多步回報可以使得智能體從未來的經(jīng)驗中學習,而不是只考慮當下的收益.多步回報的思想已經(jīng)廣泛的應(yīng)用在眾多單智能體強化學習算法[17,18]中.類似的修正也可以應(yīng)用在多智能體深度強化學習算法中.基于多步回報的貝爾曼方程定義如式(14)和式(15)所示:

    其中,Ri,t表示時刻t智能體i的N步回報.

    3.3 分布式數(shù)據(jù)生成和網(wǎng)絡(luò)更新

    針對模型耦合度高無法充分利用計算資源的問題,本文引入了分布式數(shù)據(jù)生成的框架(APE-X)將多智能體場景中智能體與環(huán)境交互生成經(jīng)驗數(shù)據(jù)和網(wǎng)絡(luò)更新兩部分進行解耦.負責數(shù)據(jù)生成的部分稱為Actor,負責從經(jīng)驗回放池中采樣數(shù)據(jù)進行網(wǎng)絡(luò)更新的部分稱為Learner.Actor的網(wǎng)絡(luò)結(jié)構(gòu)與Learner 完全一致,只負責與環(huán)境交互得到經(jīng)驗數(shù)據(jù)存入經(jīng)驗回放池中,不執(zhí)行梯度計算進行參數(shù)更新,而是定期復(fù)制Learner的網(wǎng)絡(luò)參數(shù).Learner 只負責從經(jīng)驗回放池中采樣數(shù)據(jù)進行網(wǎng)絡(luò)更新而不負責與環(huán)境進行交互.本文算法并行運行多個獨立的Actor,分別與環(huán)境進行交互得到經(jīng)驗數(shù)據(jù){St+1-N,At+1-N,Rt+1-N,St+1},寫入同一個經(jīng)驗緩沖池中.Learner 從該經(jīng)驗緩沖池中隨機采樣M批經(jīng)驗數(shù)據(jù)進行網(wǎng)絡(luò)更新.具體的算法框架圖如圖1所示.其中St+1-N={s1,t+1-N,···,sk,t+1-N},At+1-N={A1,t+1-N,···,Ak,t+1-N},Rt+1-N={R1,t+1-N,···,Rk,t+1-N}.

    圖1 分布式數(shù)據(jù)生成框架示意圖

    3.4 本文算法小結(jié)

    本文算法的偽代碼如算法1和算法2 所示.Learner中actor-critic的網(wǎng)絡(luò)都采用梯度下降法進行網(wǎng)絡(luò)參數(shù)更新.actor和critic的學習率分別是αt,βt,均采用Adam優(yōu)化器[19],利用動量和自適應(yīng)學習率來加快收斂速度.該算法偽代碼中同時包含了Actor和Learner的偽代碼,多個Actor 初始化為相同的多智能體環(huán)境,并行與環(huán)境交互生成經(jīng)驗數(shù)據(jù)并將其存入經(jīng)驗回放池中.

    算法1.經(jīng)驗數(shù)據(jù)生成-Actor 1)初始化 值,智能體數(shù)量K,經(jīng)驗回放池B,初始化軟更新頻率TAU(θ1:k N Actor,ω1:kActor)←(θ1:kLearner,ω1:kLearner)2)初始化Actor 網(wǎng)絡(luò)參數(shù)3)初始化States,Actions,Rewards,Terminals為大小為的deque j=1,···,Episode_num N+1 4)For do 5)Clear (States,Actions,Rewards,Terminals)S 0←6)Env.Reset()S 0 7)States.Add()t=1,···,max_step 8)For do A1,t-1,···,Ak,t-1←μ1(s1,t-1),···,μk(sk,t-1)9)r1,t-1,···,rk,t-1,S t,termt← At-1+OU 10)Env.Step()11)States.Add()At-1 S t Actions.Add(){r1,t-1,···,rk,t-1}Rewards.Add()termt Terminals.Add()12)If States.full then NRt-N 13)根據(jù)式(15)計算 步回報14)B.Add(States[0],Actions[0],Rt-N States[N],Terminals[N–1])15)PopLeft(States,Actions,Rewards,Terminals)16)End If termt 17)If break 18)End For 19)End For

    算法2.網(wǎng)絡(luò)更新-Learner 1)初始化采樣批次M,最大更新步數(shù)T(θ1:k Learner,ω1:kLearner)2)隨機初始化網(wǎng)絡(luò)參數(shù)target,ω1:ktarget)←(θ1:kLearner,ω1:kLearner)3)初始化目標網(wǎng)絡(luò)參數(shù)(θ1:k 4)For do BM t=1,···,T 5)If len()

    4 實驗分析

    本文設(shè)置了3 個實驗場景來測試本文算法(MAD4PG)的性能,將在本節(jié)依次描述.在實驗中設(shè)置了一個額外的Actor.該Actor 只利用,而不進行探索,方便在沒有噪聲的情況下測試本文算法的性能.其他Actor 則負責探索環(huán)境,獲得更多關(guān)于環(huán)境的信息,并且與環(huán)境交互生成經(jīng)驗數(shù)據(jù).Learner 每更新N步,將網(wǎng)絡(luò)參數(shù)復(fù)制給Actor.本文將N值設(shè)為5.為了加快訓練模型以及更好的利用資源,Learner 模型在GPU上進行運算,Actor 在CPU 進行運算.強化學習算法性能評價的兩個關(guān)鍵指標是算法收斂所需的步數(shù)以及最終收斂的Episode Reward 值.收斂所需的步數(shù)越少,表示算法的收斂速度越快,最終的收斂的Episode Reward值越大,表示智能體的學習效果越好.本文將根據(jù)這兩個指標對本文算法進行評價.并且本文還做了一些消融實驗,分別刪除本文算法中的單項組件,以確定其特定的貢獻.

    1×106

    本文實驗中統(tǒng)一使用大小為經(jīng)驗重放池存儲智能體與環(huán)境交互產(chǎn)生的經(jīng)驗數(shù)據(jù).為確保一定的探索性,在智能體的動作策略中添加Ornstein-Uhlenbeck噪聲[19].并且本文實驗中actor和critic的學習率以及采樣批次大小,軟更新頻率統(tǒng)一設(shè)置如下:

    α=5×10-5,β=5×10-5,M=256,TAU=0.001

    4.1 實驗環(huán)境配置

    本文算法中實驗環(huán)境的配置如表1所示.本文采用了PyTorch 作為深度學習框架,在GPU 上使CUDNN加速訓練模型.

    表1 本文實驗環(huán)境配置

    4.2 實驗場景

    本文實驗包含了3 個實驗場景,如圖2所示.這3 個實驗場景分別是多智能體合作清潔,多無人機監(jiān)控,多智能體救援.本節(jié)將對這3 個實驗場景進行簡單描述.

    在多智能體清潔場景中,兩個或者多個智能體將合作打掃一個房間,實驗場景如圖2(a)所示.環(huán)境中智能體的任務(wù)是在規(guī)定的時間內(nèi)盡量擴大清潔面積,或者是在最短的時間內(nèi)盡量清潔完所有的區(qū)域.該任務(wù)實際上是一個路徑規(guī)劃任務(wù),智能體之間應(yīng)該合作規(guī)劃具有最小重疊區(qū)域的路徑.每個智能體的局部觀測由周圍8 個方塊的狀態(tài)組成,一共8 維.動作空間是1 維,可以朝上下左右4 個方向移動.

    圖2 實驗場景示意圖

    多無人機監(jiān)控實驗場景如圖2(b)所示.正方形區(qū)域表示地面,空中有多個無人機使用攝像頭監(jiān)控地面,無人機可以在給定區(qū)域自由飛行.每架無人機都有一個由半徑定義的局部觀測區(qū)域(如圖2(c)所示),無人機只能觀測到該區(qū)域內(nèi)的物體.在該實驗場景中,多個智能體(無人機)的目標是盡量減少視覺區(qū)域的重疊以及監(jiān)控更多的行人.每個智能體的動作空間包含朝上下左右4 個方向移動以及停留原地5 個動作.

    多智能體救援實驗場景如圖2(d)所示.方形區(qū)域模擬地震后的廢墟.多個智能體從安全點出發(fā),進入該區(qū)域,找到該區(qū)域的人并帶回安全點.該任務(wù)的目標是智能體盡可能在更短的時間內(nèi)將更多的人帶回安全點.每個智能體的局部觀測范圍是其前方90 度的扇形區(qū)域,半徑為3 個方塊的長度.智能體的動作空間維度大小為4,分別表示沿x軸方向行走 [-0.5,0.5],沿y軸方向行走 [-0.5,0.5],旋轉(zhuǎn) [-10,10],背起/放下人 {0,1,2}.

    3個實驗場景中的超參數(shù)如表2所示.

    表2 本文實驗場景的超參數(shù)

    4.3 實驗結(jié)果分析

    在框架上,本文較多借鑒了目前性能最好的多智能體深度強化學習算法-多智能體深度確定性策略梯度算法,因此選擇與該算法進行對比實驗.此外還進行了消融實驗,分別確定本文所提每個方法的貢獻.圖3展示了本文算法(MA-D4PG) 以及3 個消融實驗和MA-DDPG 在該實驗環(huán)境中的性能.其中MAD4PG-no distributional 所示曲線表示本文算法去掉第3.1 節(jié)所述改進后的運行效果,MAD4PG-no multistep 所示曲線表示本文算法去掉3.2 節(jié)所述改進的運行效果,MAD4PGno distributed 所示曲線表示本文算法去掉第3.3 節(jié)所述改進的運行效果.

    從圖3(a)中可看到在多智能體合作清潔的場景中,本文算法MA-D4PG 在收斂速度和最終收斂的Episode Reward 值這兩個指標上都有最好的表現(xiàn),并且算法的穩(wěn)定性更好.對MAD4PG-no distributional/MAD4PG-no distributed 這兩條曲線進行分析可看出,第3.1 節(jié)和第3.3 節(jié)所述的改進對算法最后收斂的Episode Reward值的提升雖不太明顯,但是加快了算法的收斂速度.

    對圖3(b)進行分析可得,在多人機監(jiān)控場景中,相較MA-DDPG 算法,本文算法(MA-D4PG)收斂速度較慢,但是最終收斂的Episode Reward 值約是MA-DDPG的3.6 倍,智能體的決策能力得到了極大地增強.對MAD4PG-no distributional/MAD4PG-no distributed 分析可得,第3.1 節(jié)和第3.3 節(jié)所述改進使得最終收斂的Episode Reward值分別提升了約97%和43%.

    對圖3(c)分析可得,在多智能體救援場景中,本文算法(MA-D4PG)的收斂速度約是MA-DDPG 算法的3.75 倍.對MAD4PG-no multistep/MAD4PG-no distributed 兩條曲線分析可得,第3.2 節(jié)和第3.3 節(jié)所述改進使得算法的收斂速度分別提升了約185%和100%.

    對圖3(a),圖3(b)的MAD4PG-no multistep 曲線聯(lián)合分析可看出,去掉多步回報的改進,算法性能下降最大,并且去掉該改進會導(dǎo)致算法的穩(wěn)定性顯著下降.這兩個實驗場景中智能體只包含一維的離散動作空間,控制任務(wù)相對簡單.從中可看出在離散控制的多智能體場景中,引入多步回報對算法性能的貢獻最大,而第3.1 節(jié)和第3.3 節(jié)所述改進之間的互補作用較小.

    圖3 本文算法性能對比圖

    對圖3(c)的MAD4PG-no distributional 曲線分析可得,去掉值分布的改進,算法的收斂速度降低最大,并且算法的穩(wěn)定性也有一定的下降.該實驗環(huán)境中的控制任務(wù)比較復(fù)雜,既包含連續(xù)動作,又包含離散動作,而前兩個實驗場景中智能體只包含一維的離散動作空間.從中可看出在復(fù)雜的控制任務(wù)中,引入值分布對算法性能的貢獻最為突出.

    5 結(jié)論與展望

    本文的主要貢獻是提出了一種基于值分布的多智能體分布式策略梯度算法,利用值分布替代期望值,進一步區(qū)分智能體行為的好壞,而不是簡單地將其平均為期望值;同時引入了多步回報增加智能體的預(yù)見能力,提高算法穩(wěn)定性;此外引入了分布式數(shù)據(jù)生成框架將多智能體場景中智能體與環(huán)境交互生成經(jīng)驗數(shù)據(jù)和網(wǎng)絡(luò)更新解耦,加快算法的收斂.本文算法在3 個實驗場景中都實現(xiàn)了最好的性能.這3 項改進都有助于提升本文算法(MA-D4PG)的整體性能,在前兩個實驗場景中對性能貢獻最大的改進是多步回報.而在復(fù)雜的任務(wù)場景中,值分布的貢獻變得更加突出.本文的實驗場景都是基于多智能體合作的場景,接下來的研究工作是在競爭場景甚至既有合作又有競爭的混合場景中研究本文算法的性能.

    猜你喜歡
    經(jīng)驗深度動作
    2021年第20期“最值得推廣的經(jīng)驗”評選
    黨課參考(2021年20期)2021-11-04 09:39:46
    深度理解一元一次方程
    經(jīng)驗
    深度觀察
    深度觀察
    2018年第20期“最值得推廣的經(jīng)驗”評選
    黨課參考(2018年20期)2018-11-09 08:52:36
    深度觀察
    動作描寫要具體
    畫動作
    動作描寫不可少
    国产男人的电影天堂91| 亚洲av在线观看美女高潮| 亚洲精品国产色婷婷电影| 久久99一区二区三区| 少妇精品久久久久久久| 国产1区2区3区精品| 哪个播放器可以免费观看大片| av视频免费观看在线观看| 男女无遮挡免费网站观看| 99久久人妻综合| 一本大道久久a久久精品| 国产精品嫩草影院av在线观看| 欧美成人午夜精品| 中文字幕免费在线视频6| 久久久久久久大尺度免费视频| 国产老妇伦熟女老妇高清| 久久人人爽人人爽人人片va| 街头女战士在线观看网站| 天天躁夜夜躁狠狠久久av| 亚洲精华国产精华液的使用体验| 国产日韩欧美视频二区| 亚洲色图综合在线观看| 中文字幕精品免费在线观看视频 | 精品国产国语对白av| 人人妻人人添人人爽欧美一区卜| 成人无遮挡网站| 天堂8中文在线网| 搡女人真爽免费视频火全软件| 婷婷色综合大香蕉| 天天躁夜夜躁狠狠久久av| 在线看a的网站| 国产极品天堂在线| 香蕉国产在线看| 免费播放大片免费观看视频在线观看| 国产精品秋霞免费鲁丝片| 97在线视频观看| 菩萨蛮人人尽说江南好唐韦庄| av在线观看视频网站免费| 深夜精品福利| 久久精品国产a三级三级三级| 人妻少妇偷人精品九色| 国产无遮挡羞羞视频在线观看| 伊人久久国产一区二区| 又黄又爽又刺激的免费视频.| 秋霞伦理黄片| 成人午夜精彩视频在线观看| 欧美+日韩+精品| 欧美+日韩+精品| 国产精品.久久久| 久久久久国产网址| 美女脱内裤让男人舔精品视频| 成年人免费黄色播放视频| 国产精品蜜桃在线观看| 亚洲av综合色区一区| 亚洲国产毛片av蜜桃av| 亚洲,欧美,日韩| 永久网站在线| 午夜av观看不卡| 国产亚洲欧美精品永久| 久久精品久久精品一区二区三区| 久久韩国三级中文字幕| 日韩欧美精品免费久久| 国产亚洲精品久久久com| 国产亚洲一区二区精品| 亚洲精品一区蜜桃| 国产精品国产av在线观看| 国产精品.久久久| 精品熟女少妇av免费看| 午夜福利在线观看免费完整高清在| 国产成人精品久久久久久| 亚洲精品乱码久久久久久按摩| 免费人妻精品一区二区三区视频| 中文欧美无线码| 国产精品成人在线| 久久久久精品久久久久真实原创| 爱豆传媒免费全集在线观看| 一级毛片电影观看| 国精品久久久久久国模美| 人人妻人人添人人爽欧美一区卜| 毛片一级片免费看久久久久| 一区二区三区四区激情视频| 国产老妇伦熟女老妇高清| 99热这里只有是精品在线观看| 欧美 日韩 精品 国产| 久久久久久久大尺度免费视频| 久久久久久久亚洲中文字幕| 欧美变态另类bdsm刘玥| 亚洲中文av在线| 国产熟女欧美一区二区| 国产永久视频网站| 国产永久视频网站| 十八禁高潮呻吟视频| 80岁老熟妇乱子伦牲交| 国产淫语在线视频| 亚洲在久久综合| 久久久久久久久久成人| 考比视频在线观看| 又黄又爽又刺激的免费视频.| 午夜影院在线不卡| 夜夜爽夜夜爽视频| 18+在线观看网站| 99re6热这里在线精品视频| 人体艺术视频欧美日本| 亚洲av中文av极速乱| 免费在线观看黄色视频的| 国产熟女午夜一区二区三区| 美女主播在线视频| 菩萨蛮人人尽说江南好唐韦庄| 丰满迷人的少妇在线观看| 一区二区三区四区激情视频| 又粗又硬又长又爽又黄的视频| 亚洲av日韩在线播放| 大香蕉久久网| 国产一区二区三区综合在线观看 | 在线观看免费日韩欧美大片| 搡女人真爽免费视频火全软件| 一区二区av电影网| 18禁裸乳无遮挡动漫免费视频| 国产亚洲午夜精品一区二区久久| 男女高潮啪啪啪动态图| 天堂8中文在线网| 一区二区三区四区激情视频| 久久97久久精品| 最后的刺客免费高清国语| 亚洲国产最新在线播放| 少妇人妻精品综合一区二区| 久久精品国产a三级三级三级| 日韩欧美一区视频在线观看| 久久久国产精品麻豆| 在线天堂最新版资源| 亚洲欧美精品自产自拍| 久久免费观看电影| 国产精品国产三级专区第一集| 男女边摸边吃奶| 久久99精品国语久久久| 两性夫妻黄色片 | 热re99久久国产66热| 久久人人爽人人片av| av在线老鸭窝| 亚洲精华国产精华液的使用体验| 久久精品人人爽人人爽视色| a级毛片黄视频| 国产 精品1| 女人被躁到高潮嗷嗷叫费观| 秋霞伦理黄片| 色94色欧美一区二区| 久久鲁丝午夜福利片| 亚洲,欧美,日韩| 亚洲,欧美精品.| 考比视频在线观看| 精品视频人人做人人爽| 久久国产精品男人的天堂亚洲 | 免费观看av网站的网址| 国产高清不卡午夜福利| 成人亚洲精品一区在线观看| 十八禁网站网址无遮挡| 亚洲精品aⅴ在线观看| av福利片在线| 91久久精品国产一区二区三区| 精品国产国语对白av| 日韩一区二区三区影片| 久久精品熟女亚洲av麻豆精品| 日韩熟女老妇一区二区性免费视频| 国产永久视频网站| 国产精品三级大全| a级毛片黄视频| 日韩视频在线欧美| 亚洲av中文av极速乱| 免费观看无遮挡的男女| 国产xxxxx性猛交| 只有这里有精品99| 最近手机中文字幕大全| 精品人妻熟女毛片av久久网站| av片东京热男人的天堂| 99热这里只有是精品在线观看| 国产免费现黄频在线看| 九色成人免费人妻av| 啦啦啦啦在线视频资源| 插逼视频在线观看| 天堂8中文在线网| 极品少妇高潮喷水抽搐| 午夜av观看不卡| 一级毛片我不卡| 国产av一区二区精品久久| 日本午夜av视频| 国产在视频线精品| 18+在线观看网站| 日韩不卡一区二区三区视频在线| 人妻系列 视频| 十八禁网站网址无遮挡| 一边亲一边摸免费视频| 高清毛片免费看| 国产精品 国内视频| 日日爽夜夜爽网站| 精品视频人人做人人爽| 日本wwww免费看| a 毛片基地| 大香蕉久久网| 两个人看的免费小视频| 夜夜爽夜夜爽视频| 看非洲黑人一级黄片| 国产老妇伦熟女老妇高清| 免费看光身美女| 国产一区亚洲一区在线观看| 欧美亚洲日本最大视频资源| 精品人妻偷拍中文字幕| 日日爽夜夜爽网站| 免费看不卡的av| 精品国产一区二区久久| 熟女人妻精品中文字幕| 最近中文字幕2019免费版| av一本久久久久| 久久精品国产a三级三级三级| 天天躁夜夜躁狠狠久久av| 免费观看无遮挡的男女| 国产精品人妻久久久久久| 免费播放大片免费观看视频在线观看| 麻豆精品久久久久久蜜桃| 99精国产麻豆久久婷婷| 色视频在线一区二区三区| 日本欧美视频一区| 国产麻豆69| 少妇熟女欧美另类| 中文字幕另类日韩欧美亚洲嫩草| 久久精品久久精品一区二区三区| 午夜免费男女啪啪视频观看| 爱豆传媒免费全集在线观看| 高清毛片免费看| 亚洲精品自拍成人| 中文字幕精品免费在线观看视频 | 性色avwww在线观看| 日韩在线高清观看一区二区三区| 亚洲美女视频黄频| 好男人视频免费观看在线| 水蜜桃什么品种好| 老司机影院成人| 99热这里只有是精品在线观看| 日本黄色日本黄色录像| 亚洲伊人久久精品综合| 亚洲成人手机| 女的被弄到高潮叫床怎么办| 亚洲成av片中文字幕在线观看 | 日韩在线高清观看一区二区三区| freevideosex欧美| 成人18禁高潮啪啪吃奶动态图| 少妇熟女欧美另类| 亚洲成av片中文字幕在线观看 | 国产成人精品无人区| 免费久久久久久久精品成人欧美视频 | 欧美 日韩 精品 国产| 男女免费视频国产| 丰满少妇做爰视频| videosex国产| 啦啦啦中文免费视频观看日本| 日本91视频免费播放| 国产黄频视频在线观看| 国产成人aa在线观看| 欧美日韩综合久久久久久| 综合色丁香网| 中国美白少妇内射xxxbb| 在线观看三级黄色| 免费黄频网站在线观看国产| 亚洲美女视频黄频| 欧美成人精品欧美一级黄| 国产永久视频网站| 国产老妇伦熟女老妇高清| 久久久国产精品麻豆| 久久热在线av| 97超碰精品成人国产| 亚洲一级一片aⅴ在线观看| 久久久久久人人人人人| 香蕉国产在线看| 欧美日韩av久久| 人体艺术视频欧美日本| 国产成人免费无遮挡视频| 少妇被粗大的猛进出69影院 | 国产精品蜜桃在线观看| 性色av一级| av.在线天堂| 91精品国产国语对白视频| 一区二区日韩欧美中文字幕 | 免费黄网站久久成人精品| 亚洲精品视频女| 我要看黄色一级片免费的| 久久久久国产网址| 观看美女的网站| 考比视频在线观看| 五月玫瑰六月丁香| 精品亚洲成国产av| 日本wwww免费看| 国产成人欧美| 波多野结衣一区麻豆| 九色亚洲精品在线播放| 人成视频在线观看免费观看| 成年人午夜在线观看视频| 国产精品一区二区在线观看99| 天堂8中文在线网| 午夜视频国产福利| 精品久久国产蜜桃| 青春草视频在线免费观看| 亚洲av男天堂| videos熟女内射| 免费在线观看黄色视频的| 性色av一级| 1024视频免费在线观看| 51国产日韩欧美| 日本黄大片高清| av国产久精品久网站免费入址| 亚洲国产日韩一区二区| 窝窝影院91人妻| 欧美黄色片欧美黄色片| 丰满人妻熟妇乱又伦精品不卡| 巨乳人妻的诱惑在线观看| 操美女的视频在线观看| 亚洲av成人不卡在线观看播放网| 久久久精品国产亚洲av高清涩受| 嫩草影视91久久| 香蕉国产在线看| 中文亚洲av片在线观看爽 | 久久久久久人人人人人| 99香蕉大伊视频| 久久久精品区二区三区| 国产黄色免费在线视频| 麻豆乱淫一区二区| 大香蕉久久成人网| 妹子高潮喷水视频| 欧美乱妇无乱码| 黑人巨大精品欧美一区二区mp4| 久久精品国产亚洲av高清一级| 亚洲一区二区三区不卡视频| 丝袜美腿诱惑在线| 9191精品国产免费久久| 叶爱在线成人免费视频播放| 欧美乱码精品一区二区三区| 欧美激情高清一区二区三区| 不卡av一区二区三区| 亚洲性夜色夜夜综合| 中文字幕av电影在线播放| 一二三四社区在线视频社区8| 国产人伦9x9x在线观看| 99热只有精品国产| 精品国产乱子伦一区二区三区| 宅男免费午夜| 国产成人av激情在线播放| 国产欧美日韩一区二区三| 亚洲avbb在线观看| 精品一品国产午夜福利视频| 黑人猛操日本美女一级片| avwww免费| 高清av免费在线| 搡老岳熟女国产| 亚洲精品乱久久久久久| 精品一区二区三卡| 国产精品欧美亚洲77777| 日韩 欧美 亚洲 中文字幕| 久久久久国产一级毛片高清牌| 天天躁狠狠躁夜夜躁狠狠躁| 中文字幕色久视频| 国产又爽黄色视频| 日韩欧美在线二视频 | 99精品在免费线老司机午夜| 大香蕉久久网| 精品卡一卡二卡四卡免费| 五月开心婷婷网| 看片在线看免费视频| 久久久水蜜桃国产精品网| 欧美最黄视频在线播放免费 | 男女免费视频国产| 国产乱人伦免费视频| 天天操日日干夜夜撸| 手机成人av网站| 欧美在线一区亚洲| 精品少妇一区二区三区视频日本电影| 黄片大片在线免费观看| 黄色 视频免费看| 国产欧美日韩一区二区精品| 亚洲 国产 在线| 女警被强在线播放| 国产男靠女视频免费网站| 国产亚洲欧美98| 无遮挡黄片免费观看| 亚洲一区高清亚洲精品| 国产淫语在线视频| 中文字幕最新亚洲高清| 十八禁网站免费在线| 免费在线观看日本一区| 国产成人精品在线电影| 欧美人与性动交α欧美软件| 亚洲黑人精品在线| 亚洲成人免费电影在线观看| 国产熟女午夜一区二区三区| 日韩欧美国产一区二区入口| 亚洲免费av在线视频| 亚洲国产精品sss在线观看 | 两个人看的免费小视频| 久久久水蜜桃国产精品网| 日日爽夜夜爽网站| 久久国产精品大桥未久av| 欧美日韩国产mv在线观看视频| 黑丝袜美女国产一区| 91九色精品人成在线观看| 国产亚洲精品久久久久5区| 色婷婷久久久亚洲欧美| 一边摸一边抽搐一进一小说 | 两人在一起打扑克的视频| av中文乱码字幕在线| 国产成人欧美在线观看 | 夜夜躁狠狠躁天天躁| 日本黄色日本黄色录像| 亚洲午夜理论影院| 满18在线观看网站| 黑人巨大精品欧美一区二区mp4| 男人的好看免费观看在线视频 | 久久久久久久午夜电影 | 国产精品久久久av美女十八| 欧美国产精品一级二级三级| 美女高潮喷水抽搐中文字幕| 国产1区2区3区精品| 黑丝袜美女国产一区| 两性午夜刺激爽爽歪歪视频在线观看 | 高清黄色对白视频在线免费看| 一边摸一边抽搐一进一出视频| 日韩人妻精品一区2区三区| 一级黄色大片毛片| 亚洲一卡2卡3卡4卡5卡精品中文| 久久精品国产a三级三级三级| 亚洲一区高清亚洲精品| 久久久精品免费免费高清| 精品第一国产精品| 成人免费观看视频高清| 久久精品亚洲熟妇少妇任你| 麻豆av在线久日| 亚洲精品国产区一区二| 亚洲欧美激情综合另类| 久久精品熟女亚洲av麻豆精品| 国产人伦9x9x在线观看| 亚洲精品国产精品久久久不卡| 欧美日韩国产mv在线观看视频| 亚洲精品中文字幕一二三四区| 欧美精品亚洲一区二区| 麻豆国产av国片精品| 久久精品国产a三级三级三级| 少妇的丰满在线观看| 亚洲片人在线观看| 岛国毛片在线播放| svipshipincom国产片| 亚洲av美国av| 色播在线永久视频| cao死你这个sao货| 女性被躁到高潮视频| 这个男人来自地球电影免费观看| 久久久久久人人人人人| 久久精品国产99精品国产亚洲性色 | 老司机午夜福利在线观看视频| 成年动漫av网址| 91大片在线观看| 国产一区二区激情短视频| 美国免费a级毛片| 欧美精品人与动牲交sv欧美| 国产无遮挡羞羞视频在线观看| 美女 人体艺术 gogo| 一级a爱片免费观看的视频| 午夜成年电影在线免费观看| 日本黄色日本黄色录像| 一本大道久久a久久精品| 中亚洲国语对白在线视频| 国产成人欧美| 女人被狂操c到高潮| 久热这里只有精品99| 高潮久久久久久久久久久不卡| 色94色欧美一区二区| 亚洲专区字幕在线| 18禁裸乳无遮挡免费网站照片 | 欧美成狂野欧美在线观看| 婷婷成人精品国产| 国产成人免费观看mmmm| 日韩欧美一区视频在线观看| 日日夜夜操网爽| 国产伦人伦偷精品视频| 一边摸一边做爽爽视频免费| 国产极品粉嫩免费观看在线| 欧美在线黄色| 人人妻人人添人人爽欧美一区卜| 亚洲av电影在线进入| 欧美日韩av久久| 69精品国产乱码久久久| 亚洲第一av免费看| 亚洲精品国产一区二区精华液| 国产真人三级小视频在线观看| 欧美中文综合在线视频| 国产一区二区激情短视频| 欧美精品啪啪一区二区三区| 午夜精品在线福利| 久久国产亚洲av麻豆专区| 中文字幕另类日韩欧美亚洲嫩草| 国产亚洲精品久久久久久毛片 | 国产又色又爽无遮挡免费看| 精品少妇久久久久久888优播| 国内毛片毛片毛片毛片毛片| 亚洲中文字幕日韩| 亚洲人成电影免费在线| 一a级毛片在线观看| 午夜免费鲁丝| а√天堂www在线а√下载 | 在线av久久热| 亚洲,欧美精品.| 韩国av一区二区三区四区| 一级,二级,三级黄色视频| 12—13女人毛片做爰片一| 亚洲第一欧美日韩一区二区三区| 日本精品一区二区三区蜜桃| 国产精品久久久久成人av| 久久精品亚洲av国产电影网| 免费黄频网站在线观看国产| 9色porny在线观看| 中文字幕另类日韩欧美亚洲嫩草| 动漫黄色视频在线观看| 女人被狂操c到高潮| 在线免费观看的www视频| 精品久久久精品久久久| 国产成人影院久久av| 亚洲伊人色综图| 国产高清videossex| 91成年电影在线观看| 国产精品一区二区精品视频观看| 国产成人av教育| 黄色女人牲交| 黑人操中国人逼视频| 丝袜人妻中文字幕| 国产野战对白在线观看| 久久热在线av| 久久人妻熟女aⅴ| 亚洲精品中文字幕在线视频| 婷婷丁香在线五月| 国产一区二区三区综合在线观看| 国产精品国产高清国产av | 国产一区在线观看成人免费| 人妻丰满熟妇av一区二区三区 | 午夜91福利影院| 18在线观看网站| 免费看a级黄色片| 久久热在线av| 日本a在线网址| 美女视频免费永久观看网站| 亚洲综合色网址| 天堂√8在线中文| 欧美激情久久久久久爽电影 | 一区二区三区精品91| 色在线成人网| 精品国产乱子伦一区二区三区| 亚洲国产精品一区二区三区在线| 黄色 视频免费看| 欧美日韩亚洲国产一区二区在线观看 | 精品福利永久在线观看| 成人国产一区最新在线观看| 欧美精品av麻豆av| 中文字幕另类日韩欧美亚洲嫩草| 国产一区二区三区视频了| 亚洲综合色网址| 美女高潮到喷水免费观看| 午夜激情av网站| 亚洲欧美激情综合另类| 午夜福利,免费看| 欧美国产精品va在线观看不卡| 亚洲色图 男人天堂 中文字幕| 午夜福利欧美成人| 热re99久久国产66热| 国产成人影院久久av| 久久久国产欧美日韩av| 久久青草综合色| 国产精品 国内视频| 十八禁高潮呻吟视频| 人人澡人人妻人| 亚洲欧美一区二区三区黑人| 精品电影一区二区在线| 欧美精品av麻豆av| 久久人妻熟女aⅴ| ponron亚洲| 高清在线国产一区| 欧美日韩乱码在线| 老熟妇仑乱视频hdxx| 国内久久婷婷六月综合欲色啪| 叶爱在线成人免费视频播放| 国产成人欧美| 丰满人妻熟妇乱又伦精品不卡| 亚洲九九香蕉| 国产成人欧美| 国内久久婷婷六月综合欲色啪| 国内毛片毛片毛片毛片毛片| 悠悠久久av| 黑人猛操日本美女一级片| 欧美日韩亚洲综合一区二区三区_| 丝袜在线中文字幕| 日韩欧美在线二视频 | 麻豆乱淫一区二区| 精品欧美一区二区三区在线| videosex国产| 久久久久久免费高清国产稀缺| 亚洲avbb在线观看| 极品教师在线免费播放| 飞空精品影院首页| 在线播放国产精品三级| 男女之事视频高清在线观看| 国产精品综合久久久久久久免费 | 91国产中文字幕| 久久精品熟女亚洲av麻豆精品| 黑人操中国人逼视频| 国产欧美日韩一区二区精品| 黄色女人牲交| 99国产精品一区二区三区| 热99re8久久精品国产| 日韩欧美三级三区| 欧美日韩精品网址| 久久久久久亚洲精品国产蜜桃av| 亚洲av成人av|