• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    Fast-PPO:最優(yōu)基線法的近端策略優(yōu)化算法

    2020-07-13 06:15:58陳佳黎劉保生楊郭鑣
    小型微型計算機系統(tǒng) 2020年7期
    關(guān)鍵詞:基線梯度函數(shù)

    肖 竹,謝 寧,陳佳黎,劉保生,姜 峰,楊郭鑣

    (電子科技大學 未來媒體中心 計算機科學與工程學院,成都 611731)

    1 引 言

    最近,針對強化學習(RL)提出了幾種不同的神經(jīng)網(wǎng)絡(luò)函數(shù)逼近算法[1,2].主要的常用算法有深度Q學習[3,4],Vanilla策略梯度(PG)[5],信任區(qū)域策略梯度(TRPO)[6]和近端策略優(yōu)化算法[7].Q學習算法[8,9]可以很好地應(yīng)用在動作離散的學習環(huán)境中,但不能在動作連續(xù)控制的基礎(chǔ)上表現(xiàn)良好.Vanilla策略梯度方法在數(shù)據(jù)效率和魯棒性方面都較差.信任區(qū)域策略梯度算法[6]相對復(fù)雜,與包含噪聲或參數(shù)共享的架構(gòu)不兼容.近端策略優(yōu)化算法使用懲罰來改進過大的優(yōu)化,在信任區(qū)域策略梯度算法方法的基礎(chǔ)上獲得更好的采樣復(fù)雜性[10].

    由于近端策略優(yōu)化算法是一種新的強化學習的策略梯度(PG)方法[11],因此可以采用提高策略梯度方法效率的手段來改進近端策略優(yōu)化算法,包括基于參數(shù)的探索和最佳基線[12],我們選擇使用最佳基線來提高效率.我們的想法啟發(fā)于最先進的策略梯度方法、策略梯度和基于參數(shù)的勘探(PGPE)以及最佳基線減分(將方差正則化技術(shù)與基于參數(shù)的勘探和最佳基線相結(jié)合)[12].在實踐中,在策略梯度方法中使用了最佳基線,從經(jīng)驗上幫助發(fā)現(xiàn)策略更新的正確方向.

    NPC(Non-Player Character)行為的傳統(tǒng)做法是通過腳本或行為樹來操縱的.冗長的規(guī)則表通過分析NPC周圍環(huán)境的信息來確定其下一個行為.然而,隨著游戲的更新、設(shè)計和維護,調(diào)整這些規(guī)則表是非常耗時的.就最近強化學習算法的實際應(yīng)用而言,強化學習與神經(jīng)網(wǎng)絡(luò)的結(jié)合[13]廣泛應(yīng)用于NPC在視頻游戲中的智能決策,通過在NPC達到其預(yù)期目標時提供獎勵來訓練,并非手動定義觀察到的動作圖.例如,Wu和Tian[14]將卷積神經(jīng)網(wǎng)絡(luò)(CNN)部署到A3C中,在部分可觀測的3D環(huán)境中訓練一個智能對象,從最近的四個原始幀和游戲變量中,根據(jù)課程學習[15]的方法,從簡單的任務(wù)開始,逐步過渡到更難的任務(wù),預(yù)測下一步行動和價值函數(shù).

    因此,我們將提出的強化學習算法用來控制NPC在游戲中的行為,以證明我們提出的方法比其他方法更有效.實驗分為三個階段.第一階段,四個強化學習算法(Fast-PPO、PPO[7]、PG[16]、R-PGPEOB[17])都在同一個游戲中使用.我們可以看到,無論環(huán)境是離散空間還是連續(xù)空間,F(xiàn)ast-PPO和PPO算法都是有效的.但PG和PGPE只能用于連續(xù)空間.在第二階段,我們設(shè)計了一個網(wǎng)球賽,F(xiàn)ast-PPO和PPO控制兩個球拍.我們提出的Fast-PPO算法控制的球拍可以獲得比其他算法更高的分數(shù).因為,F(xiàn)ast-PPO比PPO具有更快的收斂速度和更高的回報.第三階段,采用Fast-PPO算法訓練一只狗獲取一根木棍,證明了我們提出的強化學習算法的通用性.

    2 預(yù)備知識

    2.1 策略梯度法

    策略梯度法[11]通過計算策略梯度的估計量并將其插入隨機梯度上升算法來工作.策略梯度(PG)算法可以學習隨機策略,設(shè)計策略的目標函數(shù),通過梯度下降算法對參數(shù)進行優(yōu)化,最后進行獎勵.假設(shè)軌跡為τ=(s0,a0,r0,…,sT-1,aT-1,rT-1),at是當前動作,st是當前狀態(tài),這是一個完整的事件狀態(tài)、行動和獎勵,通常的策略梯度算子形式如下:

    JPG=t[R]

    (1)

    θJPG=t[θlogπθ(at|st)R]

    (2)

    2.2 正則化策略梯度法

    當總回報R較大時,軌跡τ的發(fā)生概率增加,當總回報R較小時,軌跡τ的發(fā)生概率減小.同時為了進一步減小梯度估計的方差,趙婷婷等人[17]提出正則化策略梯度算法R-PGPEOB,策略梯度的形式為:

    (3)

    V(θ)=Varθ[Rθlogπθ(at|st)]

    (4)

    2.3 近端策略優(yōu)化算法

    (5)

    LCPI(θ)=t[min(rt(θ)t,clip(rt(θ),1-ε,1+ε)t)]

    (6)

    其中epsilon是一個超參數(shù).min中的第一項是LCPI.第二項,clip(rt(θ),1-ε,1+ε)t通過削減概率比來修改代理目標,這消除了在區(qū)間[1-ε,1+ε]的影響.最后,取剪切和未剪切目標中的最小值,最終目標函數(shù)是未剪切目標的下限.

    3 提出的快速PPO算法

    如前一節(jié)所述,PPO算法是PG算法的一個變種.雖然PPO算法對策略的更新是有效的,但我們認為PPO算法對策略更新的限制過強,不僅采用rt(θ)來防止策略更新過快,還采用clip函數(shù)進一步控制策略的更新速度.根據(jù)該方法[17],基線減分能夠提高PG算法的效率.因為基線的使用有助于從經(jīng)驗上找到策略更新的正確方向,從而提高PG算法的效率.因此,我們提出了一種具有最佳基線的PPO方法(Fast-PPO),它結(jié)合了PPO算法的優(yōu)點和最佳基線方法的優(yōu)點.

    3.1 基線減法的策略梯度

    Fast-PPO算法中的梯度估計可以通過減去基線bA進一步穩(wěn)定:

    (7)

    根據(jù)方法[6,17]中使用的優(yōu)勢函數(shù),計算出最佳基線如下:

    (8)

    其中Var表示協(xié)方差矩陣的軌跡,即:

    A=(A1,A2,…,Al)T

    Varθ[A]=tr(Eθ[(A-Eθ[A])(A-Eθ[A])T])

    (9)

    3.2 基于最佳基線DPG方法的拓展

    在Zhao的方法中[17],梯度更新使用隨機梯度下降方法.隨機梯度下降算法[21]每次從訓練集中隨機選擇一個樣本來學習.

    隨機梯度下降算法一次只隨機選取一個樣本來更新模型的參數(shù),因此每次運行都非常快速,可以在線更新.最大隨機梯度下降的缺點是,不是每個更新都會朝正確的方向進行,從而產(chǎn)生優(yōu)化方差.

    因此,在快速PPO算法中,我們使用小批量梯度方法[22]來降低小批量梯度,以將批量梯度和隨機梯度結(jié)合起來.在更新速度和更新次數(shù)之間取得平衡.每次更新都從訓練集中隨機選擇m(m

    θ=θ-η·LPG(θ;xi:i+m;yi:i+m)

    (10)

    與隨機梯度下降相比,小批量梯度降低了收斂波動性,降低了參數(shù)更新的方差,使參數(shù)更新更加穩(wěn)定.

    利用小批量的思想,我們可以解出bA的方程(9),給出快速PPO的最佳基線:

    (11)

    其中:

    (12)

    現(xiàn)在我們來簡化公式‖▽θlogπi(θ)‖2:

    令:

    (13)

    于是:

    ▽θlogπi(θ)=E-P

    (*)(14)

    因此,

    ‖▽θlogπi(θ)‖2=trace((*)2)=trace(E-2P+PPT)

    (15)

    然后我們可以將等式(15)簡化為:

    trace((*)2)=trace(E-2P+PPT)

    =trace(E)-2trace(P)+trace(PPT)

    (16)

    3.3 Fast-PPO中A2C的結(jié)構(gòu)

    Actor-Critic(AC)框架算法[23]可用于解決連續(xù)運動空間中的DRL問題.但是AC有兩個網(wǎng)絡(luò)(actor和critic)需要訓練,因此它需要分別優(yōu)化這兩組權(quán)重.Critic網(wǎng)絡(luò)計算當前狀態(tài)下某個操作的得分Q,Actor網(wǎng)絡(luò)使用該Q值更新其自己的策略權(quán)重.然而,基于價值函數(shù)的方法訓練波動較大.

    為了緩解這個問題,A3C定義了一個優(yōu)勢函數(shù),它給出了與當前狀態(tài)相比的平均動作(動作值函數(shù))的優(yōu)勢值.考慮到使用在策略和價值函數(shù)之間共享參數(shù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的想法,我們提出了一個損失函數(shù),可用于結(jié)合策略替代項和價值函數(shù)誤差項[7].

    如果使用共享策略函數(shù)和價值函數(shù)參數(shù)[7]的神經(jīng)網(wǎng)絡(luò)架構(gòu),損失函數(shù)則可以組合上述目標函數(shù)以及價值函數(shù)的誤差項[24].同時也可以通過添加熵獎勵來確保充分的探索.我們通過結(jié)合這幾項,獲得以下?lián)p失函數(shù)方程,如下所示:

    (17)

    在整個Fast-PPO算法的每次迭代中,通過執(zhí)行當前策略來估計目標函數(shù),然后通過輪流優(yōu)化目標函數(shù)來更新策略參數(shù).

    PG方法中的每一次更新都應(yīng)該增加那些優(yōu)于平均值的操作的概率,同時減少那些低于平均值的操作的概率.但其方差很高,因此提出了AC算法[26],用一個值函數(shù)代替經(jīng)驗收益作為偏差來減少方差.但實際上,John Schulman[20]主要討論了GAE(廣義優(yōu)勢估計)方法,該方法大大減少了方差,確保了控制偏差的前提.使用的GAE估計量是:

    (18)

    其中t在給定的長度T軌跡段內(nèi)以[0,T]指定時間指數(shù).概括這一選擇,使用廣義優(yōu)勢估計的截短版本[20],當λ=1時,可簡化方程(17)為:

    t=δt+(γλ)δt+1+…+…+(γλ)T-t+1δT-1

    (19)

    其中:

    δt=rt+γV(st+1)-V(st)

    (20)

    算法 1.Fast-PPO,Actor-Critic Style

    foriteration=1,2,…do

    foractor=1,2,…,Ndo

    在環(huán)境中,T時間步驟內(nèi),運行策略πθold

    從整體而言,“師傅型”師資的職業(yè)職責有:①了解學徒的發(fā)展規(guī)律;②熟悉合作企業(yè)的典型職業(yè)工作和企業(yè)實際操作流程;③開發(fā)、設(shè)計、制定以工作過程行動導(dǎo)向的培訓計劃;④從事培訓準備、培訓實施、培訓考核指導(dǎo)等工作;⑤促進學徒學習,引領(lǐng)學徒職業(yè)素養(yǎng)形成,傳承企業(yè)文化;⑥為學徒提供職業(yè)發(fā)展咨詢、服務(wù)。具體需要具備以下素質(zhì):

    endfor

    在Kepochs中,令Mini-batchM的大?。篗≤NT,優(yōu)化含θ的L目標函數(shù)

    θold←θ

    endfor

    4 實 驗

    在本節(jié)中,我們通過與原始PPO算法的比較,實驗評估了我們提出的方法的效率.我們使用一個新的開源工具包,使用Unity平臺創(chuàng)建模擬環(huán)境并與之交互:Unity ML-Agents Toolkit.通過將Unity作為仿真平臺,該工具包可以開發(fā)具有豐富的感官和物理復(fù)雜性的學習環(huán)境,提供引人注目的認知挑戰(zhàn)并支持動態(tài)多代理交互.

    基于ML-Agents,NPC通過相機獲取的狀態(tài)信息可以發(fā)送到Python的訓練模型,并且通過圖像識別來提取圖像中的參數(shù)信息.例如,障礙物的分類,到目標的距離,自身和目標的相對位置以及運動方向的判斷,這些信息被發(fā)送到訓練模型,并且模型輸出的命令被發(fā)送回NPC,從而控制NPC在虛擬游戲環(huán)境中的動作.訓練架構(gòu)如圖1所示.

    圖1 訓練架構(gòu)圖

    4.1 任務(wù)中RL算法的比較

    在這一部分,我們將Hallway,Banana和3DBall作為培訓agent的環(huán)境.這三種環(huán)境分為兩類.一個是離散的空間,包括Hallway和Banana,另一個連續(xù)的空間是3DBall.結(jié)果如圖2所示.

    這些任務(wù)的目標如表1所示.它們的訓練參數(shù)設(shè)置如下:

    HallwayBrain:

    序列長度:64; num layers:2; hidden units:128;memory size:256; beta:1.0e-2; gamma:0.99; num epoch:3;

    buffer size:1024; 批量大小:128; 最大步數(shù):5.0e5.

    BananaBrain:

    批量大小:1024; beta:5.0e3; buffer size:10240;最大步數(shù):1.5e5.

    3DBallBrain:

    批量大小:64; buffer size:12000; lambd:0.99; gamma:0.995; beta:0.001.

    表1 任務(wù)及其目標

    Table 1 Tasks and their goals

    任務(wù)空間目 標Hallway離散移動到與房間中方塊的顏色相對應(yīng)的目標Banana離散盡量多吃黃香蕉,同時避免吃到藍香蕉3DBall連續(xù)為了盡可能長時間地保持球在平臺上的平衡

    圖2 任務(wù)場景和獎勵(從左到右、從上到下分別是Hallway、Banana和3DBall)

    從上述任務(wù)的獎勵曲線可以看出,在Hallway任務(wù)中,F(xiàn)ast-PPO在200,000次收斂到0.6,PPO在450,000次收斂到0.4,R-PGPEOB算法甚至無法完成此任務(wù).與PPO算法相比,F(xiàn)ast-PPO可以在此任務(wù)中將速度提高1倍以上,并且Fast-PPO的獎勵也是1.5倍.我們相信更高的獎勵可以讓代理商更好地完成任務(wù).在Banana實驗中,F(xiàn)ast-PPO和PPO具有相同的收斂趨勢,但Fast-PPO收斂的收益率為13,大于PPO收斂的回報率為12.R-PGPEOB早期跌入局部最大值,無法從環(huán)境中學習.在3DBall任務(wù)中,F(xiàn)ast-PPO和PPO也具有相同的收斂趨勢,但仔細觀察,F(xiàn)ast-PPO比PPO更穩(wěn)定,即標準差更小.R-PGPEOB在800,000次達到局部最大值,再也無法繼續(xù)從環(huán)境中學習.根據(jù)這三個實驗的結(jié)果,我們可以得出結(jié)論R-PGPEOB算法可以在連續(xù)的空間中應(yīng)用,但是非常有限并且容易陷入局部最大值.此外,它們在離散空間中表現(xiàn)極其不好.然而,F(xiàn)ast-PPO和PPO不僅可以在連續(xù)空間中有效地應(yīng)用,而且可以在離散空間中有效地應(yīng)用.另外,無論環(huán)境是否離散或者連續(xù),F(xiàn)ast-PPO都有最高的回報.

    4.2 Fast-PPO和PPO在網(wǎng)球中的比較

    Fast-PPO和PPO都可以通過幾場比賽來控制NPC的行為.為了直觀地比較Fast-PPO和PPO的效率,我們使用Unity Machine Learning Agent Toolkit中的網(wǎng)球游戲作為培訓智能代理的環(huán)境.然后我們使用上述方法分別訓練代理的行為.每種方法的表現(xiàn)都是通過超過2萬次運行的回報和損失來衡量的.雖然我們只是展示了網(wǎng)球訓練的結(jié)果(在網(wǎng)球環(huán)境中訓練球拍的過程如圖3所示),但我們還是做了更多的工作來說明我們的方法(Fast-PPO)能夠有效地訓練NPC在各種動作游戲中的行為.

    每種方法的表現(xiàn)都是通過累積獎勵和策略損失來衡量的.對于我們的方法,我們設(shè)置超參數(shù)γ= 0.99,λ= 0.95,c1= 0.5,自學習參數(shù)β使用Tensor流的多項式衰減方法,初始值為0.05.同時,策略參數(shù)在每次迭代中迭代超過200000次.在每次迭代中,我們收集了1024個樣本用于批處理.結(jié)果如圖4所示.

    可以清楚地看到,我們的方法具有更大的累積獎勵.此外,PG和R-PGPEOB已陷入600000次死鎖,不再向環(huán)境中學習.因此,證明了我們提出的方法比PPO方法和其他算法更有效.

    在通過我們提出的方法(Fast-PPO)和其他算法訓練代理之后,我們獲得存儲為.byte文件的策略,該文件可以用作Unity中的大腦來控制代理的行為.為了更直觀地觀察Fast-PPO和其他算法的性能,我們設(shè)計了網(wǎng)球游戲.這兩種方法用于控制兩個網(wǎng)球拍.從上面的實驗中,我們可以看出PPO是唯一可以與Fast-PPO一戰(zhàn)高下的算法.所以我們使用經(jīng)過訓練的PPO算法和Fast-PPO算法來控制各種球拍并執(zhí)行網(wǎng)球比賽.代理人的目標是他們必須在彼此之間反彈球而不丟球或?qū)⑶蛩统鼋缤?

    圖3 網(wǎng)球比賽的過程

    圖4 Fast-PPO和其他算法的獎勵比較

    通過數(shù)千萬次運行,我們獲得了兩個對手的分數(shù),如圖5所示.事實上,這場比賽不符合網(wǎng)球比賽的規(guī)則.因為在這項任務(wù)中,即使一方失去了分數(shù),游戲仍然會繼續(xù).我們只想收集由PPO和Fast-PPO算法控制的AI分數(shù).然而,我們可以保證Fast-PPO的得分總是高于PPO,這意味著用Fast-PPO方法訓練的大腦比用PPO方法訓練的大腦更有效.因此有理由相信我們提出的方法(Fast-PPO)是一種更好的方法來訓練NPC的動作游戲.

    圖5 Fast-PPO和PPO之間的得分比較

    4.3 在Corgi中應(yīng)用Fast-PPO

    為了證明我們提出的Fast-PPO算法的普遍性,本部分進行了更為復(fù)雜的訓練任務(wù).實際上,使用強化學習訓練NPC的過程與訓練幼犬的方式非常相似.我們將向小狗展示一根棍子然后扔出棍子.起初,小狗會四處游蕩,不知道該做什么,直到它最終拿起木棍并將其帶回來,并獲得零食作為獎勵.經(jīng)過幾次訓練后,小狗知道獲得回擊的策略是獲得獎勵的最佳方式,然后繼續(xù)這樣做.這是如何加強NPC行為學習的過程.每當NPC正確完成任務(wù)時,我們都會給NPC一個獎勵.通過多次模擬游戲,NPC構(gòu)建了一個內(nèi)部模型,以最大化獎勵并實現(xiàn)所需的行為.因此,我們不必為每次觀察NPC創(chuàng)建和維持低級別的行動.我們只需要在任務(wù)正確完成時提供高級獎勵,然后NPC就可以學習適當?shù)牡图壭袨?每次Corgi執(zhí)行動作時,我們都會向代理提供獎勵,獎勵設(shè)置為:

    (21)

    圖6 Corgi撿木棍的過程

    訓練Corgi有以下四條規(guī)則:

    ·獲得獎勵:當柯基犬走向目標時,我們會給予獎勵.

    ·時間懲罰:我們將給予Corgi每項行動的定額罰款.通過這種方式,Corgi將學會盡快檢索棍子并避免過多的時間懲罰.

    ·輪換罰分:如果Corgi旋轉(zhuǎn)太多次,將受到懲罰.實際上,如果小狗變得太多,它就會暈眩.為了讓游戲更加逼真,Corgi在轉(zhuǎn)彎過快時會受到懲罰.

    ·目標獎勵:Corgi到達目標位置時會獲得獎勵.

    使用Fast-PPO和其他算法的訓練犬的結(jié)果如圖7所示.訓練之后,byte文件用于控制Corgi的行為.獲取木棍的過程如圖6所示.它顯示了使用Fast-PPO訓練的Corgi完成棺材棒的任務(wù).我們可以清楚地看到,柯基犬正朝著目標穩(wěn)步前進,并且很好地完成了這項任務(wù).

    圖7 柯基犬的獎勵圖

    5 結(jié) 論

    在本文中,我們提出了一種新的方法,即具有最佳基線的Fast-PPO,與PPO算法相比,它有助于提高正確方向的策略更新速度.通過比較獎勵,我們提出的方法(Fast-PPO)通過實驗證明了具有比主流強化學習算法更好的性能.從理論上講,我們提出的方法比其他強化學習算法具有更高的回報和更快的收斂速度.此外,以Unity中的環(huán)境為例,應(yīng)用Fast-PPO算法,無論環(huán)境是連續(xù)的還是離散的,所有結(jié)果都表明了Fast-PPO算法在游戲中控制NPC的良好性能.

    猜你喜歡
    基線梯度函數(shù)
    一個改進的WYL型三項共軛梯度法
    二次函數(shù)
    第3講 “函數(shù)”復(fù)習精講
    適用于MAUV的變基線定位系統(tǒng)
    二次函數(shù)
    航天技術(shù)與甚長基線陣的結(jié)合探索
    科學(2020年5期)2020-11-26 08:19:14
    函數(shù)備考精講
    一種自適應(yīng)Dai-Liao共軛梯度法
    一類扭積形式的梯度近Ricci孤立子
    一種改進的干涉儀測向基線設(shè)計方法
    少妇丰满av| 一区二区三区免费毛片| 色吧在线观看| 18禁在线无遮挡免费观看视频 | 美女被艹到高潮喷水动态| 国产成人一区二区在线| 国产午夜福利久久久久久| 欧美不卡视频在线免费观看| 亚洲av五月六月丁香网| 欧美成人a在线观看| a级毛色黄片| 男女之事视频高清在线观看| 亚洲激情五月婷婷啪啪| 精品不卡国产一区二区三区| 午夜久久久久精精品| 国产中年淑女户外野战色| 观看美女的网站| 色综合站精品国产| 变态另类丝袜制服| 亚洲国产欧洲综合997久久,| 亚洲国产欧洲综合997久久,| 国产男人的电影天堂91| 伊人久久精品亚洲午夜| 看免费成人av毛片| 欧美最新免费一区二区三区| 女同久久另类99精品国产91| 深夜a级毛片| 国产男人的电影天堂91| 国产成人aa在线观看| 国产精品伦人一区二区| 欧美日本视频| av在线观看视频网站免费| 哪里可以看免费的av片| 精品一区二区三区视频在线| 精品一区二区三区av网在线观看| 亚洲经典国产精华液单| 婷婷六月久久综合丁香| 亚洲七黄色美女视频| 在线看三级毛片| 中文字幕久久专区| 午夜福利高清视频| 久久精品综合一区二区三区| 在线免费观看不下载黄p国产| 亚洲精品乱码久久久v下载方式| 国产精品野战在线观看| 真人做人爱边吃奶动态| 女生性感内裤真人,穿戴方法视频| 欧美日韩综合久久久久久| 最近手机中文字幕大全| 一区二区三区免费毛片| 久久天躁狠狠躁夜夜2o2o| 99riav亚洲国产免费| 男人和女人高潮做爰伦理| 国产亚洲av嫩草精品影院| 午夜激情福利司机影院| 女的被弄到高潮叫床怎么办| 午夜精品一区二区三区免费看| 欧美高清成人免费视频www| 日韩国内少妇激情av| 精品福利观看| av.在线天堂| 村上凉子中文字幕在线| 三级国产精品欧美在线观看| 成人国产麻豆网| 一个人免费在线观看电影| 亚洲一区高清亚洲精品| 精品久久久久久久人妻蜜臀av| 精品少妇黑人巨大在线播放 | 国产亚洲精品av在线| 亚洲电影在线观看av| 国产伦精品一区二区三区视频9| 色播亚洲综合网| 亚洲人成网站在线播| 99热只有精品国产| 18禁在线无遮挡免费观看视频 | 国产av不卡久久| 亚洲五月天丁香| 中出人妻视频一区二区| 人人妻人人看人人澡| 寂寞人妻少妇视频99o| 久久久久久久久大av| 亚洲五月天丁香| 在线播放国产精品三级| 白带黄色成豆腐渣| 精品乱码久久久久久99久播| 国产真实乱freesex| 精品国内亚洲2022精品成人| 神马国产精品三级电影在线观看| a级毛片a级免费在线| 欧美xxxx性猛交bbbb| 联通29元200g的流量卡| 国产精品久久久久久亚洲av鲁大| 亚洲七黄色美女视频| 校园春色视频在线观看| 熟女电影av网| 日本精品一区二区三区蜜桃| 麻豆成人午夜福利视频| 日韩欧美在线乱码| 久久久午夜欧美精品| 亚洲自偷自拍三级| 少妇人妻精品综合一区二区 | 少妇高潮的动态图| 日韩欧美三级三区| 别揉我奶头~嗯~啊~动态视频| 又爽又黄a免费视频| 成人特级黄色片久久久久久久| 草草在线视频免费看| 久久久久久大精品| 国产日本99.免费观看| 亚洲欧美成人精品一区二区| 无遮挡黄片免费观看| 午夜亚洲福利在线播放| 成熟少妇高潮喷水视频| 网址你懂的国产日韩在线| 男人舔女人下体高潮全视频| 插阴视频在线观看视频| 精品久久久久久久人妻蜜臀av| 97碰自拍视频| 久久精品综合一区二区三区| 久久草成人影院| 大香蕉久久网| 日韩制服骚丝袜av| 亚洲欧美清纯卡通| 日本一本二区三区精品| 欧美又色又爽又黄视频| 亚洲国产精品成人综合色| 亚洲第一电影网av| ponron亚洲| 91久久精品国产一区二区三区| 久久久久性生活片| 亚洲色图av天堂| 高清日韩中文字幕在线| 精品无人区乱码1区二区| 搞女人的毛片| 男女下面进入的视频免费午夜| 久久久久国内视频| 亚洲国产日韩欧美精品在线观看| 国产高清激情床上av| 亚洲精品国产av成人精品 | 欧美日韩乱码在线| 欧美极品一区二区三区四区| 人人妻人人澡人人爽人人夜夜 | 超碰av人人做人人爽久久| 哪里可以看免费的av片| 日韩欧美免费精品| 两个人视频免费观看高清| 国产高清有码在线观看视频| 亚洲五月天丁香| 成人av在线播放网站| 精品久久久久久久久久久久久| av在线亚洲专区| 成人av一区二区三区在线看| 午夜a级毛片| 99久久中文字幕三级久久日本| 一个人免费在线观看电影| 狂野欧美白嫩少妇大欣赏| 天堂影院成人在线观看| 搡老熟女国产l中国老女人| 麻豆久久精品国产亚洲av| 看非洲黑人一级黄片| 国产精品国产三级国产av玫瑰| 国产高清有码在线观看视频| 一本一本综合久久| 高清毛片免费观看视频网站| 中文字幕久久专区| 国产伦一二天堂av在线观看| 看片在线看免费视频| 看十八女毛片水多多多| 日韩人妻高清精品专区| 国产精品人妻久久久影院| 欧美成人a在线观看| 人妻久久中文字幕网| 人人妻人人看人人澡| 国产精品综合久久久久久久免费| 美女黄网站色视频| 两个人视频免费观看高清| 在线看三级毛片| 免费人成在线观看视频色| 熟女电影av网| 看非洲黑人一级黄片| 深爱激情五月婷婷| 久久韩国三级中文字幕| 国产视频内射| 亚洲专区国产一区二区| 国产黄a三级三级三级人| 精品无人区乱码1区二区| 婷婷亚洲欧美| 国产欧美日韩精品亚洲av| 美女高潮的动态| 黄色日韩在线| 日韩强制内射视频| 国产aⅴ精品一区二区三区波| 成人av一区二区三区在线看| 国产高清有码在线观看视频| 国产激情偷乱视频一区二区| 久久婷婷人人爽人人干人人爱| 亚洲欧美日韩高清专用| 青春草视频在线免费观看| 日产精品乱码卡一卡2卡三| 日韩 亚洲 欧美在线| 久久久久久久久久成人| 亚洲国产欧洲综合997久久,| 成人亚洲精品av一区二区| 欧美区成人在线视频| 美女黄网站色视频| 老司机福利观看| 国产精品1区2区在线观看.| 亚洲自偷自拍三级| 非洲黑人性xxxx精品又粗又长| 老女人水多毛片| 亚洲av中文av极速乱| 亚洲国产欧美人成| 国产精品久久电影中文字幕| 精品人妻偷拍中文字幕| 美女内射精品一级片tv| 亚洲av中文字字幕乱码综合| 国产精品免费一区二区三区在线| 久久精品国产99精品国产亚洲性色| 精品不卡国产一区二区三区| 久久久精品欧美日韩精品| 精品久久久久久成人av| 国产精品久久久久久亚洲av鲁大| 亚洲最大成人手机在线| 搞女人的毛片| a级毛片免费高清观看在线播放| 晚上一个人看的免费电影| 日本黄大片高清| 超碰av人人做人人爽久久| 观看免费一级毛片| 少妇人妻一区二区三区视频| 国产欧美日韩一区二区精品| 日韩国内少妇激情av| 国产一区亚洲一区在线观看| 亚洲av不卡在线观看| 免费观看在线日韩| av在线播放精品| 在线播放国产精品三级| 欧美日韩综合久久久久久| 欧美+日韩+精品| 给我免费播放毛片高清在线观看| 51国产日韩欧美| 午夜精品国产一区二区电影 | 欧美日本亚洲视频在线播放| АⅤ资源中文在线天堂| 一级毛片我不卡| 成年免费大片在线观看| 国产精品电影一区二区三区| 日韩欧美国产在线观看| 91狼人影院| 精品人妻视频免费看| 久久久精品欧美日韩精品| 国产黄色视频一区二区在线观看 | 久久中文看片网| 欧美在线一区亚洲| 一本精品99久久精品77| 国产午夜福利久久久久久| 久久精品影院6| 夜夜夜夜夜久久久久| 亚洲中文日韩欧美视频| 日产精品乱码卡一卡2卡三| 成人国产麻豆网| 禁无遮挡网站| 色5月婷婷丁香| av天堂在线播放| 亚洲国产欧美人成| 蜜桃亚洲精品一区二区三区| 99视频精品全部免费 在线| av免费在线看不卡| 久久久久国内视频| 观看免费一级毛片| 国产成人精品久久久久久| 长腿黑丝高跟| 久久久久性生活片| 久久久久国产精品人妻aⅴ院| 免费av毛片视频| 国产精品嫩草影院av在线观看| 亚洲人成网站在线播| 欧美三级亚洲精品| 国产精品爽爽va在线观看网站| 色视频www国产| 国产精品野战在线观看| 精品一区二区免费观看| 国产淫片久久久久久久久| 亚洲性久久影院| 国产精品免费一区二区三区在线| 久久久久国内视频| 国内精品久久久久精免费| 日本色播在线视频| 综合色丁香网| 一级av片app| 国产精品久久久久久久电影| 亚洲18禁久久av| 日韩欧美免费精品| 狂野欧美白嫩少妇大欣赏| 日本三级黄在线观看| 中出人妻视频一区二区| 久久九九热精品免费| 国产精品久久久久久久久免| 午夜视频国产福利| 两个人视频免费观看高清| 国产精品女同一区二区软件| 非洲黑人性xxxx精品又粗又长| 欧美在线一区亚洲| 国产成人aa在线观看| 欧美成人免费av一区二区三区| 伦精品一区二区三区| 人人妻人人澡人人爽人人夜夜 | 亚洲成人精品中文字幕电影| 一区二区三区高清视频在线| 午夜影院日韩av| 久久精品综合一区二区三区| 在线观看午夜福利视频| 亚洲欧美中文字幕日韩二区| 成人亚洲精品av一区二区| 免费一级毛片在线播放高清视频| 国内精品美女久久久久久| 亚洲国产欧美人成| 乱人视频在线观看| 免费看av在线观看网站| 国内精品久久久久精免费| 三级经典国产精品| 中文字幕免费在线视频6| 久久久久久久久中文| 午夜福利18| 成年女人永久免费观看视频| 午夜福利在线观看吧| 人妻丰满熟妇av一区二区三区| 变态另类成人亚洲欧美熟女| 嫩草影视91久久| 中国国产av一级| 97超级碰碰碰精品色视频在线观看| 三级经典国产精品| 精华霜和精华液先用哪个| 俄罗斯特黄特色一大片| 我要搜黄色片| 人妻久久中文字幕网| 午夜视频国产福利| av免费在线看不卡| 乱码一卡2卡4卡精品| 久久欧美精品欧美久久欧美| a级毛片免费高清观看在线播放| 噜噜噜噜噜久久久久久91| 九九在线视频观看精品| 国产精品一区二区性色av| 村上凉子中文字幕在线| 最近中文字幕高清免费大全6| 日韩亚洲欧美综合| 非洲黑人性xxxx精品又粗又长| 又黄又爽又免费观看的视频| 自拍偷自拍亚洲精品老妇| 免费人成视频x8x8入口观看| 啦啦啦啦在线视频资源| 中文资源天堂在线| 在线观看一区二区三区| 国产精品一及| 久久久午夜欧美精品| 淫秽高清视频在线观看| 国产又黄又爽又无遮挡在线| 全区人妻精品视频| 乱人视频在线观看| 又爽又黄无遮挡网站| 日韩在线高清观看一区二区三区| 国产精品一及| 日韩亚洲欧美综合| av在线亚洲专区| 亚洲欧美成人综合另类久久久 | 欧美不卡视频在线免费观看| 亚洲综合色惰| 听说在线观看完整版免费高清| 中文字幕精品亚洲无线码一区| 少妇高潮的动态图| 色在线成人网| 99久久精品热视频| 在线免费十八禁| 97超碰精品成人国产| 亚洲国产欧美人成| 成人美女网站在线观看视频| 久久久久久久久久黄片| 免费黄网站久久成人精品| 看非洲黑人一级黄片| 麻豆成人午夜福利视频| 久久精品人妻少妇| 毛片女人毛片| 一区二区三区高清视频在线| 午夜老司机福利剧场| 夜夜看夜夜爽夜夜摸| or卡值多少钱| 搡老熟女国产l中国老女人| 草草在线视频免费看| 精品久久久久久久久久久久久| 三级男女做爰猛烈吃奶摸视频| 久久久久久大精品| 久久中文看片网| 高清日韩中文字幕在线| 午夜福利在线观看吧| 尾随美女入室| 国产三级在线视频| 色播亚洲综合网| 国产乱人偷精品视频| 欧美区成人在线视频| 乱人视频在线观看| 免费看av在线观看网站| 中文字幕av在线有码专区| 免费看a级黄色片| 午夜亚洲福利在线播放| 亚洲三级黄色毛片| 男女啪啪激烈高潮av片| 久久九九热精品免费| 不卡视频在线观看欧美| 久久综合国产亚洲精品| 午夜视频国产福利| 天美传媒精品一区二区| 国产毛片a区久久久久| 亚洲国产精品成人综合色| 亚洲色图av天堂| 最近视频中文字幕2019在线8| 色5月婷婷丁香| 一区二区三区四区激情视频 | 亚洲第一电影网av| 亚洲精品色激情综合| 国产精品久久久久久久久免| www.色视频.com| 国内精品宾馆在线| 日日啪夜夜撸| 夜夜夜夜夜久久久久| 精品一区二区三区视频在线观看免费| 成人av在线播放网站| 亚洲色图av天堂| 最近手机中文字幕大全| 欧美激情久久久久久爽电影| 毛片一级片免费看久久久久| 中文资源天堂在线| 国产成人a∨麻豆精品| 欧美日韩综合久久久久久| 久久综合国产亚洲精品| 亚洲精品一卡2卡三卡4卡5卡| 久久久精品欧美日韩精品| 国产探花极品一区二区| 久久人人爽人人爽人人片va| 成人美女网站在线观看视频| 九九热线精品视视频播放| 久久久精品大字幕| a级毛片a级免费在线| 亚洲精品乱码久久久v下载方式| 亚洲一级一片aⅴ在线观看| 亚洲美女搞黄在线观看 | 乱码一卡2卡4卡精品| 熟女电影av网| 精品一区二区三区视频在线| 久久精品91蜜桃| 男人和女人高潮做爰伦理| 亚洲精品日韩在线中文字幕 | 亚洲欧美精品综合久久99| 男女啪啪激烈高潮av片| 免费看日本二区| 国产女主播在线喷水免费视频网站 | 少妇熟女aⅴ在线视频| 免费观看人在逋| 亚洲丝袜综合中文字幕| 亚洲成人精品中文字幕电影| 午夜爱爱视频在线播放| 九九在线视频观看精品| 日韩高清综合在线| 老熟妇仑乱视频hdxx| 一级毛片我不卡| 成年女人看的毛片在线观看| 麻豆精品久久久久久蜜桃| 国产乱人视频| 校园春色视频在线观看| 深夜精品福利| av在线老鸭窝| 淫秽高清视频在线观看| 亚洲久久久久久中文字幕| 高清日韩中文字幕在线| 日韩欧美在线乱码| a级毛片免费高清观看在线播放| 亚洲欧美日韩东京热| 国产精品一区二区三区四区久久| 久久久精品大字幕| 尤物成人国产欧美一区二区三区| 国产精品久久久久久久电影| 久久久久性生活片| 国产精品av视频在线免费观看| 精品午夜福利视频在线观看一区| av免费在线看不卡| 午夜精品国产一区二区电影 | 最近最新中文字幕大全电影3| 亚洲成人久久性| 少妇人妻精品综合一区二区 | 久久国产乱子免费精品| 国产人妻一区二区三区在| 久久国产乱子免费精品| av在线老鸭窝| 亚洲av.av天堂| 看黄色毛片网站| 草草在线视频免费看| 欧洲精品卡2卡3卡4卡5卡区| 两个人的视频大全免费| 在线国产一区二区在线| 欧美bdsm另类| 99在线视频只有这里精品首页| 永久网站在线| 性插视频无遮挡在线免费观看| 日韩,欧美,国产一区二区三区 | 波多野结衣高清作品| 日本黄色片子视频| 波多野结衣高清无吗| 久久6这里有精品| 波多野结衣巨乳人妻| 国产精品av视频在线免费观看| 久久精品国产亚洲网站| 内射极品少妇av片p| 91麻豆精品激情在线观看国产| 亚洲美女搞黄在线观看 | 成年免费大片在线观看| 日日啪夜夜撸| 中文字幕人妻熟人妻熟丝袜美| 露出奶头的视频| 真人做人爱边吃奶动态| av卡一久久| 国产成人freesex在线 | 一个人看的www免费观看视频| 18禁裸乳无遮挡免费网站照片| 午夜福利高清视频| 热99re8久久精品国产| 男人舔女人下体高潮全视频| 国内久久婷婷六月综合欲色啪| 亚洲熟妇中文字幕五十中出| 日韩,欧美,国产一区二区三区 | 国产真实伦视频高清在线观看| 亚洲天堂国产精品一区在线| 男女做爰动态图高潮gif福利片| 精品久久久久久久人妻蜜臀av| 亚洲精品色激情综合| 99精品在免费线老司机午夜| 卡戴珊不雅视频在线播放| 色综合色国产| 成人性生交大片免费视频hd| 亚洲真实伦在线观看| 最新在线观看一区二区三区| 色吧在线观看| 淫妇啪啪啪对白视频| 免费大片18禁| 欧美人与善性xxx| av卡一久久| 久久欧美精品欧美久久欧美| 99热6这里只有精品| 久久精品国产清高在天天线| 日韩在线高清观看一区二区三区| 超碰av人人做人人爽久久| 国产成人精品久久久久久| 嫩草影院新地址| 亚洲中文字幕一区二区三区有码在线看| 国产精品伦人一区二区| 神马国产精品三级电影在线观看| 国产大屁股一区二区在线视频| 天堂动漫精品| 国产成人a区在线观看| 综合色丁香网| 国产午夜精品论理片| 毛片女人毛片| 日本色播在线视频| 极品教师在线视频| 深夜精品福利| 91狼人影院| 日日干狠狠操夜夜爽| 日本免费一区二区三区高清不卡| 免费观看的影片在线观看| 免费在线观看影片大全网站| 亚洲av电影不卡..在线观看| 村上凉子中文字幕在线| 亚洲欧美日韩高清在线视频| 综合色丁香网| 三级男女做爰猛烈吃奶摸视频| 亚洲成a人片在线一区二区| 国产高潮美女av| 欧美成人精品欧美一级黄| 国产精品三级大全| 波多野结衣巨乳人妻| 在线免费观看的www视频| 亚洲三级黄色毛片| 色哟哟·www| 女同久久另类99精品国产91| 色视频www国产| 国产高清激情床上av| 日韩成人伦理影院| 99久久精品国产国产毛片| 国产精品综合久久久久久久免费| 国内久久婷婷六月综合欲色啪| 最近视频中文字幕2019在线8| 亚洲最大成人中文| 美女 人体艺术 gogo| 高清日韩中文字幕在线| 国产欧美日韩精品一区二区| 亚洲精品影视一区二区三区av| 亚洲经典国产精华液单| 免费在线观看成人毛片| av免费在线看不卡| 成人一区二区视频在线观看| 在线观看午夜福利视频| 精品福利观看| 好男人在线观看高清免费视频| 婷婷六月久久综合丁香| 久久亚洲国产成人精品v| 亚洲七黄色美女视频| 此物有八面人人有两片| 亚洲国产精品久久男人天堂| 十八禁网站免费在线| 波野结衣二区三区在线| 国产中年淑女户外野战色| 两个人的视频大全免费| 国产人妻一区二区三区在| 久久久久久九九精品二区国产| 97超级碰碰碰精品色视频在线观看| 在线观看一区二区三区|