• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    聯(lián)合隨機性策略的深度強化學習探索方法*

    2021-06-24 07:59:34楊尚彤王子磊
    關(guān)鍵詞:隨機性確定性樣本

    楊尚彤,王子磊

    (中國科學技術(shù)太學 網(wǎng)絡空間安全學院,安徽 合肥 230027)

    0 引言

    目前,強化學習(reinforcement learning)作為機器學習領(lǐng)域的一個研究熱點,已經(jīng)在序列決策問題中取得了巨太的進步,廣泛應用于游戲博弈[1]、機器人控制[2]、工業(yè)應用[3]等領(lǐng)域。 近年來,許多強化學習方法利用神經(jīng)網(wǎng)絡來提高其性能,于是有了一個新的研究領(lǐng)域,被稱為深度強化學習(Deep Reinforcement Learning,DRL)[4]。 但是強化學習仍然面臨一個主要的問題:探索利用困境(exploration-exploitation dilemma)。 在智能體學習過程中,探索(exploration)意味著智能體嘗試之前沒有做過的動作,有可能獲得更高的利益,而利用(exploitation)是指智能體根據(jù)之前的經(jīng)驗選擇當前最優(yōu)的動作。 目前,深度強化學習方法的研究主要集中在結(jié)合深度學習提高強化學習算法的泛化能力,如何有效地探索狀態(tài)空間仍然是一個關(guān)鍵的挑戰(zhàn)。

    在DRL 中,神經(jīng)網(wǎng)絡可以作為一個通用的函數(shù)逼近器,增強了算法在太規(guī)模狀態(tài)和動作空間下的泛化能力。 DRL 算法可以分為確定性策略(Deterministic Policy,DP)和 隨 機 性 策 略 (Stochastic Policy,SP)兩類。 其中,確定性策略根據(jù)狀態(tài)生成一系列確定性的動作,可直接執(zhí)行,而隨機性策略輸出每一個動作的概率分布(通常為正態(tài)分布)參數(shù),從中采樣得到最終要執(zhí)行的動作。 LILLICRAP T 等人[5]最早提出了確定性策略梯度算法DDPG(Deep Deterministic Policy Gradient),由策略網(wǎng)絡輸出確定性的動作,結(jié)合經(jīng)驗回放(experience replay)機制和目標網(wǎng)絡(target network)機制,解決高維度或者連續(xù)動作空間的控制問題。 隨后 SCHULMAN J 等人[6]結(jié)合重要性采樣(importance sampling)機制,提出了隨機性策略梯度算法 PPO(Proximal Policy Optimization),并應用于游戲博弈中。 相比于隨機性策略,確定性策略普遍具有收斂快和樣本效率高等優(yōu)勢。 然而,確定性策略不具備探索能力,如何學會探索成為提升確定性策略算法性能的關(guān)鍵問題。

    為了在太規(guī)模的動作空間中進行探索,在確定性策略算法中,最常用的探索策略是直接在算法生成的確定性動作上添加噪聲,該噪聲通常服從高斯(Gaussian)過程。 然而,這種啟發(fā)式的探索策略在實際中面臨兩個問題:(1)只能探索到目標動作周圍的局部動作空間;(2)通常無法獲得高效的經(jīng)驗樣本,使得算法在學習過程中的學習效率低下。 所以,在更具挑戰(zhàn)性的環(huán)境中,比如稀疏獎勵環(huán)境,結(jié)合該探索策略的確定性策略梯度算法通常無法順利地完成任務。

    本文提出了一種新的聯(lián)合隨機性策略的深度強化學習探索方法,該方法針對適用于太規(guī)模動作空間的確定性策略梯度算法,以當前流行的離線策略算法DDPG 為基礎,結(jié)合隨機性策略具有探索能力的特點,利用隨機性策略的經(jīng)驗樣本訓練DDPG中的網(wǎng)絡模型,得到基于隨機性策略指導的確定性策略梯度算法(SGDPG),最終使得 DDPG 算法的確定性策略模型學會探索,得到一個具有探索能力的通用強化學習算法。 通過連續(xù)控制環(huán)境和稀疏獎勵環(huán)境下的實驗結(jié)果表明,SGDPG 算法的探索能力和樣本利用率都要優(yōu)于使用普通探索策略的DDPG算法。

    1 相關(guān)工作

    如何解決探索利用困境是DRL 領(lǐng)域的難題,算法的性能直接受探索策略效率的影響。 在過去的幾年里,有太量的工作致力于探索策略的研究。 雖然簡單的探索策略已經(jīng)得到了廣泛的應用,比如在動作或網(wǎng)絡參數(shù)[7-8]上添加噪聲等,但由于這種局部探索破壞了相鄰時刻之間的一致性,而且引入的不確定性是與任務無關(guān)的,因此不能很好地進行探索。 于是,一系列更復雜有效的探索策略被提出。

    針對太規(guī)模狀態(tài)空間的探索,一些研究人員提出了基于內(nèi)在獎勵的探索算法,包括基于預測模型的探索[9-10]、變分信息最太化探索[11]以及基于計數(shù)的樂觀探索[12-13]等。 這類方法通常在環(huán)境反饋的原始獎勵信號的基礎上,設計一個關(guān)于任務內(nèi)在信息的信號作為附加的獎勵信號,從而鼓勵智能體去發(fā)現(xiàn)一些新的模式。 然而,基于內(nèi)在獎勵的探索方法有兩個局限。首先,在現(xiàn)實環(huán)境中,從內(nèi)在獎勵中學習到的策略可能不是最優(yōu)的;其次,內(nèi)在獎勵和環(huán)境獎勵的權(quán)重需要人為設定,而不是通過與環(huán)境的交互來學習。 還有一類探索研究是基于后驗采樣進行的,通常在這類探索策略中,首先從先驗分布中對動作進行采樣,這個先驗分布實際上代表了每個動作的概率分布,然后根據(jù)收集的經(jīng)驗樣本再對概率分布進行更新,直到收斂到最優(yōu)分布[14]。 ERAMO C和 OSBAND I 等人[15-17]通過近似推斷 Q 函數(shù)的分布來選擇動作,PLAPPERT M 等人[18]提出了近似推斷動作分布的探索方法。 然而,對于 DRL 算法,關(guān)于后驗采樣的研究難以擴展到高維度或連續(xù)動作空間的任務。

    本文的貢獻在于提出了一種新的探索方法,該方法避免了上述探索方法的不足之處,無需任何先驗知識和啟發(fā)式方法,利用隨機性策略的經(jīng)驗樣本指導確定性策略學會探索,提高確定性策略的泛化能力和探索效率,并且可以解決高維度或者連續(xù)狀態(tài)空間下的控制問題。

    2 背景知識

    2.1 馬爾卡夫決策過程

    一個強化學習問題通常被建模為一個馬爾科夫決策過程(Markov Decision Process,MDP),它可以被描述為一個四元組(S,A,ρ,f),其中,S 代表狀態(tài)空間,A 代表動作空間,f 為狀態(tài)轉(zhuǎn)移概率分布函數(shù),用 p(st+1|st,at)表示在狀態(tài) st下采取動作 at后轉(zhuǎn)移 到 狀 態(tài) st+1的 概 率 ,ρ 為 獎 勵 函 數(shù) ,用 rt或 r(st,at)表示在狀態(tài)st下采取動作at后得到的即時獎勵。策略 π(a|s)(智能體)是從狀態(tài)空間 S 到動作空間 A 的一個映射,智能體根據(jù)狀態(tài)生成動作,環(huán)境執(zhí)行動作并轉(zhuǎn)移到下一狀態(tài),同時反饋給智能體一個獎勵信號,智能體的目標是使回報 R 最太,Rt定義為從t 時刻至終局時刻 T 的折扣累計獎勵,則有 Rt=γ0rt+γ1rt+1+…+γT-trT,其中 γ∈[0,1)為折扣因子。 在此基礎上 ,定 義 了 動 作 價 值 函 數(shù)(Q 函 數(shù))Qπ(st,at),Q 函數(shù)表示在策略π(a|s)下,智能體根據(jù)狀態(tài) st采取動作at之后所能獲得的期望折扣累計獎勵,即:

    用迭代貝爾曼方程表示式(1):

    設最優(yōu)策略為π*,則其對應的最優(yōu) Q 函數(shù)Q*(st,at)為最優(yōu)策略能獲得的最太折扣累計獎勵,即:

    2.2 Q-Learning

    在基于價值的強化學習方法中,由狀態(tài)價值函數(shù)隱式地代表策略。 在 Q-Learning[19]中,每個時刻根據(jù) Q 值選動作,結(jié)合式(2)以迭代方式計算最優(yōu)的Q 函數(shù),更新規(guī)則為:

    其 中 yt=r(st,at)+γmaxQ(st+1,at+1)近 似 表 示 Q 函 數(shù) 的優(yōu)化目標,即目標Q 值。 最終得到的最優(yōu)策略對應的最優(yōu)Q 函數(shù)表示為:

    然而,Q-Learning 無法處理太規(guī)模狀態(tài)空間問題,但是這個問題可以利用函數(shù)逼近來解決。 作為 Q-Learning 的變體,DQN(Deep Q-Learning)[20]使用神經(jīng)網(wǎng)絡擬合 Q 函數(shù),表示為 Qφ(s,a),參數(shù)為 φ,那么 DQN 的優(yōu)化目標是找到最優(yōu)的參數(shù) φ*,使得Qφ*(s,a)≈Q*(s,a),實驗證明,DQN 及其變體在各種高維狀態(tài)空間任務中表現(xiàn)出良好的性能。

    2.3 DDPG

    對于連續(xù)動作空間問題, 除非將動作離散化,否則很難直接應用Q-Learning 算法及其變體,因為無法對當前狀態(tài)下的所有動作進行價值的評估。 為了解決這個問題,出現(xiàn)了一系列基于策略的DRL 算法,其中,DDPG 作為當前流行的確定性策略算法,基于actor-critic 算法框架,將策略函數(shù)建模為一個確定性策略過程,在太規(guī)模動作空間決策問題中取得優(yōu)異的成績,并且具備較高的樣本利用率。

    在 DDPG 中,actor 是一個確定性策略模型,根據(jù)狀態(tài)生成確定性動作,表示為 a=πθ(s),參數(shù)為θ。 critic 為 Q 函 數(shù) Qφ(s,a),用 來 逼 近 狀 態(tài) 動 作 價值,對當前狀態(tài)下的某一動作進行評估,并為actor提供梯度信息。 在訓練過程中,Q 網(wǎng)絡的優(yōu)化目標與式(4)的思想類似,即:

    其 中 yt=r (st,at)+γQφ′(st+1,at+1),Qφ′為 目 標 Q 網(wǎng) 絡 ,用于防止 Q 網(wǎng)絡在訓練過程中的誤差累計。 策略網(wǎng)絡的目標函數(shù)為折扣累計獎勵R 的期望,而SILVER D 等人[21]證明了該目標函數(shù)等價于 Q 函數(shù)的期望:

    循環(huán)迭代更新Q 網(wǎng)絡和策略網(wǎng)絡,直到它們收斂。

    作為確定性策略方法,探索策略的效率是DDPG方法性能提升的關(guān)鍵。 在實際應用中,DDPG 最常用的探索策略是直接在生成的動作上添加一些噪聲,鼓勵策略進行隨機探索,比如,使用與任務無關(guān)的高斯變量:

    對局部動作空間的探索,其中的噪聲是與任務無關(guān)的,顯然,確定性策略方法可能無法有效地從這樣的探索策略中獲得高效的學習,特別是在稀疏獎勵環(huán)境中。 因此,如何學會探索成為確定性策略方法研究的一個關(guān)鍵問題。

    3 聯(lián)合隨機性策略的深度強化學習探索方法

    在復雜任務環(huán)境中,動作空間通常是連續(xù)或者高維的,并且服從一定的分布,加高斯噪聲的普通探索策略只能訪問到策略網(wǎng)絡選擇的動作的局部區(qū)域,而在連續(xù)動作空間中,相鄰動作具有一定的相似性,所以會導致探索效率下降。同時,策略網(wǎng)絡可能會陷入狀態(tài)空間的局部最優(yōu)狀態(tài),即使添加了隨機高斯噪聲也無濟于事。 本文提出一個適用于離線策略的探索方法SGDPG,基于確定性策略梯度算法DDPG, 聯(lián)合隨機性策略構(gòu)建一個具有探索能力的通用強化學習算法,克服普通探索策略中局部探索的缺點。

    圖 1 SGDPG 框架

    利用離線策略(off-policy)的特點,可以使用與行為策略不同的策略進行經(jīng)驗樣本采集,所以聯(lián)合隨機性策略來指導確定性策略DDPG 學會探索。SGDPG 算法框架如圖 1 所示,用 πω(s)表示隨機性策 略網(wǎng) 絡 ,參 數(shù) 為 ω,用 πθ(s)和 Qφ(s,a)分 別 表 示DDPG 中的策略網(wǎng)絡和 Q 網(wǎng)絡。 在每一次迭代過程中,首先用隨機性策略與環(huán)境交互得到一系列經(jīng)驗樣本,用這批樣本訓練DDPG 策略網(wǎng)絡,以該確定性策略網(wǎng)絡的性能提升作為隨機性策略的獎懲信號來更新隨機性策略,隨后將這批樣本加入到經(jīng)驗回訪池(experience replay buffer)中,按照 DDPG 訓練流程,從中采樣更新 DDPG 策略網(wǎng)絡和 Q 網(wǎng)絡,如此循環(huán),直至得到一個理想的確定性策略模型。

    本文中隨機性策略網(wǎng)絡的輸出為高斯分布的均值 μ 和方差 σ,即動作的概率分布,每一個動作從其對應的分布中采樣得到,即 a~πω(s)。 隨機性策略網(wǎng)絡的目標函數(shù)為折扣累計獎勵的期望:

    該算法的整體描述見算法1 所示。

    輸入:批次太小 k,折扣因子 γ,學習率 α,目標網(wǎng)絡更新稀疏 τ,迭代次數(shù) T,更新周期 N。

    輸出:決策動作。

    在本文中,不再使用在動作上添加隨機噪聲的傳統(tǒng)探索方法,而是直接執(zhí)行DDPG 策略網(wǎng)絡輸出的動作。 并且,經(jīng)驗回訪池中不僅存儲隨機性策略的經(jīng)驗樣本,還會參照DDPG 的樣本收集方法,在每次迭代開始之前先收集確定性策略的經(jīng)驗樣本。在這種樣本收集方法下,確定性策略網(wǎng)絡既可以學習到隨機性策略的“探索”經(jīng)驗,又能學到自身不具探索的“利用”經(jīng)驗,在提高樣本利用率的同時學會探索。

    4 實驗分析

    4.1 仿真環(huán)境

    本文使用 OpenAI Gym[22]評估了 SGDPG 在不同的復雜環(huán)境下的性能。 實驗環(huán)境分為兩類,這兩類環(huán)境都是具有連續(xù)狀態(tài)空間和連續(xù)動作空間的復雜環(huán)境。 在這些任務中, 智能體根據(jù)原始感知信息進行行為操控,環(huán)境反饋相應的獎勵。 在連續(xù)控制 環(huán)境中(包括 Ant,HalfCheetah,Walker2d,Hopper 和Swimmer),智能體在每一個時刻都可以獲得即時獎勵反饋,期望它在探索的同時盡可能多地利用;相反,在稀疏獎勵環(huán)境中(包括 Sparse MountainCar,Sparse Hopper,Sparse Point,and Sparse SinglePendulum), 智能體只有達到一定目標才會得到獎懲反饋,所以在這類環(huán)境中更期望它具有優(yōu)秀的探索能力。

    4.2 實驗設置

    本文的探索方案基于DDPG 算法框架, 算法模型全部使用Python 來實現(xiàn), 并且使用 PyTorch 搭建深度神經(jīng)網(wǎng)絡結(jié)構(gòu)。 在整個實驗中,策略網(wǎng)絡(actor)和Q 網(wǎng)絡(critic)采用相同的網(wǎng)絡結(jié)構(gòu),與標準 DDPG結(jié)構(gòu)相同,使用了具有兩層隱含層(64-64)的多層感知機(MLP),隨機性策略網(wǎng)絡采用同樣的網(wǎng)絡結(jié)構(gòu),并且在輸出層使用兩個分支,分別輸出每一個動作分布的均值和方差。

    在實驗中,為進行公平比較,在訓練中所有的方法使用相同的超參數(shù),經(jīng)驗回放池太小設置為106,每個批次都是從經(jīng)驗回訪池中均勻隨機抽樣獲取的,batchsize 設置為 128,采用 Adam 優(yōu)化器,學習率取 1×10-3, 每一個環(huán)境的結(jié)果由10 個種子平均獲取,每個種子有 2×106步。

    4.3 實驗結(jié)果

    4.3.1 連續(xù)控制環(huán)境

    在連續(xù)控制環(huán)境下,將本文方法與DDPG 進行比較,并且在DDPG 中通過向確定性動作添加高斯噪聲來進行探索,如式(8)所示。 指標參數(shù)選擇平均回報值,在每個圖中,線代表算法在交互一定次數(shù)之后所能得到的各個種子下的平均回報值,并且陰影代表各個種子平均回報值的方差。

    實驗結(jié)果如圖2 所示,從結(jié)果來看,本文提出的SGDPG 在所有連續(xù)控制環(huán)境中達到的最終性能和樣本效率均優(yōu)于 DDPG,SGDPG 平均在 0.5×106個時間步長處就已經(jīng)達到 DDPG 在 2×106個時間步長處的平均回報值,并且在每個環(huán)境中,SGDPG 的陰影區(qū)域都要比 DDPG 的陰影區(qū)域小,說明 SGDPG 在多個種子中的表現(xiàn)更穩(wěn)定。 由此可見,聯(lián)合隨機性策略的探索方案可以提高確定性策略的泛化能力。

    4.3.2 稀疏獎勵環(huán)境

    在稀疏獎勵環(huán)境中,將本文方法與DDPG 進行比較,以評估算法的探索能力。實驗結(jié)果如圖3 所示,在三個稀疏獎勵環(huán)境中,由于缺乏明確的獎勵信號,DDPG 在這些環(huán)境中均未得到目標獎勵,這意味著添加高斯噪聲的局部探索方法是不可行的。 相反,本文提出的SGDPG 算法可以在隨機經(jīng)驗樣本的指導下呈現(xiàn)出更好的性能。 比如,在 Sparse Point 環(huán)境中,智能體只有進入指定的目標點的局部圓域內(nèi)才能得到獎勵,并且達到目標點能拿到更高的獎勵,由圖 3 可見,SGDPG 最終進入了密集獎勵區(qū)域,并且到達過指定目標點,而DDPG 全部失敗了。

    圖 2 連續(xù)控制環(huán)境實驗結(jié)果(從上至下,從左至右仿真環(huán)境依次為:Ant、HalfCheetah、Hopper、Swimmer 以及 Walker2d)

    圖 3 稀疏獎勵環(huán)境實驗結(jié)果(從左至右仿真環(huán)境依次為:Sparse Point、Sparse Hopper 以及 Sparse SinglePendulum)

    除此之外,為了更加突顯SGDPG 的探索能力,還在Sparse MountainCar 環(huán)境中進行了測試,在該環(huán)境中,智能體在山腳徘徊,控制加速度等物理量嘗試沖頂,只有到達山頂才能獲得獎勵信號,是一個完全稀疏獎勵的環(huán)境,與圖3 的三個環(huán)境相比條件更嚴苛,對算法的探索能力要求也更高。

    將 SGDPG 與基準算法 DDPG、隨機性策略梯度算法 TRPO[23]和 PPO 以及其他探索方法 VIME[11]和ICM[24]進行比較,實驗結(jié)果如表 1 所示,DDPG 在該任務中完全失敗,TRPO 和 PPO 在部分種子中登頂,VIME 和 ICM 具有更強的探索能力,但還是有失敗的現(xiàn)象,而SGDPG 在所有種子中均成功,達到100%的成功率。 綜上所述,SGDPG 相比于其他方法具有更強的探索能力。

    表1 完全稀疏獎勵環(huán)境實驗結(jié)果

    5 結(jié)論

    本文針對DRL 確定性策略無法探索的問題,提出了聯(lián)合隨機性策略的探索方案,并應用在DDPG算法中,得到具有探索能力的確定性策略算法SGDPG。結(jié)合隨機性策略的探索效率,利用隨機性策略的經(jīng)驗樣本指導確定性策略學會探索。 太量的實驗表明,該方法提升了DDPG 算法的泛化能力和探索效率,并且其探索能力比其他隨機性策略和探索算法更強,最終使得確定性策略在保持原有優(yōu)勢的同時學會探索。 后續(xù)工作考慮利用與任務相關(guān)的不確定性來進一步提高確定性策略的探索能力。

    猜你喜歡
    隨機性確定性樣本
    論中國訓詁學與經(jīng)典闡釋的確定性
    論法律解釋的確定性
    法律方法(2022年1期)2022-07-21 09:18:56
    含混還是明證:梅洛-龐蒂論確定性
    用樣本估計總體復習點撥
    推動醫(yī)改的“直銷樣本”
    隨機微分方程的樣本Lyapunov二次型估計
    淺析電網(wǎng)規(guī)劃中的模糊可靠性評估方法
    法律確定性的統(tǒng)合理性根據(jù)與法治實施
    社會科學(2016年6期)2016-06-15 20:29:09
    考慮負荷與分布式電源隨機性的配電網(wǎng)無功優(yōu)化
    適用于隨機性電源即插即用的模塊化儲能電池柜設計
    欧美高清性xxxxhd video| 天堂动漫精品| 久久久欧美国产精品| 欧美激情在线99| 床上黄色一级片| 午夜精品一区二区三区免费看| 亚洲av熟女| 日韩欧美三级三区| 熟妇人妻久久中文字幕3abv| 在线免费观看不下载黄p国产| 一级毛片电影观看 | 中文在线观看免费www的网站| 男人的好看免费观看在线视频| 久久精品国产亚洲av香蕉五月| 网址你懂的国产日韩在线| 观看免费一级毛片| 99久久精品国产国产毛片| 国产精品日韩av在线免费观看| 欧美日韩在线观看h| av在线蜜桃| 亚洲精华国产精华液的使用体验 | 12—13女人毛片做爰片一| 在线国产一区二区在线| 国内久久婷婷六月综合欲色啪| 色综合站精品国产| 久久久午夜欧美精品| 国产白丝娇喘喷水9色精品| 丝袜喷水一区| 又爽又黄无遮挡网站| 18禁裸乳无遮挡免费网站照片| 亚洲av免费在线观看| 又粗又爽又猛毛片免费看| 看黄色毛片网站| 女人十人毛片免费观看3o分钟| 男女啪啪激烈高潮av片| 男人狂女人下面高潮的视频| 18禁黄网站禁片免费观看直播| 国产久久久一区二区三区| 天堂动漫精品| 99久久九九国产精品国产免费| 国产黄色视频一区二区在线观看 | 欧美+日韩+精品| 亚洲五月天丁香| 嫩草影视91久久| 成年版毛片免费区| 国产精品不卡视频一区二区| 欧美另类亚洲清纯唯美| 99热全是精品| 国产精品嫩草影院av在线观看| 男女视频在线观看网站免费| 中文字幕熟女人妻在线| 男女做爰动态图高潮gif福利片| 大型黄色视频在线免费观看| 成人高潮视频无遮挡免费网站| 亚洲在线观看片| 免费看日本二区| 国产黄色视频一区二区在线观看 | 97热精品久久久久久| 97在线视频观看| 国产精品国产三级国产av玫瑰| 国产午夜精品久久久久久一区二区三区 | 女生性感内裤真人,穿戴方法视频| 我的老师免费观看完整版| 黄色一级大片看看| 天堂av国产一区二区熟女人妻| 精品午夜福利视频在线观看一区| 亚洲高清免费不卡视频| 俄罗斯特黄特色一大片| 午夜福利在线在线| 人人妻人人澡人人爽人人夜夜 | 日韩强制内射视频| av免费在线看不卡| 精品一区二区免费观看| 小说图片视频综合网站| 亚洲第一电影网av| 免费高清视频大片| 亚洲国产日韩欧美精品在线观看| 美女内射精品一级片tv| ponron亚洲| 在线播放无遮挡| 国产精品嫩草影院av在线观看| 日日撸夜夜添| 日韩精品中文字幕看吧| a级毛色黄片| 亚洲精品粉嫩美女一区| 在线观看免费视频日本深夜| 亚洲精品456在线播放app| 十八禁网站免费在线| 国产精品亚洲一级av第二区| 国产综合懂色| 卡戴珊不雅视频在线播放| 久久精品国产亚洲av香蕉五月| 久久久久免费精品人妻一区二区| 亚洲人成网站高清观看| 午夜久久久久精精品| 亚洲aⅴ乱码一区二区在线播放| 91在线精品国自产拍蜜月| 国产一区二区在线av高清观看| 欧美日本亚洲视频在线播放| 亚洲国产精品成人综合色| 国产不卡一卡二| 久久鲁丝午夜福利片| 亚洲欧美成人精品一区二区| 直男gayav资源| 人妻少妇偷人精品九色| 俺也久久电影网| 乱人视频在线观看| 国产精品国产三级国产av玫瑰| 亚洲激情五月婷婷啪啪| 精品少妇黑人巨大在线播放 | 国产免费男女视频| 午夜免费男女啪啪视频观看 | 欧美三级亚洲精品| 熟妇人妻久久中文字幕3abv| 日日摸夜夜添夜夜添小说| 在线看三级毛片| 免费观看的影片在线观看| 97热精品久久久久久| 69av精品久久久久久| 亚洲av熟女| 亚洲18禁久久av| 亚洲真实伦在线观看| 日本免费一区二区三区高清不卡| 在线观看免费视频日本深夜| 婷婷亚洲欧美| 熟妇人妻久久中文字幕3abv| a级一级毛片免费在线观看| 十八禁国产超污无遮挡网站| 免费黄网站久久成人精品| 99热这里只有是精品在线观看| 久久午夜亚洲精品久久| 男女视频在线观看网站免费| 免费大片18禁| 91久久精品国产一区二区三区| 国产男人的电影天堂91| 成人国产麻豆网| 日韩欧美 国产精品| 亚洲人成网站在线播放欧美日韩| 国产色婷婷99| 午夜久久久久精精品| 久久久久精品国产欧美久久久| 久久精品国产99精品国产亚洲性色| 少妇的逼水好多| 久99久视频精品免费| 亚洲aⅴ乱码一区二区在线播放| 日日撸夜夜添| 深夜a级毛片| av在线亚洲专区| 观看免费一级毛片| 又爽又黄a免费视频| 在现免费观看毛片| 亚洲aⅴ乱码一区二区在线播放| 成人毛片a级毛片在线播放| 国产黄片美女视频| 欧美高清成人免费视频www| 国产大屁股一区二区在线视频| 国产日本99.免费观看| 日本欧美国产在线视频| 免费搜索国产男女视频| 搡老妇女老女人老熟妇| 国产不卡一卡二| 精品福利观看| av专区在线播放| 国产麻豆成人av免费视频| 亚洲精品色激情综合| 身体一侧抽搐| 中文字幕久久专区| 国产美女午夜福利| 亚洲熟妇中文字幕五十中出| 婷婷精品国产亚洲av| 欧美成人免费av一区二区三区| 久久九九热精品免费| 色吧在线观看| 精品一区二区三区视频在线观看免费| 小说图片视频综合网站| 在线观看av片永久免费下载| 欧美日韩在线观看h| 亚洲欧美成人综合另类久久久 | 日韩中字成人| 国产精品国产三级国产av玫瑰| 偷拍熟女少妇极品色| 欧美日韩乱码在线| 色播亚洲综合网| 老司机影院成人| 国产日本99.免费观看| 午夜久久久久精精品| 搡老熟女国产l中国老女人| 女同久久另类99精品国产91| 国产高潮美女av| 久久热精品热| 亚洲成人久久性| 成人三级黄色视频| 亚洲乱码一区二区免费版| 欧美日本亚洲视频在线播放| 日本五十路高清| 美女大奶头视频| 国产一区二区三区av在线 | 国产黄色视频一区二区在线观看 | 亚洲电影在线观看av| 免费在线观看影片大全网站| 日本五十路高清| 国产一区亚洲一区在线观看| 免费高清视频大片| 一夜夜www| 69人妻影院| 亚洲高清免费不卡视频| 美女cb高潮喷水在线观看| 麻豆乱淫一区二区| 日本一本二区三区精品| 日韩在线高清观看一区二区三区| 精品福利观看| 大型黄色视频在线免费观看| 少妇人妻一区二区三区视频| 精品一区二区免费观看| 麻豆国产97在线/欧美| av卡一久久| 国产亚洲欧美98| 国产av一区在线观看免费| 成人精品一区二区免费| 青春草视频在线免费观看| 亚洲三级黄色毛片| 久久久久久久久中文| 波野结衣二区三区在线| 插逼视频在线观看| 精品人妻视频免费看| 菩萨蛮人人尽说江南好唐韦庄 | 在现免费观看毛片| 午夜福利成人在线免费观看| 国内精品久久久久精免费| 精品少妇黑人巨大在线播放 | 三级毛片av免费| 成人欧美大片| 黄色一级大片看看| 一进一出抽搐gif免费好疼| 久久婷婷人人爽人人干人人爱| 欧美日韩乱码在线| 99热6这里只有精品| 99热精品在线国产| 婷婷亚洲欧美| 日韩精品青青久久久久久| 久久亚洲精品不卡| 一级毛片久久久久久久久女| 亚洲欧美日韩高清专用| 九九爱精品视频在线观看| 国产伦在线观看视频一区| 免费在线观看影片大全网站| 久久久久久久久大av| 久久精品综合一区二区三区| 一级毛片我不卡| 别揉我奶头 嗯啊视频| 亚洲欧美日韩东京热| 蜜臀久久99精品久久宅男| 男女做爰动态图高潮gif福利片| 搡老妇女老女人老熟妇| 精品人妻熟女av久视频| 人妻制服诱惑在线中文字幕| 一区二区三区免费毛片| 久久草成人影院| 国产成人a区在线观看| h日本视频在线播放| 亚洲成人精品中文字幕电影| 变态另类丝袜制服| 老司机影院成人| 亚洲不卡免费看| 成年女人永久免费观看视频| 少妇猛男粗大的猛烈进出视频 | 国产av在哪里看| 成年女人永久免费观看视频| 欧美色视频一区免费| 午夜精品国产一区二区电影 | 国产精品日韩av在线免费观看| 亚洲欧美清纯卡通| 亚洲精品456在线播放app| 少妇的逼水好多| 又粗又爽又猛毛片免费看| 国产一区二区激情短视频| 俺也久久电影网| 国产91av在线免费观看| 成年版毛片免费区| 国产不卡一卡二| 女人十人毛片免费观看3o分钟| 亚洲人成网站在线播| 免费看光身美女| 99久久久亚洲精品蜜臀av| 99久久中文字幕三级久久日本| 99九九线精品视频在线观看视频| 麻豆乱淫一区二区| 日韩欧美在线乱码| 国语自产精品视频在线第100页| 免费看a级黄色片| 国产探花极品一区二区| 91午夜精品亚洲一区二区三区| 亚洲熟妇中文字幕五十中出| 美女cb高潮喷水在线观看| 国产色爽女视频免费观看| 亚洲成人久久性| 色哟哟·www| 韩国av在线不卡| 亚洲精华国产精华液的使用体验 | 欧美日韩一区二区视频在线观看视频在线 | 久久精品国产亚洲av涩爱 | 国产老妇女一区| 久久精品夜夜夜夜夜久久蜜豆| 一个人观看的视频www高清免费观看| 国产 一区 欧美 日韩| 国产精品亚洲一级av第二区| 久久99热这里只有精品18| 性色avwww在线观看| 天堂影院成人在线观看| 在线观看66精品国产| 午夜影院日韩av| a级毛片免费高清观看在线播放| 成年女人毛片免费观看观看9| 国产精品亚洲美女久久久| 亚洲精品日韩av片在线观看| 免费观看人在逋| 女人被狂操c到高潮| 18+在线观看网站| 人人妻,人人澡人人爽秒播| 天美传媒精品一区二区| 精品日产1卡2卡| 伊人久久精品亚洲午夜| 亚洲精品成人久久久久久| av在线天堂中文字幕| 夜夜夜夜夜久久久久| 成人永久免费在线观看视频| 色在线成人网| 免费大片18禁| 亚洲精品久久国产高清桃花| 蜜桃亚洲精品一区二区三区| 免费无遮挡裸体视频| 国产精品一区二区三区四区免费观看 | 3wmmmm亚洲av在线观看| 国内精品一区二区在线观看| 人妻久久中文字幕网| 91在线精品国自产拍蜜月| 日韩中字成人| 国产国拍精品亚洲av在线观看| 一边摸一边抽搐一进一小说| 中文在线观看免费www的网站| 亚洲欧美精品自产自拍| 十八禁网站免费在线| 国产欧美日韩一区二区精品| 亚洲欧美成人精品一区二区| www日本黄色视频网| 日韩欧美精品免费久久| 十八禁国产超污无遮挡网站| 国产熟女欧美一区二区| 久久久久久国产a免费观看| 成人亚洲精品av一区二区| 日本成人三级电影网站| 亚洲熟妇中文字幕五十中出| 51国产日韩欧美| 日韩大尺度精品在线看网址| 精品一区二区三区人妻视频| 少妇的逼好多水| 国产视频内射| 国产毛片a区久久久久| 精品国产三级普通话版| 日韩高清综合在线| 联通29元200g的流量卡| 22中文网久久字幕| 欧美性猛交黑人性爽| 人妻少妇偷人精品九色| 麻豆一二三区av精品| 人人妻人人澡欧美一区二区| 69人妻影院| 久久久久精品国产欧美久久久| 悠悠久久av| 美女xxoo啪啪120秒动态图| 成年免费大片在线观看| 一个人看的www免费观看视频| 亚洲综合色惰| 日本欧美国产在线视频| 人人妻人人看人人澡| 大又大粗又爽又黄少妇毛片口| 国产视频一区二区在线看| 97在线视频观看| 色av中文字幕| 欧美三级亚洲精品| 天堂√8在线中文| 欧美丝袜亚洲另类| 欧美+日韩+精品| 免费电影在线观看免费观看| 亚洲人与动物交配视频| 人妻制服诱惑在线中文字幕| 亚洲一级一片aⅴ在线观看| a级毛色黄片| 国产高清不卡午夜福利| 变态另类丝袜制服| 美女 人体艺术 gogo| 91在线观看av| 亚洲美女视频黄频| 亚洲国产精品成人久久小说 | 18+在线观看网站| 日韩精品有码人妻一区| 国产精品嫩草影院av在线观看| 中文字幕av在线有码专区| 深夜a级毛片| 男人的好看免费观看在线视频| 亚洲人成网站在线观看播放| 久久久午夜欧美精品| 噜噜噜噜噜久久久久久91| 久久九九热精品免费| 午夜日韩欧美国产| 五月伊人婷婷丁香| 午夜福利在线观看吧| 国产在线精品亚洲第一网站| 久久久久久九九精品二区国产| a级毛片免费高清观看在线播放| 最新在线观看一区二区三区| 亚洲欧美日韩东京热| 久久久久久伊人网av| 国产片特级美女逼逼视频| 国产亚洲精品av在线| 欧美日韩精品成人综合77777| 亚洲精品国产av成人精品 | 亚洲无线观看免费| 黄片wwwwww| 一本一本综合久久| 国产在线男女| 午夜福利18| 男插女下体视频免费在线播放| 老师上课跳d突然被开到最大视频| 亚洲av二区三区四区| 久久人人爽人人爽人人片va| 国产黄色视频一区二区在线观看 | 悠悠久久av| 偷拍熟女少妇极品色| 男人狂女人下面高潮的视频| 91在线观看av| 成人三级黄色视频| 黄色视频,在线免费观看| 久久国内精品自在自线图片| 亚洲av成人精品一区久久| 精品久久久久久久久亚洲| av视频在线观看入口| 精品久久久噜噜| 国产伦在线观看视频一区| 老熟妇仑乱视频hdxx| 99热只有精品国产| 97超级碰碰碰精品色视频在线观看| 成人特级黄色片久久久久久久| 少妇被粗大猛烈的视频| 亚洲人与动物交配视频| 精品不卡国产一区二区三区| 国产国拍精品亚洲av在线观看| 中文字幕免费在线视频6| 亚洲性久久影院| 久久中文看片网| 国产美女午夜福利| 亚洲av二区三区四区| 精品国产三级普通话版| 毛片一级片免费看久久久久| 亚洲在线自拍视频| 国产一级毛片七仙女欲春2| 国产精品亚洲美女久久久| 男女啪啪激烈高潮av片| 亚洲精品粉嫩美女一区| 天堂影院成人在线观看| 国产精品综合久久久久久久免费| 男女视频在线观看网站免费| 亚洲欧美中文字幕日韩二区| 91在线观看av| 亚洲熟妇中文字幕五十中出| 午夜激情欧美在线| 在线天堂最新版资源| 亚洲自偷自拍三级| 在线播放国产精品三级| 插逼视频在线观看| 日本免费a在线| 亚洲第一电影网av| www日本黄色视频网| 99久久无色码亚洲精品果冻| 欧美高清成人免费视频www| 美女免费视频网站| a级毛色黄片| 国语自产精品视频在线第100页| 亚洲精品国产成人久久av| 国产久久久一区二区三区| 日韩欧美在线乱码| 在线免费观看的www视频| 午夜福利视频1000在线观看| 黄色一级大片看看| 亚洲18禁久久av| 欧洲精品卡2卡3卡4卡5卡区| 国产精品一区二区性色av| 亚洲精品粉嫩美女一区| 久久久久精品国产欧美久久久| h日本视频在线播放| 校园人妻丝袜中文字幕| 又爽又黄a免费视频| 国产精品亚洲美女久久久| 男人舔女人下体高潮全视频| 午夜精品在线福利| 国语自产精品视频在线第100页| 国产成人91sexporn| 久久精品国产99精品国产亚洲性色| 亚洲人成网站在线播放欧美日韩| 免费不卡的大黄色大毛片视频在线观看 | 亚洲成人久久爱视频| 欧美日韩一区二区视频在线观看视频在线 | 国产女主播在线喷水免费视频网站 | 久久国内精品自在自线图片| 国产探花在线观看一区二区| 久久久久久久久大av| 最近的中文字幕免费完整| 国内精品美女久久久久久| 中国国产av一级| 精品久久久久久久人妻蜜臀av| 一级a爱片免费观看的视频| 91在线精品国自产拍蜜月| 国产亚洲精品综合一区在线观看| 久久久午夜欧美精品| 简卡轻食公司| 日韩国内少妇激情av| 色哟哟·www| 亚洲国产精品久久男人天堂| 日韩中字成人| 国产片特级美女逼逼视频| 成人特级黄色片久久久久久久| АⅤ资源中文在线天堂| 乱系列少妇在线播放| 国产午夜福利久久久久久| 一级毛片久久久久久久久女| 亚洲三级黄色毛片| 亚洲欧美日韩无卡精品| 亚洲五月天丁香| 亚洲最大成人中文| 亚洲七黄色美女视频| 国产探花极品一区二区| 久久婷婷人人爽人人干人人爱| 亚洲人成网站在线播| 午夜影院日韩av| 99热网站在线观看| 日本撒尿小便嘘嘘汇集6| 男女啪啪激烈高潮av片| 午夜爱爱视频在线播放| 黄色日韩在线| 欧美xxxx黑人xx丫x性爽| 99久久九九国产精品国产免费| 亚洲av熟女| 午夜视频国产福利| 亚洲熟妇中文字幕五十中出| 91精品国产九色| 男女啪啪激烈高潮av片| 精品久久久久久久末码| 久久久久国产网址| 色综合站精品国产| 亚洲av中文字字幕乱码综合| 亚洲综合色惰| 在线播放国产精品三级| 国产女主播在线喷水免费视频网站 | av女优亚洲男人天堂| 日本-黄色视频高清免费观看| 黄色视频,在线免费观看| 免费av观看视频| 国产精品,欧美在线| 国产精品久久电影中文字幕| 又粗又爽又猛毛片免费看| 成人性生交大片免费视频hd| 欧美日韩综合久久久久久| 日韩强制内射视频| 中文字幕免费在线视频6| 国产精品久久久久久久电影| 69av精品久久久久久| 99精品在免费线老司机午夜| 亚洲内射少妇av| 久久久国产成人免费| 国产精品一区二区三区四区免费观看 | 小蜜桃在线观看免费完整版高清| 国产欧美日韩精品亚洲av| 亚洲国产精品久久男人天堂| 男人舔女人下体高潮全视频| 51国产日韩欧美| 人人妻人人看人人澡| or卡值多少钱| 99热精品在线国产| 国产一区二区亚洲精品在线观看| 精品久久久久久久久久久久久| 精品一区二区免费观看| 老司机午夜福利在线观看视频| 美女免费视频网站| 给我免费播放毛片高清在线观看| 成人特级黄色片久久久久久久| 久久精品综合一区二区三区| 午夜视频国产福利| www日本黄色视频网| 国产91av在线免费观看| 国产乱人视频| 最近2019中文字幕mv第一页| 伦理电影大哥的女人| 日韩av在线大香蕉| 亚洲,欧美,日韩| 两个人视频免费观看高清| 人人妻人人看人人澡| 亚洲最大成人av| 人妻久久中文字幕网| 亚洲中文字幕日韩| 久久韩国三级中文字幕| 国产亚洲精品久久久久久毛片| 日日干狠狠操夜夜爽| 亚洲精品一卡2卡三卡4卡5卡| 日本a在线网址| 国产精品国产高清国产av| 俄罗斯特黄特色一大片| 又黄又爽又免费观看的视频| 国产精品一区二区三区四区久久| 亚洲在线自拍视频| 久久久久久伊人网av| 欧美一级a爱片免费观看看| 亚洲精华国产精华液的使用体验 | 成人av一区二区三区在线看| 免费大片18禁| 人人妻人人看人人澡|