• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于啟發(fā)函數(shù)改進(jìn)的SARSA(λ)算法*

    2016-06-22 01:38:40馬朋委潘地林
    關(guān)鍵詞:強(qiáng)化學(xué)習(xí)

    馬朋委 潘地林

    (安徽理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 淮南 232001)

    ?

    基于啟發(fā)函數(shù)改進(jìn)的SARSA(λ)算法*

    馬朋委潘地林

    (安徽理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院淮南232001)

    摘要強(qiáng)化學(xué)習(xí)是一種重要的機(jī)器學(xué)習(xí)方法,在機(jī)器人路徑規(guī)劃,智能控制等許多決策問題中取得了成功的應(yīng)用,已經(jīng)成為機(jī)器學(xué)習(xí)研究的一個(gè)重要分支。針對強(qiáng)化學(xué)習(xí)存在著的收斂慢,學(xué)習(xí)知識慢,探索與利用平衡等問題,論文對SARSA(λ)算法提出了一種改進(jìn),改進(jìn)的方法借助經(jīng)驗(yàn)知識從環(huán)境特征中提出一個(gè)用于策略擇優(yōu)和優(yōu)化回報(bào)函數(shù)的啟發(fā)函數(shù),以此來加速算法的收斂速度。通過仿真對比,論文提出改進(jìn)算法具有比SARSA(λ)更快的獎賞反饋,表明了該算法在知識學(xué)習(xí)方面的有效性。

    關(guān)鍵詞強(qiáng)化學(xué)習(xí); SARSA(λ); 啟發(fā)函數(shù); 評估學(xué)習(xí)

    Class NumberTP301.6

    1引言

    20世紀(jì)90年代強(qiáng)化學(xué)習(xí)通過與運(yùn)籌學(xué)、控制理論的交叉結(jié)合,在控制理論和算法方面取得若干突破性的研究成果,奠定了強(qiáng)化學(xué)習(xí)的理論基礎(chǔ),并在智能控制、機(jī)器人系統(tǒng)規(guī)及分析預(yù)測等序貫決策中取得了成功的應(yīng)用[1~2]。強(qiáng)化學(xué)習(xí)是一個(gè)試錯(cuò)學(xué)習(xí)的過程,目的是使Agent從環(huán)境中獲得的累積獎賞值最大。Agent在環(huán)境中執(zhí)行一個(gè)動作,到達(dá)下一個(gè)狀態(tài),同時(shí)給予Agent一個(gè)強(qiáng)化信號[3](獎勵或懲罰),Agent借助環(huán)境給予的強(qiáng)化新號來對原有的策略進(jìn)行改進(jìn),最終目的是最大化累積獎賞值。

    強(qiáng)化學(xué)習(xí)大部分都是以馬爾科夫決策過程(Markov Decision Process)為基礎(chǔ)。馬爾科夫決策過程借助四元組(S,A,P,r)來描述。S為環(huán)境狀態(tài)空間,A為動作空間,P(s,a,s′)為狀態(tài)轉(zhuǎn)移概率,r為立即回報(bào)函數(shù)。在馬爾科夫決策過程中,Agent是通過一個(gè)決策函數(shù)(即策略)來選擇動作的,常用π表示策略。在定義了策略后對應(yīng)狀態(tài)-動作值函數(shù)為Qπ(s,a),Qπ(s,a)表示在狀態(tài)s下根據(jù)策略π執(zhí)行動作a的期望值如式(1):

    (1)

    最優(yōu)動作值函數(shù)Q*(s,a)的定義為式(2):

    Q*(s,a)=maxπQπ(s,a)

    (2)

    最優(yōu)策略π*是使得Agent在每一個(gè)狀態(tài)下均能獲得最大值的策略如式(3):

    (3)

    一些強(qiáng)化學(xué)習(xí)算法已經(jīng)在理論和應(yīng)用方面取得了重大的成功Q_learning[4],TD(λ)[5],SARSA[6]。本文借助將人的經(jīng)驗(yàn)和背景知識融入到強(qiáng)化學(xué)習(xí)中,基于SARSA(λ)提出一個(gè)改進(jìn)的一個(gè)啟發(fā)函數(shù),提高Agent對環(huán)境知識的學(xué)習(xí),加快算法的收斂。

    2SARSA(λ)簡介

    SARSA算法是強(qiáng)化學(xué)習(xí)中的一種在策略(on-policy)的時(shí)序差分算法[7]。它由Rummery和Niranjan在1994年提出了一種基于模型的算法,最初稱為改進(jìn)的Q學(xué)習(xí)算法,后稱為SARSA(STATE-ACTION-REWARD-STATE-ACTION)學(xué)習(xí)算法[8]。SARSA在更新時(shí)借助五元組(s,a,r,s′,a′)其中:s表示當(dāng)前狀態(tài);a表示當(dāng)前狀態(tài)下選擇的動作;r是選擇動作a后獲得的獎勵;s′和a′則分別代表后續(xù)的狀態(tài)和動作。SARSA算法中動作值函數(shù)的更新規(guī)則如式(4)所示:

    δ=[r+γQ(s′,a′)-Q(s,a)]

    Q(s,a)←Q(s,a)+αδ

    (4)

    γ為折扣因子;α是步長參數(shù),0≤α≤1和0<γ≤1。

    在Q_learning和SARSA算法中,當(dāng)接收到一個(gè)獎賞值時(shí)只向后回溯一步,相當(dāng)于做了一步備份,導(dǎo)致算法收斂緩慢,一個(gè)改進(jìn)的方法是回溯任意步,稱為SARSA(λ)算法,其動作值函數(shù)跟新規(guī)則如式(5):

    δ=[r+γQ(s′,a′)-Q(s,a)]

    Q(s,a)←Q(s,a)+αδe(s′,a′)

    (5)

    其中e(s,a)為狀態(tài)的“資格跡”(eligibility trace)[9]。借助資格跡來體現(xiàn)每一步對結(jié)果負(fù)的責(zé)任大小。一個(gè)“狀態(tài)-動作對”第一次被訪問時(shí),將它的資格跡設(shè)置為1。在隨后的每個(gè)時(shí)間步里,它的資格跡應(yīng)是不斷減少的,當(dāng)該狀態(tài)再次被訪問時(shí),其資格跡加1。資格跡的定義如式(6):

    (6)

    其中表示狀態(tài)s在t時(shí)刻的跡,SARSA(λ)使Agent對環(huán)境知識的學(xué)習(xí)有一定程度的進(jìn)步,但對環(huán)境知識的學(xué)習(xí)依然是緩慢的,忽略了大量有用的信息和知識。由于缺乏有效的策略選擇機(jī)制,常需在狀態(tài)空間進(jìn)行多次遍歷才能收斂。針對SARSA(λ)存在的問題,本文引入啟發(fā)(Heuristic)函數(shù)加速(Accelerate)算法對環(huán)境知識的學(xué)習(xí),簡稱HASARSA(λ)算法。借助啟發(fā)函數(shù)改進(jìn)策略的選擇,優(yōu)化回報(bào)函數(shù),相比SARSA(λ)對環(huán)境知識的學(xué)習(xí)有明顯的提高。

    3HASARSA(λ)設(shè)計(jì)

    強(qiáng)化學(xué)習(xí)算法是通過不斷地與環(huán)境交互,從當(dāng)前一個(gè)狀態(tài)s,選取一個(gè)動作a,到達(dá)下一個(gè)狀態(tài)s′,獲得該動作a的一個(gè)獎賞值,強(qiáng)化學(xué)習(xí)算法的關(guān)鍵問題在于動作選擇函數(shù)和回報(bào)函數(shù)的設(shè)計(jì),本文通過設(shè)計(jì)一個(gè)啟發(fā)函數(shù)來改進(jìn)動作的選擇,優(yōu)化回報(bào)函數(shù),來加快算法的收斂。啟發(fā)函數(shù)的定義主要來自兩方面,一方面是借助先驗(yàn)領(lǐng)域知識,一方面是在學(xué)習(xí)的過程利用學(xué)習(xí)獲得的信息。文獻(xiàn)[10]提出了大多數(shù)啟發(fā)函數(shù)的定義分為兩個(gè)階段,第一階段是根據(jù)值函數(shù)V進(jìn)行領(lǐng)域結(jié)構(gòu)的提取,稱作結(jié)構(gòu)提取[10]。第二階段是在結(jié)構(gòu)提取后構(gòu)造啟發(fā)式函數(shù),稱為啟發(fā)式構(gòu)造。SARSA(λ)在引入啟發(fā)式函數(shù)的強(qiáng)化學(xué)習(xí)模型如圖1所示。

    圖1 啟發(fā)式強(qiáng)化學(xué)習(xí)框架圖

    圖1表明在原有的強(qiáng)化學(xué)習(xí)框架基礎(chǔ)上引入了特征節(jié)點(diǎn),并從特征中提取了附加回報(bào)和調(diào)和函數(shù)對原有的動作選擇策略和回報(bào)函數(shù)進(jìn)行優(yōu)化。

    3.1策略選擇函數(shù)

    Q_learning,SARSA算法在選擇策略上通常選用ε-greedy算法。

    ε-greedy選擇策略定義如式(7):

    (7)

    其中π(st)表示策略選擇函數(shù),p為探索-利用平衡的參數(shù),p越大,算法越傾向于利用已有的知識,arandom是當(dāng)前動作集合中的一個(gè)隨機(jī)動作。加入啟發(fā)函數(shù)后改進(jìn)的動作選擇函數(shù)如式(8):

    (8)

    相比式(7)多了一個(gè)調(diào)和函數(shù)Ht(st,at),值可正可負(fù)。目的使Agent在執(zhí)行選擇策略過程中,通過調(diào)和函數(shù)來折中分析動作的好壞,不斷強(qiáng)化好的動作,弱化差的動作,借此來指導(dǎo)動作的選擇,減少都無用狀態(tài)的探索,加速算法的收斂過程。

    3.2回報(bào)函數(shù)

    啟發(fā)函數(shù)的回報(bào)函數(shù)分為兩部分,原立即回報(bào)函數(shù)和附加回報(bào)函數(shù)如式(9):

    R(st)=r+r′(st,at)

    (9)

    式中r為立即回報(bào),是借助人的經(jīng)驗(yàn)和背景知識,對環(huán)境的特征提取,設(shè)置的附加回報(bào)函數(shù)。

    4實(shí)驗(yàn)結(jié)果仿真分析

    4.1啟發(fā)函數(shù)的設(shè)計(jì)

    啟發(fā)函數(shù)的設(shè)計(jì)依賴一定的環(huán)境問題背景,在這里選取一個(gè)20×20 Maze,state表示Agent的狀態(tài),坐標(biāo)(x,y)。Agent開始狀態(tài)隨機(jī)生成,終點(diǎn)狀態(tài)為state(20,20)。Agent可以執(zhí)行的動作為上下左右,r表示執(zhí)行一個(gè)動作后到達(dá)下一個(gè)狀態(tài)獲得的獎賞。如果是終點(diǎn)給予10的正獎勵值,陷阱則給予負(fù)獎賞值-5,撞墻或遇到障礙物給予-1的獎賞值,其它情況給予0。

    立即回報(bào)r可以表示如式(10):

    (10)

    為了定義啟發(fā)函數(shù),本文從環(huán)境中提取如下三個(gè)特征:

    1) 本文借助Agent離終點(diǎn)的距離來表示該狀態(tài)的重要性。用Wij表示state(i,j)的權(quán)重,Wij=(i+j)/40(i,j為該狀態(tài)的坐標(biāo)位置),離終點(diǎn)越近的位置權(quán)重越大,給予的附加獎賞就越大。啟發(fā)后的回報(bào)函數(shù)可寫成R=r+Wij*β,β取一個(gè)較小的正數(shù),以免對已有的獎賞值產(chǎn)生較大的干擾。

    2) 可以通過兩個(gè)坐標(biāo)的差值Δd=(x1-x2)+(y1-y2)來反映與終點(diǎn)的距離變化關(guān)系。Δd小于0反應(yīng)越接近最終目標(biāo)。

    3) 越靠近正獎賞(也就是最終目標(biāo))的狀態(tài)的Q值近似呈增大趨勢,越靠近負(fù)獎賞(陷阱、障礙、墻壁)Q值呈近似減小趨勢。Q值的正負(fù)也隱藏體現(xiàn)著與終點(diǎn)的距離。

    從分析中可以看出,特征2),3)都從某種程度上反映了與終點(diǎn)距離的關(guān)系。因此動作選擇函數(shù)中的協(xié)調(diào)函數(shù)可以表示如式(11):

    (11)

    其中θ取一個(gè)較小的數(shù),e[s,a]表示資格跡,借助資格跡來減小調(diào)和函數(shù)H(st,at)累積效應(yīng)所產(chǎn)生的誤差。

    4.2HASARSA(λ)算法

    begin

    初始化Q(s,a),e(s,a),從環(huán)境中提取特征,結(jié)合經(jīng)驗(yàn)知識構(gòu)造啟發(fā)函數(shù),觀察目前的狀態(tài),利用基于改進(jìn)的ε-greedy算法選取動作a

    repeat forever

    執(zhí)行行為a

    觀察獎賞R和狀態(tài)s′

    R=r+r′

    利用基于改進(jìn)的ε-greedy算法選取動作a′

    s←s′

    a←a′

    end repeat

    end

    4.3程序仿真圖

    建筑工程設(shè)計(jì)管理過程中,通過對BIM 模型的高效利用,有利于為建筑給排水、電氣和暖通等專業(yè)的協(xié)調(diào)配合提供技術(shù)支持,滿足建筑工程設(shè)計(jì)中管線整體剖析、碰撞查驗(yàn)、主要區(qū)域凈空剖析、結(jié)構(gòu)預(yù)留洞校驗(yàn)以及弱電專項(xiàng)剖析等方面的要求,并得到碰撞檢查匯報(bào)、凈空剖析匯報(bào)、結(jié)構(gòu)預(yù)留洞優(yōu)化圖紙(預(yù)埋套管圖)、綜合管線審核匯報(bào)與優(yōu)化圖紙等,從而實(shí)現(xiàn)對工程設(shè)計(jì)管理要素的深入分析,建立與建筑工程密切相關(guān)的BIM模型并加以利用,促使實(shí)踐中的建筑工程設(shè)計(jì)管理更加高效,進(jìn)而有效避免工程設(shè)計(jì)管理問題的發(fā)生。

    借助Matlab進(jìn)行仿真,取ε為0.2,折扣率γ為0.9,步長α為0.1,得到仿真圖如圖2所示。

    圖2 兩種算法的對比圖

    圖2中橫坐標(biāo)episode為迭代次數(shù),縱坐標(biāo)totoalreward為總獎賞值。箭頭所指位置對應(yīng)兩種算法總獎賞值為0的坐標(biāo)。對比兩個(gè)算法的結(jié)果:雖然SARSA(λ)和HASARSA(λ)算法剛開始獲得了負(fù)獎賞,但HASARSA(λ)獲得負(fù)獎賞明顯比前者少,這表明HASARSA(λ)在執(zhí)行中更多地避開了那些會獲得負(fù)獎賞的狀態(tài)。當(dāng)算法進(jìn)行2000次迭代,HASARSA(λ)總獎賞值已經(jīng)開始為正值,并且接下來總獎賞值增長迅速,相比SARSA(λ)在3000次迭代后才為正值,而且增長速率比較平緩。這體現(xiàn)了HASARSA(λ)可以充分利用環(huán)境特征,使智能體的學(xué)習(xí)速度達(dá)到很大提升,體現(xiàn)了算法的可行性。

    5結(jié)語

    雖然HASARSA(λ)可以借助從環(huán)境特征提取啟發(fā)函數(shù),來使智能體學(xué)習(xí)知識的能力得到提升,但該算法也有一定的缺陷,定義啟發(fā)函數(shù)需要依賴環(huán)境特征和知識背景,沒有一個(gè)通用的標(biāo)準(zhǔn)。

    參 考 文 獻(xiàn)

    [1] 史忠植.智能科學(xué)[M].北京:清華大學(xué)出版社,2006:31-35.

    SHI Zhongzhi. Intelligent science[M]. Beijing: Tsinghua University Press,2006:31-35.

    [2] MItchell T M.機(jī)器學(xué)習(xí)[M].曾華軍,譯.北京:機(jī)械工業(yè)出版社,2008:23-27.

    [3] 金釗.加速強(qiáng)化學(xué)習(xí)方法研究[D].昆明:云南大學(xué),2010:32-36.

    JIN Zhao. Accelerate the reinforcement learning method research[D]. Kunming: Yunnan University,2010:32-36.

    [4] L. P. Kael bling, M. L. Litt man, A. W. Moore. Reinforcement Learning: A Survey[R]. Arxiv preprint cs/9605103,1996:237-285.

    [5] L. Tang, B. An, D. Cheng. An agent reinforcement learning model based on neural networks[C]//Bio-Inspired Computational Intelligence and Applications,2007:117-127.

    [6] Jinsong, Leng, Lakhmi Jain, Colin Fyfe. Convergence Analysis on Approximate Reinforcement Learning[C]//Z.Zhang and Siekmann (Eds): KSEM 2007, LNAI 4798, pp.85-91.

    [7] Rummery, G A, Niranjan, M. On-line Q_learning using connectionist system[D]. London: Cambridge University,1994.

    [8] SUTTONRS, BARTO AG. Reinforcement learning: an introduction[M]. Cambridge: MIT,1998:150-185.

    [9] Singh S P, Sutton R S. Reinforcement learning with replacing eligibility traces[J]. Machine Learning,1996,(22):123-158.

    [10] Bianchi R A C, Ribeiro C H C, Costa A H R. Accelerating autonomous learning by using heuristic selection of actions[J]. Journal of Heuristics,2008,14(2):135-168.

    SARSA (λ) Algorithm Based on Heuristic Function

    MA PengweiPAN Dilin

    (School of Computer Science and Engineering, Anhui University of Science and Technology, Huainan232001)

    AbstractReinforcement learning is an important method of machine learning research. The success in robot path planning, intelligent control and many other successful application in decision making problems make it become an important component of machine learning. But it is also has the problem of slow convergence, slow learning, exploration and utilization of balance. In this paper, an improved algorithm is proposed based on SARSA (λ), which can extract features form the environment and get the heuristic function for strategy and reward function to accelerate the convergence speed. Through simulation comparison, this improved algorithm has faster reward feedback than SARSA(λ), it is showed that the effectiveness of the algorithm in the learning of knowledge.

    Key Wordsreinforcement learning, SARSA(λ), heuristic function, assessment learning

    * 收稿日期:2015年11月6日,修回日期:2015年12月26日

    作者簡介:馬朋委,男,碩士,研究方向:機(jī)器學(xué)習(xí)。潘地林,男,教授,研究方向:機(jī)器學(xué)習(xí)。

    中圖分類號TP301.6

    DOI:10.3969/j.issn.1672-9722.2016.05.011

    猜你喜歡
    強(qiáng)化學(xué)習(xí)
    基于強(qiáng)化學(xué)習(xí)的無線網(wǎng)絡(luò)智能接入控制技術(shù)
    機(jī)器學(xué)習(xí)發(fā)展現(xiàn)狀及應(yīng)用的研究
    未來人工智能自主學(xué)習(xí)網(wǎng)絡(luò)的構(gòu)建
    轉(zhuǎn)觀念 強(qiáng)服務(wù) 樹立用電檢查新價(jià)值
    智能車自主避障路徑規(guī)劃研究綜述
    一種記憶可修剪型仿生機(jī)器人的速度跟蹤算法研究
    基于強(qiáng)化學(xué)習(xí)的在線訂單配送時(shí)隙運(yùn)能分配
    論“以讀促寫”在初中英語寫作教學(xué)中的應(yīng)用
    智能交通車流自動導(dǎo)引系統(tǒng)
    分布式系統(tǒng)中基于非合作博弈的調(diào)度算法
    日韩不卡一区二区三区视频在线| 亚洲av免费在线观看| 国产精品成人在线| 亚洲成人精品中文字幕电影| av网站免费在线观看视频| 亚洲高清免费不卡视频| 人妻夜夜爽99麻豆av| 亚洲精品456在线播放app| 性色av一级| 久久久久久久国产电影| 中文字幕亚洲精品专区| 丝袜美腿在线中文| 在线观看美女被高潮喷水网站| 一级二级三级毛片免费看| 国产黄片视频在线免费观看| 黄色怎么调成土黄色| 亚洲国产最新在线播放| 男插女下体视频免费在线播放| 久久久久网色| 久久精品久久久久久久性| 亚洲人成网站在线播| 丝袜喷水一区| 午夜视频国产福利| 亚洲无线观看免费| 色综合色国产| 纵有疾风起免费观看全集完整版| 丰满人妻一区二区三区视频av| 六月丁香七月| 午夜精品国产一区二区电影 | 欧美日韩在线观看h| 国产亚洲最大av| 大片免费播放器 马上看| 老司机影院成人| 69av精品久久久久久| 我要看日韩黄色一级片| 美女xxoo啪啪120秒动态图| 国精品久久久久久国模美| 99热这里只有是精品在线观看| 亚洲av中文字字幕乱码综合| 国产黄频视频在线观看| 欧美性感艳星| 在线免费十八禁| 日本三级黄在线观看| 中文字幕人妻熟人妻熟丝袜美| 国产高清三级在线| 精品久久久久久久人妻蜜臀av| 特级一级黄色大片| .国产精品久久| 国产精品一区二区性色av| 欧美日韩在线观看h| 精品一区二区免费观看| 18禁在线无遮挡免费观看视频| 熟妇人妻不卡中文字幕| 全区人妻精品视频| 国产一区二区亚洲精品在线观看| 啦啦啦啦在线视频资源| h日本视频在线播放| 又大又黄又爽视频免费| 大香蕉97超碰在线| 国产高清三级在线| 亚洲精品视频女| 欧美国产精品一级二级三级 | 国产精品久久久久久av不卡| 免费黄频网站在线观看国产| 日韩av不卡免费在线播放| 久久久久久久午夜电影| 一级av片app| 人妻一区二区av| 国产精品国产三级专区第一集| 激情五月婷婷亚洲| 国产精品久久久久久久久免| 老司机影院毛片| 菩萨蛮人人尽说江南好唐韦庄| 一级毛片aaaaaa免费看小| 我的老师免费观看完整版| xxx大片免费视频| av女优亚洲男人天堂| 国产淫语在线视频| 成年版毛片免费区| 亚洲成人av在线免费| 国产老妇伦熟女老妇高清| 一级黄片播放器| 欧美3d第一页| 国产大屁股一区二区在线视频| 午夜免费男女啪啪视频观看| 十八禁网站网址无遮挡 | 久久精品国产亚洲av天美| 久久久欧美国产精品| 国产成人午夜福利电影在线观看| 欧美高清成人免费视频www| 亚洲人成网站在线观看播放| 看免费成人av毛片| 免费观看在线日韩| 蜜臀久久99精品久久宅男| 九九久久精品国产亚洲av麻豆| 久久久精品94久久精品| 能在线免费看毛片的网站| 久热久热在线精品观看| 国产有黄有色有爽视频| 激情 狠狠 欧美| 国产亚洲一区二区精品| 成人亚洲欧美一区二区av| 日韩大片免费观看网站| 免费黄色在线免费观看| 人妻一区二区av| eeuss影院久久| 大片免费播放器 马上看| 老女人水多毛片| 三级国产精品欧美在线观看| 一级二级三级毛片免费看| 特大巨黑吊av在线直播| 天堂中文最新版在线下载 | 国产日韩欧美亚洲二区| 日本-黄色视频高清免费观看| 国产一区亚洲一区在线观看| 建设人人有责人人尽责人人享有的 | 国产精品伦人一区二区| 色网站视频免费| 国产一区亚洲一区在线观看| 女人被狂操c到高潮| 成人免费观看视频高清| 免费不卡的大黄色大毛片视频在线观看| 一二三四中文在线观看免费高清| 精品久久久久久久末码| 麻豆精品久久久久久蜜桃| 亚洲丝袜综合中文字幕| 精品熟女少妇av免费看| 久久久久久久久大av| 亚洲国产精品成人综合色| 麻豆精品久久久久久蜜桃| 尾随美女入室| 纵有疾风起免费观看全集完整版| 日本色播在线视频| 精品久久久久久久久av| 欧美xxxx黑人xx丫x性爽| 成人鲁丝片一二三区免费| 精品久久久噜噜| 亚洲成人av在线免费| 国产一区二区在线观看日韩| 免费大片18禁| 少妇熟女欧美另类| 赤兔流量卡办理| 国产免费一级a男人的天堂| 免费不卡的大黄色大毛片视频在线观看| av国产久精品久网站免费入址| 亚洲av在线观看美女高潮| 久久鲁丝午夜福利片| 日韩人妻高清精品专区| 国产一区亚洲一区在线观看| 一级毛片久久久久久久久女| 国产视频内射| 亚洲不卡免费看| 99久久精品一区二区三区| 人妻制服诱惑在线中文字幕| av网站免费在线观看视频| 久久影院123| 狂野欧美激情性bbbbbb| 夜夜爽夜夜爽视频| 亚洲成人精品中文字幕电影| 久久人人爽av亚洲精品天堂 | 欧美极品一区二区三区四区| 91精品一卡2卡3卡4卡| 2021天堂中文幕一二区在线观| 成人特级av手机在线观看| 亚洲精品日本国产第一区| 国产伦精品一区二区三区四那| 国产精品一区二区性色av| 有码 亚洲区| 下体分泌物呈黄色| 国产成人a区在线观看| 边亲边吃奶的免费视频| 2018国产大陆天天弄谢| 中文乱码字字幕精品一区二区三区| 成人一区二区视频在线观看| 欧美三级亚洲精品| 97在线视频观看| 99热全是精品| 国产在线男女| 神马国产精品三级电影在线观看| 麻豆国产97在线/欧美| 亚洲欧美中文字幕日韩二区| 亚洲最大成人中文| 只有这里有精品99| 日韩强制内射视频| 久久精品国产亚洲av天美| 国产高清不卡午夜福利| 亚洲av成人精品一二三区| 欧美成人一区二区免费高清观看| 国产在线一区二区三区精| 精品国产露脸久久av麻豆| 在线观看三级黄色| 国产片特级美女逼逼视频| 在线观看一区二区三区激情| 亚洲精品亚洲一区二区| 一级二级三级毛片免费看| 日本黄色片子视频| 亚洲成人av在线免费| 国产高清国产精品国产三级 | 亚洲欧美日韩卡通动漫| 秋霞在线观看毛片| 精品视频人人做人人爽| 制服丝袜香蕉在线| 26uuu在线亚洲综合色| 国产视频首页在线观看| 国产老妇伦熟女老妇高清| 欧美+日韩+精品| 国产成人91sexporn| 少妇 在线观看| 九草在线视频观看| 舔av片在线| 新久久久久国产一级毛片| 亚洲电影在线观看av| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 成人鲁丝片一二三区免费| 日韩欧美一区视频在线观看 | a级毛色黄片| 欧美区成人在线视频| 综合色av麻豆| 伊人久久国产一区二区| 日韩中字成人| 韩国高清视频一区二区三区| 制服丝袜香蕉在线| 一个人观看的视频www高清免费观看| 久久这里有精品视频免费| 久久精品国产自在天天线| 亚洲欧美中文字幕日韩二区| 亚洲国产高清在线一区二区三| 超碰av人人做人人爽久久| av在线老鸭窝| 成人国产麻豆网| 国产人妻一区二区三区在| 国产黄片美女视频| 日韩大片免费观看网站| 亚洲最大成人手机在线| 成人美女网站在线观看视频| 成人毛片a级毛片在线播放| 一级a做视频免费观看| 女的被弄到高潮叫床怎么办| av天堂中文字幕网| 国产成年人精品一区二区| 中文乱码字字幕精品一区二区三区| 日韩一区二区视频免费看| 久久热精品热| 国语对白做爰xxxⅹ性视频网站| 国产成人a区在线观看| 亚洲精品视频女| 日本av手机在线免费观看| 中文字幕人妻熟人妻熟丝袜美| 人妻夜夜爽99麻豆av| 亚洲精品国产色婷婷电影| 亚洲成人一二三区av| 国产精品.久久久| 爱豆传媒免费全集在线观看| 国产黄色视频一区二区在线观看| 久久精品国产亚洲av涩爱| 精品久久久久久电影网| 熟女人妻精品中文字幕| 亚洲无线观看免费| 国产一区二区在线观看日韩| 亚洲欧美一区二区三区国产| 国产探花极品一区二区| 草草在线视频免费看| 久久99热6这里只有精品| 免费av不卡在线播放| 亚洲精品乱久久久久久| 51国产日韩欧美| 日本熟妇午夜| 亚洲精品乱久久久久久| 亚洲欧美日韩另类电影网站 | 波多野结衣巨乳人妻| 高清日韩中文字幕在线| 最近的中文字幕免费完整| 日本熟妇午夜| www.色视频.com| 人妻少妇偷人精品九色| 成人高潮视频无遮挡免费网站| 亚洲美女视频黄频| 中文乱码字字幕精品一区二区三区| 中国美白少妇内射xxxbb| 日韩精品有码人妻一区| videossex国产| 涩涩av久久男人的天堂| 久久女婷五月综合色啪小说 | 91在线精品国自产拍蜜月| 成人亚洲精品av一区二区| 国产黄色免费在线视频| 久久精品夜色国产| 天天躁夜夜躁狠狠久久av| 美女cb高潮喷水在线观看| 国产精品.久久久| 超碰av人人做人人爽久久| 久久这里有精品视频免费| 18禁裸乳无遮挡动漫免费视频 | 亚洲av免费在线观看| 中文字幕制服av| 2022亚洲国产成人精品| 在线免费观看不下载黄p国产| 日本黄大片高清| 成人无遮挡网站| 看免费成人av毛片| 青青草视频在线视频观看| 日韩一区二区视频免费看| 国产成年人精品一区二区| 久久精品国产鲁丝片午夜精品| 国产午夜精品久久久久久一区二区三区| 熟女人妻精品中文字幕| 22中文网久久字幕| 亚洲国产精品成人久久小说| 国产高潮美女av| 日韩欧美精品免费久久| 美女脱内裤让男人舔精品视频| 在线观看免费高清a一片| 欧美+日韩+精品| 国产高清国产精品国产三级 | 国产黄色免费在线视频| 99热6这里只有精品| 三级国产精品欧美在线观看| 在线 av 中文字幕| 欧美三级亚洲精品| 99久国产av精品国产电影| 人人妻人人澡人人爽人人夜夜| 国产亚洲最大av| 可以在线观看毛片的网站| 亚洲自偷自拍三级| 真实男女啪啪啪动态图| 两个人的视频大全免费| 中文精品一卡2卡3卡4更新| 国产淫片久久久久久久久| 久热这里只有精品99| 少妇人妻一区二区三区视频| 精品一区二区三区视频在线| 亚洲成色77777| 激情五月婷婷亚洲| 真实男女啪啪啪动态图| 免费av不卡在线播放| 特级一级黄色大片| 亚洲欧美日韩无卡精品| 校园人妻丝袜中文字幕| 国产视频内射| 欧美最新免费一区二区三区| 国产成人精品婷婷| 99热这里只有精品一区| 2022亚洲国产成人精品| 色视频www国产| 亚洲精品一二三| 亚洲av.av天堂| 亚洲成人一二三区av| 黄色配什么色好看| 精品久久久久久久久av| 水蜜桃什么品种好| 内地一区二区视频在线| 久久99蜜桃精品久久| 久久久久九九精品影院| 精品少妇黑人巨大在线播放| 丰满乱子伦码专区| 天天躁狠狠躁夜夜躁狠狠躁| 一区在线观看完整版| av在线播放精品| 青春草视频在线免费观看| 日韩精品有码人妻一区| 国产精品国产三级国产专区5o| 久久精品国产亚洲av高清一级| 亚洲精品久久午夜乱码| 久久国产精品男人的天堂亚洲| 成人黄色视频免费在线看| 老司机影院成人| 亚洲中文av在线| 国产人伦9x9x在线观看| www.自偷自拍.com| 亚洲精品,欧美精品| 亚洲欧美中文字幕日韩二区| 欧美日韩一区二区视频在线观看视频在线| 美女扒开内裤让男人捅视频| 国产日韩欧美视频二区| 欧美日韩综合久久久久久| 久久影院123| 精品国产一区二区三区四区第35| 香蕉国产在线看| 国产片特级美女逼逼视频| 亚洲一码二码三码区别大吗| 一二三四在线观看免费中文在| 麻豆av在线久日| 国产乱来视频区| 亚洲国产欧美一区二区综合| 少妇 在线观看| 日韩人妻精品一区2区三区| 国产精品免费视频内射| 91国产中文字幕| 国产精品久久久久久精品古装| 丝袜人妻中文字幕| 黄色 视频免费看| 欧美日韩一级在线毛片| 亚洲少妇的诱惑av| 成人三级做爰电影| 国产不卡av网站在线观看| 国产一区二区 视频在线| 欧美人与善性xxx| 日本爱情动作片www.在线观看| 欧美日本中文国产一区发布| 精品卡一卡二卡四卡免费| 叶爱在线成人免费视频播放| 男人爽女人下面视频在线观看| 中文天堂在线官网| a 毛片基地| 麻豆av在线久日| 久久久精品区二区三区| 国产国语露脸激情在线看| 日日啪夜夜爽| 亚洲精品国产一区二区精华液| 考比视频在线观看| 色视频在线一区二区三区| 19禁男女啪啪无遮挡网站| 色播在线永久视频| 亚洲欧美精品自产自拍| 777久久人妻少妇嫩草av网站| 国产黄色免费在线视频| 国产成人欧美| 少妇人妻久久综合中文| 国产精品久久久av美女十八| 国产片内射在线| 男女床上黄色一级片免费看| 亚洲成人手机| 天堂中文最新版在线下载| 丝袜脚勾引网站| 亚洲人成电影观看| 男人舔女人的私密视频| 成年女人毛片免费观看观看9 | 波多野结衣av一区二区av| 国产成人精品在线电影| 国产日韩一区二区三区精品不卡| 国产野战对白在线观看| 少妇被粗大猛烈的视频| 国产亚洲av片在线观看秒播厂| 在线观看三级黄色| 亚洲成人国产一区在线观看 | 国产一级毛片在线| 性少妇av在线| 日韩电影二区| 精品一区二区三区av网在线观看 | 国产精品一区二区在线不卡| 日韩视频在线欧美| 日韩大片免费观看网站| 观看av在线不卡| 97人妻天天添夜夜摸| 午夜福利免费观看在线| 观看美女的网站| 精品少妇黑人巨大在线播放| 精品一区在线观看国产| 美女午夜性视频免费| 亚洲国产毛片av蜜桃av| 欧美日韩福利视频一区二区| 日日啪夜夜爽| 国产精品三级大全| 99国产精品免费福利视频| 国产免费视频播放在线视频| 精品国产乱码久久久久久男人| 中文乱码字字幕精品一区二区三区| 1024视频免费在线观看| 18禁动态无遮挡网站| 99热网站在线观看| 精品人妻在线不人妻| 91老司机精品| 大陆偷拍与自拍| 国产片特级美女逼逼视频| 丝袜人妻中文字幕| 在线亚洲精品国产二区图片欧美| 18禁裸乳无遮挡动漫免费视频| 秋霞伦理黄片| 啦啦啦中文免费视频观看日本| 久久国产精品大桥未久av| 女性被躁到高潮视频| 18在线观看网站| 亚洲国产欧美日韩在线播放| 亚洲免费av在线视频| 国产淫语在线视频| 观看美女的网站| 色网站视频免费| 老司机在亚洲福利影院| 哪个播放器可以免费观看大片| 亚洲精品一区蜜桃| 国产精品欧美亚洲77777| 高清视频免费观看一区二区| 99九九在线精品视频| 国产精品久久久久久人妻精品电影 | 久久天堂一区二区三区四区| 毛片一级片免费看久久久久| 国产女主播在线喷水免费视频网站| 性色av一级| 国产成人91sexporn| 一区二区日韩欧美中文字幕| 国精品久久久久久国模美| 男女之事视频高清在线观看 | 高清在线视频一区二区三区| 男女高潮啪啪啪动态图| 亚洲av日韩精品久久久久久密 | 老司机靠b影院| 国产精品亚洲av一区麻豆 | 美女福利国产在线| 美女大奶头黄色视频| 亚洲av综合色区一区| 色婷婷av一区二区三区视频| 考比视频在线观看| 热re99久久国产66热| 亚洲一码二码三码区别大吗| 亚洲国产欧美日韩在线播放| xxx大片免费视频| 亚洲,欧美精品.| 9191精品国产免费久久| 国产精品亚洲av一区麻豆 | 美女福利国产在线| 伊人亚洲综合成人网| 亚洲国产成人一精品久久久| 在线观看三级黄色| 日韩,欧美,国产一区二区三区| 午夜福利影视在线免费观看| 久久99精品国语久久久| 免费黄频网站在线观看国产| 国产精品女同一区二区软件| 美女脱内裤让男人舔精品视频| 久久人人爽人人片av| 精品久久久久久电影网| 1024香蕉在线观看| 精品少妇内射三级| 国产黄色免费在线视频| www.自偷自拍.com| 国产国语露脸激情在线看| 亚洲国产精品国产精品| 亚洲国产av影院在线观看| 国产日韩欧美亚洲二区| 十分钟在线观看高清视频www| 十八禁高潮呻吟视频| 久久这里只有精品19| 九九爱精品视频在线观看| 69精品国产乱码久久久| 国产无遮挡羞羞视频在线观看| 亚洲精品,欧美精品| 久久久久久免费高清国产稀缺| 日本色播在线视频| 亚洲精品国产av蜜桃| 国产一区二区在线观看av| 久久久国产欧美日韩av| 亚洲av福利一区| 亚洲国产看品久久| 国产精品 欧美亚洲| 熟女av电影| 久久精品久久精品一区二区三区| 90打野战视频偷拍视频| 日日摸夜夜添夜夜爱| 一级毛片黄色毛片免费观看视频| 热re99久久精品国产66热6| 亚洲精品乱久久久久久| 国产一区二区三区综合在线观看| 2021少妇久久久久久久久久久| 日本色播在线视频| h视频一区二区三区| 大片免费播放器 马上看| 又大又爽又粗| 精品亚洲成国产av| 国产成人av激情在线播放| 国产免费福利视频在线观看| 国产成人欧美| 日本猛色少妇xxxxx猛交久久| 日韩熟女老妇一区二区性免费视频| 亚洲欧美精品综合一区二区三区| 亚洲欧美成人综合另类久久久| 国产精品国产av在线观看| 女人爽到高潮嗷嗷叫在线视频| 中文欧美无线码| 欧美97在线视频| 午夜福利视频精品| 免费高清在线观看视频在线观看| 亚洲国产毛片av蜜桃av| 高清不卡的av网站| 国产精品久久久久久人妻精品电影 | 精品福利永久在线观看| 国产深夜福利视频在线观看| 国产日韩一区二区三区精品不卡| 制服丝袜香蕉在线| 男人舔女人的私密视频| 久久影院123| 亚洲七黄色美女视频| 国产爽快片一区二区三区| 国产片内射在线| 欧美日韩一区二区视频在线观看视频在线| 黄色 视频免费看| 国产精品欧美亚洲77777| 最近中文字幕2019免费版| 久久久精品区二区三区| 一级片'在线观看视频| 人人妻人人澡人人爽人人夜夜| 国产精品一二三区在线看| 国产精品人妻久久久影院| av有码第一页| 麻豆乱淫一区二区| 亚洲欧洲国产日韩| 日本欧美视频一区| av天堂久久9| 成人免费观看视频高清| 欧美人与性动交α欧美软件| 中文天堂在线官网| 蜜桃国产av成人99| 亚洲熟女精品中文字幕| 97在线人人人人妻| √禁漫天堂资源中文www| 国产成人一区二区在线| 王馨瑶露胸无遮挡在线观看| 男女免费视频国产| 狂野欧美激情性bbbbbb| 亚洲色图 男人天堂 中文字幕| 日日啪夜夜爽| 欧美少妇被猛烈插入视频| 国产一区二区三区综合在线观看| 人妻人人澡人人爽人人| 国产精品久久久久久人妻精品电影 | 国产在线视频一区二区|