• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于連續(xù)動(dòng)作學(xué)習(xí)自動(dòng)機(jī)的聯(lián)想強(qiáng)化學(xué)習(xí)

    2015-05-10 06:53:52
    關(guān)鍵詞:高斯分布自動(dòng)機(jī)端點(diǎn)

    劉 曉

    (中航工業(yè)西安航空計(jì)算技術(shù)研究所,陜西 西安 710065)

    0 引言

    強(qiáng)化學(xué)習(xí)是一種介于監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)之間的機(jī)器學(xué)習(xí)方法,屬于無教師指導(dǎo)的試錯(cuò)學(xué)習(xí)[1-2]。在強(qiáng)化學(xué)習(xí)框架下,一個(gè)學(xué)習(xí)主體(agent)通過與一個(gè)隨機(jī)環(huán)境不斷地交互,學(xué)習(xí)選擇最佳的行為策略。根據(jù)環(huán)境向agent提供的信息種類的不同,強(qiáng)化學(xué)習(xí)可以分為聯(lián)想強(qiáng)化學(xué)習(xí)和非聯(lián)想強(qiáng)化學(xué)習(xí)兩種。在非聯(lián)想強(qiáng)化學(xué)習(xí)中,agent從環(huán)境接收的信息只有強(qiáng)化信號(hào)(即對(duì)agent所選擇的動(dòng)作的評(píng)價(jià),如成功或失?。?。在聯(lián)想強(qiáng)化學(xué)習(xí)中,除強(qiáng)化信號(hào)外,agent還可接收環(huán)境的狀態(tài)信息。換句話說,在聯(lián)想強(qiáng)化學(xué)習(xí)模型中,一個(gè)動(dòng)作的好壞與環(huán)境的狀態(tài)有關(guān)。agent的任務(wù)就是發(fā)現(xiàn)輸出動(dòng)作與輸入狀態(tài)之間的關(guān)聯(lián)性[3-5]。

    實(shí)現(xiàn)聯(lián)想強(qiáng)化學(xué)習(xí)的方法有很多,如查表法(lookup-table)、人工神經(jīng)網(wǎng)絡(luò)(ANN)以及學(xué)習(xí)自動(dòng)機(jī)(LA)等[3-8]。查表法需要的存儲(chǔ)量大,效率低,且缺乏泛化能力。ANN可實(shí)現(xiàn)復(fù)雜的非線性映射,但主流的ANN學(xué)習(xí)算法都基于梯度計(jì)算,容易陷入局部最優(yōu),對(duì)噪聲也較為敏感。LA[6-8]是一種自適應(yīng)決策器,通過與其相連的隨機(jī)環(huán)境的反復(fù)交互,學(xué)習(xí)選擇最適合該環(huán)境的輸出動(dòng)作。根據(jù)是否接收環(huán)境的狀態(tài)信息,LA也可以分為聯(lián)想型和非聯(lián)想型兩種。本文的主要目標(biāo)有兩個(gè),一是提出一種新的非聯(lián)想型LA,二是利用該LA解決聯(lián)想強(qiáng)化學(xué)習(xí)問題。

    1 學(xué)習(xí)自動(dòng)機(jī)

    一個(gè)LA總與一個(gè)隨機(jī)環(huán)境相連。根據(jù)某種概率分布,LA從一個(gè)備選動(dòng)作集里選擇一個(gè)動(dòng)作,并輸出給環(huán)境,環(huán)境則向自動(dòng)機(jī)反饋一個(gè)評(píng)價(jià)信號(hào)。根據(jù)該評(píng)價(jià)信號(hào),自動(dòng)機(jī)對(duì)其概率分布進(jìn)行更新,以提高表現(xiàn)好的動(dòng)作的被選概率。作為一種重要的機(jī)器學(xué)習(xí)方法,LA已被應(yīng)用于許多不同的領(lǐng)域,例如汽車懸掛控制[9]、發(fā)動(dòng)機(jī)怠速控制[10]、數(shù)字濾波器設(shè)計(jì)[11]、磁懸浮軸承控制器的參數(shù)整定[12]、噪聲容忍模式分類[13]、自適應(yīng)網(wǎng)頁爬?。?4]、移動(dòng)無線網(wǎng)絡(luò)中的運(yùn)動(dòng)預(yù)測[15]、圖像中圓的檢測[16]以及糖尿病病人最佳胰島素劑量的確定[17]等。

    根據(jù)動(dòng)作集的性質(zhì),LA可以分為兩大類[7,8]:有限動(dòng)作學(xué)習(xí)自動(dòng)機(jī)(FALA)和連續(xù)動(dòng)作學(xué)習(xí)自動(dòng)機(jī)(CALA)。FALA只有有限多個(gè)離散的動(dòng)作,對(duì)于實(shí)值優(yōu)化問題,若使用FALA,必須先將動(dòng)作空間離散化。離散化的粒度如果太粗,最優(yōu)解有可能沒有被包含在動(dòng)作集里;粒度太細(xì),又會(huì)造成動(dòng)作數(shù)過多,學(xué)習(xí)速度減慢。CALA的動(dòng)作集可以是一個(gè)連續(xù)區(qū)間或者整個(gè)實(shí)數(shù)軸。現(xiàn)有的LA絕大多數(shù)都是FALA,CALA僅有幾種,主要有Santharam,Sastry和Thathachar[18]提出的CALA(以下以提出者名字的首字母為后綴將其簡記為CALA-SST),Beigy和 Meybodi[19]提出的CALA(簡記為CALA-BM),以及由Frost,Howell,Gordon和吳青華[9]提出的“連續(xù)動(dòng)作強(qiáng)化學(xué)習(xí)自動(dòng)機(jī)(CARLA)”。

    CALA-SST和CALA-BM都采用高斯分布概率模型,二者的動(dòng)作集均為整個(gè)實(shí)數(shù)軸。CALA-SST每次要輸出兩個(gè)動(dòng)作,一個(gè)根據(jù)高斯分布隨機(jī)產(chǎn)生,另一個(gè)則直接取高斯分布的均值。根據(jù)這兩個(gè)動(dòng)作及環(huán)境的評(píng)價(jià)信號(hào),學(xué)習(xí)算法對(duì)高斯分布的均值和標(biāo)準(zhǔn)差進(jìn)行更新。為防止標(biāo)準(zhǔn)差減小到0甚至出現(xiàn)負(fù)值,在標(biāo)準(zhǔn)差的更新方程中引入了一個(gè)懲罰項(xiàng),使得標(biāo)準(zhǔn)差永遠(yuǎn)不會(huì)小于一個(gè)預(yù)定的最小值。與CALA-SST不同,CALA-BM每次只輸出一個(gè)動(dòng)作(按高斯分布隨機(jī)產(chǎn)生)。該算法在對(duì)高斯分布的均值進(jìn)行更新時(shí),要求環(huán)境的評(píng)價(jià)信號(hào)必須處于0到1之間(如果不在此區(qū)間,需先做歸一化處理)。在CALA-BM中,高斯分布的標(biāo)準(zhǔn)差是直接根據(jù)學(xué)習(xí)時(shí)間計(jì)算的,單調(diào)減小并最終趨于0,故不利于對(duì)環(huán)境變化的跟蹤。由于按照高斯分布產(chǎn)生動(dòng)作,CALA-SST和CALA-BM有可能輸出絕對(duì)數(shù)值非常大的動(dòng)作,當(dāng)自動(dòng)機(jī)應(yīng)用于實(shí)時(shí)控制領(lǐng)域時(shí),會(huì)有安全性隱患。與前兩種CALA不同,CARLA的動(dòng)作集是一個(gè)有限區(qū)間,并采用一種非參數(shù)化的概率模型。其初始動(dòng)作概率為均勻分布,在學(xué)習(xí)過程中,通過一個(gè)對(duì)稱的高斯型“鄰近函數(shù)”,將表現(xiàn)較好的動(dòng)作的獎(jiǎng)賞“傳播”給相鄰的動(dòng)作。由于采用非參數(shù)化概率模型,該方法對(duì)概率分布的計(jì)算、存儲(chǔ)和更新相當(dāng)復(fù)雜,實(shí)現(xiàn)代價(jià)很高。

    2 一種新的連續(xù)動(dòng)作集學(xué)習(xí)自動(dòng)機(jī)

    為克服現(xiàn)有算法的不足,本文提出一種新型的CALA,其動(dòng)作集為一個(gè)可變的實(shí)數(shù)區(qū)間[αL,αR]。在任一時(shí)刻k,自動(dòng)機(jī)以均勻分布方式從當(dāng)前的區(qū)間上隨機(jī)選擇一個(gè)動(dòng)作αk并輸出給環(huán)境,環(huán)境則給出一個(gè)二值的評(píng)價(jià)信號(hào)βk。根據(jù)該評(píng)價(jià)信號(hào),自動(dòng)機(jī)對(duì)其動(dòng)作區(qū)間的兩個(gè)端點(diǎn)αL和αR進(jìn)行調(diào)整,以遠(yuǎn)離失敗的動(dòng)作,趨向成功的動(dòng)作(即對(duì)前者進(jìn)行懲罰,對(duì)后者進(jìn)行獎(jiǎng)勵(lì))。

    下面給出該算法的形式化描述。算法參數(shù):

    λ1:大于0小于1的常數(shù),控制區(qū)間外擴(kuò)的幅度;λ2:大于0小于1的常數(shù)(應(yīng)小于λ1),控制區(qū)間內(nèi)縮的幅度;θ:大于0小于1的常數(shù),控制在強(qiáng)化信號(hào)為失敗的情況下區(qū)間端點(diǎn)調(diào)整的幅度;ε:足夠小且大于0的常數(shù),控制解的精度,并防止區(qū)間長度無限縮小。

    初始化:

    給區(qū)間端點(diǎn)αL和αR分別賦初值,并置k=0。

    學(xué)習(xí)過程:

    1)按照下式產(chǎn)生一個(gè)動(dòng)作αk,并輸出給環(huán)境:αk=αL+rk(αR-αL),其中rk為0到1之間均勻分布的隨機(jī)數(shù)(每次都重新產(chǎn)生)。

    2)接收環(huán)境反饋的強(qiáng)化信號(hào)βk,其中βk∈{0,1},0表示成功,1表示失敗。

    3)更新動(dòng)作區(qū)間(等價(jià)于更新概率分布):

    令cL=αL+Δ,cR=αR-Δ,其中Δ=(αR-αL)/3;

    當(dāng)βk=0時(shí):

    若αk<cL則令αL=αL-λ1(cL-αk),否則令αL=αL+λ2(1-ε/Δ)(αk-cL);

    若αk>cR則令αR=αR+λ1(αk-cR),否則令αR=αR-λ2(1-ε/Δ)(cR-αk);

    當(dāng)βk=1時(shí):

    若αk<cL則令αL=αL+θλ2(1-ε/Δ)(cL-αk),否則,若αk>cR則令αL=αL-θλ1(αk-cL);

    若αk>cR則令αR=αR-θλ2(1-ε/Δ)(αk-cR),否則,若αk<cL則令αR=αR+θλ1(cR-αk);

    4)令k=k+1,轉(zhuǎn)1)。

    上述算法對(duì)動(dòng)作區(qū)間進(jìn)行更新的基本原理是:先確定三等分當(dāng)前區(qū)間的兩個(gè)分界點(diǎn)cL和cR。然后,根據(jù)βk的取值和αk位于左、中、右哪個(gè)1/3段,對(duì)區(qū)間的左右端點(diǎn)分別進(jìn)行調(diào)整。當(dāng)βk為成功時(shí),將兩個(gè)端點(diǎn)均朝αk所在段的方向移動(dòng);當(dāng)βk為失敗時(shí),若αk落于中間的1/3段,兩個(gè)端點(diǎn)均保持不變,否則均朝αk所在位置相反一側(cè)的方向移動(dòng)。移動(dòng)的幅度分別與αk跟cL和cR之間的距離成正比,具體的比例系數(shù)則由參數(shù)λ1,λ2,θ和ε控制。其中λ2通??扇ˇ?的1/3,以使左端點(diǎn)向右、右端點(diǎn)向左的移動(dòng)(收縮)比左端點(diǎn)向左、右端點(diǎn)向右的移動(dòng)(擴(kuò)張)更謹(jǐn)慎一些。ε的作用是防止動(dòng)作區(qū)間收縮為一個(gè)點(diǎn),以保持對(duì)環(huán)境變化的跟蹤能力。θ的作用是使對(duì)失敗動(dòng)作的“懲罰”比對(duì)成功動(dòng)作的“獎(jiǎng)勵(lì)”要輕一些。

    顯然,在區(qū)間左、右移動(dòng)時(shí),由于兩個(gè)端點(diǎn)移動(dòng)的幅度不同,整個(gè)區(qū)間的長度實(shí)際上是擴(kuò)張的;而當(dāng)兩個(gè)端點(diǎn)均向內(nèi)移動(dòng)時(shí),區(qū)間會(huì)收縮。自動(dòng)機(jī)正是通過對(duì)其動(dòng)作區(qū)間的自適應(yīng)調(diào)整(可形象地稱之為“調(diào)焦”和“變焦”),以發(fā)現(xiàn)和跟蹤最好的動(dòng)作,將其“包圍”、“夾逼”在一個(gè)長度逐漸縮小的區(qū)間的中心。故我們將該自動(dòng)機(jī)稱作“聚焦區(qū)間學(xué)習(xí)自動(dòng)機(jī)(focused interval learning automaton)”,簡記為FILA。為體現(xiàn)算法對(duì)成功的動(dòng)作進(jìn)行獎(jiǎng)勵(lì)、對(duì)失敗的動(dòng)作進(jìn)行懲罰的“獎(jiǎng)罰(reward-penalty)”式學(xué)習(xí)的特點(diǎn),再在“FILA”的后面加上“RP”,記做“FILA/RP”。

    3 關(guān)于聯(lián)想強(qiáng)化學(xué)習(xí)的仿真實(shí)驗(yàn)

    聯(lián)想強(qiáng)化學(xué)習(xí)的概念是由文獻(xiàn)[3]首先提出來的,我們借用該文所給的兩個(gè)聯(lián)想強(qiáng)化學(xué)習(xí)問題進(jìn)行仿真實(shí)驗(yàn)。其中,學(xué)習(xí)系統(tǒng)有兩個(gè)輸入矢量:x(1)=[1,1]T,x(2)=[1,0]T。這兩個(gè)矢量是線性獨(dú)立的,但并不正交。在任一時(shí)刻,兩個(gè)矢量以各0.5的概率呈現(xiàn)給學(xué)習(xí)系統(tǒng)。學(xué)習(xí)系統(tǒng)可以選擇的響應(yīng)動(dòng)作也有兩個(gè):—1和+1。兩個(gè)問題的區(qū)別是,不同輸入矢量下各動(dòng)作成功的概率不同(具體情況見后)。

    我們采用非聯(lián)想型LA求解上述聯(lián)想強(qiáng)化學(xué)習(xí)問題?,F(xiàn)構(gòu)造一個(gè)簡單的、包含一個(gè)二維參數(shù)矢量w的線性閾值判別函數(shù)。令wk為k時(shí)刻的參數(shù)矢量,該判別函數(shù)按照如下規(guī)則產(chǎn)生對(duì)于輸入xk的響應(yīng):若wkTxk>0,令αk?。?,否則?。?。LA的任務(wù),就是尋找wk的最佳取值。由于wk是二維的,故我們使用兩個(gè)LA,每個(gè)LA負(fù)責(zé)一個(gè)參數(shù)。

    我們分別用FILA/RP以及兩種現(xiàn)有的基于參數(shù)化概率模型的CALA,即CALA-SST和CALA-BM,進(jìn)行仿真實(shí)驗(yàn)。原CALA-BM[19]根據(jù)公式σk=1/[floor(k/10)]1/3計(jì)算k時(shí)刻高斯分布的標(biāo)準(zhǔn)差,在具體實(shí)現(xiàn)時(shí)存在兩個(gè)問題:一是當(dāng)k<10時(shí)會(huì)出現(xiàn)“除法溢出”;二是σk的衰減速率過快且無法控制。為此,我們對(duì)原算法進(jìn)行了如下“改造”:一是將下取整函數(shù)floor替換為上取整函數(shù)ceil;二是像CALA-SST那樣,引入一個(gè)新的參數(shù)σ(0),并按照σk=σ(0)/[ceil(k/10)]1/3計(jì)算σk,使σk的衰減速度可以被控制。

    三種算法各有一些內(nèi)部參數(shù),這些參數(shù)的取值對(duì)算法性能有很大的影響。我們先對(duì)每種算法各做了若干次初始實(shí)驗(yàn),嘗試不同的參數(shù)組合,然后取效果最好的參數(shù)組合進(jìn)行正式的仿真。最終選取的參數(shù)如下:CALA-BM的學(xué)習(xí)步長a=0.015,高斯分布的初始均值μ(0)=0,我們新引入的參數(shù)σ(0)=3;對(duì)于CALASST,λ=0.000 4,K=7,σL=0.02,μ(0)=0,σ(0)=1;對(duì)于FILA/RP,取λ1=3λ2且λ2=0.01,θ=0.15,ε=0.02,初始動(dòng)作區(qū)間取[-1,1]。

    問題1:在問題1(對(duì)應(yīng)文獻(xiàn)[3]的Task 1)中,兩個(gè)輸入矢量下不同動(dòng)作的成功概率如下:

    顯然,對(duì)x(1)應(yīng)選擇動(dòng)作“-1”作為響應(yīng);對(duì)x(2),則應(yīng)選擇“+1”。在這種情況下,學(xué)習(xí)系統(tǒng)將獲得最大的期望成功概率:0.85。若未經(jīng)學(xué)習(xí)、隨機(jī)地選取動(dòng)作,則期望的成功概率只有0.5。如果學(xué)習(xí)系統(tǒng)對(duì)一個(gè)輸入矢量能正確響應(yīng),但對(duì)另一個(gè)反應(yīng)錯(cuò)誤,則成功概率的期望值也是0.5。

    我們用三種算法各仿真100次,每次仿真20 000步。在仿真的每一步,都計(jì)算當(dāng)前實(shí)際獲得的成功率Rk=sk/k,其中sk表示截止k時(shí)刻累計(jì)獲得的成功次數(shù)。該指標(biāo)可以反映算法的在線學(xué)習(xí)性能。

    仿真結(jié)果見圖1。其中圖1(a)-(c)依次對(duì)應(yīng)算法CALA-SST,CALA-BM 和FILA/RP,每幅圖均為相應(yīng)算法100次仿真所產(chǎn)生的Rk曲線的“疊加效果”。圖1(d)則是各算法100條Rk曲線的平均結(jié)果。

    (a)-(c)performance of CALA-SST,CALA-BM and FILA/RP respectively,100 simulations per algorithm;(d)average performanceFig.1 Simulation results on Task 1(a)-(c)分別為CALA-SST,CALA-BM 和FILA/RP的性能,每種算法各仿真100次;(d)各算法的平均性能圖1 針對(duì)問題1的仿真結(jié)果

    由圖1(a)-(c)不難看出,F(xiàn)ILA/RP的學(xué)習(xí)軌跡比較整齊和緊湊,而CALA-SST尤其是CALA-BM的學(xué)習(xí)軌跡則顯得有些凌亂和分散。這說明,與后兩種算法相比,F(xiàn)ILA/RP各次運(yùn)行結(jié)果的一致性更好。CALA-BM還有幾條“不太合群”的Rk曲線,其上升速度非常緩慢。另外,CALA-SST和CALA-BM各有兩條走向怪異的曲線:CALA-SST是由高到低的“逆向演化”,越學(xué)習(xí)越退步;CALA-BM則一直“停滯”在很低的水平,毫無上升的趨勢。在仿真結(jié)束時(shí)(k=20 000),CALA-SST和CALA-BM最差的成功率分別為0.524 6和0.494 5,F(xiàn)ILA/RP則達(dá)到0.816 9,比前二者分別提高55.7%和65.2%。由圖1(d)可以看出,除學(xué)習(xí)初期的一小段時(shí)間(大約2 000步),F(xiàn)ILA/RP的平均成功率總是最高的,CALA-SST和CALA-BM則基本不相上下。仿真結(jié)束時(shí),CALA-SST和CALA-BM的成功率分別為0.815 8和0.815 6,而FILA/RP則為0.831 3比前兩個(gè)均高出1.9%

    問題2:對(duì)于問題2(對(duì)應(yīng)文獻(xiàn)[3]中的Task 2),兩個(gè)輸入矢量下不同動(dòng)作的成功概率如下:

    在該問題中,對(duì)x(1)應(yīng)選擇“+1”,對(duì)x(2)則應(yīng)選擇“-1”,此時(shí)學(xué)習(xí)系統(tǒng)將獲得0.65的最大期望成功概率。對(duì)于該問題,隨機(jī)選擇動(dòng)作只能得到0.525的期望成功概率。由于對(duì)x(1)來說兩種動(dòng)作的成功概率均小于0.5,而對(duì)x(2)來說兩者又都大于0.5,因此該問題要比Task 1復(fù)雜許多。若一個(gè)算法對(duì)x(2)能正確響應(yīng)但對(duì)x(1)反應(yīng)錯(cuò)誤,則其期望成功概率將是0.55,達(dá)不到0.65的最高值。相反,若一個(gè)算法能正確響應(yīng)x(1)但對(duì)x(2)反應(yīng)錯(cuò)誤,則只能獲得0.5的期望成功概率。這比不學(xué)習(xí)的隨機(jī)選擇還要差,因?yàn)楹笳叩钠谕晒Ω怕势鸫a有0.525。

    Task 2的仿真結(jié)果見圖2。

    (a)-(c)performance of CALA-SST,CALA-BM and FILA/RP respectively,100 simulations per algorithm;(d)average performanceFig.2 Simulation results on Task 2(a)-(c)分別為CALA-SST,CALA-BM 和FILA/RP的性能,每種算法各仿真100次;(d)各算法的平均性能圖2 針對(duì)問題2的仿真結(jié)果

    比較圖2和圖1,不難看出:對(duì)于Task 2,三種算法的表現(xiàn)均有所變差。這是意料之中的,因?yàn)門ask 2比Task 1復(fù)雜。不過,相對(duì)于另兩種算法,F(xiàn)ILA/RP要好得多。由圖2(a)-(c)不難看出,CALA-SST和CALA-BM的學(xué)習(xí)軌跡都相當(dāng)散亂,這表明它們仿真結(jié)果的一致性變得更差。仔細(xì)觀察可以發(fā)現(xiàn),CALASST和CALA-BM的Rk曲線基本上都分化為“三簇”。最上面的一簇對(duì)應(yīng)正確的收斂,但曲線分布范圍較寬,收斂速度的一致性差。中間和最下面的兩簇包含的Rk曲線較少,對(duì)應(yīng)的成功率分別為0.55和0.5。這正是前面分析過的對(duì)某一種輸入矢量能正確響應(yīng)、但對(duì)另一種輸入矢量反應(yīng)錯(cuò)誤的情形。FILA/RP則只有朝向正確方向收斂的一簇。在最差情況下,CALA-SST和CALA-BM在仿真結(jié)束時(shí)的成功率分別為0.496 3和0.499 9,而FILA/RP則達(dá)到0.611 9(而且仍在上升),比前兩者分別高出23.3%和22.4%。圖2(d)給出的平均成功率曲線,更清晰地反映了三種算法的總體性能。除剛開始的一段時(shí)間外,F(xiàn)ILA/RP的平均成功率顯著高于CALA-SST和CALA-BM。在仿真結(jié)束時(shí),后兩種算法的平均Rk分別為0.597 7和0.595 6(比FILA/RP最差的還要低),而FILA/RP則達(dá)到0.629 5,比前兩者分別提高了5.3%和5.7%。

    4 結(jié)束語

    本文提出一種新的連續(xù)動(dòng)作學(xué)習(xí)自動(dòng)機(jī)(CALA),即基于獎(jiǎng)-罰式學(xué)習(xí)的聚焦區(qū)間學(xué)習(xí)自動(dòng)機(jī)(FILA/RP)。該自動(dòng)機(jī)依據(jù)均勻分布方式產(chǎn)生輸出動(dòng)作,并利用環(huán)境反饋的成功失敗信號(hào)對(duì)動(dòng)作區(qū)間進(jìn)行自適應(yīng)調(diào)整。在學(xué)習(xí)過程中,自動(dòng)機(jī)只需要存儲(chǔ)和更新動(dòng)作區(qū)間的兩個(gè)端點(diǎn)。相對(duì)于采用非參數(shù)化概率模型的CARLA來說,其算法簡單,時(shí)空開銷小。由于動(dòng)作集為一個(gè)有限區(qū)間,新算法不會(huì)像CALA-SST和CALA-BM那樣產(chǎn)生不可預(yù)期的、絕對(duì)數(shù)值過大的輸出動(dòng)作,因而更適合安全關(guān)鍵應(yīng)用場合。

    通過兩個(gè)經(jīng)典的聯(lián)想強(qiáng)化學(xué)習(xí)問題的仿真實(shí)驗(yàn),我們演示了新算法相對(duì)于CALA-SST和CALA-BM的優(yōu)越性。與后兩者相比,F(xiàn)ILA/RP的學(xué)習(xí)精度、特別是每次仿真結(jié)果的一致性都更好。對(duì)于兩個(gè)測試問題,新算法都能100%的正確收斂,其平均及最壞情況下的成功率均明顯高于現(xiàn)有算法。利用更多的問題對(duì)新算法的學(xué)習(xí)性能進(jìn)行進(jìn)一步的仿真測試,并嘗試將其應(yīng)用于實(shí)際工程問題,如模式識(shí)別和自適應(yīng)控制等,將是下一步研究的方向。

    [1] Sutton R S,Barto A G.Reinforcement Learning:An Introduction[M].Cambridge:MIT Press,1998.

    [2] 陳學(xué)松,楊宜民.強(qiáng)化學(xué)習(xí)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2010,27(8):2834-2838,2844.

    [3] Barto A G,Anandan P.Pattern-recognizing Stochastic Learning Automata[J].IEEE Trans.on Systems,Man,and Cybernetics,1985,15(3):360-375.

    [4] Narendra K S,Mukhopadhyay S.Associative Learning in Random Environments Using Neural Networks[J].IEEE Trans.on Neural Networks,1991,2(1):20-31.

    [5] Gullapalli V.Direct Associative Reinforcement Learning Methods for Dynamic Systems Control[J].Neurocomputing,1995,9(3):271-292.

    [6] Narendra K S,Thathachar M A L.Learning Automata:An Introduction[M].Englewood Cliffs,NJ:Prentice Hall,1989.

    [7] Thathachar M A L,Sastry P S.Varieties of Learning Automata:An Overview[J].IEEE Trans.on Systems,Man,and Cybernetics,Part B:Cybernetics,2002,32(6):711-722.

    [8] Thathachar M A L,Sastry P S.Networks of Learning Automata:Techniques for Online Stochastic Optimization[M].Boston:Kluwer Academic,2004.

    [9] Howell M N,F(xiàn)rost G P,Gordon T J,et al.Continuous Action Reinforcement Learning Applied to Vehicle Suspension Control[J].Mechatronics,1997,7(3):263-276.

    [10] Howell M N,Best M C.On-line PID Turning for Engine Idle-speed Control using Continuous Action Reinforcement Learning Automata[J].Control Engineering Practice,2000,8(2):147-154.

    [11] Howell M N,Gordon T J.Continuous Action Reinforcement Learning Automata and Their Application to Adaptive Digital Filter Design[J].Engineering Applications of Artificial Intelligence,2001,14(5):549-561.

    [12] Zvacek V C.Magnetic Bearing Controller Tuning Through CARLA Learning Method[D].Doctoral Dissertation,University of Applied Sciences,Merseburg,Czech Republic,2004.

    [13] Sastry P S,Nagendra G D,Mamwani N.A Team of Continuous-action Learning Automata for Noise-tolerant Learning of Half-spaces[J].IEEE Trans.on Systems,Man,and Cybernetics,Part B:Cybernetics,2010,40(1):19-28.

    [14] Torkestani J A.An Adaptive Focused Web Crawling Algorithm based on Learning Automata[J].Applied Intelligence,2012,37(4):586-601.

    [15] Torkestani J A.Mobility Prediction in Mobile Wireless Networks[J].Journal of Network and Computer Applications,2012,35(5):1633-1645.

    [16] Cuevas E,Wario F,Zaldivar D,et al.Circle Detection on Images Using Learning Automata[M].Artificial Intelligence,Evolutionary Computing and Metaheuristics.Berlin Heidelberg:Springer,2013:545-570.

    [17] Torkestani J A,Pisheh E G.A Learning Automata-based Blood glucose Regulation Mechanism in Type 2 Diabetes[J].Control Engineering Practice,2014,26:151-159.

    [18] Santharam G,Sastry P S,Thathachar M A L.Continuous Action set Learning Automata for Stochastic Optimization[J].Journal of the Franklin Institute,1994,331B(5):607-628.

    [19] Beigy H,Meybodi M R.A New Continuous Action-set Learning Automaton for Function Optimization[J].Journal of the Franklin Institute,2006,343(1):27-47.

    猜你喜歡
    高斯分布自動(dòng)機(jī)端點(diǎn)
    非特征端點(diǎn)條件下PM函數(shù)的迭代根
    {1,3,5}-{1,4,5}問題與鄰居自動(dòng)機(jī)
    利用Box-Cox變換對(duì)移動(dòng)通信中小區(qū)級(jí)業(yè)務(wù)流量分布的研究
    2種非對(duì)稱廣義高斯分布模型的構(gòu)造
    不等式求解過程中端點(diǎn)的確定
    一種基于模糊細(xì)胞自動(dòng)機(jī)的新型疏散模型
    廣義標(biāo)準(zhǔn)自動(dòng)機(jī)及其商自動(dòng)機(jī)
    參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點(diǎn)估計(jì)
    一種基于改進(jìn)混合高斯模型的前景檢測
    基丁能雖匹配延拓法LMD端點(diǎn)效應(yīng)處理
    国产成人av激情在线播放| 精品人妻一区二区三区麻豆| 18禁黄网站禁片午夜丰满| 国产精品.久久久| 大片免费播放器 马上看| 777米奇影视久久| 亚洲激情五月婷婷啪啪| 天天添夜夜摸| 99国产极品粉嫩在线观看| 久久久精品94久久精品| 国产精品偷伦视频观看了| 免费观看人在逋| 国产淫语在线视频| 日韩有码中文字幕| 亚洲国产精品一区二区三区在线| 欧美激情久久久久久爽电影 | 人人妻人人爽人人添夜夜欢视频| 建设人人有责人人尽责人人享有的| av片东京热男人的天堂| 少妇裸体淫交视频免费看高清 | 日韩大片免费观看网站| 欧美午夜高清在线| 一级黄色大片毛片| av天堂久久9| 男女之事视频高清在线观看| 男女无遮挡免费网站观看| 12—13女人毛片做爰片一| 老司机亚洲免费影院| 国产人伦9x9x在线观看| 中文字幕色久视频| 色精品久久人妻99蜜桃| 国产成人精品无人区| 免费高清在线观看日韩| 精品人妻熟女毛片av久久网站| 一区福利在线观看| av视频免费观看在线观看| 一边摸一边做爽爽视频免费| 人人妻人人添人人爽欧美一区卜| 午夜福利在线免费观看网站| 国产深夜福利视频在线观看| 水蜜桃什么品种好| 黄色毛片三级朝国网站| 高清在线国产一区| 多毛熟女@视频| 首页视频小说图片口味搜索| 嫁个100分男人电影在线观看| 成人免费观看视频高清| 日韩 亚洲 欧美在线| 窝窝影院91人妻| 欧美精品av麻豆av| 99香蕉大伊视频| 亚洲国产欧美一区二区综合| 男女床上黄色一级片免费看| 久久久精品免费免费高清| 水蜜桃什么品种好| 国产精品免费大片| 1024视频免费在线观看| 国产精品九九99| 欧美日本中文国产一区发布| 老熟妇仑乱视频hdxx| 精品少妇一区二区三区视频日本电影| 中文字幕最新亚洲高清| 两性夫妻黄色片| 欧美在线一区亚洲| 欧美av亚洲av综合av国产av| 99热全是精品| 色播在线永久视频| 国产高清videossex| 色综合欧美亚洲国产小说| 国产精品亚洲av一区麻豆| 色婷婷av一区二区三区视频| 免费人妻精品一区二区三区视频| 大陆偷拍与自拍| 久久亚洲精品不卡| 老熟妇仑乱视频hdxx| 我的亚洲天堂| 亚洲国产av影院在线观看| 精品国产乱码久久久久久男人| 老司机靠b影院| 欧美久久黑人一区二区| 啪啪无遮挡十八禁网站| 免费在线观看完整版高清| 久久 成人 亚洲| 成人三级做爰电影| 亚洲免费av在线视频| 国产精品成人在线| 久久精品国产亚洲av高清一级| 啦啦啦 在线观看视频| 精品一区二区三卡| 在线亚洲精品国产二区图片欧美| 久久久久网色| 国产成人精品久久二区二区免费| 久久这里只有精品19| av网站免费在线观看视频| 一级黄色大片毛片| 老司机深夜福利视频在线观看 | 久热爱精品视频在线9| 国产日韩一区二区三区精品不卡| 自拍欧美九色日韩亚洲蝌蚪91| 十八禁人妻一区二区| 久久人妻福利社区极品人妻图片| 91精品三级在线观看| 国产av一区二区精品久久| 韩国精品一区二区三区| 在线观看www视频免费| 一边摸一边抽搐一进一出视频| 手机成人av网站| 午夜91福利影院| 精品国产乱子伦一区二区三区 | 欧美人与性动交α欧美软件| 日日摸夜夜添夜夜添小说| 精品一区在线观看国产| 女人精品久久久久毛片| 国产黄色免费在线视频| 国产欧美日韩精品亚洲av| 十八禁网站网址无遮挡| 建设人人有责人人尽责人人享有的| 亚洲色图综合在线观看| 国产片内射在线| e午夜精品久久久久久久| 久久精品久久久久久噜噜老黄| 久久精品久久久久久噜噜老黄| 操出白浆在线播放| 中文欧美无线码| 国产在线免费精品| 高清视频免费观看一区二区| 亚洲,欧美精品.| 中文字幕人妻丝袜一区二区| 日韩三级视频一区二区三区| 久久中文看片网| 考比视频在线观看| 无遮挡黄片免费观看| 99国产极品粉嫩在线观看| 涩涩av久久男人的天堂| 成年动漫av网址| 老司机靠b影院| 高清在线国产一区| 成人三级做爰电影| 亚洲精品国产一区二区精华液| 亚洲免费av在线视频| 亚洲天堂av无毛| 亚洲色图 男人天堂 中文字幕| 亚洲激情五月婷婷啪啪| 狠狠婷婷综合久久久久久88av| 亚洲国产看品久久| 国产真人三级小视频在线观看| 欧美在线黄色| 国产精品国产av在线观看| 亚洲视频免费观看视频| 精品亚洲乱码少妇综合久久| 极品人妻少妇av视频| 老司机午夜十八禁免费视频| 精品欧美一区二区三区在线| 777米奇影视久久| 成人国语在线视频| 久久久国产成人免费| 波多野结衣一区麻豆| 午夜精品久久久久久毛片777| 制服诱惑二区| 成人黄色视频免费在线看| 免费人妻精品一区二区三区视频| 欧美亚洲 丝袜 人妻 在线| 久久九九热精品免费| 国产熟女午夜一区二区三区| 精品国产一区二区久久| 国产精品亚洲av一区麻豆| 法律面前人人平等表现在哪些方面 | 韩国高清视频一区二区三区| 国产精品国产三级国产专区5o| 97精品久久久久久久久久精品| 欧美亚洲日本最大视频资源| 亚洲专区中文字幕在线| 天天躁夜夜躁狠狠躁躁| 人人妻,人人澡人人爽秒播| 日本五十路高清| av在线app专区| 久久久久久久国产电影| 婷婷成人精品国产| 国产欧美日韩一区二区三区在线| 天天躁夜夜躁狠狠躁躁| 涩涩av久久男人的天堂| 久久精品熟女亚洲av麻豆精品| avwww免费| 精品少妇黑人巨大在线播放| 国产亚洲欧美在线一区二区| 香蕉丝袜av| 交换朋友夫妻互换小说| 成人手机av| 他把我摸到了高潮在线观看 | 中亚洲国语对白在线视频| 波多野结衣一区麻豆| 国产精品久久久久久人妻精品电影 | 亚洲精品av麻豆狂野| 欧美中文综合在线视频| av天堂久久9| 日日爽夜夜爽网站| 欧美久久黑人一区二区| 日本av手机在线免费观看| 精品国产国语对白av| 黄色视频在线播放观看不卡| 午夜福利影视在线免费观看| 一级毛片电影观看| 亚洲色图综合在线观看| 中文字幕高清在线视频| 亚洲欧美清纯卡通| 亚洲专区字幕在线| 91字幕亚洲| 精品少妇黑人巨大在线播放| 久久免费观看电影| 桃花免费在线播放| 精品国内亚洲2022精品成人 | 精品一区在线观看国产| 免费av中文字幕在线| 亚洲av电影在线观看一区二区三区| 两个人看的免费小视频| 亚洲欧洲日产国产| 精品高清国产在线一区| 国产日韩欧美视频二区| 99国产极品粉嫩在线观看| 欧美黄色片欧美黄色片| av有码第一页| 男女之事视频高清在线观看| 久久免费观看电影| 久久精品成人免费网站| 免费人妻精品一区二区三区视频| 国产成人av教育| 一级毛片电影观看| 99精品久久久久人妻精品| 亚洲综合色网址| 丰满少妇做爰视频| 久久久久网色| 少妇精品久久久久久久| 五月开心婷婷网| 免费高清在线观看视频在线观看| 亚洲国产精品一区三区| 精品高清国产在线一区| 日韩 亚洲 欧美在线| 999久久久精品免费观看国产| 国产成人系列免费观看| 久久久水蜜桃国产精品网| 国产福利在线免费观看视频| 香蕉国产在线看| 日本一区二区免费在线视频| 一本—道久久a久久精品蜜桃钙片| 老司机深夜福利视频在线观看 | 9191精品国产免费久久| 久久久久国产精品人妻一区二区| 999精品在线视频| 纯流量卡能插随身wifi吗| 无遮挡黄片免费观看| 丝袜喷水一区| 精品人妻熟女毛片av久久网站| 叶爱在线成人免费视频播放| 亚洲五月婷婷丁香| 老司机午夜十八禁免费视频| 亚洲欧洲日产国产| av又黄又爽大尺度在线免费看| av天堂久久9| 黄色毛片三级朝国网站| 黄色视频在线播放观看不卡| 十八禁高潮呻吟视频| 纯流量卡能插随身wifi吗| 少妇被粗大的猛进出69影院| 精品少妇黑人巨大在线播放| 天堂中文最新版在线下载| a级毛片在线看网站| 三级毛片av免费| 高清av免费在线| 精品高清国产在线一区| 日韩免费高清中文字幕av| 欧美精品亚洲一区二区| 亚洲av成人不卡在线观看播放网 | 精品一品国产午夜福利视频| 久久精品aⅴ一区二区三区四区| 国产成人精品在线电影| 一级片免费观看大全| 久久久久久久国产电影| 国产成人系列免费观看| www.av在线官网国产| www.av在线官网国产| 精品国产乱码久久久久久男人| 91av网站免费观看| 亚洲人成电影观看| 亚洲天堂av无毛| 青春草亚洲视频在线观看| 制服人妻中文乱码| 黄片播放在线免费| 色播在线永久视频| 蜜桃国产av成人99| 国产一区有黄有色的免费视频| 日韩精品免费视频一区二区三区| www.999成人在线观看| 99精国产麻豆久久婷婷| 亚洲精品日韩在线中文字幕| 热99re8久久精品国产| 免费不卡黄色视频| 人妻久久中文字幕网| 青春草亚洲视频在线观看| 丝袜脚勾引网站| 日本91视频免费播放| 亚洲精品美女久久久久99蜜臀| 欧美日本中文国产一区发布| 久久免费观看电影| 欧美精品人与动牲交sv欧美| 国产精品亚洲av一区麻豆| 9191精品国产免费久久| 12—13女人毛片做爰片一| 欧美老熟妇乱子伦牲交| 满18在线观看网站| 色婷婷av一区二区三区视频| 脱女人内裤的视频| 人人妻人人添人人爽欧美一区卜| 999精品在线视频| 女性生殖器流出的白浆| 国产97色在线日韩免费| 欧美激情久久久久久爽电影 | av天堂久久9| 亚洲精品中文字幕在线视频| 成人免费观看视频高清| 一本—道久久a久久精品蜜桃钙片| 老熟妇乱子伦视频在线观看 | 亚洲七黄色美女视频| 男女国产视频网站| 淫妇啪啪啪对白视频 | 亚洲精品第二区| 日韩 亚洲 欧美在线| 天天影视国产精品| 美女脱内裤让男人舔精品视频| 国产国语露脸激情在线看| 成人三级做爰电影| 日韩免费高清中文字幕av| 黑人巨大精品欧美一区二区蜜桃| 亚洲精品美女久久av网站| 最近最新免费中文字幕在线| 在线av久久热| 9191精品国产免费久久| 一边摸一边做爽爽视频免费| 久久狼人影院| 男女免费视频国产| 日本vs欧美在线观看视频| 黄色怎么调成土黄色| 国产成人欧美| 国产一区二区三区综合在线观看| 少妇粗大呻吟视频| 国产高清国产精品国产三级| 水蜜桃什么品种好| 一边摸一边抽搐一进一出视频| 国产日韩欧美在线精品| 最近中文字幕2019免费版| 交换朋友夫妻互换小说| 桃红色精品国产亚洲av| √禁漫天堂资源中文www| 丁香六月欧美| 少妇粗大呻吟视频| 精品视频人人做人人爽| 狠狠狠狠99中文字幕| 操出白浆在线播放| 窝窝影院91人妻| 不卡一级毛片| 亚洲av成人不卡在线观看播放网 | 日日夜夜操网爽| 美女国产高潮福利片在线看| 欧美97在线视频| 久久99一区二区三区| 一本—道久久a久久精品蜜桃钙片| 免费日韩欧美在线观看| 国产日韩欧美亚洲二区| 国产免费现黄频在线看| 69精品国产乱码久久久| 亚洲avbb在线观看| 岛国在线观看网站| 欧美黑人精品巨大| 天天操日日干夜夜撸| 亚洲天堂av无毛| 50天的宝宝边吃奶边哭怎么回事| 不卡一级毛片| 日韩欧美一区二区三区在线观看 | 亚洲一区中文字幕在线| 亚洲少妇的诱惑av| 日韩三级视频一区二区三区| 欧美日韩福利视频一区二区| 国产精品久久久久成人av| 18禁国产床啪视频网站| 最黄视频免费看| 国产精品一区二区精品视频观看| 中文字幕人妻丝袜一区二区| 老司机午夜十八禁免费视频| 午夜激情av网站| 女人精品久久久久毛片| 老司机深夜福利视频在线观看 | 日韩人妻精品一区2区三区| 蜜桃在线观看..| 欧美日韩中文字幕国产精品一区二区三区 | 国产免费av片在线观看野外av| 日本黄色日本黄色录像| 久久精品aⅴ一区二区三区四区| 人人妻人人爽人人添夜夜欢视频| 大陆偷拍与自拍| 国产精品自产拍在线观看55亚洲 | 美女高潮到喷水免费观看| 欧美日韩中文字幕国产精品一区二区三区 | 啦啦啦 在线观看视频| 国产在线视频一区二区| 亚洲av日韩在线播放| 亚洲天堂av无毛| 亚洲综合色网址| 伊人久久大香线蕉亚洲五| 久久精品国产亚洲av香蕉五月 | 欧美日韩亚洲综合一区二区三区_| 十八禁人妻一区二区| 2018国产大陆天天弄谢| 亚洲欧美清纯卡通| 三上悠亚av全集在线观看| 他把我摸到了高潮在线观看 | 黑人操中国人逼视频| 亚洲国产毛片av蜜桃av| 啦啦啦免费观看视频1| 婷婷色av中文字幕| 日韩视频一区二区在线观看| 国产激情久久老熟女| 男人舔女人的私密视频| 老鸭窝网址在线观看| 国产成人免费无遮挡视频| 日韩欧美一区视频在线观看| 国产极品粉嫩免费观看在线| 久热爱精品视频在线9| 久久久国产精品麻豆| 久久影院123| 免费少妇av软件| 后天国语完整版免费观看| 免费日韩欧美在线观看| 美女午夜性视频免费| 午夜精品久久久久久毛片777| 色婷婷久久久亚洲欧美| 国产在线免费精品| 亚洲精品国产一区二区精华液| 三上悠亚av全集在线观看| 下体分泌物呈黄色| 天天躁狠狠躁夜夜躁狠狠躁| 亚洲色图 男人天堂 中文字幕| 97人妻天天添夜夜摸| 日韩视频一区二区在线观看| 久久国产精品人妻蜜桃| 青春草视频在线免费观看| 黄色片一级片一级黄色片| 97精品久久久久久久久久精品| 叶爱在线成人免费视频播放| 久久久久久久精品精品| 国产av一区二区精品久久| e午夜精品久久久久久久| 成人av一区二区三区在线看 | 亚洲国产精品一区三区| 日韩视频在线欧美| 18禁裸乳无遮挡动漫免费视频| 12—13女人毛片做爰片一| 一级,二级,三级黄色视频| 老司机深夜福利视频在线观看 | 亚洲欧美日韩高清在线视频 | 精品国产一区二区三区四区第35| 精品国产一区二区久久| 一区二区三区激情视频| 满18在线观看网站| 国产成人精品久久二区二区免费| www.999成人在线观看| 国产高清videossex| 精品亚洲成国产av| 热99re8久久精品国产| 国产精品久久久久久精品古装| 亚洲欧美精品自产自拍| 精品国产国语对白av| av有码第一页| 精品少妇久久久久久888优播| 亚洲视频免费观看视频| 可以免费在线观看a视频的电影网站| 999久久久国产精品视频| av福利片在线| 欧美日韩亚洲高清精品| 欧美成狂野欧美在线观看| 亚洲中文字幕日韩| 国产精品久久久久久人妻精品电影 | 欧美日韩一级在线毛片| 亚洲欧美激情在线| 这个男人来自地球电影免费观看| 免费日韩欧美在线观看| 国产男女超爽视频在线观看| 黄色a级毛片大全视频| 人妻 亚洲 视频| 欧美一级毛片孕妇| 日韩欧美国产一区二区入口| 久9热在线精品视频| 秋霞在线观看毛片| 99国产精品一区二区蜜桃av | 亚洲精品日韩在线中文字幕| 老司机在亚洲福利影院| 国产福利在线免费观看视频| 99久久综合免费| 亚洲中文av在线| 窝窝影院91人妻| 十八禁网站网址无遮挡| 精品第一国产精品| 热99久久久久精品小说推荐| 亚洲综合色网址| 久久国产精品男人的天堂亚洲| 精品一区二区三区四区五区乱码| 天天躁夜夜躁狠狠躁躁| 精品熟女少妇八av免费久了| 动漫黄色视频在线观看| 欧美日韩成人在线一区二区| 国产精品免费视频内射| 久久久久久久久久久久大奶| 岛国在线观看网站| 高清黄色对白视频在线免费看| 又黄又粗又硬又大视频| 免费高清在线观看日韩| 丝袜美足系列| 国产在线免费精品| 国产99久久九九免费精品| 日本黄色日本黄色录像| 日本av手机在线免费观看| 免费在线观看完整版高清| 中文字幕最新亚洲高清| 日韩电影二区| 久久久国产一区二区| 无遮挡黄片免费观看| 日本撒尿小便嘘嘘汇集6| 嫩草影视91久久| 99精品久久久久人妻精品| 飞空精品影院首页| 国产精品成人在线| 国产亚洲一区二区精品| a在线观看视频网站| 亚洲精品一卡2卡三卡4卡5卡 | 亚洲国产av影院在线观看| 欧美+亚洲+日韩+国产| 亚洲伊人久久精品综合| 日韩制服丝袜自拍偷拍| 午夜精品久久久久久毛片777| 蜜桃国产av成人99| 国产欧美日韩一区二区精品| 999久久久精品免费观看国产| av福利片在线| 999久久久国产精品视频| 精品熟女少妇八av免费久了| 婷婷成人精品国产| 亚洲精品日韩在线中文字幕| 国产日韩欧美视频二区| 亚洲av欧美aⅴ国产| 一级a爱视频在线免费观看| 欧美精品一区二区大全| 久久久久网色| av网站免费在线观看视频| 精品福利观看| 国产亚洲精品久久久久5区| 一本大道久久a久久精品| 大陆偷拍与自拍| 亚洲伊人色综图| tocl精华| 欧美 日韩 精品 国产| 男人操女人黄网站| av不卡在线播放| 51午夜福利影视在线观看| 老司机影院成人| 久久精品成人免费网站| 亚洲欧美激情在线| 久久九九热精品免费| 欧美亚洲日本最大视频资源| 精品熟女少妇八av免费久了| 嫩草影视91久久| 国产区一区二久久| 在线观看一区二区三区激情| 中文字幕色久视频| 精品一品国产午夜福利视频| 国产亚洲午夜精品一区二区久久| 国产精品久久久人人做人人爽| 91大片在线观看| 一二三四社区在线视频社区8| 日日摸夜夜添夜夜添小说| 欧美日韩中文字幕国产精品一区二区三区 | 国产亚洲av高清不卡| 国产精品偷伦视频观看了| 国产无遮挡羞羞视频在线观看| 国产欧美日韩一区二区精品| 老熟妇仑乱视频hdxx| 日本vs欧美在线观看视频| 精品亚洲成国产av| 久久久国产一区二区| 精品人妻在线不人妻| 国产高清videossex| 亚洲成av片中文字幕在线观看| 啦啦啦在线免费观看视频4| 午夜福利免费观看在线| 亚洲自偷自拍图片 自拍| 老鸭窝网址在线观看| 亚洲欧美激情在线| 免费观看a级毛片全部| 99久久人妻综合| 日本vs欧美在线观看视频| 免费少妇av软件| 法律面前人人平等表现在哪些方面 | 久久99一区二区三区| 国产精品免费视频内射| 香蕉国产在线看| 日韩欧美国产一区二区入口| 777米奇影视久久| 国产精品久久久人人做人人爽| 国产av国产精品国产| 精品久久久久久久毛片微露脸 | 日本91视频免费播放| 2018国产大陆天天弄谢| 亚洲第一青青草原| 免费一级毛片在线播放高清视频 | 亚洲精品在线美女| 亚洲黑人精品在线| 一本久久精品| 精品少妇黑人巨大在线播放|