• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種多重優(yōu)先經(jīng)驗回放的麻將游戲數(shù)據(jù)利用方法

    2022-02-08 01:04:12李淑琴
    關(guān)鍵詞:復(fù)雜程度對局局面

    李淑琴,李 奕

    (1.北京信息科技大學(xué) 計算機(jī)學(xué)院, 北京 100101; 2.感知與計算智能聯(lián)合實(shí)驗室, 北京 100101)

    0 引言

    計算機(jī)博弈一直是驗證人工智能理論的試金石,也是人工智能最活躍的研究領(lǐng)域之一。計算機(jī)博弈相關(guān)理論和技術(shù)被廣泛應(yīng)用于金融、交通、軍事等領(lǐng)域。計算機(jī)博弈通常包括完全信息博弈[1]和非完全信息博弈[2]。非完全信息博弈問題相對于完全信息博弈,其研究更為困難也更加具有挑戰(zhàn)性。深度強(qiáng)化學(xué)習(xí)憑借深度學(xué)習(xí)的感知能力與強(qiáng)化學(xué)習(xí)的決策能力成為解決非完全信息博弈問題的主流方法[3-5],目前深度強(qiáng)化學(xué)習(xí)的研究點(diǎn)主要集中在樣本利用效率,獎勵函數(shù)設(shè)計以及決策方法上。

    在樣本利用方面,以往的經(jīng)驗回放機(jī)制中最早采用的隨機(jī)經(jīng)驗回放,即將多條經(jīng)驗樣本存儲在經(jīng)驗池中,然后隨機(jī)采樣更新深度神經(jīng)網(wǎng)絡(luò),以便克服數(shù)據(jù)之間的相關(guān)性,這在一定程度上提高了數(shù)據(jù)利用率,但不符合人的學(xué)習(xí)習(xí)慣。人們在日常的學(xué)習(xí)中,往往對一些重要的經(jīng)驗記憶深刻,而忽略那些不重要的經(jīng)驗。文獻(xiàn)[6]首次提出了優(yōu)先經(jīng)驗回放機(jī)制,對于經(jīng)驗池中的樣本,根據(jù)經(jīng)驗重要性賦予不同的優(yōu)先級,樣本優(yōu)先級越大則其被采樣到的概率就越高,即希望越重要的經(jīng)驗使用次數(shù)越多,從而增加學(xué)習(xí)效率。文獻(xiàn)[7]提出根據(jù)經(jīng)驗樣本的時序差分誤差(temporal-difference)的不同,賦予每個樣本不同的優(yōu)先概率,誤差值越高,表明模型評估的差異越大,越需要訓(xùn)練,重要性越大。文獻(xiàn)[8]不僅考慮時序拆分誤差,還引入了Q值作為劃分標(biāo)準(zhǔn)。文獻(xiàn)[9]采用了回合平均獎勵作為優(yōu)先級進(jìn)行樣本選取??梢妰?yōu)先經(jīng)驗回放機(jī)制中對經(jīng)驗樣本的劃分方法并不統(tǒng)一,一般與具體領(lǐng)域有關(guān)。

    本文從提高大眾麻將AI訓(xùn)練樣本利用率角度出發(fā),通過改進(jìn)強(qiáng)化學(xué)習(xí)算法中樣本利用方法,以便提升麻將AI的訓(xùn)練速度。

    1 大眾麻將游戲術(shù)語及規(guī)則

    麻將是中國古代發(fā)明的一種不完全信息博弈游戲,在中國各地區(qū)都十分流行,不同地區(qū)有著不同的玩法。本文針對2021年中國計算機(jī)博弈錦標(biāo)賽中大眾麻將[10-11]進(jìn)行研究,大眾麻將游戲基本術(shù)語及規(guī)則如下:

    玩家:大眾麻將游戲由4名玩家組成。

    牌庫:牌的總張數(shù)。大眾麻將分為條、筒、萬三門,共計108張。

    牌墻:開局發(fā)完初始手牌后,剩下的牌為牌墻,共55張。

    局面:某位玩家在某一個時刻可以觀察到的所有信息。

    條:條子牌共有9種,由序數(shù)牌一條至九條組成,每一種都有4張,共有36張。

    筒:筒子牌共有9種,由序數(shù)牌一筒至九筒組成,每一種都有4張,共有36張。

    萬:萬字牌共有9種,由序數(shù)牌一萬至九萬組成,每一種都有4張,共有36張。

    順子:指同一花色中,順序相連的3張牌,如“一萬二萬三萬”。

    刻子:指同一花色中,3張相同的牌,如“一萬一萬一萬”。

    對子:指同一花色中,2張相同的牌,如“一萬一萬”。

    摸牌:玩家從牌墻中摸1張牌。

    出牌:玩家從手牌中選擇1張打出。

    吃牌:當(dāng)上家打出的1張牌和自己手牌中的2張牌構(gòu)成順子時,則可進(jìn)行吃牌操作。

    碰牌:其他玩家打出的1張牌和自己手牌中的2張牌相同,則可以進(jìn)行碰牌操作。

    明杠:指其他玩家打出的1張牌和自己手牌中的3張牌相同,則可以進(jìn)行明杠操作。

    暗杠:指自己手中有4張相同的牌,則可以進(jìn)行暗杠操作。

    補(bǔ)杠:指自己手牌中有1張和自己已經(jīng)碰過的牌相同,則可以進(jìn)行補(bǔ)杠操作。當(dāng)牌墻中有剩余牌時玩家可以進(jìn)行杠牌,玩家摸完牌墻最后1張牌不能杠牌。

    和牌:分為點(diǎn)炮、自摸、和搶杠胡,點(diǎn)炮是指其他玩家打出某張牌結(jié)合我方的手牌組成和牌牌型,自摸是指自己摸牌后的牌型為和牌牌型,搶杠胡是指其他玩家補(bǔ)杠的某張牌結(jié)合我方手牌組成和牌牌型,和牌牌型通常是An+B的格式,A為順子或刻子,B為對子,此外還包括七對(7個對子)和牌方式。

    聽牌:當(dāng)玩家手牌打出某張牌后,還差1張牌就可以和牌時,此時的手牌是聽牌狀態(tài)。玩家可選擇是否進(jìn)行報聽操作。報聽后,雖然可以直接獲得分?jǐn)?shù)獎勵,但是此后不可吃、碰操作,后續(xù)摸什么牌就打什么牌,直到場上胡的那張牌出現(xiàn),才可進(jìn)行和牌操作。且在不影響原來聽的牌的情況下,當(dāng)場上有合法的杠牌出現(xiàn)時,可以選擇進(jìn)行杠牌操作。

    開局時4位玩家分東南西北入座,每人起手摸13張牌,莊(東風(fēng)位置)玩家起手多摸1張牌,共計14張。之后由莊家位玩家開始按逆時針出牌操作,行牌過程中可進(jìn)行摸牌、出牌、吃牌、碰牌、杠牌、報聽和和牌操作。其中,吃牌、碰牌、杠牌、報聽和和牌都可獲得直接收益。且同一時刻可能會出現(xiàn)多種決策動作,各動作的優(yōu)先級為:和牌>杠牌>碰牌>吃牌。當(dāng)有玩家成功和牌或牌墻中的牌出完時,牌局結(jié)束,根據(jù)玩家動作以及和牌牌型的番種,統(tǒng)計各玩家的總分,麻將游戲番種如表1所示。

    表1 麻將游戲番種

    2 多重優(yōu)先經(jīng)驗值的設(shè)計

    由于大眾麻將真人打牌數(shù)據(jù)有限,目前主要采用遷移學(xué)習(xí)[12-13]和深度強(qiáng)化學(xué)習(xí)的方法來進(jìn)行研究,但在樣本的使用上,存在兩個問題:

    1) 經(jīng)驗樣本存在時序相關(guān)的特點(diǎn),不符合獨(dú)立同分布的假設(shè),因此網(wǎng)絡(luò)模型很難穩(wěn)定地去學(xué)習(xí)。

    2) 經(jīng)驗樣本被利用一次后就被丟棄,樣本利用率差。

    為解決上述問題,將經(jīng)驗樣本存入經(jīng)驗池,從經(jīng)驗池取出均勻采樣用于訓(xùn)練的方法,但是這樣做會導(dǎo)致經(jīng)驗樣本浪費(fèi),效率也低。為了提高經(jīng)驗樣本(Si,a,r,Si+1)的利用率,對重要的經(jīng)驗重復(fù)利用,本文綜合考慮經(jīng)驗樣本中局面Si的復(fù)雜程度D(Si)、時間差分誤差δi、動作的即時獎勵值ri三個因素。首先計算出經(jīng)驗樣本中各個因素的優(yōu)先值概率,然后通過對3個因素的概率值線性加權(quán),計算出經(jīng)驗樣本的總優(yōu)先概率,概率值越大,被抽取的概率越大。本文通過提高重要樣本的抽取概率,提高數(shù)據(jù)利用效率,加快網(wǎng)絡(luò)的訓(xùn)練速度。

    2.1 基于局面復(fù)雜程度的優(yōu)先級

    結(jié)合大眾麻將游戲的特點(diǎn),麻將游戲?qū)儆诙嗳瞬┺挠螒?,游戲隱藏信息多,對手策略隱蔽,出牌不確定性程度高。由于距離和牌近的游戲局面往往比較容易取得勝利,局面相對簡單,而距離和牌越遠(yuǎn)的游戲局面不確定性程度大,局面比較復(fù)雜。因此,本文在選擇樣本重要程度時考慮了不同時刻局面的復(fù)雜程度,并根據(jù)局面復(fù)雜程度給出優(yōu)先級。

    定義:麻將局面的復(fù)雜程度

    一個局面的復(fù)雜程度為當(dāng)前局面與游戲結(jié)束局面時的距離。即當(dāng)前麻將局面下玩家替換若干手牌后可以和牌的最小值。

    某個局面Si的復(fù)雜程度D(Si)計算。本文除了考慮計算4個搭子加1個對子的所有基本和牌牌型外,還考慮了七對這種特殊牌型,計算方法如式(1)所示。

    D(Si)=min(D1(Si),D2(Si))

    (1)

    其中:D1(Si)表示計算4個搭子加1個對子的基本和牌牌型,計算方法如式(2)所示。

    (2)

    其中:m表示手牌中搭子(不相交的刻子數(shù)和順子數(shù));n表示手牌中不相交的搭子數(shù)(包括兩面搭子、邊張搭子、嵌張搭子和對子);p表示除去面子和搭子后手牌中是否還有一對子。

    和牌不僅包括基本胡,還包括七對這種牌型,計算如式(3)所示。

    D2(Si)=7-q

    (3)

    其中q表示當(dāng)前局面的手牌中的對子數(shù)。

    樣本中局面復(fù)雜程度的優(yōu)先概率計算首先通過式(1)先得到每個局面復(fù)雜程度大小D(Si),然后根據(jù)式(5)計算該時段局面復(fù)雜程度重要性值Mi,最后通過式(4)歸一化得出樣本局面復(fù)雜程度的選取概率PD。Mi表示樣本i的復(fù)雜程度對應(yīng)的數(shù)值大小。相關(guān)定義如下:

    (4)

    Mi=-e(D(Si)-φ)2+f

    (5)

    式(5)表示不同時刻下樣本局面復(fù)雜程度大小,其中,e,φ,f為調(diào)節(jié)參數(shù),e使得不同復(fù)雜程度優(yōu)先級間隔平滑,f保證局面復(fù)雜程度對應(yīng)的重要性值為正,φ使得AI在不同時間局面復(fù)雜度的優(yōu)先級不同。起初φ=0,表示局面復(fù)雜程度為0的經(jīng)驗樣本概率最大;隨著游戲局?jǐn)?shù)的增加,φ逐漸增大,局面復(fù)雜程度位于(0,φ)之間值的重要性逐漸變小;局面復(fù)雜程度最高為7,所以值位于(φ,7)的樣本重要性逐漸增大,表明隨著學(xué)習(xí)的時間增加,學(xué)到的局面復(fù)雜程度越來越大。

    2.2 基于立即回報的優(yōu)先級

    在麻將游戲?qū)謺r刻t,對于狀態(tài)St做出了動作a,并轉(zhuǎn)移到下一個狀態(tài)St+1時,會獲得的立即回報為r?;貓蟮慕^對值大的樣本往往反應(yīng)映AI動作過好或者過壞,重要程度較高。因此,在選擇樣本重要程度時考慮動作的立即回報。立即回報選擇概率如式(6)所示。

    (6)

    其中:i表示為經(jīng)驗樣本中即時獎勵的下標(biāo);ε是一個很小的常數(shù),防止即時獎勵為0的經(jīng)驗被抽取到的概率為0。

    2.3 基于時間差分誤差的優(yōu)先級

    在t時刻,狀態(tài)為St,動作為at, AI的狀態(tài)動作價值函數(shù)Q(St,at)與事先預(yù)估的狀態(tài)動作價值函數(shù)Q(St+1,at+1)的差值稱為時間差分誤差。時間差分誤差越大,表明AI對該局面動作選取越差,越需要學(xué)習(xí)更新。因此,在選擇樣本重要程度時考慮了樣本時序差分誤差。時序差分選擇概率如式(7)—(9)所示。

    δt=r+λQ(St+1,at+1)-Q(St,at)

    (7)

    pi=|δi|+ε

    (8)

    (9)

    其中:λ為衰減率;ε是一個很小的常數(shù),防止時序差分誤差為0的經(jīng)驗被抽取到的概率為0。

    2.4 樣本多重優(yōu)先級的計算方法

    綜合考慮局面的復(fù)雜程度、動作即時獎勵以及時間差分誤差,采用線性加權(quán)的方式計算樣本總優(yōu)先概率值,多重優(yōu)先級計算方法如式(10)(11)所示。

    (10)

    (11)

    其中:PTD(i),PR(i),PD(i)分別表示第i條經(jīng)驗樣本的時序差分誤差、獎勵、復(fù)雜程度概率;a∈[0,1],b∈[0,1],c∈[0,1]為三者的權(quán)重,它們的大小隨時間的增加而減小。隨著游戲?qū)值脑黾樱珹I對經(jīng)驗的學(xué)習(xí)越來越不依賴于這些優(yōu)先經(jīng)驗,當(dāng)對局?jǐn)?shù)目增大時μj減小。

    2.5 降低學(xué)習(xí)率方法

    提出的多重優(yōu)先級回放方法改變了經(jīng)驗的抽樣方式,但是它引入了偏差,不利于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。為此,通過使用重要性抽樣(importing sample)對高概率樣本降低學(xué)習(xí)率,以防止過擬合。

    重要性采樣權(quán)重如式(12)所示:

    (12)

    其中β∈ [0,1],網(wǎng)絡(luò)剛開始訓(xùn)練時,β設(shè)置較小,隨著網(wǎng)絡(luò)訓(xùn)練β值逐漸增加至1。

    2.6 優(yōu)先級計算優(yōu)化方法

    相比于隨機(jī)經(jīng)驗回放,優(yōu)先經(jīng)驗回放在計算經(jīng)驗樣本的優(yōu)先級上需要額外的時間。所以,本文在經(jīng)驗樣本優(yōu)先級的計算以及經(jīng)驗樣本的抽取上進(jìn)行了時間優(yōu)化。主要方法包括:

    1)當(dāng)一條新經(jīng)驗樣本覆蓋經(jīng)驗庫時,需要重新計算經(jīng)驗庫中每條經(jīng)驗樣本的優(yōu)先級,此時經(jīng)驗庫中總局面復(fù)雜程度、總即時獎勵以及總時序差分誤差不必重新累加,優(yōu)化方法如式(13)所示,其中W表示經(jīng)驗庫中局面復(fù)雜程度、即時獎勵或時序差分誤差:

    W總=W總+W移入-W移除

    (13)

    2) 當(dāng)計算出個樣本的總優(yōu)先級值時,常用做法是對樣本排序后按概率進(jìn)行抽取,這種做法的平均時間復(fù)雜度為nlog2(n),本文通過構(gòu)建sum-tree進(jìn)行經(jīng)驗樣本的抽取,時間復(fù)雜度為log2(n),如圖1所示。

    圖1 sum-tree示意圖

    葉子節(jié)點(diǎn)表示經(jīng)驗庫中樣本的總優(yōu)先級值,父節(jié)點(diǎn)為子節(jié)點(diǎn)之和,構(gòu)建sum-tree時,當(dāng)葉子節(jié)點(diǎn)不為2n時,用0節(jié)點(diǎn)補(bǔ)至2n,自下而上構(gòu)建整棵樹。節(jié)點(diǎn)旁紅色數(shù)字為節(jié)點(diǎn)標(biāo)號,葉子結(jié)點(diǎn)下面是他們各自對應(yīng)的數(shù)值區(qū)間,葉子結(jié)點(diǎn)數(shù)值越大(優(yōu)先級越高)其區(qū)間長度就越大,因此從0~11中均勻抽樣一個數(shù)據(jù)落到這個區(qū)間內(nèi)的概率也就越大,這就是按照優(yōu)先級進(jìn)行抽樣的原理,具體抽樣過程如下:

    a) 給定0~根節(jié)點(diǎn)范圍隨機(jī)數(shù)s將根結(jié)點(diǎn)作為父親結(jié)點(diǎn),遍歷其子節(jié)點(diǎn);

    b) 如果左子節(jié)點(diǎn)大于s,將左子節(jié)點(diǎn)作為父親結(jié)點(diǎn),遍歷其子節(jié)點(diǎn);

    c) 如果左子結(jié)點(diǎn)數(shù)值小于s,將s減去左子結(jié)點(diǎn)的數(shù)值,選擇右子結(jié)點(diǎn)作為父親結(jié)點(diǎn),遍歷其子節(jié)點(diǎn);

    d) 直到遍歷的葉子結(jié)點(diǎn),該葉子結(jié)點(diǎn)的數(shù)值就是優(yōu)先級,下標(biāo)對應(yīng)的數(shù)值下標(biāo),可以從經(jīng)驗庫中找到對應(yīng)的數(shù)值。

    例如,圖1給出隨機(jī)數(shù)8.5,選擇節(jié)點(diǎn)0作為父節(jié)點(diǎn)。8.5與節(jié)點(diǎn)1比較,8小于8.5,得到結(jié)果0.5,將節(jié)點(diǎn)2作為父節(jié)點(diǎn), 0.5與節(jié)點(diǎn)5比較,0.5小于1,選擇節(jié)點(diǎn)5,所以抽取節(jié)點(diǎn)5代表的經(jīng)驗樣本。

    3 基于多重優(yōu)先經(jīng)驗值的大眾麻將博弈算法實(shí)現(xiàn)

    強(qiáng)化學(xué)習(xí)就是一個智能體(Agent)在狀態(tài)(State)采取行動(Action)獲得獎勵(Reward)與環(huán)境(Environment)發(fā)生交互并更新的自身循環(huán)過程。

    對于大眾麻將游戲而言,要訓(xùn)練的AI可以看作一個智能體,博弈信息可以看作是環(huán)境狀態(tài),吃、碰、杠、聽、胡、棄牌可以看作是行動,是否獲勝,以及獲勝的番種可以看作為獎勵。博弈過程會隨著智能體根據(jù)博弈信息做出策略,而轉(zhuǎn)移到下一個狀態(tài),并獲得一定獎勵。麻將是一個四人博弈游戲,在一個智能體做完動作后,需要等其余3名玩家做出回應(yīng)后才能使得環(huán)境狀態(tài)進(jìn)行轉(zhuǎn)移。因此,本文將其他3個玩家設(shè)置為環(huán)境一部分。采用DDQN(double deep Q-learning)方法結(jié)合優(yōu)先經(jīng)驗回放進(jìn)行麻將AI訓(xùn)練。由于麻將數(shù)據(jù)離散,需要對麻將牌面進(jìn)行表示,以供神經(jīng)網(wǎng)絡(luò)的輸入,牌面表示如圖2所示。訓(xùn)練流程如圖3所示,其中紅色虛線框中多重經(jīng)驗回放機(jī)制部分是本文重難點(diǎn)研究的內(nèi)容。算法主要流程見算法1所示。

    圖2 牌面表示示意圖

    圖3 DDQN算法訓(xùn)練流程框圖

    算法1:MPER-DDQN

    1 輸入:minibatch大小為k學(xué)習(xí)率為α,折扣系數(shù)γ,回放周期為K,存儲數(shù)據(jù)大小為N,對局輪數(shù)M,單局對局時間T,探索率ε

    2 輸出:預(yù)測網(wǎng)絡(luò)Q參數(shù)ε

    4 for episode = 1 toMdo

    5 fort= 1 toTdo

    觀察初始狀態(tài)S0, 生成隨機(jī)數(shù)n,n∈[0,1];

    6 ifn<ε

    選擇隨機(jī)動作at

    7 else

    at=maxaQ*(St,a;θ)

    8 end

    9 得到該動作獎勵rt,以及下一狀態(tài)St+1,并將經(jīng)驗樣本(St,at,rt,St+1)存儲在經(jīng)驗庫H中;

    10 forj= 1 toNdo

    11 令yj=

    //a為動作集,t′為時間步

    12 計算δj=yj-Q(St′-at′);

    13 計算P(j)D,P(j)r,P(j)TD;

    14 計算優(yōu)先級

    15 iftmodK== 0 then

    //間隔K步回放一次

    fori= 1 tokdo

    損失函數(shù)Loss:

    計算樣本的重要性權(quán)重ωj;

    計算權(quán)重Δ←Δ+ωj·δj▽θ(St″,at″)

    16 end for

    17 更新預(yù)測網(wǎng)絡(luò)參數(shù)θ←θ+α·Δ

    18 更新有先經(jīng)驗權(quán)重系數(shù)μi=μi*μ

    19 一段時間θ-←θ;

    20 end if

    21 end for

    22 end for

    23end for

    在訓(xùn)練過程中,DDQN使用預(yù)測網(wǎng)絡(luò)計算下一個狀態(tài)下的對應(yīng)各個打牌動作的Q值,并記錄其下標(biāo),然后使用目標(biāo)網(wǎng)絡(luò)計算下一個狀態(tài)里面的對應(yīng)各個打牌動作,將預(yù)測網(wǎng)絡(luò)預(yù)測的打牌動作索引對應(yīng)的Q值作為目標(biāo)Q值,避免了選取預(yù)測網(wǎng)絡(luò)最大Q值的過程,從而一定程度上避免了對當(dāng)前牌局下,對某個打牌動作過高Q值估計的問題,提高了訓(xùn)練的穩(wěn)定性。Double DQN與DQN相同的是他們都有被稱之為預(yù)測網(wǎng)絡(luò)與目標(biāo)網(wǎng)絡(luò)的兩個網(wǎng)絡(luò),只是在實(shí)作過程中,標(biāo)簽的計算過程做了修正,如式(14)。

    (14)

    yj表示模型訓(xùn)練時得到的Q值。如果當(dāng)前一輪游戲結(jié)束,則rj值為最終Q值;否則,Q值不僅包含即時獎勵rj,也包含預(yù)測網(wǎng)絡(luò)對下一牌局狀態(tài)預(yù)測的最大Q值。

    與深度學(xué)習(xí)不同的是,DDQN輸出的不再是預(yù)測出牌的概率,而是對于當(dāng)前狀態(tài)下每個動作的Q值,選取Q值最大的動作進(jìn)行執(zhí)行,進(jìn)而利用eval網(wǎng)絡(luò)得到最大Q值打牌策略的下標(biāo),然后利用target網(wǎng)絡(luò)計算下一狀態(tài)下執(zhí)行該動作的實(shí)際Q值,進(jìn)而計算當(dāng)前局面下,執(zhí)行該打牌動作后的收益,與預(yù)估收益的均方誤差,作為DDQN的損失函數(shù)為:

    (15)

    4 實(shí)驗平臺搭建及實(shí)驗結(jié)果

    4.1 實(shí)驗平臺的搭建

    在對智能體交互的環(huán)境進(jìn)行搭建的文獻(xiàn)中,OpenAI的gym[14]以及RLcard[15]給出了很好的范例,因此,本文借鑒其對智能體環(huán)境的搭建方式,并結(jié)合大眾游戲自身的特點(diǎn),建立一套大眾麻將自博弈環(huán)境。其自博弈流程如下:

    算法2大眾麻將自博弈流程

    1 輸入:初始化玩家手牌hand,莊家位置dealer,該回合玩家p

    2 輸出:博弈結(jié)果

    3p= 莊家;

    4 while True do

    5 ifp已經(jīng)聽牌 then

    6 ifp和牌合法

    7 直接胡

    8 else ifp杠牌合法 then

    9 獲取p的動作內(nèi)容

    10 else

    11 打出剛摸得牌

    12 end if

    13 else

    14 驗證p動作action合法性;

    15 if action == 和牌 then

    16 游戲結(jié)束計算得分

    17 else if action == 杠牌 then

    18 if 補(bǔ)杠 then

    19 if 搶杠胡(判定動作是否合法)then

    20 游戲結(jié)束

    21 end if

    22 end if

    23 else if action == 棄牌 or 聽牌 then

    24 獲取可行動作玩家動作;

    25 判定優(yōu)先級

    26 Continue;

    27 if 剩余牌數(shù)目大于0 then

    28 摸一張(吃碰后不能摸);

    29 else

    30 游戲結(jié)束

    31 end if

    32 end if

    33end if

    4.2 實(shí)驗結(jié)果與分析

    在2080Ti服務(wù)器進(jìn)行實(shí)驗。實(shí)驗的軟件環(huán)境配置為:Windows 10,python 3.7,pytorch 1.4等,實(shí)驗超參數(shù)如表2所示。

    表2 超參數(shù)設(shè)置

    為了驗證本文方法的有效性,將提出的多重優(yōu)先經(jīng)驗回放大眾麻將程序 MPER-DDQN與基于隨機(jī)經(jīng)驗回放麻將程序ER-DDQN各自博弈8萬局,設(shè)置的對手麻將AI均為采用深度學(xué)習(xí)編寫的2020年亞軍程序[16]。由于麻將游戲?qū)殖跏际峙撇煌烤钟螒蚶塾嫽貓蟛町愝^大,故統(tǒng)計了每百輪平均獎勵作為AI對局中的表現(xiàn)。實(shí)驗過程中2個麻將AI程序?qū)种蝎@得的累計回報如圖4所示,橫坐標(biāo)為AI對局輪數(shù),縱坐標(biāo)為對局中獲得的累計獎勵。AI對局消耗的時間如圖5所示,其中橫坐標(biāo)表現(xiàn)對局時間,縱坐標(biāo)為對局所用時間。

    圖4 2種方法AI對局中累計回報

    圖5 2種方法AI對局中消耗的時間

    從圖4中可以看出,采用本文多重優(yōu)先經(jīng)驗回放的方法AI在39 000輪對局可以達(dá)到收斂,而隨機(jī)經(jīng)驗回放則大約需要61 000局。從圖5可以看出,優(yōu)先經(jīng)驗回放方法在8萬個對局中總用時高于隨機(jī)經(jīng)驗回放,分析其原因為計算優(yōu)先級需要花費(fèi)額外的時間。從實(shí)驗數(shù)據(jù)得出,優(yōu)先經(jīng)驗回放對局39 000輪收斂大約需要615 min,而隨機(jī)經(jīng)驗回放則需要794 min。由此得出,本文所提出的方法將麻將AI的訓(xùn)練速度上提升了22.5%。

    5 結(jié)論

    通過分析麻將游戲的特點(diǎn),提出了多重優(yōu)先經(jīng)驗回放機(jī)制,給出了麻將游戲局面復(fù)雜程度的定義,通過時序差分誤差、獎勵以及局面復(fù)雜程度3個標(biāo)準(zhǔn)對經(jīng)驗樣本優(yōu)先值進(jìn)行計算,并在筆者搭建的麻將自博弈平臺進(jìn)行對比實(shí)驗。與傳統(tǒng)的隨機(jī)經(jīng)驗回放算法相比,麻將AI訓(xùn)練速度與穩(wěn)定性大幅度提升。下一步,將在改進(jìn)模型訓(xùn)練速度的基礎(chǔ)上研究將麻將AI決策水平進(jìn)一步提高。

    猜你喜歡
    復(fù)雜程度對局局面
    打好同心牌 共筑“根魂夢” 開創(chuàng)港澳僑和海外統(tǒng)戰(zhàn)工作新局面
    華人時刊(2022年7期)2022-06-05 07:33:56
    探究高校會計與財務(wù)的復(fù)雜性
    虛擬對局
    初中幾何教材認(rèn)知復(fù)雜程度的比較研究
    ——以中國、新加坡教材的三角形問題為例
    第29屆歐洲象棋錦標(biāo)賽對局選評
    棋藝(2016年6期)2016-11-14 05:12:03
    口孜東煤礦81煤層斷裂復(fù)雜程度定量評價
    綠色科技(2015年2期)2016-01-16 01:26:27
    “四個結(jié)合”開創(chuàng)基層黨建新局面
    面對復(fù)雜局面必須找到突破點(diǎn)
    趙國榮先勝呂欽
    棋藝(2014年7期)2014-09-09 08:43:54
    一步一腳印 開創(chuàng)新局面
    中國火炬(2011年1期)2011-08-15 06:53:24
    国产在线观看jvid| 在线观看舔阴道视频| 免费一级毛片在线播放高清视频 | 18禁国产床啪视频网站| 久久久久久久久久久久大奶| 久久精品国产99精品国产亚洲性色 | 女人精品久久久久毛片| 国产成人精品久久二区二区免费| 一边摸一边抽搐一进一出视频| 纯流量卡能插随身wifi吗| 久久国产乱子伦精品免费另类| 亚洲男人天堂网一区| 日韩av在线大香蕉| 中文字幕色久视频| 精品国产国语对白av| 国产一区二区三区视频了| 婷婷精品国产亚洲av在线| 国产欧美日韩一区二区三| 国产精品av久久久久免费| 大香蕉久久成人网| 国产高清videossex| 色综合婷婷激情| 国产一级毛片七仙女欲春2 | 91国产中文字幕| 欧美黄色淫秽网站| 黑人操中国人逼视频| 麻豆久久精品国产亚洲av| 最好的美女福利视频网| 免费高清在线观看日韩| 国内精品久久久久久久电影| 国产1区2区3区精品| 一边摸一边做爽爽视频免费| 人人妻人人爽人人添夜夜欢视频| 亚洲一码二码三码区别大吗| 久久草成人影院| 真人做人爱边吃奶动态| 亚洲av成人不卡在线观看播放网| 美女高潮到喷水免费观看| 国产成人影院久久av| 99久久综合精品五月天人人| 国产成+人综合+亚洲专区| 少妇粗大呻吟视频| 亚洲中文av在线| 亚洲精华国产精华精| 亚洲精品国产一区二区精华液| 女人爽到高潮嗷嗷叫在线视频| 午夜福利高清视频| 黄色视频不卡| 午夜老司机福利片| 国产熟女xx| 成人av一区二区三区在线看| 欧美日本中文国产一区发布| 波多野结衣一区麻豆| 最新美女视频免费是黄的| 亚洲色图av天堂| 美女免费视频网站| 亚洲国产精品成人综合色| 性欧美人与动物交配| 亚洲av成人一区二区三| 亚洲精品一区av在线观看| АⅤ资源中文在线天堂| 久99久视频精品免费| 久久热在线av| 亚洲一区二区三区色噜噜| 国产一卡二卡三卡精品| 精品欧美国产一区二区三| 久久久久精品国产欧美久久久| 亚洲av成人一区二区三| 涩涩av久久男人的天堂| 日韩欧美免费精品| 一卡2卡三卡四卡精品乱码亚洲| 国产伦一二天堂av在线观看| 女人高潮潮喷娇喘18禁视频| 18禁美女被吸乳视频| 最新在线观看一区二区三区| 久久精品亚洲熟妇少妇任你| 久久狼人影院| 这个男人来自地球电影免费观看| 成人18禁高潮啪啪吃奶动态图| 国产精品一区二区精品视频观看| 午夜福利,免费看| 一区二区三区精品91| 国产精品永久免费网站| 精品不卡国产一区二区三区| 亚洲av美国av| 在线观看日韩欧美| netflix在线观看网站| 日韩欧美国产一区二区入口| 欧美激情高清一区二区三区| 亚洲国产中文字幕在线视频| 亚洲熟女毛片儿| 18禁国产床啪视频网站| 久9热在线精品视频| 脱女人内裤的视频| 波多野结衣av一区二区av| 久久人妻福利社区极品人妻图片| 日本在线视频免费播放| 黄网站色视频无遮挡免费观看| 人人妻人人爽人人添夜夜欢视频| 亚洲欧美激情综合另类| 久久久久国产精品人妻aⅴ院| 99re在线观看精品视频| 黄片大片在线免费观看| 精品久久久久久久人妻蜜臀av | 久久天躁狠狠躁夜夜2o2o| www.精华液| 久热爱精品视频在线9| 亚洲激情在线av| 一本久久中文字幕| 看黄色毛片网站| 大型黄色视频在线免费观看| 国产av精品麻豆| 久久九九热精品免费| 制服人妻中文乱码| 18禁观看日本| 久久精品国产亚洲av高清一级| 久久草成人影院| 欧美日韩精品网址| 亚洲熟妇中文字幕五十中出| 19禁男女啪啪无遮挡网站| 免费在线观看黄色视频的| 黑人操中国人逼视频| 亚洲国产毛片av蜜桃av| 亚洲精品久久国产高清桃花| 黄色毛片三级朝国网站| 国产真人三级小视频在线观看| 大型av网站在线播放| 国产精品久久电影中文字幕| 亚洲中文字幕一区二区三区有码在线看 | 99久久综合精品五月天人人| 亚洲三区欧美一区| 久久久国产精品麻豆| e午夜精品久久久久久久| 国产免费男女视频| 免费av毛片视频| 大香蕉久久成人网| 91九色精品人成在线观看| 久久国产乱子伦精品免费另类| 国产精品自产拍在线观看55亚洲| 亚洲av电影不卡..在线观看| 亚洲欧美日韩另类电影网站| 亚洲熟妇熟女久久| 欧美一级毛片孕妇| 夜夜看夜夜爽夜夜摸| 亚洲熟妇熟女久久| 国产97色在线日韩免费| 欧美成人午夜精品| 午夜福利免费观看在线| 午夜成年电影在线免费观看| 黄网站色视频无遮挡免费观看| 啦啦啦 在线观看视频| 美女 人体艺术 gogo| 国产亚洲精品一区二区www| 99re在线观看精品视频| 一区在线观看完整版| 热re99久久国产66热| 国产三级在线视频| 最近最新免费中文字幕在线| 国产精品野战在线观看| 国产不卡一卡二| 成人手机av| 亚洲在线自拍视频| 婷婷精品国产亚洲av在线| 男女下面插进去视频免费观看| 黄色丝袜av网址大全| 亚洲中文字幕一区二区三区有码在线看 | 欧美国产日韩亚洲一区| 自线自在国产av| 91av网站免费观看| 我的亚洲天堂| 丁香欧美五月| av福利片在线| 欧美日韩精品网址| 久久久精品欧美日韩精品| 国产成人欧美在线观看| 妹子高潮喷水视频| 亚洲无线在线观看| 级片在线观看| av天堂在线播放| 人成视频在线观看免费观看| 久久久久久久久中文| 一级a爱片免费观看的视频| 中亚洲国语对白在线视频| 中文字幕人妻熟女乱码| 久久精品亚洲精品国产色婷小说| 国产精品,欧美在线| 国产欧美日韩一区二区精品| 亚洲自偷自拍图片 自拍| 精品一品国产午夜福利视频| 精品熟女少妇八av免费久了| 一本大道久久a久久精品| 亚洲片人在线观看| 18禁美女被吸乳视频| 欧美丝袜亚洲另类 | 久久久国产欧美日韩av| 久久久久久久久久久久大奶| 色播在线永久视频| 久久婷婷人人爽人人干人人爱 | 成人三级黄色视频| 久久性视频一级片| 国产免费男女视频| 琪琪午夜伦伦电影理论片6080| 日本撒尿小便嘘嘘汇集6| 亚洲色图av天堂| 啦啦啦 在线观看视频| 精品午夜福利视频在线观看一区| 色哟哟哟哟哟哟| 免费看美女性在线毛片视频| 精品一区二区三区av网在线观看| 一a级毛片在线观看| 一边摸一边抽搐一进一小说| 在线国产一区二区在线| 久久婷婷人人爽人人干人人爱 | 亚洲国产看品久久| 国产欧美日韩一区二区精品| 九色亚洲精品在线播放| 国产精品自产拍在线观看55亚洲| 看免费av毛片| 91麻豆精品激情在线观看国产| 欧美日韩福利视频一区二区| 一边摸一边做爽爽视频免费| 久久久久久久精品吃奶| 亚洲av片天天在线观看| 久久精品国产亚洲av香蕉五月| 亚洲一卡2卡3卡4卡5卡精品中文| 老司机在亚洲福利影院| 亚洲中文av在线| 亚洲国产精品久久男人天堂| 欧美av亚洲av综合av国产av| 午夜精品久久久久久毛片777| 亚洲专区字幕在线| 免费高清视频大片| 成人18禁在线播放| 村上凉子中文字幕在线| 在线观看日韩欧美| 在线观看www视频免费| 久久中文字幕一级| 久久青草综合色| 欧美在线黄色| 精品国产一区二区久久| 日韩中文字幕欧美一区二区| 男女下面插进去视频免费观看| 中文字幕av电影在线播放| 久热这里只有精品99| 亚洲欧美激情综合另类| 国产99白浆流出| 午夜亚洲福利在线播放| 中文字幕av电影在线播放| 国产av一区二区精品久久| 免费在线观看亚洲国产| 99久久久亚洲精品蜜臀av| cao死你这个sao货| 久久久国产成人免费| 少妇熟女aⅴ在线视频| 国产午夜精品久久久久久| 久久伊人香网站| 久久久久亚洲av毛片大全| 在线观看午夜福利视频| 曰老女人黄片| 长腿黑丝高跟| 制服人妻中文乱码| 国产又爽黄色视频| 99在线视频只有这里精品首页| 欧美日韩精品网址| 久久人妻熟女aⅴ| 久久青草综合色| 两个人免费观看高清视频| 人人妻人人澡人人看| 久热爱精品视频在线9| 叶爱在线成人免费视频播放| 黄色丝袜av网址大全| 无遮挡黄片免费观看| 高清毛片免费观看视频网站| 一本大道久久a久久精品| 99在线人妻在线中文字幕| 欧美日韩亚洲国产一区二区在线观看| 丝袜在线中文字幕| 国产精华一区二区三区| 97人妻天天添夜夜摸| av有码第一页| 91老司机精品| 免费在线观看完整版高清| 桃色一区二区三区在线观看| 亚洲精品中文字幕在线视频| 这个男人来自地球电影免费观看| 国产精品一区二区精品视频观看| 性色av乱码一区二区三区2| 久久青草综合色| 精品人妻在线不人妻| 很黄的视频免费| 久久精品亚洲熟妇少妇任你| 99国产综合亚洲精品| 精品一区二区三区av网在线观看| 久久婷婷人人爽人人干人人爱 | 午夜福利一区二区在线看| 亚洲一卡2卡3卡4卡5卡精品中文| 一区二区三区激情视频| 一级片免费观看大全| 9191精品国产免费久久| 亚洲精品美女久久av网站| 99久久综合精品五月天人人| 91成人精品电影| 久久午夜亚洲精品久久| 女同久久另类99精品国产91| 啪啪无遮挡十八禁网站| 亚洲av成人一区二区三| 日韩三级视频一区二区三区| www.精华液| 无遮挡黄片免费观看| 久9热在线精品视频| 欧美成人午夜精品| 亚洲黑人精品在线| 99国产精品一区二区三区| 亚洲av成人av| 制服人妻中文乱码| 精品国产美女av久久久久小说| 日本撒尿小便嘘嘘汇集6| 亚洲三区欧美一区| 日韩高清综合在线| 日韩精品中文字幕看吧| 制服丝袜大香蕉在线| 窝窝影院91人妻| 在线永久观看黄色视频| 欧美一级毛片孕妇| 无遮挡黄片免费观看| 女警被强在线播放| 国产成人欧美| 制服诱惑二区| 成人特级黄色片久久久久久久| 国产高清有码在线观看视频 | 午夜福利在线观看吧| 久久精品亚洲精品国产色婷小说| 国产三级黄色录像| 久久热在线av| 亚洲,欧美精品.| 午夜福利成人在线免费观看| 美女免费视频网站| 老司机午夜福利在线观看视频| 日韩欧美国产一区二区入口| 操出白浆在线播放| 日本免费一区二区三区高清不卡 | 国产精品影院久久| 69精品国产乱码久久久| 精品一区二区三区视频在线观看免费| 18美女黄网站色大片免费观看| 久久精品国产综合久久久| 精品国产美女av久久久久小说| 亚洲国产中文字幕在线视频| 久久狼人影院| 国产成人欧美在线观看| 伊人久久大香线蕉亚洲五| 在线观看免费日韩欧美大片| 亚洲一区二区三区色噜噜| 色精品久久人妻99蜜桃| 两性午夜刺激爽爽歪歪视频在线观看 | 岛国在线观看网站| 狠狠狠狠99中文字幕| 黑人操中国人逼视频| 国产精品日韩av在线免费观看 | 中文字幕另类日韩欧美亚洲嫩草| av电影中文网址| 国产黄a三级三级三级人| 久久国产精品人妻蜜桃| 宅男免费午夜| 婷婷丁香在线五月| 日韩免费av在线播放| 日韩有码中文字幕| 纯流量卡能插随身wifi吗| 国产色视频综合| 精品不卡国产一区二区三区| 日本 欧美在线| 熟妇人妻久久中文字幕3abv| 一夜夜www| 在线国产一区二区在线| 精品久久久久久久毛片微露脸| 少妇的丰满在线观看| 日韩精品青青久久久久久| 欧美日韩一级在线毛片| 国产成人欧美| 久久性视频一级片| 一边摸一边做爽爽视频免费| 欧美成人一区二区免费高清观看 | 日本 欧美在线| 久热爱精品视频在线9| 亚洲五月天丁香| 亚洲专区国产一区二区| 电影成人av| 老司机在亚洲福利影院| 电影成人av| 一边摸一边抽搐一进一出视频| 欧美激情高清一区二区三区| 韩国av一区二区三区四区| 淫秽高清视频在线观看| 国产亚洲精品av在线| 女性生殖器流出的白浆| 日日爽夜夜爽网站| 90打野战视频偷拍视频| 在线观看舔阴道视频| 俄罗斯特黄特色一大片| 搞女人的毛片| 一个人观看的视频www高清免费观看 | 每晚都被弄得嗷嗷叫到高潮| 午夜精品久久久久久毛片777| 一区二区三区高清视频在线| 国产欧美日韩综合在线一区二区| 999久久久国产精品视频| 欧美色视频一区免费| 国产高清视频在线播放一区| 免费在线观看黄色视频的| 国产精品久久久久久亚洲av鲁大| 桃色一区二区三区在线观看| 一a级毛片在线观看| 多毛熟女@视频| 国产精品久久久人人做人人爽| 在线播放国产精品三级| 长腿黑丝高跟| 搡老熟女国产l中国老女人| 国产一区二区三区在线臀色熟女| 咕卡用的链子| 亚洲一码二码三码区别大吗| 精品久久久精品久久久| 亚洲精品美女久久av网站| 91大片在线观看| 日韩欧美一区二区三区在线观看| 美女大奶头视频| 日韩一卡2卡3卡4卡2021年| 国产精品久久久久久亚洲av鲁大| 亚洲一区高清亚洲精品| 99re在线观看精品视频| 人妻久久中文字幕网| 午夜a级毛片| 自拍欧美九色日韩亚洲蝌蚪91| 巨乳人妻的诱惑在线观看| 少妇的丰满在线观看| 日韩 欧美 亚洲 中文字幕| 国产精品 欧美亚洲| 亚洲成人国产一区在线观看| 99精品在免费线老司机午夜| videosex国产| 女人爽到高潮嗷嗷叫在线视频| 久久久国产精品麻豆| 精品久久久精品久久久| 亚洲黑人精品在线| 日韩高清综合在线| 亚洲欧美精品综合一区二区三区| 成人手机av| 午夜精品国产一区二区电影| x7x7x7水蜜桃| 中文字幕人成人乱码亚洲影| 精品久久久久久成人av| 亚洲,欧美精品.| 99精品在免费线老司机午夜| 国产精品精品国产色婷婷| 波多野结衣巨乳人妻| 国内毛片毛片毛片毛片毛片| 麻豆成人av在线观看| 亚洲成人国产一区在线观看| 久久青草综合色| 大陆偷拍与自拍| 9热在线视频观看99| 久久久久国内视频| 亚洲精品中文字幕在线视频| 非洲黑人性xxxx精品又粗又长| 97人妻精品一区二区三区麻豆 | 国产色视频综合| 欧美+亚洲+日韩+国产| a在线观看视频网站| ponron亚洲| 国产亚洲欧美98| 韩国精品一区二区三区| 久9热在线精品视频| 男人舔女人的私密视频| 人妻久久中文字幕网| 日韩欧美三级三区| 黑人操中国人逼视频| 欧美在线一区亚洲| 老司机在亚洲福利影院| 久久久国产成人免费| 午夜影院日韩av| 十分钟在线观看高清视频www| 国产不卡一卡二| 黄片播放在线免费| or卡值多少钱| 岛国在线观看网站| 日本 欧美在线| 国产一级毛片七仙女欲春2 | 丰满人妻熟妇乱又伦精品不卡| 深夜精品福利| 在线观看舔阴道视频| www.999成人在线观看| 国产在线精品亚洲第一网站| 亚洲,欧美精品.| 成人18禁在线播放| 亚洲视频免费观看视频| 久久国产精品人妻蜜桃| 国产av精品麻豆| 一级a爱视频在线免费观看| 国产av又大| 久久人人精品亚洲av| 久久久久久亚洲精品国产蜜桃av| 久久精品国产清高在天天线| 国产精品一区二区在线不卡| 久久久精品欧美日韩精品| 激情在线观看视频在线高清| 午夜福利在线观看吧| 久久人人97超碰香蕉20202| 久久久国产成人免费| 亚洲国产毛片av蜜桃av| 可以免费在线观看a视频的电影网站| 欧美老熟妇乱子伦牲交| 久久热在线av| 叶爱在线成人免费视频播放| 午夜福利影视在线免费观看| 麻豆av在线久日| 中文亚洲av片在线观看爽| 精品熟女少妇八av免费久了| 一区二区三区激情视频| 在线av久久热| 欧美黑人欧美精品刺激| 一级毛片精品| 两个人视频免费观看高清| 又黄又爽又免费观看的视频| 中文字幕人妻熟女乱码| 亚洲精品在线观看二区| 午夜久久久在线观看| 久热这里只有精品99| 男男h啪啪无遮挡| 亚洲av电影在线进入| 成年版毛片免费区| 麻豆av在线久日| 久久欧美精品欧美久久欧美| 少妇的丰满在线观看| 男女床上黄色一级片免费看| 叶爱在线成人免费视频播放| 色婷婷久久久亚洲欧美| 亚洲成av人片免费观看| 在线观看www视频免费| 少妇的丰满在线观看| 国产精品,欧美在线| 精品一区二区三区av网在线观看| 制服丝袜大香蕉在线| 老熟妇乱子伦视频在线观看| bbb黄色大片| av欧美777| 脱女人内裤的视频| 午夜福利免费观看在线| 女同久久另类99精品国产91| 国产97色在线日韩免费| 男女床上黄色一级片免费看| 欧美国产精品va在线观看不卡| 亚洲五月天丁香| 人人妻,人人澡人人爽秒播| 久久伊人香网站| 精品国产美女av久久久久小说| 国产亚洲精品av在线| 大香蕉久久成人网| 在线视频色国产色| 免费久久久久久久精品成人欧美视频| videosex国产| 在线观看免费视频日本深夜| 中文字幕人妻熟女乱码| 午夜福利一区二区在线看| 久久午夜综合久久蜜桃| 国产伦人伦偷精品视频| 少妇粗大呻吟视频| 国产麻豆69| 欧美午夜高清在线| 午夜福利影视在线免费观看| 欧美成人性av电影在线观看| 男人舔女人的私密视频| 日韩欧美国产在线观看| 欧美激情极品国产一区二区三区| 亚洲精品一卡2卡三卡4卡5卡| 操美女的视频在线观看| 日韩精品免费视频一区二区三区| 麻豆一二三区av精品| 欧美激情极品国产一区二区三区| 久久精品亚洲熟妇少妇任你| 久99久视频精品免费| 涩涩av久久男人的天堂| 久久午夜综合久久蜜桃| 51午夜福利影视在线观看| 一区二区三区国产精品乱码| 国产精品久久视频播放| 91成人精品电影| 色综合欧美亚洲国产小说| 啦啦啦 在线观看视频| 国产伦一二天堂av在线观看| 亚洲一卡2卡3卡4卡5卡精品中文| 午夜福利一区二区在线看| 免费在线观看日本一区| 亚洲黑人精品在线| 亚洲电影在线观看av| 久久精品国产99精品国产亚洲性色 | 亚洲国产欧美一区二区综合| 人人妻人人澡欧美一区二区 | 叶爱在线成人免费视频播放| 丝袜在线中文字幕| 97超级碰碰碰精品色视频在线观看| 在线观看免费视频网站a站| 男男h啪啪无遮挡| 午夜福利视频1000在线观看 | 成人国语在线视频| 午夜a级毛片| 精品久久久精品久久久| 亚洲一码二码三码区别大吗| 亚洲伊人色综图| 中出人妻视频一区二区| 国产精品久久久久久精品电影 | 色老头精品视频在线观看| x7x7x7水蜜桃| 村上凉子中文字幕在线| 一级毛片女人18水好多| 视频在线观看一区二区三区| 999久久久国产精品视频|