• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種強(qiáng)化學(xué)習(xí)的射頻供能通信收包率優(yōu)化方法

    2022-11-18 03:43:44蘇小楓陳清華
    關(guān)鍵詞:設(shè)備

    蘇小楓,陳清華

    1(浙江工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,杭州 310014)2(溫州職業(yè)技術(shù)學(xué)院 信息技術(shù)系,浙江 溫州 325035)

    1 引 言

    無線供能通信(Wireless Powered Communication,WPC)是指低功耗設(shè)備從專門的射頻源中捕獲能量并存儲在自身電池或者電容中,用于支持設(shè)備傳感、計(jì)算和數(shù)據(jù)傳輸?shù)热蝿?wù),被廣泛應(yīng)用于環(huán)境檢測、智能家居等領(lǐng)域[1-3].得益于電路技術(shù)在硬件靈敏度、射頻-直流轉(zhuǎn)換效率、電路功耗等方面的最新發(fā)展[4,5],設(shè)備可直接捕獲環(huán)境射頻源(如廣播基站、WIFI等)的廣播信號實(shí)現(xiàn)長期工作,進(jìn)一步降低總成本.

    然而,當(dāng)周圍環(huán)境射頻信號較弱或者射頻源周期性工作時(shí),設(shè)備需要很長時(shí)間來積累足夠能量用于主動傳輸,從而降低數(shù)據(jù)傳輸效率.作為射頻供能通信的另一方式,反向散射通信可以很好地彌補(bǔ)這一局限.反向散射通信是指發(fā)送端將一系列數(shù)字信號映射到天線處的射頻反向散射波形上,通過調(diào)整天線的負(fù)載阻抗來產(chǎn)生與原始信號不同的波形,根據(jù)射頻源與接收端的不同,可分成單站反向散射、雙站反向散射和環(huán)境反向散射3類.單站反向散射通信系統(tǒng)應(yīng)用最廣泛的是射頻識別系統(tǒng)[6],然而,射頻識別系統(tǒng)的射頻源和接收端在同一儀器上,存在往返路徑損耗和雙遠(yuǎn)近效應(yīng)問題.針對該問題,Lu等人部署專門射頻源提高性能,但增加了部署成本[4].Lyu則研究了環(huán)境反向散射射頻通信網(wǎng)絡(luò),利用環(huán)境中存在的射頻源(如調(diào)幅廣播基站、電視信號塔、蜂窩基站等)作為自身射頻源[7],該方法不僅降低了功耗和總體成本,而且不需要分配新的頻譜.然而,環(huán)境反向散射通信存在射頻源工作頻率和周期不可控的缺點(diǎn),性能會因信道和環(huán)境因素(如環(huán)境能源的分布、空間密度和傳輸負(fù)載)發(fā)生改變[8],數(shù)據(jù)傳輸速率與距離都小于主動通信,僅在穩(wěn)定的射頻源情況下才可正常工作.為此,學(xué)者提出了混合反向散射和無線供能通信的設(shè)備硬件設(shè)計(jì),在無法捕獲到足夠能量進(jìn)行主動通信[9],在有足夠能量但缺乏主動通信機(jī)會時(shí),反向散射通信是一種有效的補(bǔ)充方式.

    在研究混合通信時(shí),通常以吞吐量作為評價(jià)指標(biāo),由于吞吐量的計(jì)算過程大多采用香農(nóng)公式[10,11],意味著即使發(fā)送端存在少部分能量也可以進(jìn)行數(shù)據(jù)傳輸,這與通信協(xié)議中以數(shù)據(jù)包為單位傳輸不符.為此,部分研究以收包率作為評價(jià)通信性能的另一指標(biāo)[12,13].Wu認(rèn)為收包率與接收端的功率閾值有關(guān),以數(shù)學(xué)公式的形式,計(jì)算了在不同網(wǎng)絡(luò)參數(shù)(如功率接收閾值、收發(fā)機(jī)距離、發(fā)射功率)下系統(tǒng)的丟包率[14].Zhang在認(rèn)知異構(gòu)網(wǎng)絡(luò)中,考慮了智能切換調(diào)制編碼技術(shù),并給出了不同調(diào)制技術(shù)的誤碼率與信噪比關(guān)系[15],但均未考慮包長度與收包率的關(guān)系,且所考慮的數(shù)據(jù)量無限.

    在混合通信求解最佳策略中,通過建立馬爾可夫決策過程,并使用值迭代算法求解是常見的步驟,但值迭代方法以遍歷的形式求得全局最優(yōu)解[16],需要已知所有狀態(tài)信息和轉(zhuǎn)移概率,不能解決實(shí)際環(huán)境量部分未知且狀態(tài)空間連續(xù).深度強(qiáng)化學(xué)習(xí)方法在解決高維連續(xù)問題上獨(dú)具優(yōu)勢,已在場景同樣復(fù)雜的邊緣計(jì)算[17-19]、智能無人機(jī)領(lǐng)域[20,21]和點(diǎn)到點(diǎn)通信[22]廣泛運(yùn)用,解決部分可觀測的馬爾可夫決策過程最優(yōu)策略問題,例如Zhang將長期集群吞吐量最大化問題歸結(jié)為部分可觀測的馬爾可夫決策過程,提出了一種基于深度強(qiáng)化學(xué)習(xí)的無授權(quán)算法[19],以較少的沖突了解網(wǎng)絡(luò)競爭狀態(tài)、輸出子信道和接收功率電平選擇.

    因此,考慮使用深度強(qiáng)化學(xué)習(xí)解決混合通信狀態(tài)連續(xù)問題.本文從鏈路層方面研究混合通信的性能,考慮有限的電池電量和數(shù)據(jù)量,給出反向散射和無線供能通信的收包率計(jì)算過程,并采用無先驗(yàn)信息的算法解決環(huán)境的動態(tài)變化問題,運(yùn)用深度Q學(xué)習(xí)算法解決狀態(tài)空間連續(xù)問題.具體來說,發(fā)送端以數(shù)據(jù)包為單位傳輸,其收包率受比特級誤碼率和包長度影響,誤碼率需根據(jù)信噪比和調(diào)制解調(diào)方式計(jì)算.隨后,由于信號受周圍環(huán)境的影響,且環(huán)境是動態(tài)變化,無法事先了解周圍信息,通過基于無模型的方法可以得到相對較優(yōu)解,更適用于實(shí)際環(huán)境.同時(shí)考慮數(shù)據(jù)信息量大、狀態(tài)空間連續(xù)情況,運(yùn)用深度Q學(xué)習(xí)算法,通過神經(jīng)網(wǎng)絡(luò)對狀態(tài)空間擬合化處理求解最優(yōu)策略.

    本文考慮單用戶通信網(wǎng)絡(luò)框架:一種低功耗物聯(lián)網(wǎng)設(shè)備,其發(fā)射機(jī)支持無線供能和后向散射通信作為發(fā)送端.在射頻源通信時(shí)可捕獲能量或被動反向散射傳輸,在射頻源不通信時(shí)可主動傳輸數(shù)據(jù)給接收端.在這種情況下,本文旨在探索一種完全在線的策略,確定選擇的工作模式并分配無線供能通信的發(fā)射功率,從而最大限度地提高長期平均收包率.同時(shí),還考慮了電池容量有限和時(shí)變數(shù)據(jù)傳輸信道等實(shí)際約束條件.具體而言,本工作主要貢獻(xiàn)如下:

    1)提出基于信干噪比的反向散射和無線供能通信的誤碼率計(jì)算過程,并通過誤碼率和數(shù)據(jù)包長度計(jì)算收包率;

    2)通過工作模式選擇和功率分配實(shí)現(xiàn)收包率最大化,在環(huán)境動態(tài)變化、有限能量和數(shù)據(jù)量約束下構(gòu)建馬爾可夫決策過程,提出數(shù)據(jù)丟包開銷問題,根據(jù)所歸納的問題,提出基于無先驗(yàn)信息的SARSA在線最優(yōu)策略求解方法和基于連續(xù)狀態(tài)的深度Q學(xué)習(xí)算法;

    3)在不同參數(shù)下探尋收包率的有效性和穩(wěn)定性,通過廣泛模擬,比較不同強(qiáng)化學(xué)習(xí)方法的性能,發(fā)現(xiàn)基于SARSA和深度Q學(xué)習(xí)的在線解決方案性能優(yōu)于基線方案Q學(xué)習(xí).

    2 相關(guān)模型

    2.1 系統(tǒng)模型

    考慮如圖1所示的系統(tǒng)模型,該模型由基站、移動用戶和物聯(lián)網(wǎng)設(shè)備構(gòu)成.物聯(lián)網(wǎng)設(shè)備消耗自身存儲的能量用于工作,而后將所采集得到的數(shù)據(jù)封裝成包發(fā)送給移動設(shè)備,物聯(lián)網(wǎng)設(shè)備自身不與基站通信.因此,在用戶通信,即信道忙碌時(shí),物聯(lián)網(wǎng)設(shè)備可以捕獲基站發(fā)射的射頻能或者是通過基站的射頻信號反向散射傳輸數(shù)據(jù)給移動用戶.而當(dāng)信道空閑時(shí),物聯(lián)網(wǎng)設(shè)備可以消耗自身存儲的能量產(chǎn)生射頻信號實(shí)現(xiàn)無線供能通信.考慮一種情況,當(dāng)用戶與基站通信時(shí),物聯(lián)網(wǎng)設(shè)備也可以消耗能量傳輸數(shù)據(jù),但此時(shí)在用戶處其接收信號會接收到來自基站的干擾,使本次傳輸?shù)臄?shù)據(jù)包更容易丟失,即便如此,在數(shù)據(jù)包與能量均充足,且用戶一直在通信的情況下,物聯(lián)網(wǎng)設(shè)備可以通過該方式提升傳輸效率.

    圖1 系統(tǒng)模型

    2.2 能量捕獲模型

    在本文考慮的系統(tǒng)模型中,射頻源為無線接入點(diǎn)或者WIFI等,這類射頻源的特點(diǎn)是傳輸距離短,發(fā)射功率小.因此物聯(lián)網(wǎng)設(shè)備在能量捕獲的過程中,需要考慮信道增益,捕獲功率為:

    (1)

    其中,ζ是與能量轉(zhuǎn)化效率,λ表示路徑損耗指數(shù),dH是射頻源到物聯(lián)網(wǎng)設(shè)備的距離,h1是從射頻源到物聯(lián)網(wǎng)設(shè)備間的信道增益輻值的平方,PT是射頻源的發(fā)射功率.

    2.3 傳輸信道模型

    對于無線供能通信部分,不僅需要考慮大規(guī)模的路徑損耗過程,也需要考慮小規(guī)模的塊間瑞利信道衰落.對于反向散射通信,由于其傳輸電路的設(shè)置,其物聯(lián)網(wǎng)設(shè)備至移動用戶間的通信過程在考慮路徑損耗和信道衰落之外,還要考慮反向散射通信系數(shù).特別的是,當(dāng)物聯(lián)網(wǎng)設(shè)備與移動用戶間的距離確定時(shí),其大規(guī)模的路徑損耗為常數(shù),而小規(guī)模信道衰落被認(rèn)為在塊間保持不變,在不同的塊之間相互獨(dú)立且服從瑞利分布,令h表示信道增益輻值的平方,信道增益在每個(gè)塊內(nèi)保持不變,在不同的塊間獨(dú)立同分布.h(n)是塊n的信道狀態(tài),f(h(n))是變量h(n)的概率密度函數(shù),有:

    f(h(n))=exp(-h(n)),h(n)≥0

    (2)

    3 馬爾可夫決策過程與問題描述

    本節(jié)將研究問題納入馬爾可夫決策過程框架,詳細(xì)介紹系統(tǒng)狀態(tài)空間、動作空間、獎(jiǎng)勵(lì)空間、轉(zhuǎn)移概率,最后歸納問題的數(shù)學(xué)形式.

    3.1 馬爾可夫決策過程

    在移動用戶概率性通信的情況下,基于包級別的數(shù)據(jù)傳輸,根據(jù)物聯(lián)網(wǎng)設(shè)備的電池能量和數(shù)據(jù)包隊(duì)列狀態(tài),得到使得長期平均收包率最大化的物聯(lián)網(wǎng)設(shè)備工作模式和主動傳輸功率.將該問題建模為部分可觀測的馬爾可夫決策過程,由四元組{S,A,R,P}組成,其中S是系統(tǒng)的狀態(tài)空間,A是動作空間,R是獎(jiǎng)勵(lì)空間,P是轉(zhuǎn)移概率.以下是這4個(gè)要素的詳細(xì)說明.

    1)系統(tǒng)狀態(tài)空間S:在塊n的開始,物聯(lián)網(wǎng)設(shè)備已知當(dāng)前的系統(tǒng)狀態(tài)Sn∈S,包括環(huán)境信道狀態(tài)h(n)、能量隊(duì)列b(n)和數(shù)據(jù)包隊(duì)列q(n),即Sn={h(n),b(n),q(n)},其中h(n)∈{0,1},h(n)∈{0,1,…,qmax}.h(n)=1表示射頻源處于通信狀態(tài),物聯(lián)網(wǎng)設(shè)備周圍有射頻信號,為0則代表不存在射頻信號.q(n)表示數(shù)據(jù)隊(duì)列中數(shù)據(jù)包的個(gè)數(shù),以離散化狀態(tài)表示,qmax為最大數(shù)據(jù)包容量.b(n)表示電池能量狀態(tài),bmax為最大電池容量,超出的能量將被舍棄.

    (3)

    3)轉(zhuǎn)移概率P:在采用動作An下,狀態(tài)Sn變成Sn+1的轉(zhuǎn)移概率為P(Sn+1|Sn,An).當(dāng)狀態(tài)空間連續(xù)時(shí),P(Sn+1|Sn,An)為Sn+1的條件概率密度函數(shù).由于信道狀態(tài)h(n+1)、能量隊(duì)列b(n+1)和數(shù)據(jù)隊(duì)列q(n+1)相互獨(dú)立:

    P(S(n+1)│Sn,An)=P(h(n+1)│Sn,An)×

    P(b(n+1)│Sn,An)×P(q(n+1)│Sn,An),?S(n+1)∈S

    (4)

    式中η表示當(dāng)前環(huán)境信道忙碌概率,則空閑概率用1-η表示.由于信道狀態(tài)在塊間相互獨(dú)立,無論當(dāng)前信道為忙碌或空閑,下一狀態(tài)的信道忙碌概率不變,因此P(h(n+1)│Sn,An)為:

    (5)

    對于P(b(n+1)│Sn,An),根據(jù)所選擇動作不同,轉(zhuǎn)移概率有3種情況:

    ①當(dāng)e(n)=0或2,即物聯(lián)網(wǎng)設(shè)備休眠或反向散射傳輸時(shí),由于節(jié)點(diǎn)休眠時(shí)不消耗任何能量,反向散射過程中消耗的能量忽略不計(jì),因此有

    P(b(n+1)│Sn,An)=1(b(n+1)=b(n)),

    ?b(n+1)∈[0,bmax]

    (6)

    1(X)為指示函數(shù),當(dāng)X滿足時(shí)該函數(shù)為1,反之則為0.

    ②當(dāng)e(n)=1,即物聯(lián)網(wǎng)設(shè)備進(jìn)行能量捕獲時(shí),天線從環(huán)境中接收射頻信號,通過電路將其轉(zhuǎn)化為電能并存儲在能量模塊中,同時(shí)存儲的能量不能超過最大電池容量限制:

    ?b(n+1)∈[0,bmax]

    (7)

    ③當(dāng)e(n)=3,即物聯(lián)網(wǎng)設(shè)備進(jìn)行主動傳輸數(shù)據(jù)時(shí),物聯(lián)網(wǎng)設(shè)備消耗存儲能量生成射頻信號,通過調(diào)制編碼傳輸數(shù)據(jù).消耗的能量與主動傳輸發(fā)射功率和傳輸時(shí)間有關(guān).值得注意的是,消耗的能量不得超過已存儲的能量,這需要在發(fā)射功率的選擇上加以調(diào)整.

    P(b(n+1)│Sn,An)=1(b(n+1)=max{b(n)-pt(n)T,0}),

    ?b(n+1)∈[0,bmax]

    (8)

    對于P(qn+1│Sn,An),根據(jù)所選擇動作不同,其轉(zhuǎn)移概率也有3種情況:

    ①當(dāng)e(n)=0或1,即物聯(lián)網(wǎng)設(shè)備休眠或捕獲能量時(shí),本文假設(shè)發(fā)送端以概率ω(ω∈[0,1])到達(dá)qr個(gè)數(shù)據(jù)包,因此P(q(n+1)│Sn,An)為:

    (9)

    ②當(dāng)e(n)=2,即物聯(lián)網(wǎng)設(shè)備反向散射傳輸數(shù)據(jù)時(shí),考慮數(shù)據(jù)包的到達(dá),其轉(zhuǎn)移概率為:

    (10)

    qb為反向散射通信傳輸?shù)臄?shù)據(jù)包數(shù):

    人的活動尺度是指人在一個(gè)空間內(nèi)的進(jìn)行基本活動的尺度。在專業(yè)教室中,一般使用者為教師與學(xué)生,在教室內(nèi)的活動主要有授課、聽課、繪圖、站立、行走、討論、制作模型等。但這些活動的基礎(chǔ)實(shí)際上就是站、坐、行三種。

    qb=vbT×Pb

    (11)

    vb為反向散射傳輸數(shù)據(jù)包的速率,表示為比特傳輸速率與包長度的商,Pb為反向散射通信過程中的收包率,表示為:

    Pb=(1-Wb)L

    (12)

    Wb為反向散射通信的誤碼率,將在后文做詳細(xì)說明,L為數(shù)據(jù)包的長度.

    ③當(dāng)e(n)=3,即物聯(lián)網(wǎng)設(shè)備主動傳輸數(shù)據(jù)時(shí),同樣考慮數(shù)據(jù)包的到達(dá),其轉(zhuǎn)移概率為:

    (13)

    qa為反向散射通信傳輸?shù)臄?shù)據(jù)包數(shù):

    qa=vaT×Pa

    (14)

    Pa為主動通信過程中的收包率.本文假設(shè)無論射頻源是否處于工作狀態(tài),物聯(lián)網(wǎng)設(shè)備都可以消耗自身的能量用于主動傳輸.由于設(shè)備要求,至少需要消耗bth的能量才滿足最低要求,其收包率可表示為:

    Pa=(1-Wa)L·1(b(n)≥bth)

    (15)

    Wa為主動通信中的誤碼率.

    (16)

    3.2 開銷問題

    物聯(lián)網(wǎng)設(shè)備工作過程中,在塊n且數(shù)據(jù)包隊(duì)列已滿時(shí),根據(jù)數(shù)據(jù)包到達(dá)概率,此時(shí)仍會有數(shù)據(jù)包概率性進(jìn)入,產(chǎn)生數(shù)據(jù)包丟棄.因此,設(shè)定權(quán)重α表示丟棄數(shù)據(jù)包對策略的影響程度,存儲容量限制代價(jià)函數(shù)Cn表示為:

    Cn=αmin(0,qmax-q(n+1))

    (17)

    3.3 問題表述

    (18)

    馬爾可夫決策過程的目標(biāo)就是找到使得長期平均收包率最大化的最優(yōu)策略,問題表述為:

    (P1):maxJ(π)

    s.t.(3),(4),(12),(15),(16),

    (17)

    4 問題求解

    4.1 誤碼率計(jì)算過程

    在上節(jié)所提出的馬爾可夫決策過程的獎(jiǎng)勵(lì)空間中,根據(jù)不同狀態(tài)所得的收包率與誤碼率有關(guān),其計(jì)算過程如下:

    1)反向散射通信誤碼率計(jì)算過程:誤碼率與節(jié)點(diǎn)所采用的調(diào)制技術(shù)有關(guān),在反向散射過程中大多采用ASK編碼技術(shù),其誤碼率為:

    (19)

    (20)

    δ1和δ2分別為物聯(lián)網(wǎng)設(shè)備與移動用戶處的噪聲功率,Nt表示反向散射傳輸一比特?cái)?shù)據(jù)所需的符號數(shù).由于反向散射的調(diào)制是將Nt個(gè)射頻信號轉(zhuǎn)變成一個(gè)反向散射信號,主動通信的頻率是反向散射的Nt倍.

    2)主動傳輸誤碼率計(jì)算過程:主動通信所采用編碼方式為QPSK,其誤碼率與信噪比關(guān)系為:

    (21)

    在主動通信信噪比計(jì)算中,僅需考慮物聯(lián)網(wǎng)設(shè)備至移動用戶間通信過程,當(dāng)信道空閑時(shí),移動用戶處僅考慮環(huán)境噪聲;當(dāng)信道忙碌時(shí),移動用戶需考慮射頻源信號對信噪比的干擾,d1和h1分別為射頻源與移動用戶之間距離和信道增益.因此,當(dāng)信道空閑時(shí),信噪比表示為:

    (22)

    當(dāng)信道忙碌時(shí),信干噪比表示為:

    (23)

    4.2 基于SARSA的收包率最大化策略求解

    由于信道概率性忙碌和數(shù)據(jù)概率性到達(dá),無法使用值迭代這種離線方法對本問題進(jìn)行求解,因?yàn)橹档鷷ふ易顑?yōu)的下一狀態(tài)進(jìn)行狀態(tài)轉(zhuǎn)移過程,在數(shù)據(jù)包低到達(dá)概率的收包率會與高到達(dá)概率一致,這與模型設(shè)定不符.采用SARSA在線學(xué)習(xí)法對本文所歸納問題求解.SARSA學(xué)習(xí)法定義了策略π下動作值函數(shù)qπ(s,a).表示從狀態(tài)s起執(zhí)行動作a,此后遵循策略π得到帶折扣的期望累積獎(jiǎng)勵(lì),即

    qπ(s,a)=

    (24)

    其中γ∈[0,1]是折扣因子,γ越大表示代理越重視未來獎(jiǎng)勵(lì).強(qiáng)化學(xué)習(xí)定理證明如果采用表格法使得對于每個(gè)狀態(tài)動作對qπ(s,a)的估計(jì)都是準(zhǔn)確的,則使得J(π)取得最大值的最優(yōu)策略π*有著最優(yōu)動作值函數(shù),即:

    (25)

    SARSA法采用ε-貪婪策略,其思想是給定初始策略π和任意的動作值函數(shù)qπ(s,a),不斷交替進(jìn)行策略提高和值函數(shù)更新.在塊n給定狀態(tài)Sn,遵循策略π選擇動作An,收到立即獎(jiǎng)勵(lì)Rn并進(jìn)入下一個(gè)狀態(tài)Sn+1,再遵循策略π選擇動作An+1然后更新qπ使其接近當(dāng)前策略π的動作值函數(shù):

    Q(Sn,An)←Q(Sn,An)+

    μ(Rn-Cn+γQ(Sn+1,An+1)-Q(Sn,An))

    (26)

    u為學(xué)習(xí)率,使用五元組{Sn,An,Rn,Sn+1,An+1}更新公式.相較于基線的Q學(xué)習(xí)方法,SARSA使用在線控制策略求最優(yōu)動作,在當(dāng)前狀態(tài)選擇動作和依據(jù)下一狀態(tài)選擇下一動作更新Q表都是使用貪婪策略,而Q學(xué)習(xí)中在選擇下一動作時(shí)所采用Q值最大的動作.相比而言,Q學(xué)習(xí)更具冒險(xiǎn)性,而SARSA比較保守.

    4.3 基于深度Q學(xué)習(xí)的收包率最大化策略求解

    雖然SARSA可以求解無先驗(yàn)信息問題,然而卻需要建立表格存儲每個(gè)狀態(tài)和動作對應(yīng)值,這樣的方法僅限于狀態(tài)和動作空間是離散且空間維度不高情況.當(dāng)狀態(tài)空間是高維或連續(xù)時(shí),使用表格法計(jì)算復(fù)雜度過高.深度神經(jīng)網(wǎng)絡(luò)在特征提取方面有非常好效果,本小節(jié)采用深度Q學(xué)習(xí)(DQL)方法來求解連續(xù)狀態(tài)空間的馬爾可夫決策過程.將連續(xù)狀態(tài)轉(zhuǎn)化為函數(shù)擬合問題,僅將動作空間離散化,通過函數(shù)近似方式去估計(jì)值函數(shù),使得相近的狀態(tài)得到相同動作.

    為了解決使用非線性網(wǎng)絡(luò)表示值函數(shù)時(shí)出現(xiàn)不穩(wěn)定等問題,DQL創(chuàng)建原始神經(jīng)網(wǎng)絡(luò),其中用Q(Sn,An,ω1)表示當(dāng)前網(wǎng)絡(luò)的輸出,來評估當(dāng)前狀態(tài)動作對的值函數(shù),稱為Q現(xiàn)實(shí),還創(chuàng)建了目標(biāo)神經(jīng)網(wǎng)絡(luò),計(jì)算得到Q(Sn,An,ω2)稱為Q估計(jì).目標(biāo)網(wǎng)絡(luò)是一種打亂相關(guān)性的機(jī)制,DQL中會出現(xiàn)兩個(gè)結(jié)構(gòu)完全相同但是參數(shù)不同的網(wǎng)絡(luò),用最新的參數(shù)預(yù)測原始網(wǎng)絡(luò)的Q估計(jì),而用舊參數(shù)預(yù)測目標(biāo)網(wǎng)絡(luò)的Q現(xiàn)實(shí).在一段時(shí)間里Q現(xiàn)實(shí)的參數(shù)保持不變,在一定程度上降低了Q現(xiàn)實(shí)和Q估計(jì)的相關(guān)性,提高了算法穩(wěn)定性.而后經(jīng)過一定次數(shù)迭代,再將原始網(wǎng)絡(luò)參數(shù)復(fù)制給目標(biāo)網(wǎng)絡(luò),保證其值函數(shù)的時(shí)效.

    本文中兩個(gè)網(wǎng)絡(luò)都采用卷積神經(jīng)網(wǎng)絡(luò),包括輸入層、卷積層、激活函數(shù)、全連接層和輸出層.其中通過卷積層將輸入的Sn轉(zhuǎn)變?yōu)楦呔S,擴(kuò)充輸入層信息;激活函數(shù)采用非飽和線性單元ReLU代替?zhèn)鹘y(tǒng)sigmoid函數(shù),加速了網(wǎng)絡(luò)訓(xùn)練的速度,降低了計(jì)算的復(fù)雜度,對各種干擾更加具有魯棒性,并且在一定程度上避免了梯度消失問題;全連接層通過矩陣乘法,實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)從高維轉(zhuǎn)變?yōu)榈途S,并保留有用信息,最后通過分類輸出每一個(gè)動作An的Q值.目標(biāo)網(wǎng)絡(luò)輸入層僅為狀態(tài)Sn,原始網(wǎng)絡(luò)輸入層除了狀態(tài)Sn外,還需要目標(biāo)值target.對于MDP四元組(Sn,An,Rn-Cn,Sn+1),DQL目標(biāo)值滿足:

    (27)

    原始網(wǎng)絡(luò)在經(jīng)驗(yàn)池中選取樣本,通過目標(biāo)網(wǎng)絡(luò)得到選取每一樣本對應(yīng)的目標(biāo)值,通過損失函數(shù)和梯度下降方法更新原始網(wǎng)絡(luò)參數(shù),其損失函數(shù)為:

    -Q(Sn,An,ω1)]2

    (28)

    該損失函數(shù)是一個(gè)殘差模型,表示為Q(Sn,An,ω1)和預(yù)測值之間差的平方.過程如圖2所示.

    圖2 DQL算法結(jié)構(gòu)

    此外,DQL采用經(jīng)驗(yàn)回放機(jī)制克服了學(xué)習(xí)算法的不穩(wěn)定性,并在一定程度上解決相關(guān)性及非靜態(tài)分布問題.經(jīng)驗(yàn)池的數(shù)據(jù)結(jié)構(gòu)為隊(duì)列,以先進(jìn)先出的原則存儲數(shù)據(jù).當(dāng)達(dá)到最大容量時(shí)覆蓋最先存儲的數(shù)據(jù),保證數(shù)據(jù)的時(shí)效性.當(dāng)需要使用樣本時(shí),通過指針實(shí)現(xiàn)隨機(jī)取一部分樣本作為神經(jīng)網(wǎng)絡(luò)的輸入,更新神經(jīng)網(wǎng)絡(luò)參數(shù),打亂神經(jīng)網(wǎng)絡(luò)多次輸入數(shù)據(jù)間的相關(guān)性,極大程度上地滿足神經(jīng)網(wǎng)絡(luò)作為有監(jiān)督學(xué)習(xí)對輸入數(shù)據(jù)的獨(dú)立同分布要求.因此,神經(jīng)網(wǎng)絡(luò)不僅可以學(xué)習(xí)當(dāng)前的經(jīng)歷,還可以學(xué)習(xí)曾經(jīng)的經(jīng)驗(yàn),提高神經(jīng)網(wǎng)絡(luò)的效率.

    DQL算法在算法1中描述.算法的輸入包括學(xué)習(xí)率u、折扣因子γ、訓(xùn)練間隔Nb、參數(shù)更新間隔Nw、訓(xùn)練所取樣本數(shù)Ns、貪婪因子ε、經(jīng)驗(yàn)池容量LM和神經(jīng)網(wǎng)絡(luò)參數(shù)ω1、ω2.輸出為狀態(tài)動作對的Q值.算法的訓(xùn)練過程分成內(nèi)外兩個(gè)循環(huán),其中外循環(huán)為迭代過程,通過不同的初始狀態(tài)輸入,盡可能遍歷所有情況,通過內(nèi)循環(huán)不斷更新神經(jīng)網(wǎng)絡(luò)參數(shù),使所得策略不斷逼近最優(yōu)策略.內(nèi)循環(huán)為神經(jīng)網(wǎng)絡(luò)參數(shù)更新過程.具體地說,在塊n時(shí),狀態(tài)為狀態(tài)Sn(初始值為S0),首先通過ε貪婪策略選擇動作,貪婪策略是指以ε的概率從動作空間中隨機(jī)選擇一個(gè)動作,以1-ε的概率選擇Q(Sn,An,ω1)值最大的動作.然后將所得的狀態(tài)與動作通過前文所提出的狀態(tài)轉(zhuǎn)移、獎(jiǎng)勵(lì)值和開銷計(jì)算公式,得到下一狀態(tài)Sn+1、當(dāng)前報(bào)酬Rn-Cn,并整合成樣本(Sn,An,Rn-Cn,Sn+1)存儲在經(jīng)驗(yàn)池中,便于后續(xù)采用,重復(fù)這一過程直至循環(huán)結(jié)束.這一過程模擬環(huán)境的按時(shí)序變化,但貪婪策略在選擇動作時(shí)需通過神經(jīng)網(wǎng)絡(luò)計(jì)算Q值,需要更新神經(jīng)網(wǎng)絡(luò)以便找到每個(gè)狀態(tài)所對應(yīng)的最優(yōu)策略.為此在內(nèi)循環(huán)中加入訓(xùn)練過程,即每隔Nb個(gè)時(shí)間塊,從經(jīng)驗(yàn)池中隨機(jī)抽取一小批Ns個(gè)樣本作為神經(jīng)網(wǎng)絡(luò)的輸入,通過公式(27)、公式(28)和梯度下降法更新參數(shù)ω1,同時(shí)為打亂樣本間的相關(guān)性,此過程不更新參數(shù)ω2.為保證目標(biāo)神經(jīng)網(wǎng)絡(luò)參數(shù)的時(shí)效性,每隔Nw個(gè)時(shí)間塊使兩個(gè)神經(jīng)網(wǎng)絡(luò)的參數(shù)相等.

    算法1.最大化混合通信收包率算法

    輸入:u,γ,Nb,Ns,Nw,ε,LM,ω1,ω2

    輸出:Q(Sn,An,ω1)

    1.forepisode=0,1,2,…do

    2. 初始化狀態(tài)S0

    3.forn=0,1,2,…,nmaxdo

    4. 隨機(jī)產(chǎn)生0到1之間的一個(gè)數(shù)p

    5.ifp≤εthen

    6. 隨機(jī)選擇一個(gè)行為An

    7.else

    8. 將狀態(tài)Sn(初始值為S0)作為參數(shù)輸入原始神經(jīng)網(wǎng)絡(luò),得到所有行為的Q(Sn,An,ω1)集合,選擇Q值最大的行為An

    9.endif

    10. 得到環(huán)境中的信道增益,并根據(jù)狀態(tài)Sn和行為An,從環(huán)境中得到報(bào)酬Rn-Cn,環(huán)境狀態(tài)變?yōu)镾n+1

    11. 將樣本(Sn,An,Rn-Cn,Sn+1)存儲至經(jīng)驗(yàn)池中

    12. 每隔Nb次抽取Ns個(gè)樣本,并利用目標(biāo)神經(jīng)網(wǎng)絡(luò)和計(jì)算每個(gè)樣本的目標(biāo)值

    13. 利用損失函數(shù)和梯度下降方法更新原始神經(jīng)網(wǎng)絡(luò)的參數(shù)ω1

    14. 每隔Nw次更新目標(biāo)神經(jīng)網(wǎng)絡(luò)參數(shù)ω2=ω1

    15.endfor

    16.endfor

    5 實(shí)驗(yàn)與分析

    5.1 實(shí)驗(yàn)設(shè)置

    采用Python3.8實(shí)現(xiàn)文中算法,實(shí)驗(yàn)環(huán)境Win10系統(tǒng),Intel Core i5 2.40GHz CPU,8GB內(nèi)存.使用Tensor Flow搭建卷積神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)隱藏層間均為全連接,且每層隱藏層有100個(gè)神經(jīng)元.SARSA、Q學(xué)習(xí)和深度Q網(wǎng)絡(luò)的學(xué)習(xí)率和折扣因子一致,分別為0.001和0.9,ε初始值設(shè)置為1,并在每次迭代過程中以0.995的相關(guān)系數(shù)降低直至0.1.隨機(jī)抽取的樣本數(shù)目Ns為32,總樣本容量LM為500.內(nèi)循環(huán)次數(shù)nmax為1000,Nb=5,Nw=200.反向散射和主動通信的傳輸速率分別為10kbps和30kbps,數(shù)據(jù)到達(dá)速率為5kbps,計(jì)算包個(gè)數(shù)向上取整.數(shù)據(jù)包的長度受反向散射通信協(xié)議限制,取值范圍為48-528比特,且為8的倍數(shù),本文實(shí)驗(yàn)為128比特.其他實(shí)驗(yàn)參數(shù)設(shè)置見表1.

    表1 實(shí)驗(yàn)參數(shù)設(shè)置

    5.2 實(shí)驗(yàn)結(jié)果與分析

    本小節(jié)通過改變不同的參數(shù),使用SARSA算法對本章節(jié)所歸納的數(shù)學(xué)模型進(jìn)行求解,比較長期平均收包率.考慮強(qiáng)化學(xué)習(xí)算法僅能得到最優(yōu)策略,因此從任一狀態(tài)開始,依照最優(yōu)策略選擇動作,進(jìn)而狀態(tài)轉(zhuǎn)移并計(jì)算報(bào)酬,重復(fù)1000次取報(bào)酬平均值即為最終的長期平均收包率.

    首先,在不同的數(shù)據(jù)包長度下,比較信道忙碌概率與收包率之間的關(guān)系.由圖3可以看出,無論數(shù)據(jù)包長度為何值,收包率總是隨著信道忙碌概率的增加而增加.這是因?yàn)殡S著信道概率增加,物聯(lián)網(wǎng)設(shè)備具有更高的可能性進(jìn)行捕獲后傳輸或者是反向散射通信,從而提升整體收包率.對于不同數(shù)據(jù)包長度而言,數(shù)據(jù)包長度越小,收包率越高,這是因?yàn)槭瞻适钦`碼率的冪函數(shù),呈正相關(guān)變化.在高信道概率情況下,收包率差距較為明顯.當(dāng)信道概率為0.9時(shí),L=256時(shí)的收包率相對于L=512提升了5%,當(dāng)信道概率為1時(shí),L=128時(shí)的收包率相對于L=256提升了7.5%,這是因?yàn)樵谛诺烂β禃r(shí),物聯(lián)網(wǎng)設(shè)備更有可能進(jìn)行反向散射和有干擾的主動傳輸,這兩種通信所產(chǎn)生的收包率都低于無干擾的主動傳輸,因此數(shù)據(jù)包長度對收包率影響明顯.

    圖3 不同包長度下信道忙碌概率對收包率的影響

    而當(dāng)信道忙碌概率較低時(shí),出現(xiàn)數(shù)據(jù)包長度越大,收包率越高的情況,此時(shí)3種數(shù)據(jù)包情況所得的收包率接近,但由于數(shù)據(jù)容量限制代價(jià)函數(shù)的影響,數(shù)據(jù)包長度越小,所接收數(shù)據(jù)包越多,接收數(shù)據(jù)包越容易達(dá)到數(shù)據(jù)存儲最大容量,丟包代價(jià)越高,收包率越低.

    其次,在不同數(shù)據(jù)包長度下,比較數(shù)據(jù)包到達(dá)概率對收包率的影響,如圖4所示.隨著數(shù)據(jù)包到達(dá)概率增加,收包率呈現(xiàn)先增加后平緩的趨勢.這是因?yàn)榈偷竭_(dá)概率情況下,數(shù)據(jù)包較少,未能到達(dá)通信所需的最少數(shù)據(jù)包數(shù),物聯(lián)網(wǎng)設(shè)備只能采取休眠或能量捕獲,而在本文中認(rèn)為該類動作收包率為0,因此收包率較低.在高到達(dá)概率時(shí),數(shù)據(jù)隊(duì)列中的數(shù)據(jù)包數(shù)已達(dá)到傳輸要求,因此到達(dá)概率增加并不會對收包率造成影響.同樣,由于不同包長度原因,傳輸所要求的最小數(shù)據(jù)包不一致,數(shù)據(jù)包長度越大,所要求的數(shù)據(jù)包值越小,到達(dá)概率較低便可滿足傳輸條件,也就是長度越大,越早趨于平緩的原因.對于不同數(shù)據(jù)長度對收包率的影響.在高數(shù)據(jù)到達(dá)概率時(shí),數(shù)據(jù)包長度越小,收包率越高,是因?yàn)閿?shù)據(jù)量充足的情況下收包率與包長正相關(guān).在數(shù)據(jù)低到達(dá)概率下,包長度越長就越容易有足夠的數(shù)據(jù)包進(jìn)行傳輸,從而收包率也就越高.

    圖4 不同包長度下數(shù)據(jù)到達(dá)概率對收包率的影響

    然后,由于本文假定在信道忙碌時(shí)物聯(lián)網(wǎng)設(shè)備可進(jìn)行主動傳輸,希望能研究該方案對長期平均收包率的影響,如圖5所示,其中HTI表示物聯(lián)網(wǎng)設(shè)備可以在信道忙碌時(shí)主動傳輸,HT則表示無法主動傳輸.從圖中可以看出,當(dāng)信道忙碌概率較低,即η≤0.6時(shí),該方案對最終結(jié)果的影響不大,HT的收包率平均為HTI的98.56%,最低為97.8%.而當(dāng)信道忙碌概率增加,兩條曲線有了較為明顯的差值,原因有二,一是信道空閑可能性低,HT主動傳輸時(shí)間少,只能采用收包率較低的反向散射來進(jìn)行數(shù)據(jù)傳輸,尤其是在信道一直處于忙碌(η=1)時(shí),HTI相較于HT提升13%.二是電池能量充足甚至溢出,反向散射速率超過數(shù)據(jù)到達(dá)的速率,因此物聯(lián)網(wǎng)設(shè)備在信道忙碌時(shí)不僅可以反向散射傳輸所接收的數(shù)據(jù),還能進(jìn)行能量捕獲,在擁有充足能量情況下,即使存在干擾,主動傳輸收包率也超過反向散射通信的收包率,因此在0.7≤η≤0.9時(shí),HTI相較于HT平均提升了6.6%,最低也提升了4.27%.由此可見,本文所假設(shè)信道忙碌可主動傳輸方案在高信道概率時(shí)能小幅度提升混合通信收包率.

    圖5 不同傳輸方案在不同信道忙碌概率下的收包率對比情況

    然后,在圖6中,研究了本文所提出的SARSA與Q學(xué)習(xí)、深度Q學(xué)習(xí)在不同信道忙碌概率的收包率.雖然Q學(xué)習(xí)在η=0.7時(shí)其收包率優(yōu)于SARSA算法,但在其余情況下均略遜于SARSA算法.在低信道忙碌概率時(shí)SARSA相對提升了近15%,正如前文所述,作為同一策略的在線學(xué)習(xí)算法,SARSA更容易尋找最優(yōu)策略,從當(dāng)前狀態(tài)開始找到一條更優(yōu)的路線,而不是像Q學(xué)習(xí)那樣只著眼于下一狀態(tài)最大值,而忽略Q值更新與下一動作之間的關(guān)聯(lián)性,這兩類方法的計(jì)算復(fù)雜度一致.因此,在考慮長期平均目標(biāo)最優(yōu)策略求解過程中,SARSA算法比Q學(xué)習(xí)更適合,能求得更佳的狀態(tài)-最優(yōu)動作對,有效提升最終結(jié)果.而深度Q學(xué)習(xí)由于采用神經(jīng)網(wǎng)絡(luò),可以采用連續(xù)狀態(tài)空間,因此所得的最優(yōu)策略均高于SARSA和Q學(xué)習(xí)這類表格法,但是神經(jīng)網(wǎng)絡(luò)的計(jì)算復(fù)雜度略高于表格法,而且計(jì)算運(yùn)行時(shí)間相對較長,因此應(yīng)適當(dāng)根據(jù)設(shè)備條件和計(jì)算能力選擇相應(yīng)強(qiáng)化學(xué)習(xí)方法.

    圖6 不同強(qiáng)化學(xué)習(xí)方法在不同信道忙碌概率下的收包率對比情況

    最后,在圖7中對比了不同信道忙碌概率下長期平均收包率與瞬時(shí)平均收包率.瞬時(shí)收包率是指物聯(lián)網(wǎng)設(shè)備僅考慮當(dāng)前時(shí)間塊的最佳動作,不考慮采取該動作對后續(xù)選擇動作的影響,同樣計(jì)算1000次取平均值,即為瞬時(shí)平均收包率.由圖7可以看出,長期平均收包率一直高于瞬時(shí)平均收包率.在高信道忙碌概率下(η≥0.7),長期平均收包率相較于瞬時(shí)收包率平均提升了8.35%,最高提升10.18%;而在低信道忙碌概率下平均提升52.57%,最高提升了120%(η=0.1時(shí),此時(shí)長期平均收包率為0.017,而瞬時(shí)平均收包率僅為0.0078).這是因?yàn)樗矔r(shí)收包率僅關(guān)注當(dāng)前情況,無法考慮自身行為對下一狀態(tài)的影響,在周圍信號不足時(shí)急于消耗自身資源造成后續(xù)傳輸能力下降,降低系統(tǒng)的收包率.因此,長期平均收包率這一目標(biāo)可適應(yīng)較為惡劣的環(huán)境,及時(shí)調(diào)整自身工作模式,顯著提升整體網(wǎng)絡(luò)性能.

    圖7 長期平均和順時(shí)平均收包率在不同信道忙碌概率下的對比情況

    6 結(jié)束語

    針對混合通信系統(tǒng)收包率優(yōu)化問題,提出了一個(gè)最優(yōu)策略求解過程,通過工作模式選擇和主動傳輸發(fā)射功率分配來最大化長期平均收包率.考慮了信道忙碌狀態(tài)下物聯(lián)網(wǎng)設(shè)備主動傳輸方案,提出了數(shù)據(jù)包容量限制的開銷問題并歸納了不同通信方式的誤碼率和收包率計(jì)算過程,而后提出基于在線控制策略的SARSA算法和連續(xù)狀態(tài)的深度Q學(xué)習(xí)算法來獲得在線最優(yōu)解.通過仿真實(shí)驗(yàn),研究了不同包長度與信道忙碌概率和數(shù)據(jù)到達(dá)概率的關(guān)系.此外,對所采用的傳輸方案和在線算法與Q學(xué)習(xí)方法進(jìn)行了對比與分析.在未來希望能考慮多傳感器節(jié)點(diǎn)的混合通信場景,將強(qiáng)化學(xué)習(xí)應(yīng)用于實(shí)際,驗(yàn)證其效能.

    猜你喜歡
    設(shè)備
    諧響應(yīng)分析在設(shè)備減振中的應(yīng)用
    調(diào)試新設(shè)備
    基于VB6.0+Access2010開發(fā)的設(shè)備管理信息系統(tǒng)
    基于MPU6050簡單控制設(shè)備
    電子制作(2018年11期)2018-08-04 03:26:08
    廣播發(fā)射設(shè)備中平衡輸入與不平衡輸入的轉(zhuǎn)換
    電子制作(2018年10期)2018-08-04 03:24:48
    食之無味,棄之可惜 那些槽點(diǎn)滿滿的可穿戴智能設(shè)備
    500kV輸變電設(shè)備運(yùn)行維護(hù)探討
    HTC斥資千萬美元入股虛擬現(xiàn)實(shí)設(shè)備商WEVR
    Automechanika Shanghai 2014 之“看” 汽保設(shè)備篇
    如何在設(shè)備采購中節(jié)省成本
    国产精品一区www在线观看| av在线app专区| av在线老鸭窝| 免费av不卡在线播放| 制服诱惑二区| 久久久精品94久久精品| 少妇 在线观看| 亚洲国产精品国产精品| 90打野战视频偷拍视频| 只有这里有精品99| 中国国产av一级| 中文字幕精品免费在线观看视频 | 亚洲av日韩在线播放| 亚洲av成人精品一二三区| 视频中文字幕在线观看| 人妻系列 视频| 日韩一区二区视频免费看| 你懂的网址亚洲精品在线观看| 久久99蜜桃精品久久| 丰满乱子伦码专区| 侵犯人妻中文字幕一二三四区| 成人综合一区亚洲| 大话2 男鬼变身卡| 自拍欧美九色日韩亚洲蝌蚪91| 日韩欧美精品免费久久| 91成人精品电影| 国产精品一区二区在线观看99| 最黄视频免费看| 久久人人爽av亚洲精品天堂| 热re99久久精品国产66热6| 国产不卡av网站在线观看| 22中文网久久字幕| 欧美少妇被猛烈插入视频| 国产老妇伦熟女老妇高清| 国产亚洲av片在线观看秒播厂| videosex国产| 99热网站在线观看| 亚洲成人手机| 午夜福利视频在线观看免费| 精品国产一区二区三区久久久樱花| 最新中文字幕久久久久| 日日摸夜夜添夜夜爱| 久热久热在线精品观看| 亚洲精品美女久久久久99蜜臀 | 日韩制服丝袜自拍偷拍| 久久精品人人爽人人爽视色| 精品一区二区免费观看| 夜夜骑夜夜射夜夜干| 精品人妻一区二区三区麻豆| 亚洲第一区二区三区不卡| 我的女老师完整版在线观看| 国内精品宾馆在线| 午夜影院在线不卡| 美女大奶头黄色视频| 又粗又硬又长又爽又黄的视频| 亚洲欧美清纯卡通| 男女无遮挡免费网站观看| 寂寞人妻少妇视频99o| 少妇的丰满在线观看| 亚洲欧美清纯卡通| 亚洲精品久久成人aⅴ小说| 国产成人精品无人区| 国产精品免费大片| 99热6这里只有精品| 少妇被粗大的猛进出69影院 | 国产毛片在线视频| 制服诱惑二区| av在线播放精品| 国产精品蜜桃在线观看| 夫妻性生交免费视频一级片| 成人国语在线视频| 在线 av 中文字幕| 免费看不卡的av| 国产永久视频网站| 丰满迷人的少妇在线观看| 麻豆精品久久久久久蜜桃| 日韩在线高清观看一区二区三区| 一区二区三区精品91| 两个人看的免费小视频| 亚洲精品中文字幕在线视频| 久久精品人人爽人人爽视色| 亚洲国产欧美在线一区| 日韩 亚洲 欧美在线| 一区二区日韩欧美中文字幕 | 免费高清在线观看视频在线观看| 欧美精品高潮呻吟av久久| 亚洲中文av在线| 成年人免费黄色播放视频| 免费高清在线观看日韩| 黄片无遮挡物在线观看| 亚洲精品乱久久久久久| 久久青草综合色| 国产精品99久久99久久久不卡 | 一级毛片黄色毛片免费观看视频| 婷婷色麻豆天堂久久| 久久影院123| 欧美丝袜亚洲另类| 波野结衣二区三区在线| 桃花免费在线播放| 色婷婷久久久亚洲欧美| 中国美白少妇内射xxxbb| 亚洲精品,欧美精品| 观看美女的网站| 国产精品一二三区在线看| 午夜福利视频在线观看免费| videos熟女内射| 又黄又爽又刺激的免费视频.| 欧美人与善性xxx| 亚洲国产精品一区二区三区在线| 日韩伦理黄色片| 国产精品免费大片| 美女国产高潮福利片在线看| 国产毛片在线视频| 日韩伦理黄色片| 日韩欧美精品免费久久| 国产成人午夜福利电影在线观看| 91国产中文字幕| 亚洲 欧美一区二区三区| 亚洲伊人色综图| 人体艺术视频欧美日本| 欧美国产精品一级二级三级| 欧美日韩亚洲高清精品| 免费av不卡在线播放| 大码成人一级视频| 国产乱来视频区| 久久久久精品人妻al黑| 亚洲av福利一区| 欧美xxxx性猛交bbbb| 久久亚洲国产成人精品v| 欧美日韩精品成人综合77777| 亚洲成人手机| 精品视频人人做人人爽| 日本av免费视频播放| 卡戴珊不雅视频在线播放| 九九爱精品视频在线观看| 国产熟女欧美一区二区| www.熟女人妻精品国产 | 日韩制服骚丝袜av| 中文乱码字字幕精品一区二区三区| 人妻 亚洲 视频| 日本与韩国留学比较| 一二三四中文在线观看免费高清| 亚洲国产毛片av蜜桃av| 欧美精品人与动牲交sv欧美| 校园人妻丝袜中文字幕| 欧美97在线视频| 亚洲精品视频女| 看免费av毛片| 午夜福利视频在线观看免费| 亚洲av国产av综合av卡| 精品国产国语对白av| 夜夜爽夜夜爽视频| 一级片免费观看大全| 国产精品女同一区二区软件| 性色av一级| 欧美97在线视频| 亚洲精品自拍成人| 热re99久久国产66热| 亚洲国产精品国产精品| 波野结衣二区三区在线| 日韩伦理黄色片| 免费大片18禁| 丁香六月天网| av播播在线观看一区| 久久韩国三级中文字幕| 午夜福利乱码中文字幕| 久久久久精品久久久久真实原创| 午夜激情av网站| 在线天堂中文资源库| av片东京热男人的天堂| 久久精品夜色国产| 成人亚洲欧美一区二区av| 欧美国产精品一级二级三级| 自线自在国产av| 日本黄大片高清| 久久久久人妻精品一区果冻| 又黄又爽又刺激的免费视频.| 汤姆久久久久久久影院中文字幕| 日韩欧美精品免费久久| 亚洲,欧美,日韩| 极品人妻少妇av视频| 国产黄色视频一区二区在线观看| 捣出白浆h1v1| 在线观看三级黄色| 国产成人欧美| 日本黄大片高清| 色视频在线一区二区三区| 伊人久久国产一区二区| av在线观看视频网站免费| 热re99久久国产66热| 80岁老熟妇乱子伦牲交| 欧美日韩精品成人综合77777| 国产精品熟女久久久久浪| 国产精品不卡视频一区二区| 最近最新中文字幕免费大全7| 侵犯人妻中文字幕一二三四区| 黄色一级大片看看| 免费av中文字幕在线| 国产欧美日韩一区二区三区在线| 精品人妻偷拍中文字幕| 91精品国产国语对白视频| 精品国产一区二区三区四区第35| 中文字幕人妻熟女乱码| 亚洲国产欧美日韩在线播放| 国产成人精品在线电影| 制服人妻中文乱码| tube8黄色片| 久久免费观看电影| 亚洲成人手机| 在线精品无人区一区二区三| 夫妻午夜视频| 国产亚洲精品第一综合不卡 | 欧美丝袜亚洲另类| 欧美日韩综合久久久久久| 久久人人爽人人爽人人片va| 精品99又大又爽又粗少妇毛片| 午夜福利网站1000一区二区三区| 国产成人a∨麻豆精品| 在线观看免费视频网站a站| 免费高清在线观看视频在线观看| 久久影院123| 如何舔出高潮| 国产高清不卡午夜福利| 大码成人一级视频| 午夜激情av网站| 午夜免费观看性视频| 男女下面插进去视频免费观看 | h视频一区二区三区| 亚洲一区二区三区欧美精品| 有码 亚洲区| 久久久久精品性色| 国产高清不卡午夜福利| 人人澡人人妻人| 亚洲国产毛片av蜜桃av| 亚洲国产av影院在线观看| 亚洲精品第二区| 老司机影院毛片| 亚洲情色 制服丝袜| av在线app专区| 欧美精品一区二区免费开放| 黄色视频在线播放观看不卡| 中文字幕人妻丝袜制服| 亚洲色图综合在线观看| 国产又色又爽无遮挡免| 亚洲国产欧美在线一区| 亚洲精品一区蜜桃| 亚洲熟女精品中文字幕| 一二三四在线观看免费中文在 | 美女xxoo啪啪120秒动态图| 免费黄网站久久成人精品| freevideosex欧美| 国产亚洲精品久久久com| 十八禁网站网址无遮挡| 中文字幕最新亚洲高清| 日韩电影二区| 亚洲欧美成人综合另类久久久| 人妻系列 视频| 男女免费视频国产| 久久精品国产综合久久久 | 一本久久精品| 国产白丝娇喘喷水9色精品| 亚洲精品国产色婷婷电影| 乱码一卡2卡4卡精品| 日本午夜av视频| 欧美日韩av久久| 国产高清不卡午夜福利| av卡一久久| 欧美激情 高清一区二区三区| 亚洲av福利一区| 久热久热在线精品观看| 两性夫妻黄色片 | 99视频精品全部免费 在线| 校园人妻丝袜中文字幕| 亚洲性久久影院| 国产精品三级大全| 夜夜爽夜夜爽视频| 国产精品人妻久久久影院| 午夜精品国产一区二区电影| 街头女战士在线观看网站| 久久精品国产综合久久久 | 爱豆传媒免费全集在线观看| 欧美亚洲日本最大视频资源| 欧美精品人与动牲交sv欧美| 在现免费观看毛片| 人体艺术视频欧美日本| 91精品国产国语对白视频| 国产成人一区二区在线| 亚洲精品国产色婷婷电影| 国产xxxxx性猛交| 久久久久久伊人网av| 中文字幕制服av| 这个男人来自地球电影免费观看 | 国产成人精品无人区| 亚洲婷婷狠狠爱综合网| 亚洲久久久国产精品| 97在线视频观看| 国产精品久久久av美女十八| 少妇的丰满在线观看| 久久久久久久国产电影| 26uuu在线亚洲综合色| 三级国产精品片| 成人毛片60女人毛片免费| 99久久综合免费| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 一边亲一边摸免费视频| 又黄又爽又刺激的免费视频.| 婷婷色综合大香蕉| 日韩欧美精品免费久久| 久久av网站| 欧美3d第一页| 性色av一级| 草草在线视频免费看| 国产一区二区在线观看日韩| 国产片特级美女逼逼视频| 女人久久www免费人成看片| 男女边吃奶边做爰视频| 丝袜在线中文字幕| 亚洲经典国产精华液单| 精品久久国产蜜桃| 午夜精品国产一区二区电影| 亚洲av欧美aⅴ国产| 国产成人免费无遮挡视频| 男人添女人高潮全过程视频| 中文字幕人妻熟女乱码| 人妻人人澡人人爽人人| 人妻一区二区av| 在线观看三级黄色| 美女视频免费永久观看网站| 亚洲国产精品一区二区三区在线| 久久青草综合色| 国产成人精品一,二区| 亚洲熟女精品中文字幕| 大香蕉97超碰在线| 精品酒店卫生间| 制服人妻中文乱码| 久久国产精品男人的天堂亚洲 | 在线 av 中文字幕| 久久久国产精品麻豆| 成人影院久久| 国产乱人偷精品视频| 欧美日韩成人在线一区二区| 人妻人人澡人人爽人人| 国产一区二区三区综合在线观看 | 亚洲精品久久成人aⅴ小说| 草草在线视频免费看| 最近的中文字幕免费完整| 人人妻人人澡人人爽人人夜夜| 精品一区在线观看国产| 高清在线视频一区二区三区| 18在线观看网站| 久久精品国产综合久久久 | 人人妻人人添人人爽欧美一区卜| 黑人巨大精品欧美一区二区蜜桃 | 亚洲精品中文字幕在线视频| 边亲边吃奶的免费视频| 国产免费视频播放在线视频| 男人舔女人的私密视频| 久久国产精品大桥未久av| 男女国产视频网站| 国产免费又黄又爽又色| 搡女人真爽免费视频火全软件| 黄色毛片三级朝国网站| 一本大道久久a久久精品| 97超碰精品成人国产| 精品福利永久在线观看| 日本爱情动作片www.在线观看| 亚洲第一av免费看| 观看av在线不卡| av不卡在线播放| 久久亚洲国产成人精品v| 日日撸夜夜添| 激情视频va一区二区三区| 精品国产露脸久久av麻豆| 青春草亚洲视频在线观看| 免费黄频网站在线观看国产| 街头女战士在线观看网站| www日本在线高清视频| 美女脱内裤让男人舔精品视频| 99九九在线精品视频| 老司机影院毛片| 一级毛片我不卡| 九九在线视频观看精品| 又黄又粗又硬又大视频| 欧美日韩一区二区视频在线观看视频在线| 一本大道久久a久久精品| 成年美女黄网站色视频大全免费| 成年人午夜在线观看视频| 在线看a的网站| 色婷婷久久久亚洲欧美| 日韩av在线免费看完整版不卡| 国产精品99久久99久久久不卡 | 亚洲第一区二区三区不卡| 老司机亚洲免费影院| 男的添女的下面高潮视频| 欧美xxxx性猛交bbbb| 汤姆久久久久久久影院中文字幕| 国产一级毛片在线| 观看av在线不卡| 九九爱精品视频在线观看| 极品人妻少妇av视频| 午夜福利视频在线观看免费| 国产精品免费大片| 国产伦理片在线播放av一区| 久久精品久久精品一区二区三区| 成人亚洲欧美一区二区av| 高清欧美精品videossex| 久久99一区二区三区| 99久国产av精品国产电影| 精品福利永久在线观看| 韩国高清视频一区二区三区| 免费观看a级毛片全部| 国产精品蜜桃在线观看| 国产麻豆69| 一个人免费看片子| 亚洲内射少妇av| 考比视频在线观看| 久久99热这里只频精品6学生| 久久鲁丝午夜福利片| 91精品国产国语对白视频| 色网站视频免费| 老司机亚洲免费影院| a级毛片在线看网站| 秋霞在线观看毛片| 欧美日韩精品成人综合77777| 黑人巨大精品欧美一区二区蜜桃 | 亚洲欧美成人精品一区二区| 精品少妇久久久久久888优播| 看十八女毛片水多多多| 国产在视频线精品| 亚洲av欧美aⅴ国产| a级毛色黄片| 99香蕉大伊视频| 十八禁高潮呻吟视频| 爱豆传媒免费全集在线观看| 国产午夜精品一二区理论片| 午夜免费鲁丝| 亚洲av电影在线进入| 春色校园在线视频观看| 22中文网久久字幕| 啦啦啦啦在线视频资源| 精品国产一区二区久久| 国产成人精品一,二区| 欧美另类一区| 亚洲国产日韩一区二区| 婷婷色综合www| 欧美精品一区二区大全| 国产亚洲一区二区精品| 菩萨蛮人人尽说江南好唐韦庄| 午夜福利视频在线观看免费| 男女高潮啪啪啪动态图| 成年人免费黄色播放视频| 亚洲国产最新在线播放| 久久久亚洲精品成人影院| 超碰97精品在线观看| 免费在线观看黄色视频的| 免费黄频网站在线观看国产| 亚洲欧洲精品一区二区精品久久久 | 国产 一区精品| 欧美成人午夜免费资源| 自拍欧美九色日韩亚洲蝌蚪91| 午夜视频国产福利| 亚洲国产精品成人久久小说| 亚洲成人一二三区av| 日韩精品有码人妻一区| av黄色大香蕉| 国产精品免费大片| 精品视频人人做人人爽| 黑人欧美特级aaaaaa片| 色网站视频免费| 国产精品一区www在线观看| 91aial.com中文字幕在线观看| 天天躁夜夜躁狠狠躁躁| 一级片'在线观看视频| 色5月婷婷丁香| 卡戴珊不雅视频在线播放| 亚洲欧美精品自产自拍| 国产乱来视频区| 人人妻人人澡人人看| 夜夜爽夜夜爽视频| 观看美女的网站| 国产精品一区二区在线观看99| 精品一区二区三区视频在线| av播播在线观看一区| 国产在线一区二区三区精| 国产男女内射视频| 99国产精品免费福利视频| 国产亚洲最大av| 国产午夜精品一二区理论片| 亚洲欧洲精品一区二区精品久久久 | 成年美女黄网站色视频大全免费| 国产日韩欧美视频二区| 最新中文字幕久久久久| 丝袜喷水一区| 国产亚洲最大av| 伦理电影大哥的女人| 中文乱码字字幕精品一区二区三区| 街头女战士在线观看网站| 高清在线视频一区二区三区| 国产亚洲最大av| 久久久久久久久久久免费av| 精品一区二区三区视频在线| 69精品国产乱码久久久| 夜夜爽夜夜爽视频| 日本爱情动作片www.在线观看| 一级毛片黄色毛片免费观看视频| 97精品久久久久久久久久精品| 中文字幕免费在线视频6| av免费在线看不卡| 欧美老熟妇乱子伦牲交| 好男人视频免费观看在线| 人成视频在线观看免费观看| 国产一级毛片在线| 亚洲伊人久久精品综合| 午夜视频国产福利| 嫩草影院入口| 精品人妻偷拍中文字幕| 黑人巨大精品欧美一区二区蜜桃 | 在线天堂中文资源库| 大香蕉97超碰在线| 亚洲色图 男人天堂 中文字幕 | 男人操女人黄网站| 丝袜喷水一区| 国产成人av激情在线播放| 99视频精品全部免费 在线| 欧美成人午夜精品| 女人精品久久久久毛片| 国产毛片在线视频| 亚洲综合精品二区| 一区二区三区精品91| 97在线人人人人妻| 亚洲国产精品一区三区| 在线天堂最新版资源| 秋霞在线观看毛片| 我的女老师完整版在线观看| 亚洲性久久影院| 一本大道久久a久久精品| 中文欧美无线码| 国产一区有黄有色的免费视频| 久久综合国产亚洲精品| 国产成人精品久久久久久| 国产精品久久久久久久久免| 2018国产大陆天天弄谢| 性高湖久久久久久久久免费观看| 午夜激情av网站| 日本wwww免费看| 国产精品人妻久久久久久| 大片免费播放器 马上看| 久久久久久久久久久久大奶| 天天躁夜夜躁狠狠躁躁| av一本久久久久| 国产成人精品在线电影| 人妻系列 视频| 中国三级夫妇交换| kizo精华| 一区二区三区四区激情视频| 99视频精品全部免费 在线| 午夜91福利影院| 免费女性裸体啪啪无遮挡网站| 亚洲国产精品成人久久小说| 欧美日韩成人在线一区二区| 国产一级毛片在线| 日韩av免费高清视频| 国产白丝娇喘喷水9色精品| 人妻少妇偷人精品九色| 亚洲欧美成人综合另类久久久| 另类亚洲欧美激情| 午夜91福利影院| 黄片无遮挡物在线观看| 乱码一卡2卡4卡精品| 天堂8中文在线网| 天堂中文最新版在线下载| 晚上一个人看的免费电影| 国产成人精品婷婷| 精品酒店卫生间| 亚洲精品第二区| 亚洲成国产人片在线观看| 亚洲成av片中文字幕在线观看 | 国产无遮挡羞羞视频在线观看| 亚洲av福利一区| 女性生殖器流出的白浆| 秋霞在线观看毛片| 国产一区亚洲一区在线观看| 久久亚洲国产成人精品v| 热99国产精品久久久久久7| 五月伊人婷婷丁香| h视频一区二区三区| 大片免费播放器 马上看| 在线观看免费日韩欧美大片| 久久久久久久亚洲中文字幕| 亚洲色图综合在线观看| 久久久亚洲精品成人影院| 老女人水多毛片| 国产av国产精品国产| 视频在线观看一区二区三区| 老熟女久久久| 免费久久久久久久精品成人欧美视频 | 在线看a的网站| 丰满饥渴人妻一区二区三| 免费播放大片免费观看视频在线观看| 在线观看一区二区三区激情| 亚洲,一卡二卡三卡| freevideosex欧美| 国产成人精品一,二区| 男男h啪啪无遮挡| 国产极品天堂在线| 亚洲国产毛片av蜜桃av| 久久国产亚洲av麻豆专区| 一区二区三区精品91| 精品视频人人做人人爽| 性色avwww在线观看| av福利片在线| 亚洲精华国产精华液的使用体验| 一本大道久久a久久精品| 国产国语露脸激情在线看| 18禁国产床啪视频网站|