• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于聯(lián)邦深度強(qiáng)化學(xué)習(xí)的多無人機(jī)軌跡規(guī)劃算法

    2024-01-02 07:53:44王鑒威李學(xué)華陳碩
    關(guān)鍵詞:覆蓋范圍公平性時(shí)隙

    王鑒威,李學(xué)華,陳碩

    (北京信息科技大學(xué) 現(xiàn)代測(cè)控技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100101)

    0 引言

    隨著物聯(lián)網(wǎng)技術(shù)不斷發(fā)展以及第五代移動(dòng)通信技術(shù)大規(guī)模商用,越來越多的計(jì)算密集型應(yīng)用對(duì)時(shí)延具有較強(qiáng)的敏感度,對(duì)設(shè)備的計(jì)算能力提出了較高的要求。移動(dòng)邊緣計(jì)算(mobile edge computing,MEC)通過在移動(dòng)網(wǎng)絡(luò)邊緣部署計(jì)算和存儲(chǔ)資源,可以有效地給予用戶超低延時(shí)和高帶寬的網(wǎng)絡(luò)服務(wù)解決方案[1]。

    然而,現(xiàn)有MEC服務(wù)器部署往往依賴地面通信基礎(chǔ)服務(wù)設(shè)施。在偏遠(yuǎn)區(qū)域或緊急情況下,難以滿足移動(dòng)用戶的通信需求。無人機(jī)(unmanned aerial vehicle,UAV)因其靈活度高、移動(dòng)性強(qiáng)和部署成本低等特點(diǎn)[2],可以在空中建立移動(dòng)通信基站為地面移動(dòng)設(shè)備提供通信服務(wù),依靠視距(light of sight,LoS)傳輸信道[3]以及靈活部署位置獲取最佳信道條件等優(yōu)勢(shì),構(gòu)筑空-地一體的通信網(wǎng)絡(luò)。

    雖然無人機(jī)能夠通過自身移動(dòng)性,靈活規(guī)劃無人機(jī)軌跡進(jìn)行MEC服務(wù),但是無人機(jī)輔助移動(dòng)邊緣計(jì)算仍存在諸多挑戰(zhàn)。一方面,傳統(tǒng)計(jì)算卸載方案,將計(jì)算任務(wù)全部卸載到邊緣服務(wù)器上執(zhí)行,舍棄了地面設(shè)備端的計(jì)算資源,沒有充分利用場(chǎng)景內(nèi)的算力;另一方面,傳統(tǒng)研究采用單個(gè)無人機(jī)對(duì)地面用戶進(jìn)行移動(dòng)邊緣計(jì)算服務(wù),相比于多個(gè)無人機(jī)對(duì)地面用戶服務(wù)的效率較低。如今,多無人機(jī)軌跡規(guī)劃算法已有大量的研究。如文獻(xiàn)[4],為最小化平均相應(yīng)時(shí)間,采用粒子群優(yōu)化算法與遺傳算法算子相結(jié)合的方式來優(yōu)化無人機(jī)部署。文獻(xiàn)[5]在資源分配凸優(yōu)化和組合無人機(jī)分組優(yōu)化方案的耦合步驟中,通過調(diào)控優(yōu)化無人機(jī)發(fā)射功率、計(jì)算資源分配,在最大化資源利用率的同時(shí)最大限度減少無人機(jī)傳輸能量和計(jì)算能量消耗。

    然而,上述方法難以真正應(yīng)用于實(shí)際場(chǎng)景[6]。一方面,用戶位置、無人機(jī)-用戶信道狀況等用戶側(cè)信息常常無法獲得或提前預(yù)測(cè);另一方面,實(shí)際通信環(huán)境通常較復(fù)雜,無法準(zhǔn)確建模。因此,在無法提前掌握環(huán)境信息的場(chǎng)景下進(jìn)行無人機(jī)軌跡規(guī)劃是亟需解決的關(guān)鍵技術(shù)。

    近年來,多智能體強(qiáng)化學(xué)習(xí)(multi-agent reinforcement learning,MARL)已成為熱門研究課題。多智能體強(qiáng)化學(xué)習(xí)可以基于分布式架構(gòu)的無人機(jī)通信網(wǎng)絡(luò),提供一種有效的智能資源管理解決方案,特別是在一些無人機(jī)只能獲取局部本地信息的真實(shí)場(chǎng)景下。如文獻(xiàn)[7],當(dāng)環(huán)境動(dòng)態(tài)和部分可觀察時(shí),基于多智能體強(qiáng)化學(xué)習(xí)設(shè)計(jì)多無人機(jī)在多重約束下學(xué)習(xí)最優(yōu)軌跡規(guī)劃策略。文獻(xiàn)[8]采用多智能體強(qiáng)化學(xué)習(xí)框架,每個(gè)智能體根據(jù)局部觀察學(xué)習(xí),所有智能體獨(dú)立地執(zhí)行決策算法。分布式架構(gòu)有效地降低了計(jì)算的復(fù)雜性。然而,在經(jīng)典的分布式學(xué)習(xí)方法中,大多數(shù)智能體的決策都是局部的。這些代理之間相互獨(dú)立、缺乏信息共享,難以實(shí)現(xiàn)全局最優(yōu)結(jié)果。此外,即使有些方案在智能體間進(jìn)行了信息交互,但此類方法沒有考慮用戶數(shù)據(jù)的隱私性,會(huì)對(duì)用戶通信數(shù)據(jù)的安全構(gòu)成威脅。

    聯(lián)邦學(xué)習(xí)(federated learning,FL)作為一種分布式機(jī)器學(xué)習(xí)算法,將訓(xùn)練數(shù)據(jù)保存在本地設(shè)備,通過匯總本地模型更新到云服務(wù)器,學(xué)習(xí)得到全局模型,可同時(shí)實(shí)現(xiàn)隱私保護(hù)和信息共享。Wang等[9]在多無人機(jī)網(wǎng)絡(luò)采用聯(lián)邦學(xué)習(xí)框架,無需將原始敏感數(shù)據(jù)傳至服務(wù)器,在保護(hù)用戶設(shè)備隱私的同時(shí)節(jié)省無人機(jī)有限的計(jì)算和通信資源。余雪勇等[10]面對(duì)感知數(shù)據(jù)隱私安全問題,采用聯(lián)邦學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的激勵(lì)機(jī)制相結(jié)合的方式促進(jìn)高質(zhì)量模型共享,提高了無人機(jī)的實(shí)用性并保障了隱私保護(hù)。從上述文獻(xiàn)能夠看出,聯(lián)邦學(xué)習(xí)既能夠?qū)崿F(xiàn)用戶間的信息共享,又很好地彌補(bǔ)了傳統(tǒng)分布式架構(gòu)在隱私安全方面的缺陷。

    因此,本文提出了一種移動(dòng)邊緣計(jì)算場(chǎng)景下基于聯(lián)邦深度強(qiáng)化學(xué)習(xí)的多無人機(jī)軌跡規(guī)劃算法,有效地解決了無人機(jī)輔助移動(dòng)邊緣計(jì)算場(chǎng)景中地面用戶設(shè)備時(shí)延敏感、無人機(jī)卸載服務(wù)不均衡的情況。本算法結(jié)合了聯(lián)邦學(xué)習(xí)與雙延遲深度確定性策略梯度(twin delayed deep deterministic policy gradient,TD3)算法,既實(shí)現(xiàn)了在環(huán)境信息無法預(yù)知的情況下進(jìn)行路徑規(guī)劃,又確保了信息共享以實(shí)現(xiàn)全局最優(yōu),同時(shí)保護(hù)了無人機(jī)的數(shù)據(jù)隱私。

    1 系統(tǒng)模型與問題描述

    1.1 無人機(jī)飛行模型

    將無人機(jī)的飛行時(shí)間劃分為T個(gè)時(shí)隙,每個(gè)時(shí)隙長(zhǎng)度為τ。無人機(jī)以固定安全高度H在目標(biāo)區(qū)域上空飛行,第m(m=1,2,…,M)架無人機(jī)的飛行坐標(biāo)為[Xm(t),Ym(t),H],其中Xm(t)、Ym(t)分別為無人機(jī)m在第t(t=1,2,…,T)時(shí)隙的橫、縱坐標(biāo)。令dm,t和θm,t分別為無人機(jī)在t時(shí)隙的飛行距離和水平方向角度,且滿足dmax為無人機(jī)單位時(shí)隙內(nèi)最大飛行距離。因此第m架無人機(jī)在第t時(shí)隙的橫縱坐標(biāo)分別為

    圖1 無人機(jī)輔助移動(dòng)邊緣計(jì)算系統(tǒng)模型Fig.1 UAV aided mobile edge computing system model

    (1)

    為保證無人機(jī)在飛行過程中的安全,限定邊界,防止無人機(jī)飛出任務(wù)區(qū)域,即0≤Xm(t)≤Xmax和0≤Ym(t)≤Ymax,其中Xmax和Ymax為該區(qū)域的長(zhǎng)度和寬度。多無人機(jī)協(xié)同工作時(shí),為避免無人機(jī)之間出現(xiàn)碰撞造成損失,需得到無人機(jī)m與無人機(jī)m′之間的距離,表示如下:

    (2)

    設(shè)置無人機(jī)m與無人機(jī)m′之間的最小距離為Rm,并滿足:

    Rm,m′,t≥Rm

    (3)

    1.2 信道模型

    對(duì)于空對(duì)地信道,當(dāng)無人機(jī)在一定高度上時(shí),地面用戶n與無人機(jī)m之間的傳播條件可以近似為由視距鏈路[12]主導(dǎo)的自由空間路徑損耗模型[13]。因此,無人機(jī)m和地面用戶設(shè)備n之間的信道功率增益可以被量化為

    (4)

    式中:h0為參考距離d0=1 m時(shí)無線信道內(nèi)的信道增益大小;dn,m,t為第n個(gè)地面用戶與第m架無人機(jī)之間的距離。利用歐幾里得坐標(biāo)系表示為

    (5)

    因此,第n個(gè)地面用戶與第m架無人機(jī)之間的數(shù)據(jù)傳輸速率[14]可以進(jìn)一步表示為

    (6)

    式中:B為信道的帶寬,本文設(shè)定所有無人機(jī)通過頻分多址(frequency division multiple access,FDMA)的方式為所有地面用戶提供同等帶寬分配的服務(wù);Pn為用戶設(shè)備n的傳輸功率;σ2為信道中的背景噪聲功率。

    同時(shí)考慮到傳輸距離損耗和不同信道之間的干擾,設(shè)定無人機(jī)可為地面用戶提供計(jì)算卸載的最大傳輸距離,即覆蓋范圍為Rmax,并滿足如下覆蓋范圍約束:

    dn,m,t≤Rmax

    (7)

    1.3 計(jì)算卸載模型

    本文假定,每個(gè)地面用戶均可選擇本地計(jì)算或部分卸載至無人機(jī)進(jìn)行輔助計(jì)算。同時(shí),無人機(jī)可為覆蓋范圍內(nèi)的任意地面用戶提供比例卸載服務(wù)。卸載比例αn,m,t∈[0,1],αn,m,t=0表示完全卸載至無人機(jī)m進(jìn)行計(jì)算,αn,m,t=1表示由地面用戶進(jìn)行計(jì)算。為簡(jiǎn)化數(shù)據(jù)分割難度,同一時(shí)隙內(nèi)單個(gè)地面用戶設(shè)備規(guī)定只能與一架無人機(jī)關(guān)聯(lián)進(jìn)行計(jì)算卸載。

    在任意時(shí)隙t,各地面用戶設(shè)備均會(huì)產(chǎn)生一個(gè)待處理的計(jì)算密集型任務(wù)Sn,t,并假設(shè)終端設(shè)備產(chǎn)生的任務(wù)數(shù)據(jù)均可逐位獨(dú)立并可按任意比例進(jìn)行劃分,定義為

    Sn,t={Dn,t,Fn,t}

    (8)

    式中:Dn,t為待處理的數(shù)據(jù)量;Fn,t為執(zhí)行此任務(wù)所需的CPU周期總數(shù)。

    1.3.1 地面用戶本地計(jì)算

    (9)

    式中:fn,t為用戶設(shè)備處理器的CPU計(jì)算頻率。

    1.3.2 地面用戶設(shè)備卸載到無人機(jī)

    (10)

    在無人機(jī)端任務(wù)的執(zhí)行時(shí)間可以表示為

    (11)

    式中:fm,t為無人機(jī)服務(wù)器的CPU計(jì)算頻率。

    由于無人機(jī)端計(jì)算處理結(jié)束后產(chǎn)生的數(shù)據(jù)結(jié)果通常較小,因此忽略數(shù)據(jù)回傳時(shí)延。

    1.3.3 對(duì)于單個(gè)地面用戶設(shè)備的總時(shí)延

    雖然終端設(shè)備可以同時(shí)將任務(wù)卸載到無人機(jī),但各終端設(shè)備卸載的任務(wù)在無人機(jī)上為串行執(zhí)行,故需要排隊(duì)處理,采用先進(jìn)先出(first input first output,FIFO)方式對(duì)終端設(shè)備卸載到無人機(jī)的數(shù)據(jù)進(jìn)行處理。無人機(jī)計(jì)算卸載時(shí)延由傳輸時(shí)延、等待和計(jì)算時(shí)延構(gòu)成。

    因?yàn)椴扇×瞬糠中遁d的方式,充分利用了無人機(jī)端和地面用戶設(shè)備端的計(jì)算資源。因此,對(duì)于單個(gè)地面用戶,在計(jì)算總時(shí)延時(shí)需要并行考慮這兩端的時(shí)延。對(duì)每一個(gè)地面用戶設(shè)備所產(chǎn)生的待計(jì)算任務(wù)工作時(shí)延Tn,t為

    (12)

    最后,為了保障所有地面用戶設(shè)備的計(jì)算能夠在規(guī)定時(shí)間內(nèi)完成,還規(guī)定了每個(gè)時(shí)隙內(nèi)的最大任務(wù)時(shí)間Tmax,并滿足:

    Tn,t

    (13)

    1.4 問題描述

    (14)

    為了同時(shí)兼顧地面用戶任務(wù)處理時(shí)延以及無人機(jī)服務(wù)地面用戶的公平性,本文提出了多無人機(jī)輔助移動(dòng)邊緣計(jì)算系統(tǒng)中的聯(lián)合優(yōu)化問題,通過聯(lián)合優(yōu)化無人機(jī)的軌跡和計(jì)算卸載決策,使服務(wù)公平性和任務(wù)計(jì)算時(shí)延的加權(quán)和最大化。用β代表權(quán)重系數(shù),最終優(yōu)化問題可以描述如下:

    (15)

    2 算法設(shè)計(jì)

    在本節(jié)中,提出一種融合聯(lián)邦學(xué)習(xí)和雙延遲深度確定性策略梯度(FL-TD3)的算法,解決移動(dòng)邊緣計(jì)算中多無人機(jī)軌跡規(guī)劃問題。由于在環(huán)境中沒有可以獲取全局信息的中央控制器,每架無人機(jī)只能根據(jù)自身傳感器獲取環(huán)境中的相關(guān)信息,而無法得知其他無人機(jī)的相關(guān)信息。各無人機(jī)分別與環(huán)境交互,依據(jù)自身觀察到的局部信息獲取動(dòng)作獎(jiǎng)勵(lì)值,得到相應(yīng)策略。這種訓(xùn)練方式使無人機(jī)獲取信息不夠全面,根據(jù)這些局部信息學(xué)習(xí)得到的策略容易陷入局部最優(yōu)。因此,為了保證不陷入局部最優(yōu)解,需要對(duì)無人機(jī)進(jìn)行一定的協(xié)作來實(shí)現(xiàn)信息共享,從而達(dá)到全局最優(yōu)。

    為保證訓(xùn)練效果,本文用聯(lián)邦深度強(qiáng)化學(xué)習(xí)的方式對(duì)無人機(jī)輔助移動(dòng)邊緣計(jì)算進(jìn)行訓(xùn)練,如圖2所示。

    圖2 基于聯(lián)邦深度強(qiáng)化學(xué)習(xí)算法框架Fig.2 Framework of federated deep reinforcement learning algorithm

    首先,無人機(jī)根據(jù)自身情況與環(huán)境進(jìn)行交互,訓(xùn)練得到局部最優(yōu)策略;然后,為保證多無人機(jī)決策不陷入局部最優(yōu)解,定期將無人機(jī)訓(xùn)練所得局部模型傳輸至云服務(wù)器進(jìn)行聯(lián)邦學(xué)習(xí)中心聚合,之后再將聚合所得模型下發(fā)回各無人機(jī)。與集中式架構(gòu)的中央控制器決策方案相比,云服務(wù)器不進(jìn)行全局模型訓(xùn)練,僅通過更新模型參數(shù)的方式實(shí)現(xiàn)無人機(jī)之間的信息共享。無人機(jī)重復(fù)上述學(xué)習(xí)方式,直至收斂完成訓(xùn)練。這樣,無人機(jī)就可以直接根據(jù)環(huán)境信息生成相應(yīng)的部署和資源分配決策,無需將大量數(shù)據(jù)傳輸至云服務(wù)器在云端集中訓(xùn)練,極大縮減數(shù)據(jù)傳輸量以及訓(xùn)練復(fù)雜度。

    在此算法中,每架無人機(jī)作為一個(gè)智能體,每個(gè)智能體可以進(jìn)行獨(dú)立學(xué)習(xí),根據(jù)當(dāng)前環(huán)境狀態(tài)確定下一步的動(dòng)作。無人機(jī)的軌跡位置狀態(tài)和計(jì)算卸載服務(wù)狀態(tài)都具有馬爾可夫性質(zhì),即下一個(gè)時(shí)刻的狀態(tài)只與當(dāng)前狀態(tài)有關(guān),與之前的狀態(tài)均無關(guān)。因此,這樣的優(yōu)化問題可以被建立為離散時(shí)間馬爾可夫決策過程(Markov decision process,MDP)。在數(shù)學(xué)上,將MDP重新定義為三元組(sm,am,rm)。其中,sm和am分別代表無人機(jī)m的狀態(tài)空間和動(dòng)作空間,rm代表無人機(jī)m在當(dāng)前狀態(tài)sm做出動(dòng)作am的獎(jiǎng)勵(lì)函數(shù)。

    因此可以定義每個(gè)智能體在t時(shí)隙的狀態(tài)、動(dòng)作、獎(jiǎng)勵(lì)函數(shù)如下:

    2)動(dòng)作am(t)。定義在t時(shí)隙無人機(jī)m的飛行位移和卸載比例am(t)={dm,t,θm,t,αn,m,t} 。

    3)獎(jiǎng)勵(lì)函數(shù)rm(t)。定義獎(jiǎng)勵(lì)函數(shù)為

    (16)

    式中:pr為無人機(jī)m飛出限定范圍的懲罰;pm為無人機(jī)m與其他無人機(jī)相撞的懲罰。

    綜上所述,每架無人機(jī)都可以根據(jù)當(dāng)前的環(huán)境狀態(tài)信息做出相應(yīng)的執(zhí)行策略。根據(jù)多架無人機(jī)的聯(lián)合動(dòng)作將環(huán)境更新到下一狀態(tài),同時(shí)每架無人機(jī)得到相應(yīng)的獎(jiǎng)勵(lì)。每架無人機(jī)通過試錯(cuò)的方法不斷地與環(huán)境交互,最終學(xué)習(xí)到一個(gè)最優(yōu)的策略π(s),使其能夠做出最優(yōu)決策,得到長(zhǎng)期獎(jiǎng)勵(lì)最大化,可以將長(zhǎng)期獎(jiǎng)勵(lì)定義為

    (17)

    式中:r(·)為獎(jiǎng)勵(lì)函數(shù);γ為獎(jiǎng)勵(lì)的折扣因子,γ∈(0,1)。

    深度強(qiáng)化學(xué)習(xí)因其加強(qiáng)了神經(jīng)網(wǎng)絡(luò)的層級(jí),可用于處理無人機(jī)更加復(fù)雜的的控制問題。使用深度神經(jīng)網(wǎng)絡(luò)的輸出近似擬合未來獎(jiǎng)勵(lì)的期望值Q(s,a),Q(s,a)是在狀態(tài)s中執(zhí)行動(dòng)作a,以取得獎(jiǎng)勵(lì)的預(yù)期收益。連續(xù)性動(dòng)作控制算法包括深度確定性策略梯度(deep deterministic policy gradient,DDPG)算法和TD3算法,通過最小化損失函數(shù)更新神經(jīng)網(wǎng)絡(luò)的參數(shù)θ獲得更準(zhǔn)確的Q值,提升智能體的性能。

    TD3作為一種連續(xù)動(dòng)作控制算法,在智能控制領(lǐng)域擁有良好的效果。與同為連續(xù)動(dòng)作空間控制算法的DDPG相比,這一經(jīng)典算法解決了高估誤差問題。TD3使用3種技術(shù)對(duì)這個(gè)問題進(jìn)行優(yōu)化。

    首先,TD3算法采用兩套Critic網(wǎng)絡(luò)及Critic Target網(wǎng)絡(luò),對(duì)于每次更新,選取較小的Q值。

    其次,采用延遲更新策略,當(dāng)模型的價(jià)值函數(shù)產(chǎn)生較大變化時(shí),才會(huì)更新其策略;否則,不會(huì)更新。這樣可降低價(jià)值估計(jì)的差異,產(chǎn)生更好的策略,在更新時(shí)可以獲得更穩(wěn)定的性能。

    最后,采用目標(biāo)策略正則化減少方差增加,因?yàn)樵诟翪ritic網(wǎng)絡(luò)時(shí),確定性策略的學(xué)習(xí)目標(biāo)容易受到函數(shù)近似值誤差的影響,導(dǎo)致目標(biāo)的方差增加。此外,TD3的動(dòng)作輸出會(huì)受到噪聲影響,我們通過平均訓(xùn)練批次中的噪聲平滑估計(jì)值。所添加的噪聲服從正態(tài)分布,并且對(duì)采樣的噪聲進(jìn)行適當(dāng)裁剪,使動(dòng)作更接近原始動(dòng)作。

    從以上所述可以看到,在每架無人機(jī)上分別部署了基于TD3的無人機(jī)輔助移動(dòng)邊緣計(jì)算軌跡規(guī)劃算法。每架無人機(jī)分別根據(jù)自身所處環(huán)境學(xué)得局部最優(yōu)策略。然而,本文的場(chǎng)景設(shè)置為多無人機(jī)協(xié)作共同服務(wù)地面用戶,如果單架無人機(jī)只追求自身的獎(jiǎng)勵(lì)最大化,會(huì)影響其他無人機(jī)的訓(xùn)練結(jié)果。而在此項(xiàng)任務(wù)當(dāng)中無人機(jī)相互之間處于合作關(guān)系而非獨(dú)立或者競(jìng)爭(zhēng)的關(guān)系,那么應(yīng)當(dāng)設(shè)計(jì)出一種能夠在全局的角度下最優(yōu)結(jié)果,而非單架無人機(jī)局部最優(yōu)。因此,本文引入聯(lián)邦學(xué)習(xí)框架,從而達(dá)到多無人機(jī)協(xié)同過程中的全局最優(yōu)。

    采用聯(lián)邦平均(federated averaging,FedAvg)的方式對(duì)深度強(qiáng)化學(xué)習(xí)模型進(jìn)行平均聚合,按式(18)更新:

    (18)

    式中:θglobal為全局網(wǎng)絡(luò)模型參數(shù);θm為無人機(jī)上部署的局部模型參數(shù)。

    在聯(lián)邦深度強(qiáng)化學(xué)習(xí)框架下,模型訓(xùn)練僅在各無人機(jī)端利用私有數(shù)據(jù)進(jìn)行訓(xùn)練,而中心服務(wù)器只進(jìn)行模型聚合。與傳統(tǒng)的集中式學(xué)習(xí)相比,本方案并沒有將所有數(shù)據(jù)傳至中心服務(wù)器進(jìn)行集中式訓(xùn)練,既降低了訓(xùn)練復(fù)雜度又保護(hù)了數(shù)據(jù)隱私。

    在本文提出的移動(dòng)邊緣計(jì)算中基于聯(lián)邦深度強(qiáng)化學(xué)習(xí)的無人機(jī)輔助軌跡規(guī)劃方案中,無人機(jī)是聯(lián)邦學(xué)習(xí)框架中客戶端學(xué)習(xí)與訓(xùn)練的主體,基站配屬的服務(wù)器是聯(lián)邦學(xué)習(xí)框架中的云端。每架無人機(jī)都被建模為一個(gè)智能體,可以進(jìn)行獨(dú)立的探索和學(xué)習(xí)。算法將聯(lián)邦學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)相結(jié)合,組成多智能體協(xié)作通信網(wǎng)絡(luò)。具體過程如算法1所示。

    該算法分為3個(gè)部分。首先,初始化整個(gè)多無人機(jī)通信環(huán)境和每架無人機(jī)的網(wǎng)絡(luò)參數(shù)。之后,每架無人機(jī)通過與環(huán)境交互獲得狀態(tài)信息。無人機(jī)根據(jù)神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果執(zhí)行動(dòng)作,獲得相應(yīng)的獎(jiǎng)勵(lì)和下一個(gè)狀態(tài)。重復(fù)無人機(jī)與環(huán)境交互達(dá)到一定次數(shù)后,將學(xué)習(xí)所得網(wǎng)絡(luò)模型參數(shù)傳輸至FL云服務(wù)器。最后,FL云服務(wù)器在特定周期得到各無人機(jī)上傳的網(wǎng)絡(luò)模型參數(shù)。云服務(wù)器聚合各局部模型參數(shù)并生成新的全局模型參數(shù),再下發(fā)回各無人機(jī)繼續(xù)訓(xùn)練。重復(fù)上述訓(xùn)練過程,直到達(dá)到迭代次數(shù)為止。

    算法1:移動(dòng)邊緣計(jì)算中基于聯(lián)邦深度強(qiáng)化學(xué)習(xí)的多無人機(jī)軌跡規(guī)劃算法1.建立環(huán)境和算法參數(shù);2.for all UAV m,m∈Mdo3. 初始化回放緩存 m。4. 初始化Critic網(wǎng)絡(luò)Qmθ1、Qmθ2和Actor網(wǎng)絡(luò)πm?,以及隨機(jī)參數(shù)θm1、θm2、?m。5.初始化Critic Target網(wǎng)絡(luò)Qm,Targetθ1、Qm,Targetθ2和Ac-tor Target網(wǎng)絡(luò)θm,Targetπ?,以及模型參數(shù):θm,Target1θm1、θm,Target2θm2、?m,Target1?m。6.end for7.forp=1 to emaxdo8. 初始化環(huán)境以及全局狀態(tài)S(t);9. fort=1 to Tdo10. for all UAV m,m∈M do11. 從FL中心服務(wù)器獲取全局權(quán)重θglobal;12. 獲取狀態(tài)sm(t)同時(shí)依據(jù)模型策略選 取動(dòng)作;

    13. end for14. 根據(jù)所有無人機(jī)的聯(lián)合動(dòng)作A(t)更新最新 的全局狀態(tài)S(t+1);15. for all UAV m,m∈Mdo16. 獲取新的狀態(tài)值sm(t)以及相應(yīng)的獎(jiǎng)勵(lì) rm(t);17. 存儲(chǔ)(sm(t),am(t),rm(t),sm(t+1))到 回放緩存 m中;18. 從回放緩存 m中隨機(jī)采樣過渡的小批 量樣本(sj,aji,rji,s′j);19. 通過目標(biāo)值ym計(jì)算最小化損失函數(shù),更 新Critic網(wǎng)絡(luò)的權(quán)重θm1、θm2: θmi←argminθmiN-1∑(ym-Qmθi(s,a))2 ?i∈1,220. Ift mod 3 then21. 更新Actor網(wǎng)絡(luò)的權(quán)重 ?m: Δ?mJ(?m)=N-1∑ΔaQmθmi(s,a)a=πm?(s)Δ?mπ?m(s)22. 更新Actor Target網(wǎng)絡(luò)和Critic Target 網(wǎng)絡(luò)的權(quán)重: θm,Targeti←τθmi+(1-τ)θm,Target ?i∈1,2 ?m,Target←τ?m+(1-τ)?m,Target?i∈1,223. End if24. 發(fā)送模型權(quán)重θm1、θm2、?m到聯(lián)邦學(xué)習(xí)中心 服務(wù)器;25. end for26. 聯(lián)邦學(xué)習(xí)云服務(wù)器對(duì)所有無人機(jī)的權(quán)重進(jìn) 行平均,以更新全局權(quán)重θglobal;27. end for28.end for

    3 仿真結(jié)果和分析

    本節(jié)通過實(shí)驗(yàn)仿真說明移動(dòng)邊緣計(jì)算中基于聯(lián)邦深度強(qiáng)化學(xué)習(xí)的多無人機(jī)軌跡規(guī)劃算法的性能。首先,描述系統(tǒng)模型參數(shù)設(shè)置。其次,分析仿真結(jié)果以及性能,并與其他算法進(jìn)行性能比較。

    3.1 仿真設(shè)計(jì)環(huán)境參數(shù)和算法超參數(shù)設(shè)置

    設(shè)定150 m×150 m的任務(wù)區(qū)域,部署3架無人機(jī)以及20個(gè)地面用戶隨機(jī)分布在任務(wù)區(qū)域內(nèi),如果無人機(jī)飛出限定區(qū)域?qū)⒈粡?qiáng)制返回。為了簡(jiǎn)化無人機(jī)飛行環(huán)境,設(shè)置無人機(jī)飛行高度為15 m。3架無人機(jī)的起始位置分別為[20,20]、[20,120]、[120,120] m。在此區(qū)域內(nèi)部署隨機(jī)分布的20個(gè)地面用戶,每個(gè)地面用戶在各時(shí)隙開始時(shí)均會(huì)產(chǎn)生一個(gè)數(shù)據(jù)大小為D以及每比特需要CPU輪數(shù)為F的待處理計(jì)算密集型任務(wù)Sn,t。具體相關(guān)參數(shù)見表1。

    表1 系統(tǒng)模型與優(yōu)化模型參數(shù)Table 1 System model and optimization model parameters

    為分析本文算法性能,與其他3種算法進(jìn)行對(duì)比:

    1)分布式雙延遲深度確定性策略梯度(distributed twin delayed deep deterministic policy gradient,DIS-TD3)[15]多無人機(jī)輔助移動(dòng)邊緣計(jì)算算法:部署多架無人機(jī),采用分布式架構(gòu),TD3算法獨(dú)立部署在各無人機(jī)上僅依靠自身局部信息訓(xùn)練學(xué)習(xí),最終做出決策。

    2)雙延遲深度確定性策略梯度單無人機(jī)輔助移動(dòng)邊緣計(jì)算(single UAV twin delayed deep deterministic policy gradient,SINGLE-TD3)[16]算法:僅使用單個(gè)無人機(jī),利用雙延遲深度確定性策略梯度算法對(duì)無人機(jī)進(jìn)行軌跡規(guī)劃。

    3)在地面用戶設(shè)備本地執(zhí)行所有計(jì)算任務(wù),簡(jiǎn)稱為L(zhǎng)OCAL-ONLY:無人機(jī)不參與計(jì)算任務(wù),僅依靠地面用戶自身對(duì)產(chǎn)生的計(jì)算任務(wù)進(jìn)行處理。

    3.2 仿真性能分析

    首先,描述多無人機(jī)輔助移動(dòng)邊緣計(jì)算的軌跡,如圖3。在150 m×150 m的規(guī)定范圍內(nèi)部署了3架無人機(jī)以及20個(gè)地面用戶隨機(jī)分布在任務(wù)區(qū)域內(nèi),圓點(diǎn)代表地面用戶的位置,菱形、三角形、十字形分別為3架無人機(jī)的軌跡。

    圖3 各地面用戶位置分布及無人機(jī)軌跡Fig.3 Location distribution of ground users and drone trajectories

    從圖3可以看出,因計(jì)算卸載覆蓋范圍有限,無人機(jī)必須移動(dòng)位置以保證服務(wù)更多地面用戶,從而提高服務(wù)地面用戶公平性。同時(shí)為減小卸載到無人機(jī)計(jì)算任務(wù)的傳輸時(shí)延,無人機(jī)盡可能貼近地面用戶以減小傳輸距離。所有無人機(jī)都在一定區(qū)域內(nèi)飛行,無人機(jī)1聚集在左下,貼近地面用戶聚集處。無人機(jī)3從右上逐漸遷移至右下,以服務(wù)更多用戶。

    圖4為FL-TD3的收斂性能。本文共部署了3架無人機(jī)協(xié)同對(duì)地面用戶設(shè)備進(jìn)行計(jì)算卸載服務(wù)。收斂性能描述了訓(xùn)練過程中3架無人機(jī)的總獎(jiǎng)勵(lì)值變化。剛開始總獎(jiǎng)勵(lì)持續(xù)增加,到1 000次左右逐漸趨于平緩,經(jīng)過約2 800次訓(xùn)練后趨于收斂。

    圖4 FL-TD3算法收斂情況Fig.4 Convergence of FL-TD3 algorithm

    圖5為系統(tǒng)中服務(wù)公平性和時(shí)延累計(jì)隨時(shí)隙變化的仿真結(jié)果。在整個(gè)多無人機(jī)輔助計(jì)算卸載過程中,共設(shè)置了10個(gè)時(shí)隙為地面用戶提供服務(wù)。其中,為了對(duì)比優(yōu)化問題中權(quán)重系數(shù)β對(duì)性能的影響,在本文提出的FL-TD3上設(shè)立權(quán)重系數(shù)為β=0.3的對(duì)比算法,即圖中的FL-TD3-0.3算法,對(duì)比權(quán)重系數(shù)對(duì)公平性和時(shí)延性能的影響。在圖5(a)中,所有算法的公平性均隨著時(shí)隙的增長(zhǎng)而升高。這是因?yàn)殡S著時(shí)隙的增長(zhǎng)無人機(jī)不斷增加對(duì)地面用戶的計(jì)算卸載數(shù)量,從而使服務(wù)公平性不斷增高。圖5(b)為時(shí)延的累計(jì),它隨著時(shí)隙的增長(zhǎng)不斷升高。首先,FL-TD3-0.3相比FL-TD3的公平性較差而時(shí)延較好,這是因?yàn)楫?dāng)權(quán)重系數(shù)β變小時(shí),算法將更重視對(duì)時(shí)延的優(yōu)化而減輕對(duì)公平性的注重。因此FL-TD3-0.3的時(shí)延優(yōu)于其他所有算法。還可以看出,因?yàn)镕L-TD3-0.3權(quán)重系數(shù)β較小,隨著時(shí)隙的增長(zhǎng),FL-TD3-0.3的公平性相比于另兩個(gè)多無人機(jī)算法的差距越來越大。其次,本文提出的FL-TD3算法優(yōu)于DIS-TD3算法,這是因?yàn)楸狙芯繉⒙?lián)邦學(xué)習(xí)融入了多智能體深度強(qiáng)化學(xué)習(xí)框架中,聯(lián)邦學(xué)習(xí)的加入讓無人機(jī)之間能夠信息共享,因此性能更優(yōu)。最后,分析無人機(jī)數(shù)量對(duì)服務(wù)性能的影響,單無人機(jī)與多無人機(jī)相對(duì)比,僅依靠單個(gè)無人機(jī)對(duì)地面用戶進(jìn)行計(jì)算卸載任務(wù)服務(wù),能夠看出其性能低于多無人機(jī)算法。LOCAL-ONLY算法不能充分利用整個(gè)系統(tǒng)的計(jì)算資源,性能在所有算法中最差。

    圖5 公平性和時(shí)延累計(jì)隨時(shí)隙變化Fig.5 Fairness and delay accumulation vary with time slots

    圖6展示了在無人機(jī)不同覆蓋范圍Rmax下,各算法的服務(wù)公平性和時(shí)延對(duì)比。其中地面用戶數(shù)量恒定為20個(gè)。同樣,本文為了對(duì)比優(yōu)化問題中權(quán)重系數(shù)β對(duì)性能的影響,設(shè)置了對(duì)比算法FL-TD3-0.3。

    圖6 公平性與總時(shí)延隨無人機(jī)覆蓋范圍變化Fig.6 Fairness and total latency vary with drone coverage

    由圖6可以看出,當(dāng)無人機(jī)的覆蓋范圍增大時(shí),所有算法的性能隨之更優(yōu)。具體來說,公平性均隨覆蓋范圍的增大而變好;FL-TD3算法、FL-TD3-0.3、DIS-TD3的時(shí)延均隨覆蓋范圍的增大而減短。這是因?yàn)殡S著無人機(jī)覆蓋范圍的增大,無人機(jī)能夠在單個(gè)時(shí)隙內(nèi)覆蓋更多地面用戶,從而豐富了無人機(jī)部署位置的多樣性,最終提高了無人機(jī)服務(wù)地面用戶的整體性能。相比本文提出的算法FL-TD3,隨著覆蓋范圍變化,FL-TD3-0.3始終保持著公平性較差而時(shí)延較好的趨勢(shì),這是因?yàn)槠錂?quán)重系數(shù)β較小,使公平性的權(quán)重降低而時(shí)延的權(quán)重更高。本文提出的FL-TD3算法因其融入了聯(lián)邦學(xué)習(xí)框架,使無人機(jī)之間能夠?qū)崿F(xiàn)信息共享。隨著覆蓋范圍的增大,FL-TD3性能始終優(yōu)于DIS-TD3算法。SINGLE-TD3算法覆蓋范圍在15~25 m區(qū)間時(shí),可以看到時(shí)延能夠隨覆蓋范圍增大而降低。然而在30~45 m之間,時(shí)延幾乎不變,只有微弱的降低,這是因?yàn)閱蝹€(gè)無人機(jī)無法在一個(gè)時(shí)隙內(nèi)卸載過多地面用戶,這會(huì)造成計(jì)算任務(wù)大量排隊(duì),使計(jì)算時(shí)延超過本地計(jì)算時(shí)間,無人機(jī)不再拓展更多計(jì)算卸載任務(wù),所以在此區(qū)間內(nèi)時(shí)延變化不大。對(duì)比其他算法,SINGLE-TD3的公平性、時(shí)延性能雖然能夠隨著覆蓋范圍的增大而變優(yōu),但是由于其無人機(jī)數(shù)量局限性,其性能差于所有多無人機(jī)算法。LOCAL-ONLY算法不能充分利用整個(gè)系統(tǒng)的計(jì)算資源,性能在所有算法中最差。

    4 結(jié)束語

    本文研究了多無人機(jī)輔助移動(dòng)邊緣計(jì)算的軌跡規(guī)劃問題。針對(duì)計(jì)算密集型應(yīng)用對(duì)時(shí)延具有較強(qiáng)的敏感性,采取將地面用戶部分任務(wù)卸載到無人機(jī)上進(jìn)行輔助計(jì)算。本文采用了一種聯(lián)合優(yōu)化策略,將無人機(jī)軌跡和任務(wù)卸載比例作為優(yōu)化目標(biāo),旨在最大化任務(wù)時(shí)延和服務(wù)公平性的加權(quán)和,以確保在服務(wù)地面用戶的過程中,最小化時(shí)延的同時(shí)兼顧無人機(jī)服務(wù)地面公平性。為實(shí)現(xiàn)多無人機(jī)能夠協(xié)同對(duì)地面用戶進(jìn)行計(jì)算卸載服務(wù),本文將聯(lián)邦學(xué)習(xí)融入多智能體深度強(qiáng)化學(xué)習(xí)算法中,達(dá)到信息交互的目的。通過聯(lián)邦學(xué)習(xí)非隱私數(shù)據(jù)共享的機(jī)制,既實(shí)現(xiàn)了多無人機(jī)間的信息共享使學(xué)習(xí)效果達(dá)到全局最優(yōu),又保障了數(shù)據(jù)隱私。仿真結(jié)果表明,與無信息交互的多智能體深度強(qiáng)化學(xué)習(xí)相比,本文提出的算法在無人機(jī)服務(wù)公平性和時(shí)延上具有更好的性能。

    猜你喜歡
    覆蓋范圍公平性時(shí)隙
    復(fù)用段單節(jié)點(diǎn)失效造成業(yè)務(wù)時(shí)隙錯(cuò)連處理
    一種提高TCP與UDP數(shù)據(jù)流公平性的擁塞控制機(jī)制
    基于機(jī)器學(xué)習(xí)的基站覆蓋范圍仿真
    一種高速通信系統(tǒng)動(dòng)態(tài)時(shí)隙分配設(shè)計(jì)
    公平性問題例談
    工傷社會(huì)保險(xiǎn)覆蓋范圍的擴(kuò)展及其路徑
    時(shí)隙寬度約束下網(wǎng)絡(luò)零售配送時(shí)隙定價(jià)研究
    淺談提高小功率短波電臺(tái)覆蓋范圍的措施
    電子制作(2016年23期)2016-05-17 03:54:06
    關(guān)于短波廣播覆蓋范圍的幾點(diǎn)探討
    科技視界(2016年9期)2016-04-26 09:14:10
    關(guān)于公平性的思考
    天天添夜夜摸| av不卡在线播放| 久久韩国三级中文字幕| 黄片播放在线免费| 两个人看的免费小视频| 亚洲国产精品一区三区| 观看美女的网站| 中文字幕av电影在线播放| 咕卡用的链子| 亚洲成人手机| 亚洲国产最新在线播放| 午夜日韩欧美国产| 婷婷色综合www| 亚洲欧美中文字幕日韩二区| 国产精品一二三区在线看| 三上悠亚av全集在线观看| www.自偷自拍.com| 天天躁狠狠躁夜夜躁狠狠躁| 午夜影院在线不卡| 国产免费又黄又爽又色| 两个人免费观看高清视频| 久久毛片免费看一区二区三区| avwww免费| 国产午夜精品一二区理论片| 青春草视频在线免费观看| 国产亚洲av片在线观看秒播厂| 亚洲av在线观看美女高潮| 一区福利在线观看| 男人操女人黄网站| 男女边摸边吃奶| 婷婷色麻豆天堂久久| 两性夫妻黄色片| 亚洲国产av新网站| 亚洲av成人精品一二三区| 操美女的视频在线观看| 国产精品免费大片| 成人18禁高潮啪啪吃奶动态图| 久久久久久久久免费视频了| 国精品久久久久久国模美| 老司机深夜福利视频在线观看 | 宅男免费午夜| 久久av网站| 夫妻性生交免费视频一级片| 免费女性裸体啪啪无遮挡网站| 男女免费视频国产| 亚洲人成电影观看| 亚洲美女视频黄频| 七月丁香在线播放| 大码成人一级视频| 制服人妻中文乱码| 国产高清国产精品国产三级| 精品少妇久久久久久888优播| 一二三四中文在线观看免费高清| 午夜91福利影院| 免费日韩欧美在线观看| 九色亚洲精品在线播放| 国产 精品1| 如何舔出高潮| 国产亚洲av片在线观看秒播厂| 美女午夜性视频免费| 高清视频免费观看一区二区| 波野结衣二区三区在线| 看免费成人av毛片| 大陆偷拍与自拍| 欧美精品人与动牲交sv欧美| 久久性视频一级片| 日本午夜av视频| 日韩制服骚丝袜av| 一级毛片电影观看| 亚洲国产精品一区三区| 久久精品久久精品一区二区三区| 久久韩国三级中文字幕| 日韩免费高清中文字幕av| 中文字幕精品免费在线观看视频| 97人妻天天添夜夜摸| 嫩草影视91久久| 国产精品香港三级国产av潘金莲 | 亚洲成av片中文字幕在线观看| 亚洲成色77777| 国产一区二区三区av在线| 亚洲国产欧美在线一区| 日日爽夜夜爽网站| 丰满少妇做爰视频| 99热全是精品| 老熟女久久久| 1024香蕉在线观看| 日韩熟女老妇一区二区性免费视频| 久久99一区二区三区| 免费在线观看黄色视频的| 美女扒开内裤让男人捅视频| 制服人妻中文乱码| 高清不卡的av网站| 下体分泌物呈黄色| 一级a爱视频在线免费观看| 性色av一级| 亚洲少妇的诱惑av| 精品人妻在线不人妻| 久久女婷五月综合色啪小说| 母亲3免费完整高清在线观看| 在线观看免费午夜福利视频| 男女国产视频网站| 亚洲国产欧美网| 欧美精品亚洲一区二区| 丝瓜视频免费看黄片| 天天躁狠狠躁夜夜躁狠狠躁| 国产在线视频一区二区| 亚洲国产精品一区二区三区在线| 99香蕉大伊视频| 2018国产大陆天天弄谢| 热re99久久国产66热| 一二三四在线观看免费中文在| 亚洲图色成人| 亚洲人成网站在线观看播放| 国产男女超爽视频在线观看| 亚洲精品日韩在线中文字幕| 免费不卡黄色视频| 成人影院久久| av电影中文网址| 欧美日韩亚洲高清精品| 两个人免费观看高清视频| 看免费成人av毛片| 久久久久久久久久久久大奶| 久久这里只有精品19| 成人漫画全彩无遮挡| 日韩欧美精品免费久久| 狂野欧美激情性bbbbbb| 成年av动漫网址| 人妻一区二区av| av网站免费在线观看视频| 精品久久蜜臀av无| 久久久精品94久久精品| 亚洲 欧美一区二区三区| 九色亚洲精品在线播放| 亚洲成人免费av在线播放| 亚洲久久久国产精品| 亚洲国产欧美一区二区综合| 日韩精品免费视频一区二区三区| 精品酒店卫生间| 久久天躁狠狠躁夜夜2o2o | 亚洲国产中文字幕在线视频| netflix在线观看网站| 亚洲熟女毛片儿| 一个人免费看片子| 亚洲成av片中文字幕在线观看| 久久免费观看电影| 色吧在线观看| 午夜福利视频精品| 黄网站色视频无遮挡免费观看| 午夜福利视频在线观看免费| 99国产精品免费福利视频| av网站免费在线观看视频| av又黄又爽大尺度在线免费看| 日日爽夜夜爽网站| 韩国高清视频一区二区三区| 日韩一区二区视频免费看| 大陆偷拍与自拍| 国产精品一国产av| 在线观看三级黄色| 一二三四中文在线观看免费高清| 婷婷成人精品国产| 免费少妇av软件| 色94色欧美一区二区| 国产精品无大码| 亚洲国产中文字幕在线视频| netflix在线观看网站| 精品国产超薄肉色丝袜足j| 男人添女人高潮全过程视频| 亚洲成人av在线免费| 欧美日韩视频精品一区| 欧美中文综合在线视频| 校园人妻丝袜中文字幕| 少妇人妻精品综合一区二区| 国产xxxxx性猛交| videosex国产| 男人操女人黄网站| 精品一区在线观看国产| 老司机影院成人| 日本91视频免费播放| 大香蕉久久网| 午夜av观看不卡| 成人影院久久| 男人爽女人下面视频在线观看| 天天躁狠狠躁夜夜躁狠狠躁| 色94色欧美一区二区| 别揉我奶头~嗯~啊~动态视频 | 亚洲成人av在线免费| 亚洲天堂av无毛| 久久影院123| 9热在线视频观看99| 新久久久久国产一级毛片| 捣出白浆h1v1| 纵有疾风起免费观看全集完整版| 性少妇av在线| 亚洲婷婷狠狠爱综合网| 老汉色∧v一级毛片| 午夜福利乱码中文字幕| 精品免费久久久久久久清纯 | 国产精品.久久久| 日本av免费视频播放| 欧美精品av麻豆av| 亚洲欧美清纯卡通| 飞空精品影院首页| 18禁国产床啪视频网站| 欧美精品一区二区大全| 中国三级夫妇交换| 亚洲国产最新在线播放| www.自偷自拍.com| 美女高潮到喷水免费观看| 婷婷色综合大香蕉| 成人漫画全彩无遮挡| 亚洲三区欧美一区| 午夜福利一区二区在线看| 亚洲国产欧美一区二区综合| 高清av免费在线| 成年人午夜在线观看视频| 国产亚洲精品第一综合不卡| 亚洲av电影在线进入| 日韩精品有码人妻一区| 久久97久久精品| 晚上一个人看的免费电影| 色94色欧美一区二区| 两性夫妻黄色片| 丁香六月欧美| 99久久人妻综合| 亚洲七黄色美女视频| 色综合欧美亚洲国产小说| 国语对白做爰xxxⅹ性视频网站| 亚洲少妇的诱惑av| 免费高清在线观看日韩| 久久精品久久久久久噜噜老黄| 少妇猛男粗大的猛烈进出视频| 美女视频免费永久观看网站| 久久精品国产亚洲av涩爱| 久久精品亚洲av国产电影网| 国产亚洲欧美精品永久| 色婷婷久久久亚洲欧美| 午夜免费观看性视频| 大香蕉久久成人网| 青春草亚洲视频在线观看| 久久久精品区二区三区| 亚洲成av片中文字幕在线观看| 国产 一区精品| 一区二区三区四区激情视频| 久久久久久人人人人人| 欧美激情极品国产一区二区三区| 国产欧美日韩综合在线一区二区| 日日爽夜夜爽网站| 午夜精品国产一区二区电影| www.av在线官网国产| 99热国产这里只有精品6| netflix在线观看网站| 国产精品久久久久久精品古装| 亚洲精华国产精华液的使用体验| 欧美精品一区二区免费开放| 中文字幕最新亚洲高清| 亚洲精品国产区一区二| 啦啦啦 在线观看视频| 久久av网站| 只有这里有精品99| 亚洲婷婷狠狠爱综合网| 久久天堂一区二区三区四区| 十八禁人妻一区二区| 人人妻人人添人人爽欧美一区卜| 老汉色∧v一级毛片| 国产一区二区激情短视频 | 秋霞在线观看毛片| 亚洲,欧美精品.| 中文欧美无线码| 亚洲,一卡二卡三卡| 欧美成人精品欧美一级黄| 不卡视频在线观看欧美| 69精品国产乱码久久久| 久久韩国三级中文字幕| 国产爽快片一区二区三区| 国产精品.久久久| 国产成人91sexporn| 午夜日韩欧美国产| 18禁观看日本| 国产男女超爽视频在线观看| 亚洲成国产人片在线观看| av不卡在线播放| 久热这里只有精品99| 国产黄色免费在线视频| 色视频在线一区二区三区| 晚上一个人看的免费电影| 久久女婷五月综合色啪小说| 一级毛片 在线播放| 下体分泌物呈黄色| 亚洲,欧美精品.| 最黄视频免费看| 我要看黄色一级片免费的| 精品人妻在线不人妻| 制服诱惑二区| 日韩免费高清中文字幕av| 男女床上黄色一级片免费看| 日本vs欧美在线观看视频| 精品久久久精品久久久| 18禁国产床啪视频网站| 日韩一卡2卡3卡4卡2021年| 老司机亚洲免费影院| 久久鲁丝午夜福利片| 国产精品秋霞免费鲁丝片| 亚洲一区中文字幕在线| 欧美激情极品国产一区二区三区| 免费久久久久久久精品成人欧美视频| 丝袜在线中文字幕| 国产成人精品无人区| 久久精品久久精品一区二区三区| 天天躁狠狠躁夜夜躁狠狠躁| 久久精品亚洲av国产电影网| 午夜福利视频精品| 日本91视频免费播放| 亚洲精品aⅴ在线观看| 久久影院123| 国产深夜福利视频在线观看| 精品免费久久久久久久清纯 | 国产成人精品福利久久| 一级毛片 在线播放| 国产精品一区二区精品视频观看| 久久久欧美国产精品| 如日韩欧美国产精品一区二区三区| 国产成人免费无遮挡视频| 亚洲成人免费av在线播放| 男女下面插进去视频免费观看| av又黄又爽大尺度在线免费看| 亚洲五月色婷婷综合| 19禁男女啪啪无遮挡网站| 午夜老司机福利片| 亚洲国产最新在线播放| 男女无遮挡免费网站观看| 一区二区三区精品91| 在线观看免费高清a一片| 丁香六月天网| 男女边摸边吃奶| 黄色毛片三级朝国网站| 日韩视频在线欧美| 又大又爽又粗| 午夜福利视频精品| 搡老岳熟女国产| 亚洲精品视频女| 久久久久久久久免费视频了| 伊人久久国产一区二区| 黄频高清免费视频| 欧美中文综合在线视频| 性色av一级| 老司机影院毛片| 多毛熟女@视频| 亚洲国产欧美日韩在线播放| 你懂的网址亚洲精品在线观看| 国产精品 欧美亚洲| 国产精品蜜桃在线观看| 香蕉丝袜av| 一级毛片电影观看| 成年av动漫网址| 纵有疾风起免费观看全集完整版| 久久热在线av| 国产在线一区二区三区精| 电影成人av| 啦啦啦中文免费视频观看日本| 亚洲第一av免费看| 成人手机av| 欧美乱码精品一区二区三区| 一区二区日韩欧美中文字幕| 国产精品一国产av| 老司机深夜福利视频在线观看 | 啦啦啦在线免费观看视频4| 国产日韩欧美在线精品| 母亲3免费完整高清在线观看| 国产av国产精品国产| 久久狼人影院| 99精品久久久久人妻精品| 水蜜桃什么品种好| 久久久国产精品麻豆| 欧美精品av麻豆av| 中文字幕制服av| 久久99一区二区三区| 国产成人av激情在线播放| 国产野战对白在线观看| 欧美日韩成人在线一区二区| 国产在视频线精品| 午夜福利,免费看| 在线观看三级黄色| 久久久久久人妻| 男女下面插进去视频免费观看| 久久99热这里只频精品6学生| 国产一区有黄有色的免费视频| 欧美精品一区二区免费开放| 超碰成人久久| 国产成人精品福利久久| 国产片内射在线| 新久久久久国产一级毛片| 国产极品天堂在线| 成人影院久久| 国产日韩欧美亚洲二区| 纵有疾风起免费观看全集完整版| 久久 成人 亚洲| 亚洲精华国产精华液的使用体验| 色吧在线观看| 飞空精品影院首页| 美女扒开内裤让男人捅视频| 国产无遮挡羞羞视频在线观看| 成人亚洲欧美一区二区av| 黑人欧美特级aaaaaa片| 日本欧美视频一区| 人人妻人人澡人人看| 亚洲五月色婷婷综合| 叶爱在线成人免费视频播放| 天堂8中文在线网| 精品视频人人做人人爽| 人人妻人人澡人人看| 国产亚洲av高清不卡| 在线天堂最新版资源| 青青草视频在线视频观看| 欧美av亚洲av综合av国产av | 国产成人欧美| 国产成人精品无人区| 99久久综合免费| 久久av网站| 亚洲精品国产一区二区精华液| www.自偷自拍.com| 免费人妻精品一区二区三区视频| 老司机亚洲免费影院| 伦理电影大哥的女人| 一本色道久久久久久精品综合| 老汉色∧v一级毛片| 亚洲一码二码三码区别大吗| 久久97久久精品| 国产又色又爽无遮挡免| 亚洲国产欧美在线一区| 韩国精品一区二区三区| 一区二区三区精品91| 不卡av一区二区三区| 伦理电影大哥的女人| 国产视频首页在线观看| 亚洲第一av免费看| 99精品久久久久人妻精品| 国产精品熟女久久久久浪| 亚洲av电影在线进入| 观看美女的网站| 久久久精品免费免费高清| 日本wwww免费看| 国产亚洲一区二区精品| 最近最新中文字幕大全免费视频 | 一区二区三区乱码不卡18| 性高湖久久久久久久久免费观看| 色视频在线一区二区三区| 亚洲视频免费观看视频| www.精华液| 青春草视频在线免费观看| 日本wwww免费看| www.自偷自拍.com| 日本av免费视频播放| 一边摸一边做爽爽视频免费| 看十八女毛片水多多多| 观看美女的网站| 赤兔流量卡办理| 久久久国产一区二区| 国产亚洲av片在线观看秒播厂| 精品国产乱码久久久久久小说| 在线观看www视频免费| 久久免费观看电影| 久久精品亚洲熟妇少妇任你| 亚洲av日韩精品久久久久久密 | 极品人妻少妇av视频| 欧美 日韩 精品 国产| 日韩av不卡免费在线播放| 久久精品亚洲熟妇少妇任你| 成人亚洲欧美一区二区av| 日韩成人av中文字幕在线观看| 国产精品久久久人人做人人爽| 成人三级做爰电影| 国产亚洲精品第一综合不卡| 日韩不卡一区二区三区视频在线| 激情视频va一区二区三区| 男女边摸边吃奶| 欧美 亚洲 国产 日韩一| 国产精品.久久久| 国产日韩一区二区三区精品不卡| www.av在线官网国产| 在线观看人妻少妇| 国产国语露脸激情在线看| 曰老女人黄片| 亚洲成色77777| av一本久久久久| 精品一区二区三卡| 国产精品秋霞免费鲁丝片| 欧美日韩亚洲高清精品| 国产精品成人在线| 国产精品一区二区精品视频观看| 天堂中文最新版在线下载| 精品久久久精品久久久| www.av在线官网国产| 日韩成人av中文字幕在线观看| 亚洲精华国产精华液的使用体验| 高清av免费在线| 日韩视频在线欧美| 一本色道久久久久久精品综合| 男人舔女人的私密视频| 欧美日韩一级在线毛片| 热re99久久精品国产66热6| 只有这里有精品99| 韩国av在线不卡| 亚洲av欧美aⅴ国产| 亚洲四区av| 欧美日韩一区二区视频在线观看视频在线| 在线观看免费高清a一片| 亚洲在久久综合| 久久热在线av| 少妇被粗大的猛进出69影院| 欧美日韩亚洲国产一区二区在线观看 | 丝袜脚勾引网站| 亚洲欧美精品自产自拍| 一级毛片我不卡| 老司机影院毛片| 丝袜美足系列| 久久精品人人爽人人爽视色| 国产av国产精品国产| 黄片小视频在线播放| 精品第一国产精品| 亚洲精华国产精华液的使用体验| 国产成人啪精品午夜网站| 巨乳人妻的诱惑在线观看| 亚洲成国产人片在线观看| 少妇精品久久久久久久| 少妇人妻 视频| 国产深夜福利视频在线观看| 国产欧美日韩综合在线一区二区| 悠悠久久av| 亚洲色图 男人天堂 中文字幕| 久久精品久久久久久久性| 最新的欧美精品一区二区| 一边摸一边做爽爽视频免费| 免费高清在线观看视频在线观看| 美女福利国产在线| 成人免费观看视频高清| 少妇猛男粗大的猛烈进出视频| 欧美激情极品国产一区二区三区| 观看美女的网站| 99re6热这里在线精品视频| 9色porny在线观看| 精品人妻熟女毛片av久久网站| 黄色怎么调成土黄色| 一本大道久久a久久精品| 美女脱内裤让男人舔精品视频| netflix在线观看网站| 大陆偷拍与自拍| 亚洲欧美清纯卡通| 男女之事视频高清在线观看 | 国产精品人妻久久久影院| 免费黄频网站在线观看国产| 日韩中文字幕视频在线看片| 日韩视频在线欧美| 熟女少妇亚洲综合色aaa.| 青春草视频在线免费观看| 午夜久久久在线观看| 赤兔流量卡办理| 中文字幕最新亚洲高清| 国产伦理片在线播放av一区| 国产成人av激情在线播放| 久久精品国产亚洲av涩爱| 亚洲,一卡二卡三卡| 亚洲人成77777在线视频| 欧美乱码精品一区二区三区| 肉色欧美久久久久久久蜜桃| 99久国产av精品国产电影| 国产成人精品无人区| 日韩 亚洲 欧美在线| 一区二区三区精品91| 欧美日韩亚洲高清精品| 十八禁人妻一区二区| 欧美日韩亚洲高清精品| 久久久精品国产亚洲av高清涩受| 无遮挡黄片免费观看| 欧美日韩亚洲国产一区二区在线观看 | 只有这里有精品99| 欧美 日韩 精品 国产| 日韩制服骚丝袜av| 亚洲欧美色中文字幕在线| 2018国产大陆天天弄谢| 久久毛片免费看一区二区三区| 黑人欧美特级aaaaaa片| 久久精品国产亚洲av涩爱| 一区二区三区四区激情视频| 精品国产一区二区三区久久久樱花| 99久国产av精品国产电影| 亚洲精品视频女| 老汉色∧v一级毛片| 菩萨蛮人人尽说江南好唐韦庄| 国产成人系列免费观看| 亚洲欧洲日产国产| 亚洲国产精品999| 一二三四中文在线观看免费高清| 欧美激情高清一区二区三区 | 成年美女黄网站色视频大全免费| 午夜激情av网站| 免费高清在线观看视频在线观看| 国产欧美日韩一区二区三区在线| 亚洲免费av在线视频| 在线观看免费视频网站a站| 国产一区二区 视频在线| 五月开心婷婷网| 国语对白做爰xxxⅹ性视频网站| 成人毛片60女人毛片免费| 黄网站色视频无遮挡免费观看| 欧美日韩一级在线毛片| 天天躁狠狠躁夜夜躁狠狠躁| √禁漫天堂资源中文www| 十八禁网站网址无遮挡| 精品国产国语对白av| av网站免费在线观看视频| 亚洲精品国产区一区二| 亚洲欧洲国产日韩| 日韩电影二区| 色视频在线一区二区三区| 国产av码专区亚洲av|