• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度強(qiáng)化學(xué)習(xí)的異構(gòu)智能體編隊避障控制方法

    2024-09-15 00:00:00虞逸凡岳圣智徐俊宋婧菡林遠(yuǎn)山
    現(xiàn)代電子技術(shù) 2024年15期
    關(guān)鍵詞:領(lǐng)航者跟隨者異構(gòu)

    摘 "要: 針對在編隊避障控制中智能體個體的異構(gòu)性和多任務(wù)的復(fù)雜性問題,提出一種基于深度強(qiáng)化學(xué)習(xí)的異構(gòu)智能體編隊避障控制方法。首先,為了克服智能體個體的異構(gòu)性,詳細(xì)描述了領(lǐng)航者和跟隨者智能體各自采用的局部觀測表示;其次,根據(jù)智能體的相應(yīng)任務(wù),設(shè)計了編隊、避障和導(dǎo)航三種復(fù)合的綜合獎勵函數(shù),以實現(xiàn)更加靈活和高效的編隊避障控制;最后,設(shè)計了融合注意力機(jī)制的行動者?評論家網(wǎng)絡(luò),用于聯(lián)合訓(xùn)練領(lǐng)航者和跟隨者的運動策略,從而使智能體能夠逐步優(yōu)化綜合策略,以應(yīng)對復(fù)雜的交互信息。數(shù)值仿真實驗結(jié)果顯示,文中提出的方法使得智能體能有效完成各自的任務(wù),與其他強(qiáng)化學(xué)習(xí)算法相比,能夠更迅速、更精確地使智能體學(xué)習(xí)到最優(yōu)的運動策略,并在未來應(yīng)用于復(fù)雜環(huán)境中,具有潛在的前景和價值。

    關(guān)鍵詞: 編隊避障控制; 異構(gòu)性; 多任務(wù); 領(lǐng)航者?跟隨者; 深度強(qiáng)化學(xué)習(xí); 綜合獎勵函數(shù); 注意力機(jī)制; 運動策略

    中圖分類號: TN911.1?34; TP181; TP183 " " " " " " 文獻(xiàn)標(biāo)識碼: A " " " " " " " 文章編號: 1004?373X(2024)15?0102?07

    Heterogeneous agent formation obstacle avoidance control method based on

    deep reinforcement learning

    YU Yifan1, 2, YUE Shengzhi1, 2, XU Jun1, 2, SONG Jinghan1, 2, LIN Yuanshan1, 2

    (1. School of Information Science amp; Engineering, Dalian Ocean University, Dalian 116023, China;

    2. Key Laboratory of Environment Controlled Aquaculture, Ministry of Education, Dalian Ocean University, Dalian 116023, China)

    Abstract: In view of the heterogeneity of individual agents and the complexity of multi?tasks in formation obstacle avoidance control, a heterogeneous agent formation obstacle avoidance control method based on deep reinforcement learning is proposed. The local observation representations adopted by the leader and follower agents are described in detail in order to overcome the heterogeneity of individual agents. According to the corresponding tasks of the agents, three composite reward functions of formation, obstacle avoidance and navigation are designed to achieve more flexible and efficient formation obstacle avoidance control. An actor?critic network integrating attention mechanism is designed for joint training of the motion strategies of the leader and follower, so that the agents can gradually optimize the comprehensive strategy to cope with complex interaction information. Numerical simulation results show that the proposed method enables the agents to complete their respective tasks effectively. In comparison with the other reinforcement learning algorithms, the proposed method can make the agents learn the optimal motion strategy more quickly and accurately, so it has potential prospects and value for future applications in complex environments.

    Keywords: formation obstacle avoidance control; heterogeneity; multi?tasking; leader?follower; deep reinforcement learning; composite reward function; attention mechanism; motion strategy

    0 "引 "言

    在人工智能快速發(fā)展的幾十年內(nèi),多智能體得到了廣泛的研究。編隊避障控制是多智能體系統(tǒng)最基本的功能之一,旨在驅(qū)動智能體形成所需的幾何形狀,并使其在運動過程中躲避障礙物,以更好地適應(yīng)任務(wù)和環(huán)境[1?2]。然而,由于系統(tǒng)的異質(zhì)性、交互信息的局部性限制,適應(yīng)實際任務(wù)的多智能體編隊避障技術(shù)仍然是一個挑戰(zhàn)。

    異構(gòu)智能體一般是指具有不同的參數(shù)和狀態(tài)空間結(jié)構(gòu)的智能體[3],由于在實際系統(tǒng)中不存在兩個動力學(xué)特性完全一致的智能體,因此將其應(yīng)用于編隊避障控制可以充分發(fā)揮每個智能體的特定能力和角色,從而為實現(xiàn)實際任務(wù)獲取更優(yōu)的決策,但與此同時為智能體之間的交互帶來了極大的困難[4]。近些年來,強(qiáng)化學(xué)習(xí)[5?8]利用試錯機(jī)制與環(huán)境進(jìn)行交互學(xué)習(xí)自身的最優(yōu)策略,而無需構(gòu)建精確的運動學(xué)模型的特點,使得學(xué)者逐漸將該方法運用到異構(gòu)編隊控制任務(wù)中,并獲得了較好的成果。文獻(xiàn)[9]采用具有可變學(xué)習(xí)率的[Q(λ)]算法使得智能體能夠?qū)W習(xí)到一種在領(lǐng)導(dǎo)者?跟隨者拓?fù)渲械年犘慰刂撇呗?。文獻(xiàn)[10]針對有領(lǐng)導(dǎo)者的異構(gòu)離散多智能體系統(tǒng)的最優(yōu)一致性問題,提出一種無模型的基于非策略[Q]強(qiáng)化學(xué)習(xí)的控制協(xié)議設(shè)計方法。

    基于以上的研究成果,當(dāng)前項目更深入研究了異構(gòu)智能體編隊、導(dǎo)航問題以及編隊和避障問題,以發(fā)展出更貼近實際應(yīng)用的控制方法。文獻(xiàn)[11]使用基于強(qiáng)化學(xué)習(xí)的分布式最優(yōu)控制方法來解決異構(gòu)無人機(jī)(UAV)編隊軌跡跟蹤問題。文獻(xiàn)[12]針對復(fù)雜環(huán)境的隨機(jī)性,提出一種在不確定環(huán)境下的深度強(qiáng)化學(xué)習(xí)編隊避障控制方法,使得每個智能體通過學(xué)習(xí)能夠有效避開障礙物并到達(dá)各自的期望位置形成隊形。在文獻(xiàn)[13]中,原始傳感器數(shù)據(jù)被用于生成無碰撞轉(zhuǎn)向命令,并在豐富環(huán)境中基于強(qiáng)化學(xué)習(xí)的算法對機(jī)器人進(jìn)行訓(xùn)練,使最終的學(xué)習(xí)策略能夠為導(dǎo)航異構(gòu)機(jī)器人找到時間高效、無碰撞的路徑。

    然而,上述文獻(xiàn)多解決編隊、避障或?qū)Ш街械膯我粏栴},或者僅簡單地將其中兩個問題進(jìn)行組合。即使在采用了穩(wěn)定且易于實現(xiàn)的領(lǐng)航者?跟隨者結(jié)構(gòu)[14?15]的情況下,如何讓不同類型的智能體學(xué)習(xí)一個綜合任務(wù),從而平衡避障和維持編隊的要求,并成功地達(dá)成既定目標(biāo),緩解現(xiàn)實世界中群體控制問題的復(fù)雜性仍然是一項巨大的挑戰(zhàn)。因此,為了解決現(xiàn)有方法在控制異構(gòu)多智能體編隊避障時存在的上述問題,本文提出了一種基于深度強(qiáng)化學(xué)習(xí)的異構(gòu)智能體編隊避障控制方法。

    1 "問題描述

    為了解決非完全合作環(huán)境下的異構(gòu)智能體編隊避障任務(wù),并確定每個智能體的最優(yōu)運動策略。領(lǐng)航者智能體學(xué)習(xí)的運動策略是:帶領(lǐng)編隊中的其他智能體在自身避開障礙物的同時到達(dá)指定目標(biāo)點;而跟隨者智能體學(xué)習(xí)的運動策略是:通過感知信息做出相應(yīng)的動作,以確保在領(lǐng)航者智能體完成任務(wù)期間,自身與其他智能體保持一定的距離,同時在維持隊形穩(wěn)定的前提下有效地避開障礙物。這兩類智能體之間相互影響、相互作用,最終將學(xué)習(xí)到一個能夠完成綜合任務(wù)的最優(yōu)運動策略。

    將上述多智能體編隊避障控制問題表述為強(qiáng)化學(xué)習(xí)問題。對[N]個智能體的強(qiáng)化學(xué)習(xí)過程建模為[N]個馬爾可夫決策過程(MDP)的擴(kuò)展,被定義為元組[N,S,A,O,R,P]。其中:[N]是智能體的數(shù)量;[S]是每個智能體可觀測狀態(tài)的有限集;[A]是所有智能體的動作集合[{AL, AF1,…, AFn}],其中,[AL]是領(lǐng)航者智能體的動作,[AFn]為第[n]個跟隨者智能體的動作;[O]是所有智能體的觀測集合[{OL,OF1,…,OFn}],其中,[OL]是領(lǐng)航者智能體的觀測集,[OFn]是第[n]個跟隨者智能體的觀測集;[P]為狀態(tài)轉(zhuǎn)移函數(shù),是指智能體在當(dāng)前狀態(tài)和動作時下一狀態(tài)的概率分布;[R]為獎勵函數(shù),表示為[Ri:S×AL×AF1×…×AFn→R]。

    基于提出的MDP,可以使用多智能體深度強(qiáng)化學(xué)習(xí)找到解決編隊避障任務(wù)的局部運動策略,即把尋找局部運動策略當(dāng)成最大化其總累積獎勵的優(yōu)化問題,被定義為式(1):

    [maxJiπi=maxEai~πit=0∞γtRitst,At " ] (1)

    式中:[At]是[t]時刻所有智能體的聯(lián)合動作;智能體[i]接收到一個觀測[oi],該觀測[oi]包含來自全局狀態(tài)的部分信息[s∈S];[πi]是第[i]個智能體的局部策略;[γt∈0,1],決定在[t]時刻策略多大程度上傾向于即時獎勵而非長期收益的折扣因子。

    2 "編隊避障控制方法

    2.1 "局部觀測表示

    假設(shè)環(huán)境中存在的靜態(tài)障礙物以及[N( N≥ 2)]個智能體和1個目標(biāo)點均隨機(jī)分布在二維空間的指定范圍內(nèi)。對于跟隨者智能體而言,其局部觀測信息則有以下要素。

    1) 當(dāng)前[t]時刻下,每個智能體[i]都有基于全局坐標(biāo)系下的位置[ptxi,yi],速度[vt=vx,vy];

    2) 在智能體[i]的局部坐標(biāo)系中,任意其他智能體[j]的相對狀態(tài)[si←j=di←j, αij],其中[di←j]是智能體[i]到智能體[j]的歐幾里德距離,[αij]是智能體[i]的航向與其他智能體[j]之間形成的角度;

    3) 與此同時,靜態(tài)障礙物[O]的相對狀態(tài)記為[so←i=di←o,αio]。

    對于領(lǐng)航者智能體而言,除了領(lǐng)導(dǎo)其他智能體和避開障礙物以外,還需要抵達(dá)期望目標(biāo)點,因此它的局部觀測信息還包括當(dāng)前[t]時刻下,在領(lǐng)航者智能體[i]的局部坐標(biāo)系中目標(biāo)點[l]的相對狀態(tài)為[sl←i=di←l,αil]。

    2.2 "動作表示

    為了使工作盡可能接近現(xiàn)實環(huán)境,本文所采用的仿真環(huán)境中所有智能體考慮在二維平面內(nèi)移動,且被視為具有非完整約束的圓,如圖1所示。

    在[t]時刻,每個智能體[i]的位置為[ptxi,yi],在每個時間段[Δt]中,智能體從初始位置[pt]到下個位置[pt+1x'i,y'i]。智能體的速度隨著每個時間段的變化而變化,方向由力[Fi]的方向決定。力是二維向量,其中[Fix]與[Fiy]分別表示智能體[i]在[x]軸和[y]軸上受到的力,動作表示為[Fi=Fix,F(xiàn)iy],相應(yīng)的速度也是一個二維矢量,即[vt=vx,vy]。速度的大小由力[Fi]的大小和智能體自身的質(zhì)量[m]決定。假設(shè)智能體的質(zhì)量都為[m],每個智能體的運動學(xué)方程如式(2)~式(4)所示,其決定了智能體的運動方向和下一時刻的位置。

    [vt+1=FixmdtFiymdt] (2)

    [φt+1=arctanFiyFix] (3)

    [pt+1=vixdtviydt] (4)

    移動過程中,智能體的速度在力的作用下做勻加速運動并達(dá)到最大速度[vmax],如果達(dá)到最大速度,智能體將保持移動速度[vmax]。

    2.3 "獎勵函數(shù)

    在強(qiáng)化學(xué)習(xí)領(lǐng)域中,適當(dāng)選擇獎勵函數(shù)的設(shè)計對系統(tǒng)來說至關(guān)重要,它能決定智能體是否能夠在編隊避障控制問題中有效學(xué)習(xí)。為了在盡可能短的時間內(nèi)實現(xiàn)編隊、導(dǎo)航和避障的綜合任務(wù),獎勵函數(shù)設(shè)計如下:

    [rit=rDit+rGit+rSit] " (5)

    式中,總獎勵[rit]是距離規(guī)則獎勵[rDit]、目標(biāo)到達(dá)獎勵[rGit]和[安全風(fēng)險懲罰rSit]的線性累加。

    距離規(guī)則獎勵[rDit]由隊形獎勵[rFit]和跟隨獎勵[rHit]組成,當(dāng)跟隨者智能體與領(lǐng)航者智能體之間保持要求的歐幾里德距離和跟隨者智能體之間保持一定隊形距離時給予獎勵,否則受到懲罰。

    [rDit=rFit+rHit] (6)

    [rFit=rformation, " "gcbpiF-pjF∈disformation-1, " " " " "otherwise] "(7)

    [rHit=rholding, " " " gcb(piL-piF)∈disholding-1, " " " " " otherwise] (8)

    當(dāng)領(lǐng)航者成功到達(dá)目標(biāo)點時,給予智能體一種稀疏獎勵,即目標(biāo)到達(dá)獎勵[rGit]。

    [rGit=rgoal, " " " gcbpiL-ptlt;ragent0, " " " " " otherwise] (9)

    為了確保智能體與障礙物或合作者之間避免發(fā)生碰撞,當(dāng)智能體與障礙物或合作者發(fā)生碰撞時,對智能體施加安全風(fēng)險懲罰[rSit]。

    [rSit=rsafe, " " gcbpip-pko≤ragent+robstacle " " " " " "or "gcbpip-pjp≤2disagent0, " " otherwise] (10)

    式中:[piL]定義為領(lǐng)航者智能體坐標(biāo);[pi,jF]定義為跟隨者智能體坐標(biāo);[pko]為障礙物坐標(biāo),[k∈0,1,2,…,n];[pt]為目標(biāo)坐標(biāo);[disformation]是設(shè)定在一定范圍內(nèi)的編隊距離;[disholding]是設(shè)定在一定范圍內(nèi)的領(lǐng)航者和跟隨者間的距離;[ragent]、[rgoal]、[robstacle]分別為智能體、目標(biāo)和障礙物的半徑,領(lǐng)航者智能體和跟隨者智能體半徑相同;[gcb(a,b)]用于計算位置[a]和位置[b]的歐幾里德距離。

    2.4 "融合注意力機(jī)制的行動者?評論家網(wǎng)絡(luò)

    本文將軟行動者?評論家[16](Soft Actor?Critic, SAC)與注意力機(jī)制方法相結(jié)合,提出一種基于行動者?注意力?評論家的多智能體強(qiáng)化學(xué)習(xí)算法(Soft Actor?Attention?Critic, SAAC)。

    在評論家中,輸入由所有智能體的觀測和動作組成,具體來說,是由當(dāng)前智能體觀測和動作的嵌入函數(shù)和其他智能體進(jìn)行注意力計算得到的嵌入向量;輸出為每個動作的動作值函數(shù)。

    [Qψio,a=figioi,ai,xi] " (11)

    式中:[fi]是一個兩層多層感知機(jī)(Multi?layer Perceptron, MLP);[gi]是一個單層MLP嵌入函數(shù);[xi]是每個智能體動作值的加權(quán)和,也就是來自其他智能體的貢獻(xiàn)。

    [xi=j≠iαjvj=j≠iαjhVgjoj,aj] "(12)

    將所有智能體定義為[i∈1,2,…,N]的集合,將所有除[i]以外的智能體定義為[\i]的集合,并將該集合中的任意智能體定義為[j]。[gj]是智能體[j]的嵌入函數(shù),用嵌入函數(shù)對其進(jìn)行編碼,然后由共享矩陣[V]進(jìn)行線性變換。[h]是一個激活函數(shù)(使用Leaky ReLU函數(shù))。注意力權(quán)重[αj]對其他智能體進(jìn)行注意力計算[17],比較嵌入函數(shù)[ei=gioi,ai]和[ej],獲得其相似度。

    每一個智能體都有一個獨立的評論家,注意力機(jī)制接受每個智能體編碼其觀測和動作,并接收其他智能體編碼的加權(quán)和,如圖2所示。

    因此,對于任意的一個智能體[i],當(dāng)前評論家網(wǎng)絡(luò)根據(jù)式(13)、式(14)更新:

    [LQψ=i=1NE(o,a,r,o')~DQψio,a-yi2] (13)

    [yi=ri+γEa'~πθ(o')Qψio',a'-αlogπθa'io'i " "] (14)

    式中:[ψ]和[θ]分別是目標(biāo)批評家和目標(biāo)策略的參數(shù);[α]是決定最大化熵和獎勵之間平衡的溫度參數(shù);[LQψ]是智能體[i]的評論家當(dāng)前網(wǎng)絡(luò)的損失函數(shù);[yi]是智能體[i]的目標(biāo)[Q]值。

    同時,在行動者?注意力?評論家中,每個智能體的行動者使用隨機(jī)性策略,輸入是所有智能體的觀測,輸出是每個動作的分布,并且動作是從當(dāng)前的策略函數(shù)進(jìn)行采樣的。當(dāng)前行動者網(wǎng)絡(luò)通過式(15)進(jìn)行優(yōu)化:

    [?θiJ=Es~D,a~π?θilogπθiaioi?-αlogπθiaioi+Qψio,a] " (15)

    目標(biāo)網(wǎng)絡(luò)的參數(shù)采用軟更新方式,如式(16)所示:

    [ψ=τψ+1-τψθ=τθ+1-τθ] " "(16)

    3 "仿真與結(jié)果

    3.1 "實驗環(huán)境介紹

    本文的多智能體編隊避障控制的實驗環(huán)境如圖3所示,總共有4個半徑為0.05 m的圓形智能體,包括1個領(lǐng)航者智能體和3個跟隨者智能體。訓(xùn)練期間在[x∈-1, 0 m]、[y∈-1, 0 ]m范圍內(nèi)隨機(jī)出現(xiàn),且最大速度限制為[0.3 m/s]。為了保證訓(xùn)練難度與真實環(huán)境盡可能相符,目標(biāo)點在[x∈0.5, 1 m]、[y∈0.5, 1 m]范圍內(nèi)隨機(jī)出現(xiàn)。為了使智能體得到具有一定擴(kuò)展性的避障策略,將障礙物定義為半徑在[0.03, 0.07 ]范圍內(nèi)的隨機(jī)圓,并隨機(jī)出現(xiàn)在[x∈-0.2, 0.2 m],[y∈-0.2, 0.2 m]范圍內(nèi)。通過在每一回合開始時對智能體、障礙物和地標(biāo)的狀態(tài)隨機(jī)初始化來增加任務(wù)的多樣性。

    3.2 "有效性驗證

    為了驗證智能體在學(xué)習(xí)編隊避障策略時是否收斂,利用SAAC算法對智能體的策略進(jìn)行60 000個回合的訓(xùn)練。

    所訓(xùn)練的跟隨者智能體在每個回合內(nèi)所獲得的總獎勵曲線情況如圖4所示。

    圖4中的插圖是智能體在訓(xùn)練的不同階段所表現(xiàn)出的學(xué)習(xí)效果圖,這些插圖發(fā)生在相應(yīng)回合數(shù)中的最后幾個時間步。通過本文提出的方法,智能體群逐漸學(xué)習(xí)到編隊、導(dǎo)航和避障的策略,學(xué)習(xí)過程逐漸收斂,最終可以得到穩(wěn)定的編隊避障控制策略。

    為了驗證智能體習(xí)得的編隊避障策略的有效性,使用SAAC算法對智能體的策略進(jìn)行訓(xùn)練后得到?jīng)Q策模型,通過可視化測試階段智能體群的軌跡圖來判斷該方法是否有效。在測試階段,將初始條件設(shè)定為目標(biāo)點在地圖的右上角隨機(jī)產(chǎn)生;障礙物在地圖中央隨機(jī)初始化;智能體在地圖的左下角隨機(jī)初始化。4個智能體在140個時間步中的軌跡如圖5所示。本文方法訓(xùn)練智能體得到?jīng)Q策模型,其學(xué)習(xí)到的運動策略可以得到穩(wěn)定的編隊避障控制,驗證了本文方法的有效性。

    3.3 "性能對比

    為了驗證本文算法的性能,將其與用于編隊避障的DDPG、MADDPG、MATD3等較為經(jīng)典的強(qiáng)化學(xué)習(xí)算法進(jìn)行對比,當(dāng)群體規(guī)模大小為4時,使用這四種算法訓(xùn)練的編隊智能體在每個回合下獲得的獎勵曲線如圖6所示。在本文的編隊避障控制任務(wù)下,與其他三種算法相比,本文方法能夠更快獲得成功的經(jīng)驗,學(xué)習(xí)速率更快,擁有更好的訓(xùn)練效果。

    在綜合策略性能對比中,分別對三種算法在1 000次測試中的成功率、平均路徑長度和平均運行時間進(jìn)行了評估。成功率表示智能體群在領(lǐng)航者智能體的引導(dǎo)下,成功避開障礙并到達(dá)目標(biāo)點的次數(shù)占總測試次數(shù)的百分比。平均路徑長度和平均運行時間分別是指領(lǐng)航者智能體從初始點出發(fā),在避免碰撞的情況下,每次成功到達(dá)目標(biāo)點時路徑長度和運行時間的平均值。

    鑒于DDPG算法下的智能體群難以學(xué)習(xí)到提出的綜合策略,因此不需要進(jìn)一步對其性能進(jìn)行比較。其余三種算法下的綜合策略評估結(jié)果如表1所示。從表中可以清晰地看出,本文方法實現(xiàn)了更高的成功率、更短的平均路徑長度以及更快的平均運行時間,在綜合策略性能方面表現(xiàn)出色。

    通過對兩類智能體設(shè)計的距離規(guī)則、任務(wù)標(biāo)準(zhǔn)以及安全風(fēng)險,將該綜合策略精簡為編隊策略、任務(wù)策略和避障策略并分別進(jìn)行驗證對比。

    為了評估三種算法下智能體群所習(xí)得的編隊策略性能,使用其在測試期間執(zhí)行任務(wù)時的平均編隊誤差和進(jìn)行評判。編隊誤差指的是智能體彼此之間保持的實際距離與距離規(guī)則要求距離間的差距。在實際環(huán)境中智能體幾乎不可能存在按照固定距離進(jìn)行移動,因此允許智能體之間的距離存在微小形變,即距離規(guī)則是一個具有較小差距的范圍。由于智能體、地標(biāo)和障礙物的初始狀態(tài)具有一定隨機(jī)性,因此對模型進(jìn)行1 000次測試,并對智能體間的編隊誤差和求均值,三種算法中4個智能體彼此之間的平均編隊誤差和如圖7所示。本文方法能夠更快地形成隊形,并保持更穩(wěn)定的隊形進(jìn)行運動。

    為了評估三種算法在智能體群習(xí)得導(dǎo)航和避障策略方面的性能,采用兩個指標(biāo)來衡量其表現(xiàn),即在測試期間執(zhí)行任務(wù)時,領(lǐng)航者智能體成功抵達(dá)目標(biāo)點的次數(shù)以及智能體與障礙物發(fā)生碰撞的次數(shù)。在測試時期采用與訓(xùn)練時期相同的智能體、障礙物和目標(biāo)點設(shè)置,進(jìn)行了1 000次測試,領(lǐng)航者智能體到達(dá)目標(biāo)點的次數(shù)以及智能體與障礙物發(fā)生碰撞的次數(shù)如表2所示。這表明與其他兩種算法相比,本文方法在智能體群的運動過程中能夠更好地避免碰撞,并確保每次都能夠成功到達(dá)目標(biāo)點。

    4 "結(jié) "論

    為了智能體能夠?qū)W習(xí)到具有編隊、避碰和導(dǎo)航功能的綜合策略,本文提出一種基于深度強(qiáng)化學(xué)習(xí)的異構(gòu)智能體編隊避障控制方法。通過對領(lǐng)航者與跟隨者智能體設(shè)計不同的局部觀測表示以緩解智能體個體的異構(gòu)性,并對其分別設(shè)計能夠完成相應(yīng)任務(wù)的獎勵函數(shù)以實現(xiàn)更加靈活和高效的編隊避障控制。通過融合注意力機(jī)制的行動者?評論家網(wǎng)絡(luò)訓(xùn)練,使得智能體能夠自主學(xué)習(xí)到穩(wěn)定的編隊避障控制策略。本文提出的方法與其余四種基線算法相比,具有更快的收斂速度,能夠?qū)W習(xí)到更好的運動策略,有望應(yīng)用于不同規(guī)模的集群編隊以及復(fù)雜環(huán)境的編隊控制中。

    注:本文通訊作者為林遠(yuǎn)山。

    參考文獻(xiàn)

    [1] 杜康豪,宋睿卓,魏慶來.強(qiáng)化學(xué)習(xí)在機(jī)器博弈上的應(yīng)用綜述[J].控制工程,2021,28(10):1998?2004.

    [2] SHI P, YAN B. A survey on intelligent control for multiagent systems [J]. IEEE transactions on systems, man, and cybernetics: Systems, 2021, 51(1): 161?175.

    [3] YAN B, SHI P, LIM C, et al. Optimal robust formation control for heterogeneous multi?agent systems based on reinforcement learning [J]. International journal of robust amp; nonlinear control, 2021, 32(5): 2683?2704.

    [4] 于家興,魏海平,金麗娜,等.基于模型參考的異構(gòu)多智能體平均一致性[J].計算機(jī)應(yīng)用,2019,39(4):1240?1246.

    [5] ZHANG Y, ZHANG Z F, YANG Q Y, et al. EV charging bidding by multi?DQN reinforcement learning in electricity auction market [J]. Neurocomputing, 2020, 397: 404?414.

    [6] LIU K, ZHAO Y Y, WANG G, et al. Self?attention?based multi?agent continuous control method in cooperative environments [J]. Information sciences, 2022, 585: 454?470.

    [7] HUNG S M, GIVIGI S N. A Q?learning approach to flocking with UAVs in a stochastic environment [J]. IEEE transactions on cybernetics, 2017, 47(1): 186?197.

    [8] 張海峰,簡燕紅,王宏剛,等.基于優(yōu)化強(qiáng)化學(xué)習(xí)的多智能體編隊最優(yōu)控制[J].控制工程,2022,29(12):2316?2321.

    [9] KNOPP M, AYKIN C, FELDMAIER J, et al. Formation control using GQ(λ) reinforcement learning [C]// 2017 26th IEEE International Symposium on Robot and Human Interactive Communication (RO?MAN). New York: IEEE, 2017: 1043?1048.

    [10] 程薇燃,李金娜.基于Q學(xué)習(xí)的異構(gòu)多智能體系統(tǒng)最優(yōu)一致性[J].遼寧石油化工大學(xué)學(xué)報,2022,42(4):59?67.

    [11] LIU H, MENG Q Y, PENG F C, et al. Heterogeneous formation control of multiple UAVs with limited?input leader via reinforcement learning [J]. Neurocomputing, 2020, 412: 63?71.

    [12] 禹鑫燚,杜丹楓,歐林林.不確定環(huán)境下的深度強(qiáng)化學(xué)習(xí)編隊避障控制[J].高技術(shù)通訊,2022,32(8):836?844.

    [13] LONG P X, FAN T X, LIAO X Y, et al. Towards optimally decentralized multi?robot collision avoidance via deep reinforcement learning [C]// IEEE International Conference on Robotics and Automation (ICRA). New York: IEEE, 2018: 6252?6259.

    [14] SUI Z Z, PU Z Q, YI J Q, et al. Formation control with collision avoidance through deep reinforcement learning using model?guided demonstration [J]. IEEE transactions on neural networks and learning systems, 2020, 32(6): 2358?2372.

    [15] DIALLO E A O, SUGAWARA T. Multi?agent pattern formation: A distributed model?free deep reinforcement learning approach [C]// 2020 International Joint Conference on Neural Networks (IJCNN). New York: IEEE, 2020: 1?8.

    [16] HAARNOJA T, ZHOU A, ABBEEL P, et al. Soft actor?critic: Off?policy maximum entropy deep reinforcement learning with a stochastic actor [C]// Proceedings of the 35th International Conference on Machine Learning. New York: PMLR, 2018: 1856?1865.

    [17] VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need [C]// Proceedings of the 31st International Conference on Neural Information Processing Systems. Red Hook, NY: Curran Associates Inc., 2017: 5998?6008.

    作者簡介:虞逸凡(1999—),男,浙江紹興人,碩士研究生,研究方向為人工智能、多智能體強(qiáng)化學(xué)習(xí)、編隊控制。

    岳圣智(1999—),男,遼寧撫順人,碩士研究生,研究方向為人工智能、強(qiáng)化學(xué)習(xí)、多目標(biāo)追蹤。

    徐 "?。?999—),男,河南駐馬店人,碩士研究生,研究方向為人工智能、強(qiáng)化學(xué)習(xí)、對抗博弈。

    宋婧菡(1996—),女,遼寧大連人,碩士研究生,研究方向為強(qiáng)化學(xué)習(xí)。

    林遠(yuǎn)山(1982—),男,廣西貴港人,工學(xué)博士,副教授,研究方向為機(jī)器人運動規(guī)劃、機(jī)器人學(xué)習(xí)等。

    猜你喜歡
    領(lǐng)航者跟隨者異構(gòu)
    漁船的“領(lǐng)航者”和“安全衛(wèi)士”
    智慧少年(2022年8期)2022-05-30 10:48:04
    試論同課異構(gòu)之“同”與“異”
    “益源慶”打造中國高品質(zhì)食醋領(lǐng)航者
    IC訪談:“智慧政府”領(lǐng)航者——新華三集團(tuán)
    智能城市(2018年8期)2018-07-06 01:11:00
    由城市臺的“跟隨者”到縣域“三農(nóng)”媒體的 “領(lǐng)導(dǎo)者”
    中國廣播(2017年9期)2017-09-30 21:05:19
    做純棉數(shù)碼印花領(lǐng)航者
    從“跟隨者”到“引領(lǐng)者”
    —— 甕福集團(tuán)PPA項目成為攪動市場的“鯰魚”
    跟隨者
    詩潮(2017年5期)2017-06-01 11:29:51
    overlay SDN實現(xiàn)異構(gòu)兼容的關(guān)鍵技術(shù)
    LTE異構(gòu)網(wǎng)技術(shù)與組網(wǎng)研究
    a级毛片a级免费在线| 国产伦一二天堂av在线观看| 国产99久久九九免费精品| 脱女人内裤的视频| 可以在线观看毛片的网站| 精品国产乱子伦一区二区三区| 一级毛片女人18水好多| 国产精品永久免费网站| 成人高潮视频无遮挡免费网站| 欧美日韩黄片免| 欧美黑人精品巨大| 日韩av在线大香蕉| 亚洲免费av在线视频| 国产99久久九九免费精品| 国产精品久久久久久久电影 | 女同久久另类99精品国产91| 天天躁狠狠躁夜夜躁狠狠躁| 国产精品精品国产色婷婷| 好男人在线观看高清免费视频| 亚洲av电影不卡..在线观看| 岛国在线观看网站| 午夜影院日韩av| 麻豆久久精品国产亚洲av| 黄色女人牲交| cao死你这个sao货| 亚洲国产精品久久男人天堂| 黄色成人免费大全| av国产免费在线观看| 亚洲狠狠婷婷综合久久图片| 国产亚洲欧美98| 黄色毛片三级朝国网站| 亚洲成人久久性| 精品乱码久久久久久99久播| 精品欧美国产一区二区三| 高清在线国产一区| 欧美不卡视频在线免费观看 | 国产又黄又爽又无遮挡在线| 欧美三级亚洲精品| 日韩欧美三级三区| 1024手机看黄色片| 成人精品一区二区免费| 波多野结衣高清无吗| 免费高清视频大片| 好男人在线观看高清免费视频| 一本精品99久久精品77| 又紧又爽又黄一区二区| 18禁国产床啪视频网站| 欧美成狂野欧美在线观看| 国产片内射在线| 欧美 亚洲 国产 日韩一| 久久精品人妻少妇| 亚洲av美国av| 香蕉国产在线看| 级片在线观看| 国产精品国产高清国产av| 精品久久久久久,| 免费高清视频大片| 18禁黄网站禁片午夜丰满| 久久国产精品人妻蜜桃| 每晚都被弄得嗷嗷叫到高潮| 91成年电影在线观看| av福利片在线| 亚洲av成人一区二区三| 欧美一区二区精品小视频在线| 草草在线视频免费看| 大型av网站在线播放| 欧美3d第一页| 香蕉久久夜色| 亚洲国产精品sss在线观看| 日韩欧美免费精品| 久久草成人影院| 欧美性长视频在线观看| 久久亚洲精品不卡| 午夜福利视频1000在线观看| 天堂av国产一区二区熟女人妻 | a级毛片在线看网站| 校园春色视频在线观看| 在线观看免费视频日本深夜| 88av欧美| 狂野欧美白嫩少妇大欣赏| 成人欧美大片| 午夜福利高清视频| 国产黄a三级三级三级人| 真人一进一出gif抽搐免费| 国产精品一区二区免费欧美| 国产爱豆传媒在线观看 | 欧美精品啪啪一区二区三区| 久久精品夜夜夜夜夜久久蜜豆 | 天天一区二区日本电影三级| 国产高清激情床上av| 男女之事视频高清在线观看| 日本三级黄在线观看| av免费在线观看网站| 欧美黑人精品巨大| 制服诱惑二区| 波多野结衣巨乳人妻| 日本免费一区二区三区高清不卡| 亚洲狠狠婷婷综合久久图片| 国产69精品久久久久777片 | 国产欧美日韩一区二区三| 1024视频免费在线观看| 久久午夜综合久久蜜桃| ponron亚洲| 久久精品影院6| 最近在线观看免费完整版| 国产激情欧美一区二区| 波多野结衣高清无吗| 叶爱在线成人免费视频播放| 久久久久久亚洲精品国产蜜桃av| 国产乱人伦免费视频| 两个人免费观看高清视频| 亚洲精华国产精华精| 国产精品永久免费网站| 一区二区三区高清视频在线| 叶爱在线成人免费视频播放| 欧美中文综合在线视频| 亚洲精品在线美女| 亚洲性夜色夜夜综合| 国产区一区二久久| 午夜激情av网站| 国产精品久久久久久精品电影| 淫秽高清视频在线观看| 婷婷丁香在线五月| 国产精品久久久久久久电影 | 亚洲成人中文字幕在线播放| 欧美在线一区亚洲| 亚洲欧洲精品一区二区精品久久久| 亚洲专区国产一区二区| 亚洲精品美女久久久久99蜜臀| 成年人黄色毛片网站| 久久午夜综合久久蜜桃| 99久久久亚洲精品蜜臀av| 国产午夜精品久久久久久| 国产成人aa在线观看| 国产激情久久老熟女| 窝窝影院91人妻| 日韩精品中文字幕看吧| 久久欧美精品欧美久久欧美| 国产欧美日韩精品亚洲av| 一级片免费观看大全| 免费看日本二区| 欧美国产日韩亚洲一区| 国产1区2区3区精品| 国产精品一区二区精品视频观看| 亚洲 国产 在线| 国产精品av视频在线免费观看| 黄色视频,在线免费观看| 91国产中文字幕| 色综合欧美亚洲国产小说| 国产1区2区3区精品| 一区二区三区激情视频| 色老头精品视频在线观看| 久久久久久免费高清国产稀缺| 国产精品久久久久久精品电影| 免费看美女性在线毛片视频| 别揉我奶头~嗯~啊~动态视频| 91老司机精品| 精品人妻1区二区| 搡老妇女老女人老熟妇| 久久久久久久久免费视频了| 国产精品综合久久久久久久免费| 亚洲欧美一区二区三区黑人| 国产精品电影一区二区三区| 精品人妻1区二区| 欧美在线一区亚洲| 国内精品久久久久精免费| 99国产极品粉嫩在线观看| 两个人视频免费观看高清| 法律面前人人平等表现在哪些方面| 又紧又爽又黄一区二区| 99国产综合亚洲精品| 日韩欧美在线二视频| 国产午夜福利久久久久久| 亚洲国产欧美人成| 日韩欧美在线二视频| 我的老师免费观看完整版| 国产亚洲精品久久久久5区| 欧美中文综合在线视频| 嫩草影视91久久| 欧美成人性av电影在线观看| 日韩大尺度精品在线看网址| www日本黄色视频网| 日韩大码丰满熟妇| 中文字幕高清在线视频| 亚洲片人在线观看| 亚洲人与动物交配视频| 国产精品免费视频内射| 亚洲av日韩精品久久久久久密| www国产在线视频色| 三级男女做爰猛烈吃奶摸视频| 黄色视频不卡| √禁漫天堂资源中文www| 亚洲一区二区三区色噜噜| a级毛片a级免费在线| 校园春色视频在线观看| 久久精品人妻少妇| 俺也久久电影网| 精品高清国产在线一区| 巨乳人妻的诱惑在线观看| 丝袜人妻中文字幕| 亚洲va日本ⅴa欧美va伊人久久| 亚洲成人国产一区在线观看| 久久精品国产99精品国产亚洲性色| 久久国产精品影院| 我要搜黄色片| 观看免费一级毛片| www日本黄色视频网| 给我免费播放毛片高清在线观看| 韩国av一区二区三区四区| 在线永久观看黄色视频| e午夜精品久久久久久久| 在线观看66精品国产| 国产亚洲欧美在线一区二区| 色尼玛亚洲综合影院| 少妇粗大呻吟视频| 这个男人来自地球电影免费观看| 国产伦在线观看视频一区| 国产91精品成人一区二区三区| 中文字幕精品亚洲无线码一区| 欧美激情久久久久久爽电影| 亚洲国产欧美人成| 制服人妻中文乱码| 午夜福利在线在线| 午夜精品在线福利| 婷婷亚洲欧美| 丝袜美腿诱惑在线| 国产日本99.免费观看| 精品高清国产在线一区| 女人高潮潮喷娇喘18禁视频| 久久久久久大精品| 18禁黄网站禁片午夜丰满| 亚洲午夜精品一区,二区,三区| 老汉色av国产亚洲站长工具| 亚洲男人的天堂狠狠| 亚洲成人久久性| av视频在线观看入口| 国产成人av激情在线播放| 久久人人精品亚洲av| 在线观看免费日韩欧美大片| 婷婷亚洲欧美| 亚洲九九香蕉| 啦啦啦韩国在线观看视频| 美女免费视频网站| 国产成人一区二区三区免费视频网站| 三级男女做爰猛烈吃奶摸视频| 亚洲av电影在线进入| 成人18禁在线播放| 欧美av亚洲av综合av国产av| 可以在线观看的亚洲视频| 老熟妇乱子伦视频在线观看| 听说在线观看完整版免费高清| 正在播放国产对白刺激| 丁香欧美五月| 美女 人体艺术 gogo| 一二三四在线观看免费中文在| 国产精品日韩av在线免费观看| 亚洲国产中文字幕在线视频| 国产野战对白在线观看| 亚洲一卡2卡3卡4卡5卡精品中文| 亚洲专区国产一区二区| 两个人视频免费观看高清| 国产av麻豆久久久久久久| 久久这里只有精品中国| 夜夜夜夜夜久久久久| 久久国产精品影院| 欧美zozozo另类| 久久久久久久久中文| 久久中文看片网| 首页视频小说图片口味搜索| 男人舔女人的私密视频| 毛片女人毛片| 一边摸一边做爽爽视频免费| 免费人成视频x8x8入口观看| 国产伦一二天堂av在线观看| 露出奶头的视频| 欧美大码av| 18禁黄网站禁片免费观看直播| 别揉我奶头~嗯~啊~动态视频| 国产精品98久久久久久宅男小说| 日日干狠狠操夜夜爽| 男男h啪啪无遮挡| 国产精品久久久人人做人人爽| 成人国语在线视频| 欧美又色又爽又黄视频| 欧美日韩福利视频一区二区| 在线a可以看的网站| 国产亚洲精品久久久久5区| 窝窝影院91人妻| 香蕉av资源在线| 成人国语在线视频| 人人妻人人澡欧美一区二区| 操出白浆在线播放| 999精品在线视频| 中亚洲国语对白在线视频| 亚洲国产日韩欧美精品在线观看 | 亚洲欧美日韩无卡精品| 国产麻豆成人av免费视频| 亚洲电影在线观看av| 成人午夜高清在线视频| 欧美绝顶高潮抽搐喷水| 中文字幕熟女人妻在线| 天堂av国产一区二区熟女人妻 | 欧美日韩亚洲国产一区二区在线观看| 人人妻人人澡欧美一区二区| x7x7x7水蜜桃| 12—13女人毛片做爰片一| 在线观看午夜福利视频| 黄色成人免费大全| 国产精品久久视频播放| 色老头精品视频在线观看| 舔av片在线| 久久久久久九九精品二区国产 | 在线观看66精品国产| 日本a在线网址| 中文字幕高清在线视频| 国产亚洲欧美在线一区二区| 可以在线观看毛片的网站| 欧美黑人欧美精品刺激| 美女扒开内裤让男人捅视频| 美女免费视频网站| 精品日产1卡2卡| 久久欧美精品欧美久久欧美| 美女 人体艺术 gogo| 999精品在线视频| www.www免费av| 亚洲一区中文字幕在线| 18禁美女被吸乳视频| 9191精品国产免费久久| 亚洲无线在线观看| 免费一级毛片在线播放高清视频| 亚洲精品粉嫩美女一区| 中文字幕久久专区| 免费高清视频大片| 免费观看精品视频网站| 免费在线观看完整版高清| 法律面前人人平等表现在哪些方面| 国产成人系列免费观看| 精品久久蜜臀av无| 97人妻精品一区二区三区麻豆| 久久久精品国产亚洲av高清涩受| 97碰自拍视频| 国产成人一区二区三区免费视频网站| 又粗又爽又猛毛片免费看| 国产欧美日韩一区二区精品| 老司机靠b影院| 久久久久国内视频| av福利片在线观看| 男女视频在线观看网站免费 | 国产亚洲av嫩草精品影院| av免费在线观看网站| 99国产精品一区二区蜜桃av| 又黄又爽又免费观看的视频| 99国产精品一区二区蜜桃av| 色老头精品视频在线观看| 18禁美女被吸乳视频| 一本综合久久免费| 国产精品av久久久久免费| 亚洲精品av麻豆狂野| www.999成人在线观看| 一本精品99久久精品77| 免费在线观看完整版高清| 正在播放国产对白刺激| 亚洲成人国产一区在线观看| 国产在线精品亚洲第一网站| 欧美黄色片欧美黄色片| 高潮久久久久久久久久久不卡| 免费电影在线观看免费观看| 欧美久久黑人一区二区| 十八禁网站免费在线| 最新美女视频免费是黄的| 午夜免费观看网址| 男女那种视频在线观看| 88av欧美| 国产探花在线观看一区二区| 19禁男女啪啪无遮挡网站| 中文字幕高清在线视频| 国产精品久久久久久精品电影| 蜜桃久久精品国产亚洲av| 日韩 欧美 亚洲 中文字幕| 国产成人欧美在线观看| 精华霜和精华液先用哪个| 国产区一区二久久| 成人三级黄色视频| 成人亚洲精品av一区二区| av国产免费在线观看| 婷婷丁香在线五月| 久久精品aⅴ一区二区三区四区| 精品久久久久久成人av| 国产高清激情床上av| 高清在线国产一区| 免费在线观看完整版高清| 久久国产精品人妻蜜桃| 国产欧美日韩精品亚洲av| 啦啦啦观看免费观看视频高清| www.999成人在线观看| 人妻丰满熟妇av一区二区三区| 中文字幕人妻丝袜一区二区| 欧美最黄视频在线播放免费| 亚洲无线在线观看| 欧美日韩国产亚洲二区| 黄频高清免费视频| 久热爱精品视频在线9| 这个男人来自地球电影免费观看| 动漫黄色视频在线观看| 久99久视频精品免费| 久久精品人妻少妇| 欧美中文日本在线观看视频| 国产成人系列免费观看| 欧美国产日韩亚洲一区| 99精品欧美一区二区三区四区| 看免费av毛片| 国产精品精品国产色婷婷| 国产免费男女视频| 久久久久久久精品吃奶| 一边摸一边做爽爽视频免费| 后天国语完整版免费观看| 亚洲中文字幕一区二区三区有码在线看 | 色综合亚洲欧美另类图片| svipshipincom国产片| 一进一出好大好爽视频| 欧美久久黑人一区二区| 国产午夜精品久久久久久| 成人精品一区二区免费| 日本免费a在线| 特级一级黄色大片| 老鸭窝网址在线观看| 又紧又爽又黄一区二区| 亚洲欧美日韩高清专用| 国产三级中文精品| 亚洲免费av在线视频| 国产在线观看jvid| 国产精品久久电影中文字幕| 免费电影在线观看免费观看| 日日爽夜夜爽网站| 久久久精品欧美日韩精品| 不卡av一区二区三区| 久久久久久久精品吃奶| 久久精品91蜜桃| 午夜精品在线福利| 神马国产精品三级电影在线观看 | 久久天堂一区二区三区四区| 淫妇啪啪啪对白视频| 黄色视频不卡| 免费在线观看视频国产中文字幕亚洲| av超薄肉色丝袜交足视频| 精品国产亚洲在线| 黄色片一级片一级黄色片| 久久性视频一级片| 99久久久亚洲精品蜜臀av| 老司机午夜十八禁免费视频| 亚洲成人精品中文字幕电影| 欧美成人免费av一区二区三区| 在线永久观看黄色视频| 一级毛片女人18水好多| 九九热线精品视视频播放| 亚洲一区二区三区不卡视频| 亚洲aⅴ乱码一区二区在线播放 | 很黄的视频免费| 日韩成人在线观看一区二区三区| 成人亚洲精品av一区二区| 亚洲成人国产一区在线观看| 国产1区2区3区精品| 欧美日韩乱码在线| 国产精品99久久99久久久不卡| 亚洲国产精品成人综合色| 亚洲电影在线观看av| 国产成人av教育| 丁香欧美五月| 欧美大码av| 亚洲中文av在线| 欧美日韩国产亚洲二区| 精品久久久久久久末码| 老汉色∧v一级毛片| 午夜激情福利司机影院| 国产又色又爽无遮挡免费看| 九色国产91popny在线| 麻豆国产97在线/欧美 | 亚洲av电影在线进入| 亚洲最大成人中文| 亚洲五月婷婷丁香| 波多野结衣高清无吗| 亚洲av电影不卡..在线观看| 欧美黑人欧美精品刺激| 麻豆一二三区av精品| 久久中文字幕一级| 精品福利观看| 最近在线观看免费完整版| 最好的美女福利视频网| 国内久久婷婷六月综合欲色啪| 亚洲av成人av| 久久久久免费精品人妻一区二区| av超薄肉色丝袜交足视频| 久久婷婷成人综合色麻豆| 国产区一区二久久| 欧美午夜高清在线| 一级毛片精品| 欧美zozozo另类| 亚洲一区二区三区色噜噜| 国产97色在线日韩免费| 久久精品aⅴ一区二区三区四区| 看免费av毛片| 51午夜福利影视在线观看| 亚洲国产高清在线一区二区三| 女警被强在线播放| av国产免费在线观看| 精品久久久久久久久久免费视频| 丝袜美腿诱惑在线| 精品不卡国产一区二区三区| 三级毛片av免费| 国内揄拍国产精品人妻在线| 日日夜夜操网爽| 日本免费a在线| 夜夜看夜夜爽夜夜摸| 午夜激情福利司机影院| 久久精品国产亚洲av香蕉五月| 免费观看精品视频网站| 久久精品国产亚洲av高清一级| 亚洲国产高清在线一区二区三| x7x7x7水蜜桃| 日韩欧美一区二区三区在线观看| 日日爽夜夜爽网站| 色播亚洲综合网| 久久香蕉精品热| 热99re8久久精品国产| 欧美黑人精品巨大| 波多野结衣巨乳人妻| 一级片免费观看大全| 婷婷亚洲欧美| tocl精华| 精品人妻1区二区| 亚洲成av人片免费观看| 亚洲真实伦在线观看| 久久久久久亚洲精品国产蜜桃av| 美女免费视频网站| 国产片内射在线| 嫩草影院精品99| 欧美成人午夜精品| 欧美色欧美亚洲另类二区| 亚洲国产精品999在线| 黄色a级毛片大全视频| 久久中文字幕人妻熟女| 久久久久国产精品人妻aⅴ院| 一级作爱视频免费观看| 亚洲精品久久成人aⅴ小说| 亚洲天堂国产精品一区在线| 国产精品av久久久久免费| 成人特级黄色片久久久久久久| 午夜精品在线福利| 一级a爱片免费观看的视频| 国内精品久久久久精免费| 亚洲激情在线av| 中文字幕高清在线视频| 在线观看午夜福利视频| 亚洲成人久久性| 国产精品久久电影中文字幕| 久久久国产精品麻豆| 欧美 亚洲 国产 日韩一| 亚洲欧美日韩高清专用| 国产精品香港三级国产av潘金莲| 国产激情久久老熟女| 国产精品九九99| 亚洲精品一卡2卡三卡4卡5卡| 亚洲五月婷婷丁香| 美女免费视频网站| 男人的好看免费观看在线视频 | 日本撒尿小便嘘嘘汇集6| 老鸭窝网址在线观看| 黄色 视频免费看| 婷婷丁香在线五月| 黄片小视频在线播放| 国产成+人综合+亚洲专区| 久久性视频一级片| 久久久久久九九精品二区国产 | 2021天堂中文幕一二区在线观| 校园春色视频在线观看| 91成年电影在线观看| 全区人妻精品视频| 国产成人aa在线观看| 一进一出好大好爽视频| 搞女人的毛片| 久久精品成人免费网站| 日本免费一区二区三区高清不卡| 色av中文字幕| 午夜福利18| 一本精品99久久精品77| 亚洲狠狠婷婷综合久久图片| 精品一区二区三区视频在线观看免费| 老司机福利观看| 淫秽高清视频在线观看| 亚洲色图av天堂| 国产欧美日韩一区二区精品| 美女免费视频网站| 亚洲国产精品久久男人天堂| 国产亚洲欧美在线一区二区| 国产精品一区二区精品视频观看| e午夜精品久久久久久久| 波多野结衣高清作品| 亚洲专区字幕在线| 最近在线观看免费完整版| 两个人免费观看高清视频| 亚洲精品av麻豆狂野| 亚洲av熟女| 亚洲精品在线观看二区| 欧美一级a爱片免费观看看 | 国语自产精品视频在线第100页| 99久久精品国产亚洲精品| 国产高清激情床上av| 一区二区三区国产精品乱码| 亚洲av第一区精品v没综合| 伊人久久大香线蕉亚洲五| 日本一本二区三区精品| 国产一区二区激情短视频| 国产精品98久久久久久宅男小说| 国产精品亚洲av一区麻豆| 国产一区二区在线av高清观看|