• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于深度強(qiáng)化學(xué)習(xí)的多無(wú)人車(chē)系統(tǒng)編隊(duì)控制1)

    2024-03-01 08:32:02曾毓凌郝宇清王青云
    力學(xué)學(xué)報(bào) 2024年2期
    關(guān)鍵詞:模型

    曾毓凌 郝宇清 于 穎 王青云

    (北京航空航天大學(xué)航空科學(xué)與工程學(xué)院,北京 100191)

    引言

    21 世紀(jì)以來(lái),隨著半導(dǎo)體技術(shù)、車(chē)輛技術(shù)、控制科學(xué)、人工智能和通信技術(shù)的不斷發(fā)展,無(wú)人機(jī)和無(wú)人車(chē)等新穎的運(yùn)載設(shè)備逐漸從最初的創(chuàng)意設(shè)計(jì)變成了我們?nèi)粘I钪械囊徊糠?隨著工業(yè)發(fā)展中不斷升級(jí)的制造需求和對(duì)更先進(jìn)的生產(chǎn)力需求,無(wú)人車(chē)和無(wú)人機(jī)等工具也從一個(gè)傳統(tǒng)的運(yùn)載體向智能體的方向發(fā)展,其智能化程度正在飛快發(fā)展.然而,由于現(xiàn)代工程的復(fù)雜性和多樣性,許多任務(wù)很難通過(guò)單個(gè)智能體完成,如大型設(shè)備的搬運(yùn)和組裝、大規(guī)模搜索與識(shí)別、復(fù)雜礦洞的數(shù)字建模,以及多樣性的軍事作戰(zhàn)任務(wù)等.在許多這樣的場(chǎng)景中,多智能體的協(xié)作往往能比進(jìn)行單一智能體的功能擴(kuò)充帶來(lái)更好的效果,例如節(jié)省復(fù)雜系統(tǒng)的研發(fā)成本,減少對(duì)硬件和軟件復(fù)雜性的要求[1].一個(gè)典型的例子就是在空戰(zhàn)中不同種類飛機(jī)的配合,其協(xié)同作戰(zhàn)效率和能力遠(yuǎn)大于將所有功能集成于單一飛機(jī)[2].

    關(guān)于多智能體協(xié)同控制問(wèn)題,目前主要的研究方向有一致性控制[3-4]、編隊(duì)控制[5]和編隊(duì)-合圍控制[6]等.多智能體協(xié)同控制的控制器設(shè)計(jì)方法目前主要有領(lǐng)導(dǎo)-跟隨法[7-8]、虛擬結(jié)構(gòu)法[9]、基于行為法[10]及基于一致性理論的方法[11-12]等.但現(xiàn)有的控制器設(shè)計(jì)方法大多是基于精確的線性模型,不能很好地刻畫(huà)地面輪式車(chē)輛等運(yùn)載體的動(dòng)力學(xué)行為.無(wú)人車(chē)的動(dòng)力學(xué)行為具有較強(qiáng)的非線性,且存在非完整約束和欠驅(qū)動(dòng)問(wèn)題,傳統(tǒng)的基于線性系統(tǒng)理論設(shè)計(jì)的控制器有時(shí)候在實(shí)際無(wú)人車(chē)控制中效果欠佳.況且,當(dāng)模型具有不確定性時(shí)基于精確模型的控制方法魯棒性較差.而機(jī)器學(xué)習(xí)的方法具有強(qiáng)大的擬合能力,對(duì)模型的要求度低,已廣泛應(yīng)用在各種力學(xué)問(wèn)題當(dāng)中[13].相較于基于精確模型設(shè)計(jì)控制器的方法,強(qiáng)化學(xué)習(xí)的基本思路不再是人為地利用多智能體的精確模型設(shè)計(jì)各種形式的控制器,而是利用機(jī)器學(xué)習(xí)的方法建立高維狀態(tài)空間到動(dòng)作空間的映射,相當(dāng)于一個(gè)黑箱控制器模型,是一種較為新穎的控制器設(shè)計(jì)方式[14].結(jié)合了深度神經(jīng)網(wǎng)絡(luò)的深度強(qiáng)化學(xué)習(xí)在特征表示方面具有非常強(qiáng)大的能力,該能力在構(gòu)建狀態(tài)-動(dòng)作映射時(shí)發(fā)揮了重要作用,在非線性動(dòng)力學(xué)與控制問(wèn)題以及欠驅(qū)動(dòng)控制問(wèn)題中具有較好的應(yīng)用價(jià)值[15].況且,模型的訓(xùn)練只需要智能體的輸入輸出數(shù)據(jù),而不需要系統(tǒng)的精確模型,本質(zhì)上是一種數(shù)據(jù)驅(qū)動(dòng)的無(wú)模型控制方法,在模型參數(shù)未知、模型存在擾動(dòng)和攝動(dòng)時(shí)仍然可以學(xué)習(xí)到控制器[16].傳統(tǒng)的基于模型的控制方法與基于深度強(qiáng)化學(xué)習(xí)的控制方法的優(yōu)缺點(diǎn)對(duì)比如表1 所示.

    表1 兩種控制方法對(duì)比Table 1 Comparison of two control methods

    Bae 等[17]結(jié)合CNN 卷積神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)算法解決了多機(jī)器人的路徑規(guī)劃問(wèn)題.Zhu 等[18]利用MADDPG 算法解決多機(jī)器人運(yùn)動(dòng)避障問(wèn)題,并加入了優(yōu)先經(jīng)驗(yàn)回放機(jī)制來(lái)更好地利用強(qiáng)化學(xué)習(xí)隨機(jī)動(dòng)作儲(chǔ)存的經(jīng)驗(yàn)數(shù)據(jù),但其使用的是質(zhì)點(diǎn)運(yùn)動(dòng)學(xué)模型,并不能很好地刻畫(huà)真實(shí)的多智能體運(yùn)動(dòng).Hung等[19]利用Q-learning 的強(qiáng)化學(xué)習(xí)算法,結(jié)合無(wú)人機(jī)運(yùn)動(dòng)學(xué)模型,解決了領(lǐng)導(dǎo)-跟隨問(wèn)題.李波等[20]利用MADDPG 算法解決無(wú)人機(jī)群在威脅區(qū)域中的“避險(xiǎn)”飛行問(wèn)題.張海峰等[21]針對(duì)非線性多智能體控制問(wèn)題,利用HJB 方程來(lái)設(shè)計(jì)控制律,并利用強(qiáng)化學(xué)習(xí)的方法來(lái)求解HJB 方程進(jìn)而得到最優(yōu)控制器.趙啟等[22]利用D3QN 深度強(qiáng)化學(xué)習(xí)算法和無(wú)人機(jī)運(yùn)動(dòng)學(xué)模型來(lái)研究長(zhǎng)機(jī)-僚機(jī)編隊(duì)的橫向距離保持問(wèn)題,后續(xù)又采用DDQN 深度強(qiáng)化學(xué)習(xí)算法研究長(zhǎng)機(jī)-僚機(jī)編隊(duì)中的橫向距離保持和縱向速度跟蹤問(wèn)題[23].馬曉帆[24]主要研究了商用車(chē)隊(duì)的編隊(duì)道路運(yùn)行問(wèn)題,構(gòu)建了六自由度商用車(chē)動(dòng)力學(xué)模型,利用TD3 算法來(lái)實(shí)現(xiàn)車(chē)隊(duì)的縱向編隊(duì)運(yùn)行.相曉嘉等[25]提出了ID3QN 算法來(lái)研究固定翼無(wú)人機(jī)的定高長(zhǎng)機(jī)-僚機(jī)編隊(duì)問(wèn)題,ID3QN 算法是在D3QN 的基礎(chǔ)上增加“模仿”行為,旨在幫助僚機(jī)更快速地取得跟蹤長(zhǎng)機(jī)效果較好的經(jīng)驗(yàn)數(shù)據(jù).以上文獻(xiàn)主要基于運(yùn)動(dòng)學(xué)模型進(jìn)行控制器設(shè)計(jì),但實(shí)際的動(dòng)力學(xué)系統(tǒng)往往是二階系統(tǒng),由于慣性的存在,速度控制必然存在一定時(shí)延,力控制是最直接而準(zhǔn)確的控制方式,在實(shí)際工程問(wèn)題中具有更好的應(yīng)用價(jià)值.

    本文旨在利用深度強(qiáng)化學(xué)習(xí)技術(shù)設(shè)計(jì)多無(wú)人車(chē)系統(tǒng)的編隊(duì)控制器,使多無(wú)人車(chē)系統(tǒng)形成指定的期望隊(duì)形,并對(duì)控制器進(jìn)行策略優(yōu)化.本文的創(chuàng)新點(diǎn)包括以下三個(gè)方面.第一,基于DDQN 深度強(qiáng)化學(xué)習(xí)算法,結(jié)合一致性理論和伴隨位形的思想設(shè)計(jì)多無(wú)人車(chē)系統(tǒng)的編隊(duì)控制器,該控制器在無(wú)精確模型只有運(yùn)動(dòng)數(shù)據(jù)時(shí)也可以實(shí)現(xiàn)編隊(duì)控制任務(wù),降低了對(duì)模型的依賴性,相比傳統(tǒng)的基于模型設(shè)計(jì)的控制器,本文給出的控制器魯棒性更強(qiáng);第二,相較于目前大多數(shù)文獻(xiàn)基于運(yùn)動(dòng)學(xué)模型設(shè)計(jì)控制器,本文直接基于動(dòng)力學(xué)模型設(shè)計(jì)力控制器,更具有實(shí)際意義;第三,本文創(chuàng)新性地提出了編隊(duì)起始階段的等候與啟動(dòng)條件,進(jìn)行了策略優(yōu)化,仿真顯示優(yōu)化后的策略有效節(jié)省了編隊(duì)所需的能量.

    1 無(wú)人車(chē)動(dòng)力學(xué)模型

    常見(jiàn)的車(chē)輛動(dòng)力學(xué)模型有阿克曼轉(zhuǎn)向模型[24]、麥克納姆輪轉(zhuǎn)向模型[26]和后輪差動(dòng)轉(zhuǎn)向[27]等.后輪差動(dòng)轉(zhuǎn)向的車(chē)輛硬件與結(jié)構(gòu)更加簡(jiǎn)單,常用于小型輪式機(jī)器人等.本文擬采用后輪差動(dòng)轉(zhuǎn)向的剛體無(wú)人車(chē)動(dòng)力學(xué)模型.

    考慮后輪差動(dòng)轉(zhuǎn)向的無(wú)人車(chē)模型,其左右兩側(cè)后輪由兩個(gè)電機(jī)獨(dú)立驅(qū)動(dòng),兩側(cè)的前輪僅用于支撐車(chē)輛和配合運(yùn)動(dòng),不產(chǎn)生控制作用[28].無(wú)人車(chē)相對(duì)慣性坐標(biāo)系定義的位形坐標(biāo)為 η=(x,y,θ)T,代表了無(wú)人車(chē)的質(zhì)心位置以及車(chē)頭朝向,無(wú)人車(chē)的幾何模型如圖1 所示,各參數(shù)如表2 所示.

    圖1 無(wú)人車(chē)幾何模型Fig.1 Unmanned vehicle geometric model

    表2 無(wú)人車(chē)幾何參數(shù)Table 2 Unmanned vehicle geometric parameter

    無(wú)人車(chē)的動(dòng)力學(xué)方程為[29]

    需要注意的是,該無(wú)人車(chē)動(dòng)力學(xué)模型僅僅用于運(yùn)動(dòng)的仿真和運(yùn)動(dòng)數(shù)據(jù)的獲取,在控制器的設(shè)計(jì)與訓(xùn)練中并不需要該動(dòng)力學(xué)模型.

    2 基于DDQN 的多無(wú)人車(chē)編隊(duì)控制

    2.1 問(wèn)題描述

    考慮含有N+1 個(gè)無(wú)人車(chē)的多無(wú)人車(chē)系統(tǒng),其中包含1 個(gè)領(lǐng)導(dǎo)者無(wú)人車(chē)和N個(gè)跟隨者無(wú)人車(chē),其狀態(tài)由位形坐標(biāo)與速度變量表示.無(wú)人車(chē)的位形坐標(biāo)記作xi=(xi,yi,θi),i=1,2,···,N;其速度變量記作vi=(vi,ωi),i=1,2,···,N.其中第0 號(hào)無(wú)人車(chē)為領(lǐng)導(dǎo)者,第1 至N號(hào)無(wú)人車(chē)為跟隨者.

    編隊(duì)控制問(wèn)題的控制目標(biāo)是使得多無(wú)人車(chē)系統(tǒng)形成期望的隊(duì)形,如下式所示

    2.2 問(wèn)題分析

    為了實(shí)現(xiàn)多無(wú)人車(chē)系統(tǒng)的編隊(duì)控制,可以先從單領(lǐng)導(dǎo)者單跟隨者問(wèn)題出發(fā),再利用樹(shù)狀通訊擴(kuò)展到多無(wú)人車(chē)系統(tǒng)的編隊(duì)控制問(wèn)題.首先考慮單個(gè)跟隨者和領(lǐng)導(dǎo)者的編隊(duì)控制,領(lǐng)導(dǎo)者狀態(tài)表示為xl=(xl,yl,θl) 和vl=(vl,ωl),跟隨者的狀態(tài)表示為xf=(xf,yf,θf(wàn))和vf=(vf,ωf) .任務(wù)目標(biāo)為設(shè)計(jì)合適的控制器,使得跟隨者的狀態(tài)與跟隨者的狀態(tài)之差等于期望的相對(duì)位形d,即

    觀察上式,可以構(gòu)造領(lǐng)導(dǎo)者的伴隨位形 (xl-d),稱之為伴隨領(lǐng)導(dǎo)者.若跟隨者實(shí)現(xiàn)對(duì)伴隨領(lǐng)導(dǎo)者的一致性跟蹤,則等價(jià)于實(shí)現(xiàn)了對(duì)領(lǐng)導(dǎo)者的編隊(duì)控制.因此,可利用構(gòu)造伴隨領(lǐng)導(dǎo)者的方法將編隊(duì)控制問(wèn)題轉(zhuǎn)化為一致性問(wèn)題.伴隨領(lǐng)導(dǎo)者的幾何示意圖如圖2 所示.

    圖2 伴隨領(lǐng)導(dǎo)者Fig.2 Accompanying leader

    2.3 DDQN 深度強(qiáng)化學(xué)習(xí)算法

    強(qiáng)化學(xué)習(xí)技術(shù)作為機(jī)器學(xué)習(xí)的一個(gè)分支,憑借其在解決復(fù)雜的序列決策問(wèn)題中的優(yōu)異表現(xiàn),在控制工程領(lǐng)域和多智能體協(xié)同領(lǐng)域得到了廣泛的應(yīng)用[1].其基本思想是在無(wú)經(jīng)驗(yàn)的情況下通過(guò)智能體與環(huán)境的交互,獲取反饋并積累經(jīng)驗(yàn),然后優(yōu)化智能體的決策模型,其基本思想如圖3 所示.

    圖3 強(qiáng)化學(xué)習(xí)基本思想Fig.3 Reinforcement learning basic idea

    DDQN 算法是一種經(jīng)典的深度強(qiáng)化學(xué)習(xí)算法,全稱為double deepQnetwork learning,旨在利用深度學(xué)習(xí)的思想構(gòu)建深度神經(jīng)網(wǎng)絡(luò)來(lái)建立從智能體狀態(tài)st到價(jià)值函數(shù)Q(st,at) 的映射,其中st代表當(dāng)前時(shí)刻的狀態(tài),at代表智能體做出的動(dòng)作,rt代表智能體在本次交互中獲得的獎(jiǎng)勵(lì)[30].該算法的特點(diǎn)是構(gòu)建了價(jià)值網(wǎng)絡(luò)與目標(biāo)網(wǎng)絡(luò)兩個(gè)神經(jīng)網(wǎng)絡(luò),在訓(xùn)練時(shí)可以有效避免因自舉現(xiàn)象產(chǎn)生的價(jià)值函數(shù)高估問(wèn)題,具有較好的穩(wěn)定性,且其原理和架構(gòu)的復(fù)雜程度不高,對(duì)硬件的要求低,便于無(wú)人車(chē)系統(tǒng)部署.

    強(qiáng)化學(xué)習(xí)的最終目標(biāo)是學(xué)習(xí)到最優(yōu)策略π*(a|s),使得期望折扣獎(jiǎng)勵(lì)R最大,期望折扣獎(jiǎng)勵(lì)定義為

    其中,γ 為折扣因子,代表未來(lái)的獎(jiǎng)勵(lì)折算到當(dāng)前時(shí)刻的比例,rt為即時(shí)獎(jiǎng)勵(lì),T為終止時(shí)刻.獎(jiǎng)勵(lì)函數(shù)r(s,a)通常根據(jù)具體任務(wù)來(lái)進(jìn)行設(shè)計(jì),便于針對(duì)性地進(jìn)行優(yōu)化,例如在多無(wú)人車(chē)一致性控制任務(wù)中加入位形誤差、速度誤差等變量.

    準(zhǔn)確的價(jià)值函數(shù)Q*(s,a) 代表的是神經(jīng)網(wǎng)絡(luò)在狀態(tài)s下執(zhí)行動(dòng)作a所能獲得的期望折扣獎(jiǎng)勵(lì)的期望值,其表達(dá)式為[13]

    在學(xué)習(xí)到了準(zhǔn)確的價(jià)值函數(shù)后,便可以在不同狀態(tài)下評(píng)估最優(yōu)動(dòng)作并進(jìn)行控制.

    2.4 控制器狀態(tài)與動(dòng)作空間設(shè)計(jì)

    為了實(shí)現(xiàn)利用DDQN 算法建立控制器實(shí)現(xiàn)控制目標(biāo)的任務(wù),需要設(shè)計(jì)合適的狀態(tài)空間和動(dòng)作空間,在經(jīng)過(guò)多輪測(cè)試后,選取局部坐標(biāo)相比于慣性系下的全局坐標(biāo)能使網(wǎng)絡(luò)學(xué)習(xí)到更準(zhǔn)確的特征,控制效果會(huì)有明顯的進(jìn)步,由于是設(shè)計(jì)跟隨者的控制器,故設(shè)計(jì)狀態(tài)空間時(shí)需要將領(lǐng)導(dǎo)者與跟隨者的全局坐標(biāo)轉(zhuǎn)化為在跟隨者坐標(biāo)系下建立的相對(duì)坐標(biāo),幾何示意圖如圖4 所示.

    圖4 狀態(tài)空間Fig.4 State space

    狀態(tài)空間定義為

    其中,e1和e2為跟隨者坐標(biāo)系下的縱向距離誤差和橫向距離誤差,vf為跟隨者的運(yùn)動(dòng)速度,vl1和vl2為領(lǐng)導(dǎo)者的運(yùn)動(dòng)速度在跟隨者坐標(biāo)系下的縱向和橫向分量,ωf和ωl為跟隨者和領(lǐng)導(dǎo)者的角速度.各個(gè)局部坐標(biāo)變量與慣性坐標(biāo)系下的變量轉(zhuǎn)換關(guān)系為

    考慮到DDQN 算法輸出神經(jīng)元數(shù)量有限,需要將動(dòng)作空間進(jìn)行離散化,才能使輸出層的各個(gè)神經(jīng)元輸出價(jià)值函數(shù)Q(s,a)[31].本文基于無(wú)人車(chē)系統(tǒng)動(dòng)力學(xué)模型來(lái)設(shè)計(jì)控制器,控制輸入為左右側(cè)后輪的轉(zhuǎn)矩,需要對(duì)驅(qū)動(dòng)力矩進(jìn)行控制來(lái)改變運(yùn)動(dòng)狀態(tài).其轉(zhuǎn)矩的和值控制無(wú)人車(chē)縱向的加減速,其轉(zhuǎn)矩的差值控制無(wú)人車(chē)沿豎直方向的角加速度.考慮到縱向加減速可分為加速、減速和保持速度3 個(gè)動(dòng)作,轉(zhuǎn)動(dòng)增大角速度、減小角速度和保持角速度3 個(gè)動(dòng)作,兩個(gè)維度耦合后可以得到9 種動(dòng)作,因此取動(dòng)作空間為9 種典型動(dòng)作構(gòu)成的集合.

    2.5 控制器訓(xùn)練環(huán)境

    為了使網(wǎng)絡(luò)學(xué)習(xí)到符合實(shí)際物理意義的價(jià)值函數(shù)Q(s,a),需要針對(duì)控制目標(biāo)設(shè)計(jì)對(duì)應(yīng)的獎(jiǎng)勵(lì)函數(shù),顯然一致性控制問(wèn)題下,位形誤差與速度誤差越小,系統(tǒng)的狀態(tài)越佳,因此設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù)為

    其中,相對(duì)距離與相對(duì)速度的計(jì)算方法如下

    該獎(jiǎng)勵(lì)函數(shù)的具體含義是: 相對(duì)距離越小,狀態(tài)越接近一致,具有更高的價(jià)值,所以獎(jiǎng)勵(lì)與相對(duì)距離呈負(fù)相關(guān),不同區(qū)間的不同梯度有助于模型在誤差較小時(shí)提高敏感性,避免在誤差較小的區(qū)間內(nèi)因?yàn)楠?jiǎng)勵(lì)函數(shù)的值變化較小而學(xué)習(xí)效果不佳.在本任務(wù)中,取ed=0.01 m 為收斂閾值,認(rèn)為距離誤差小于該閾值時(shí)實(shí)現(xiàn)了一致性跟蹤,故距離獎(jiǎng)勵(lì)的最大值定義在ed<0.01 m 的情況.將相對(duì)速度引入較小的負(fù)獎(jiǎng)勵(lì)可以使模型的過(guò)渡階段盡量平滑,避免出現(xiàn)過(guò)大的速度差值.

    基于以上的狀態(tài)與動(dòng)作空間、獎(jiǎng)勵(lì)函數(shù)以及無(wú)人車(chē)剛體動(dòng)力學(xué)模型,便可以構(gòu)建基于DDQN 算法的一致性控制器訓(xùn)練環(huán)境和運(yùn)動(dòng)仿真環(huán)境,如圖5 所示.

    圖5 控制訓(xùn)練環(huán)境Fig.5 Controller training environment

    在每一個(gè)控制周期內(nèi),無(wú)人車(chē)將狀態(tài)變量輸入神經(jīng)網(wǎng)絡(luò)并得到價(jià)值函數(shù)輸出,然后利用動(dòng)作選擇策略來(lái)決定跟隨者的控制量,訓(xùn)練時(shí)常采用帶有一定隨機(jī)性的動(dòng)作選擇策略來(lái)使得網(wǎng)絡(luò)探索更多的動(dòng)作.動(dòng)作選擇完成后,環(huán)境將更新領(lǐng)導(dǎo)者與跟隨者的下一狀態(tài),并計(jì)算該次控制得到的獎(jiǎng)勵(lì)函數(shù),然后將經(jīng)驗(yàn)數(shù)據(jù)即環(huán)境交互得到的四元組(st,at,rt,st+1)存入經(jīng)驗(yàn)記憶庫(kù),再?gòu)慕?jīng)驗(yàn)庫(kù)中采樣并更新網(wǎng)絡(luò).

    為了在網(wǎng)絡(luò)訓(xùn)練時(shí)模擬到更全面更復(fù)雜的環(huán)境來(lái)指導(dǎo)神經(jīng)網(wǎng)絡(luò)的更新,避免網(wǎng)絡(luò)陷入局部最優(yōu),在設(shè)計(jì)訓(xùn)練場(chǎng)景時(shí)需要充分增加隨機(jī)性,避免因?yàn)檐壽E和場(chǎng)景的單一導(dǎo)致網(wǎng)絡(luò)過(guò)擬合,泛化性差.因此考慮如圖6 所示的4 種典型運(yùn)動(dòng),分別為勻速直線運(yùn)動(dòng)、加減速、左轉(zhuǎn)和右轉(zhuǎn).

    圖6 4 種典型運(yùn)動(dòng)軌跡Fig.6 Four typical trajectories

    在每一輪訓(xùn)練開(kāi)始前,環(huán)境會(huì)生成 40 s 的領(lǐng)導(dǎo)者運(yùn)動(dòng)軌跡,其中每 4 s 為一段.每一輪訓(xùn)練共由10 段軌跡拼接而成,每一段軌跡都為上述4 種典型軌跡之一,且為均勻抽樣,以實(shí)現(xiàn)訓(xùn)練過(guò)程的領(lǐng)導(dǎo)者軌跡多樣性.

    在訓(xùn)練中,領(lǐng)導(dǎo)者無(wú)人車(chē)的起始位形和速度為(xl0,yl0,θl0,vl0,ωl0)=(0,0,0,0.2,0).跟隨者的起始位置在以領(lǐng)導(dǎo)者起始位置為中心,以 6 m 為邊長(zhǎng)的正方形內(nèi)隨機(jī)生成,起始姿態(tài)角,按照均勻分布隨機(jī)選取.

    神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及參數(shù)如圖7 和表3 所示.

    圖7 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.7 Neural network framework

    表3 神經(jīng)網(wǎng)絡(luò)參數(shù)Table 3 Neural network parameters

    2.6 控制器訓(xùn)練結(jié)果

    基于以上的訓(xùn)練環(huán)境,設(shè)置網(wǎng)絡(luò)訓(xùn)練的總輪次為10 000 輪,初始學(xué)習(xí)率為0.000 1,記憶庫(kù)總?cè)萘緿為 218,每次更新網(wǎng)絡(luò)的采樣數(shù)量為256,折扣因子γ為0.95,訓(xùn)練結(jié)果如圖8 所示.

    圖8 訓(xùn)練結(jié)果Fig.8 Training result

    可以看到,隨著網(wǎng)絡(luò)的訓(xùn)練,每輪次所獲得的獎(jiǎng)勵(lì)函數(shù)和值在不斷增大,網(wǎng)絡(luò)訓(xùn)練后期獎(jiǎng)勵(lì)函數(shù)和值趨于收斂.由于網(wǎng)絡(luò)訓(xùn)練時(shí)模型決策因?yàn)橛休^小的探索率會(huì)存在動(dòng)作的隨機(jī)選擇,并且每個(gè)輪次的領(lǐng)導(dǎo)者軌跡與起始位置不同,因此會(huì)造成獎(jiǎng)勵(lì)函數(shù)和值的波動(dòng),可用滑動(dòng)窗口平均值觀察網(wǎng)絡(luò)的收斂性,圖中取窗口大小k=5和k=30 兩組參數(shù)進(jìn)行繪圖,可以觀察到網(wǎng)絡(luò)在訓(xùn)練后期收斂于較高的獎(jiǎng)勵(lì)值,模型趨于收斂.然后,將動(dòng)作選擇策略的隨機(jī)性消除,按照價(jià)值最大策略進(jìn)行控制,對(duì)模型進(jìn)行驗(yàn)證,控制器結(jié)構(gòu)圖如圖9 所示.

    圖9 控制器結(jié)構(gòu)Fig.9 Controller framework

    進(jìn)行100 輪驗(yàn)證,結(jié)果如圖10 所示.

    圖10 驗(yàn)證結(jié)果Fig.10 Test result

    同樣使用滑動(dòng)窗口平均法觀察驗(yàn)證過(guò)程的獎(jiǎng)勵(lì)函數(shù),可以觀察到模型的表現(xiàn)較為穩(wěn)定,曲線有所波動(dòng)的原因與領(lǐng)導(dǎo)者軌跡的隨機(jī)性和初始位置的隨機(jī)性有關(guān).經(jīng)驗(yàn)證,該網(wǎng)絡(luò)可以在訓(xùn)練場(chǎng)景下實(shí)現(xiàn)跟隨者狀態(tài)對(duì)領(lǐng)導(dǎo)者狀態(tài)的跟蹤.

    3 仿真驗(yàn)證

    3.1 運(yùn)動(dòng)仿真結(jié)果

    考慮由5 臺(tái)無(wú)人車(chē)組成的多無(wú)人車(chē)系統(tǒng),通訊方式為樹(shù)狀拓?fù)?如圖11 所示.其中,0 號(hào)無(wú)人車(chē)為領(lǐng)導(dǎo)者,其他為跟隨者,其中1 號(hào)和3 號(hào)無(wú)人車(chē)都與領(lǐng)導(dǎo)者進(jìn)行通訊,可以獲取領(lǐng)導(dǎo)者的運(yùn)動(dòng)狀態(tài),但2 號(hào)和4 號(hào)無(wú)人車(chē)只能分別與1 號(hào)和3 號(hào)無(wú)人車(chē)進(jìn)行通訊,獲取對(duì)應(yīng)無(wú)人車(chē)的狀態(tài),而不能得到領(lǐng)導(dǎo)者的運(yùn)動(dòng)狀態(tài),以模擬分布式通訊的場(chǎng)景.領(lǐng)導(dǎo)者按照期望軌跡進(jìn)行運(yùn)動(dòng),跟隨者在控制器的控制下運(yùn)動(dòng).

    圖11 通訊拓?fù)銯ig.11 Communication topology

    各無(wú)人車(chē)的物理參數(shù)如表4 所示.

    表4 無(wú)人車(chē)物理參數(shù)Table 4 Unmanned vehicle physical parameter

    無(wú)人車(chē)的初始位形為

    無(wú)人車(chē)的期望隊(duì)形為五邊形,具體的隊(duì)形參數(shù)為

    引入期望隊(duì)形的信號(hào)后,便可將一致性控制器轉(zhuǎn)化為編隊(duì)控制器,控制器的結(jié)構(gòu)圖如圖12 所示.

    圖12 編隊(duì)控制器結(jié)構(gòu)Fig.12 Formation controller framework

    設(shè)置期望隊(duì)形為五邊形,領(lǐng)導(dǎo)者運(yùn)動(dòng)軌跡覆蓋加減速、左右轉(zhuǎn)等情況,所有跟隨者初始時(shí)刻靜止,進(jìn)行運(yùn)動(dòng)仿真,結(jié)果如圖13 和圖14 所示.

    圖13 無(wú)人車(chē)軌跡Fig.13 Unmanned vehicle trajectory

    圖14 編隊(duì)誤差曲線Fig.14 Formation error

    根據(jù)運(yùn)動(dòng)軌跡和誤差曲線可以觀察到,多無(wú)人車(chē)系統(tǒng)在該控制器的控制下成功實(shí)現(xiàn)了期望的編隊(duì)運(yùn)動(dòng).

    為了充分驗(yàn)證控制器的有效性,需要針對(duì)不同的期望隊(duì)形開(kāi)展運(yùn)動(dòng)仿真實(shí)驗(yàn),圖15 和圖16 為不同期望隊(duì)形的運(yùn)動(dòng)仿真結(jié)果,其中圖15(a)和圖16(a)為五邊形隊(duì)形,圖15(b)和圖16(b)為平行隊(duì)形,圖15(c)和圖16(c)為合圍四邊形隊(duì)形.領(lǐng)導(dǎo)者運(yùn)動(dòng)軌跡也包含了左右轉(zhuǎn)、加減速等典型運(yùn)動(dòng)情況.通過(guò)運(yùn)動(dòng)軌跡和誤差曲線可以看到,不同期望隊(duì)形下,控制器均能驅(qū)動(dòng)多無(wú)人車(chē)系統(tǒng)快速實(shí)現(xiàn)編隊(duì)并保持隊(duì)形穩(wěn)定運(yùn)動(dòng).

    圖15 多隊(duì)形測(cè)試軌跡Fig.15 Multiple formation testing trajectory

    圖16 多隊(duì)形測(cè)試誤差曲線Fig.16 Error plot of multiple formation testing

    在現(xiàn)實(shí)場(chǎng)景中,往往由于地形等原因,多無(wú)人車(chē)編隊(duì)需要在運(yùn)動(dòng)過(guò)程中進(jìn)行隊(duì)形切換,因此需要驗(yàn)證控制器在運(yùn)動(dòng)過(guò)程中變換隊(duì)形的能力.圖17 和圖18 為隊(duì)形切換的運(yùn)動(dòng)仿真結(jié)果,多無(wú)人車(chē)系統(tǒng)在運(yùn)行過(guò)程中由于遇到障礙需要收緊隊(duì)形,通過(guò)后恢復(fù)原隊(duì)形.運(yùn)動(dòng)軌跡和誤差曲線顯示多無(wú)人車(chē)系統(tǒng)能夠在控制器的驅(qū)動(dòng)下,在運(yùn)動(dòng)過(guò)程中期望隊(duì)形發(fā)生變化時(shí)快速轉(zhuǎn)換為新目標(biāo)隊(duì)形,驗(yàn)證了在運(yùn)動(dòng)過(guò)程中的隊(duì)形切換能力.

    圖17 隊(duì)形切換測(cè)試軌跡Fig.17 Formation switching test trajectory

    圖18 隊(duì)形切換測(cè)試誤差曲線Fig.18 Formation switching test error plot

    3.2 起始階段策略優(yōu)化

    上文中的運(yùn)動(dòng)仿真證明了編隊(duì)控制器的有效性,但通過(guò)對(duì)多無(wú)人車(chē)系統(tǒng)運(yùn)動(dòng)軌跡的觀察可以發(fā)現(xiàn),在編隊(duì)控制的多隊(duì)形實(shí)驗(yàn)中,當(dāng)無(wú)人車(chē)起始位形為平行排布時(shí),五邊形編隊(duì)任務(wù)中存在一定的反向運(yùn)動(dòng)現(xiàn)象,即運(yùn)動(dòng)過(guò)程中跟隨者與領(lǐng)導(dǎo)者的速度方向夾角出現(xiàn)鈍角,即vf·vl<0,圖19 為第4 s 時(shí)刻的無(wú)人車(chē)狀態(tài).

    圖19 反向運(yùn)動(dòng)時(shí)刻Fig.19 Reverse movement moment

    造成該現(xiàn)象的原因是在起始位形下根據(jù)領(lǐng)導(dǎo)者計(jì)算各個(gè)跟隨者的伴隨領(lǐng)導(dǎo)者時(shí),跟隨者對(duì)伴隨者的縱向跟蹤誤差為負(fù),也就是兩者之間的距離誤差在跟隨者的速度方向投影為負(fù),導(dǎo)致跟隨者需要向領(lǐng)導(dǎo)者速度方向的反方向運(yùn)動(dòng)才能對(duì)伴隨領(lǐng)導(dǎo)者實(shí)現(xiàn)跟蹤,故存在“反向運(yùn)動(dòng)”現(xiàn)象,由于需要進(jìn)行更多的轉(zhuǎn)向和加減速動(dòng)作,該現(xiàn)象會(huì)增大控制過(guò)程中消耗的能量.

    考慮單領(lǐng)導(dǎo)者-單跟隨者的編隊(duì)控制起始階段狀態(tài).考慮 θf(wàn)0=θl0且e1<0,vl0≥0,vf0=0 的初始情況,如圖20 所示.

    圖20 反向運(yùn)動(dòng)典型狀態(tài)Fig.20 Reverse movement typical condition

    顯然,該初始情況與上述五邊形編隊(duì)的所有跟隨者的情況相同,是典型的易引起反向運(yùn)動(dòng)的起始條件.然而顯而易見(jiàn)的是,該情況下若跟隨者保持靜止等候,在短時(shí)間內(nèi)也會(huì)由于領(lǐng)導(dǎo)者的自身運(yùn)動(dòng)而使得編隊(duì)誤差減小,而不消耗任何能量,這是因?yàn)閑1<0,vl1-vf>0,兩者縱向的相對(duì)速度與位置誤差異號(hào),故縱向位置誤差的大小將在一定時(shí)間內(nèi)自行減小.由于考慮 θf(wàn)0=θl0的初始情況,在起始時(shí)刻臨近的短時(shí)間內(nèi)橫向誤差e2基本不變,為簡(jiǎn)化模型暫不考慮橫向的誤差狀態(tài).

    為了消除反向運(yùn)動(dòng)情況,現(xiàn)基于領(lǐng)導(dǎo)者與跟隨者的縱向狀態(tài)量定義單個(gè)無(wú)人車(chē)的等候條件與啟動(dòng)條件,等候條件為

    其物理含義為,縱向距離誤差與速度誤差符號(hào)相反,具有自發(fā)消除誤差的趨勢(shì),因此跟隨者保持靜止不動(dòng)仍然能使得編隊(duì)誤差減小.

    定義啟動(dòng)條件為

    其物理含義為,縱向距離誤差與速度誤差符號(hào)相同,位置誤差的絕對(duì)值將趨于增大,因此必須引入編隊(duì)控制器的作用來(lái)驅(qū)動(dòng)各個(gè)無(wú)人車(chē)達(dá)成期望隊(duì)形.

    各個(gè)無(wú)人車(chē)從初始時(shí)刻開(kāi)始,在每個(gè)時(shí)間差分內(nèi)都要進(jìn)行等候條件與啟動(dòng)調(diào)節(jié)的判斷,若滿足等候條件則不進(jìn)行控制,保持初始狀態(tài);若滿足啟動(dòng)條件,則由DDQN 編隊(duì)控制器持續(xù)進(jìn)行控制.需要注意的是,由于以上分析都是基于 θf(wàn)0=θl0的運(yùn)動(dòng)初始階段,該動(dòng)作策略僅用于運(yùn)動(dòng)初始階段的能量?jī)?yōu)化,每個(gè)無(wú)人車(chē)一旦在某時(shí)刻達(dá)到啟動(dòng)條件,在后續(xù)時(shí)刻就不再進(jìn)行條件判斷,而是由編隊(duì)控制器驅(qū)動(dòng)無(wú)人車(chē)以實(shí)現(xiàn)控制目標(biāo).

    3.3 對(duì)比分析

    為了驗(yàn)證該策略的作用,采用五邊形編隊(duì)進(jìn)行運(yùn)動(dòng)仿真以對(duì)比分析.運(yùn)動(dòng)仿真結(jié)果如圖21 和圖22所示.

    圖21 運(yùn)動(dòng)軌跡對(duì)比圖Fig.21 Trajectory comparison

    圖22 誤差曲線對(duì)比圖Fig.22 Error-curve comparison

    其中,圖21(a)和圖22(a)分別為優(yōu)化前的運(yùn)動(dòng)軌跡與誤差曲線,圖21(b)和圖22(b)為優(yōu)化后結(jié)果.經(jīng)計(jì)算,加入該策略后,運(yùn)動(dòng)過(guò)程中所消耗的能量減少了19.93%,有效驗(yàn)證了該策略節(jié)約能量的作用,并且通過(guò)對(duì)運(yùn)動(dòng)軌跡的觀察可以發(fā)現(xiàn)該策略消除了反向運(yùn)動(dòng)現(xiàn)象.但值得注意的是,由誤差曲線的對(duì)比可知,能量?jī)?yōu)化伴隨著收斂時(shí)間增大的代價(jià),這是由于等候的過(guò)程實(shí)際上消耗了一定的時(shí)間.雖然該策略可以在節(jié)省一部分能量的情況下完成編隊(duì)任務(wù),但因?yàn)槠湓O(shè)計(jì)原理而必然伴隨著收斂時(shí)間延長(zhǎng).

    4 總結(jié)

    本文基于DDQN 深度強(qiáng)化學(xué)習(xí)算法,結(jié)合一致性理論與伴隨領(lǐng)導(dǎo)者設(shè)計(jì)了多無(wú)人車(chē)系統(tǒng)的編隊(duì)控制器.首先,進(jìn)行了編隊(duì)問(wèn)題簡(jiǎn)化,將編隊(duì)控制問(wèn)題轉(zhuǎn)化為對(duì)伴隨領(lǐng)導(dǎo)者的一致性跟蹤問(wèn)題,然后簡(jiǎn)化為單領(lǐng)導(dǎo)者-單跟隨者問(wèn)題,并對(duì)該問(wèn)題設(shè)計(jì)了基于跟隨者局部坐標(biāo)系的7 維狀態(tài)空間、9 維動(dòng)作空間和基于距離誤差和速度誤差的獎(jiǎng)勵(lì)函數(shù).然后搭建了DDQN 網(wǎng)絡(luò)的訓(xùn)練環(huán)境,設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)架構(gòu)參數(shù)后,引入初始位置和領(lǐng)導(dǎo)者訓(xùn)練軌跡的隨機(jī)性進(jìn)行網(wǎng)絡(luò)訓(xùn)練.訓(xùn)練完成后利用運(yùn)動(dòng)仿真驗(yàn)證了控制器的有效性,并針對(duì)運(yùn)動(dòng)中所存在的反向運(yùn)動(dòng)現(xiàn)象,從編隊(duì)控制器中的動(dòng)作選擇策略層面提出了編隊(duì)控制器起始階段策略優(yōu)化方法.在運(yùn)動(dòng)初始時(shí),定義了等候條件與啟動(dòng)條件,對(duì)部分無(wú)人車(chē)進(jìn)行延遲啟動(dòng),仿真驗(yàn)證了該策略具有一定的能量節(jié)約作用,但可能會(huì)增加收斂時(shí)間.

    猜你喜歡
    模型
    一半模型
    一種去中心化的域名服務(wù)本地化模型
    適用于BDS-3 PPP的隨機(jī)模型
    提煉模型 突破難點(diǎn)
    函數(shù)模型及應(yīng)用
    p150Glued在帕金森病模型中的表達(dá)及分布
    函數(shù)模型及應(yīng)用
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
    3D打印中的模型分割與打包
    最近2019中文字幕mv第一页| 亚洲第一青青草原| 大陆偷拍与自拍| 亚洲精品,欧美精品| 高清av免费在线| 咕卡用的链子| 国产爽快片一区二区三区| av视频免费观看在线观看| 美女脱内裤让男人舔精品视频| 欧美日韩精品成人综合77777| 国产亚洲最大av| 一本大道久久a久久精品| 热re99久久精品国产66热6| 精品人妻在线不人妻| 欧美xxⅹ黑人| 久久久久久伊人网av| 少妇猛男粗大的猛烈进出视频| 婷婷色av中文字幕| 亚洲精华国产精华液的使用体验| 一级毛片黄色毛片免费观看视频| 美女国产视频在线观看| 免费在线观看视频国产中文字幕亚洲 | 国产淫语在线视频| a级毛片在线看网站| 日韩av免费高清视频| 99久久精品国产国产毛片| www.自偷自拍.com| 日韩熟女老妇一区二区性免费视频| 一区二区三区精品91| 欧美另类一区| 久久久久精品性色| 国产成人午夜福利电影在线观看| 国产精品成人在线| 久久青草综合色| 日韩中文字幕欧美一区二区 | 亚洲少妇的诱惑av| 久久久久久久久久人人人人人人| 一本色道久久久久久精品综合| 午夜日韩欧美国产| 波多野结衣av一区二区av| 国产高清不卡午夜福利| 各种免费的搞黄视频| 一级毛片我不卡| 亚洲图色成人| 女人久久www免费人成看片| 波多野结衣一区麻豆| 人人澡人人妻人| 三级国产精品片| 免费看不卡的av| 麻豆av在线久日| 男女边吃奶边做爰视频| 性色av一级| 欧美激情 高清一区二区三区| 亚洲精品日韩在线中文字幕| 激情五月婷婷亚洲| 韩国高清视频一区二区三区| 宅男免费午夜| 一区二区三区精品91| 国产精品一区二区在线不卡| 国产一级毛片在线| 国产免费现黄频在线看| 国产国语露脸激情在线看| 日日爽夜夜爽网站| 成年av动漫网址| 伦理电影大哥的女人| 视频区图区小说| 一二三四中文在线观看免费高清| 18禁观看日本| 伦理电影大哥的女人| 亚洲欧美成人综合另类久久久| 啦啦啦视频在线资源免费观看| 香蕉精品网在线| 老汉色av国产亚洲站长工具| 男人操女人黄网站| 亚洲国产最新在线播放| 欧美97在线视频| 亚洲国产精品一区二区三区在线| 国产人伦9x9x在线观看 | 最新中文字幕久久久久| 婷婷色综合www| 久久久国产欧美日韩av| 男女啪啪激烈高潮av片| 激情五月婷婷亚洲| 亚洲国产成人一精品久久久| 成人亚洲欧美一区二区av| 亚洲av.av天堂| 一级毛片我不卡| tube8黄色片| 欧美激情高清一区二区三区 | 不卡av一区二区三区| 欧美97在线视频| 精品人妻偷拍中文字幕| 午夜免费鲁丝| 中文字幕亚洲精品专区| 欧美日韩一区二区视频在线观看视频在线| 99香蕉大伊视频| 成人18禁高潮啪啪吃奶动态图| 不卡av一区二区三区| 丝袜在线中文字幕| 国产有黄有色有爽视频| 精品一区在线观看国产| 欧美 日韩 精品 国产| 黄色配什么色好看| 亚洲国产欧美在线一区| 一区二区三区激情视频| 欧美日韩综合久久久久久| 一本—道久久a久久精品蜜桃钙片| av不卡在线播放| 精品视频人人做人人爽| 成人黄色视频免费在线看| 亚洲色图综合在线观看| 97在线人人人人妻| 国产福利在线免费观看视频| www.熟女人妻精品国产| 国产欧美日韩一区二区三区在线| 国产免费福利视频在线观看| 国产精品三级大全| 在线亚洲精品国产二区图片欧美| 成年美女黄网站色视频大全免费| 黄片播放在线免费| 国产欧美日韩一区二区三区在线| 在线看a的网站| 男女高潮啪啪啪动态图| 精品99又大又爽又粗少妇毛片| 国产精品一区二区在线观看99| 精品久久久久久电影网| 热re99久久精品国产66热6| 欧美激情极品国产一区二区三区| 一本色道久久久久久精品综合| 在现免费观看毛片| 黄片小视频在线播放| 亚洲色图 男人天堂 中文字幕| 中文字幕av电影在线播放| 久久精品国产亚洲av天美| 欧美激情高清一区二区三区 | 丝袜脚勾引网站| 赤兔流量卡办理| 在线观看免费日韩欧美大片| videossex国产| 国产免费又黄又爽又色| 国产精品一国产av| 欧美 亚洲 国产 日韩一| 日韩欧美一区视频在线观看| 亚洲av国产av综合av卡| 中文字幕av电影在线播放| 乱人伦中国视频| 日本-黄色视频高清免费观看| 免费久久久久久久精品成人欧美视频| 亚洲国产欧美日韩在线播放| 欧美激情高清一区二区三区 | 亚洲精品日本国产第一区| 日韩电影二区| 在线观看免费日韩欧美大片| 国语对白做爰xxxⅹ性视频网站| 精品视频人人做人人爽| 91国产中文字幕| 精品少妇久久久久久888优播| 精品亚洲乱码少妇综合久久| 在线看a的网站| 免费av中文字幕在线| 超碰97精品在线观看| 日韩熟女老妇一区二区性免费视频| 菩萨蛮人人尽说江南好唐韦庄| 亚洲一区中文字幕在线| 国产又色又爽无遮挡免| 日本wwww免费看| www日本在线高清视频| 在线观看免费视频网站a站| 日韩av在线免费看完整版不卡| 久久人人爽av亚洲精品天堂| 亚洲欧美色中文字幕在线| 天天躁夜夜躁狠狠久久av| 国产一区二区 视频在线| 久久久久久久国产电影| 精品福利永久在线观看| 99久久综合免费| 国产成人精品一,二区| 91午夜精品亚洲一区二区三区| 黄色怎么调成土黄色| 亚洲av在线观看美女高潮| 寂寞人妻少妇视频99o| 欧美另类一区| 中文字幕制服av| 大陆偷拍与自拍| 亚洲综合色网址| 麻豆乱淫一区二区| 欧美最新免费一区二区三区| 久久久精品94久久精品| 黑人巨大精品欧美一区二区蜜桃| 天堂中文最新版在线下载| 久久久国产一区二区| 美女福利国产在线| 午夜福利乱码中文字幕| 中文欧美无线码| 91精品伊人久久大香线蕉| 久久久国产欧美日韩av| 国产精品成人在线| 在现免费观看毛片| 看免费成人av毛片| 欧美中文综合在线视频| 中文字幕亚洲精品专区| 日韩av不卡免费在线播放| 在线观看美女被高潮喷水网站| 97在线人人人人妻| 久久99精品国语久久久| 国产成人av激情在线播放| 亚洲图色成人| 大话2 男鬼变身卡| 亚洲,一卡二卡三卡| 狠狠精品人妻久久久久久综合| 美女高潮到喷水免费观看| 成人国产av品久久久| 国产精品蜜桃在线观看| 高清黄色对白视频在线免费看| 久久久精品94久久精品| 999久久久国产精品视频| 大话2 男鬼变身卡| av国产久精品久网站免费入址| 精品一区二区三卡| 久久精品亚洲av国产电影网| 中文字幕精品免费在线观看视频| 熟女av电影| 中文字幕人妻熟女乱码| 人妻系列 视频| 女人久久www免费人成看片| xxx大片免费视频| 一边摸一边做爽爽视频免费| 最近中文字幕2019免费版| 欧美少妇被猛烈插入视频| 免费黄网站久久成人精品| 亚洲精品自拍成人| 亚洲国产欧美网| 日韩一区二区视频免费看| 哪个播放器可以免费观看大片| 午夜老司机福利剧场| 另类亚洲欧美激情| 一本色道久久久久久精品综合| 少妇 在线观看| 中文字幕人妻丝袜一区二区 | 日韩精品有码人妻一区| 午夜福利影视在线免费观看| 精品人妻在线不人妻| 91aial.com中文字幕在线观看| 国产1区2区3区精品| videos熟女内射| 亚洲欧美精品自产自拍| 两个人看的免费小视频| 天天躁狠狠躁夜夜躁狠狠躁| 日韩av在线免费看完整版不卡| 综合色丁香网| 精品亚洲成a人片在线观看| 交换朋友夫妻互换小说| 久久人人爽av亚洲精品天堂| videos熟女内射| 成人毛片a级毛片在线播放| 制服人妻中文乱码| 男女午夜视频在线观看| 波多野结衣一区麻豆| 国产av国产精品国产| 国产乱人偷精品视频| 国产福利在线免费观看视频| 啦啦啦中文免费视频观看日本| 极品少妇高潮喷水抽搐| 亚洲激情五月婷婷啪啪| 好男人视频免费观看在线| av视频免费观看在线观看| 久久精品久久久久久噜噜老黄| 人妻人人澡人人爽人人| 少妇的逼水好多| 哪个播放器可以免费观看大片| 国产成人av激情在线播放| videos熟女内射| 大香蕉久久成人网| 一二三四在线观看免费中文在| 性高湖久久久久久久久免费观看| 中文精品一卡2卡3卡4更新| 欧美成人午夜精品| 国产av码专区亚洲av| 夫妻午夜视频| 久久久久久久国产电影| 精品福利永久在线观看| 精品少妇久久久久久888优播| 亚洲少妇的诱惑av| 亚洲人成电影观看| 一区二区三区乱码不卡18| 成年动漫av网址| 制服诱惑二区| 亚洲四区av| 久久久久精品人妻al黑| 精品午夜福利在线看| 999精品在线视频| 色网站视频免费| 成人影院久久| 久久久国产欧美日韩av| 久久99精品国语久久久| 免费在线观看视频国产中文字幕亚洲 | 国产 精品1| 天天躁狠狠躁夜夜躁狠狠躁| 黄频高清免费视频| 色哟哟·www| 亚洲三区欧美一区| 看十八女毛片水多多多| 熟女少妇亚洲综合色aaa.| 亚洲国产精品成人久久小说| 亚洲国产日韩一区二区| 最近最新中文字幕免费大全7| 国产精品免费视频内射| 久久亚洲国产成人精品v| 18禁裸乳无遮挡动漫免费视频| 亚洲成人一二三区av| 成人毛片a级毛片在线播放| 亚洲精品久久午夜乱码| 国产成人精品一,二区| 亚洲人成电影观看| 美国免费a级毛片| 久久av网站| 黄片无遮挡物在线观看| 婷婷色综合www| 久久av网站| 亚洲美女黄色视频免费看| 亚洲婷婷狠狠爱综合网| 久久毛片免费看一区二区三区| 精品久久久久久电影网| 亚洲欧美精品综合一区二区三区 | 国产精品一区二区在线观看99| 欧美日韩亚洲国产一区二区在线观看 | 少妇的逼水好多| 如何舔出高潮| av在线app专区| 亚洲第一区二区三区不卡| 一本色道久久久久久精品综合| 国产免费视频播放在线视频| 国产日韩欧美在线精品| freevideosex欧美| 日本猛色少妇xxxxx猛交久久| 卡戴珊不雅视频在线播放| 国产亚洲精品第一综合不卡| 黄频高清免费视频| 欧美少妇被猛烈插入视频| 精品国产超薄肉色丝袜足j| 久久久久久久久久人人人人人人| 黑人猛操日本美女一级片| 精品少妇一区二区三区视频日本电影 | 久久 成人 亚洲| 国产成人精品一,二区| 在线观看免费日韩欧美大片| 卡戴珊不雅视频在线播放| 在线观看免费视频网站a站| 久久精品亚洲av国产电影网| 2022亚洲国产成人精品| 777米奇影视久久| 另类精品久久| 在线看a的网站| 国产成人a∨麻豆精品| 午夜影院在线不卡| 91aial.com中文字幕在线观看| av国产久精品久网站免费入址| 亚洲视频免费观看视频| 一级毛片 在线播放| 另类精品久久| 国产免费福利视频在线观看| 天堂8中文在线网| 欧美精品高潮呻吟av久久| 最黄视频免费看| 国产老妇伦熟女老妇高清| 亚洲精品美女久久av网站| 各种免费的搞黄视频| 欧美精品亚洲一区二区| 少妇的逼水好多| 香蕉国产在线看| 国产在视频线精品| 青春草视频在线免费观看| 日韩伦理黄色片| 欧美人与性动交α欧美软件| 国产av一区二区精品久久| 麻豆av在线久日| 精品少妇内射三级| 国产xxxxx性猛交| 男的添女的下面高潮视频| 男男h啪啪无遮挡| 成人午夜精彩视频在线观看| 中文欧美无线码| 又黄又粗又硬又大视频| 国产一区二区三区综合在线观看| 国产男人的电影天堂91| 男人舔女人的私密视频| freevideosex欧美| 国产精品久久久久成人av| 国产成人午夜福利电影在线观看| 久久精品亚洲av国产电影网| 五月天丁香电影| 久久久久国产网址| 久久久久国产一级毛片高清牌| 国产精品一二三区在线看| av有码第一页| 免费久久久久久久精品成人欧美视频| 纯流量卡能插随身wifi吗| 91国产中文字幕| 日韩中文字幕欧美一区二区 | 乱人伦中国视频| 色婷婷av一区二区三区视频| 国产野战对白在线观看| 亚洲av福利一区| tube8黄色片| 亚洲成国产人片在线观看| 日本91视频免费播放| 久热久热在线精品观看| 久久精品国产自在天天线| 美女视频免费永久观看网站| 欧美日韩一级在线毛片| 欧美成人午夜免费资源| 成年女人毛片免费观看观看9 | 看免费av毛片| 久久久久国产网址| 嫩草影院入口| 99国产综合亚洲精品| 99九九在线精品视频| 精品国产露脸久久av麻豆| 婷婷色综合www| 在线看a的网站| 狂野欧美激情性bbbbbb| av在线观看视频网站免费| 天堂俺去俺来也www色官网| 久久久亚洲精品成人影院| 一二三四在线观看免费中文在| 欧美日韩成人在线一区二区| 久久久久久久大尺度免费视频| 最新中文字幕久久久久| 午夜福利视频在线观看免费| 午夜久久久在线观看| h视频一区二区三区| 国产亚洲午夜精品一区二区久久| 国产午夜精品一二区理论片| 国产成人av激情在线播放| 岛国毛片在线播放| 亚洲国产欧美网| 夫妻性生交免费视频一级片| 春色校园在线视频观看| 欧美精品人与动牲交sv欧美| 在线 av 中文字幕| 久久久国产精品麻豆| 国产高清国产精品国产三级| 精品亚洲成a人片在线观看| 久久99精品国语久久久| 中文字幕精品免费在线观看视频| 在线精品无人区一区二区三| 国产亚洲欧美精品永久| 精品99又大又爽又粗少妇毛片| 五月开心婷婷网| 男女高潮啪啪啪动态图| 国产av一区二区精品久久| 国产片内射在线| 久久av网站| av在线播放精品| 黄色配什么色好看| 99九九在线精品视频| 午夜福利在线观看免费完整高清在| 色婷婷久久久亚洲欧美| 久久99精品国语久久久| 九九爱精品视频在线观看| 国产97色在线日韩免费| 国产av一区二区精品久久| 人人妻人人添人人爽欧美一区卜| 亚洲成人av在线免费| 免费在线观看视频国产中文字幕亚洲 | 亚洲内射少妇av| 国产伦理片在线播放av一区| 好男人视频免费观看在线| 久久99一区二区三区| 久久久久国产精品人妻一区二区| 亚洲熟女精品中文字幕| 老女人水多毛片| av网站在线播放免费| 久久亚洲国产成人精品v| 高清不卡的av网站| 精品国产乱码久久久久久男人| 国产精品99久久99久久久不卡 | 美女xxoo啪啪120秒动态图| av有码第一页| 色婷婷久久久亚洲欧美| 亚洲美女黄色视频免费看| 韩国精品一区二区三区| 大片电影免费在线观看免费| 高清视频免费观看一区二区| 天天躁日日躁夜夜躁夜夜| 久久99一区二区三区| 日韩中文字幕欧美一区二区 | 久久99蜜桃精品久久| 久久久久久人人人人人| 久久久久国产一级毛片高清牌| 亚洲欧美成人精品一区二区| 国产精品久久久久久av不卡| 久久99一区二区三区| 黄网站色视频无遮挡免费观看| 日韩不卡一区二区三区视频在线| 男人添女人高潮全过程视频| 丰满迷人的少妇在线观看| 亚洲经典国产精华液单| 9热在线视频观看99| 午夜av观看不卡| 日日啪夜夜爽| 亚洲欧洲精品一区二区精品久久久 | 美女午夜性视频免费| 国产一区二区 视频在线| 久久久国产精品麻豆| 亚洲国产精品成人久久小说| 波多野结衣一区麻豆| 91成人精品电影| 中文字幕最新亚洲高清| 性高湖久久久久久久久免费观看| 亚洲一区中文字幕在线| 国产 一区精品| 丝袜喷水一区| 制服人妻中文乱码| 久久久久久久久久人人人人人人| 国产精品免费视频内射| 亚洲美女视频黄频| 国产xxxxx性猛交| 久久综合国产亚洲精品| 欧美激情高清一区二区三区 | 熟女av电影| 色播在线永久视频| 男女边摸边吃奶| 成年av动漫网址| 熟女少妇亚洲综合色aaa.| 十八禁网站网址无遮挡| 欧美人与性动交α欧美软件| 精品福利永久在线观看| 久久久久国产精品人妻一区二区| 久久精品亚洲av国产电影网| 新久久久久国产一级毛片| 亚洲内射少妇av| 日韩欧美一区视频在线观看| 国产人伦9x9x在线观看 | 国产精品久久久久久精品电影小说| 亚洲色图 男人天堂 中文字幕| av在线老鸭窝| 我的亚洲天堂| 久久精品国产亚洲av高清一级| 青春草国产在线视频| 菩萨蛮人人尽说江南好唐韦庄| 两个人免费观看高清视频| 午夜福利视频精品| 伊人亚洲综合成人网| 欧美日韩亚洲高清精品| 午夜激情久久久久久久| 日韩,欧美,国产一区二区三区| 99久国产av精品国产电影| 国产精品无大码| 欧美精品高潮呻吟av久久| 国产精品女同一区二区软件| 国产有黄有色有爽视频| 婷婷色av中文字幕| 777米奇影视久久| 不卡视频在线观看欧美| 老司机亚洲免费影院| 最黄视频免费看| 一区福利在线观看| 男男h啪啪无遮挡| 亚洲av中文av极速乱| 亚洲图色成人| 国产高清国产精品国产三级| 99国产综合亚洲精品| 热re99久久精品国产66热6| 日韩三级伦理在线观看| 久久久久精品人妻al黑| 欧美日韩精品网址| 日本wwww免费看| 18+在线观看网站| 午夜福利影视在线免费观看| 两性夫妻黄色片| 国产免费又黄又爽又色| 黄色毛片三级朝国网站| 亚洲av中文av极速乱| av在线app专区| 精品第一国产精品| 亚洲国产精品一区二区三区在线| 国产精品蜜桃在线观看| 男女边吃奶边做爰视频| 99精国产麻豆久久婷婷| 免费看av在线观看网站| 自拍欧美九色日韩亚洲蝌蚪91| 黄色配什么色好看| 久久精品夜色国产| 日韩精品有码人妻一区| 免费看不卡的av| 99久久精品国产国产毛片| 亚洲美女黄色视频免费看| 精品国产一区二区三区四区第35| 日日爽夜夜爽网站| 欧美精品一区二区大全| av线在线观看网站| 黑人猛操日本美女一级片| 色94色欧美一区二区| 国产精品国产三级国产专区5o| av又黄又爽大尺度在线免费看| 精品少妇黑人巨大在线播放| 99久国产av精品国产电影| 欧美bdsm另类| av视频免费观看在线观看| 99久久综合免费| 欧美亚洲 丝袜 人妻 在线| 亚洲国产精品国产精品| 久久久久人妻精品一区果冻| 国产有黄有色有爽视频| 久热久热在线精品观看| 男女国产视频网站| 肉色欧美久久久久久久蜜桃| 18禁动态无遮挡网站| 成人影院久久| 国产熟女欧美一区二区| 欧美成人精品欧美一级黄| 亚洲欧洲精品一区二区精品久久久 | 国产精品不卡视频一区二区| 我要看黄色一级片免费的|