• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于DDPG算法的無人機集群追擊任務

    2020-11-06 06:44:34張耀中許佳林姚康佳劉潔凌
    航空學報 2020年10期
    關鍵詞:評論家人工神經(jīng)網(wǎng)絡集群

    張耀中,許佳林,姚康佳,劉潔凌

    1.西北工業(yè)大學 電子信息學院,西安 710072 2.西安北方光電科技防務有限公司,西安 710043

    無人機與有人飛機相比,具有體積小、造價低、使用方便、對作戰(zhàn)環(huán)境要求低、戰(zhàn)場生存能力強等優(yōu)點。在過去的幾十年里,伴隨著導航、傳感器、能量存儲與制造等相關技術的發(fā)展,無人機在軍用和民用領域都得到了廣泛的應用。

    隨著無人機在相關領域應用的不斷推進,單架無人機在執(zhí)行任務時暴露出了靈活性差和任務完成率低的短板,因此使用多架無人機構(gòu)成集群協(xié)同執(zhí)行相關任務必將成為無人機未來應用的重要發(fā)展方向。無人機集群可以看作是一個多Agent 系統(tǒng)(Multi-Agent Systems,MAS),其目標是協(xié)調(diào)集群內(nèi)的無人機實現(xiàn)一個共同的任務目標。

    當前對無人機集群的眾多研究都集中在協(xié)同任務決策方面,通過蟻群算法、狼群算法等有關的群體智能算法來實現(xiàn)對多架無人機的指揮控制。但這些方法有著計算時間過長、靈活性不足、智能化程度低的缺點,無法很好地滿足無人機集群對于無中心化、自主化、自治化的要求。相比而言,人工智能領域中的深度強化學習方法憑借著其強大的高維度信息感知、理解以及非線性處理能力,有望使無人機集群在面向戰(zhàn)場復雜任務時有足夠的智能協(xié)同完成作戰(zhàn)任務。

    目前,已經(jīng)有諸多學者使用深度強化學習方法對無人機集群的相關問題進行了探索性研究。其中,Pham等基于深度強化學習算法對無人機的自主導航過程進行了研究,并應用于自主目標區(qū)域覆蓋問題,在一定程度上解決了無人機集群聯(lián)合行動下的協(xié)同任務規(guī)劃問題和高維度狀態(tài)空間的挑戰(zhàn)[1-2];Qi和Zhu使用深度強化學習研究了智能體的環(huán)境感知問題,實現(xiàn)了對相鄰智能體的意圖感知[3];李高壘[4]和魏航[5]使用深度強化學習方法研究了影響無人機自主空戰(zhàn)的相關因素,為未來智能空戰(zhàn)提供了理論依據(jù)。Yamaguchi引入反饋控制律研究多機器人的協(xié)調(diào)運動問題,采用隊形矢量法控制機器人群體隊形實現(xiàn)了對目標的追擊[6]。目前已有部分學者采用人工智能算法來解決無人機對目標的追擊問題,如Gadre采用Q學習算法在柵格化環(huán)境下研究了智能體的追擊問題,并與動態(tài)規(guī)劃算法進行對比,取得了較好的效果[7]。蘇治寶等通過對未知環(huán)境中多移動智能體追擊單目標問題的研究,采用強化學習中的Q學習算法給出了相應的解決方案[8]。通過對相關文獻的分析可以看出,目前在無人機集群應用方面的研究還不夠完善,所研究問題的規(guī)模都比較小,而且大多采用柵格化的任務環(huán)境,導致應用環(huán)境過于簡單。

    與此同時,一些軍事強國,如美、英、俄羅斯等都在開展將人工智能技術應用于無人機集群任務的相關實驗驗證,美國已經(jīng)開展了多個智能化無人機集群項目,2016年美軍在加州進行的無人機集群實驗,成功地將人工智能技術應用到無人機集群的行為決策中,實現(xiàn)了無人機集群在空中自主協(xié)作,組成無人機集群隊形,并完成預定任務,充分體現(xiàn)了無人機集群的無中心化、自主化、自治化,這一實驗表明美軍在無人機集群自組網(wǎng)以及任務決策方面已經(jīng)達到了實用化水平[9]。因此,進行無人機集群的應用研究具有一定的理論意義和使用價值。

    本文在現(xiàn)有研究的基礎上,以無人機集群對敵方來襲目標的追擊任務為場景[10],基于深度確定性策略梯度網(wǎng)絡(Deep Deterministic Policy Gradient,DDPG)算法建立了人工神經(jīng)網(wǎng)絡模型,設計了一種引導型回報函數(shù)有效解決了深度強化學習在長周期任務下的稀疏回報問題,通過引入基于滑動平均值的軟更新策略減少了DDPG算法中Eval網(wǎng)絡和Target網(wǎng)絡在訓練過程中的參數(shù)震蕩,提高了算法的訓練效率。仿真實驗結(jié)果表明,訓練完成后的無人機集群能夠較好地執(zhí)行對敵方來襲目標的追擊任務,表現(xiàn)了人工智能算法在提升無人機集群指揮決策能力上的應用潛力。

    1 任務場景描述

    如圖1所示,在任務場景中出現(xiàn)敵方目標,目標的初始位置已知,保持高度和速度恒定飛行,我方派出無人機集群進行追擊攔截。設定雙方都處于同一個水平面內(nèi),不考慮高度因素。不同于以往將任務環(huán)境網(wǎng)格化的離散處理方案,本文構(gòu)建了連續(xù)的二維戰(zhàn)場地圖作為無人機集群追擊問題的任務環(huán)境,集群中的無人機、被追擊目標的位置,均采用連續(xù)的空間位置坐標表示。

    圖1 無人機集群執(zhí)行追擊任務示意圖Fig.1 Schematic diagram of UAV swarm for pursuit task

    本文針對任務場景中只有一個目標出現(xiàn)的情況,且不考慮目標針對無人機集群進行機動規(guī)避等行為,目標按照自身預定的運動策略進行飛行。無人機集群的任務是圍堵目標,實現(xiàn)對目標的打擊或者驅(qū)離,當無人機集群與目標之間的距離滿足一定的態(tài)勢要求后,視為無人機集群完成追擊任務[11-12]。

    2 無人機集群模型

    2.1 無人機運動控制模型

    為了便于問題分析,將集群中的無人機看作質(zhì)點運動模型,使用兩個方向的加速度來控制無人機的運動過程,如圖2所示。

    圖2 無人機的運動學模型Fig.2 Kinematic model of UAV

    無人機的質(zhì)點運動方程表示為

    (1)

    (2)

    (3)

    針對式(1)~式(3)建立的無人機運動控制模型,為了便于強化學習算法的實現(xiàn),采用2個方向的加速度作為控制量對無人機的運動行為進行控制,如圖3所示。

    由圖3可知,無人機的行為空間包含切向加速度a∥和法向加速度a⊥2個維度,無人機的行為即深度強化學習算法的輸出可以是這2個維度中滿足范圍要求的任意值,限定無人機的行為空間滿足:

    圖3 無人機加速度控制模型圖Fig.3 Diagram of UAV acceleration control model

    (4)

    同時,對無人機的速度做出限制,規(guī)定無人機的速度v∈[3,7] m/s。

    2.2 無人機傳感器探測模型

    設定集群中的無人機具有對任務場景的全局探測能力,為了模擬傳感器的真實探測效果,對無人機的傳感器探測結(jié)果加入一個服從正態(tài)分布ε~N(μ,σ2)的隨機誤差。誤差的參數(shù)為

    (5)

    式中:di_t為無人機到目標的距離。

    因此,集群中每架無人機對目標位置的探測結(jié)果為

    (6)

    式中:(xg,yg)為無人機探測到的目標位置;(x′g,y′g) 為目標的真實位置;εx、εy為服從正態(tài)分布N(0,σ2)的隨機誤差。

    無人機對目標速度的探測結(jié)果計算為

    (7)

    式中:(xg_old,yg_old)為上一時刻探測到的目標位置;(xg_now,yg_now)為當前時刻探測到的目標位置。

    2.3 集群內(nèi)無人機信息交互模型

    集群內(nèi)的無人機之間需要進行信息交互以便使無人機集群具有更好的協(xié)作行為決策,每架無人機都有固定的通信范圍,在通信范圍內(nèi)的無人機之間可以進行通信,為了便于仿真分析,設定每架無人機最多可以與通信范圍內(nèi)距離最近的3架無人機進行信息交互,如圖4所示。

    圖4 集群內(nèi)信息交互關系示意圖Fig.4 Schematic diagram of interaction within swarm

    圖5 無人機間態(tài)勢信息關系圖Fig.5 Situational relationship between UAVs

    3 深度確定性策略梯度網(wǎng)絡算法

    DDPG算法是一種結(jié)合了基于值迭代和策略迭代的深度強化學習算法[13-14]。該算法的優(yōu)勢在于可以針對無限大小的狀態(tài)空間和行為空間實現(xiàn)智能體對最優(yōu)策略的學習,使無人機集群在針對具體任務的學習過程中具有更優(yōu)良的性能表現(xiàn)。DDPG算法是在傳統(tǒng)的“演員-評論家”算法的基礎上改進形成的,下面對算法網(wǎng)絡的結(jié)構(gòu)進行詳細分析。

    3.1 “演員-評論家”算法

    “演員-評論家”算法主要由2個不同的網(wǎng)絡模塊組成,分別是演員網(wǎng)絡模塊和評論家網(wǎng)絡模塊。

    演員網(wǎng)絡模塊主要通過對輸入環(huán)境的狀態(tài)觀測,利用人工神經(jīng)網(wǎng)絡得到智能體行為的選擇概率,完成智能體與環(huán)境的交互過程,并且用交互得到的環(huán)境回報對人工神經(jīng)網(wǎng)絡的參數(shù)進行更新,用來維護和更新智能體的動作選取策略。

    評論家網(wǎng)絡模塊則通過對輸入環(huán)境的狀態(tài)及行為進行觀測,來評估每個環(huán)境狀態(tài)與行為的價值,即估計演員網(wǎng)絡模塊的價值,通過實際網(wǎng)絡價值與預測網(wǎng)絡價值的誤差來更新當前神經(jīng)網(wǎng)絡。評論家網(wǎng)絡模塊輸出的價值可以對演員網(wǎng)絡模塊的行為選取策略進行指導,這也是“演員-評論家”算法的由來。

    由上述可知,對于“演員-評論家”算法2個不同的網(wǎng)絡模塊:演員網(wǎng)絡模塊和評論家網(wǎng)絡模塊分別需要建立各自的人工神經(jīng)網(wǎng)絡。演員網(wǎng)絡模塊的人工神經(jīng)網(wǎng)絡實現(xiàn)了從觀測狀態(tài)到智能體行為選取概率的映射,其訓練過程需要結(jié)合評論家網(wǎng)絡模塊的誤差進行。而評論家網(wǎng)絡模塊的人工神經(jīng)網(wǎng)絡是通過對環(huán)境狀態(tài)和行為選取的觀測得到相應的評分,形成環(huán)境狀態(tài)與行為到對應評分的映射。“演員-評論家”算法的模型結(jié)構(gòu)如圖6所示。

    圖6 “演員-評論家”算法的模型結(jié)構(gòu)Fig.6 Model structure of “Actor-Critics” algorithm

    3.2 DDPG算法的網(wǎng)絡架構(gòu)

    DDPG算法融合了“演員-評論家”算法和深度Q網(wǎng)絡算法,是一種新型的深度強化學習算法[15-16],算法的網(wǎng)絡架構(gòu)如圖7所示。

    圖7 DDPG算法的網(wǎng)絡架構(gòu)圖Fig.7 Network architecture of DDPG algorithm

    如圖7所示,DDPG算法主要由環(huán)境、記憶回放單元、演員網(wǎng)絡模塊和評論家網(wǎng)絡模塊構(gòu)成。其中,環(huán)境是智能體的交互空間,也是智能體的探索空間,智能體在與環(huán)境的交互過程中得到交互樣本,并將交互樣本存儲到記憶回放單元中用于智能體的訓練過程。為了優(yōu)化算法的學習過程,DDPG算法吸取了深度Q網(wǎng)絡算法的思想,對于算法中的網(wǎng)絡部分分別構(gòu)建了一對結(jié)構(gòu)完全相同的人工神經(jīng)網(wǎng)絡,分別稱為Eval神經(jīng)網(wǎng)絡和Target神經(jīng)網(wǎng)絡。其中Eval神經(jīng)網(wǎng)絡用于訓練更新網(wǎng)絡參數(shù),Target神經(jīng)網(wǎng)絡則使用周期性軟更新策略對Eval神經(jīng)網(wǎng)絡進行跟隨,并協(xié)助Eval神經(jīng)網(wǎng)絡進行訓練。

    演員網(wǎng)絡模塊的神經(jīng)網(wǎng)絡用來完成對智能體行為選取概率的確定,智能體進行行為決策時,將依據(jù)演員網(wǎng)絡模塊提供的行為選擇概率來選取行為與環(huán)境進行交互。評論家網(wǎng)絡模塊的神經(jīng)網(wǎng)絡通過接收環(huán)境狀態(tài)和智能體行為,用來生成對“狀態(tài)-行為”的價值評估。其中Eval神經(jīng)網(wǎng)絡用來判斷當前狀態(tài)與行為的價值,Target神經(jīng)網(wǎng)絡接收下一時刻的狀態(tài)和演員部分Target神經(jīng)網(wǎng)絡輸出的下一時刻行為,并進行價值判斷。

    DDPG算法中演員和評論家2部分的神經(jīng)網(wǎng)絡有著不同的功能和結(jié)構(gòu),相應的訓練方式也不同,使用不同的損失函數(shù)進行訓練。對于評論家網(wǎng)絡而言,使用TD-error對Eval神經(jīng)網(wǎng)絡的參數(shù)進行訓練,訓練過程使用最小化損失函數(shù)Loss進行更新,即

    TD-error=reward(st,at)+

    (8)

    Loss=(TD-error)2

    (9)

    對于演員網(wǎng)絡模塊中神經(jīng)網(wǎng)絡的訓練過程,通過最大化<狀態(tài),行為>相對應的價值判斷來實現(xiàn),因此使用對狀態(tài)和行為的評價均值作為損失函數(shù),即

    Loss=-mean(v(s,a;θcritic))

    (10)

    3.3 DDPG算法中探索與經(jīng)驗的平衡

    在DDPG算法中,如果只是依據(jù)算法輸出的行為選擇策略來決定無人機的當前行為,容易導致算法對任務環(huán)境探索的不充分,因此需要對DDPG算法策略增加一定的探索性[17]。根據(jù)DDPG算法的特點,增強算法探索性的實現(xiàn)方法是在無人機行為選取過程中增加一定的隨機噪聲[18-19],即

    action=action′+Noise

    (11)

    式中:action為無人機當前時刻選擇的行為;action′為DDPG算法中演員網(wǎng)絡模塊輸出的無人機行為;Noise為隨機噪聲。

    由于DDPG算法輸出的是無人機在2個方向上加速度的連續(xù)控制量,因此采用上述方法增強DDPG算法的探索性具備良好的可行性,設定隨機噪聲服從正態(tài)分布:

    Noise~N(μ,σ2)

    (12)

    噪聲的期望值μ=0、方差σ與迭代輪次相關,隨著網(wǎng)絡訓練迭代次數(shù)的增加σ將逐漸減小,為了保證無人機集群具備足夠的探索能力,確保在無人機探索初期其行為選擇能夠選取到行為空間中的任意值,對隨機噪聲方差初始值的設計為

    σ0=(actionmax-actionmin)/4

    (13)

    σ=Kepisodeσ0

    (14)

    式中:K=0.999 5;episode為算法訓練代數(shù)。

    3.4 DDPG算法的網(wǎng)絡結(jié)構(gòu)

    由前述分析可知,DDPG算法由一對結(jié)構(gòu)完全相同的神經(jīng)網(wǎng)絡,即“演員”部分人工神經(jīng)網(wǎng)絡(Actor網(wǎng)絡)和“評論家”部分人工神經(jīng)網(wǎng)絡(Critic網(wǎng)絡)構(gòu)成[19-20],所構(gòu)建網(wǎng)絡的Tensorboard輸出如圖8所示。

    圖8 DDPG算法網(wǎng)絡結(jié)構(gòu)(Tensorboard)Fig.8 Network structure of DDPG algorithm (Tensorboard)

    3.4.1 “演員”網(wǎng)絡模塊的人工神經(jīng)網(wǎng)絡結(jié)構(gòu)

    “演員”網(wǎng)絡模塊的人工神經(jīng)網(wǎng)絡用來輸出無人機的行為,在無人機集群追擊任務環(huán)境中,無人機集群的狀態(tài)空間為自身位置(xi,yi)、速度(vx_i,vy_i)、探測得到的目標位置(xg,yg)、速度(vx_g,vy_g)以及通過信息交互得到的其他無人機的相關信息(xij,yij)、(vx_ij,vy_ij)和其他無人機的探測信息(xij_get,yij_get)、(vx_ij_get,vy_ij_get),共32個維度作為無人機的狀態(tài)空間,如圖9所示。

    對“演員”網(wǎng)絡模塊中的Target和Eval人工神經(jīng)網(wǎng)絡,構(gòu)建了2個結(jié)構(gòu)完全相同的6層全連接人工神經(jīng)網(wǎng)絡,每層網(wǎng)絡的人工神經(jīng)元個數(shù)分別為[100,100,300,100,100,2],最后一層神經(jīng)網(wǎng)絡為二維度的輸出層,對應無人機的切向加速度a∥與法向加速度a⊥。輸出神經(jīng)元使用tanh(x)作為激活函數(shù),實現(xiàn)網(wǎng)絡輸出與無人機行為的映射,其他各層的神經(jīng)元使用relu(x)作為激活函數(shù)。并且使用RMSProp(Root Mean Square Prop)算法作為訓練的優(yōu)化器?!把輪T”網(wǎng)絡模塊中人工神經(jīng)網(wǎng)絡的結(jié)構(gòu)如圖10所示。圖中“演員”

    圖10 “演員”網(wǎng)絡模塊中人工神經(jīng)網(wǎng)絡結(jié)構(gòu)Fig.10 Network structure in “Actor” network module

    網(wǎng)絡模塊中,w1,w2,…,w6和b1,b2,…,b6代表了6層網(wǎng)絡中的權重值和偏置值。

    3.4.2 “評論家”網(wǎng)絡模塊的人工神經(jīng)網(wǎng)絡結(jié)構(gòu)

    “評論家”網(wǎng)絡模塊的人工神經(jīng)網(wǎng)絡通過對“狀態(tài)-行為”的價值評估,指導“演員”網(wǎng)絡模塊中神經(jīng)網(wǎng)絡的訓練過程[21-23]。因此,評論家網(wǎng)絡模塊中神經(jīng)網(wǎng)絡的輸入狀態(tài)為無人機集群的狀態(tài)信息與行為信息,網(wǎng)絡的狀態(tài)空間構(gòu)成如圖11所示。

    圖11 “評論家”網(wǎng)絡模塊的狀態(tài)空間構(gòu)成Fig.11 State space of “Critic” network module

    對“評論家”網(wǎng)絡模塊中的Target和Eval人工神經(jīng)網(wǎng)絡,構(gòu)建了2個結(jié)構(gòu)完全相同的5層全連接人工神經(jīng)網(wǎng)絡,每層網(wǎng)絡的人工神經(jīng)元個數(shù)分別為[100,300,100,10,1]。輸出層的神經(jīng)元使用tanh (x)作為激活函數(shù),隱藏層的神經(jīng)元使用relu(x)作為激活函數(shù),并且使用RMSProp(Root Mean Square Prop)算法作為訓練的優(yōu)化器。神經(jīng)網(wǎng)絡的結(jié)構(gòu)如圖12所示。

    圖12 “評論家”網(wǎng)絡模塊中的人工神經(jīng)網(wǎng)絡結(jié)構(gòu)Fig.12 Network structure in “Critic” network module

    在“演員”網(wǎng)絡模塊和“評論家”網(wǎng)絡模塊中同時存在Target和Eval人工神經(jīng)網(wǎng)絡,其中Eval神經(jīng)網(wǎng)絡用于訓練過程,而Target神經(jīng)網(wǎng)絡則周期性的跟隨訓練網(wǎng)絡相應參數(shù)的變化而更新。對于Target神經(jīng)網(wǎng)絡的參數(shù)更新使用基于滑動平均值的軟更新策略,即

    θTarget=kθTarget+(1-k)θEval

    (15)

    式中:θTarget為Target神經(jīng)網(wǎng)絡參數(shù);θEval為Eval神經(jīng)網(wǎng)絡參數(shù);k為滑動因子,經(jīng)驗取值為0.2。

    3.5 DDPG算法的稀疏回報問題

    對于連續(xù)的狀態(tài)空間和行為空間,無人機進行隨機初始化之后要經(jīng)歷一段很長時間與環(huán)境的交互過程才能達到最終狀態(tài)。此時,僅在無人機集群到達最終狀態(tài)之后給予相應回報的方式,有著回報周期過長的缺陷,容易導致強化學習過程無法進行有效學習,即存在著稀疏回報問題。

    為了解決稀疏回報問題,對無人機集群的學習目標進行了相應的修改,增加有效回報,從而加快學習速度,構(gòu)建不同情形下無人機的回報函數(shù)來指導深度強化學習的學習方向,即

    (16)

    對于式(16)中的無人機集群回報函數(shù),由無人機與目標之間的距離變化情況、無人機的速度方向以及無人機的速度大小共同表示。當無人機與目標之間的距離變小時對應的回報函數(shù)為正值;由無人機的速度大小與速度方向相結(jié)合構(gòu)成了回報函數(shù),在相同速度大小的情況下,速度矢量的方向越指向目標,無人機的回報就越高;同理,在無人機速度方向指向目標的情況下,無人機的速度越大回報越高;對于無人機速度方向遠離目標的情況下,無人機的速度越大,其負向回報越高。

    由于無人機集群從初始狀態(tài)出發(fā),需要運行較長時間才能到達目標狀態(tài),如果在長時間的中間狀態(tài)下無法得到環(huán)境的有效回報,容易導致算法訓練過程中的梯度消失,從而導致訓練過程無法收斂。無人機集群采用上述引導型回報函數(shù)時,訓練過程中會根據(jù)無人機的任一狀態(tài)產(chǎn)生一個與當前<狀態(tài),行為>相對應的價值回報,從而引導無人機集群逐漸向目標狀態(tài)轉(zhuǎn)移。因此,式(16) 能較準確地反應無人機的行為收益,算法的訓練結(jié)果表明,通過采用引導型回報函數(shù)能夠較好地解決深度強化學習中的稀疏回報問題。

    3.6 DDPG算法程序流程

    使用DDPG算法對無人機集群的追擊任務進行訓練,程序?qū)崿F(xiàn)流程如圖13所示。

    圖13 DDPG算法的程序流程圖Fig.13 Algorithm flow chart of DDPG algorithm

    4 仿真實驗

    設定仿真場景中只存在一個勻速前進的目標,當集群中的任意一架無人機追擊到目標之后,視為無人機集群完成了對目標的追擊任務,即到達了任務的最終狀態(tài)。

    4.1 訓練過程

    仿真中使用5架完全相同的無人機構(gòu)成集群進行訓練。為了便于觀察算法的訓練狀態(tài),防止訓練過程中出現(xiàn)梯度消失等現(xiàn)象,對人工神經(jīng)網(wǎng)絡的收斂性能進行了監(jiān)測,分別選取“演員”和“評論家”網(wǎng)絡模塊中的神經(jīng)網(wǎng)絡參數(shù)進行統(tǒng)計觀察,得到相關統(tǒng)計信息如圖14~圖17所示。

    圖14 “演員”網(wǎng)絡模型Eval網(wǎng)絡參數(shù)均值變化曲線Fig.14 Curve of average change in Eval network parameters in “Actor” network module

    圖15 “演員”網(wǎng)絡模塊Target網(wǎng)絡參數(shù)方差變化曲線Fig.15 Curve of variance in Target network parameters in “Actor” network module

    圖16 “評論家”網(wǎng)絡模塊Eval網(wǎng)絡參數(shù)均值變化曲線Fig.16 Curve of average change in Eval network parameters in “Critic” network module

    圖17 “評論家”網(wǎng)絡模塊Target網(wǎng)絡參數(shù)方差變化曲線Fig.17 Curve of variance in Target network parameters in “Critic” network module

    圖14~圖17數(shù)據(jù)曲線圖分別是對“演員”和“評論家”網(wǎng)絡模塊中的神經(jīng)網(wǎng)絡參數(shù)取均值和方差進行統(tǒng)計的結(jié)果,圖中實線為網(wǎng)絡參數(shù)統(tǒng)計的真實值,虛線則是對統(tǒng)計數(shù)據(jù)進行周期為3的滑動平均處理的結(jié)果,用來表明參數(shù)統(tǒng)計的變化趨勢。由上述參數(shù)統(tǒng)計曲線圖可以看出人工神經(jīng)網(wǎng)絡在訓練過程中很好地實現(xiàn)了收斂。

    圖18截取自TensorBoard的“評論家”網(wǎng)絡模塊中的神經(jīng)網(wǎng)絡參數(shù)分布變化直方圖,由遠及近(顏色由深變淺)表現(xiàn)了神經(jīng)網(wǎng)絡在不同訓練階段各個神經(jīng)元參數(shù)分布的變化情況,橫向表示神經(jīng)元各個參數(shù)取值,從神經(jīng)網(wǎng)絡的參數(shù)統(tǒng)計變化曲線圖與參數(shù)分布變化直方圖可以看出,人工神經(jīng)網(wǎng)絡的參數(shù)分布情況在訓練過程中逐漸收斂到穩(wěn)定的分布狀態(tài)。

    圖18 “評論家”網(wǎng)絡模塊Eval網(wǎng)絡參數(shù)分布變化曲線Fig.18 Eval network parameter distribution curves in “Critic” network module

    無人機集群在不同訓練輪次下的平均回報值變化趨勢如圖19所示。

    由圖19可見,在算法的訓練過程中,無人機集群的行為收益值保持比較平穩(wěn)的狀態(tài)緩慢增加,說明無人機集群行為隨著訓練過程的不斷進行有著越來越好的表現(xiàn)。

    圖19 無人機集群在不同訓練輪次下的平均回報值Fig.19 Mean value of rewards under different training epochs for UAV swarm

    隨著算法訓練回合的增加,無人機集群在環(huán)境中的回合總回報變化趨勢如圖20所示。

    圖20 無人機集群在不同迭代輪次下的回合總回報Fig.20 Total rewards under different training epochs for UAV swarm

    無人機集群在不同訓練輪次下的任務完成率如圖21所示。

    從圖21可以看出,完成訓練后無人機集群執(zhí)行對敵來襲目標追擊任務的成功率可以達到95%左右。

    圖21 無人機集群在不同迭代輪次下的任務成功率Fig.21 Task completion rate under different training epochs for UAV swarm

    4.2 驗證過程

    使用5架相同無人機構(gòu)成集群完成所創(chuàng)建神經(jīng)網(wǎng)絡的訓練后,對訓練完成的模型進行了測試驗證。使用訓練完成的無人機集群執(zhí)行對目標的追擊任務,生成5架無人機集群及目標的初始狀態(tài),得到無人機集群追擊任務的軌跡圖如圖22所示。

    如圖22所示,使用訓練完成的神經(jīng)網(wǎng)絡模型很好地實現(xiàn)了5架無人機構(gòu)成集群執(zhí)行對目標的追擊任務。為了驗證模型對于動態(tài)數(shù)量無人機集群的適用性,分別使用10架和20架無人機構(gòu)成集群,對無人機集群的追擊任務進行驗證,得到無人機集群軌跡圖如圖23和圖24所示。

    圖23 10架無人機執(zhí)行追擊任務的軌跡Fig.23 Trajectory of 10 UAVs on pursuit mission

    圖24 20架無人機執(zhí)行追擊任務的軌跡Fig.24 Trajectories of 20 UAVs on pursuit mission

    由圖22~圖24可以看出,基于5架無人機訓練得到的模型能很好地應用于10和20架無人機用來執(zhí)行對敵來襲目標的追擊任務中,可以看出,DDPG算法對無人機集群的行為決策有著良好的適應能力和泛化能力。

    為了進一步驗證本文基于改進DDPG算法無人機集群模型的泛化能力和適應能力,對具有不同程度的逃逸策略的機動目標使用訓練完成的集群模型進行了實驗驗證,得到無人機集群軌跡圖如圖25所示。由圖25仿真結(jié)果可以看出,對于具有簡單逃逸策略的來襲目標,無人機集群很好地完成了預定的追擊任務。

    圖25 簡單逃逸策略下對20架無人機的追擊任務軌跡Fig.25 Trajectories of 20 UAVs on pursuit mission with simple escape strategy target

    在圖26的追擊任務場景中,當目標采用大機動逃逸運動策略時,由于來襲目標快速逃逸出了設定的任務邊界導致目標逃逸成功,但是訓練完成后的無人機集群仍然很好地完成了對預定目標的追擊任務。

    圖26 大機動逃逸策略下對20架無人機的追擊任務軌跡Fig.26 Trajectories of 20 UAVs on pursuit mission with big maneuver escape strategy target

    仿真實驗表明,深度強化學習能夠很好地滿足了無人機集群對于無中心化、自主化和自治化的要求。將人工智能算法應用在無人機集群的任務決策中具有很好的發(fā)展前景。

    5 結(jié) 論

    本文基于深度強化學習中的DDPG算法對無人機集群追擊任務進行了研究,為了平衡DDPG算法“探索-經(jīng)驗”的矛盾,在訓練過程中對無人機行為加入了自適應的噪聲單元,以增強算法的探索能力。為了提升算法性能,引入基于滑動平均值的軟更新策略減少了DDPG算法中Eval神經(jīng)網(wǎng)絡和Target神經(jīng)網(wǎng)絡在訓練過程中的參數(shù)震蕩,提高了算法的收斂速度。為解決深度強化學習中的“稀疏回報”問題,設計了指導型回報函數(shù),避免了無人機集群在長周期訓練條件下無法有效學習的問題,提升了算法的收斂性。

    訓練完成后的無人機集群能夠很好地執(zhí)行追擊任務。同時驗證了在不改變網(wǎng)絡模型和狀態(tài)空間結(jié)構(gòu)的前提下,訓練完成的模型能直接應用于更多無人機構(gòu)成的集群追擊任務中和具有不同程度逃逸策略的機動目標追擊任務中。仿真結(jié)果表明使用DDPG算法針對無人機集群的追擊任務可以求解出良好的行為策略,體現(xiàn)了基于人工神經(jīng)網(wǎng)絡的強化學習算法在提升無人機集群指揮決策模型的泛化能力上的巨大應用潛力。

    猜你喜歡
    評論家人工神經(jīng)網(wǎng)絡集群
    音樂評論家的“內(nèi)功”修煉——論八項追求
    中國音樂(2022年3期)2022-06-10 06:28:36
    著名詩人、評論家
    鴨綠江(2021年29期)2021-02-28 05:44:26
    著名詩人、評論家 吳思敬
    鴨綠江(2020年29期)2020-11-15 07:05:52
    利用人工神經(jīng)網(wǎng)絡快速計算木星系磁坐標
    海上小型無人機集群的反制裝備需求與應對之策研究
    評論家楊占平
    火花(2019年8期)2019-08-28 08:45:06
    人工神經(jīng)網(wǎng)絡實現(xiàn)簡單字母的識別
    電子制作(2019年10期)2019-06-17 11:45:10
    一種無人機集群發(fā)射回收裝置的控制系統(tǒng)設計
    電子制作(2018年11期)2018-08-04 03:25:40
    Python與Spark集群在收費數(shù)據(jù)分析中的應用
    勤快又呆萌的集群機器人
    可以在线观看的亚洲视频| 美女黄网站色视频| 欧美日本视频| 国产精品久久久久久久久免| 青春草亚洲视频在线观看| av国产免费在线观看| 免费av观看视频| 国产色婷婷99| 成人美女网站在线观看视频| 国产成人精品一,二区 | 22中文网久久字幕| 欧美日韩一区二区视频在线观看视频在线 | 久久精品影院6| 国产精品福利在线免费观看| 神马国产精品三级电影在线观看| 欧美精品一区二区大全| 久久久午夜欧美精品| 男的添女的下面高潮视频| 你懂的网址亚洲精品在线观看 | 99久久人妻综合| 一卡2卡三卡四卡精品乱码亚洲| 久久精品久久久久久久性| 韩国av在线不卡| 麻豆精品久久久久久蜜桃| 亚洲成人久久爱视频| 精品无人区乱码1区二区| 欧美色欧美亚洲另类二区| 亚洲最大成人手机在线| 一本久久精品| 日本一二三区视频观看| 国产亚洲精品久久久com| 毛片女人毛片| 国产淫片久久久久久久久| 好男人在线观看高清免费视频| 日韩亚洲欧美综合| 国产成人影院久久av| 国产亚洲av嫩草精品影院| 亚洲av免费高清在线观看| 一本一本综合久久| 国产淫片久久久久久久久| 麻豆国产av国片精品| 99久国产av精品国产电影| 亚洲欧美清纯卡通| 一本久久精品| 久久午夜亚洲精品久久| 亚洲成人久久爱视频| 韩国av在线不卡| 日本黄色片子视频| 成人鲁丝片一二三区免费| 婷婷色av中文字幕| 成人鲁丝片一二三区免费| 六月丁香七月| 午夜激情福利司机影院| 色尼玛亚洲综合影院| 赤兔流量卡办理| av天堂中文字幕网| 99国产极品粉嫩在线观看| 99久久成人亚洲精品观看| 校园春色视频在线观看| 成人av在线播放网站| 最近的中文字幕免费完整| 少妇人妻精品综合一区二区 | 99热全是精品| 18禁裸乳无遮挡免费网站照片| av卡一久久| 成人午夜高清在线视频| 国产黄片视频在线免费观看| 亚洲aⅴ乱码一区二区在线播放| 嫩草影院入口| 日韩成人av中文字幕在线观看| 欧美激情在线99| av在线播放精品| 搡老妇女老女人老熟妇| 亚洲av第一区精品v没综合| 亚洲欧美日韩卡通动漫| 夜夜爽天天搞| 久久午夜亚洲精品久久| 美女cb高潮喷水在线观看| 国模一区二区三区四区视频| 欧美成人a在线观看| 嫩草影院入口| 麻豆成人午夜福利视频| 久久人人爽人人片av| 嘟嘟电影网在线观看| 亚洲图色成人| 亚洲欧美日韩高清在线视频| 男女那种视频在线观看| 成人一区二区视频在线观看| 日韩成人伦理影院| 久久久久国产网址| 欧美日韩综合久久久久久| 国产极品精品免费视频能看的| 天天躁夜夜躁狠狠久久av| 哪个播放器可以免费观看大片| 男女做爰动态图高潮gif福利片| 我的女老师完整版在线观看| 亚洲精品粉嫩美女一区| 一夜夜www| 国产精品久久久久久av不卡| 亚洲国产色片| 青春草国产在线视频 | 欧美一级a爱片免费观看看| 人人妻人人看人人澡| 黄色一级大片看看| 午夜福利在线观看免费完整高清在 | 午夜a级毛片| 亚洲av.av天堂| 麻豆国产97在线/欧美| 午夜亚洲福利在线播放| 成人无遮挡网站| 国产麻豆成人av免费视频| 色视频www国产| 如何舔出高潮| 级片在线观看| 黄色欧美视频在线观看| 91精品一卡2卡3卡4卡| 国产毛片a区久久久久| 九九在线视频观看精品| 我的老师免费观看完整版| 亚洲成人精品中文字幕电影| 亚洲精品成人久久久久久| 亚洲欧洲日产国产| av卡一久久| 国产老妇伦熟女老妇高清| 一本久久精品| 夜夜爽天天搞| 99久久无色码亚洲精品果冻| 日日摸夜夜添夜夜爱| 六月丁香七月| 亚洲国产色片| 亚洲一区高清亚洲精品| 免费黄网站久久成人精品| 精品久久久久久成人av| 青春草视频在线免费观看| 国产激情偷乱视频一区二区| 亚洲精华国产精华液的使用体验 | 国产高清视频在线观看网站| 欧美一区二区国产精品久久精品| 观看美女的网站| 99久久精品国产国产毛片| 在线免费观看不下载黄p国产| 蜜桃亚洲精品一区二区三区| 高清在线视频一区二区三区 | 国产亚洲精品久久久com| 韩国av在线不卡| 十八禁国产超污无遮挡网站| a级一级毛片免费在线观看| 日韩,欧美,国产一区二区三区 | 欧美最新免费一区二区三区| av在线亚洲专区| 网址你懂的国产日韩在线| 国产高潮美女av| avwww免费| 国产一区二区激情短视频| 一级毛片久久久久久久久女| 免费人成视频x8x8入口观看| 日本欧美国产在线视频| 美女高潮的动态| 级片在线观看| 97超碰精品成人国产| 白带黄色成豆腐渣| 日韩一本色道免费dvd| 少妇丰满av| 床上黄色一级片| 亚洲国产精品成人综合色| 国产美女午夜福利| 一卡2卡三卡四卡精品乱码亚洲| 亚洲欧美日韩高清在线视频| 天天一区二区日本电影三级| 国产黄片美女视频| 99视频精品全部免费 在线| 亚洲精品乱码久久久久久按摩| 亚洲欧美成人综合另类久久久 | 国产成人福利小说| 亚洲国产精品成人综合色| 午夜激情欧美在线| 亚洲人成网站高清观看| 白带黄色成豆腐渣| 22中文网久久字幕| 精品一区二区免费观看| 国产视频首页在线观看| 国模一区二区三区四区视频| 狂野欧美白嫩少妇大欣赏| 99久久人妻综合| 中国美白少妇内射xxxbb| 在线a可以看的网站| 又粗又爽又猛毛片免费看| 久久亚洲精品不卡| 变态另类丝袜制服| 亚洲婷婷狠狠爱综合网| 国产视频内射| 欧洲精品卡2卡3卡4卡5卡区| 尾随美女入室| 日本免费一区二区三区高清不卡| 国产精品久久久久久精品电影| 狂野欧美激情性xxxx在线观看| 一本久久中文字幕| 国产精品蜜桃在线观看 | 中文字幕av成人在线电影| 一区福利在线观看| or卡值多少钱| 男插女下体视频免费在线播放| 又爽又黄无遮挡网站| 日韩大尺度精品在线看网址| 亚洲欧美成人精品一区二区| 久久精品91蜜桃| 草草在线视频免费看| 我要看日韩黄色一级片| 国产老妇伦熟女老妇高清| 欧美另类亚洲清纯唯美| 99热精品在线国产| 亚洲色图av天堂| 91午夜精品亚洲一区二区三区| 日韩av不卡免费在线播放| 午夜a级毛片| 国产视频首页在线观看| 一本一本综合久久| 中文在线观看免费www的网站| 熟妇人妻久久中文字幕3abv| 日韩av不卡免费在线播放| 少妇的逼好多水| 亚洲精品久久国产高清桃花| 男人狂女人下面高潮的视频| 国产av麻豆久久久久久久| 久久久久久久久久久免费av| 日日啪夜夜撸| 色哟哟·www| 国产亚洲av嫩草精品影院| 久久精品国产亚洲av天美| 麻豆成人av视频| 日韩av不卡免费在线播放| 国产成年人精品一区二区| а√天堂www在线а√下载| 国产精品一二三区在线看| 99精品在免费线老司机午夜| 波野结衣二区三区在线| 亚洲欧洲国产日韩| 少妇裸体淫交视频免费看高清| 亚洲欧美中文字幕日韩二区| 国产91av在线免费观看| 成人永久免费在线观看视频| 久久久久久九九精品二区国产| 国产精品免费一区二区三区在线| 最近中文字幕高清免费大全6| 性欧美人与动物交配| 亚洲av成人精品一区久久| 波野结衣二区三区在线| 26uuu在线亚洲综合色| 国产黄片视频在线免费观看| 日韩一区二区三区影片| 真实男女啪啪啪动态图| 搞女人的毛片| 在线观看av片永久免费下载| 亚洲国产欧美在线一区| 最后的刺客免费高清国语| 中文字幕制服av| 在线播放国产精品三级| 尾随美女入室| av天堂在线播放| 亚洲欧洲国产日韩| 国产 一区 欧美 日韩| 欧美激情国产日韩精品一区| 国产av在哪里看| 91久久精品国产一区二区三区| 可以在线观看的亚洲视频| 久久这里有精品视频免费| 日韩欧美 国产精品| 国产精品国产三级国产av玫瑰| 久久午夜福利片| 欧美高清性xxxxhd video| 老熟妇乱子伦视频在线观看| 久久国产乱子免费精品| 嫩草影院精品99| 欧美xxxx性猛交bbbb| 丝袜喷水一区| 久久久国产成人精品二区| 日本一本二区三区精品| 国产色爽女视频免费观看| 久久午夜福利片| 床上黄色一级片| av.在线天堂| 久久国内精品自在自线图片| 可以在线观看的亚洲视频| 欧洲精品卡2卡3卡4卡5卡区| 尾随美女入室| 日产精品乱码卡一卡2卡三| 狂野欧美激情性xxxx在线观看| 熟女人妻精品中文字幕| 成人午夜精彩视频在线观看| 久久热精品热| 国产精品爽爽va在线观看网站| 午夜爱爱视频在线播放| 亚洲成av人片在线播放无| 日韩精品青青久久久久久| 青青草视频在线视频观看| 欧美成人精品欧美一级黄| 国语自产精品视频在线第100页| 免费av毛片视频| 18禁裸乳无遮挡免费网站照片| 国产综合懂色| 亚洲第一区二区三区不卡| 国产精品人妻久久久影院| 免费搜索国产男女视频| 亚洲第一电影网av| av天堂中文字幕网| 久久精品国产清高在天天线| 在现免费观看毛片| 国产在线男女| 亚洲av中文av极速乱| 99九九线精品视频在线观看视频| 啦啦啦啦在线视频资源| 国产伦在线观看视频一区| 亚洲欧美精品专区久久| a级毛片免费高清观看在线播放| 麻豆av噜噜一区二区三区| 色综合色国产| 久久久成人免费电影| 性色avwww在线观看| 青春草视频在线免费观看| 蜜臀久久99精品久久宅男| 嫩草影院新地址| 一级av片app| 亚洲成人av在线免费| 久久人人爽人人爽人人片va| 热99re8久久精品国产| 国产精品99久久久久久久久| eeuss影院久久| 一边摸一边抽搐一进一小说| 日韩大尺度精品在线看网址| 中文字幕av成人在线电影| 亚洲av一区综合| 成人亚洲精品av一区二区| 国产高清不卡午夜福利| 亚洲精品色激情综合| 国产人妻一区二区三区在| 欧美激情国产日韩精品一区| 男人舔女人下体高潮全视频| 一本久久中文字幕| 国产伦精品一区二区三区四那| 午夜福利在线在线| 91在线精品国自产拍蜜月| 久久精品国产99精品国产亚洲性色| 国产精品一区二区三区四区免费观看| 亚洲av男天堂| 国产人妻一区二区三区在| 伦精品一区二区三区| 最好的美女福利视频网| 日本爱情动作片www.在线观看| 亚洲av电影不卡..在线观看| h日本视频在线播放| 99久久中文字幕三级久久日本| av女优亚洲男人天堂| 免费人成在线观看视频色| 91午夜精品亚洲一区二区三区| 偷拍熟女少妇极品色| 女的被弄到高潮叫床怎么办| 亚洲成人av在线免费| 欧美精品国产亚洲| 99热这里只有是精品在线观看| 久久精品国产亚洲av涩爱 | 一进一出抽搐动态| 国产精品乱码一区二三区的特点| 国产精品av视频在线免费观看| 国产精品嫩草影院av在线观看| 国产午夜精品一二区理论片| 18禁黄网站禁片免费观看直播| 69人妻影院| 日本三级黄在线观看| 寂寞人妻少妇视频99o| 男女边吃奶边做爰视频| 国产精品伦人一区二区| 亚洲国产高清在线一区二区三| 有码 亚洲区| 老司机福利观看| 美女脱内裤让男人舔精品视频 | 久久韩国三级中文字幕| 最近最新中文字幕大全电影3| 日韩欧美 国产精品| 免费大片18禁| 久久精品国产鲁丝片午夜精品| 亚洲欧美精品自产自拍| 青青草视频在线视频观看| 精品久久久久久成人av| 你懂的网址亚洲精品在线观看 | 欧美一区二区亚洲| 国产精品伦人一区二区| 日本-黄色视频高清免费观看| 国产精品三级大全| 校园春色视频在线观看| 午夜福利高清视频| 天美传媒精品一区二区| 国产久久久一区二区三区| 日韩欧美 国产精品| 亚洲av一区综合| 高清在线视频一区二区三区 | 国产探花在线观看一区二区| 只有这里有精品99| 国产高清有码在线观看视频| 国产在线精品亚洲第一网站| 亚洲激情五月婷婷啪啪| 国产精品女同一区二区软件| 最近最新中文字幕大全电影3| 中文欧美无线码| 久久午夜福利片| 久久久久久久久中文| 美女大奶头视频| 97热精品久久久久久| 久久这里有精品视频免费| 18禁黄网站禁片免费观看直播| 亚洲四区av| 熟妇人妻久久中文字幕3abv| 久久中文看片网| 中出人妻视频一区二区| 国产精品一区二区性色av| 一级二级三级毛片免费看| 日本在线视频免费播放| 日韩人妻高清精品专区| 校园人妻丝袜中文字幕| 成人综合一区亚洲| 亚洲国产精品sss在线观看| 亚洲av免费高清在线观看| 中国美白少妇内射xxxbb| 国产精品免费一区二区三区在线| 非洲黑人性xxxx精品又粗又长| 伦理电影大哥的女人| 色哟哟·www| 成人亚洲精品av一区二区| 日日啪夜夜撸| 国产成人影院久久av| 中国美白少妇内射xxxbb| 久久婷婷人人爽人人干人人爱| 三级毛片av免费| 精品久久久久久久久亚洲| 99久久无色码亚洲精品果冻| 亚洲三级黄色毛片| 国内揄拍国产精品人妻在线| 国产精品一二三区在线看| 黄色日韩在线| 亚洲无线在线观看| 午夜福利成人在线免费观看| 日韩人妻高清精品专区| 美女内射精品一级片tv| 国产伦理片在线播放av一区 | 嫩草影院新地址| 国产av麻豆久久久久久久| 色综合亚洲欧美另类图片| 免费看日本二区| 99久久久亚洲精品蜜臀av| 乱人视频在线观看| 一本精品99久久精品77| 我要搜黄色片| 人体艺术视频欧美日本| 亚洲国产欧美人成| 99久久人妻综合| 色尼玛亚洲综合影院| 日日啪夜夜撸| 亚洲四区av| h日本视频在线播放| 欧美性感艳星| 久久久精品大字幕| 精品国产三级普通话版| 婷婷色av中文字幕| 久久久久久九九精品二区国产| 成人无遮挡网站| 伊人久久精品亚洲午夜| or卡值多少钱| 亚洲在线自拍视频| 九九久久精品国产亚洲av麻豆| 一级黄片播放器| 国产极品精品免费视频能看的| 一本久久中文字幕| 天天一区二区日本电影三级| 久久久久久大精品| 欧美一级a爱片免费观看看| 草草在线视频免费看| 青春草国产在线视频 | 中文精品一卡2卡3卡4更新| 亚洲人成网站在线播| 蜜臀久久99精品久久宅男| 久久久久网色| 成年女人看的毛片在线观看| 日日干狠狠操夜夜爽| 国产成人午夜福利电影在线观看| 黑人高潮一二区| 午夜久久久久精精品| 男人舔女人下体高潮全视频| a级毛色黄片| 国产女主播在线喷水免费视频网站 | 亚洲三级黄色毛片| 91麻豆精品激情在线观看国产| 亚洲久久久久久中文字幕| 国产午夜精品久久久久久一区二区三区| 国产精品久久久久久精品电影小说 | 国产黄a三级三级三级人| 国产亚洲av片在线观看秒播厂 | 日韩 亚洲 欧美在线| 熟女电影av网| 69人妻影院| 国产av一区在线观看免费| 悠悠久久av| 18禁在线播放成人免费| 国产久久久一区二区三区| 三级国产精品欧美在线观看| 乱人视频在线观看| 在线播放国产精品三级| 边亲边吃奶的免费视频| 国产成人福利小说| 晚上一个人看的免费电影| 欧美成人精品欧美一级黄| 女同久久另类99精品国产91| АⅤ资源中文在线天堂| 久久久国产成人精品二区| 三级男女做爰猛烈吃奶摸视频| 长腿黑丝高跟| 亚洲一区高清亚洲精品| 人人妻人人澡人人爽人人夜夜 | 五月伊人婷婷丁香| 亚洲va在线va天堂va国产| 99久久精品一区二区三区| 亚洲国产精品sss在线观看| 久久午夜福利片| 天堂网av新在线| 国产午夜精品久久久久久一区二区三区| 精品久久久久久久末码| 国产在线男女| 男女做爰动态图高潮gif福利片| 91精品国产九色| 国产 一区精品| a级毛色黄片| 免费看a级黄色片| 国产精品一二三区在线看| 又粗又爽又猛毛片免费看| 亚洲欧美中文字幕日韩二区| 身体一侧抽搐| 99久国产av精品国产电影| 欧美日韩一区二区视频在线观看视频在线 | 九九在线视频观看精品| 一边摸一边抽搐一进一小说| 三级男女做爰猛烈吃奶摸视频| 中文在线观看免费www的网站| 成人三级黄色视频| 成人鲁丝片一二三区免费| 国产三级在线视频| 婷婷色av中文字幕| 国产极品天堂在线| 久久精品国产亚洲网站| 亚洲精品乱码久久久久久按摩| 在线免费观看不下载黄p国产| 日本免费一区二区三区高清不卡| 亚洲国产精品成人久久小说 | 给我免费播放毛片高清在线观看| 国产熟女欧美一区二区| 一级毛片我不卡| 永久网站在线| 久久久国产成人免费| 成人毛片a级毛片在线播放| 精品欧美国产一区二区三| 国产成人精品久久久久久| 男插女下体视频免费在线播放| 精品熟女少妇av免费看| 免费观看的影片在线观看| 久久精品91蜜桃| 好男人在线观看高清免费视频| 色哟哟哟哟哟哟| 国产美女午夜福利| 99国产极品粉嫩在线观看| 久久久国产成人精品二区| 五月伊人婷婷丁香| 亚洲国产精品久久男人天堂| 免费av毛片视频| 国产在线精品亚洲第一网站| 亚洲自偷自拍三级| 天堂av国产一区二区熟女人妻| 国国产精品蜜臀av免费| 日日摸夜夜添夜夜添av毛片| 校园人妻丝袜中文字幕| 婷婷亚洲欧美| 在线观看午夜福利视频| 美女脱内裤让男人舔精品视频 | 啦啦啦观看免费观看视频高清| 色哟哟·www| 国产精品不卡视频一区二区| 国产精品精品国产色婷婷| 日韩,欧美,国产一区二区三区 | 一个人观看的视频www高清免费观看| 黄色日韩在线| 男插女下体视频免费在线播放| 悠悠久久av| 少妇人妻精品综合一区二区 | 综合色丁香网| 久久鲁丝午夜福利片| av卡一久久| 三级男女做爰猛烈吃奶摸视频| 亚洲欧美清纯卡通| 成人毛片a级毛片在线播放| 国产视频内射| 久久精品国产自在天天线| 久久精品国产鲁丝片午夜精品| 97超视频在线观看视频| 欧美潮喷喷水| 国产一区二区三区在线臀色熟女| 尾随美女入室| 男女视频在线观看网站免费| 欧美区成人在线视频| 精品一区二区三区视频在线| 男女啪啪激烈高潮av片| 国产日本99.免费观看| 亚洲精品成人久久久久久| 直男gayav资源| 一边亲一边摸免费视频| 亚洲欧美成人精品一区二区| 观看美女的网站| 在线观看66精品国产| 日韩亚洲欧美综合| 亚洲精品日韩在线中文字幕 |