• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向無人機(jī)集群察打場景的PPO 算法設(shè)計(jì)

    2024-04-16 12:18:00李俊慧張振華聶天常車博山
    火力與指揮控制 2024年3期
    關(guān)鍵詞:藍(lán)方紅方集群

    李俊慧,張振華,邊 疆,聶天常,車博山

    (北方自動控制技術(shù)研究所,太原 030006)

    0 引言

    軍事作戰(zhàn)概念從“軍種聯(lián)合”到“跨域”,再到“全域作戰(zhàn)”的演變過程中,無人機(jī)集群充當(dāng)至關(guān)重要的角色[1]。無人機(jī)集群作為新的作戰(zhàn)力量,在未來戰(zhàn)場上發(fā)揮重要價值[2]。無人機(jī)集群通常執(zhí)行偵察、打擊等任務(wù)。執(zhí)行偵察打擊任務(wù)需要進(jìn)行合理決策,將任務(wù)分配給不同的無人機(jī),并規(guī)劃它們的行動路徑,使其能夠高效地完成任務(wù)。目前,無人機(jī)集群的任務(wù)分配與運(yùn)動規(guī)劃方法主要可分為規(guī)則算法、啟發(fā)式算法與深度強(qiáng)化學(xué)習(xí)算法3 類。其中,規(guī)則算法和啟發(fā)式算法受高維非線性、局部最優(yōu)、先驗(yàn)知識依賴問題的限制。與此同時,由于戰(zhàn)場環(huán)境的不確定性、復(fù)雜性和動態(tài)性,規(guī)則和啟發(fā)式方法效果不佳。深度強(qiáng)化學(xué)習(xí)是一種激勵學(xué)習(xí),通過獎勵或懲罰引導(dǎo)智能體學(xué)習(xí)從狀態(tài)空間到動作空間的映射,在激勵中不斷試錯糾正,甚至探索創(chuàng)新行為,最終根據(jù)可獲取的狀態(tài)給出最優(yōu)的策略。該算法能夠處理高維非線性問題,不需要對狀態(tài)進(jìn)行預(yù)測,不顯性建模行動和環(huán)境的相互影響,也可以不依賴先驗(yàn)信息,是解決復(fù)雜不確定條件下自主學(xué)習(xí)的有效手段[3]。因此,本文選用深度強(qiáng)化學(xué)習(xí)算法應(yīng)用到無人機(jī)集群任務(wù)分配和路徑規(guī)劃研究中。采用DRL 方法進(jìn)行無人機(jī)集群任務(wù)分配與運(yùn)動規(guī)劃的研究已經(jīng)取得一定的進(jìn)展。文獻(xiàn)[4]采用Actor-Critic 強(qiáng)化學(xué)習(xí)結(jié)構(gòu),網(wǎng)絡(luò)以NRBF 神經(jīng)網(wǎng)絡(luò)擬合,通過控制3 個變量實(shí)現(xiàn)了無人機(jī)的機(jī)動決策;文獻(xiàn)[5]選用軟行動者-評論家算法(soft actor-critic,SAC)結(jié)構(gòu),價值策略網(wǎng)絡(luò)均選用多層感知機(jī)擬合,通過控制前進(jìn)后退力度與朝向控制坦克的速度。文獻(xiàn)[4-5]控制的作戰(zhàn)單元少,決策的量少,任務(wù)復(fù)雜度低。文獻(xiàn)[6]通過多智能體近端策略優(yōu)化方法研究了實(shí)戰(zhàn)中常見的動態(tài)火力分配的決策問題。文獻(xiàn)中毀傷概率僅與來襲目標(biāo)相關(guān),忽略了戰(zhàn)場其他因素的影響。文獻(xiàn)[7]研究了不清楚威脅數(shù)量、位置和策略的條件下巡飛彈的突防問題,通過深度確定性策略梯度算法,巡飛彈實(shí)現(xiàn)了以同一高度固定速度進(jìn)行自主躲避藍(lán)方火力。該文獻(xiàn)一定程度證明了在動態(tài)對抗環(huán)境下的運(yùn)動自主性。在現(xiàn)實(shí)作戰(zhàn)中,更具實(shí)際意義的決策問題往往具有復(fù)雜性、動態(tài)性、不確定性等特點(diǎn)[3]。偵察打擊作戰(zhàn)中,通常包含多個單元移動、偵察、打擊、規(guī)避等決策點(diǎn),同時由于天氣的隨機(jī)性和藍(lán)方兵力部署的不確定等因素的影響,偵察概率與毀傷概率往往動態(tài)變化,任務(wù)難度大。

    綜上所述,如何在動態(tài)復(fù)雜不確定條件下進(jìn)行集群的任務(wù)分配與運(yùn)動規(guī)劃仍然是研究的難點(diǎn)和熱點(diǎn)。本文以無人機(jī)集群在不清楚藍(lán)方數(shù)量和位置的區(qū)域內(nèi)執(zhí)行偵察打擊任務(wù)為想定場景,主要的貢獻(xiàn)和創(chuàng)新點(diǎn)總結(jié)如下:

    1)為更真實(shí)反映戰(zhàn)場環(huán)境的不確定性,主要包括自然環(huán)境的隨機(jī)性和藍(lán)方兵力部署的未知性,通過在仿真平臺對戰(zhàn)場自然環(huán)境如天氣、地勢等進(jìn)行參數(shù)化建模,同時主要建模了環(huán)境對無人機(jī)傳感器偵察的影響,另外通過仿真平臺作戰(zhàn)規(guī)則模擬了藍(lán)方兵力部署的未知性,實(shí)現(xiàn)較大程度模擬了真實(shí)作戰(zhàn)場景。

    2)針對集群在不確定察打?qū)弓h(huán)境中的復(fù)雜決策問題,提出了較為通用的狀態(tài)空間、獎勵函數(shù)、動作空間與策略網(wǎng)絡(luò)設(shè)計(jì)方法,實(shí)現(xiàn)了基于PPO 的集群察打智能體的有效學(xué)習(xí)訓(xùn)練,解決了決策的復(fù)雜性。狀態(tài)空間從多個角度設(shè)計(jì)并提取特征,捕捉多維度戰(zhàn)場態(tài)勢信息,具有靈活性與可擴(kuò)展性;獎勵函數(shù)的設(shè)計(jì)緊密結(jié)合察打任務(wù)的作戰(zhàn)效果指標(biāo),以實(shí)現(xiàn)察打任務(wù)最優(yōu)化;動作策略采取主謂賓的形式,以更好地表達(dá)無人機(jī)集群的復(fù)雜決策動作;策略網(wǎng)絡(luò)選用編碼器-時序聚合- 注意力機(jī)制- 解碼器結(jié)構(gòu),降低優(yōu)化問題的復(fù)雜性,促進(jìn)訓(xùn)練收斂。

    3)在構(gòu)建的典型察打任務(wù)場景中,通過大規(guī)模并行仿真推演生成的數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),賦予了無人機(jī)集群運(yùn)動規(guī)劃和任務(wù)分配的智能性。通過實(shí)驗(yàn)驗(yàn)證了面對未知威脅時自主規(guī)避的運(yùn)動規(guī)劃的智能性與面向最大化毀傷能力的任務(wù)分配的智能性。

    1 復(fù)雜不確定性分析

    為構(gòu)建典型集群察打想定場景,使用了支持戰(zhàn)場環(huán)境模型參數(shù)化建模的仿真推演平臺。戰(zhàn)場環(huán)境模型主要指仿真模型庫和推演引擎中各種用于模擬實(shí)戰(zhàn)而建立的數(shù)學(xué)模型。該仿真推演平臺具備一定程度專業(yè)的可參數(shù)化戰(zhàn)場環(huán)境模型,能夠還原出實(shí)戰(zhàn)任務(wù)中決策的復(fù)雜性。

    1.1 戰(zhàn)場環(huán)境模型參數(shù)化設(shè)計(jì)

    仿真模型庫中包含實(shí)體模型和組件模型,其中實(shí)體模型有飛機(jī)、戰(zhàn)場設(shè)施、武器等,組件模型有傳感器、推進(jìn)系統(tǒng)、戰(zhàn)斗部、掛載方案等。對于實(shí)體模型,該平臺支持物理屬性和運(yùn)動與動力學(xué)的建模。其次,作戰(zhàn)實(shí)體模型通常配備各種傳感器和掛載方案,可通過參數(shù)化建模模擬組件的性能和配備效果。另外,仿真中涉及的作戰(zhàn)實(shí)體可模擬損傷和恢復(fù)過程。平臺還模擬了環(huán)境模型,環(huán)境因素對作戰(zhàn)實(shí)體的性能和行為都會產(chǎn)生影響。通過準(zhǔn)確建模仿真模型庫,可以使仿真平臺更真實(shí)地模擬作戰(zhàn)場景,并為實(shí)際作戰(zhàn)提供有價值的參考和決策支持。

    模型的真實(shí)性促使眾多因素互相影響,偵察打擊任務(wù)面臨著復(fù)雜不確定性的挑戰(zhàn)。其中,引起偵察任務(wù)中不確定性的因素涉及了傳感器模型、目標(biāo)類型以及天氣條件等方面,這些因素導(dǎo)致目標(biāo)的探測和識別概率變化不定,增加了任務(wù)的挑戰(zhàn)性。為在不同環(huán)境條件下獲得更全面的感知能力,紅方使用了雷達(dá)和光電傳感器模型,雷達(dá)模型負(fù)責(zé)長距離、受天氣影響小的目標(biāo)探測,而光電模型則在近距離和良好光照條件下提供更高分辨率的目標(biāo)信息。同樣地,打擊任務(wù)影響因素有武器效能和精度、火力密度、目標(biāo)類型、打擊時間以及藍(lán)方反應(yīng)等,這些因素造成任務(wù)中紅方執(zhí)行能力的不確定與藍(lán)方反擊的不確定,從而打擊的毀傷概率不確定。

    這里挑選了4 種典型的不同類型的戰(zhàn)場環(huán)境模型,并展示了其可參數(shù)化建模的關(guān)鍵屬性,如表1所示。

    表1 模型參數(shù)Table 1 Model parameters

    為更真實(shí)模擬實(shí)際戰(zhàn)場的復(fù)雜性和不確定性,每回合隨機(jī)設(shè)定天氣、藍(lán)方單元位置部署和藍(lán)方實(shí)力。通過這種方式增加了博弈對抗因素,提升智能體面對未知和不確定性的應(yīng)對能力,使訓(xùn)練出來的智能體更具有實(shí)戰(zhàn)價值。

    1.2 想定場景介紹

    紅方派出數(shù)架無人機(jī)前往某區(qū)域范圍內(nèi)執(zhí)行偵察打擊任務(wù),且收到的情報中沒有關(guān)于藍(lán)方的兵力部署情況。具體的任務(wù)內(nèi)容如下:無人機(jī)進(jìn)入?yún)^(qū)域后對藍(lán)方目標(biāo)進(jìn)行搜索,明確目標(biāo)位置與類型。此外,無人機(jī)需要完成對特定目標(biāo)的打擊毀傷。任務(wù)執(zhí)行過程中,若遭遇藍(lán)方防空火力的襲擊,無人機(jī)需要快速規(guī)避,避免被擊落。因此,無人機(jī)集群需要進(jìn)行有效及時的智能決策,任務(wù)復(fù)雜度高。

    2 深度強(qiáng)化學(xué)習(xí)決策算法設(shè)計(jì)

    2.1 狀態(tài)空間設(shè)計(jì)

    深度強(qiáng)化學(xué)習(xí)狀態(tài)空間的設(shè)計(jì)力求簡潔、高效。因此,狀態(tài)信息的篩選尤為重要。在訓(xùn)練過程中,深度神經(jīng)網(wǎng)絡(luò)需要從狀態(tài)信息中提煉出與長期回報高度關(guān)聯(lián)的特征。狀態(tài)信息的變化對獎勵的反饋越及時越容易建立決策相關(guān)性[8]。因此,需要選擇盡可能與獎勵即時聯(lián)動的信息。同時為了更好地幫助智能體全面建模和理解實(shí)體、任務(wù)、環(huán)境,以及它們相互之間的關(guān)系等信息,需要構(gòu)建多元的狀態(tài)信息,且要提升信息表達(dá)的通用泛化性。

    首先,每個作戰(zhàn)單元有自己的獨(dú)立屬性,多個單元的屬性特征建模為序列(sequence)特征。序列特征除了紅方單元外,也需要包含偵察到的藍(lán)方單元狀態(tài)信息。此外,在推演中由于毀傷的原因,單元的數(shù)量可變,因此,該序列特征長度可變。本文紅方單元屬性狀態(tài)變量包含經(jīng)緯高度、速度、毀傷情況、彈藥裝載量、執(zhí)行任務(wù)類型。藍(lán)方單元屬性變量有經(jīng)緯度、類別和毀傷情況。

    其次,任務(wù)通常在三維空間中執(zhí)行,在涉及空間決策的任務(wù)中,空間信息的缺失可能導(dǎo)致智能體在環(huán)境中無法準(zhǔn)確地執(zhí)行任務(wù)。本文建立了空間三維狀態(tài)信息,在柵格化空間區(qū)域累計(jì)紅方被擊中和被毀傷的次數(shù)以標(biāo)記威脅程度,幫助紅方更好地實(shí)現(xiàn)規(guī)避。

    本文還采用一維特征用于捕捉任務(wù)環(huán)境中的一些重要變量,如時間、天氣條件、任務(wù)進(jìn)度等。這些變量作為決策的依據(jù),影響智能體的策略選擇。

    同時,為提高狀態(tài)空間的靈活性與可擴(kuò)展性,對狀態(tài)信息進(jìn)行歸一化。常用的歸一化方法有Min-Max 歸一化、Z-Score 歸一化、范圍放縮法等。這里選用了Min-Max 歸一化如式(1),將狀態(tài)信息映射到[0,1]。

    2.2 獎勵函數(shù)設(shè)計(jì)

    獎勵函數(shù)的設(shè)計(jì)需要圍繞察打作戰(zhàn)業(yè)務(wù)指標(biāo)設(shè)計(jì),從而最優(yōu)化作戰(zhàn)效能。這里考慮的作戰(zhàn)效能主要包括偵察任務(wù)完成度、毀傷任務(wù)完成度、時間效率以及己方損失。獎勵的設(shè)計(jì)包含即時獎勵和任務(wù)完成獎勵。

    任務(wù)執(zhí)行過程中的即時獎勵為探索方向提供指導(dǎo)。即時獎勵統(tǒng)一采用范圍縮放法進(jìn)行歸一化,如式(2),將獎勵映射到[-1,1],避免不同類型獎勵差異過大。

    這里的即時獎勵主要有3 個,發(fā)現(xiàn)藍(lán)方目標(biāo)時給予正向獎勵、無人機(jī)被擊落時給予懲罰獎勵,以及造成藍(lán)方目標(biāo)毀傷時給予正向獎勵。

    式中,rd、B,b(t)、wd分別為偵察獎勵、藍(lán)方總數(shù)量、t時刻以前共識別目標(biāo)的數(shù)量和偵察獎勵權(quán)重。

    式中,ru、N、dn(t)、wu分別為無人機(jī)躲避獎勵、紅方無人機(jī)總數(shù)量、t 時刻第n 架無人機(jī)的損傷程度和無人機(jī)躲避獎勵權(quán)重。

    式中,ra、M、Omax、om(t)、wa分別為打擊獎勵、需要打擊目標(biāo)的總數(shù)量、目標(biāo)最大毀傷點(diǎn)、t 時刻打擊目標(biāo)m的毀傷點(diǎn)以及打擊獎勵權(quán)重。

    式中,rt、t、ts、tduration、wt分別為任務(wù)結(jié)束時間獎勵、仿真當(dāng)前時間、仿真開始時間、仿真持續(xù)時間和任務(wù)結(jié)束時間獎勵權(quán)重。

    任務(wù)成功完成后給予較大額度的獎勵,保證智能體的行為向著主線任務(wù)完成的趨勢靠近。

    式中,r 為所有即時獎勵與任務(wù)完成獎勵之和,其中re1和re2分別表示偵察任務(wù)和打擊任務(wù)完成時給予的獎勵。

    2.3 動作空間設(shè)計(jì)

    動作空間的設(shè)計(jì)原則包含功能完備、高效性設(shè)計(jì)以及合法性設(shè)計(jì)。

    本文設(shè)計(jì)了“指揮官模式”的智能體,通過該智能體下達(dá)命令使紅方作戰(zhàn)單元完成任務(wù)?,F(xiàn)實(shí)中指揮官在任務(wù)分配時需綜合考慮任務(wù)執(zhí)行者、動作類型和作用對象等因素。為使上述智能體動作空間具備現(xiàn)實(shí)指揮官的全部能力,同時使決策具有更好的可解釋性和表達(dá)復(fù)雜動作的能力,本文將動作輸出表示為自然語言結(jié)構(gòu),輸出設(shè)計(jì)采用主謂賓的形式,即執(zhí)行者、動作類型和作用對象。這里執(zhí)行者是紅方無人機(jī),動作類型分為偵察與打擊,當(dāng)動作為偵察時,作用對象為無人機(jī)所需偵察的經(jīng)緯度和移動時的高度速度;當(dāng)動作為打擊時,作用對象為打擊目標(biāo),以及無人機(jī)釋放彈藥所需到達(dá)的經(jīng)緯度和投彈高度速度。其中,執(zhí)行者和打擊目標(biāo)屬于離散的動作指令,而位置如經(jīng)緯高以及速度屬于連續(xù)的動作指令。連續(xù)空間擬合難度大,過細(xì)的動作粒度通常是冗余無必要的,文獻(xiàn)[9]表明離散化動作空間以解決連續(xù)控制問題是一種簡單而強(qiáng)大的策略優(yōu)化技術(shù)。因此,將連續(xù)的動作進(jìn)行離散化,同時選擇的離散化粒度需要平衡控制精度與解空間探索效率。

    實(shí)戰(zhàn)任務(wù)是在一系列作戰(zhàn)規(guī)則約束下進(jìn)行的。本文采用作戰(zhàn)規(guī)則和深度強(qiáng)化學(xué)習(xí)相結(jié)合的決策方式。無人機(jī)在三維戰(zhàn)場空間的運(yùn)動軌跡是在深度強(qiáng)化學(xué)習(xí)和規(guī)則兩者作用下生成。將三維經(jīng)緯高空間轉(zhuǎn)化為xyz 軸的三維空間,在研究中,深度強(qiáng)化學(xué)習(xí)決策無人機(jī)的動作包括經(jīng)度、緯度、高度和速度大小,這些因素對作戰(zhàn)效能起到關(guān)鍵影響,而具體無人機(jī)的運(yùn)動軌跡通常使用運(yùn)動規(guī)劃技術(shù)實(shí)現(xiàn),并結(jié)合自帶的飛行控制器進(jìn)行跟蹤,這里運(yùn)動規(guī)劃采用5 次多項(xiàng)式曲線插值,使得實(shí)際運(yùn)動的速度和加速度平滑連續(xù),易于跟蹤。飛控使用常見的設(shè)定三維位置點(diǎn)和速度的控制接口。其中,x 軸分量的運(yùn)動軌跡設(shè)為式(8),方程組(9)利用路徑點(diǎn)約束和最小二乘方法求解x 軸運(yùn)動軌跡。

    圖1 多項(xiàng)式求解運(yùn)動軌跡示意圖Fig.1 Schematic diagram of polynomial solution for motion trajectory

    圖2 運(yùn)動軌跡xy 平面投影圖Fig.2 Planar projection of motion trajectory xy

    無人機(jī)運(yùn)動軌跡描述:當(dāng)無人機(jī)處于盤旋狀態(tài),接收到指揮官智能體的指令,首先在xy 平面繼續(xù)順時針盤旋,調(diào)整無人機(jī)朝向,計(jì)算起始位置與終點(diǎn)位置的盤旋圓在二維的公共切線,當(dāng)無人機(jī)朝向與切線方向一致,無人機(jī)沿切線方向進(jìn)入飛行狀態(tài),到達(dá)目標(biāo)位置后以智能體給定的速度大小進(jìn)行順時針盤旋。當(dāng)無人機(jī)正處于飛向某目標(biāo)點(diǎn)的狀態(tài)時接收到臨機(jī)指令,無人機(jī)以當(dāng)前速度轉(zhuǎn)為盤旋狀態(tài),然后按照無人機(jī)處于盤旋狀態(tài)的軌跡進(jìn)行變化。

    另外,有些規(guī)則由仿真平臺交戰(zhàn)設(shè)置。圖3 中傳感器開關(guān)狀態(tài)由作戰(zhàn)電磁管控模塊負(fù)責(zé),作戰(zhàn)任務(wù)所需雷達(dá)一直處于開啟狀態(tài)。圖4 設(shè)置紅方對地目標(biāo)確認(rèn)為藍(lán)方目標(biāo)后,紅方無人機(jī)才能開火。

    圖3 傳感器設(shè)置Fig.3 Setting of sensors

    圖4 開火規(guī)則Fig.4 Firing rules

    2.4 策略網(wǎng)絡(luò)架構(gòu)

    整體的策略網(wǎng)絡(luò)結(jié)構(gòu)如下頁圖5 所示。策略網(wǎng)絡(luò)結(jié)構(gòu)選用編碼器-時序聚合- 注意力機(jī)制- 解碼器結(jié)構(gòu)。策略網(wǎng)絡(luò)結(jié)構(gòu)中各模塊功能與整體工作流程如下:

    圖5 策略網(wǎng)絡(luò)Fig.5 Strategy network

    1)編碼器將狀態(tài)值進(jìn)行特征提取和降維轉(zhuǎn)換。其中,作戰(zhàn)單元序列特征通過全連接神經(jīng)網(wǎng)絡(luò)(FC)和池化層(pooling)來提取特征和除去冗余信息;全局一維信息如天氣信息、任務(wù)進(jìn)度等經(jīng)過全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提?。豢臻g特征如威脅分布經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)(ANN)進(jìn)行特征提取與選擇。然后使用拼接操作(concat)得到一個高維特征表示,從而更好地學(xué)習(xí)與融合任務(wù)環(huán)境與實(shí)體等多元特征;

    2)時序聚合是通過將上述融合的高級特征輸入門控神經(jīng)網(wǎng)絡(luò)(GRU),挖掘長期依賴性,從而建模歷史信息對當(dāng)前作戰(zhàn)任務(wù)的影響;

    3)執(zhí)行者和作用對象的獲取需要使用注意力機(jī)制(attention)模塊,動態(tài)地分配注意力,使網(wǎng)絡(luò)注意力集中在重要性更高的信息上[10],從而選擇性地關(guān)注那些在當(dāng)前任務(wù)中更適合的無人機(jī)和當(dāng)前更適合的打擊目標(biāo)等;

    4)解碼器將注意力機(jī)制的輸出表示和時序聚合產(chǎn)生的特征表示轉(zhuǎn)換回到動作空間。注意力機(jī)制的輸出經(jīng)過激活函數(shù)(sigmoid)和概率采樣(sample)獲取執(zhí)行者(主語)和作用對象(賓語),時序聚合的輸出經(jīng)過全連接、激活函數(shù)和采樣得到?jīng)Q策的動作類型(謂語)。

    3 基于近端策略優(yōu)化的求解方法

    本次研究選用了深度強(qiáng)化學(xué)習(xí)中的近端策略優(yōu)化算法。PPO 在2017 年由SCHULMAN J 等提出,是一種基于策略梯度的強(qiáng)化學(xué)習(xí)算法,旨在解決深度強(qiáng)化學(xué)習(xí)中的穩(wěn)定性問題[11]。PPO 引入剪切系數(shù)可以確保策略更新不會過于劇烈,不會引起策略不穩(wěn)定,可以更好地適應(yīng)環(huán)境的變化,符合無人機(jī)集群由于行動前不清楚藍(lán)方目標(biāo)的位置和類型而需要頻繁地調(diào)整策略。

    值網(wǎng)絡(luò)損失函數(shù)用于優(yōu)化值網(wǎng)絡(luò)估計(jì)值與真實(shí)累積獎勵之間的誤差。PPO 利用式(14)作為值網(wǎng)絡(luò)損失函數(shù)計(jì)算梯度,更新值網(wǎng)絡(luò)參數(shù),優(yōu)化值網(wǎng)絡(luò)的評價能力。

    基于近端策略優(yōu)化算法的無人機(jī)集群執(zhí)行偵察打擊任務(wù)的決策算法,如算法1 所示。

    算法1 無人機(jī)集群執(zhí)行偵察打擊任務(wù)的決策算法1)初始化新舊actor 網(wǎng)絡(luò)參數(shù)θπ、θπold,critic 網(wǎng)絡(luò)參數(shù)θQ 2)采樣部分將狀態(tài)信息輸入到新actor 網(wǎng)絡(luò)輸出action,采樣獲取一個action,輸入環(huán)境中獲取r 與下一個狀態(tài)s,以此循環(huán)存儲episode 3)訓(xùn)練部分①從存儲的樣本中獲取一個batchsize 大小的樣本量將每個樣本中的狀態(tài)s 輸入到critic 網(wǎng)絡(luò)中輸出v 值,計(jì)算優(yōu)勢函數(shù)如式(12)、式(13)②使用優(yōu)勢函數(shù)計(jì)算值網(wǎng)絡(luò)損失如式(14),通過反向傳播更新值網(wǎng)絡(luò)參數(shù)θQ③計(jì)算當(dāng)前策略與舊策略的比值如式(11)④計(jì)算策略網(wǎng)絡(luò)損失如式(10),反向傳播更新新actor網(wǎng)絡(luò)參數(shù)θπ,從而更新舊actor 網(wǎng)絡(luò)參數(shù)θπold,

    4 仿真實(shí)驗(yàn)

    4.1 實(shí)驗(yàn)場景參數(shù)設(shè)置

    實(shí)驗(yàn)場景中對抗主體為紅方無人機(jī)集群和藍(lán)方地面設(shè)施。其中,紅方共16 架無人機(jī),藍(lán)方有7種類型,共13 個地面設(shè)施。具體類型和數(shù)量如下頁表2 所示。其中,無人機(jī)速度范圍為0~300 km/h,調(diào)整高度范圍為0~8 km。其中,雷達(dá)察打無人機(jī)的偵察范圍為15 km,光電察打無人機(jī)的偵察范圍為10 km,無人機(jī)最大攻擊距離為5 km。藍(lán)方SAM 地空導(dǎo)彈的最大攻擊距離是10 km,復(fù)仇者防空導(dǎo)彈的最大攻擊距離為10 km。

    表2 對抗雙方兵力情況Table 2 The forces situation of opposing sides

    下頁圖6 是上帝視角下的作戰(zhàn)雙方兵力分布情況。雙方作戰(zhàn)的區(qū)域長約79 km,寬約88 km。區(qū)域內(nèi)環(huán)境因素考慮了平均氣溫、降水量、云量和風(fēng)力/海況。任務(wù)完成需要偵察到大于80%的藍(lán)方目標(biāo)數(shù)量,同時對特定目標(biāo)跑道1、跑道2 和航空汽油油箱場站進(jìn)行毀傷。

    圖6 偵察打擊想定示意圖(上帝視角)Fig.6 Schematic diagram of reconnaissance and strike scenarios(god perspective)

    本次仿真基于ubuntu 系統(tǒng)完成了仿真推演和智能體訓(xùn)練。仿真基礎(chǔ)條件設(shè)置:想定推演速度為1 s,即仿真推演時間與實(shí)際時間一致;每輪仿真訓(xùn)練時長上限為2 h;每輪訓(xùn)練以規(guī)定時間內(nèi)紅方完成任務(wù)或規(guī)定時間內(nèi)未完成任務(wù)或達(dá)到仿真上限時間3 種情況結(jié)束;仿真每50 s 進(jìn)行一步?jīng)Q策。網(wǎng)絡(luò)超參數(shù)設(shè)置:單次采樣樣本量batch_size=1 024,策略熵?fù)p失系數(shù)entropy_coef=0.1,學(xué)習(xí)率lr=2e-4,剪切系數(shù)ε 采用原PPO 論文建議的數(shù)值0.2[11],優(yōu)勢函數(shù)gae 的時間步長gae_ length=128。具體的仿真的運(yùn)行流程如圖7 所示。

    圖7 仿真運(yùn)行流程圖Fig.7 Simulation running flow chart

    首先從仿真環(huán)境加載預(yù)定義的想定場景,并從仿真環(huán)境中實(shí)時獲取數(shù)據(jù)。篩選狀態(tài)空間變量,構(gòu)建獎勵函數(shù),優(yōu)化強(qiáng)化學(xué)習(xí)模型的參數(shù),使模型朝著紅方累積獎勵最大化的方向優(yōu)化。模型包括一個用于輸出動作的策略網(wǎng)絡(luò)(動作輸出網(wǎng)絡(luò))和一個用于評估狀態(tài)值的價值網(wǎng)絡(luò)(動作評價網(wǎng)絡(luò))。右虛線方框是智能體輸出與作戰(zhàn)規(guī)則結(jié)合的具體流程。方框中輸入量為智能體輸出的紅方無人機(jī)ID(主語)、打擊目標(biāo)ID(賓語)、任務(wù)類型(謂語)、經(jīng)緯高度(謂語)和速度(謂語)。中間過程是對主謂賓分配進(jìn)行作戰(zhàn)規(guī)則限制,其中,設(shè)置每個狀態(tài)結(jié)束后即飛到目的地,在沒有新的命令情況下,無人機(jī)進(jìn)入原地盤旋狀態(tài)等待。輸出量是DRL 與作戰(zhàn)規(guī)則結(jié)合的任務(wù)分配與運(yùn)動規(guī)劃。

    4.2 仿真結(jié)果分析

    實(shí)驗(yàn)從算法設(shè)計(jì)的合理性和作戰(zhàn)任務(wù)指標(biāo)兩方面進(jìn)行分析。曲線圖的橫坐標(biāo)均是訓(xùn)練步數(shù)(learning step),縱坐標(biāo)是相應(yīng)的算法或任務(wù)監(jiān)控指標(biāo)。訓(xùn)練基于分布式架構(gòu),因此,算法類指標(biāo)曲線圖8~圖10 呈現(xiàn)多曲線,表示不同訓(xùn)練容器生成的趨勢;而作戰(zhàn)任務(wù)指標(biāo)呈現(xiàn)單曲線,是計(jì)算總體獲取的平均值,如圖11~圖14。

    圖8 優(yōu)勢函數(shù)曲線Fig.8 Advantage function curve

    4.2.1 算法設(shè)計(jì)合理性分析

    圖8 是優(yōu)勢函數(shù)曲線,可以看出曲線整體呈現(xiàn)逐漸上升的趨勢,說明新策略比舊策略好。到訓(xùn)練后期,增加逐漸趨于緩慢,說明此時策略已經(jīng)相對穩(wěn)定。圖9 中可以看出,策略損失網(wǎng)絡(luò)隨訓(xùn)練進(jìn)行,逐漸維持在一個較小的范圍內(nèi),說明策略在逐步優(yōu)化并趨于穩(wěn)定。圖10 是值網(wǎng)絡(luò)損失函數(shù)曲線,該曲線用于衡量值函數(shù)估計(jì)與真實(shí)累積獎勵之間的誤差。曲線呈現(xiàn)下降趨勢,損失函數(shù)的值逐漸減小,說明值函數(shù)估計(jì)逐漸逼近真實(shí)累積獎勵。

    圖9 策略損失函數(shù)曲線Fig.9 Strategy loss function curve

    圖10 值網(wǎng)絡(luò)損失函數(shù)曲線Fig.10 Value network loss function curve

    4.2.2 作戰(zhàn)任務(wù)指標(biāo)分析

    從以下3 個指標(biāo)的曲線變化情況可知,隨著學(xué)習(xí)次數(shù)的持續(xù)增加,所訓(xùn)練模型在執(zhí)行任務(wù)時的指標(biāo)不斷得到優(yōu)化,最后保持穩(wěn)定。

    圖11 是無人機(jī)集群執(zhí)行偵察打擊任務(wù)的總獎勵曲線。總獎勵整體呈現(xiàn)上升趨勢,最后訓(xùn)練穩(wěn)定收斂。

    圖11 總獎勵函數(shù)曲線Fig.11 Total reward function curve

    下頁圖12 是目標(biāo)數(shù)量曲線。起初發(fā)現(xiàn)的目標(biāo)數(shù)量大致為7,這是由于不具備反制行為的目標(biāo)總數(shù)量為7,容易被偵察到,而剩余地面設(shè)施均有反制能力,無人機(jī)接近后易被擊落,導(dǎo)致無人機(jī)不易偵察到目標(biāo)。從曲線中可以看出隨著訓(xùn)練的進(jìn)行,偵察到的數(shù)量從7 增加到11 左右,說明無人機(jī)的偵察能力有所提升。

    圖12 目標(biāo)數(shù)量曲線Fig.12 Target quantity curve

    圖13 是無人機(jī)損失數(shù)量曲線。曲線中無人機(jī)折損的初始數(shù)量為8,說明剛開始無人機(jī)面臨突發(fā)的威脅不具備自主躲避火力攻擊的能力。隨著訓(xùn)練的進(jìn)行,曲線呈現(xiàn)下降趨勢達(dá)到3,說明無人機(jī)學(xué)到了快速偵察并撤離的策略,在盡快完成目標(biāo)偵察后,通過調(diào)整速度、航向、高度等動作空間中關(guān)鍵動作立即撤離目標(biāo)區(qū)域,體現(xiàn)了運(yùn)動規(guī)劃的智能性。

    圖13 無人機(jī)損失數(shù)量曲線Fig.13 Loss quantity curve of UAVs

    圖14 是目標(biāo)毀傷分?jǐn)?shù)。從曲線可以看出毀傷分?jǐn)?shù)從160 上升到260。經(jīng)過智能訓(xùn)練,在執(zhí)行毀傷任務(wù)時,通過改變無人機(jī)打擊時的速度高度航向,目標(biāo)分配的合理性等關(guān)鍵影響因素,學(xué)習(xí)到了最大化毀傷的任務(wù)分配的智能性。

    圖14 目標(biāo)毀傷分?jǐn)?shù)Fig.14 Target damage scores

    4.3 仿真結(jié)果驗(yàn)證

    仿真訓(xùn)練設(shè)定訓(xùn)練步數(shù)learning step 每增加200,生成用于本地計(jì)算機(jī)執(zhí)行的模型參數(shù)文本。仿真驗(yàn)證選用了learning step=1、1 000 和2 000 的訓(xùn)練模型,分別對三者仿真步長step=140。即仿真推演接近設(shè)定的作戰(zhàn)結(jié)束時間2 h 進(jìn)行了可視化界面展示,如圖15~圖17 所示。圖中每個作戰(zhàn)單元有對應(yīng)血量顯示,表現(xiàn)為單元附近的窄方塊。

    圖15 Learning step=1Fig.15 Learning step=1

    圖15 中紅方無人機(jī)偵察到藍(lán)方6 個目標(biāo),重度毀傷了跑道1(血量顏色為紅色),此時紅方剩余3 架無人機(jī);圖16 中偵察到藍(lán)方7 個目標(biāo),重度毀傷了跑道1,輕度毀傷了跑道2(血量顏色為黃色),無人機(jī)剩余9 架;圖17 中紅方無人機(jī)偵察到藍(lán)方11 個目標(biāo),一架無人機(jī)正對藍(lán)方航空汽油油箱場站進(jìn)行完全摧毀,重度毀傷了跑道1,中度毀傷了跑道2(血量顏色為橙色),自身剩余無人機(jī)10 架。

    圖16 Learning step=1 000Fig.16 Learning step=1 000

    圖17 Learning step=2 000Fig.17 Learning step=2 000

    通過上述可視化界面可知,藍(lán)方兵力部署具有對抗性。初始階段的訓(xùn)練模型,紅方無人機(jī)偵察藍(lán)方目標(biāo)數(shù)量少,且自身損毀數(shù)量多;后期穩(wěn)定階段的訓(xùn)練模型,紅方無人機(jī)不但可以躲避藍(lán)方的防空火力,而且可以偵察到較多數(shù)量的目標(biāo),并對目標(biāo)的毀傷也大幅提高。由此可見,基于近端策略優(yōu)化算法和規(guī)則的決策模型在無人機(jī)集群偵察場景中具有一定有效性。

    5 結(jié)論

    本文針對復(fù)雜不確定條件下構(gòu)建的無人機(jī)集群典型偵察打擊任務(wù)想定,通過設(shè)計(jì)狀態(tài)空間、動作空間、獎勵函數(shù)和策略網(wǎng)絡(luò),搭建了基于PPO 的深度強(qiáng)化學(xué)習(xí)框架。通過仿真實(shí)驗(yàn)結(jié)果表明,實(shí)現(xiàn)了察打任務(wù)的作戰(zhàn)效能最優(yōu),體現(xiàn)了無人機(jī)集群運(yùn)動規(guī)劃和任務(wù)分配的智能性。該方法可為復(fù)雜不確定條件下大規(guī)模無人集群決策提供技術(shù)借鑒,同時該方法可以進(jìn)一步豐富和接入更專業(yè)的武器裝備參數(shù)和數(shù)據(jù),對實(shí)戰(zhàn)化環(huán)境中的無人機(jī)集群察打指揮決策具有重要意義。

    猜你喜歡
    藍(lán)方紅方集群
    如何在方格紙上確定位置
    海上小型無人機(jī)集群的反制裝備需求與應(yīng)對之策研究
    一種無人機(jī)集群發(fā)射回收裝置的控制系統(tǒng)設(shè)計(jì)
    電子制作(2018年11期)2018-08-04 03:25:40
    精彩的足球比賽
    Python與Spark集群在收費(fèi)數(shù)據(jù)分析中的應(yīng)用
    暗號
    勤快又呆萌的集群機(jī)器人
    暗號
    小小說月刊(2015年5期)2016-01-22 08:39:19
    暗號
    試論棋例裁決難點(diǎn)
    棋藝(2014年3期)2014-05-29 14:27:14
    国产av码专区亚洲av| 精品午夜福利在线看| 久久综合国产亚洲精品| 人妻系列 视频| 亚洲在线观看片| 色综合色国产| 又大又黄又爽视频免费| av一本久久久久| 国产精品嫩草影院av在线观看| 国产爽快片一区二区三区| 久久久精品免费免费高清| 久久精品国产亚洲av涩爱| 精品国产露脸久久av麻豆| 人人妻人人澡人人爽人人夜夜| 99久久精品国产国产毛片| 2021少妇久久久久久久久久久| 亚洲四区av| 久久久国产一区二区| videossex国产| 久久久久国产精品人妻一区二区| 成年免费大片在线观看| 成人亚洲精品av一区二区| 国产淫语在线视频| 黄色一级大片看看| 国产爱豆传媒在线观看| 亚洲美女视频黄频| 一本色道久久久久久精品综合| 国产成人精品婷婷| 久久久亚洲精品成人影院| 国产精品av视频在线免费观看| 亚洲欧美精品专区久久| av播播在线观看一区| 国产一区亚洲一区在线观看| 国产亚洲最大av| 亚洲欧洲日产国产| 嫩草影院精品99| 性插视频无遮挡在线免费观看| 18禁在线无遮挡免费观看视频| 简卡轻食公司| 亚洲精品第二区| 狠狠精品人妻久久久久久综合| 亚洲人成网站高清观看| 高清视频免费观看一区二区| 全区人妻精品视频| 国产精品国产三级专区第一集| 免费播放大片免费观看视频在线观看| 又粗又硬又长又爽又黄的视频| 嫩草影院新地址| 国模一区二区三区四区视频| 韩国av在线不卡| 亚洲精品一区蜜桃| 伦精品一区二区三区| 美女脱内裤让男人舔精品视频| 日韩人妻高清精品专区| 久久精品国产自在天天线| 亚洲av免费在线观看| 久久ye,这里只有精品| 国产精品熟女久久久久浪| 亚洲国产精品国产精品| 熟女电影av网| 亚洲欧美成人综合另类久久久| 大码成人一级视频| 校园人妻丝袜中文字幕| 九九爱精品视频在线观看| 99久久九九国产精品国产免费| 五月伊人婷婷丁香| 精品久久久精品久久久| 老女人水多毛片| 亚洲经典国产精华液单| 一级片'在线观看视频| 好男人在线观看高清免费视频| 天堂网av新在线| 边亲边吃奶的免费视频| 国产精品女同一区二区软件| 成年av动漫网址| 亚洲成色77777| 日韩制服骚丝袜av| av女优亚洲男人天堂| 久久精品熟女亚洲av麻豆精品| 交换朋友夫妻互换小说| 亚洲精品国产成人久久av| 人妻系列 视频| 国产精品99久久久久久久久| eeuss影院久久| 日日摸夜夜添夜夜爱| 九九爱精品视频在线观看| 三级男女做爰猛烈吃奶摸视频| 99热网站在线观看| 午夜爱爱视频在线播放| 亚洲在久久综合| 免费看a级黄色片| 综合色丁香网| videos熟女内射| av.在线天堂| 2018国产大陆天天弄谢| 一本一本综合久久| 久久久欧美国产精品| 亚洲精品,欧美精品| 日本av手机在线免费观看| 久久久久久久大尺度免费视频| 日韩国内少妇激情av| 日韩伦理黄色片| 国产av国产精品国产| 丝瓜视频免费看黄片| 美女脱内裤让男人舔精品视频| 亚洲自偷自拍三级| 99热这里只有是精品在线观看| 在线精品无人区一区二区三 | av又黄又爽大尺度在线免费看| 国产老妇伦熟女老妇高清| 99久久精品一区二区三区| 午夜日本视频在线| 久久韩国三级中文字幕| 天堂俺去俺来也www色官网| 国产成人a区在线观看| 在线a可以看的网站| 精品一区二区免费观看| 熟女人妻精品中文字幕| tube8黄色片| 亚洲精品,欧美精品| 综合色av麻豆| 性色av一级| 免费大片黄手机在线观看| 神马国产精品三级电影在线观看| 啦啦啦在线观看免费高清www| 成人无遮挡网站| 国产成人a区在线观看| av.在线天堂| 国产精品成人在线| 日日摸夜夜添夜夜爱| 黄色视频在线播放观看不卡| 国产精品国产av在线观看| 免费看a级黄色片| 亚洲欧美日韩卡通动漫| 日韩视频在线欧美| 亚洲精品日韩av片在线观看| 亚洲四区av| 亚洲人成网站在线观看播放| 少妇丰满av| 性色avwww在线观看| 成人综合一区亚洲| 亚洲精品乱码久久久久久按摩| 国产精品女同一区二区软件| 国产高清三级在线| 日本与韩国留学比较| 一二三四中文在线观看免费高清| 联通29元200g的流量卡| 欧美日韩精品成人综合77777| 美女内射精品一级片tv| 国产精品国产av在线观看| 精华霜和精华液先用哪个| 一区二区三区免费毛片| 欧美老熟妇乱子伦牲交| 亚洲伊人久久精品综合| 国产视频内射| 亚洲电影在线观看av| 国产亚洲午夜精品一区二区久久 | 亚洲欧美成人综合另类久久久| 99久久精品国产国产毛片| 国产在线男女| 国产成人免费观看mmmm| 韩国高清视频一区二区三区| 全区人妻精品视频| 视频中文字幕在线观看| 亚洲人成网站高清观看| 亚洲精品成人久久久久久| 性色avwww在线观看| 80岁老熟妇乱子伦牲交| 精品一区二区免费观看| 色视频www国产| 一个人看的www免费观看视频| 国产男人的电影天堂91| 国产美女午夜福利| 国产高清不卡午夜福利| 成人漫画全彩无遮挡| 九九爱精品视频在线观看| 国产免费一级a男人的天堂| 成人漫画全彩无遮挡| 日本三级黄在线观看| 两个人的视频大全免费| 久久韩国三级中文字幕| 中国美白少妇内射xxxbb| 亚洲欧洲国产日韩| 男人爽女人下面视频在线观看| 色5月婷婷丁香| 亚洲国产av新网站| 天堂俺去俺来也www色官网| 波野结衣二区三区在线| 欧美性感艳星| 国产色婷婷99| 国产真实伦视频高清在线观看| 天天躁日日操中文字幕| 国产精品人妻久久久久久| 日韩不卡一区二区三区视频在线| 日韩 亚洲 欧美在线| 黄色一级大片看看| 久久久精品欧美日韩精品| 九九爱精品视频在线观看| 中文天堂在线官网| 91精品伊人久久大香线蕉| 国产淫语在线视频| 精品一区二区免费观看| 国产精品久久久久久久久免| 天天躁夜夜躁狠狠久久av| 一二三四中文在线观看免费高清| 国产熟女欧美一区二区| 性色av一级| 人妻 亚洲 视频| 纵有疾风起免费观看全集完整版| 亚洲国产欧美在线一区| 99久国产av精品国产电影| 亚洲av成人精品一区久久| 三级男女做爰猛烈吃奶摸视频| 哪个播放器可以免费观看大片| 日韩成人av中文字幕在线观看| 最近2019中文字幕mv第一页| 成人午夜精彩视频在线观看| 久久精品人妻少妇| 国产国拍精品亚洲av在线观看| 性插视频无遮挡在线免费观看| 亚洲精品456在线播放app| 精品少妇黑人巨大在线播放| 久久国产乱子免费精品| 夫妻午夜视频| 99热全是精品| 亚洲最大成人中文| 最新中文字幕久久久久| 亚洲婷婷狠狠爱综合网| 又黄又爽又刺激的免费视频.| 日本黄大片高清| 国产男女内射视频| 亚洲欧美日韩另类电影网站 | 午夜老司机福利剧场| 成人鲁丝片一二三区免费| 亚洲精品一二三| 欧美日韩视频精品一区| 色播亚洲综合网| 亚洲av在线观看美女高潮| 一级毛片黄色毛片免费观看视频| 中文精品一卡2卡3卡4更新| 狂野欧美激情性bbbbbb| 99久久精品一区二区三区| 午夜福利在线观看免费完整高清在| 菩萨蛮人人尽说江南好唐韦庄| 久久午夜福利片| 亚洲不卡免费看| 99久久九九国产精品国产免费| av播播在线观看一区| 成人国产av品久久久| 欧美精品一区二区大全| 久久久精品94久久精品| 久久久久国产精品人妻一区二区| 国产伦在线观看视频一区| 成人黄色视频免费在线看| 男人和女人高潮做爰伦理| 女人久久www免费人成看片| 欧美少妇被猛烈插入视频| 伊人久久国产一区二区| 视频区图区小说| 99热全是精品| 大话2 男鬼变身卡| 国产亚洲av嫩草精品影院| 国产精品一区二区三区四区免费观看| 欧美另类一区| 一级爰片在线观看| 99久久中文字幕三级久久日本| 国产精品久久久久久久久免| av播播在线观看一区| 在线免费十八禁| 大陆偷拍与自拍| 亚洲av一区综合| 秋霞伦理黄片| 最近最新中文字幕免费大全7| 成人二区视频| 91午夜精品亚洲一区二区三区| 日韩欧美精品免费久久| 免费av不卡在线播放| 久久综合国产亚洲精品| 成人欧美大片| 少妇的逼好多水| 亚洲国产成人一精品久久久| 97人妻精品一区二区三区麻豆| 国产黄色视频一区二区在线观看| 午夜福利网站1000一区二区三区| 大香蕉97超碰在线| 美女脱内裤让男人舔精品视频| 亚洲欧美日韩卡通动漫| 搞女人的毛片| 国产综合精华液| 波多野结衣巨乳人妻| 亚洲一级一片aⅴ在线观看| 欧美丝袜亚洲另类| 蜜臀久久99精品久久宅男| 丝袜脚勾引网站| 欧美区成人在线视频| 亚洲色图综合在线观看| 不卡视频在线观看欧美| 日韩成人av中文字幕在线观看| 国产在线男女| 久久精品综合一区二区三区| 男女无遮挡免费网站观看| 亚洲综合色惰| 久久精品国产亚洲av天美| 国产精品偷伦视频观看了| 亚洲成人久久爱视频| 精品熟女少妇av免费看| 2021少妇久久久久久久久久久| h日本视频在线播放| 午夜免费鲁丝| 99re6热这里在线精品视频| 91久久精品国产一区二区三区| 免费少妇av软件| 亚洲伊人久久精品综合| 精品亚洲乱码少妇综合久久| 日本wwww免费看| 亚洲国产成人一精品久久久| 久久精品国产自在天天线| 啦啦啦啦在线视频资源| 日韩欧美精品v在线| 免费在线观看成人毛片| av在线观看视频网站免费| 水蜜桃什么品种好| 欧美精品人与动牲交sv欧美| 99久国产av精品国产电影| 大陆偷拍与自拍| 性插视频无遮挡在线免费观看| 国产欧美亚洲国产| 卡戴珊不雅视频在线播放| 国产成人freesex在线| 激情 狠狠 欧美| 波多野结衣巨乳人妻| 精品久久久久久久久av| 日韩欧美一区视频在线观看 | 搡女人真爽免费视频火全软件| 性色avwww在线观看| 一级毛片aaaaaa免费看小| 国产 一区精品| 久久久久九九精品影院| 免费av观看视频| 成人国产麻豆网| 在线 av 中文字幕| 一个人看视频在线观看www免费| 各种免费的搞黄视频| 啦啦啦啦在线视频资源| 精品国产露脸久久av麻豆| 久久影院123| 亚洲精品乱码久久久v下载方式| 交换朋友夫妻互换小说| 国产免费视频播放在线视频| 美女被艹到高潮喷水动态| 26uuu在线亚洲综合色| 国产片特级美女逼逼视频| 久久鲁丝午夜福利片| 一级毛片电影观看| 免费黄频网站在线观看国产| 亚洲熟女精品中文字幕| 国产精品久久久久久精品电影小说 | 欧美高清成人免费视频www| 精品久久久久久久久av| 另类亚洲欧美激情| 激情 狠狠 欧美| 91精品一卡2卡3卡4卡| 狂野欧美激情性xxxx在线观看| 午夜视频国产福利| 欧美另类一区| 亚洲国产精品999| 一级二级三级毛片免费看| 熟女av电影| 99九九线精品视频在线观看视频| 日韩国内少妇激情av| 91在线精品国自产拍蜜月| 人妻制服诱惑在线中文字幕| 毛片一级片免费看久久久久| .国产精品久久| videossex国产| 国产老妇女一区| 性色avwww在线观看| 高清午夜精品一区二区三区| 在现免费观看毛片| 91久久精品电影网| 下体分泌物呈黄色| 亚洲一区二区三区欧美精品 | 日本wwww免费看| 亚洲av不卡在线观看| 欧美最新免费一区二区三区| 欧美另类一区| 久久久久久久大尺度免费视频| 国产午夜福利久久久久久| 日韩强制内射视频| 亚洲国产精品国产精品| 日本与韩国留学比较| 亚洲av免费高清在线观看| 不卡视频在线观看欧美| 欧美性猛交╳xxx乱大交人| 国产色婷婷99| 日韩不卡一区二区三区视频在线| 免费在线观看成人毛片| 亚洲第一区二区三区不卡| 一区二区三区四区激情视频| 国产又色又爽无遮挡免| av又黄又爽大尺度在线免费看| 欧美高清性xxxxhd video| 2021天堂中文幕一二区在线观| 老司机影院成人| 亚洲成色77777| 久久久久久久精品精品| 另类亚洲欧美激情| 久久久国产一区二区| 精品亚洲乱码少妇综合久久| 最新中文字幕久久久久| 老师上课跳d突然被开到最大视频| 97超视频在线观看视频| 成人欧美大片| 一级毛片久久久久久久久女| 成年版毛片免费区| 国产亚洲精品久久久com| 边亲边吃奶的免费视频| 国产亚洲一区二区精品| 亚洲欧洲国产日韩| 男女那种视频在线观看| a级毛片免费高清观看在线播放| 日韩在线高清观看一区二区三区| 亚洲,一卡二卡三卡| 国产中年淑女户外野战色| 久久久亚洲精品成人影院| a级毛色黄片| 亚洲天堂av无毛| 蜜桃久久精品国产亚洲av| 国产精品一及| 久久久精品免费免费高清| 国产精品精品国产色婷婷| 十八禁网站网址无遮挡 | 国产亚洲最大av| 麻豆成人av视频| 女人十人毛片免费观看3o分钟| 黄色日韩在线| 五月天丁香电影| 亚洲av中文av极速乱| 一级av片app| 日韩不卡一区二区三区视频在线| 成人美女网站在线观看视频| 在线观看国产h片| 内射极品少妇av片p| 亚洲精品影视一区二区三区av| 国产熟女欧美一区二区| 人妻少妇偷人精品九色| 国产真实伦视频高清在线观看| 欧美成人午夜免费资源| 亚州av有码| 国产伦精品一区二区三区四那| 欧美一区二区亚洲| 国产白丝娇喘喷水9色精品| 最近中文字幕高清免费大全6| 欧美高清成人免费视频www| 亚洲伊人久久精品综合| 亚洲成人久久爱视频| 国产免费一级a男人的天堂| 亚洲欧美日韩另类电影网站 | 97在线人人人人妻| 搡女人真爽免费视频火全软件| 女的被弄到高潮叫床怎么办| 国产午夜精品久久久久久一区二区三区| 国产老妇伦熟女老妇高清| 免费观看av网站的网址| 亚洲va在线va天堂va国产| 22中文网久久字幕| 在线观看免费高清a一片| 免费看光身美女| 黄色怎么调成土黄色| 日韩成人伦理影院| 亚洲精品国产色婷婷电影| 人人妻人人看人人澡| 一级毛片电影观看| 国产精品国产av在线观看| 综合色av麻豆| 在线播放无遮挡| 偷拍熟女少妇极品色| kizo精华| 我要看日韩黄色一级片| 另类亚洲欧美激情| 搡老乐熟女国产| 亚洲无线观看免费| 青青草视频在线视频观看| 欧美激情国产日韩精品一区| 天美传媒精品一区二区| 日韩,欧美,国产一区二区三区| 91在线精品国自产拍蜜月| www.av在线官网国产| 一个人观看的视频www高清免费观看| 成人免费观看视频高清| 18禁在线无遮挡免费观看视频| 大陆偷拍与自拍| 美女cb高潮喷水在线观看| 亚洲欧美精品自产自拍| 色婷婷久久久亚洲欧美| 欧美精品一区二区大全| 国产人妻一区二区三区在| .国产精品久久| 人人妻人人澡人人爽人人夜夜| 亚洲av电影在线观看一区二区三区 | 小蜜桃在线观看免费完整版高清| 精品久久久久久久久av| 国产色爽女视频免费观看| 99久久精品热视频| 国产爽快片一区二区三区| 22中文网久久字幕| 亚洲怡红院男人天堂| 午夜激情福利司机影院| 午夜福利在线观看免费完整高清在| 春色校园在线视频观看| 成人毛片60女人毛片免费| 亚洲欧美中文字幕日韩二区| 日韩一本色道免费dvd| 99热6这里只有精品| 国产一区二区三区av在线| 在线亚洲精品国产二区图片欧美 | 在线看a的网站| 简卡轻食公司| 久久久亚洲精品成人影院| 最近的中文字幕免费完整| 精品人妻偷拍中文字幕| 99热全是精品| 国产精品福利在线免费观看| 亚洲精品成人av观看孕妇| 国产精品一区二区性色av| 春色校园在线视频观看| 你懂的网址亚洲精品在线观看| 亚洲四区av| 日韩欧美 国产精品| 丰满少妇做爰视频| 成年女人看的毛片在线观看| 男人爽女人下面视频在线观看| 国语对白做爰xxxⅹ性视频网站| 亚洲,欧美,日韩| 少妇裸体淫交视频免费看高清| 国产一区有黄有色的免费视频| 亚洲欧美日韩无卡精品| 亚洲欧美一区二区三区国产| 亚洲av中文av极速乱| 国产亚洲一区二区精品| 亚洲精品,欧美精品| 久久精品久久久久久久性| 免费观看a级毛片全部| 精品99又大又爽又粗少妇毛片| 亚洲欧洲国产日韩| 中文字幕人妻熟人妻熟丝袜美| 97超视频在线观看视频| 精品视频人人做人人爽| 国产一区二区亚洲精品在线观看| 欧美高清成人免费视频www| 在线观看美女被高潮喷水网站| 人妻制服诱惑在线中文字幕| 天天躁日日操中文字幕| 一级毛片黄色毛片免费观看视频| 五月天丁香电影| 久久精品人妻少妇| 国产69精品久久久久777片| av免费观看日本| 蜜桃久久精品国产亚洲av| 国产精品国产三级国产av玫瑰| 中文字幕久久专区| 国产精品爽爽va在线观看网站| 国产探花极品一区二区| 国产黄片视频在线免费观看| 亚洲欧美一区二区三区黑人 | 欧美成人a在线观看| 婷婷色麻豆天堂久久| 国产 一区 欧美 日韩| 黄色怎么调成土黄色| 国产免费一级a男人的天堂| 99热这里只有精品一区| 国产视频首页在线观看| 国产精品久久久久久久电影| 久热久热在线精品观看| 国产一区二区亚洲精品在线观看| 亚洲成人av在线免费| 免费看av在线观看网站| 国产男女内射视频| 老司机影院毛片| 干丝袜人妻中文字幕| 大码成人一级视频| 成年版毛片免费区| 国产精品一二三区在线看| 黑人高潮一二区| 欧美激情久久久久久爽电影| 欧美xxxx性猛交bbbb| 最近最新中文字幕免费大全7| 十八禁网站网址无遮挡 | 99久久精品国产国产毛片| 五月伊人婷婷丁香| 国产午夜精品一二区理论片| 一区二区三区乱码不卡18| 欧美日韩视频精品一区| 久久久精品免费免费高清| 一区二区三区乱码不卡18| av免费观看日本| 国内精品美女久久久久久| 中文字幕亚洲精品专区| 亚洲最大成人av| 大话2 男鬼变身卡| 亚洲图色成人| 欧美另类一区| 精品熟女少妇av免费看| 国产91av在线免费观看| 听说在线观看完整版免费高清| av在线蜜桃| 尤物成人国产欧美一区二区三区| 天美传媒精品一区二区| 91午夜精品亚洲一区二区三区| 丝袜喷水一区| 日日摸夜夜添夜夜爱| 只有这里有精品99| 国产探花在线观看一区二区| 一区二区三区免费毛片| 亚洲熟女精品中文字幕|