• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    伴隨壓制干擾與組網(wǎng)雷達(dá)功率分配的深度博弈研究

    2023-07-04 09:51:58王躍東顧以靜王增福張會(huì)霞
    雷達(dá)學(xué)報(bào) 2023年3期
    關(guān)鍵詞:干擾機(jī)資源分配分配

    王躍東 顧以靜 梁 彥* 王增福 張會(huì)霞

    ①(西北工業(yè)大學(xué)自動(dòng)化學(xué)院 西安 710072)

    ②(信息融合技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室 西安 710072)

    1 引言

    組網(wǎng)雷達(dá)(Networked Radar,NR)因具有資源共享、協(xié)同探測(cè)、空間覆蓋范圍大和抗干擾等優(yōu)勢(shì),已經(jīng)受到廣大學(xué)者和機(jī)構(gòu)的關(guān)注[1–8]。組網(wǎng)雷達(dá)資源管理在提升信息融合系統(tǒng)的探測(cè)、跟蹤性能中扮演著至關(guān)重要的角色。然而,干擾技術(shù)向智能化方向發(fā)展[9–13],給雷達(dá)系統(tǒng)資源管理帶來(lái)新的挑戰(zhàn)和任務(wù)需求。如何在時(shí)間、能量和計(jì)算等軟硬件資源限制下,降低干擾帶來(lái)的不利影響,是實(shí)現(xiàn)組網(wǎng)雷達(dá)探測(cè)性能提升的關(guān)鍵。

    現(xiàn)有的組網(wǎng)雷達(dá)資源分配方法主要分為3類:基于啟發(fā)式優(yōu)化方法、基于博弈論方法和基于強(qiáng)化學(xué)習(xí)方法?;趩l(fā)式優(yōu)化方法通常利用最優(yōu)化方法或者群智能優(yōu)化方法求解某一探測(cè)性能指標(biāo)下的最優(yōu)解。文獻(xiàn)[6]以最小化多輸入多輸出雷達(dá)的發(fā)射功率為目標(biāo),通過(guò)推導(dǎo)了各個(gè)目標(biāo)定位誤差的克拉美羅界建立機(jī)會(huì)約束模型,并通過(guò)等效變換將機(jī)會(huì)約束問(wèn)題變?yōu)榉蔷€性方程求解問(wèn)題。文獻(xiàn)[14]將目標(biāo)的后驗(yàn)克拉美羅下界作為優(yōu)化目標(biāo)函數(shù),提出一種同時(shí)優(yōu)化雷達(dá)功率和帶寬的改進(jìn)型麻雀搜索算法對(duì)目標(biāo)函數(shù)進(jìn)行求解。啟發(fā)式優(yōu)化方法是資源優(yōu)化的有效手段,然而最優(yōu)化方法需要在每一個(gè)資源分配時(shí)刻沿著目標(biāo)函數(shù)的負(fù)梯度方向?qū)ふ易顑?yōu)值,這個(gè)過(guò)程耗費(fèi)大量時(shí)間且要求目標(biāo)函數(shù)具有可導(dǎo)性。群體智能體方法在高維場(chǎng)景下其性能受到嚴(yán)重影響,導(dǎo)致算法搜索能力下降。

    博弈論方法將組網(wǎng)雷達(dá)中的雷達(dá)節(jié)點(diǎn)視為博弈參與者,利用決策理論進(jìn)行雷達(dá)資源分配。文獻(xiàn)[15]將雷達(dá)功率分配問(wèn)題建立為合作博弈模型,提出一種基于合作博弈的分布式功率分配算法,利用一種基于shapley值的求解算法得到功率分配結(jié)果。文獻(xiàn)[16]針對(duì)組網(wǎng)雷達(dá)的抗截獲問(wèn)題,將信干噪比(Signal to Interference plus Noise Ratio,SINR)和各雷達(dá)的發(fā)射功率作為約束條件,提出了一種基于非合作博弈的迭代功率控制方法,該方法可以快速收斂至納什均衡解。文獻(xiàn)[17]提出基于納什均衡的彈載雷達(dá)波形設(shè)計(jì)方法,根據(jù)最大化SINR準(zhǔn)則分別設(shè)計(jì)了雷達(dá)和干擾的波形策略。博弈論方法無(wú)法提供資源分配的唯一解,而且需要每一時(shí)刻計(jì)算博弈雙方的收益矩陣,具有較大的計(jì)算復(fù)雜度。

    近年來(lái),隨著深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,DRL)在資源分配和控制決策方面的成功應(yīng)用,已經(jīng)有基于DRL的雷達(dá)資源優(yōu)化技術(shù)被提出。DRL具有利用智能體與環(huán)境交互來(lái)學(xué)習(xí)狀態(tài)到動(dòng)作最優(yōu)映射策略的能力。將組網(wǎng)雷達(dá)作為智能體,文獻(xiàn)[3]提出基于領(lǐng)域知識(shí)輔助強(qiáng)化學(xué)習(xí)的多輸入多輸出雷達(dá)功率方法,其利用領(lǐng)域知識(shí)來(lái)設(shè)計(jì)導(dǎo)向獎(jiǎng)勵(lì),從而增加策略網(wǎng)絡(luò)收斂性和收斂速度。文獻(xiàn)[18]考慮目標(biāo)信息感知和平臺(tái)安全的情況下獲得傳感器目標(biāo)探測(cè)分配序列,提出一種基于DRL的機(jī)載傳感器任務(wù)分配方法。文獻(xiàn)[19]考慮無(wú)線通信系統(tǒng)中的功率分配問(wèn)題,提出一種近似SARSA[20]功率分配算法,其通過(guò)線性近似避免了SARSA功率分配策略中可能出現(xiàn)的“維數(shù)災(zāi)難”問(wèn)題。毫無(wú)疑問(wèn)DRL已經(jīng)成功的運(yùn)用于組網(wǎng)雷達(dá)資源分配問(wèn)題。

    然而,上述組網(wǎng)雷達(dá)資源分配方法都是建立在沒(méi)有干擾或者干擾模型已知的基礎(chǔ)上,缺少干擾機(jī)和雷達(dá)的博弈與交互。隨著干擾技術(shù)的發(fā)展,干擾機(jī)在干擾時(shí)間、干擾功率控制方面具有更強(qiáng)的對(duì)抗能力。在干擾機(jī)資源調(diào)度方面,文獻(xiàn)[21]提出一種魯棒的干擾波束選擇和功率調(diào)度策略來(lái)協(xié)同壓制NR系統(tǒng),其中多個(gè)目標(biāo)的后驗(yàn)克拉美羅下界之和用來(lái)評(píng)估干擾性能。文獻(xiàn)[22]考慮在干擾資源有限的情況下的干擾波束和功率的分配問(wèn)題,建立了一種基于改進(jìn)遺傳算法的干擾資源分配模型,推導(dǎo)了壓制干擾下NR系統(tǒng)的探測(cè)概率,并將其作為評(píng)價(jià)干擾性能指標(biāo),提出一種基于粒子群算法的兩步求解方法。文獻(xiàn)[23]采用模糊綜合評(píng)價(jià)方法對(duì)影響輻射源威脅水平和干擾效率的綜合因素進(jìn)行量化,提出了一種基于改進(jìn)螢火蟲(chóng)算法的干擾資源分配方法。文獻(xiàn)[11]提出一種基于雙Q學(xué)習(xí)算法的干擾資源分配策略。文獻(xiàn)[24]提出基于DRL的智能頻譜干擾方法,其對(duì)不同種類的跳頻通信信號(hào)具有很好的干擾效果。

    綜上所述,DRL已經(jīng)被用于組網(wǎng)雷達(dá)或者干擾機(jī)的資源分配任務(wù),但是同時(shí)考慮伴隨壓制干擾與組網(wǎng)雷達(dá)功率分配的深度博弈仍然是一個(gè)開(kāi)放性問(wèn)題。由于以下因素,應(yīng)用DRL解決上述問(wèn)題頗具挑戰(zhàn):組網(wǎng)雷達(dá)功率分配動(dòng)作屬于連續(xù)動(dòng)作,因此智能體探索空間很大,導(dǎo)致策略難以收斂;組網(wǎng)雷達(dá)和干擾機(jī)博弈過(guò)程中環(huán)境動(dòng)態(tài)性增強(qiáng),進(jìn)一步增加智能體的策略學(xué)習(xí)難度。

    考慮DRL在處理動(dòng)態(tài)環(huán)境下的資源分配的優(yōu)勢(shì),本文首先將干擾機(jī)和組網(wǎng)雷達(dá)映射為智能體,根據(jù)雷達(dá)目標(biāo)檢測(cè)模型和干擾模型建立了壓制干擾下組網(wǎng)雷達(dá)目標(biāo)檢測(cè)模型和檢測(cè)概率最大化優(yōu)化目標(biāo)函數(shù)。然后,采用PPO策略網(wǎng)絡(luò)生成組網(wǎng)雷達(dá)功率分配動(dòng)作;引入目標(biāo)檢測(cè)模型和等功率分配策略兩類領(lǐng)域知識(shí)構(gòu)建導(dǎo)向獎(jiǎng)勵(lì)以輔助智能體探索。其次,設(shè)計(jì)混合策略網(wǎng)絡(luò)生成干擾機(jī)智能體的波束選擇和功率分配動(dòng)作;同樣引入領(lǐng)域知識(shí)(貪婪干擾資源分配策略)生成干擾機(jī)智能體的導(dǎo)向獎(jiǎng)勵(lì)。最后,通過(guò)交替訓(xùn)練更新兩種智能體的策略網(wǎng)絡(luò)參數(shù)。實(shí)驗(yàn)結(jié)果表明:當(dāng)干擾機(jī)采用基于DRL的資源分配策略時(shí),采用基于DRL的組網(wǎng)雷達(dá)功率分配在目標(biāo)檢測(cè)概率和運(yùn)行速度兩種指標(biāo)上明顯優(yōu)于基于粒子群的組網(wǎng)雷達(dá)功率分配和基于人工魚(yú)群的組網(wǎng)雷達(dá)功率分配。

    2 問(wèn)題描述

    本文目的是在智能化壓制干擾下通過(guò)調(diào)度組網(wǎng)雷達(dá)的功率資源以提升雷達(dá)的探測(cè)性能。為此,首先提出干擾機(jī)掩護(hù)目標(biāo)穿越組網(wǎng)雷達(dá)探測(cè)區(qū)域的任務(wù)想定。其次,根據(jù)干擾模型和雷達(dá)檢測(cè)模型建立壓制干擾下的組網(wǎng)雷達(dá)目標(biāo)檢測(cè)模型,進(jìn)而提出最大化目標(biāo)檢測(cè)概率優(yōu)化目標(biāo)函數(shù)。

    2.1 任務(wù)想定

    圖1給出干擾機(jī)掩護(hù)目標(biāo)穿越組網(wǎng)雷達(dá)防區(qū)的資源分配任務(wù)的示例。由一架干擾機(jī)伴隨一架飛機(jī)(目標(biāo))試圖穿越由N部雷達(dá)組成的組網(wǎng)雷達(dá)探測(cè)區(qū)域。在此過(guò)程中,干擾機(jī)生成電磁噪聲干擾雷達(dá)的探測(cè)信號(hào)來(lái)掩護(hù)目標(biāo),這種噪聲干擾被稱為壓制式干擾。在該任務(wù)想定中,干擾方希望盡可能地使組網(wǎng)雷達(dá)探測(cè)不到目標(biāo),而我方組網(wǎng)雷達(dá)則期望最大化目標(biāo)的檢測(cè)性能。

    圖1 壓制干擾機(jī)掩護(hù)目標(biāo)穿越組網(wǎng)雷達(dá)防區(qū)的示例Fig.1 An example of a suppression jammer protecting a target through the networked radar defense area

    如圖2所示,上述干擾機(jī)和組網(wǎng)雷達(dá)的博弈過(guò)程被進(jìn)一步細(xì)化為干擾機(jī)智能體和組網(wǎng)雷達(dá)智能體資源分配策略的博弈。

    圖2 干擾機(jī)智能體和組網(wǎng)雷達(dá)智能體的博弈流程圖Fig.2 The game closed-loop process of the jammer agent and the networked radar agent

    (1) 假設(shè)干擾機(jī)在k時(shí)刻能夠發(fā)射L <N個(gè)干擾波束。干擾機(jī)智能體需要完成以下任務(wù),即:在k時(shí)刻選擇干擾哪幾部雷達(dá)?被選中的雷達(dá)的干擾功率分配多少才能使組網(wǎng)雷達(dá)探測(cè)目標(biāo)的概率最???

    (2) 假設(shè)組網(wǎng)雷達(dá)每個(gè)節(jié)點(diǎn)都工作單波束模式,在各個(gè)探測(cè)時(shí)刻,所有雷達(dá)節(jié)點(diǎn)均發(fā)射波束,即每個(gè)探測(cè)時(shí)刻有N個(gè)雷達(dá)波束探測(cè)目標(biāo)。組網(wǎng)雷達(dá)智能體需要怎么為每個(gè)雷達(dá)-目標(biāo)分配合理的發(fā)射功率使得目標(biāo)檢測(cè)概率最大化?

    與無(wú)干擾情況下的組網(wǎng)雷達(dá)功率分配不同,在干擾機(jī)干擾下,組網(wǎng)雷達(dá)需要考慮干擾機(jī)對(duì)資源分配和目標(biāo)檢測(cè)的影響,因此需要引入干擾機(jī)的干擾特性和模型來(lái)優(yōu)化組網(wǎng)雷達(dá)功率分配。同時(shí),由于干擾機(jī)的干擾波束和功率分配具有不確定性和動(dòng)態(tài)性,因此需要?jiǎng)討B(tài)地調(diào)整組網(wǎng)雷達(dá)功率分配策略,以實(shí)現(xiàn)最優(yōu)的干擾抑制和探測(cè)性能的平衡。在組網(wǎng)雷達(dá)功率分配策略求解方面,傳統(tǒng)的方法通常采用全局優(yōu)化算法對(duì)問(wèn)題求解,如遺傳算法、粒子群算法等,這些方法都需要較高的計(jì)算成本,難以在大規(guī)模優(yōu)化問(wèn)題中保證優(yōu)化的時(shí)效性和可靠性,因此需要探測(cè)探索具有大規(guī)模優(yōu)化空間搜索能力的DRL分配策略。

    2.2 目標(biāo)檢測(cè)模塊

    2.2.1 干擾模型

    壓制干擾是一種噪聲干擾手段,干擾機(jī)發(fā)射強(qiáng)干擾信號(hào)進(jìn)入雷達(dá)接收機(jī),進(jìn)而形成對(duì)雷達(dá)的回波的掩蓋和壓制,使雷達(dá)對(duì)目標(biāo)的檢測(cè)性能下降。本文采用噪聲調(diào)頻干擾信號(hào)進(jìn)行干擾信號(hào)建模,假設(shè)干擾機(jī)向敵方雷達(dá)n施加噪聲調(diào)頻干擾信號(hào)[10,21,23],即

    2.2.2 壓制干擾下單雷達(dá)目標(biāo)檢測(cè)模型

    在無(wú)干擾情況下,目標(biāo)的檢測(cè)概率與雷達(dá)接收天線處的信噪比(Signal Noise Ratio,SNR)相關(guān)。SNR的大小由目標(biāo)回波功率ysignal和接收機(jī)輸入噪聲Pn共同決定[10,21,23]。

    雷達(dá)n接收到的目標(biāo)回波信號(hào)功率ysignal可表示為

    其中,Pr,k為雷達(dá)的發(fā)射功率,Gr為雷達(dá)天線主瓣方向上的增益,σ為目標(biāo)有效反射面積,λ為雷達(dá)的工作波長(zhǎng),為k時(shí)刻目標(biāo)與探測(cè)雷達(dá)n之間的距離。

    雷達(dá)接收機(jī)的內(nèi)部噪聲Pn可表示為

    其中,k=1.38×10-23J/K為玻爾茲曼常數(shù),Bn為接收機(jī)帶寬,T0為接收機(jī)內(nèi)部有效熱噪聲溫度,F(xiàn)n為接收機(jī)噪聲系數(shù)。

    因此,雷達(dá)n接收端的SNR表示為

    在噪聲壓制干擾下,雷達(dá)接收端的信號(hào)由目標(biāo)回波功率ysignal、內(nèi)部噪聲Pn以及干擾信號(hào)功率yinterf3部分組成。根據(jù)干擾方程[10,21,23],雷達(dá)n接收到來(lái)自干擾機(jī)發(fā)射的干擾信號(hào)功率為

    其中,θ0.5為雷達(dá)天線波瓣寬度;β為常數(shù)。

    如圖3所示,θk取決于干擾機(jī)、目標(biāo)機(jī)和雷達(dá)三者之間的相對(duì)位置關(guān)系。根據(jù)干擾信號(hào)進(jìn)入雷達(dá)的角度,壓制干擾劃分為伴隨干擾和支援干擾兩種類型。當(dāng)干擾信號(hào)從雷達(dá)天線主瓣進(jìn)入接收機(jī)時(shí)為伴隨干擾;當(dāng)θk>θ0.5/2時(shí)干擾信號(hào)主要從雷達(dá)天線旁瓣進(jìn)入,干擾方式為支援干擾。

    圖3 干擾機(jī)、雷達(dá)和目標(biāo)的相對(duì)空間位置Fig.3 The relative spatial position of the jammer,radar and target

    壓制干擾下,雷達(dá)n接收機(jī)接收到關(guān)于目標(biāo)的SINR為[10,23]

    假設(shè)目標(biāo)的起伏特性為Swerling I型,雷達(dá)累積脈沖數(shù)為1,則雷達(dá)n對(duì)目標(biāo)的檢測(cè)概率可表示為[10,23,25]

    其中,VT為檢測(cè)門(mén)限。將式(7)代入式(8)可得

    由式(9)可以發(fā)現(xiàn)雷達(dá)對(duì)目標(biāo)的檢測(cè)概率與干擾資源分配變量以及干擾機(jī)、目標(biāo)機(jī)和雷達(dá)間的空間位置有關(guān)。

    2.2.3 組網(wǎng)雷達(dá)檢測(cè)融合

    組網(wǎng)雷達(dá)采用K-N融合規(guī)則來(lái)實(shí)現(xiàn)信息融合[10,23,26]。假設(shè)雷達(dá)n的局部判決為dn∈{0,1},其中dn=1或0表示發(fā)現(xiàn)目標(biāo)與否。融合中心根據(jù)這些局部判據(jù)產(chǎn)生全局判決向量D=[d1d2...dN],共有 2N種可能。定義全局判決規(guī)則為R(D),當(dāng)組網(wǎng)雷達(dá)中發(fā)現(xiàn)目標(biāo)的雷達(dá)數(shù)超過(guò)檢測(cè)門(mén)限K(1≤K≤N)時(shí),判定發(fā)現(xiàn)目標(biāo),否則判定為未發(fā)現(xiàn)目標(biāo),即

    根據(jù)秩K融合準(zhǔn)則可以得到k時(shí)刻組網(wǎng)雷達(dá)對(duì)目標(biāo)的檢測(cè)概率Pd,k為

    2.3 優(yōu)化函數(shù)設(shè)計(jì)

    組網(wǎng)雷達(dá)探測(cè)任務(wù)的要求是在統(tǒng)計(jì)意義下探測(cè)到目標(biāo)的次數(shù)越多越好。該指標(biāo)可進(jìn)一步量化為組網(wǎng)雷達(dá)對(duì)目標(biāo)的檢測(cè)概率Pd,k,其值越大說(shuō)明目標(biāo)越容易被發(fā)現(xiàn)。根據(jù)任務(wù)需求,本文的優(yōu)化目標(biāo)函數(shù)為

    傳統(tǒng)的組網(wǎng)雷達(dá)功率方法一般先通過(guò)干擾性能評(píng)估建立優(yōu)化目標(biāo)函數(shù),然后利用啟發(fā)式搜索算法進(jìn)行策略求解。這些方法通常是在假定探測(cè)環(huán)境沒(méi)有干擾或者干擾模型給定的情況下進(jìn)行方案設(shè)計(jì),缺少干擾機(jī)和組網(wǎng)雷達(dá)相互博弈,不符合實(shí)際作戰(zhàn)需求。同時(shí)啟發(fā)式搜索方法存在計(jì)算成本高、搜索速度慢的缺點(diǎn),難以保證優(yōu)化的有效性。與這些方法不同,本文考慮到體系協(xié)同作戰(zhàn)下干擾機(jī)與組網(wǎng)雷達(dá)的博弈,提出基于DRL的干擾機(jī)波束和功率分配條件下的組網(wǎng)雷達(dá)功率分配問(wèn)題。在策略求解方面,結(jié)合了人工智能方法,干擾機(jī)和組網(wǎng)雷達(dá)被映射為智能體,利用DRL的交互試錯(cuò)學(xué)習(xí)機(jī)制生成從環(huán)境狀態(tài)到組網(wǎng)雷達(dá)功率分配向量的映射。由于采用離線訓(xùn)練的方式進(jìn)行策略探索,因此DRL相較于一般方法具有更快的在線運(yùn)行速度。

    3 組網(wǎng)雷達(dá)智能體的MDP建模

    本節(jié)首先將組網(wǎng)雷達(dá)智能體功率分配模型化為馬爾可夫決策過(guò)程(Markov Decision Process,MDP)[27]。一個(gè)MDP通常采用元組(S,A,P,r)表示,其中S為環(huán)境狀態(tài),它是智能體的環(huán)境觀測(cè);A為動(dòng)作,它是執(zhí)行器的輸出;P為狀態(tài)的轉(zhuǎn)移概率。值得注意的是,在無(wú)模型強(qiáng)化學(xué)習(xí)中P是未知的。r是由環(huán)境產(chǎn)生的單步獎(jiǎng)勵(lì)。

    圖4顯示組網(wǎng)雷達(dá)策略網(wǎng)絡(luò)同干擾機(jī)與雷達(dá)博弈環(huán)境的交互過(guò)程。首先組網(wǎng)雷達(dá)智能體的策略網(wǎng)絡(luò)根據(jù)環(huán)境狀態(tài)生成一個(gè)功率分配動(dòng)作,并將該動(dòng)作傳遞給組網(wǎng)雷達(dá)。然后雷達(dá)執(zhí)行探測(cè)動(dòng)作獲取目標(biāo)量測(cè),并提取下一時(shí)刻的環(huán)境狀態(tài)。智能體的狀態(tài)、動(dòng)作和獎(jiǎng)勵(lì)被存入經(jīng)驗(yàn)池用于組網(wǎng)雷達(dá)智能體的策略網(wǎng)絡(luò)參數(shù)更新。

    圖4 組網(wǎng)雷達(dá)智能體與環(huán)境交互圖Fig.4 The networked radar agent and environment interaction diagram

    (1) 組網(wǎng)雷達(dá)智能體的狀態(tài)

    組網(wǎng)雷達(dá)能夠獲取的環(huán)境信息包括k時(shí)刻雷達(dá)n與目標(biāo)的距離和雷達(dá)被干擾指示。通過(guò)對(duì)組網(wǎng)雷達(dá)的觀測(cè)進(jìn)行預(yù)處理生成策略網(wǎng)絡(luò)的輸入狀態(tài)。預(yù)處理過(guò)程包括標(biāo)準(zhǔn)化和連接操作。標(biāo)準(zhǔn)化是為了將不同量綱的雷達(dá)觀測(cè)統(tǒng)一到[0,1]。定義距離標(biāo)準(zhǔn)化函數(shù)為

    其中,Rmin,Rmax分別表示雷達(dá)的最小和最大觀測(cè)距離。

    連接操作是在數(shù)據(jù)標(biāo)準(zhǔn)化后將不同類型的雷達(dá)觀測(cè)組合成策略網(wǎng)絡(luò)的輸入狀態(tài)。首先將任意雷達(dá)的觀測(cè)按照被干擾指示和雷達(dá)與目標(biāo)的距離組合,即。然后將所有雷達(dá)的觀測(cè)按照雷達(dá)編號(hào)組合,即

    (2) 組網(wǎng)雷達(dá)智能體的動(dòng)作

    組網(wǎng)雷達(dá)智能體的動(dòng)作定義為ar,k=(n=1,2,...,N),其中表示k時(shí)刻雷達(dá)節(jié)點(diǎn)n的發(fā)射功率。

    (3) 知識(shí)輔助的組網(wǎng)雷達(dá)智能體獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)

    強(qiáng)化學(xué)習(xí)模擬人類獎(jiǎng)懲機(jī)制,利用智能體與環(huán)境交互試錯(cuò)改進(jìn)策略,本質(zhì)上是選擇獎(jiǎng)勵(lì)大的動(dòng)作。然而,強(qiáng)化學(xué)習(xí)的試錯(cuò)過(guò)程仍然是隨機(jī)探索,對(duì)于壓制干擾下組網(wǎng)雷達(dá)功率分配任務(wù),干擾機(jī)和組網(wǎng)雷達(dá)的博弈與目標(biāo)運(yùn)動(dòng)使得探測(cè)環(huán)境的動(dòng)態(tài)性顯著增加,進(jìn)而導(dǎo)致智能體策略學(xué)習(xí)困難。為了輔助智能體的探索,有必要引入人的認(rèn)知模型和知識(shí),提出知識(shí)輔助下的獎(jiǎng)勵(lì)設(shè)計(jì)。通過(guò)專家知識(shí)和模型知識(shí)設(shè)計(jì)導(dǎo)向獎(jiǎng)勵(lì),以引導(dǎo)智能體向人類認(rèn)知方向探索,最終生成符合任務(wù)想定的資源分配策略。如圖5所示,本文給出知識(shí)輔助的組網(wǎng)雷達(dá)智能體獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)框圖。

    圖5 知識(shí)輔助的組網(wǎng)雷達(dá)智能體獎(jiǎng)勵(lì)模塊Fig.5 The knowledge-assisted reward module for the networked radar agent

    根據(jù)壓制干擾下組網(wǎng)雷達(dá)目標(biāo)探測(cè)模型(模型知識(shí))可知,雷達(dá)發(fā)現(xiàn)目標(biāo)的概率和雷達(dá)與目標(biāo)的距離以及雷達(dá)的發(fā)射功率相關(guān)。對(duì)于使用相同發(fā)射功率的雷達(dá),目標(biāo)距離雷達(dá)越近,雷達(dá)接收端獲得的SINR越大,意味著發(fā)現(xiàn)目標(biāo)的概率越大。因此定義評(píng)價(jià)函數(shù)為

    在組網(wǎng)雷達(dá)功率分配任務(wù)中等功率分配策略(專家知識(shí))被用來(lái)作為判斷智能體分配動(dòng)作好壞的基準(zhǔn)策略。如果k時(shí)刻智能體的探測(cè)收益大于基準(zhǔn)策略的探測(cè)收益,那么給予智能體正的導(dǎo)向獎(jiǎng)勵(lì),否則做出適當(dāng)?shù)膽土P。具體的規(guī)則定義如下:

    其中,rrg,k表示組網(wǎng)雷達(dá)智能體的導(dǎo)向獎(jiǎng)勵(lì);b1和b2是正實(shí)數(shù);為等功率分配動(dòng)作。

    組網(wǎng)雷達(dá)智能體的環(huán)境獎(jiǎng)勵(lì)是根據(jù)優(yōu)化目標(biāo)給出的。組網(wǎng)雷達(dá)期望發(fā)現(xiàn)目標(biāo)的概率越大越好,即目標(biāo)的檢測(cè)概率越接近1給予的獎(jiǎng)勵(lì)越大。因此,組網(wǎng)雷達(dá)的環(huán)境獎(jiǎng)勵(lì)定義為

    組網(wǎng)雷達(dá)智能體的導(dǎo)向獎(jiǎng)勵(lì)和環(huán)境獎(jiǎng)勵(lì)共同用于改進(jìn)組網(wǎng)雷達(dá)智能體的策略??紤]到隨著訓(xùn)練次數(shù)的增加智能體的策略將超越基準(zhǔn)策略,此時(shí)導(dǎo)向獎(jiǎng)勵(lì)起到促進(jìn)策略探索作用,相反會(huì)影響智能體向最優(yōu)策略探索。因此,本文設(shè)計(jì)導(dǎo)向獎(jiǎng)勵(lì)衰減獎(jiǎng)勵(lì)融合模塊,由知識(shí)產(chǎn)生的導(dǎo)向獎(jiǎng)勵(lì)隨著訓(xùn)練幕數(shù)的增加逐漸減小,即

    其中,rr,k為融合后組網(wǎng)雷達(dá)智能體的獎(jiǎng)勵(lì);β為衰減因子;t為訓(xùn)練幕數(shù)。

    注意,上述設(shè)計(jì)過(guò)程中使用等功率分配策略作為專家知識(shí)來(lái)生成導(dǎo)向獎(jiǎng)勵(lì),事實(shí)上可以引入更加先進(jìn)的分配策略輔助智能體探索。

    (4) 組網(wǎng)雷達(dá)智能體的策略網(wǎng)絡(luò)

    如圖6,組網(wǎng)雷達(dá)智能體的策略網(wǎng)絡(luò)采用演員-評(píng)論家(Actor-Critic,AC)框架,由一個(gè)Actor和一個(gè)Critic組成,其中Actor策略網(wǎng)絡(luò)用于產(chǎn)生功率分配動(dòng)作,Critic策略網(wǎng)絡(luò)用來(lái)評(píng)估動(dòng)作的好壞。Actor策略網(wǎng)絡(luò)采用3層全連接神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)搭建,中間層采用ReLU激活函數(shù)激活,輸出層采用Tanh激活函數(shù)激活。Critic策略網(wǎng)絡(luò)同樣采用3層全連接NN搭建并使用Tanh激活。采用PPO算法進(jìn)行策略學(xué)習(xí)[28]。

    圖6 組網(wǎng)雷達(dá)智能體的策略網(wǎng)絡(luò)Fig.6 The policy network of the networked radar agent

    4 干擾機(jī)智能體的MDP建模

    圖7顯示了干擾機(jī)策略網(wǎng)絡(luò)同干擾機(jī)與雷達(dá)博弈環(huán)境的交互過(guò)程。首先由基于混合強(qiáng)化學(xué)習(xí)的干擾資源分配策略網(wǎng)絡(luò)生成干擾機(jī)智能體的波束選擇動(dòng)作和波束功率分配動(dòng)作。然后,干擾機(jī)執(zhí)行該動(dòng)作對(duì)被選中雷達(dá)發(fā)射干擾波束。干擾機(jī)獲取環(huán)境觀察并提取下一時(shí)刻狀態(tài)。干擾機(jī)智能體的狀態(tài)、動(dòng)作和獎(jiǎng)勵(lì)被存入經(jīng)驗(yàn)池,這些樣本用于混合策略網(wǎng)絡(luò)的參數(shù)更新。

    圖7 干擾機(jī)智能體與環(huán)境交互圖Fig.7 The jammer agent and environment interaction diagram

    (1) 干擾機(jī)智能體的狀態(tài)

    (2) 干擾機(jī)智能體的動(dòng)作

    (3) 干擾機(jī)智能體的獎(jiǎng)勵(lì)

    干擾機(jī)的波束和功率聯(lián)合分配具有由離散動(dòng)作和連續(xù)動(dòng)作組成的混合動(dòng)作空間,這比其他的資源分配任務(wù)更加復(fù)雜。其中,混合動(dòng)作空間增加了智能體的探索難度,更少的最優(yōu)動(dòng)作被遍歷,這意味著最優(yōu)動(dòng)作下的環(huán)境獎(jiǎng)勵(lì)是稀疏的,這導(dǎo)致DRL的策略難以改進(jìn)。因此引入模型知識(shí)和專家知識(shí)設(shè)計(jì)導(dǎo)向獎(jiǎng)勵(lì)輔助智能體探索,如圖8所示。

    圖8 知識(shí)輔助的干擾機(jī)智能體獎(jiǎng)勵(lì)函數(shù)模塊Fig.8 The knowledge-assisted reward function module for the jammer agent

    將貪婪干擾資源分配策略視作評(píng)價(jià)干擾機(jī)智能體的資源分配動(dòng)作的基準(zhǔn)。當(dāng)采用干擾機(jī)智能體的波束選擇和功率分配動(dòng)作下組網(wǎng)雷達(dá)發(fā)現(xiàn)目標(biāo)的概率小于使用基準(zhǔn)干擾資源分配策略時(shí),給予正的導(dǎo)向獎(jiǎng)勵(lì),否則懲罰,即

    其中,rjg,k為干擾機(jī)智能體的導(dǎo)向獎(jiǎng)勵(lì);表示基準(zhǔn)干擾資源分配策略下組網(wǎng)雷達(dá)發(fā)現(xiàn)目標(biāo)的概率。

    干擾機(jī)的優(yōu)化目標(biāo)與組網(wǎng)雷達(dá)的優(yōu)化目標(biāo)相反,目標(biāo)的發(fā)現(xiàn)概率越小越好。因此干擾機(jī)智能體的環(huán)境獎(jiǎng)勵(lì)表示為

    與組網(wǎng)雷達(dá)的導(dǎo)向獎(jiǎng)勵(lì)和環(huán)境獎(jiǎng)勵(lì)融合的方法相同,干擾機(jī)智能體的獎(jiǎng)勵(lì)融合模塊定義為

    其中,rj,k表示融合后干擾機(jī)智能體的獎(jiǎng)勵(lì)。

    (4) 干擾機(jī)智能體的混合策略網(wǎng)絡(luò)

    干擾機(jī)智能體需要同時(shí)產(chǎn)生兩種不同質(zhì)的混合動(dòng)作,即離散的干擾波束選擇動(dòng)作和連續(xù)的波束功率分配動(dòng)作。因此本文設(shè)計(jì)一種混合策略網(wǎng)絡(luò),如圖9所示,用來(lái)表示兩種分配動(dòng)作,其中利用具有分類分布輸出的離散Actor來(lái)表示干擾波束選擇動(dòng)作,采用具有高斯分布的連續(xù)Actor來(lái)表示干擾波束功率分配動(dòng)作。

    圖9 干擾機(jī)智能體的混合策略網(wǎng)絡(luò)Fig.9 The hybrid policy network of the jammer agent

    5 基于交替訓(xùn)練的干擾機(jī)與組網(wǎng)雷達(dá)資源分配策略學(xué)習(xí)

    如圖2所示,由組網(wǎng)雷達(dá)和干擾機(jī)組成的資源對(duì)抗優(yōu)化問(wèn)題由于以下困難使得資源分配策略很難收斂:(1)組網(wǎng)雷達(dá)和干擾的功率分配都是連續(xù)變量,因此策略學(xué)習(xí)的狀態(tài)-動(dòng)作空間維度很大,難以收斂;(2)干擾機(jī)波束分配為非凸優(yōu)化并與功率分配耦合,這進(jìn)一步增加策略搜索空間;(3)組網(wǎng)雷達(dá)和干擾機(jī)博弈過(guò)程中資源分配環(huán)境動(dòng)態(tài)性增加。

    為此本文提出基于交替訓(xùn)練的多步求解方法,設(shè)置最大迭代次數(shù)為M。具體步驟為:

    步驟1 固定組網(wǎng)雷達(dá)的功率分配策略,訓(xùn)練干擾機(jī)的聯(lián)合波束與功率分配策略。

    步驟2 固定干擾機(jī)的資源分配策略,訓(xùn)練組網(wǎng)雷達(dá)的功率分配策略。

    進(jìn)行下一次迭代m←m+1,重復(fù)執(zhí)行步驟1和步驟2,直到迭代訓(xùn)練次數(shù)m>M。此時(shí)得到訓(xùn)練后的組網(wǎng)雷達(dá)功率分配策略。

    6 仿真實(shí)驗(yàn)

    6.1 場(chǎng)景描述與參數(shù)設(shè)置

    6.1.1 任務(wù)場(chǎng)景描述

    如圖10所示,代表一種典型的部署方式,各部雷達(dá)以扇形方式部署到作戰(zhàn)區(qū)域,探測(cè)范圍相互重疊,這種部署有效地增加了雷達(dá)發(fā)現(xiàn)目標(biāo)的能力。目標(biāo)由西北方向朝向東南方向勻速運(yùn)動(dòng),并且逐漸靠近雷達(dá)4和雷達(dá)5所在區(qū)域。

    圖10 組網(wǎng)雷達(dá)部署和目標(biāo)編隊(duì)軌跡Fig.10 The deployment of the networked radar and the trajectory of the target formation

    值得注意的是,在測(cè)試場(chǎng)景干擾機(jī)和目標(biāo)飛行軌跡的趨勢(shì)與訓(xùn)練場(chǎng)景中軌跡的飛行樣式相同,但每一次運(yùn)行目標(biāo)和干擾機(jī)的位置與速度都在一個(gè)區(qū)間內(nèi)隨機(jī)生成。在實(shí)際作戰(zhàn)過(guò)程中,如果測(cè)試場(chǎng)景與訓(xùn)練場(chǎng)景的匹配度很低,訓(xùn)練好的參數(shù)可能不再有效。因?yàn)镈RL是通過(guò)訓(xùn)練階段不斷地與環(huán)境交互學(xué)習(xí)最優(yōu)策略。如果測(cè)試環(huán)境改變較大,可能會(huì)導(dǎo)致性能下降。此時(shí),需要通過(guò)在線訓(xùn)練方式對(duì)模型進(jìn)行微調(diào),以適應(yīng)新的環(huán)境。同時(shí),本文通過(guò)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行隨機(jī)擾動(dòng),即每一個(gè)訓(xùn)練幕干擾機(jī)和目標(biāo)的位置和速度隨機(jī)產(chǎn)生,來(lái)增加模型對(duì)新情況的魯棒性。

    6.1.2 仿真參數(shù)設(shè)置

    仿真實(shí)驗(yàn)在10 km×10 km的二維作戰(zhàn)平面進(jìn)行。組網(wǎng)雷達(dá)由N=5部廣泛分布的單站雷達(dá)組成,融合中心采用K-N準(zhǔn)則(K=2)。假設(shè)組網(wǎng)雷達(dá)和干擾機(jī)的工作頻率相等,基于文獻(xiàn)[9,10,23,29,30]提供的數(shù)據(jù),每部雷達(dá)的工作參數(shù)設(shè)置如表1所示,干擾機(jī)的工作參數(shù)設(shè)置如表2所示。雷達(dá)的工作帶寬為300 MHz,干擾機(jī)帶寬為雷達(dá)帶寬的2倍,各場(chǎng)景中目標(biāo)的有效反射面積均設(shè)置為5 m2。

    表1 雷達(dá)工作參數(shù)Tab.1 The working parameters of the radars

    表2 干擾機(jī)工作參數(shù)Tab.2 The working parameters of the jammer

    本文算法的參數(shù)設(shè)置如表3所示,其中組網(wǎng)雷達(dá)智能體中Actor網(wǎng)絡(luò)的層數(shù)和節(jié)點(diǎn)數(shù)與干擾機(jī)智能體中連續(xù)Actor的參數(shù)設(shè)置相同。仿真所使用的計(jì)算機(jī)硬件參數(shù)為:Intel i5-10400F CPU,8 GB RAM,NVIDIA GTX 1650顯示適配器,python版本為3.6,tensorflow版本為1.14.1。

    表3 算法參數(shù)設(shè)置Tab.3 The algorithm parameters setting

    算法的計(jì)算復(fù)雜度分析:算法的計(jì)算復(fù)雜度包含時(shí)間復(fù)雜度和空間復(fù)雜度[3]。前者由NN中乘法和加法的數(shù)量來(lái)衡量,后者由NN中帶優(yōu)化的參數(shù)數(shù)量決定,即

    其中,M是NN的層數(shù)(隱藏層數(shù)+1),m表示NN層編號(hào),F(xiàn)Cin(m)和 FCout(m)分別表示第m層NN的輸入節(jié)點(diǎn)數(shù)和輸出節(jié)點(diǎn)數(shù)。根據(jù)表3所示的Actor網(wǎng)絡(luò)的參數(shù)設(shè)置,本文算法干擾機(jī)策略網(wǎng)絡(luò)中離散Actor的時(shí)間復(fù)雜度是17792,空間復(fù)雜度是18049,連續(xù)Actor的時(shí)間復(fù)雜度是18048,空間復(fù)雜度是18307。組網(wǎng)雷達(dá)智能體策略網(wǎng)絡(luò)的時(shí)間復(fù)雜度為18304,空間復(fù)雜度為18565。

    6.2 對(duì)比策略和評(píng)價(jià)指標(biāo)

    為驗(yàn)證所提方法的有效性,在干擾機(jī)使用基于DRL的干擾策略時(shí),將基于DRL的組網(wǎng)雷達(dá)功率分配算法與如下2種組網(wǎng)雷達(dá)功率分配策略進(jìn)行對(duì)比:

    基于粒子群(Particle Swarm Optimization,PSO)算法的組網(wǎng)雷達(dá)分配策略:該方法采用粒子群算法作為雷達(dá)功率資源分配策略,在使用時(shí)設(shè)計(jì)參數(shù)較少、粒子群規(guī)模較小,所以收斂速度相對(duì)較快。

    基于人工魚(yú)群算法(Artificial Fish Swarms Algorithm,AFSA)的組網(wǎng)雷達(dá)分配策略:應(yīng)用人工魚(yú)群算法進(jìn)行功率資源的分配,該方法通過(guò)模擬魚(yú)群的覓食行為進(jìn)行策略尋優(yōu),具有較好的全局最優(yōu)解的求解能力,對(duì)初始值和參數(shù)要求較低、魯棒性強(qiáng)。

    組網(wǎng)雷達(dá)功率資源分配的目的是最大化目標(biāo)的檢測(cè)概率,因此選取目標(biāo)檢測(cè)概率以及資源調(diào)度運(yùn)行時(shí)間(Scheduling Run Time,SRT)作為性能評(píng)估指標(biāo)。

    6.3 訓(xùn)練過(guò)程

    根據(jù)6.1.2節(jié)設(shè)置的參數(shù)和第5節(jié)的訓(xùn)練方法學(xué)習(xí)組網(wǎng)雷達(dá)功率分配策略。每隔50步對(duì)目標(biāo)運(yùn)動(dòng)狀態(tài)進(jìn)行初始化,稱為一幕。干擾機(jī)策略訓(xùn)練的總幕數(shù)設(shè)置為3000幕,組網(wǎng)雷達(dá)智能體的訓(xùn)練總幕數(shù)設(shè)置為10000幕。圖11顯示了不同訓(xùn)練幕下獎(jiǎng)勵(lì)收斂情況。從圖11(a)可以看出,隨著訓(xùn)練幕數(shù)的增加組網(wǎng)雷達(dá)智能體的獎(jiǎng)勵(lì)逐漸收斂,表明訓(xùn)練是有效的。由圖11(b)可以發(fā)現(xiàn),隨著訓(xùn)練幕數(shù)的增加干擾機(jī)智能體的獎(jiǎng)勵(lì)也逐漸收斂,表明干擾機(jī)的策略訓(xùn)練是有效的。

    圖11 獎(jiǎng)勵(lì)變化曲線Fig.11 The rewards convergence curve

    6.4 測(cè)試結(jié)果

    將訓(xùn)練好的組網(wǎng)雷達(dá)功率分配策略參數(shù)和干擾機(jī)資源分配策略參數(shù)加載到測(cè)試環(huán)境。圖12顯示了單次運(yùn)行下的干擾資源分配結(jié)果。可以發(fā)現(xiàn),在初始階段距離干擾機(jī)較近的雷達(dá)1、雷達(dá)2和雷達(dá)3受到的干擾較大;在運(yùn)行到中間時(shí)刻時(shí)干擾機(jī)分配更多的干擾功率給雷達(dá)2;隨著目標(biāo)編隊(duì)逐漸靠近雷達(dá),干擾機(jī)選擇對(duì)距離近的雷達(dá)4和雷達(dá)5施加干擾。

    圖12 干擾資源分配結(jié)果Fig.12 The interference resource allocation result

    通過(guò)50次蒙特卡羅仿真測(cè)試了3種組網(wǎng)雷達(dá)功率分配策略在干擾機(jī)采用基于DRL的壓制干擾下的目標(biāo)檢測(cè)性能。圖13顯示了幾種組網(wǎng)雷達(dá)功率分配策略在基于DRL干擾下的目標(biāo)檢測(cè)概率,可以發(fā)現(xiàn)基于DRL的組網(wǎng)雷達(dá)功率分配方法可以有效地提升壓制干擾下的目標(biāo)檢測(cè)性能,相較于其他兩種策略,目標(biāo)檢測(cè)概率最多提升了大約11%,這是由于DRL通過(guò)智能體與環(huán)境交互學(xué)習(xí),因此DRL分配策略考慮了干擾機(jī)帶來(lái)的不確定性。

    圖13 3種組網(wǎng)雷達(dá)功率分配策略的目標(biāo)檢測(cè)概率Fig.13 The target detection probability of three networked radar power allocation strategies

    為了驗(yàn)證本文算法在時(shí)變干擾條件下的優(yōu)勢(shì),本文分別采用3種不同的策略進(jìn)行測(cè)試,包括基于DRL干擾下訓(xùn)練的組網(wǎng)雷達(dá)功率分配策略(DRL-TI)、在無(wú)干擾下訓(xùn)練的組網(wǎng)雷達(dá)分配策略(DRL-NI)以及固定干擾情況下訓(xùn)練的組網(wǎng)雷達(dá)功率分配策略(DRL-FI)。其中,固定干擾設(shè)置為干擾機(jī)在所有時(shí)刻采用均等功率干擾雷達(dá)3、雷達(dá)4和雷達(dá)5。本文測(cè)試了這3種策略的目標(biāo)檢測(cè)性能,結(jié)果如圖14所示。從圖14可以看出,DRL-TI組網(wǎng)雷達(dá)功率分配策略的目標(biāo)檢測(cè)概率要比DRL-NI和DRL-FI策略的目標(biāo)檢測(cè)概率高,最多提升了約15%。這是因?yàn)?,DRL-TI分配策略在訓(xùn)練過(guò)程中考慮了干擾機(jī)與組網(wǎng)雷達(dá)的資源博弈,能夠適應(yīng)時(shí)變干擾帶來(lái)的不確定性,從而具有更好的目標(biāo)檢測(cè)性能。

    圖14 不同干擾模式下基于DRL組網(wǎng)雷達(dá)功率分配策略的目標(biāo)檢測(cè)概率Fig.14 The target detection probability of the DRL-based networked radar power allocation strategy under different interference models

    圖15對(duì)比了單次仿真測(cè)試下3種組網(wǎng)雷達(dá)功率分配策略雷達(dá)功率分配結(jié)果。圖16顯示了各雷達(dá)節(jié)點(diǎn)受干擾壓制干擾情況。圖17顯示了干擾機(jī)和組網(wǎng)雷達(dá)的距離變化。由圖15(a)—圖17可以發(fā)現(xiàn)基于DRL的組網(wǎng)雷達(dá)功率分配方法具有以下現(xiàn)象:

    圖15 組網(wǎng)雷達(dá)功率分配結(jié)果Fig.15 The networked radar power allocation results

    圖16 各雷達(dá)節(jié)點(diǎn)受壓制干擾情況Fig.16 The indication that each radar node is interfered

    圖17 干擾機(jī)和組網(wǎng)雷達(dá)的距離變化Fig.17 The distance variation of the jammer and the networked radar

    在1~25步,干擾機(jī)與雷達(dá)1、雷達(dá)2和雷達(dá)3的距離最近,因此干擾資源偏向于分配給這3部雷達(dá),以達(dá)到最佳的干擾效果。為了對(duì)抗上述干擾策略,組網(wǎng)雷達(dá)分配資源大部分資源給雷達(dá)1、雷達(dá)4和雷達(dá)5,其能夠提升未被干擾且距離較遠(yuǎn)的雷達(dá)4和雷達(dá)5檢測(cè)概率,同時(shí)能夠提升受干擾最嚴(yán)重的雷達(dá)1的檢測(cè)概率。采用該策略保證在K-N融合準(zhǔn)則下對(duì)的檢測(cè)概率最大。在26~38步,干擾機(jī)所有的功率都用于干擾雷達(dá)3。在這種情況下組網(wǎng)雷達(dá)3的探測(cè)性能受到極大限制,所以在系統(tǒng)資源有限的情況下,幾乎不分配資源于此節(jié)點(diǎn),以保證對(duì)突防目標(biāo)的及時(shí)探測(cè)??傮w來(lái)看,基于DRL的組網(wǎng)雷達(dá)功率分配方法能夠隨著壓制干擾強(qiáng)度以及目標(biāo)運(yùn)動(dòng)實(shí)時(shí)動(dòng)態(tài)調(diào)整每個(gè)雷達(dá)節(jié)點(diǎn)的功率,從而提高資源的利用率,進(jìn)而提高壓制干擾下目標(biāo)的發(fā)現(xiàn)概率。

    從圖15(b)可以發(fā)現(xiàn),基于PSO的組網(wǎng)雷達(dá)功率分配在整個(gè)仿真時(shí)刻呈現(xiàn)出交替分配較大功率給部分雷達(dá),這種各個(gè)分配時(shí)刻交替分配功率的分配策略與雷達(dá)受干擾情況和雷達(dá)-目標(biāo)的距離曲線的變化不符。原因在于基于PSO的組網(wǎng)雷達(dá)功率分配不能保證各個(gè)時(shí)刻的分配結(jié)果都是最優(yōu)。

    從圖15(c)可以發(fā)現(xiàn),基于AFSA的組網(wǎng)雷達(dá)功率分配在1~10步的功率分配結(jié)果變化較大,選擇為部分雷達(dá)分配均等的發(fā)射功率;在6~25步組網(wǎng)雷達(dá)的能量主要分配給雷達(dá)1、雷達(dá)4和雷達(dá)5,而此時(shí)雷達(dá)2和雷達(dá)3受到干擾,可以發(fā)現(xiàn)AFSA將組網(wǎng)雷達(dá)功率分配給未受干擾的雷達(dá),這種分配結(jié)果使雷達(dá)2和雷達(dá)3對(duì)目標(biāo)的檢測(cè)概率較低,進(jìn)而導(dǎo)致K-N融合準(zhǔn)則下目標(biāo)的檢測(cè)性能降低。在26~45步具有類似的結(jié)果,但是僅雷達(dá)3被干擾,因此融合后的目標(biāo)檢測(cè)性能下降小??傮w來(lái)看,AFSA將組網(wǎng)雷達(dá)功率均勻地分配給未受到干擾的雷達(dá)節(jié)點(diǎn),這種分配方式是一種保守的分配策略,在被干擾雷達(dá)節(jié)點(diǎn)較少時(shí)有較好的目標(biāo)檢測(cè)性能。

    表4對(duì)比了50次蒙特卡羅仿真下各分配策略的資源調(diào)度運(yùn)行時(shí)間。其中PSO算法和AFSA算法的種群規(guī)模數(shù)和最大迭代次數(shù)均相同,所有算法均在相同的仿真平臺(tái)上運(yùn)行。從運(yùn)行時(shí)間來(lái)看,所提方法的資源調(diào)度運(yùn)行時(shí)間能夠達(dá)到0.01 s以下,相對(duì)于PSO優(yōu)化方法和AFSA優(yōu)化方法有顯著提升,完全能夠滿足高動(dòng)態(tài)博弈場(chǎng)景下雷達(dá)功率資源調(diào)度的實(shí)時(shí)性要求。

    表4 各策略的資源調(diào)度運(yùn)行時(shí)間Tab.4 The resource scheduling running time of each strategy

    7 結(jié)語(yǔ)

    考慮到干擾機(jī)與雷達(dá)相互博弈作戰(zhàn)場(chǎng)景,本文提出了一種基于DRL的伴隨壓制干擾下組網(wǎng)雷達(dá)功率分配問(wèn)題的解決方案。在該問(wèn)題中,干擾機(jī)和組網(wǎng)雷達(dá)被映射為智能體?;贒RL的策略網(wǎng)絡(luò)被用來(lái)訓(xùn)練組網(wǎng)雷達(dá)的功率分配策略,同時(shí)采用DRL生成干擾機(jī)智能體的波束選擇和功率分配動(dòng)作。此外,引入模型知識(shí)和專家知識(shí),以協(xié)助兩類智能體的策略探索。在仿真測(cè)試中,干擾機(jī)采用了基于DRL的干擾策略,而組網(wǎng)雷達(dá)分別采用了基于DRL的功率分配以及其他兩種啟發(fā)式組網(wǎng)雷達(dá)功率分配方法。比較了3種組網(wǎng)雷達(dá)功率分配方法在目標(biāo)檢測(cè)概率和運(yùn)行時(shí)間兩個(gè)指標(biāo)下的表現(xiàn)。結(jié)果表明,當(dāng)干擾機(jī)采用DRL資源分配策略時(shí),組網(wǎng)雷達(dá)采用基于DRL的功率分配策略在兩個(gè)指標(biāo)上都優(yōu)于其他方法。這是因?yàn)镈RL采用離線訓(xùn)練生成策略模型,因此在線功率分配的運(yùn)行時(shí)間相比PSO和AFSA更快。其次由于干擾機(jī)的干擾波束和功率具有不確定性和動(dòng)態(tài)性,基于啟發(fā)式搜索的組網(wǎng)雷達(dá)功率分配策略難以在這種環(huán)境下求得最優(yōu)解,而DRL的分配策略是從智能體與環(huán)境交互的訓(xùn)練樣本得到的,這些樣本中包含了干擾機(jī)帶來(lái)的不確定性,因此基于DRL組網(wǎng)雷達(dá)功率分配具有更好的目標(biāo)檢測(cè)性能。

    在未來(lái)的工作中,我們將探究在多干擾機(jī)協(xié)同干擾下的組網(wǎng)雷達(dá)資源分配,并且拓展當(dāng)前的組網(wǎng)雷達(dá)資源分配算法,使其能夠適應(yīng)分布式學(xué)習(xí)結(jié)構(gòu),以應(yīng)對(duì)集群體系的對(duì)抗場(chǎng)景。同時(shí),我們也會(huì)考慮其他針對(duì)雷達(dá)的抗干擾措施,如波束置零和干擾濾除等。

    猜你喜歡
    干擾機(jī)資源分配分配
    新研究揭示新冠疫情對(duì)資源分配的影響 精讀
    應(yīng)答器THR和TFFR分配及SIL等級(jí)探討
    雷聲公司交付首套中頻段下一代干擾機(jī)
    遺產(chǎn)的分配
    一種分配十分不均的財(cái)富
    一種基于價(jià)格競(jìng)爭(zhēng)的D2D通信資源分配算法
    績(jī)效考核分配的實(shí)踐與思考
    基于壓縮感知的單脈沖雷達(dá)欺騙干擾機(jī)研究
    空襲遠(yuǎn)距離支援干擾機(jī)陣位選擇及航線規(guī)劃
    美國(guó)海軍將研制新一代干擾機(jī)
    啦啦啦免费观看视频1| 亚洲久久久国产精品| 午夜福利影视在线免费观看| aaaaa片日本免费| 黑丝袜美女国产一区| 丁香六月欧美| 久久久久久亚洲精品国产蜜桃av| 亚洲性夜色夜夜综合| 国产av一区二区精品久久| 亚洲精品在线美女| 校园春色视频在线观看| 一边摸一边抽搐一进一小说 | 免费一级毛片在线播放高清视频 | 人人妻人人爽人人添夜夜欢视频| 老熟妇乱子伦视频在线观看| 搡老乐熟女国产| 久久九九热精品免费| 精品乱码久久久久久99久播| 国产欧美日韩一区二区三区在线| 亚洲精品国产色婷婷电影| 久99久视频精品免费| 一夜夜www| 精品人妻在线不人妻| 一进一出抽搐gif免费好疼 | 性色av乱码一区二区三区2| 久久精品aⅴ一区二区三区四区| 中文亚洲av片在线观看爽 | 久久ye,这里只有精品| 午夜精品在线福利| 一夜夜www| 岛国毛片在线播放| 精品亚洲成国产av| 国产亚洲精品久久久久久毛片 | 啦啦啦免费观看视频1| 亚洲精品久久午夜乱码| 国产在线精品亚洲第一网站| 久久精品熟女亚洲av麻豆精品| 久久精品亚洲精品国产色婷小说| 久久ye,这里只有精品| 久久精品亚洲av国产电影网| 叶爱在线成人免费视频播放| 欧美日本中文国产一区发布| 亚洲少妇的诱惑av| 少妇 在线观看| 国产av一区二区精品久久| 成人国产一区最新在线观看| 无限看片的www在线观看| 精品第一国产精品| 99久久综合精品五月天人人| 国产精品美女特级片免费视频播放器 | 成年人免费黄色播放视频| 日韩欧美三级三区| 亚洲熟妇熟女久久| 亚洲av成人av| 岛国毛片在线播放| 国产精品一区二区在线观看99| 日韩欧美一区二区三区在线观看 | 99精国产麻豆久久婷婷| 久久人妻福利社区极品人妻图片| 99国产综合亚洲精品| 久久亚洲真实| 亚洲人成电影观看| 视频在线观看一区二区三区| 久久久久久久午夜电影 | 国产成人免费无遮挡视频| 国产精品美女特级片免费视频播放器 | 国产真人三级小视频在线观看| 女性被躁到高潮视频| 亚洲 欧美一区二区三区| 美女扒开内裤让男人捅视频| 十八禁人妻一区二区| 欧美精品一区二区免费开放| 亚洲aⅴ乱码一区二区在线播放 | 午夜福利视频在线观看免费| 侵犯人妻中文字幕一二三四区| 天天躁日日躁夜夜躁夜夜| 中文字幕最新亚洲高清| 久久精品国产99精品国产亚洲性色 | 日日摸夜夜添夜夜添小说| 中文欧美无线码| 一级,二级,三级黄色视频| 成人免费观看视频高清| 欧美老熟妇乱子伦牲交| 美女午夜性视频免费| 久久国产乱子伦精品免费另类| 亚洲国产欧美日韩在线播放| 国产精品98久久久久久宅男小说| av电影中文网址| 看片在线看免费视频| 久久热在线av| 久久ye,这里只有精品| 免费在线观看黄色视频的| 国产av又大| 夜夜爽天天搞| 欧美激情高清一区二区三区| 精品人妻熟女毛片av久久网站| 精品人妻在线不人妻| 丝袜在线中文字幕| 在线国产一区二区在线| www.熟女人妻精品国产| 久久久国产成人精品二区 | 亚洲中文日韩欧美视频| 中文欧美无线码| 亚洲色图 男人天堂 中文字幕| 男女下面插进去视频免费观看| 亚洲性夜色夜夜综合| 精品国产美女av久久久久小说| 久久狼人影院| 老汉色∧v一级毛片| 精品午夜福利视频在线观看一区| 亚洲精品美女久久av网站| 婷婷成人精品国产| 色婷婷久久久亚洲欧美| 欧美日韩亚洲国产一区二区在线观看 | 伦理电影免费视频| 亚洲性夜色夜夜综合| 成人免费观看视频高清| 午夜福利乱码中文字幕| 国产亚洲精品第一综合不卡| 热re99久久国产66热| 黑人欧美特级aaaaaa片| 制服诱惑二区| 麻豆国产av国片精品| 狠狠狠狠99中文字幕| 国产又色又爽无遮挡免费看| 乱人伦中国视频| 黄色毛片三级朝国网站| 精品国产乱子伦一区二区三区| av天堂久久9| 免费不卡黄色视频| 99精品久久久久人妻精品| 一边摸一边抽搐一进一小说 | tocl精华| 在线看a的网站| 亚洲av电影在线进入| 亚洲精品久久成人aⅴ小说| 精品人妻1区二区| 妹子高潮喷水视频| 国产精品99久久99久久久不卡| 两个人看的免费小视频| 啪啪无遮挡十八禁网站| 一进一出好大好爽视频| 亚洲精品久久成人aⅴ小说| 日韩 欧美 亚洲 中文字幕| 精品久久久久久,| 丝瓜视频免费看黄片| 久久久久久人人人人人| 久久久久国产精品人妻aⅴ院 | 精品欧美一区二区三区在线| 久久久精品国产亚洲av高清涩受| 亚洲精品乱久久久久久| 十八禁网站免费在线| 一级毛片高清免费大全| 国产亚洲一区二区精品| 久久精品国产亚洲av香蕉五月 | 激情视频va一区二区三区| 国产日韩欧美亚洲二区| 成年人免费黄色播放视频| 亚洲人成电影免费在线| 啦啦啦在线免费观看视频4| 欧美日韩亚洲高清精品| 少妇被粗大的猛进出69影院| 国产av精品麻豆| 桃红色精品国产亚洲av| 国产精品欧美亚洲77777| 成年版毛片免费区| 国产xxxxx性猛交| 俄罗斯特黄特色一大片| 中亚洲国语对白在线视频| 国产精品亚洲av一区麻豆| 亚洲欧美一区二区三区久久| www.自偷自拍.com| 天天添夜夜摸| 人人妻人人澡人人看| 久久人人爽av亚洲精品天堂| 久久精品亚洲精品国产色婷小说| 国产又爽黄色视频| 亚洲黑人精品在线| av网站在线播放免费| 国产乱人伦免费视频| 黄色女人牲交| 国产精品 国内视频| 久久久久国产一级毛片高清牌| 啦啦啦视频在线资源免费观看| 97人妻天天添夜夜摸| 久热这里只有精品99| a级毛片在线看网站| 欧美另类亚洲清纯唯美| 又黄又爽又免费观看的视频| 天天躁狠狠躁夜夜躁狠狠躁| 国产男女超爽视频在线观看| 亚洲国产精品一区二区三区在线| 99国产极品粉嫩在线观看| 午夜福利乱码中文字幕| 黑丝袜美女国产一区| 国产av又大| 亚洲国产中文字幕在线视频| 一区二区三区国产精品乱码| 亚洲欧美日韩另类电影网站| 巨乳人妻的诱惑在线观看| 日韩三级视频一区二区三区| 91精品国产国语对白视频| 欧美日韩瑟瑟在线播放| 波多野结衣av一区二区av| 一夜夜www| 校园春色视频在线观看| av免费在线观看网站| 成年动漫av网址| 亚洲aⅴ乱码一区二区在线播放 | 人妻一区二区av| 狠狠狠狠99中文字幕| 人人妻人人澡人人看| 多毛熟女@视频| 美女福利国产在线| 精品一区二区三区视频在线观看免费 | 宅男免费午夜| 欧美激情高清一区二区三区| 久久精品亚洲av国产电影网| 亚洲avbb在线观看| 一区二区三区国产精品乱码| 动漫黄色视频在线观看| 亚洲第一av免费看| 欧美午夜高清在线| 精品国产乱码久久久久久男人| 18禁裸乳无遮挡免费网站照片 | 大型av网站在线播放| bbb黄色大片| 国产精品一区二区免费欧美| 欧美激情久久久久久爽电影 | 欧美色视频一区免费| 可以免费在线观看a视频的电影网站| 精品第一国产精品| 女人爽到高潮嗷嗷叫在线视频| 不卡一级毛片| 午夜福利乱码中文字幕| 欧美日韩中文字幕国产精品一区二区三区 | 国产免费av片在线观看野外av| 精品国产乱码久久久久久男人| 欧美日韩一级在线毛片| 男女高潮啪啪啪动态图| 搡老熟女国产l中国老女人| 欧美日韩亚洲高清精品| 在线永久观看黄色视频| 中文字幕人妻丝袜制服| bbb黄色大片| 人妻丰满熟妇av一区二区三区 | av视频免费观看在线观看| 亚洲一码二码三码区别大吗| 狂野欧美激情性xxxx| 91精品国产国语对白视频| 亚洲精品国产区一区二| 丰满的人妻完整版| 精品国产乱码久久久久久男人| bbb黄色大片| 久久青草综合色| 女人被躁到高潮嗷嗷叫费观| 中文字幕人妻丝袜一区二区| 亚洲精品自拍成人| 午夜久久久在线观看| 欧美最黄视频在线播放免费 | 久99久视频精品免费| 欧美日韩亚洲国产一区二区在线观看 | 在线永久观看黄色视频| 99re6热这里在线精品视频| 午夜福利在线观看吧| 免费av中文字幕在线| av不卡在线播放| 色在线成人网| 欧美日韩亚洲综合一区二区三区_| 久久这里只有精品19| 精品高清国产在线一区| 午夜视频精品福利| 亚洲av成人av| 久9热在线精品视频| 两个人看的免费小视频| 久久久精品区二区三区| 美女高潮喷水抽搐中文字幕| 夜夜爽天天搞| 美女扒开内裤让男人捅视频| 欧美激情久久久久久爽电影 | 91麻豆av在线| 久久精品亚洲熟妇少妇任你| 国产亚洲精品第一综合不卡| 午夜亚洲福利在线播放| 国产97色在线日韩免费| 在线观看舔阴道视频| 精品人妻1区二区| 丝袜美腿诱惑在线| 色婷婷av一区二区三区视频| 啦啦啦在线免费观看视频4| 精品国产超薄肉色丝袜足j| 国产在线观看jvid| 国内毛片毛片毛片毛片毛片| 亚洲人成伊人成综合网2020| 亚洲午夜理论影院| 亚洲伊人色综图| 亚洲性夜色夜夜综合| 亚洲免费av在线视频| 欧美性长视频在线观看| 搡老岳熟女国产| 国产高清视频在线播放一区| 久久人人97超碰香蕉20202| 亚洲av电影在线进入| 人人妻人人澡人人看| 欧美+亚洲+日韩+国产| 男女床上黄色一级片免费看| 嫁个100分男人电影在线观看| 国产成人啪精品午夜网站| 下体分泌物呈黄色| 一区二区日韩欧美中文字幕| 国产精品久久久久久人妻精品电影| 女人精品久久久久毛片| 精品卡一卡二卡四卡免费| 极品少妇高潮喷水抽搐| 国产精品一区二区在线观看99| 国产精品秋霞免费鲁丝片| 黄色怎么调成土黄色| 免费在线观看影片大全网站| www.999成人在线观看| 人人妻人人澡人人看| 国产精品电影一区二区三区 | 久久人妻熟女aⅴ| 首页视频小说图片口味搜索| 国产精品久久久久成人av| 精品视频人人做人人爽| cao死你这个sao货| 老司机午夜福利在线观看视频| 亚洲av片天天在线观看| 婷婷精品国产亚洲av在线 | 精品第一国产精品| 女同久久另类99精品国产91| 热99久久久久精品小说推荐| 青草久久国产| 成人精品一区二区免费| 国产男靠女视频免费网站| 亚洲九九香蕉| 人妻久久中文字幕网| 国产精品99久久99久久久不卡| 成年动漫av网址| 男女下面插进去视频免费观看| 91麻豆av在线| 一本大道久久a久久精品| 一a级毛片在线观看| 99国产精品一区二区蜜桃av | 成人av一区二区三区在线看| 日韩熟女老妇一区二区性免费视频| 午夜老司机福利片| 成人永久免费在线观看视频| 99re在线观看精品视频| 亚洲精品自拍成人| 亚洲 欧美一区二区三区| 国产精品综合久久久久久久免费 | 国产精品久久视频播放| 国产精品美女特级片免费视频播放器 | 久久久久久久精品吃奶| 电影成人av| 热99re8久久精品国产| av网站在线播放免费| 国产激情欧美一区二区| 又黄又粗又硬又大视频| 国产精品久久久久久精品古装| 涩涩av久久男人的天堂| 精品人妻熟女毛片av久久网站| 69av精品久久久久久| 操美女的视频在线观看| 国产高清国产精品国产三级| 亚洲精品av麻豆狂野| 国产视频一区二区在线看| 99re6热这里在线精品视频| 欧美日韩一级在线毛片| 亚洲专区字幕在线| 18禁国产床啪视频网站| 国产成人av教育| 一本大道久久a久久精品| 成年动漫av网址| 免费在线观看黄色视频的| 国产免费男女视频| 少妇被粗大的猛进出69影院| 人人妻人人澡人人看| 国产精品98久久久久久宅男小说| 19禁男女啪啪无遮挡网站| 精品欧美一区二区三区在线| 日本黄色视频三级网站网址 | 夫妻午夜视频| 建设人人有责人人尽责人人享有的| 国产男女超爽视频在线观看| 欧美中文综合在线视频| 免费在线观看影片大全网站| 亚洲人成77777在线视频| 亚洲精品国产一区二区精华液| 建设人人有责人人尽责人人享有的| 亚洲中文av在线| av网站在线播放免费| 国产亚洲av高清不卡| 视频区欧美日本亚洲| 国产精品免费大片| 成人av一区二区三区在线看| 国产伦人伦偷精品视频| 正在播放国产对白刺激| 18禁观看日本| cao死你这个sao货| 亚洲精品av麻豆狂野| 久久精品熟女亚洲av麻豆精品| 超色免费av| 天天躁日日躁夜夜躁夜夜| 国产精品国产av在线观看| 久久久国产成人免费| 在线十欧美十亚洲十日本专区| 男女床上黄色一级片免费看| 亚洲精品乱久久久久久| 热re99久久精品国产66热6| 久久人妻熟女aⅴ| 黄片播放在线免费| 日韩欧美国产一区二区入口| 夜夜爽天天搞| 啦啦啦视频在线资源免费观看| 美女午夜性视频免费| 欧美日韩一级在线毛片| 手机成人av网站| 亚洲av日韩精品久久久久久密| 18禁裸乳无遮挡动漫免费视频| 一区二区三区激情视频| 少妇裸体淫交视频免费看高清 | 亚洲精品中文字幕在线视频| 欧美日韩乱码在线| 久久青草综合色| 午夜福利欧美成人| 在线观看免费午夜福利视频| 免费在线观看视频国产中文字幕亚洲| www.999成人在线观看| 亚洲一区二区三区欧美精品| 免费一级毛片在线播放高清视频 | 免费av中文字幕在线| 国产精品久久久久久人妻精品电影| 一级片免费观看大全| 啦啦啦在线免费观看视频4| 80岁老熟妇乱子伦牲交| 操美女的视频在线观看| 麻豆乱淫一区二区| 男女免费视频国产| 一级毛片高清免费大全| 国产一卡二卡三卡精品| 亚洲成国产人片在线观看| 欧美日韩亚洲高清精品| 日韩人妻精品一区2区三区| 色播在线永久视频| 欧美黑人欧美精品刺激| 大片电影免费在线观看免费| 嫩草影视91久久| 久久性视频一级片| www日本在线高清视频| 久久久久精品人妻al黑| 欧美国产精品一级二级三级| 波多野结衣av一区二区av| 在线观看免费午夜福利视频| 一级a爱视频在线免费观看| 黑丝袜美女国产一区| 亚洲精品久久午夜乱码| 国产高清激情床上av| 国产亚洲欧美98| 国产高清视频在线播放一区| 99riav亚洲国产免费| 欧美精品啪啪一区二区三区| 免费高清在线观看日韩| 高潮久久久久久久久久久不卡| 久久精品aⅴ一区二区三区四区| 欧美丝袜亚洲另类 | 国产男女内射视频| 精品亚洲成国产av| 国产极品粉嫩免费观看在线| 日本黄色视频三级网站网址 | 老司机午夜福利在线观看视频| 欧美精品啪啪一区二区三区| 亚洲国产精品sss在线观看 | 日韩一卡2卡3卡4卡2021年| 三级毛片av免费| 国产97色在线日韩免费| 老司机在亚洲福利影院| 在线免费观看的www视频| √禁漫天堂资源中文www| 悠悠久久av| 中亚洲国语对白在线视频| 国产精品久久久久成人av| 女人久久www免费人成看片| 淫妇啪啪啪对白视频| 久久精品国产亚洲av香蕉五月 | 成人国产一区最新在线观看| 国产成人影院久久av| 又黄又爽又免费观看的视频| 成在线人永久免费视频| 99精品在免费线老司机午夜| 亚洲视频免费观看视频| 美女扒开内裤让男人捅视频| 免费黄频网站在线观看国产| 亚洲欧美激情综合另类| 好男人电影高清在线观看| 男人操女人黄网站| 亚洲精品成人av观看孕妇| 人成视频在线观看免费观看| 成人永久免费在线观看视频| 视频区欧美日本亚洲| 亚洲精品久久午夜乱码| 丰满的人妻完整版| 国产精品永久免费网站| 99re在线观看精品视频| 少妇的丰满在线观看| 91字幕亚洲| 在线观看日韩欧美| 精品国产超薄肉色丝袜足j| 一边摸一边抽搐一进一小说 | 免费人成视频x8x8入口观看| 老司机深夜福利视频在线观看| 黄色视频,在线免费观看| 精品高清国产在线一区| 亚洲精品国产精品久久久不卡| 脱女人内裤的视频| 日韩欧美三级三区| 国内久久婷婷六月综合欲色啪| 一区福利在线观看| 久久久国产一区二区| 丁香欧美五月| 极品人妻少妇av视频| 999久久久国产精品视频| 成人手机av| 激情视频va一区二区三区| a在线观看视频网站| 亚洲欧美精品综合一区二区三区| cao死你这个sao货| 99国产精品一区二区三区| 丝袜美腿诱惑在线| 国精品久久久久久国模美| 亚洲精品美女久久久久99蜜臀| 91老司机精品| 中文字幕人妻丝袜一区二区| 久久久久久久久免费视频了| 午夜福利,免费看| 9色porny在线观看| 亚洲男人天堂网一区| 成人18禁高潮啪啪吃奶动态图| 热99久久久久精品小说推荐| 亚洲精品国产色婷婷电影| 少妇被粗大的猛进出69影院| 久久久久精品国产欧美久久久| 在线观看免费视频网站a站| 成熟少妇高潮喷水视频| 国产精品香港三级国产av潘金莲| 高清av免费在线| 国产av一区二区精品久久| av一本久久久久| 精品国产美女av久久久久小说| 久久久久精品国产欧美久久久| 精品国产美女av久久久久小说| 精品第一国产精品| 美女高潮喷水抽搐中文字幕| 亚洲情色 制服丝袜| 欧美黑人欧美精品刺激| 亚洲精品久久午夜乱码| 久久中文看片网| 精品国产乱子伦一区二区三区| 捣出白浆h1v1| 国产1区2区3区精品| 天天添夜夜摸| 欧美人与性动交α欧美软件| 久久人妻熟女aⅴ| 又黄又爽又免费观看的视频| 亚洲一码二码三码区别大吗| 国产精品98久久久久久宅男小说| 亚洲av成人av| 黑人欧美特级aaaaaa片| 男女床上黄色一级片免费看| av国产精品久久久久影院| 女性生殖器流出的白浆| 成人精品一区二区免费| 成在线人永久免费视频| 国产免费男女视频| 交换朋友夫妻互换小说| 国产精品亚洲一级av第二区| 久久九九热精品免费| 国产成人欧美| 午夜老司机福利片| 男女午夜视频在线观看| 18禁裸乳无遮挡动漫免费视频| 啦啦啦免费观看视频1| 亚洲avbb在线观看| 欧美午夜高清在线| 黑人欧美特级aaaaaa片| 天堂√8在线中文| 色综合婷婷激情| 香蕉丝袜av| 欧美日韩av久久| 一区二区三区精品91| 免费在线观看影片大全网站| 日韩一卡2卡3卡4卡2021年| 欧美av亚洲av综合av国产av| 校园春色视频在线观看| 1024香蕉在线观看| 看免费av毛片| 精品久久久久久久毛片微露脸| 天天躁日日躁夜夜躁夜夜| 久久精品国产亚洲av高清一级| 欧美不卡视频在线免费观看 | 在线视频色国产色| 欧美另类亚洲清纯唯美| 亚洲精品一二三| 免费观看精品视频网站| 90打野战视频偷拍视频| 一本综合久久免费| 狠狠狠狠99中文字幕| 少妇 在线观看| tocl精华| av中文乱码字幕在线| 欧美日韩亚洲国产一区二区在线观看 | 久久精品亚洲精品国产色婷小说| 国产伦人伦偷精品视频| 国产精品99久久99久久久不卡|