• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于優(yōu)勢(shì)行動(dòng)-評(píng)論的雷達(dá)自主干擾決策方法

    2023-12-07 03:32:12曹育維
    航天電子對(duì)抗 2023年5期
    關(guān)鍵詞:雷達(dá)決策狀態(tài)

    梁 猛,王 衛(wèi),余 波,陳 飛,曹育維

    (中國(guó)航天科工集團(tuán)8511 研究所,江蘇 南京 210007)

    0 引言

    面對(duì)日益復(fù)雜的電磁環(huán)境,電子對(duì)抗雙方充分感知并分析環(huán)境中的各種信息,自適應(yīng)地調(diào)整作戰(zhàn)狀態(tài)和智能地實(shí)施干擾決策是未來(lái)電子戰(zhàn)的主要發(fā)展趨勢(shì)[1]。在現(xiàn)代電子戰(zhàn)裝備作戰(zhàn)中,雷達(dá)作為電子對(duì)抗的主要載體,是對(duì)抗雙方奪取“制電磁權(quán)”的主要戰(zhàn)場(chǎng)之一。隨著技術(shù)的進(jìn)步,雷達(dá)從傳統(tǒng)體制發(fā)展到現(xiàn)在的多功能新體制雷達(dá)。傳統(tǒng)雷達(dá)工作模式簡(jiǎn)單,干擾樣式粗放控制,其相對(duì)固定的干擾策略面對(duì)敵雷達(dá)復(fù)雜多變的工作模式與眾多抗干擾措施,干擾效果有限[2]。而現(xiàn)代新體制雷達(dá)干擾信號(hào)樣式、干擾手段多樣,具有優(yōu)秀的抗工作模式識(shí)別、抗干擾能力[3]。特別是在智能化方法的運(yùn)用下,新體制雷達(dá)有了更高的感知能力和快速應(yīng)變能力,使得敵方雷達(dá)識(shí)別困難,難以獲取己方工作模式的轉(zhuǎn)變情況,從而達(dá)到敵方利用基于知識(shí)庫(kù)匹配等技術(shù)無(wú)法快速實(shí)施有效干擾。

    認(rèn)知電子戰(zhàn)系統(tǒng)通常由認(rèn)知偵察、認(rèn)知干擾、作戰(zhàn)評(píng)估和動(dòng)態(tài)規(guī)則庫(kù)4 個(gè)組成,其中認(rèn)知干擾決策環(huán)節(jié)是認(rèn)知電子戰(zhàn)系統(tǒng)的關(guān)鍵之一。國(guó)內(nèi)方面,認(rèn)知干擾決策有關(guān)領(lǐng)域的研究逐漸增多,包括干擾資源分配、干擾樣式選擇、干擾參數(shù)尋優(yōu)[4-7]等。這些方法通常建立在充分或部分先驗(yàn)知識(shí)的基礎(chǔ)之上,需構(gòu)建雷達(dá)干擾與抗干擾對(duì)策矩陣來(lái)指導(dǎo)干擾方進(jìn)行干擾決策,以期在對(duì)抗過(guò)程中獲得最高的干擾得益。

    隨著深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)理論的突破,機(jī)器學(xué)習(xí)得益于深度學(xué)習(xí)的高維抽象學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的智能學(xué)習(xí)決策特點(diǎn),算法受到認(rèn)知電子戰(zhàn)技術(shù)研究者的青睞,無(wú)先驗(yàn)信息條件下的干擾決策問(wèn)題也有了新的解決方案[8]。本文在分析強(qiáng)化學(xué)習(xí)與認(rèn)知干擾決策基本原理的基礎(chǔ)上,將其應(yīng)用在非合作環(huán)境下對(duì)敵方雷達(dá)干擾決策中,構(gòu)建了雷達(dá)智能干擾決策模型,提出了基于優(yōu)勢(shì)行動(dòng)-評(píng)論的雷達(dá)自主干擾決策方法,可支撐電子戰(zhàn)背景下雷達(dá)智能干擾決策,提高干擾決策效率和準(zhǔn)確率。

    1 基本原理

    1.1 認(rèn)知干擾決策原理

    認(rèn)知電子戰(zhàn)是在傳統(tǒng)電子戰(zhàn)的基礎(chǔ)上,結(jié)合OODA環(huán)(感知、識(shí)別、決策、動(dòng)作)的閉環(huán)學(xué)習(xí)過(guò)程所提出的新型智能化作戰(zhàn)理論。認(rèn)知電子戰(zhàn)系統(tǒng)通常具有認(rèn)知偵察、認(rèn)知干擾、智能評(píng)估以及干擾知識(shí)庫(kù)[1]等能力。其中認(rèn)知干擾決策功能是認(rèn)知作戰(zhàn)的關(guān)鍵環(huán)節(jié),負(fù)責(zé)根據(jù)認(rèn)知偵察的結(jié)果,結(jié)合干擾知識(shí)庫(kù)實(shí)施自主干擾決策。

    強(qiáng)化學(xué)習(xí)智能體通過(guò)與環(huán)境交互來(lái)獲得序貫問(wèn)題的最優(yōu)解[9]。本文是在雷達(dá)偵察信息的基礎(chǔ)上研究智能干擾決策方法,通過(guò)對(duì)戰(zhàn)場(chǎng)環(huán)境態(tài)勢(shì)的分析判斷,然后分配干擾任務(wù)、選擇干擾目標(biāo),并根據(jù)雷達(dá)的工作狀態(tài)實(shí)施合適的干擾策略。該過(guò)程映射到認(rèn)知雷達(dá)干擾系統(tǒng)中,需要通過(guò)觀察敵方雷達(dá)的工作狀態(tài),經(jīng)過(guò)干擾激勵(lì)和行為學(xué)習(xí)過(guò)程,建立目標(biāo)雷達(dá)的工作狀態(tài)與已有干擾樣式之間的最佳映射關(guān)系,從而針對(duì)靈活變化的雷達(dá)狀態(tài)實(shí)現(xiàn)干擾的快速響應(yīng),最終達(dá)到最優(yōu)的干擾效果。而深度強(qiáng)化學(xué)習(xí)具有強(qiáng)大的環(huán)境感知能力和在與環(huán)境的交互中學(xué)習(xí)決策的能力,這與智能干擾決策的OODA 過(guò)程非常契合。

    1.2 面向干擾決策的深度強(qiáng)化學(xué)習(xí)算法分析與選擇

    雷達(dá)干擾決策過(guò)程是一個(gè)個(gè)OODA 環(huán),本質(zhì)上是一個(gè)序貫決策過(guò)程,對(duì)于這類(lèi)問(wèn)題的求解,強(qiáng)化學(xué)習(xí)算法成為研究的熱點(diǎn),其中基于策略梯度的強(qiáng)化學(xué)習(xí)算法直接搜索最佳策略,如REINFORCE 算法[10]利用蒙特卡洛方法估計(jì)梯度策略,具有較好的穩(wěn)定性,但樣本的利用效率較低,容易陷入局部最優(yōu)的困境。基于價(jià)值函數(shù)的強(qiáng)化學(xué)習(xí)算法通過(guò)獲取最優(yōu)價(jià)值函數(shù)來(lái)隱式地構(gòu)建最優(yōu)策略,如張柏開(kāi)[8]利用Q-Learning算法實(shí)現(xiàn)多功能雷達(dá)干擾任務(wù)自主決策與策略尋優(yōu),但該策略主要適用于少數(shù)雷達(dá)任務(wù)。為解決決策效率隨可執(zhí)行任務(wù)增多而明顯下降的問(wèn)題,張柏開(kāi)[11]利用深度Q 學(xué)習(xí)(DQN)算法[12]將應(yīng)用范圍拓展到高維度和連續(xù)空間,但算法存在訓(xùn)練時(shí)間長(zhǎng)、效率低的缺點(diǎn),無(wú)法很好地滿(mǎn)足對(duì)抗的實(shí)時(shí)性。

    行動(dòng)-評(píng)論(AC)算法結(jié)合上述2 種方法的優(yōu)點(diǎn),分別由動(dòng)作選擇網(wǎng)絡(luò)和動(dòng)作評(píng)價(jià)網(wǎng)絡(luò)同時(shí)學(xué)習(xí)策略和價(jià)值函數(shù)[13],結(jié)構(gòu)如圖1 所示。為解決AC 算法容易過(guò)擬合和收斂性差的問(wèn)題,發(fā)展出了A2C 算法,該算法繼承了DQN 的目標(biāo)網(wǎng)絡(luò),采用異步策略的Critic估計(jì)策略梯度,使訓(xùn)練更加穩(wěn)定簡(jiǎn)單[14]。因此,本文選用A2C 算法應(yīng)用于雷達(dá)多任務(wù)自主干擾決策。算法中Actor 網(wǎng)絡(luò)學(xué)習(xí)策略,根據(jù)當(dāng)前策略θ和狀態(tài)s選擇動(dòng)作作用于環(huán)境;Critic 網(wǎng)絡(luò)評(píng)價(jià)Actor 網(wǎng)絡(luò)的動(dòng)作,并使用TD 算法學(xué)習(xí)Actor 網(wǎng)絡(luò)當(dāng)前策略下的狀態(tài)值函數(shù)。通過(guò)TD 誤差用于反饋并更新Actor 網(wǎng)絡(luò)的策略參數(shù)。算法實(shí)現(xiàn)了動(dòng)作價(jià)值評(píng)估和策略更新過(guò)程的相對(duì)獨(dú)立,Actor 可以對(duì)當(dāng)前環(huán)境進(jìn)行充分探索并進(jìn)行策略更新,Critic 只需要負(fù)責(zé)評(píng)價(jià)策略的好壞,從而降低訓(xùn)練樣本的相關(guān)性, 提升了采樣效率和訓(xùn)練速度。策略梯度更新的目的是學(xué)習(xí)一個(gè)使得期望累計(jì)獎(jiǎng)勵(lì)值最大化的策略。A2C 算法的Critic 網(wǎng)絡(luò)和Actor 網(wǎng)絡(luò)更新方式如下。

    圖1 Actor-Critic 算法架構(gòu)

    其中TD 誤差采用均方誤差損失函數(shù)來(lái)計(jì)算,則Critic 網(wǎng)絡(luò)的損失函數(shù)為:

    式中,Gt=Rt+1+γRt+2+…+γn-1Rt+n+γt+nV(st+n)為累積獎(jiǎng)勵(lì),Gt-V(st)為優(yōu)勢(shì)函數(shù)A。則Actor 的優(yōu)化目標(biāo)函數(shù)可以由式(2)給出。

    式中,π*為最優(yōu)策略,該公式的含義為當(dāng)TD 大于0 時(shí)增強(qiáng)該動(dòng)作的選擇概率,反之亦然,所以目標(biāo)為最小化損失函數(shù)-La。

    2 基于優(yōu)勢(shì)行動(dòng)-評(píng)論的雷達(dá)自主干擾決策方法

    2.1 雷達(dá)自主干擾決策模型

    如圖2 所示,基于優(yōu)勢(shì)行動(dòng)-評(píng)論的雷達(dá)自主干擾決策模型可用四元組抽象表示,即S,A,P,R,其中,S表示敵方雷達(dá)的工作狀態(tài)空間,假設(shè)雷達(dá)有N種工作狀態(tài),則S={s1,s2,…,sN},狀態(tài)可以是雷達(dá)的工作模式,如搜索、跟蹤等;A表示干擾智能體的可采取動(dòng)作空間,動(dòng)作空間是可執(zhí)行的干擾樣式等,假設(shè)智能 體 可 采 取 的 干 擾 樣 式 有M種 ,則A={a1,a2,…,aM};P為狀態(tài)轉(zhuǎn)移概率,即干擾智能體在一個(gè)狀態(tài)下采取一個(gè)動(dòng)作a后達(dá)到下一個(gè)狀態(tài)的概率,記為P(s′|s,a);R為獎(jiǎng)勵(lì)函數(shù),指干擾智能體在一個(gè)狀態(tài)完成一個(gè)動(dòng)作后的獎(jiǎng)勵(lì),記為即時(shí)回報(bào)r(s,a),獎(jiǎng)勵(lì)是干擾方的干擾收益。該模型的核心問(wèn)題是為決策者找到一個(gè)最優(yōu)的策略:函數(shù)π(s)表示當(dāng)前狀態(tài)下的動(dòng)作。目標(biāo)是最大化該策略的累積獎(jiǎng)勵(lì)函數(shù),即π*(s)=arg maxa∈AQ*(s,a),其中,π*(s)為最優(yōu)策略,Q*(s,a)為當(dāng)前狀態(tài)下選擇動(dòng)作的最優(yōu)狀態(tài)-動(dòng)作值函數(shù)。

    圖2 基于A2C 算法的雷達(dá)干擾決策模型

    干擾知識(shí)庫(kù)中預(yù)存儲(chǔ)雷達(dá)的工作狀態(tài)參數(shù)、干擾樣式及其對(duì)應(yīng)的干擾效果等知識(shí),干擾知識(shí)庫(kù)一方面為干擾決策提供先驗(yàn)知識(shí),另一方面也不斷在新的決策過(guò)程中修正知識(shí)庫(kù)中已有經(jīng)驗(yàn)和更新知識(shí)。理想情況下,假設(shè)先驗(yàn)經(jīng)驗(yàn)充足且完善,雷達(dá)自主干擾決策僅需要從干擾知識(shí)庫(kù)中獲取知識(shí)即可。

    2.2 基于優(yōu)勢(shì)行動(dòng)-評(píng)論的雷達(dá)干擾決策過(guò)程

    文中雷達(dá)是非合作式目標(biāo),干擾方不能直接獲得雷達(dá)工作的各項(xiàng)參數(shù),只能通過(guò)偵查手段對(duì)雷達(dá)的工作狀態(tài)和行為特征進(jìn)行辨識(shí),實(shí)現(xiàn)雷達(dá)威脅信號(hào)的感知。假設(shè)雷達(dá)的工作狀態(tài)(本文以工作模式為狀態(tài))有N種,狀態(tài)集合表示為S={s1,s2,…,sN};干擾智能體可采取的干擾樣式動(dòng)作假設(shè)有M種,動(dòng)作集合可表示為A={a1,a2,…,aM};在當(dāng)前時(shí)刻t,工作狀態(tài)為st,干擾方會(huì)根據(jù)偵查到的敵方雷達(dá)信號(hào)信息,識(shí)別出雷達(dá)的工作狀態(tài)。首先,對(duì)于該狀態(tài)從干擾知識(shí)庫(kù)橫向比較各干擾樣式參數(shù)得到與雷達(dá)干擾效果相關(guān)的參數(shù),作為選擇下一步干擾動(dòng)作的依據(jù)。同時(shí),保留一定的探索新?tīng)顟B(tài)的行為概率。當(dāng)Actor 網(wǎng)絡(luò)根據(jù)知識(shí)及其當(dāng)前策略選擇干擾動(dòng)作后作用于敵方雷達(dá),Critic網(wǎng)絡(luò)根據(jù)反饋信息對(duì)選擇的動(dòng)作進(jìn)行評(píng)價(jià),指導(dǎo)actor網(wǎng)絡(luò)的更新。此時(shí),完成一次“觀察-學(xué)習(xí)-反饋-再觀察”的訓(xùn)練,并且A2C 學(xué)習(xí)模型獲得一次經(jīng)驗(yàn)樣本,即st,at,rt,Rt,st+1,其中rt是一次動(dòng)作的即時(shí)獎(jiǎng)勵(lì),Rt是執(zhí)行該動(dòng)作后的累積獎(jiǎng)勵(lì)期望。

    此外,經(jīng)驗(yàn)樣本是存儲(chǔ)用于訓(xùn)練當(dāng)前評(píng)價(jià)網(wǎng)絡(luò)的輸入樣本,使用經(jīng)驗(yàn)樣本融合了模仿學(xué)習(xí)和經(jīng)驗(yàn)回放的思路,一方面,先驗(yàn)知識(shí)作為經(jīng)驗(yàn)加速訓(xùn)練網(wǎng)絡(luò)的效率,另一方面產(chǎn)生新的樣本可以存入并更新到知識(shí)庫(kù)中。在算法訓(xùn)練階段可從經(jīng)驗(yàn)知識(shí)庫(kù)隨機(jī)抽樣樣本供策略網(wǎng)絡(luò)學(xué)習(xí),這有助于減小學(xué)習(xí)樣本之間的相關(guān)性,提高樣本的利用效率。仿真實(shí)驗(yàn)證明,先驗(yàn)知識(shí)的加入能夠有效提升算法的學(xué)習(xí)效率。

    本文假設(shè)雷達(dá)通過(guò)工作模式的轉(zhuǎn)變體現(xiàn)抗干擾,且雷達(dá)工作模式的轉(zhuǎn)變是由于干擾引起的,因此干擾方的干擾收益可以通過(guò)雷達(dá)工作模式的轉(zhuǎn)移評(píng)估得到。假設(shè)雷達(dá)的工作模式轉(zhuǎn)變服從以馬爾科夫決策過(guò)程,雷達(dá)有N種工作模式,記為S={s1,s2,…,sN}。以pij表示雷達(dá)從第i種工作模式轉(zhuǎn)移到第j種工作模式的概率。干擾方通過(guò)偵查設(shè)備統(tǒng)計(jì)一段時(shí)間的雷達(dá)工作模式,然后根據(jù)統(tǒng)計(jì)的方式計(jì)算工作模式的轉(zhuǎn)移概率,如:

    進(jìn)而可得到總的工作模式轉(zhuǎn)移概率矩陣,如:

    假設(shè)干擾方可以實(shí)施的干擾樣式有M種,記為J={j1,j2,…,jM},針對(duì)不同的干擾樣式,雷達(dá)工作模式轉(zhuǎn)移的概率不同,若將雷達(dá)受到第k種干擾時(shí),雷達(dá)的工作狀態(tài)由i轉(zhuǎn)變到j(luò)的概率記為,則可以得到此時(shí)狀態(tài)的轉(zhuǎn)移概率為:

    在實(shí)施干擾后,可能導(dǎo)致雷達(dá)的工作狀態(tài)發(fā)生變化,干擾方則根據(jù)干擾效果進(jìn)行評(píng)估得到工作模式的轉(zhuǎn)移獎(jiǎng)勵(lì)。不同的干擾樣式對(duì)雷達(dá)不同的工作狀態(tài)影響也不一樣,以各工作體制雷達(dá)為例,壓制干擾在雷達(dá)搜索模式效果好,在跟蹤模式時(shí),欺騙干擾通常比噪聲干擾的效果更好。

    通過(guò)上述分析,有效的干擾決策使得干擾更具有主動(dòng)性和針對(duì)性,大幅提升干擾效能。為了計(jì)算雷達(dá)工作狀態(tài)轉(zhuǎn)換所反饋的干擾效果,借鑒文獻(xiàn)[11]中對(duì)不同工作模式進(jìn)行威脅等級(jí)劃分的方法,定義雷達(dá)工作模式轉(zhuǎn)換的3 種情況:高威脅模式轉(zhuǎn)換到低威脅模式、低威脅模式轉(zhuǎn)換到高威脅模式以及威脅等級(jí)不變。那么受到第k干擾后,雷達(dá)從工作模式i轉(zhuǎn)移到模式j(luò)的獎(jiǎng)勵(lì)函數(shù)設(shè)為有效的干擾動(dòng)作會(huì)使得雷達(dá)的工作模式轉(zhuǎn)變且威脅等級(jí)下降。因此,在算法學(xué)習(xí)的過(guò)程中,干擾智能體的目的是使得雷達(dá)的威脅程度在最少的時(shí)間內(nèi)達(dá)到最低。

    雷達(dá)自主干擾決策流程主要分為5 個(gè)步驟,如圖3所示。

    圖3 A2C 干擾決策方法流程圖

    1) 初始化算法網(wǎng)絡(luò)參數(shù)包括評(píng)價(jià)網(wǎng)絡(luò)參數(shù)w,策略網(wǎng)絡(luò)參數(shù)θ;初始化學(xué)習(xí)率α,折扣因子γ,動(dòng)作探索貪婪策略因子ε;初始化干擾知識(shí)庫(kù)。

    2) 設(shè)置策略收斂條件,最大訓(xùn)練回合數(shù),每回合最大訓(xùn)練迭代次數(shù)。

    3) 根據(jù)輸入的雷達(dá)干擾任務(wù),干擾智能體通過(guò)偵查方分析環(huán)境得到雷達(dá)工作狀態(tài)st,Actor 網(wǎng)絡(luò)依據(jù)策略π 或分析經(jīng)驗(yàn)知識(shí)選擇動(dòng)作at,基于該動(dòng)作得到新的狀態(tài)st+1和獎(jiǎng)勵(lì)rt,Critic 網(wǎng)絡(luò)輸入當(dāng)前狀態(tài)與動(dòng)作,輸出動(dòng)作價(jià)值函數(shù)Vt;并保存和更新經(jīng)驗(yàn)知識(shí)st,at,rt,Rt,st+1到知識(shí)庫(kù)中。

    4) 計(jì)算優(yōu)勢(shì)函數(shù)A,更新Critic 網(wǎng)絡(luò),更新Actor網(wǎng)絡(luò)。

    5) 達(dá)到單回合最大迭代次數(shù)結(jié)束該回合,或達(dá)到最大訓(xùn)練回合數(shù)結(jié)束訓(xùn)練,或算法達(dá)到收斂狀態(tài)結(jié)束訓(xùn)練。

    3 仿真實(shí)驗(yàn)分析

    為驗(yàn)證本文提出算法的可行性和有效性,本文以某多功能相陣控雷達(dá)為例,該雷達(dá)在工作過(guò)程中,可以自主完成搜索、跟蹤、識(shí)別和制導(dǎo)等任務(wù)。圍繞雷達(dá)工作的全過(guò)程,假設(shè)實(shí)驗(yàn)中雷達(dá)工作模式有5 種,即關(guān)機(jī)、搜索、跟蹤(單目標(biāo)跟蹤、多目標(biāo)跟蹤)、綜合(邊搜索邊跟蹤)、制導(dǎo),即{s0,s1,s2,s3,s4,s5,s6}。其中威脅等級(jí)依次上升,分別為0,1,2,3,4,5,6。動(dòng)作為無(wú)干擾、壓制干擾(噪聲調(diào)制、射頻噪聲干擾、梳狀譜干擾)、欺騙干擾(假目標(biāo)干擾、距速拖引干擾、靈巧噪聲干擾)7 種,記為{a0,a1,a2,a3,a4,a5,a6}。

    DQN 算法是經(jīng)典的深度強(qiáng)化學(xué)習(xí)算法,可解決未知對(duì)抗環(huán)境下對(duì)多功能雷達(dá)的干擾最優(yōu)決策問(wèn)題[11]。因此仿真實(shí)驗(yàn)分別采用DQN 算法和A2C 算法進(jìn)行對(duì)比測(cè)試,其中設(shè)置折扣因子γ=0.9,學(xué)習(xí)率為α=0.01,動(dòng)作的初始探索率為ε=0.9,隨著訓(xùn)練次數(shù)的增加,探索因子逐漸變小。

    3.1 算法性能比較

    實(shí)驗(yàn)1 中,DQN 算法和A2C 算法的訓(xùn)練回合數(shù)為800,記錄每回合訓(xùn)練的平均動(dòng)作值和平均損失誤差,結(jié)果如圖4 和圖5 所示。圖中顯示的是2 種算法的網(wǎng)絡(luò)模型策略隨著訓(xùn)練次數(shù)增加的關(guān)系,可以看出隨著訓(xùn)練次數(shù)的增加,DQN 算法和A2C 算法的平均動(dòng)作值逐漸增加,且平均誤差逐漸減小,且相比于DQN 算法,A2C 算法收斂的速度更快,學(xué)習(xí)效率更高。當(dāng)訓(xùn)練回合數(shù)在0~200 之間,A2C 算法的平均動(dòng)作價(jià)值迅速增加,損失函數(shù)減少但波動(dòng)比較明顯,表明智能體在探索動(dòng)作的過(guò)程中有明顯的學(xué)習(xí)過(guò)程。200 回合以后,損失函數(shù)穩(wěn)定減小,表明A2C 智能體策略達(dá)到穩(wěn)定的收斂狀態(tài)。而DQN 算法則在400 回合以后,智能體策略達(dá)到相對(duì)穩(wěn)定的收斂狀態(tài)。

    圖4 每回合平均動(dòng)作值

    圖5 每回合損失誤差

    3.2 先驗(yàn)知識(shí)對(duì)算法的影響

    為驗(yàn)證先驗(yàn)知識(shí)對(duì)算法模型的學(xué)習(xí)存在的影響關(guān)系,實(shí)驗(yàn)2 中分別設(shè)置100、200、400 條先驗(yàn)經(jīng)驗(yàn)來(lái)預(yù)訓(xùn)練智能體模型,得到的算法訓(xùn)練結(jié)果如圖6 所示??梢钥闯?,先驗(yàn)知識(shí)對(duì)智能體的訓(xùn)練和學(xué)習(xí)存在正向的促進(jìn)關(guān)系,且隨著先驗(yàn)知識(shí)的增多,智能體模型的學(xué)習(xí)效率更高,收斂速度更快。這表明,在特定的知識(shí)領(lǐng)域,專(zhuān)家知識(shí)對(duì)強(qiáng)化學(xué)習(xí)算法模型的學(xué)習(xí)具有巨大的輔助支撐作用。

    圖6 先驗(yàn)知識(shí)對(duì)算法學(xué)習(xí)效率的影響

    4 結(jié)束語(yǔ)

    智能干擾決策算法的關(guān)鍵是在相應(yīng)的狀態(tài)下提供有效的干擾策略,本質(zhì)上等效為一個(gè)序貫決策問(wèn)題。本文在雷達(dá)干擾原理及深度強(qiáng)化學(xué)習(xí)算法分析的基礎(chǔ)上,提出了基于優(yōu)勢(shì)行動(dòng)-評(píng)論的自主干擾決策算法來(lái)解決不同雷達(dá)狀態(tài)下的自主干擾決策問(wèn)題。仿真結(jié)果表明,在智能體通過(guò)大量的干擾策略動(dòng)作與雷達(dá)環(huán)境狀態(tài)進(jìn)行交互后,其能夠快速學(xué)習(xí)到最優(yōu)的干擾策略,且在智能干擾算法的學(xué)習(xí)中,先驗(yàn)知識(shí)能夠加快算法的學(xué)習(xí)效率,可為認(rèn)知干擾決策的研究提供一定的理論支撐和指導(dǎo)意義。但是,干擾策略的決策還需進(jìn)一步考慮干擾參數(shù)如干信比、占空比、假目標(biāo)數(shù)量等參數(shù)的最佳選擇與適配,后續(xù)研究可根據(jù)典型的干擾樣式及其干擾參數(shù)的分析,結(jié)合具體的機(jī)器學(xué)習(xí)算法來(lái)實(shí)現(xiàn)更智能和深入的干擾決策應(yīng)用。

    猜你喜歡
    雷達(dá)決策狀態(tài)
    有雷達(dá)
    大自然探索(2023年7期)2023-08-15 00:48:21
    為可持續(xù)決策提供依據(jù)
    狀態(tài)聯(lián)想
    決策為什么失誤了
    雷達(dá)
    生命的另一種狀態(tài)
    熱圖
    家庭百事通(2016年3期)2016-03-14 08:07:17
    堅(jiān)持是成功前的狀態(tài)
    山東青年(2016年3期)2016-02-28 14:25:52
    基于空時(shí)二維隨機(jī)輻射場(chǎng)的彈載雷達(dá)前視成像
    現(xiàn)代“千里眼”——雷達(dá)
    亚洲成a人片在线一区二区| 午夜免费成人在线视频| 热99久久久久精品小说推荐| 一级,二级,三级黄色视频| 午夜久久久在线观看| 色视频在线一区二区三区| 中文字幕av电影在线播放| 窝窝影院91人妻| 成人精品一区二区免费| 成人精品一区二区免费| 两性午夜刺激爽爽歪歪视频在线观看 | 精品乱码久久久久久99久播| 久久精品aⅴ一区二区三区四区| 日韩欧美一区二区三区在线观看 | av天堂在线播放| 美女午夜性视频免费| kizo精华| 国产亚洲精品久久久久5区| 国产熟女午夜一区二区三区| 两人在一起打扑克的视频| 成人18禁高潮啪啪吃奶动态图| 在线观看舔阴道视频| 757午夜福利合集在线观看| 又黄又粗又硬又大视频| 精品一区二区三区视频在线观看免费 | 免费黄频网站在线观看国产| 蜜桃国产av成人99| 久久国产精品影院| 欧美 日韩 精品 国产| 国产精品影院久久| 亚洲少妇的诱惑av| 女人高潮潮喷娇喘18禁视频| 午夜福利视频在线观看免费| 啦啦啦免费观看视频1| 91字幕亚洲| 蜜桃国产av成人99| 亚洲少妇的诱惑av| 日韩欧美一区视频在线观看| 国产不卡av网站在线观看| 亚洲av美国av| av有码第一页| 国产亚洲欧美在线一区二区| 欧美日韩亚洲综合一区二区三区_| 免费人妻精品一区二区三区视频| 久久这里只有精品19| 日本av手机在线免费观看| 夜夜骑夜夜射夜夜干| 亚洲国产成人一精品久久久| 日本黄色日本黄色录像| 男人操女人黄网站| 久久久精品94久久精品| 一二三四在线观看免费中文在| 国产精品久久久av美女十八| 国产av精品麻豆| 国产极品粉嫩免费观看在线| 91老司机精品| 国产高清视频在线播放一区| 黄色视频不卡| 午夜精品久久久久久毛片777| 两个人看的免费小视频| 9热在线视频观看99| 午夜福利视频在线观看免费| 国产亚洲欧美在线一区二区| 最新在线观看一区二区三区| xxxhd国产人妻xxx| 中文亚洲av片在线观看爽 | 涩涩av久久男人的天堂| 90打野战视频偷拍视频| 久久久久国内视频| 国产片内射在线| 最新美女视频免费是黄的| 老司机在亚洲福利影院| 欧美变态另类bdsm刘玥| 两性夫妻黄色片| 亚洲综合色网址| 午夜福利视频精品| 亚洲精品国产区一区二| 亚洲精品美女久久av网站| 国产色视频综合| 成人影院久久| 一边摸一边做爽爽视频免费| 中文字幕人妻丝袜一区二区| 美女主播在线视频| 久久99热这里只频精品6学生| 在线观看www视频免费| 国产真人三级小视频在线观看| 国产精品免费一区二区三区在线 | 欧美日本中文国产一区发布| 亚洲伊人久久精品综合| 又黄又粗又硬又大视频| 亚洲欧美色中文字幕在线| 亚洲人成77777在线视频| 视频区图区小说| 国产免费视频播放在线视频| 97在线人人人人妻| 欧美激情 高清一区二区三区| 国产精品久久久久久人妻精品电影 | 色综合婷婷激情| 99国产精品一区二区三区| 在线观看人妻少妇| 亚洲九九香蕉| 午夜激情久久久久久久| 亚洲专区国产一区二区| 在线天堂中文资源库| 久久免费观看电影| 久久影院123| 亚洲一区二区三区欧美精品| 人人澡人人妻人| 亚洲精品中文字幕在线视频| 亚洲男人天堂网一区| 一级片免费观看大全| 久久久精品国产亚洲av高清涩受| 夜夜骑夜夜射夜夜干| 一本久久精品| 亚洲精品在线观看二区| 国产精品 国内视频| 黑人猛操日本美女一级片| 一边摸一边做爽爽视频免费| 国产免费现黄频在线看| 夫妻午夜视频| 男人舔女人的私密视频| av网站免费在线观看视频| av一本久久久久| 丰满饥渴人妻一区二区三| 成年人免费黄色播放视频| 菩萨蛮人人尽说江南好唐韦庄| 无限看片的www在线观看| 日韩 欧美 亚洲 中文字幕| 老鸭窝网址在线观看| 亚洲情色 制服丝袜| 少妇粗大呻吟视频| 精品国产乱码久久久久久男人| 人妻久久中文字幕网| 一级黄色大片毛片| videosex国产| 色尼玛亚洲综合影院| 999久久久精品免费观看国产| 日韩熟女老妇一区二区性免费视频| 老司机午夜十八禁免费视频| 一级a爱视频在线免费观看| 深夜精品福利| 在线av久久热| 精品国产亚洲在线| 岛国毛片在线播放| 精品久久久久久电影网| 少妇 在线观看| 欧美黄色片欧美黄色片| 国产97色在线日韩免费| 亚洲专区国产一区二区| 99精国产麻豆久久婷婷| 亚洲精品国产一区二区精华液| 国产亚洲一区二区精品| 黑丝袜美女国产一区| 久久久久视频综合| 欧美亚洲日本最大视频资源| 色94色欧美一区二区| 首页视频小说图片口味搜索| 精品国产超薄肉色丝袜足j| 大香蕉久久网| 国产精品欧美亚洲77777| 黑人巨大精品欧美一区二区mp4| 国产在线视频一区二区| 精品午夜福利视频在线观看一区 | 国产成人精品无人区| 国产高清国产精品国产三级| 国产野战对白在线观看| 在线观看免费日韩欧美大片| 我要看黄色一级片免费的| 考比视频在线观看| 国产成人免费观看mmmm| 蜜桃国产av成人99| 欧美精品人与动牲交sv欧美| 国产av国产精品国产| 色在线成人网| 一区在线观看完整版| 香蕉久久夜色| 在线天堂中文资源库| 久久精品国产99精品国产亚洲性色 | 考比视频在线观看| 操出白浆在线播放| 黄色成人免费大全| videosex国产| 两个人看的免费小视频| 精品一区二区三卡| 操出白浆在线播放| 亚洲五月色婷婷综合| 成人免费观看视频高清| 正在播放国产对白刺激| 国产精品久久久av美女十八| 国产精品偷伦视频观看了| 热re99久久国产66热| 午夜福利乱码中文字幕| 日韩有码中文字幕| 精品少妇一区二区三区视频日本电影| 国内毛片毛片毛片毛片毛片| xxxhd国产人妻xxx| 国产精品久久久人人做人人爽| 亚洲人成电影免费在线| 亚洲五月色婷婷综合| 久久精品人人爽人人爽视色| 精品午夜福利视频在线观看一区 | 免费女性裸体啪啪无遮挡网站| 香蕉国产在线看| 国产亚洲精品一区二区www | 亚洲成av片中文字幕在线观看| 99热网站在线观看| 不卡一级毛片| 久久久久久久久久久久大奶| 精品久久久精品久久久| 国产一区二区三区综合在线观看| 欧美一级毛片孕妇| 色老头精品视频在线观看| 一区二区日韩欧美中文字幕| 欧美日韩视频精品一区| a在线观看视频网站| 亚洲人成电影免费在线| e午夜精品久久久久久久| 美女福利国产在线| 日韩成人在线观看一区二区三区| 精品免费久久久久久久清纯 | 久久九九热精品免费| 欧美日韩国产mv在线观看视频| 人人妻,人人澡人人爽秒播| 99精国产麻豆久久婷婷| 精品久久蜜臀av无| 美国免费a级毛片| 自线自在国产av| 99国产综合亚洲精品| 菩萨蛮人人尽说江南好唐韦庄| 免费在线观看日本一区| 老司机靠b影院| 成年人免费黄色播放视频| 黄色片一级片一级黄色片| netflix在线观看网站| 涩涩av久久男人的天堂| 一夜夜www| 国产激情久久老熟女| 国产精品98久久久久久宅男小说| 日韩欧美一区二区三区在线观看 | 一个人免费在线观看的高清视频| 日本撒尿小便嘘嘘汇集6| 女人爽到高潮嗷嗷叫在线视频| 国产真人三级小视频在线观看| 亚洲一码二码三码区别大吗| 午夜成年电影在线免费观看| 国产精品亚洲一级av第二区| 久久人妻福利社区极品人妻图片| 亚洲精品av麻豆狂野| 久热这里只有精品99| 一进一出抽搐动态| 免费在线观看影片大全网站| 嫁个100分男人电影在线观看| 国产成+人综合+亚洲专区| 天堂动漫精品| 久久午夜综合久久蜜桃| 亚洲国产看品久久| 精品国产一区二区久久| 飞空精品影院首页| 欧美精品一区二区免费开放| 日韩一区二区三区影片| 电影成人av| 午夜91福利影院| 亚洲av美国av| 91大片在线观看| 三上悠亚av全集在线观看| 99精国产麻豆久久婷婷| 国产在线免费精品| 91麻豆精品激情在线观看国产 | 国产成人精品久久二区二区免费| 黑人巨大精品欧美一区二区蜜桃| 亚洲av日韩在线播放| www.熟女人妻精品国产| 蜜桃国产av成人99| 狠狠婷婷综合久久久久久88av| 免费久久久久久久精品成人欧美视频| 一级黄色大片毛片| 日韩熟女老妇一区二区性免费视频| 老司机午夜福利在线观看视频 | 捣出白浆h1v1| 桃花免费在线播放| 一级黄色大片毛片| 久久天堂一区二区三区四区| 纵有疾风起免费观看全集完整版| 午夜激情久久久久久久| 一级黄色大片毛片| 久久久水蜜桃国产精品网| 色婷婷av一区二区三区视频| 老司机在亚洲福利影院| 亚洲成av片中文字幕在线观看| 日本vs欧美在线观看视频| 欧美激情久久久久久爽电影 | 国产黄色免费在线视频| 高潮久久久久久久久久久不卡| 日韩免费av在线播放| 精品免费久久久久久久清纯 | 丝袜美足系列| 天天影视国产精品| 久久这里只有精品19| 国产成人欧美| 制服诱惑二区| 国产一区二区三区视频了| 男女边摸边吃奶| 久久精品亚洲熟妇少妇任你| 一夜夜www| 亚洲欧美一区二区三区久久| 亚洲精品国产精品久久久不卡| 久久久久精品国产欧美久久久| 欧美精品高潮呻吟av久久| 最黄视频免费看| 亚洲精品在线美女| 欧美成狂野欧美在线观看| 一边摸一边抽搐一进一出视频| 国产欧美亚洲国产| 一级毛片女人18水好多| 十八禁网站网址无遮挡| 免费在线观看日本一区| 成年人免费黄色播放视频| 久久人人爽av亚洲精品天堂| 日本精品一区二区三区蜜桃| 50天的宝宝边吃奶边哭怎么回事| 日韩欧美三级三区| 欧美久久黑人一区二区| 久久久精品免费免费高清| 精品午夜福利视频在线观看一区 | bbb黄色大片| 不卡一级毛片| 黄片大片在线免费观看| 日韩一区二区三区影片| 国产精品成人在线| 另类精品久久| 欧美日韩视频精品一区| 少妇粗大呻吟视频| 女警被强在线播放| 午夜精品国产一区二区电影| 国产欧美日韩综合在线一区二区| 国产成人欧美| 操出白浆在线播放| 99久久人妻综合| 女警被强在线播放| 亚洲伊人色综图| 久久久精品国产亚洲av高清涩受| 午夜免费成人在线视频| 日韩大片免费观看网站| 亚洲第一av免费看| av网站在线播放免费| 日韩成人在线观看一区二区三区| 大码成人一级视频| 午夜福利欧美成人| 黑人猛操日本美女一级片| 亚洲精品久久成人aⅴ小说| 精品欧美一区二区三区在线| 国产淫语在线视频| 欧美成人免费av一区二区三区 | 日韩欧美三级三区| 怎么达到女性高潮| 国产精品九九99| 啦啦啦视频在线资源免费观看| 一二三四社区在线视频社区8| 两个人看的免费小视频| 十八禁网站网址无遮挡| 少妇猛男粗大的猛烈进出视频| 久久久水蜜桃国产精品网| 看免费av毛片| 视频区欧美日本亚洲| 啦啦啦视频在线资源免费观看| 天天操日日干夜夜撸| 窝窝影院91人妻| 亚洲精品国产精品久久久不卡| 日日爽夜夜爽网站| 久久国产精品大桥未久av| netflix在线观看网站| 天天添夜夜摸| 中文字幕精品免费在线观看视频| 纵有疾风起免费观看全集完整版| 在线观看66精品国产| 久久免费观看电影| 一二三四在线观看免费中文在| 午夜福利在线观看吧| 侵犯人妻中文字幕一二三四区| 亚洲精品自拍成人| 欧美日韩黄片免| 又大又爽又粗| 不卡一级毛片| 三级毛片av免费| 日韩欧美国产一区二区入口| 夜夜夜夜夜久久久久| 涩涩av久久男人的天堂| 欧美成人免费av一区二区三区 | 老汉色av国产亚洲站长工具| 日日爽夜夜爽网站| 99国产综合亚洲精品| 又黄又粗又硬又大视频| 国产精品久久久久久人妻精品电影 | 精品人妻熟女毛片av久久网站| 啦啦啦中文免费视频观看日本| 大香蕉久久网| 操出白浆在线播放| videos熟女内射| 在线av久久热| 一区二区日韩欧美中文字幕| 最新美女视频免费是黄的| 99精品欧美一区二区三区四区| xxxhd国产人妻xxx| 国产一区二区三区在线臀色熟女 | 男男h啪啪无遮挡| 天天添夜夜摸| 欧美 亚洲 国产 日韩一| 国产免费福利视频在线观看| 一级a爱视频在线免费观看| 99riav亚洲国产免费| 欧美日韩黄片免| 最黄视频免费看| 亚洲伊人色综图| 18禁裸乳无遮挡动漫免费视频| 丁香欧美五月| 夫妻午夜视频| 天堂动漫精品| 99九九在线精品视频| 精品免费久久久久久久清纯 | kizo精华| 亚洲精品av麻豆狂野| 亚洲人成77777在线视频| 又黄又粗又硬又大视频| 国产精品 国内视频| 一区二区三区激情视频| 无人区码免费观看不卡 | 伦理电影免费视频| 深夜精品福利| 王馨瑶露胸无遮挡在线观看| 国产成人精品无人区| 久久国产精品影院| 99香蕉大伊视频| 日本五十路高清| 最新在线观看一区二区三区| 日韩欧美一区视频在线观看| 色视频在线一区二区三区| 女人久久www免费人成看片| 黑人操中国人逼视频| 国产免费现黄频在线看| 欧美精品啪啪一区二区三区| 超色免费av| 免费在线观看影片大全网站| 亚洲免费av在线视频| 欧美+亚洲+日韩+国产| 少妇的丰满在线观看| 精品人妻在线不人妻| 丰满迷人的少妇在线观看| 99在线人妻在线中文字幕 | 国产野战对白在线观看| 欧美国产精品一级二级三级| 两个人看的免费小视频| 亚洲精品国产精品久久久不卡| 欧美日韩国产mv在线观看视频| 亚洲七黄色美女视频| 麻豆成人av在线观看| 成人黄色视频免费在线看| 999久久久国产精品视频| 最新在线观看一区二区三区| av视频免费观看在线观看| 黄色a级毛片大全视频| videosex国产| 国产精品久久久久久精品电影小说| 欧美亚洲 丝袜 人妻 在线| 久久婷婷成人综合色麻豆| 国产一区二区在线观看av| 日韩视频在线欧美| 久久热在线av| 亚洲av电影在线进入| 岛国在线观看网站| 在线观看免费日韩欧美大片| 99国产极品粉嫩在线观看| 老司机福利观看| 宅男免费午夜| 王馨瑶露胸无遮挡在线观看| 日韩人妻精品一区2区三区| 久久久精品区二区三区| 一区二区av电影网| 一区二区日韩欧美中文字幕| 窝窝影院91人妻| 久久人妻熟女aⅴ| 国产精品免费视频内射| 国产欧美日韩综合在线一区二区| 欧美在线黄色| 午夜免费鲁丝| 国产伦人伦偷精品视频| 国产亚洲一区二区精品| 两人在一起打扑克的视频| 久久精品国产亚洲av香蕉五月 | 999久久久精品免费观看国产| 精品久久久久久电影网| 考比视频在线观看| 一区二区三区国产精品乱码| 欧美精品人与动牲交sv欧美| 中文字幕制服av| av又黄又爽大尺度在线免费看| 久久中文看片网| 亚洲av片天天在线观看| 欧美精品人与动牲交sv欧美| 午夜视频精品福利| av网站在线播放免费| 中文字幕人妻丝袜一区二区| 欧美人与性动交α欧美软件| 欧美日韩成人在线一区二区| 极品少妇高潮喷水抽搐| av天堂久久9| 国产精品一区二区在线观看99| 亚洲色图av天堂| 久久午夜亚洲精品久久| 国产精品麻豆人妻色哟哟久久| 成人18禁高潮啪啪吃奶动态图| 人人妻人人澡人人爽人人夜夜| 老司机在亚洲福利影院| 国产极品粉嫩免费观看在线| 午夜福利乱码中文字幕| 国产免费视频播放在线视频| 一级片免费观看大全| 999久久久国产精品视频| 2018国产大陆天天弄谢| 在线天堂中文资源库| 五月天丁香电影| 国产色视频综合| 无遮挡黄片免费观看| 欧美大码av| 久久中文字幕人妻熟女| 激情视频va一区二区三区| 亚洲免费av在线视频| a级片在线免费高清观看视频| 男男h啪啪无遮挡| 日韩人妻精品一区2区三区| 好男人电影高清在线观看| 美女扒开内裤让男人捅视频| 女性生殖器流出的白浆| 久热爱精品视频在线9| 无人区码免费观看不卡 | 美女福利国产在线| 中国美女看黄片| 亚洲精品在线观看二区| 最新美女视频免费是黄的| 亚洲九九香蕉| 另类精品久久| 老司机福利观看| 岛国毛片在线播放| 曰老女人黄片| 久久香蕉激情| 国产主播在线观看一区二区| 丝袜美足系列| 十八禁人妻一区二区| 在线观看人妻少妇| 亚洲欧美日韩高清在线视频 | 免费在线观看影片大全网站| 国产亚洲欧美精品永久| 欧美日韩中文字幕国产精品一区二区三区 | 午夜福利乱码中文字幕| 亚洲中文日韩欧美视频| 午夜福利在线观看吧| 97在线人人人人妻| 久久人人爽av亚洲精品天堂| 久久精品国产亚洲av高清一级| 成人av一区二区三区在线看| 亚洲欧洲日产国产| 一个人免费在线观看的高清视频| 亚洲成人免费电影在线观看| 精品国产一区二区久久| 宅男免费午夜| 久久精品亚洲熟妇少妇任你| 免费在线观看黄色视频的| 久久亚洲精品不卡| 久久精品国产综合久久久| 久久久久国内视频| 欧美av亚洲av综合av国产av| 一级毛片女人18水好多| 欧美精品人与动牲交sv欧美| 人人妻,人人澡人人爽秒播| 久久国产精品人妻蜜桃| 精品免费久久久久久久清纯 | 国产精品一区二区在线观看99| 国产视频一区二区在线看| 少妇的丰满在线观看| 19禁男女啪啪无遮挡网站| 亚洲专区国产一区二区| 一本—道久久a久久精品蜜桃钙片| 亚洲成av片中文字幕在线观看| a级毛片黄视频| 精品一区二区三区四区五区乱码| 午夜福利,免费看| 欧美性长视频在线观看| 18禁黄网站禁片午夜丰满| 久久久欧美国产精品| 亚洲成人手机| 青草久久国产| 天天躁狠狠躁夜夜躁狠狠躁| 国精品久久久久久国模美| 最近最新免费中文字幕在线| 色在线成人网| 啦啦啦视频在线资源免费观看| 最新的欧美精品一区二区| 国产日韩欧美在线精品| 在线观看免费高清a一片| 汤姆久久久久久久影院中文字幕| 国产又爽黄色视频| 亚洲国产欧美网| 国产色视频综合| 欧美黑人精品巨大| 咕卡用的链子| 99香蕉大伊视频| 亚洲精品一二三| 日韩免费高清中文字幕av| 欧美日韩福利视频一区二区| 久久毛片免费看一区二区三区| 国产精品久久久久成人av| 99久久国产精品久久久| 亚洲男人天堂网一区| 97人妻天天添夜夜摸| 国产精品亚洲av一区麻豆| 国产在线免费精品|