• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    對(duì)先進(jìn)多功能雷達(dá)系統(tǒng)行為的識(shí)別、推理與預(yù)測(cè):綜述與展望

    2024-02-24 01:54:06王沙飛朱夢(mèng)韜李云杰
    信號(hào)處理 2024年1期
    關(guān)鍵詞:符號(hào)模型

    王沙飛 朱夢(mèng)韜*,2 李云杰 楊 健,2 李 巖,2

    (1.電磁空間認(rèn)知與智能控制技術(shù)實(shí)驗(yàn)室,北京 100191;2.北京理工大學(xué)網(wǎng)絡(luò)空間安全學(xué)院,北京 100081;3.北京理工大學(xué)信息與電子學(xué)院,北京 100081)

    1 引言

    本文所考慮的先進(jìn)體制雷達(dá)具體指具備多功能能力的相控陣多功能雷達(dá)系統(tǒng)(Multi-Function Radar,MFR),以及在此基礎(chǔ)上采取了認(rèn)知技術(shù)的相控陣多功能雷達(dá)系統(tǒng)1本文簡(jiǎn)稱為認(rèn)知多功能雷達(dá)(Cognitive MFR,CMFR)。兩類。

    多功能雷達(dá)概念最早可以追溯到第一部相控陣天線的出現(xiàn)。20 世紀(jì)70 年代,隨著數(shù)字技術(shù)的發(fā)展,雷達(dá)被賦予多功能性,能夠執(zhí)行多個(gè)不同的雷達(dá)任務(wù),如搜索、跟蹤、導(dǎo)航等[1,2]。由Simon Haykin 于2006 年正式提出的認(rèn)知雷達(dá)(Cognitive Radar,CR)概念[3]賦予多功能雷達(dá)更高的智能水平和自由度,從而進(jìn)一步發(fā)掘雷達(dá)的性能潛力。多功能性強(qiáng)調(diào)雷達(dá)系統(tǒng)具備任意波形生成和同時(shí)執(zhí)行多個(gè)不同任務(wù)的能力,以實(shí)現(xiàn)不同的雷達(dá)功能需求。認(rèn)知能力則強(qiáng)調(diào)雷達(dá)系統(tǒng)的智能性,認(rèn)知雷達(dá)能夠根據(jù)動(dòng)態(tài)變化的環(huán)境和目標(biāo)調(diào)整其雷達(dá)資源管理[2,4]??梢哉f,認(rèn)知多功能雷達(dá)(Cognitive MFR,CMFR)將是下一代多功能雷達(dá)的重要發(fā)展方向和實(shí)現(xiàn)形態(tài)[4]。

    (1)相控陣多功能雷達(dá)系統(tǒng)

    雷達(dá)的多功能性與天線類型無(wú)關(guān),如機(jī)械掃描方式的AN/APG-6570和73雷達(dá)已經(jīng)在作戰(zhàn)中演示了多功能性[1,5],但電子掃描天線陣列更容易實(shí)現(xiàn)多功能。電子掃描陣列可以通過相位控制、頻率控制和時(shí)間控制實(shí)現(xiàn)波束掃描。相控陣?yán)走_(dá)是最常見和最典型的MFR,其使用相位控制實(shí)現(xiàn)波束的無(wú)慣性快速掃描能力[6-8]。相較于傳統(tǒng)機(jī)械掃描天線,相控陣?yán)走_(dá)從根本上解決了大天線與伺服轉(zhuǎn)動(dòng)之間的矛盾,緩解了雷達(dá)目標(biāo)容量與數(shù)據(jù)率之間的矛盾,為遠(yuǎn)程、高速目標(biāo)的搜索與跟蹤提供了有效的技術(shù)途徑。相控陣多功能雷達(dá)能夠?qū)崿F(xiàn)實(shí)時(shí)和同時(shí)多波束指向,從而一方面可以靈活的針對(duì)空間多個(gè)目標(biāo)執(zhí)行多個(gè)同時(shí)的任務(wù),例如可分時(shí)分波束對(duì)不同目標(biāo)執(zhí)行搜索、跟蹤任務(wù)。另一方面也使得雷達(dá)任務(wù)執(zhí)行對(duì)雷達(dá)資源管理方法的依賴性增大[9-11]。即MFR是雷達(dá)硬件和資源管理算法的綜合體,是復(fù)雜系統(tǒng)的系統(tǒng)。

    相控陣?yán)走_(dá)發(fā)展的直接需求來(lái)自于冷戰(zhàn)期間洲際導(dǎo)彈預(yù)警、空間軌道監(jiān)視等等軍事需要。雷達(dá)需要在廣闊的空間體積中搜索檢測(cè)再入體以及跟蹤多個(gè)目標(biāo)以進(jìn)行作戰(zhàn)管理[6]。圖1 描述了美國(guó)相控陣技術(shù)和數(shù)字處理節(jié)點(diǎn)發(fā)展的時(shí)間線[6]。相控陣體制在多任務(wù)執(zhí)行方面具有天然優(yōu)勢(shì),加上相控陣在往低成本、小型化方向發(fā)展,50年來(lái),多功能相控陣?yán)走_(dá)在很多領(lǐng)域得到了迅速發(fā)展和廣泛應(yīng)用。包括反導(dǎo)預(yù)警、防空預(yù)警、空間目標(biāo)監(jiān)視、航空管制、引導(dǎo)識(shí)別、戰(zhàn)場(chǎng)偵察、電子對(duì)抗等等。雷達(dá)的載體也從地面發(fā)展到機(jī)載、艦載、星載以及彈載等形式[12]。這些先進(jìn)體制多功能雷達(dá)的應(yīng)用部署給現(xiàn)代電子偵察設(shè)備帶來(lái)了極大的挑戰(zhàn)[13]。

    圖1 美國(guó)相控陣?yán)走_(dá)技術(shù)發(fā)展Fig.1 Development of phased array radar technology in the United States

    (2)認(rèn)知多功能雷達(dá)系統(tǒng)

    隨著認(rèn)知技術(shù)的不斷發(fā)展,現(xiàn)代相控陣多功能雷達(dá)的系統(tǒng)設(shè)計(jì)正受到認(rèn)知雷達(dá)從發(fā)射-接收-閉環(huán)處理架構(gòu)的影響。認(rèn)知技術(shù)[3,4,14-17]基于對(duì)環(huán)境的感知,實(shí)時(shí)優(yōu)化雷達(dá)預(yù)先設(shè)定的目標(biāo)函數(shù)以充分挖掘雷達(dá)的性能潛力。認(rèn)知技術(shù)使得雷達(dá)具有脈沖-脈沖或者脈沖組-脈沖組級(jí)別的捷變能力,信號(hào)的復(fù)雜度和靈活性進(jìn)一步提升。認(rèn)知雷達(dá)通常也是多功能的,基于認(rèn)知雷達(dá)資源管理技術(shù)對(duì)多個(gè)雷達(dá)工作模式分配資源并優(yōu)化對(duì)應(yīng)控制參數(shù)。對(duì)認(rèn)知雷達(dá)技術(shù)的早期嘗試可以追溯到20 世紀(jì)70 年代,美國(guó)、歐洲以及亞洲的一些研究者就在嘗試將一些認(rèn)知技術(shù)應(yīng)用到真實(shí)世界的相控陣?yán)走_(dá)[18-19]2在參考文獻(xiàn)[18]中,作者Fred Daum(IEEE Fellow,雷神技術(shù)公司專家,粒子濾波器的提出者)指出雖然“認(rèn)知雷達(dá)”這個(gè)名詞是最早直接由Simon Haykin 和Joe Guerci提出,但符合認(rèn)知雷達(dá)概念與想法的嘗試性工作在20世紀(jì)70年代已得到廣泛開展。而這些50年前的嘗試由于保密和知識(shí)產(chǎn)權(quán)的原因未能在公開文獻(xiàn)發(fā)表。。在20 世紀(jì)90 年代的兩篇經(jīng)典相控陣多功能雷達(dá)的論文中提出了認(rèn)知技術(shù)的相關(guān)概念[20-21]。2006 年Simon Haykin 首次直接提出認(rèn)知雷達(dá)的概念[3],被認(rèn)為是認(rèn)知雷達(dá)發(fā)展史上的開創(chuàng)性貢獻(xiàn)。從此,認(rèn)知雷達(dá)開始受到國(guó)內(nèi)外研究者的廣泛關(guān)注和研究。

    目前對(duì)認(rèn)知雷達(dá)技術(shù)的研究集中在波形研究(Waveform Diversity)[22-24],傳感器和雷達(dá)資源管理研究(Sensor and Radar Resource Management)[4,25-27],目標(biāo)檢測(cè)與跟蹤(Target Detection and Tracking)[15,28],認(rèn)知雷達(dá)頂層框架設(shè)計(jì)[14,29-30],元認(rèn)知雷達(dá)[31-32],認(rèn)知雷達(dá)測(cè)試平臺(tái)等等[33-36]。認(rèn)知雷達(dá)最典型的特征就是感知-行動(dòng)環(huán)路(Perception Action Cycle,PAC)。在PAC 中,雷達(dá)感知環(huán)境,然后基于隨機(jī)最優(yōu)控制算法對(duì)發(fā)射機(jī)進(jìn)行最優(yōu)發(fā)射控制,以優(yōu)化雷達(dá)性能。典型的隨機(jī)最優(yōu)控制框架如馬爾可夫決策過程(Markov Decision Process,MDP),部分可觀測(cè)MDP(Partially Observable MDP,POMDP)以及基于強(qiáng)化學(xué)習(xí)算法求解序貫決策問題,已經(jīng)成為多功能雷達(dá)以及認(rèn)知多功能雷達(dá)的相關(guān)資源管理問題的一個(gè)熱點(diǎn),并得到了廣泛研究[37-42]??偟膩?lái)說,認(rèn)知雷達(dá)的概念、理論和建模工作,經(jīng)過十多年的發(fā)展,已經(jīng)有了許多的研究成果,但是大多成果仍處于雷達(dá)測(cè)試平臺(tái)驗(yàn)證層面,表1 梳理了國(guó)外典型的認(rèn)知雷達(dá)測(cè)試平臺(tái)。

    表1 典型認(rèn)知雷達(dá)技術(shù)測(cè)試平臺(tái)Tab.1 Typical cognitive radar testbed

    (3)多功能性的使能技術(shù)

    在現(xiàn)代多功能雷達(dá)的研究中,雷達(dá)資源管理是雷達(dá)多功能性與雷達(dá)性能保證的關(guān)鍵使能技術(shù)。在給定多功能硬件射頻系統(tǒng)、雷達(dá)資源總量和約束關(guān)系的前提下,資源管理技術(shù)需要充分控制和利用雷達(dá)的自由度,實(shí)現(xiàn)任務(wù)容量、質(zhì)量最大化和資源利用最優(yōu)化。多功能雷達(dá)資源管理具有三個(gè)方面的依賴性:一是雷達(dá)工作模式具有設(shè)計(jì)性;二是雷達(dá)探測(cè)能力具有調(diào)節(jié)性;三是雷達(dá)事件調(diào)度具有管理性[8]。具體來(lái)說,具有傳統(tǒng)或自適應(yīng)雷達(dá)資源管理能力的多功能雷達(dá),這些雷達(dá)在設(shè)計(jì)時(shí),預(yù)先設(shè)計(jì)具體的、有針對(duì)性的資源管理方法,并將這些方法封裝為一套完整的、相對(duì)固定的、可重復(fù)調(diào)用的資源分配和雷達(dá)控制關(guān)系。例如,在工作模式設(shè)計(jì)方面,針對(duì)不同環(huán)境和目標(biāo)預(yù)先設(shè)計(jì)不同具有針對(duì)性的雷達(dá)工作模式。在事件調(diào)度方面,預(yù)先設(shè)置調(diào)度策略處理事件調(diào)度,這些策略包括如固定模板、多模板、部分模板和自適應(yīng)模板等策略。而對(duì)認(rèn)知多功能雷達(dá)則根據(jù)回波感知到的環(huán)境狀況和優(yōu)化特定目標(biāo)函數(shù)來(lái)進(jìn)行雷達(dá)資源管理,即CMFR 具有認(rèn)知雷達(dá)資源管理的特點(diǎn)。參考IEEE 標(biāo)準(zhǔn)中對(duì)認(rèn)知雷達(dá)和自適應(yīng)雷達(dá)的定義[2],相較于自適應(yīng)MFR,CMFR 能夠在擴(kuò)展的時(shí)間線上學(xué)習(xí)調(diào)整其控制參數(shù)和處理參數(shù),靈活性、自由度較傳統(tǒng)多功能雷達(dá)有極大提升。

    (4)給電子偵察帶來(lái)的挑戰(zhàn)

    上述先進(jìn)多功能雷達(dá)系統(tǒng)的發(fā)展給傳統(tǒng)電子偵察設(shè)備帶來(lái)了幾個(gè)方面的巨大挑戰(zhàn):

    1)建模表征難:先進(jìn)多功能雷達(dá)系統(tǒng)具備自由分配時(shí)域、空域、頻域、能量域等多域資源的能力,其天線波束及工作波形復(fù)雜多樣,波束調(diào)度和發(fā)射波形組合靈活多變,且軟件自定義的特性使得新的工作狀態(tài)隨時(shí)出現(xiàn)。先進(jìn)體制雷達(dá)靈活捷變的動(dòng)態(tài)特性以及非合作電子偵察任務(wù)存在的視角差異、信息不對(duì)稱性等給雷達(dá)行為建模表征帶來(lái)挑戰(zhàn)。

    2)分選識(shí)別難:先進(jìn)多功能雷達(dá)系統(tǒng)自身信號(hào)產(chǎn)生機(jī)理層次化、信號(hào)形式復(fù)雜、多維參數(shù)聯(lián)合變化、工作狀態(tài)序列受調(diào)度策略和環(huán)境目標(biāo)狀態(tài)影響;現(xiàn)代戰(zhàn)場(chǎng)環(huán)境中各種用頻設(shè)備數(shù)量不斷增加且體制日趨復(fù)雜,使得先進(jìn)體制雷達(dá)所處電磁信號(hào)環(huán)境日益復(fù)雜,偵收脈沖序列往往包含來(lái)自多個(gè)輻射源的復(fù)雜脈沖序列;偵收脈沖序列存在由于偵察設(shè)備帶來(lái)的檢測(cè)信號(hào)缺失,雷達(dá)波束調(diào)度等原因造成的稀疏觀測(cè)情況,由于信號(hào)發(fā)射-傳播-接收過程帶來(lái)的噪聲與虛假干擾等非理想情況。上述三個(gè)因素給傳統(tǒng)的雷達(dá)輻射源分選3多功能雷達(dá)行為的特點(diǎn)可以輔助分選,因而對(duì)多功能雷達(dá)信號(hào)進(jìn)行分選時(shí)往往需要同時(shí)完成分選與識(shí)別。但本文聚焦于對(duì)先進(jìn)多功能雷達(dá)系統(tǒng)行為的識(shí)別、推理、預(yù)測(cè)等,為了聚焦,本文不對(duì)分選展開介紹。與識(shí)別方法帶來(lái)了挑戰(zhàn)。

    3)推理預(yù)測(cè)難:多功能雷達(dá)行為動(dòng)作序列受其和環(huán)境、目標(biāo)之間的交互過程影響,呈現(xiàn)出隨機(jī)動(dòng)態(tài)特性。認(rèn)知多功能雷達(dá)行為動(dòng)作序列受雷達(dá)資源管理器控制,行為生成策略受特定環(huán)境、目標(biāo)情況下的目標(biāo)函數(shù)最大化這一過程影響。上述先進(jìn)體制雷達(dá)和環(huán)境/目標(biāo)之間交互或博弈對(duì)抗導(dǎo)致的行為動(dòng)作隨機(jī)捷變特點(diǎn),給非合作觀測(cè)下的雷達(dá)行為生成策略推理與預(yù)測(cè)帶來(lái)挑戰(zhàn)。

    因而開展對(duì)先進(jìn)多功能雷達(dá)的行為識(shí)別、推理與預(yù)測(cè)研究具有緊迫性和必要性。

    (5)對(duì)先進(jìn)多功能雷達(dá)系統(tǒng)行為的分析研究

    目前,國(guó)內(nèi)外學(xué)者針對(duì)多功能雷達(dá)的系統(tǒng)行為建模表征與感知識(shí)別開展了大量研究,也取得了大量的研究成果。相關(guān)的綜述性文章主要有航天工程大學(xué)陽(yáng)榴于2020 年發(fā)表的關(guān)于多功能雷達(dá)工作模式識(shí)別的綜述[47],并對(duì)各類識(shí)別方法進(jìn)行了定性分析。2023 年信息工程大學(xué)付雨欣對(duì)多功能相控陣?yán)走_(dá)行為辨識(shí)進(jìn)行了綜述[48],并對(duì)各個(gè)研究中識(shí)別方法取得的性能進(jìn)行了比較分析。國(guó)防科技大學(xué)熊敬偉從知識(shí)驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)兩個(gè)方面對(duì)四類雷達(dá)工作模式識(shí)別方法進(jìn)行了綜述[49]。但這些綜述均聚焦于較為具體的、特定的雷達(dá)行為或工作模式識(shí)別任務(wù),亟須對(duì)多功能雷達(dá)行為分析更為全面和更具系統(tǒng)性的綜述研究。本文聚焦相控陣多功能雷達(dá)系統(tǒng)行為的非合作偵察分析,從多功能雷達(dá)行為的概念內(nèi)涵、建模表征、外顯行為識(shí)別、內(nèi)隱行為推理和未來(lái)行為預(yù)測(cè)等方面,對(duì)國(guó)內(nèi)外新技術(shù)、關(guān)鍵問題、解決方案進(jìn)行歸納分析,并對(duì)未來(lái)研究重點(diǎn)進(jìn)行展望4本文依據(jù)公開發(fā)表的文獻(xiàn)進(jìn)行綜述與展望。。

    本文重點(diǎn)綜述和介紹以下四個(gè)方面的內(nèi)容:第一是多功能雷達(dá)系統(tǒng)行為的概念、分類與內(nèi)涵,對(duì)應(yīng)本文第2 章;第二是多功能雷達(dá)系統(tǒng)行為的偵察分析模型,對(duì)應(yīng)本文第3章;第三是對(duì)多功能雷達(dá)系統(tǒng)外顯行為的識(shí)別和內(nèi)隱行為的推理,對(duì)應(yīng)本文第4 章和第5 章;第四是基于行為識(shí)別與推理結(jié)果對(duì)未來(lái)行為的預(yù)測(cè),對(duì)應(yīng)本文第6 章。最后第7 章對(duì)多功能雷達(dá)系統(tǒng)行為分析的未來(lái)研究重點(diǎn)進(jìn)行展望,并在第8章總結(jié)全文。

    2 多功能雷達(dá)行為的概念、分類與內(nèi)涵

    2.1 雷達(dá)行為的概念與分類

    在心理學(xué)中,“行為”指“有機(jī)體在各種內(nèi)外部刺激影響下產(chǎn)生的活動(dòng)”。2017 年國(guó)防科技大學(xué)的歐健博士首次定義“雷達(dá)行為”為“雷達(dá)對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)及電磁環(huán)境作出的內(nèi)部資源分配與外部信號(hào)輻射等所有反應(yīng)的總和”[50]。2018 年,電子信息控制重點(diǎn)實(shí)驗(yàn)室的石榮結(jié)合人類行為科學(xué)領(lǐng)域的研究,將電磁輻射源行為描述為“該電磁輻射源目標(biāo)在個(gè)體和群體層次上對(duì)外界的變化和內(nèi)在任務(wù)要求改變所做出的整體性反映”[51]。

    上述定義對(duì)雷達(dá)行為進(jìn)行了較為抽象和整體性的描述。本文結(jié)合心理學(xué)與行為科學(xué)相關(guān)知識(shí)以及其他工程領(lǐng)域類似研究對(duì)行為定義和分類[52-54],首先依據(jù)雷達(dá)系統(tǒng)行為活動(dòng)的內(nèi)容與目的,將雷達(dá)行為劃分為推理行為、決策行為和動(dòng)作行為三類。推理行為指雷達(dá)基于對(duì)外界環(huán)境5環(huán)境為廣義的環(huán)境,包含如目標(biāo)、干擾方、偵察方等所有可能和雷達(dá)發(fā)生交互的元素。的量測(cè)信息,對(duì)外界環(huán)境的狀態(tài)做出識(shí)別/估計(jì)、推斷與預(yù)測(cè)的行為。決策行為指雷達(dá)基于對(duì)外界環(huán)境的量測(cè)信息或推理信息,對(duì)雷達(dá)外界環(huán)境未來(lái)狀態(tài)的控制、優(yōu)化方案與策略做出決定的行為。動(dòng)作行為指雷達(dá)基于對(duì)外界環(huán)境的決策信息,對(duì)雷達(dá)外界環(huán)境未來(lái)狀態(tài)的控制、優(yōu)化方案與策略進(jìn)行執(zhí)行的行為。然后進(jìn)一步從雷達(dá)方視角和偵察方視角對(duì)上述三種雷達(dá)行為進(jìn)行分類,如表2所示。

    表2 不同視角對(duì)雷達(dá)行為的分類Tab.2 Categorization of radar behavior from different perspectives

    上述三種角度分類的關(guān)系如圖2所示。其中在雷達(dá)方視角,管理行為從行為內(nèi)容與目的這個(gè)角度,可進(jìn)一步細(xì)化為動(dòng)作行為和決策行為。評(píng)估行為則對(duì)應(yīng)推理行為和決策行為。從偵察方視角,動(dòng)作行為實(shí)際上是雷達(dá)的外顯行為,而決策行為和推理行為則是動(dòng)作行為背后的內(nèi)隱行為6這些劃分和分類,一定程度上基于作者自身的觀點(diǎn)和偏好設(shè)計(jì)得到,不可避免地存在需要進(jìn)一步完善和改進(jìn)的地方,讀者可以根據(jù)實(shí)際需求進(jìn)行調(diào)整與修改。。

    圖2 不同角度行為分類之間的關(guān)系Fig.2 The relationship of behavioral categorization from different perspectives

    2.2 雷達(dá)方視角的雷達(dá)行為及內(nèi)涵

    對(duì)多功能雷達(dá)而言,其行為和資源管理模塊息息相關(guān)。MFR 是“設(shè)備”和“管理”的綜合體。其中“設(shè)備”指雷達(dá)的物理硬件實(shí)體,而“管理”則指嵌入雷達(dá)系統(tǒng)的計(jì)算機(jī)系統(tǒng)及實(shí)現(xiàn)雷達(dá)資源管理和各種功能操作的算法軟件。雷達(dá)設(shè)備提供了雷達(dá)運(yùn)行各種任務(wù)、實(shí)現(xiàn)多種功能的基礎(chǔ),而雷達(dá)資源管理則是任務(wù)有效運(yùn)行、提升雷達(dá)性能的關(guān)鍵保證[55]。

    多功能雷達(dá)的資源管理是層次化的[8,12,20,55-56]。為了方便信息在層內(nèi)和層間傳遞,雷達(dá)研究者又基于信息融合領(lǐng)域研究[57]的理論基礎(chǔ),在模塊內(nèi)構(gòu)建高速有效的信息融合機(jī)制,實(shí)現(xiàn)了如圖3 所示的雷達(dá)資源管理架構(gòu)[4,29-30,58-59]。該架構(gòu)由管理分支和評(píng)估分支組成。評(píng)估分支表示了雷達(dá)信號(hào)處理的內(nèi)容,而管理分支則表示了對(duì)雷達(dá)的控制內(nèi)容。

    圖3 先進(jìn)多功能雷達(dá)資源管理層次化結(jié)構(gòu)示意圖Fig.3 Schematic diagram of hierarchical structure for advanced MFR resource management

    因此雷達(dá)方視角,多功能雷達(dá)的行為包括對(duì)應(yīng)雷達(dá)管理分支各個(gè)層次活動(dòng)的管理行為和對(duì)應(yīng)評(píng)估分支各個(gè)層次活動(dòng)的評(píng)估行為。管理行為包括如信號(hào)發(fā)射、信號(hào)調(diào)制、波束調(diào)度等活動(dòng)。評(píng)估行為包括如雷達(dá)內(nèi)部的匹配濾波、檢測(cè)測(cè)量、跟蹤識(shí)別等活動(dòng)。

    2.2.1 評(píng)估行為

    在雷達(dá)領(lǐng)域經(jīng)過幾十年的研究對(duì)評(píng)估分支行為各層的各個(gè)內(nèi)容已經(jīng)建立了許多處理方法,如1)信號(hào)層中的空時(shí)自適應(yīng)處理技術(shù)(Spatial Time Adaptive Processing,STAP)[60];2)在測(cè)量層,通過學(xué)習(xí)雜波環(huán)境特征來(lái)輔助復(fù)雜環(huán)境下的目標(biāo)檢測(cè)[61];3)在任務(wù)層,雷達(dá)利用多假設(shè)跟蹤算法(Multiple Hypothesis Tracking,MHT)[62]來(lái)解釋測(cè)量數(shù)據(jù),以及利用交互式多模型(Interacting Multiple Model,IMM)[63]濾波算法估計(jì)復(fù)雜運(yùn)動(dòng)目標(biāo)的運(yùn)動(dòng)狀態(tài)。管理分支的決策取決于評(píng)估分支所提供的信息,相較于評(píng)估分支,雷達(dá)領(lǐng)域?qū)芾矸种У难芯肯鄬?duì)滯后。

    2.2.2 管理行為

    管理行為主要包含任務(wù)管理、場(chǎng)景管理、目標(biāo)管理、測(cè)量管理和信號(hào)管理5 個(gè)部分。任務(wù)管理以雷達(dá)戰(zhàn)略需求為目的規(guī)劃制定雷達(dá)的觀測(cè)任務(wù)計(jì)劃。場(chǎng)景管理負(fù)責(zé)為每個(gè)雷達(dá)任務(wù)依據(jù)任務(wù)的需求設(shè)置對(duì)應(yīng)的優(yōu)先級(jí)、任務(wù)質(zhì)量效能評(píng)價(jià)等。不同的觀測(cè)任務(wù)都需要一整套相應(yīng)的搜索、跟蹤策略以及對(duì)應(yīng)的雷達(dá)控制參數(shù)。目標(biāo)管理根據(jù)觀測(cè)目標(biāo)特性預(yù)先設(shè)計(jì)或優(yōu)化觀測(cè)任務(wù)對(duì)應(yīng)的搜索、跟蹤策略及控制參數(shù),封裝成相對(duì)固定的工作模式方便調(diào)用。在任務(wù)管理、場(chǎng)景管理和目標(biāo)管理的基礎(chǔ)上,每個(gè)目標(biāo)的觀測(cè)任務(wù)最終可以分解為獨(dú)立的、離散的、具有時(shí)效性約束的雷達(dá)波束探測(cè)事件(Radar Job),每個(gè)事件7對(duì)不同智能程度的雷達(dá),事件代表的雷達(dá)操作尺度不同。例如“水星”MFR中事件對(duì)應(yīng)雷達(dá)命令,該命令對(duì)應(yīng)了四個(gè)雷達(dá)字,每個(gè)雷達(dá)字對(duì)應(yīng)了一次具體的波束探測(cè)。若雷達(dá)實(shí)時(shí)處理能力更強(qiáng),則可以以雷達(dá)字作為事件進(jìn)行調(diào)度,以取得更大的自由度和性能潛力提升。對(duì)應(yīng)了雷達(dá)天線的一次或多次使用。測(cè)量管理需要從許多事件請(qǐng)求(Job Request)中規(guī)劃事件執(zhí)行的時(shí)間線。最后的信號(hào)管理對(duì)應(yīng)發(fā)射機(jī)端,執(zhí)行每個(gè)具體的事件及對(duì)應(yīng)的事件控制參數(shù)。雷達(dá)需要設(shè)計(jì)或優(yōu)化事件對(duì)應(yīng)的發(fā)射控制參數(shù)、接收控制參數(shù)等控制內(nèi)容??刂茀?shù)的種類越多、取值空間越廣,雷達(dá)的自由度和性能潛力也越大。

    在管理分支,自上而下是雷達(dá)任務(wù)層層分解的過程,上層是下層的框架和要求,下層是上層的分解和細(xì)化,通過任務(wù)層層細(xì)化分解,最終具化為雷達(dá)可執(zhí)行信號(hào)發(fā)射的方案。通過層次化結(jié)構(gòu)設(shè)計(jì),能夠?qū)㈨攲永走_(dá)操作器規(guī)劃的雷達(dá)任務(wù)等與底層可執(zhí)行雷達(dá)脈沖發(fā)射的天線單元關(guān)聯(lián)起來(lái),實(shí)現(xiàn)多時(shí)間尺度上的資源管理。在評(píng)估分支,自下而上是對(duì)雷達(dá)接收信號(hào)的層層處理,逐級(jí)提取對(duì)目標(biāo)和環(huán)境的態(tài)勢(shì)感知信息。最后通過環(huán)境和操作器,實(shí)現(xiàn)多功能雷達(dá)發(fā)射-接收-處理的閉環(huán)架構(gòu)。

    2.3 偵察方視角的雷達(dá)行為及內(nèi)涵

    對(duì)偵察方而言,雷達(dá)行為分為外顯和內(nèi)隱行為。對(duì)不同內(nèi)容和目的的行為,偵察方進(jìn)行行為識(shí)別分析研究所要完成的任務(wù)也不相同。對(duì)外顯行為,偵察方需要識(shí)別獲取行為的信息,如發(fā)射信號(hào)的類型、調(diào)制參數(shù)、所屬雷達(dá)工作狀態(tài)等。通過外顯行為的識(shí)別結(jié)果,偵察方可推理內(nèi)隱行為。對(duì)內(nèi)隱行為中的決策行為,推理其決策過程的準(zhǔn)則。例如雷達(dá)波形優(yōu)化過程的目標(biāo)函數(shù)與約束條件,雷達(dá)選擇所使用的跟蹤濾波模型的準(zhǔn)則等。對(duì)內(nèi)隱行為中的推理行為,偵察方需要逆向推理雷達(dá)方推理的結(jié)果和性能。例如希望獲知對(duì)手目標(biāo)跟蹤的結(jié)果、跟蹤精度、目標(biāo)識(shí)別的結(jié)果和識(shí)別準(zhǔn)確率。

    2.3.1 外顯行為

    雷達(dá)的外顯行為和雷達(dá)的發(fā)射信號(hào)相關(guān)。偵察方可以通過分析偵收到的底層雷達(dá)信號(hào)逐級(jí)向上推知各個(gè)層次的外顯行為。

    對(duì)偵察方而言,先進(jìn)體制雷達(dá)調(diào)度的事件序列,可以按時(shí)分復(fù)用的形式劃分為圖4所示單幀時(shí)間和多幀時(shí)間兩個(gè)維度。單幀時(shí)間反映了多功能雷達(dá)同時(shí)(對(duì)多個(gè)目標(biāo))執(zhí)行多個(gè)事件的過程;多幀時(shí)間則反映了對(duì)同一個(gè)目標(biāo)雷達(dá)的事件序列執(zhí)行過程。

    圖4 多功能雷達(dá)發(fā)射信號(hào)與分布式觀測(cè)Fig.4 The transmitting signals of MFRS and distributed observation

    在單幀時(shí)間維度,不同觀測(cè)平臺(tái)觀測(cè)到雷達(dá)在一個(gè)處理幀中對(duì)各個(gè)觀測(cè)平臺(tái)的事件脈沖序列。通過對(duì)觀測(cè)平臺(tái)之間的協(xié)同可以恢復(fù)出雷達(dá)在單幀時(shí)間尺度的事件調(diào)度序列。多個(gè)觀測(cè)平臺(tái)可能被同一個(gè)波束照射,或者觀測(cè)平臺(tái)被雷達(dá)對(duì)其他觀測(cè)平臺(tái)波束的旁瓣所照射。即使是多平臺(tái)觀測(cè),也可能存在指向所有觀測(cè)平臺(tái)之外位置的搜索波束,即可能存在未被觀測(cè)到的雷達(dá)波束。在多幀時(shí)間維度,單個(gè)觀測(cè)平臺(tái)會(huì)偵收到來(lái)自雷達(dá)的,針對(duì)該目標(biāo)的連續(xù)多個(gè)雷達(dá)事件序列,如搜索-跟蹤-識(shí)別等事件序列。多觀測(cè)平臺(tái)在兩個(gè)維度的事件觀測(cè)示意圖如圖5所示。上述單幀時(shí)間和多幀時(shí)間的劃分主要是依據(jù)雷達(dá)的多目標(biāo)處理能力,隨著雷達(dá)資源管理能力的提升,單幀時(shí)間和多幀時(shí)間的劃分將會(huì)更加靈活[8]。

    圖5 多觀測(cè)平臺(tái)單幀時(shí)間和多幀時(shí)間事件觀測(cè)Fig.5 Observations of fast and slow time radar job on multiple observation platforms

    2.3.2 內(nèi)隱行為

    雷達(dá)的內(nèi)隱行為無(wú)法直接體現(xiàn)在偵察方可感知到的信號(hào)上。但隨著對(duì)抗雙方智能程度的不斷提升,通過研究可感知到的雷達(dá)外顯行為和環(huán)境信息,逆向分析推理雷達(dá)系統(tǒng)內(nèi)隱行為的研究也開始受到電子偵察領(lǐng)域?qū)W者的關(guān)注。電子信息控制重點(diǎn)實(shí)驗(yàn)室的石榮等人在文獻(xiàn)[51,64-65]中指出對(duì)輻射源內(nèi)部控制機(jī)制與控制參數(shù)進(jìn)行推理的作用和重要性,并給出了基于主動(dòng)有源電子對(duì)抗實(shí)現(xiàn)對(duì)輻射源內(nèi)部控制參數(shù)估計(jì)的基本設(shè)想。對(duì)內(nèi)隱行為推理系統(tǒng)性的研究工作則由美國(guó)康奈爾大學(xué)教授Vikram Krishnamurthy 率先開展。例如在文獻(xiàn)[66]中,針對(duì)雷達(dá)評(píng)估分支的濾波行為,設(shè)計(jì)逆濾波方法,實(shí)現(xiàn)對(duì)非合作雷達(dá)系統(tǒng)目標(biāo)跟蹤環(huán)節(jié)濾波精度的估計(jì);針對(duì)雷達(dá)方管理分支控制發(fā)射信號(hào)生成的波形優(yōu)化決策行為,設(shè)計(jì)逆強(qiáng)化學(xué)習(xí)算法,估計(jì)該決策行為的優(yōu)化目標(biāo)函數(shù)及約束。

    對(duì)內(nèi)隱行為推理的研究概念新穎,將使得電子偵察一方由識(shí)別雷達(dá)當(dāng)前采取的外顯行為“是什么”,進(jìn)一步由果溯因深入為獲知雷達(dá)“為什么”會(huì)采取這些外顯行為,以及環(huán)境和偵察方動(dòng)作演變對(duì)雷達(dá)方行為過程的影響,可為后續(xù)針對(duì)先進(jìn)體制雷達(dá)系統(tǒng)的精準(zhǔn)干擾與行為控制提供強(qiáng)有力支撐,需要引起國(guó)內(nèi)研究者的重視。

    3 多功能雷達(dá)行為的偵察分析模型

    3.1 偵察分析模型的概念與分類

    多功能雷達(dá)偵察分析模型是以多功能雷達(dá)本體為對(duì)象,直接從多功能雷達(dá)本體的行為出發(fā),以偵察方可觀測(cè)外顯行為為輸入,融合對(duì)雷達(dá)行為有影響因素的所有可得信息,以獲取行為主體多功能雷達(dá)相關(guān)行為的屬性、產(chǎn)生機(jī)理、作用過程、行為結(jié)果及后續(xù)行為利用和對(duì)抗方式等為目的而構(gòu)建的雷達(dá)行為模型?!皬亩喙δ芾走_(dá)本體的行為出發(fā)”是模型構(gòu)建的思路。因?yàn)閭刹旆娇捎^測(cè)的外顯行為直接原因是多功能雷達(dá)的管理行為,根源原因是多功能雷達(dá)的評(píng)估行為,管理行為和評(píng)估行為均來(lái)自多功能雷達(dá)本體,只有從本體出發(fā)才可從邏輯上導(dǎo)出可觀測(cè)外顯行為產(chǎn)生的一般機(jī)理和分析方法8我們認(rèn)為對(duì)非合作雷達(dá)行為的分析識(shí)別,應(yīng)該包含兩大類模型:雷達(dá)方真實(shí)行為模型和偵察方偵察分析模型。其中雷達(dá)方的真實(shí)行為模型對(duì)偵察方而言未知。偵察方的偵察分析模型源于多功能雷達(dá)真實(shí)行為模型,是在通盤利用偵察方所有可得信息的基礎(chǔ)上從偵察方視角構(gòu)建的模型。偵察分析模型可繼續(xù)細(xì)分為兩類模型:偵察方想定的雷達(dá)行為模型和用于行為分析的偵察過程模型。其中想定的雷達(dá)行為模型是對(duì)雷達(dá)方的真實(shí)行為模型的一種盡可能的近似,用于行為分析的偵察過程模型則是在想定模型的基礎(chǔ)上,構(gòu)建的逆向分析識(shí)別模型。本文為了保持聚焦,不至于過于發(fā)散,僅對(duì)偵察分析模型構(gòu)建的基本邏輯進(jìn)行介紹。。

    根據(jù)上述思路,多功能雷達(dá)行為的偵察分析模型應(yīng)該包括但不限于以下5個(gè)基本要素:評(píng)估行為、管理行為、動(dòng)態(tài)環(huán)境、外顯行為模型、內(nèi)隱行為模型。偵察分析模型構(gòu)建的基本邏輯如圖6 所示:雷達(dá)方基于評(píng)估行為和管理行為,向環(huán)境輸出雷達(dá)動(dòng)作,偵察方根據(jù)對(duì)外界環(huán)境的量測(cè)信息,對(duì)外顯行為進(jìn)行識(shí)別,然后對(duì)內(nèi)隱行為進(jìn)行推理。最后偵察方可能會(huì)基于行為分析結(jié)果對(duì)環(huán)境輸出自身的動(dòng)作,影響環(huán)境變化,進(jìn)一步刺激雷達(dá)方的評(píng)估行為,進(jìn)入新一輪雷達(dá)行為實(shí)現(xiàn)與分析過程。

    圖6 多功能雷達(dá)行為偵察分析模型構(gòu)建的基本邏輯Fig.6 The basic logic of constructing a MFR behavior reconnaissance analysis model

    在圖6 中,四種行為均為客觀存在的行為。評(píng)估行為和管理行為為雷達(dá)本體真實(shí)行為,偵察方無(wú)法感知。雖然外顯行為、內(nèi)隱行為和管理行為、評(píng)估行為能夠通過動(dòng)態(tài)環(huán)境直接關(guān)聯(lián),但偵察方不一定知道之間確切的關(guān)聯(lián)關(guān)系。因此,外顯行為模型和內(nèi)隱行為模型是偵察方視角,基于動(dòng)態(tài)環(huán)境作用后的雷達(dá)方動(dòng)作,及其他可用信息,對(duì)外顯行為和內(nèi)隱行為構(gòu)建的想定模型,是對(duì)真實(shí)外顯行為和內(nèi)隱行為的模型近似。如在文獻(xiàn)[67]中,雷達(dá)方在任務(wù)層采取Logit 模型進(jìn)行任務(wù)決策,決定是否進(jìn)行雷達(dá)任務(wù)的切換。此時(shí)任務(wù)層的外顯行為為雷達(dá)執(zhí)行的任務(wù)序列,決定該任務(wù)序列的Logit 模型對(duì)偵察方未知。因此偵察方采取馬爾可夫鏈模型對(duì)外顯行為進(jìn)行數(shù)學(xué)模型表征。偵察方構(gòu)建的模型顯然永遠(yuǎn)不會(huì)和非合作雷達(dá)目標(biāo)的真實(shí)模型匹配上,但是總是可以在不同的應(yīng)用場(chǎng)景下構(gòu)建合適的數(shù)學(xué)模型以逼近雷達(dá)的真實(shí)行為模型。這也反映出構(gòu)建好的偵察分析模型對(duì)于非合作MFR 進(jìn)行行為識(shí)別具有復(fù)雜性、重要性和必要性。

    考慮到動(dòng)態(tài)環(huán)境是客觀存在的,但偵察方視角和雷達(dá)方視角各自認(rèn)為的動(dòng)態(tài)環(huán)境是不同的,這涉及到雙方的博弈設(shè)計(jì),如智能水平、想定推理深度等,不在本文涉及。偵察方進(jìn)行偵察分析時(shí),是基于外顯行為模型和內(nèi)隱行為模型對(duì)雷達(dá)行為進(jìn)行識(shí)別、推理與預(yù)測(cè),因此下面分別介紹這兩個(gè)模型的研究情況。

    3.2 雷達(dá)外顯行為的層次化建模

    雷達(dá)外顯行為,從行為內(nèi)容和目的來(lái)說,是雷達(dá)基于對(duì)外界環(huán)境的決策信息,對(duì)雷達(dá)外界環(huán)境未來(lái)狀態(tài)的控制、優(yōu)化方案與策略進(jìn)行執(zhí)行的動(dòng)作行為。例如執(zhí)行雷達(dá)調(diào)度的事件、采取的工作模式、對(duì)優(yōu)化波形結(jié)果的發(fā)射等。

    以文獻(xiàn)[67]中的例子說明單觀測(cè)平臺(tái)的雷達(dá)外顯行為模型,此時(shí)的模型如圖7 所示。雷達(dá)對(duì)特定的跟蹤目標(biāo)執(zhí)行辨識(shí)任務(wù),辨識(shí)任務(wù)對(duì)應(yīng)一組可調(diào)度的雷達(dá)命令(雷達(dá)命令即該雷達(dá)可調(diào)度的雷達(dá)事件),包括如警告、非自適應(yīng)跟蹤、距離分辨等。其中每個(gè)雷達(dá)命令又由不同的雷達(dá)字序列構(gòu)成。最終雷達(dá)通過將每個(gè)雷達(dá)字映射成對(duì)應(yīng)的雷達(dá)脈沖,通過天線發(fā)射??梢钥闯隼走_(dá)外顯行為具有功能多層次、序列多狀態(tài)以及信號(hào)多維度的特點(diǎn)。功能多層次指系統(tǒng)行為的層次化實(shí)現(xiàn)。序列多狀態(tài)指雷達(dá)在雷達(dá)時(shí)間線上對(duì)目標(biāo)調(diào)度多個(gè)工作狀態(tài)(本文將雷達(dá)字稱為雷達(dá)狀態(tài))。信號(hào)多維度則指雷達(dá)發(fā)射的脈沖是由多維狀態(tài)參數(shù)表征。

    圖7 外顯行為模型Fig.7 Explicit behavior model

    3.2.1 建模表征方法

    已有典型對(duì)多功能雷達(dá)外顯行為建模的層次化模型如圖8所示[50,68-69]。根據(jù)層次化模型各個(gè)層次的抽象程度和在雷達(dá)資源管理模塊管理分支所起的功能,可以將層次劃分為符號(hào)層和符號(hào)-脈沖層兩大類。

    圖8 已有MFR的外顯行為層次化模型Fig.8 Existing hierarchical model for explicit behavior of MFRs

    符號(hào)層的含義指雷達(dá)在這些層次外顯行為的基本元素是符號(hào),即在符號(hào)層中雷達(dá)通過符號(hào)間的映射表征管理分支各層的外顯行為。符號(hào)-脈沖層則起到將雷達(dá)管理器規(guī)劃調(diào)度的符號(hào)轉(zhuǎn)換成雷達(dá)可執(zhí)行發(fā)射的脈沖序列的功能,直接對(duì)應(yīng)了管理分支中的發(fā)射機(jī)執(zhí)行控制命令這一行為。因此,模型符號(hào)層中的符號(hào)和雷達(dá)方資源管理調(diào)度的事件存在直接映射。對(duì)不同的雷達(dá),符號(hào)-脈沖層具體執(zhí)行的控制信息具有多樣性。

    2005 年加拿大學(xué)者Visnevski Nikita 在其博士論文中[68],首次提出了著名的多功能雷達(dá)層次化模型(圖8中層次化模型1)。在該層次化模型結(jié)構(gòu)下,他使用喬姆斯基所提出的形式語(yǔ)言和語(yǔ)法[70-72](即句法模型)來(lái)建模多功能雷達(dá)復(fù)雜動(dòng)態(tài)的信號(hào)生成過程。他提出的方法能夠從數(shù)學(xué)模型的角度表征雷達(dá)層次化管理分支中自頂向下,從雷達(dá)任務(wù)到中間層雷達(dá)命令再到底層可直接執(zhí)行的雷達(dá)發(fā)射脈沖序列的雷達(dá)信號(hào)產(chǎn)生機(jī)理與過程。在層次化資源管理中,雷達(dá)自頂向下,將上層的任務(wù)符號(hào)序列、命令符號(hào)序列等逐層拆解成底層雷達(dá)可直接執(zhí)行發(fā)射任務(wù)的“雷達(dá)字”這一符號(hào)-脈沖層符號(hào),將高層抽象的任務(wù)信息轉(zhuǎn)換成雷達(dá)可執(zhí)行對(duì)應(yīng)雷達(dá)任務(wù)的具體控制參數(shù),最后通過動(dòng)作行為執(zhí)行具體的控制。

    具體的層次化模型1 的雷達(dá)任務(wù)層,他使用馬爾可夫鏈[67]表征由于多功能雷達(dá)和目標(biāo)之間交互導(dǎo)致的雷達(dá)任務(wù)切換過程。在雷達(dá)命令、雷達(dá)字等下層,他使用隨機(jī)上下文無(wú)關(guān)文法(Stochastic Context-Free Grammars,SCFG)表征下層各層內(nèi)和層間元素之間的概率性切換。相較于傳統(tǒng)基于狀態(tài)空間模型,如基于隱馬爾可夫模型(Hidden Markov Model,HMM)[73]的表征方法,SCFG 能更好地描述多功能雷達(dá)外顯行為中的事件規(guī)劃和插入等操作,相較于HMM 具有更低的熵,更適合表征多功能雷達(dá)的外顯行為。圖9描述了上述馬爾可夫調(diào)制的SCFG 模型表征MFR 外顯行為時(shí),層次化模型層內(nèi)與層間的符號(hào)轉(zhuǎn)移關(guān)系[67]。他們所提出的多功能雷達(dá)層次化模型,以及使用句法模型對(duì)多功能雷達(dá)外顯行為進(jìn)行數(shù)學(xué)建模分析的思路,給多功能雷達(dá)系統(tǒng)行為分析奠定了基礎(chǔ)。后續(xù)國(guó)內(nèi)外大量的研究以他們所提出的層次化模型,以及典型的“水星”多功能雷達(dá)為對(duì)象開展研究。

    圖9 MFR的層次化模型Fig.9 The hierarchical model of a MFR

    在他們的層次化模型中[68],所使用的“水星”雷達(dá)型號(hào)設(shè)計(jì)生產(chǎn)比較早,對(duì)應(yīng)的雷達(dá)字較為簡(jiǎn)單。如圖10 所示,每個(gè)雷達(dá)字由兩串脈沖組成,第一串是固定脈沖重復(fù)間隔(Pulse Repetition Interval,PRI)的脈沖-多普勒脈沖(圖10 中B 段,字與字的PRI 不同),第二串為固定PRI 的同步脈沖(圖10 中D段,所有字的同步脈沖PRI相同)。

    圖10 “水星”多功能雷達(dá)的雷達(dá)字結(jié)構(gòu)Fig.10 The radar word structure of the “Mercury” MFR

    3.2.2 符號(hào)層行為表征

    符號(hào)層行為相較于符號(hào)-脈沖層行為,從形式上說要更簡(jiǎn)單,因?yàn)榉?hào)層所對(duì)應(yīng)的雷達(dá)操作要更抽象,因而對(duì)應(yīng)的符號(hào)集合基數(shù)也相對(duì)要小。高層次符號(hào)層符號(hào)為有限個(gè)低一層次符號(hào)層符號(hào)的有序排列。符號(hào)層行為的建模表征方法需要具備表征層內(nèi)元素之間和層間元素之間轉(zhuǎn)換關(guān)系與規(guī)律的能力。已有研究對(duì)真實(shí)雷達(dá)符號(hào)層實(shí)現(xiàn)模型進(jìn)行建模表征的常用方法分類如表3所示。但這些典型文獻(xiàn)是從雷達(dá)方視角進(jìn)行建模,是為雷達(dá)決策服務(wù)的模型方法研究。

    表3 符號(hào)層表征模型分類Tab.3 Categorization of symbol layer representation models

    基于實(shí)際工作過程目標(biāo)函數(shù)優(yōu)化的表征方法,實(shí)際上也是對(duì)決策行為的建模。雷達(dá)實(shí)際上是按照自身的資源管理過程進(jìn)行雷達(dá)控制與信號(hào)生成,而不是按照偵察方構(gòu)建的模型產(chǎn)生雷達(dá)信號(hào)。偵察方是通過如句法模型等數(shù)學(xué)模型對(duì)雷達(dá)方的外顯行為進(jìn)行描述,是對(duì)雷達(dá)真實(shí)資源管理過程的數(shù)學(xué)模型近似。不同的雷達(dá)資源管理過程對(duì)應(yīng)的數(shù)學(xué)模型也會(huì)存在區(qū)別[76]。

    3.2.3 符號(hào)-脈沖層狀態(tài)表征

    符號(hào)-脈沖層行為表征則更復(fù)雜。隨著多功能雷達(dá)的不斷發(fā)展,多功能雷達(dá)的信號(hào)形式日益復(fù)雜,如雷達(dá)廣泛使用捷變頻或者頻率步進(jìn)技術(shù)來(lái)抗干擾,或者使用參差PRI序列解距離模糊等等[22,24]。Visnevski Nikita 層次化模型中的雷達(dá)字不能適應(yīng)先進(jìn)體制雷達(dá)信號(hào)的建模表征。因此,國(guó)內(nèi)外的研究者以層次化模型為基礎(chǔ),圍繞符號(hào)-脈沖層的表征展開了一系列的研究改進(jìn)。其中典型的工作有,國(guó)防科技大學(xué)的歐健博士在其博士論文中,將雷達(dá)字替換成脈沖樣本圖,從而使得句法模型的應(yīng)用范圍從脈沖多普勒(Pulse Doppler,PD)多功能雷達(dá)擴(kuò)展到所有脈沖雷達(dá)[50]。脈沖樣本圖模型由羅景青等人構(gòu)建[77,78],基本思想源自抽樣理論。即只要恰當(dāng)?shù)倪x取合適數(shù)量的樣本,就可以以任意準(zhǔn)確度描述該數(shù)據(jù)集代表的總體。2019 年,德國(guó)夫瑯禾費(fèi)研究所的Sabine Apfeld等人將雷達(dá)字層次擴(kuò)充為雷達(dá)字母,雷達(dá)音節(jié)和雷達(dá)字三層,從而將原始雷達(dá)字表征粒度進(jìn)一步細(xì)化,同時(shí)將單PRI參數(shù)表征擴(kuò)充到多維參數(shù)表征[69]。

    文獻(xiàn)[68-69]研究中所考慮的“符號(hào)-脈沖層”對(duì)應(yīng)的脈間調(diào)制都比較簡(jiǎn)單。文獻(xiàn)[50]中的脈沖樣本圖對(duì)脈沖序列調(diào)制類型進(jìn)行了擴(kuò)展,能夠表征所有類型的雷達(dá)脈沖。但脈沖樣本圖本質(zhì)上仍然屬于構(gòu)造模板的表征方法。隨著先進(jìn)體制多功能雷達(dá)及新一代認(rèn)知多功能雷達(dá)的發(fā)展,雷達(dá)系統(tǒng)可以在符號(hào)-脈沖層上實(shí)現(xiàn)更豐富的調(diào)制類型,每種調(diào)制類型可以實(shí)現(xiàn)更靈活的參數(shù)控制。以對(duì)應(yīng)脈沖序列中的PRI參數(shù)為例,雷達(dá)除了可以實(shí)現(xiàn)不同的PRI脈間調(diào)制類型外,在相同的PRI調(diào)制類型工作狀態(tài)實(shí)現(xiàn)中,也可以存在調(diào)制參數(shù)不同的細(xì)粒度工作狀態(tài)實(shí)現(xiàn)。本團(tuán)隊(duì)在這些研究的基礎(chǔ)上[79-80],提出基于參數(shù)化概率模型表征符號(hào)-脈沖層元素,把符號(hào)-脈沖層元素對(duì)應(yīng)的脈沖序列表征為隨機(jī)變量序列。該隨機(jī)變量序列的特點(diǎn)可由K個(gè)參數(shù)上的調(diào)制類型與調(diào)制參數(shù)組合描述,(如圖11 所示)?;趨?shù)化概率模型的表征方法更通用并能和數(shù)學(xué)模型相結(jié)合。進(jìn)一步,本團(tuán)隊(duì)在文獻(xiàn)[81]中結(jié)合貝葉斯非參數(shù)理論,通過貝葉斯非參數(shù)HMM表征雷達(dá)脈沖序列,能夠適應(yīng)電磁環(huán)境存在的虛假和缺失脈沖非理想情況,并能夠?qū)崿F(xiàn)模型的自動(dòng)定階。

    圖11 MFR符號(hào)-脈沖層的參數(shù)化模型表征Fig.11 Parametric model representation of MFR Symbol to Pulse Layer

    3.3 雷達(dá)內(nèi)隱行為的層次化建模

    內(nèi)隱行為是外顯行為的成因。相較于外顯行為,對(duì)內(nèi)隱行為建模的研究較少。

    3.3.1 建模表征方法

    對(duì)內(nèi)隱行為的建模不是孤立的,需要從雷達(dá)發(fā)射-接收-處理的閉環(huán)架構(gòu)進(jìn)行考慮??紤]文獻(xiàn)[82]中對(duì)發(fā)射-接收-處理閉環(huán)架構(gòu)的模型,具備如下動(dòng)態(tài)特性:

    其中,k=1,2,···,N表示離散化時(shí)間,p(·)表示條件概率密度函數(shù)或條件概率質(zhì)量函數(shù),~表示服從的分布。其中:

    xk∈X 為環(huán)境狀態(tài),為狀態(tài)轉(zhuǎn)移核函數(shù),π0為初始狀態(tài)信念,X 為狀態(tài)空間。狀態(tài)空間包含所有與雷達(dá)任務(wù)有關(guān)的環(huán)境因素。例如在目標(biāo)跟蹤任務(wù)中,狀態(tài)空間可包括目標(biāo)的運(yùn)動(dòng)學(xué)信息。

    yk∈Y為雷達(dá)方對(duì)環(huán)境狀態(tài)的帶噪估計(jì),為觀測(cè)函數(shù),Y為觀測(cè)狀態(tài)空間;由于非合作原因,雷達(dá)方無(wú)法獲得環(huán)境狀態(tài)的真實(shí)值。

    由于真實(shí)的xk無(wú)法被觀測(cè),雷達(dá)根據(jù)yk獲得對(duì)xk的信念或后驗(yàn)(Belief 或Posterior)πk。令y1:k=(y1,y2,…,yk)為包括到當(dāng)前時(shí)刻k的所有可觀測(cè)變量歷史。

    at∈A為雷達(dá)動(dòng)作,Gπk,a為決策準(zhǔn)則,A為動(dòng)作空間包含了雷達(dá)所有可采取的動(dòng)作。例如在特定空域調(diào)度特定波形的波束進(jìn)行測(cè)量。∈為我方對(duì)雷達(dá)動(dòng)作的觀測(cè),為觀測(cè)函數(shù),觀測(cè)動(dòng)作空間。

    上述過程在單個(gè)時(shí)間步具有式(1)所示依賴關(guān)系。如第2.1 節(jié)所述,內(nèi)隱行為從行為內(nèi)容和目的上劃分,包括決策行為和推理行為。對(duì)內(nèi)隱行為不同的行為類型所構(gòu)建的模型類型也不同。目前主要是由美國(guó)康奈爾大學(xué)教授Vikram Krishnamurthy率先開展相關(guān)研究[82-84]。本文結(jié)合Vikram Krishnamurthy 的研究,從濾波和隨機(jī)優(yōu)化模型兩個(gè)方面描述建模表征的基本思想。其中濾波對(duì)應(yīng)了內(nèi)隱行為中的推理行為類型,隨機(jī)優(yōu)化模型則對(duì)應(yīng)了內(nèi)隱行為中的決策行為類型。

    3.3.2 推理行為中的濾波處理模型

    Vikram Krishnamurthy 在文獻(xiàn)[82,85]中分別給出了T(πk-1,yk)為HMM 濾波器和卡爾曼濾波器時(shí)的模型。經(jīng)典貝葉斯濾波器有:

    當(dāng)T(π,y)為HMM 濾波器時(shí),記狀態(tài)轉(zhuǎn)移矩陣分別為P和B:

    記B的列向量形式為:

    從而有:

    3.3.3 決策行為中的隨機(jī)優(yōu)化模型

    Vikram Krishnamurthy 在文獻(xiàn)[84]中給出了基于顯示偏好的雷達(dá)決策行為建模。但在顯示偏好框架下,一方面他們要求認(rèn)知雷達(dá)的優(yōu)化目標(biāo)函數(shù)為單調(diào)函數(shù);另一方面他們考慮雷達(dá)基于近視性的方式優(yōu)化其目標(biāo)函數(shù),未考慮對(duì)環(huán)境的預(yù)見性(Anticipation),難以適應(yīng)不同體制、型號(hào)、智能水平以及認(rèn)知推理深度等雷達(dá)多樣性帶來(lái)的復(fù)雜而廣泛的建模問題,因而偵察分析模型需要具有普適性和泛化能力,適應(yīng)各種未知且復(fù)雜的認(rèn)知雷達(dá)技術(shù)具體實(shí)現(xiàn)。

    文獻(xiàn)[25,76]定義了雷達(dá)基于服務(wù)質(zhì)量的資源分配模型(Quality of Service based Resource Allocation Model,Q-RAM)建模資源分配決策問題,該模型可以描述如下:

    記{τ1,τ2,…,τn}為雷達(dá)任務(wù)集合,雷達(dá)共有k種可分配且待分配的資源,對(duì)應(yīng)的資源總量分別為R1,R2,…,Rk。對(duì)每一個(gè)雷達(dá)任務(wù)τi,存在:

    離散控制空間Φi:即可行的任務(wù)配置離散空間;

    映射gi:Φi→Rk:該函數(shù)將任務(wù)配置映射為對(duì)應(yīng)的資源需求;

    任務(wù)質(zhì)量空間Qi和環(huán)境狀態(tài)空間Si;

    映射fi:Φi×Si→Qi:該映射將配置-環(huán)境對(duì)映射成對(duì)應(yīng)的任務(wù)質(zhì)量水平;

    上述Q-RAM 資源管理模型的求解實(shí)現(xiàn)流程如圖12 所示,分為構(gòu)建并評(píng)估控制參數(shù)配置、凸包運(yùn)算、全局優(yōu)化以及調(diào)度器調(diào)度四步。

    圖12 基于實(shí)時(shí)全局優(yōu)化的Q-RAM資源管理實(shí)現(xiàn)Fig.12 Implementation of Q-RAM resource management based on real-time global optimization

    首先構(gòu)建并評(píng)估控制參數(shù)配置,假定雷達(dá)存在k種待分配的資源R1,R2,…,Rk,復(fù)合資源函數(shù)h:Rk→R 將資源向量映射為描述資源需求的標(biāo)量。對(duì)每個(gè)任務(wù),雷達(dá)產(chǎn)生并評(píng)估所有可能的控制參數(shù)配置?。在評(píng)估中,雷達(dá)將任務(wù)配置嵌入到資源-效用空間。然后通過凸包運(yùn)算,確定在固定資源水平的情況下最大化效用函數(shù)的控制配置子集。這些控制配置子集被稱為事件列表。在資源充分的前提下,雷達(dá)使用全局優(yōu)化器迭代地將資源分配給具有最佳的效用-資源比率的事件。資源分配結(jié)束后,通過調(diào)度器對(duì)選定的雷達(dá)事件進(jìn)行調(diào)度。

    上述方法在實(shí)際雷達(dá)運(yùn)行時(shí)需要求解優(yōu)化問題,實(shí)時(shí)性得不到保證。為了解決實(shí)際部署時(shí)的算法實(shí)時(shí)性問題,一個(gè)研究趨勢(shì)是基于強(qiáng)化學(xué)習(xí)求解雷達(dá)資源管理問題[37,75,86-87]。強(qiáng)化學(xué)習(xí)通過智能體在環(huán)境中與環(huán)境不斷進(jìn)行交互,學(xué)習(xí)到使得累積回報(bào)值最大的動(dòng)作策略。從而在部署時(shí),訓(xùn)練好的智能體便可以以類似于查表法(或神經(jīng)網(wǎng)絡(luò)前向計(jì)算)的時(shí)間,給出當(dāng)前環(huán)境下Q 函數(shù)最大的雷達(dá)動(dòng)作(即控制參數(shù)優(yōu)化結(jié)果)。基于強(qiáng)化學(xué)習(xí)求解QRAM問題的實(shí)現(xiàn)過程如圖13所示[88]。

    圖13 基于強(qiáng)化學(xué)習(xí)的資源管理實(shí)現(xiàn)Fig.13 Implementation of resource management based on reinforcement learning

    3.4 雷達(dá)行為偵察過程建模

    圖14 展示了多功能雷達(dá)的信號(hào)生成過程與偵察方基于偵收脈沖序列進(jìn)行行為偵察的過程。其中識(shí)別對(duì)應(yīng)外顯行為,推理對(duì)應(yīng)內(nèi)隱行為。以文獻(xiàn)[67]中的例子說明,在圖14中雷達(dá)對(duì)特定跟蹤目標(biāo)執(zhí)行辨識(shí)任務(wù),辨識(shí)任務(wù)對(duì)應(yīng)一組可調(diào)度的雷達(dá)命令,則不同雷達(dá)命令為可調(diào)度的雷達(dá)事件,如警告,非自適應(yīng)跟蹤,距離分辨等雷達(dá)命令。其中每個(gè)雷達(dá)命令由不同的雷達(dá)字序列構(gòu)成。最終雷達(dá)通過將每個(gè)雷達(dá)字映射成對(duì)應(yīng)的雷達(dá)脈沖,通過天線發(fā)射。對(duì)偵察方而言,其直接偵收到雷達(dá)脈沖序列,需要基于底層脈沖序列逐層向上反向推理脈沖序列所對(duì)應(yīng)的雷達(dá)工作狀態(tài)、雷達(dá)行為等外顯行為。例如根據(jù)雷達(dá)字符號(hào)序列識(shí)別當(dāng)前的雷達(dá)命令,然后根據(jù)雷達(dá)命令序列預(yù)測(cè)未來(lái)時(shí)刻雷達(dá)可能采取的雷達(dá)命令等。

    圖14 信號(hào)生成過程與行為偵察過程Fig.14 Signal generation process and behavior reconnaissance process

    上述3.2-3.3 節(jié)的建模研究多是從偵察方視角構(gòu)建的想定模型,是對(duì)雷達(dá)方真實(shí)行為模型的近似,未考慮非合作偵察條件下由于視角差異、信息不對(duì)稱性等因素引入的新問題。例如在外顯行為建模方面,文獻(xiàn)[50,68-69]在構(gòu)建模型時(shí)往往假定雷達(dá)真實(shí)模型的結(jié)構(gòu)已知或結(jié)構(gòu)和參數(shù)均已知。即假定雷達(dá)資源管理模塊管理分支各個(gè)層次的動(dòng)作行為(即句法模型字母表)已知,或者字母表及字母表元素間的轉(zhuǎn)移規(guī)則(語(yǔ)法)已知,偵察識(shí)別方只需要從偵收脈沖序列逐級(jí)提取,識(shí)別各個(gè)層次對(duì)應(yīng)的元素就實(shí)現(xiàn)了對(duì)各個(gè)層次外顯行為的識(shí)別。在文獻(xiàn)[68]的模型中,偵察方可通過脈沖序列提取雷達(dá)字,然后每四個(gè)雷達(dá)字可以映射成一個(gè)高層雷達(dá)命令,對(duì)應(yīng)了命令層中的一個(gè)雷達(dá)命令符號(hào),而多個(gè)固定排列的雷達(dá)命令對(duì)應(yīng)了一個(gè)特定的雷達(dá)任務(wù)。在實(shí)際戰(zhàn)場(chǎng)環(huán)境中,偵察方很難獲取雷達(dá)脈沖與脈沖-符號(hào)層中的各個(gè)元素以及這些元素間的轉(zhuǎn)移規(guī)則。從而也就無(wú)法依據(jù)他們的層次化模型逐層完成對(duì)各個(gè)層次雷達(dá)符號(hào)的準(zhǔn)確提取。就算能夠通過長(zhǎng)時(shí)間積累對(duì)非合作雷達(dá)信號(hào)進(jìn)行分析處理,因?yàn)閭刹旆脚c雷達(dá)方視角的不同,往往也無(wú)法完美構(gòu)建各個(gè)層的元素。

    再如對(duì)圖10 所示的雷達(dá)字,從偵察方的視角,若有雷達(dá)字先驗(yàn)信息,則直接可以將對(duì)應(yīng)的脈沖序列轉(zhuǎn)換成對(duì)應(yīng)的雷達(dá)字符號(hào)。若無(wú)雷達(dá)字先驗(yàn)信息,那么在進(jìn)行分析處理時(shí),無(wú)論是通過專家分析還是無(wú)監(jiān)督算法提取[89],很可能首先將B 和D 劃分成兩個(gè)不同的“雷達(dá)字”,然后通過大量積累的數(shù)據(jù)分析,可能進(jìn)一步將BD 這兩段合并歸納成一個(gè)“雷達(dá)字”。再考慮如圖15 所示PRI序列。對(duì)雷達(dá)方而言,其“符號(hào)-脈沖層”最小元素可能就是重復(fù)多個(gè)周期的組變脈沖,對(duì)偵察方而言,在無(wú)直接先驗(yàn)信息的情況下,將組變脈沖的一個(gè)周期或者一個(gè)周期中每個(gè)PRI 取值對(duì)應(yīng)的脈沖序列當(dāng)作一個(gè)單獨(dú)的“符號(hào)-脈沖層”元素也是合理的。因此需要構(gòu)建更通用的表征模型以支撐非合作偵察情況下對(duì)雷達(dá)行為的建模,以支撐后續(xù)的識(shí)別處理。

    圖15 符號(hào)-脈沖層的多尺度示例Fig.15 Multiscale example of symbol to pulse layer

    本團(tuán)隊(duì)在文獻(xiàn)[80]中考慮非合作視角差異,提出了符號(hào)-脈沖層序列觀測(cè)的多尺度建模方法,并針對(duì)典型脈間調(diào)制類型給出了表4所示無(wú)先驗(yàn)信息情況下的不同尺度脈沖序列層級(jí)劃分示例。

    表4 不同尺度脈沖序列層級(jí)劃分示例Tab.4 Example of hierarchical division of pulse sequences at different scales

    對(duì)于任意雷達(dá)脈沖序列,總是可以按一定尺度標(biāo)準(zhǔn)將其劃分成多個(gè)脈沖片段,這是符號(hào)-脈沖層對(duì)符號(hào)“盲”提取的基礎(chǔ)。在按尺度劃分之后,需要給劃分之后的片段和片段內(nèi)脈沖進(jìn)行符號(hào)分配,以便進(jìn)行后續(xù)符號(hào)層的處理。不失一般性,本團(tuán)隊(duì)在文獻(xiàn)[80]中,將按照一定劃分標(biāo)準(zhǔn)得到的單個(gè)符號(hào)類別對(duì)應(yīng)的雷達(dá)脈沖序列片段為雷達(dá)行為的最小可分辨單元,對(duì)應(yīng)的符號(hào)類別稱為工作狀態(tài)類別。在有先驗(yàn)信息時(shí),最小可分辨單元直接基于先驗(yàn)信息定義,例如不同的雷達(dá)字即為不同的最小可分辨單元。在無(wú)任何先驗(yàn)信息時(shí),最小可分辨單元對(duì)應(yīng)一組有序脈沖。本文定義最小可分辨單元為一組多維脈沖參數(shù)上具有特定調(diào)制類型和調(diào)制參數(shù)組合的脈沖序列。

    4 多功能雷達(dá)外顯行為的識(shí)別

    4.1 行為識(shí)別的研究路線分類

    在多功能雷達(dá)的層次化結(jié)構(gòu)與句法模型表征的基礎(chǔ)上,國(guó)內(nèi)外有許多學(xué)者開展了雷達(dá)外顯行為識(shí)別的研究[47,50,67,89-106]。外顯行為識(shí)別的目的是基于輸入脈沖,逐級(jí)向上推知雷達(dá)管理分支各個(gè)層次的外顯行為。已有的外顯行為識(shí)別研究工作可以根據(jù)實(shí)現(xiàn)外顯行為識(shí)別的不同輸入輸出形式,劃分為表5中4類。

    表5 已有MFR行為識(shí)別研究的分類Tab.5 Categorization of existing MFR behavior recognition studies

    已有雷達(dá)行為感知識(shí)別研究中的“行為”多對(duì)應(yīng)符號(hào)層行為,為了描述簡(jiǎn)便,在后面的描述中,除非特別指出,本文將符號(hào)層行為統(tǒng)稱為雷達(dá)行為。而對(duì)符號(hào)-脈沖層,其基本元素符號(hào)在不同的文獻(xiàn)中有不同的含義,如雷達(dá)字、工作狀態(tài)、或更細(xì)化的分層描述等,本文不做表述上的區(qū)分,統(tǒng)一稱為工作狀態(tài)。下面分別進(jìn)行介紹。

    4.2 序列預(yù)處理

    序列預(yù)處理對(duì)存在缺失、虛假等非理想情況的脈沖序列或符號(hào)序列進(jìn)行重建,去除非理想情況,以提升后續(xù)識(shí)別處理性能??紤]雷達(dá)脈沖或符號(hào)序列數(shù)據(jù)A={a1,a2,…,aT|ai∈RD},D為A對(duì)應(yīng)的特征維度,T為時(shí)間序列的長(zhǎng)度。A中的一部分?jǐn)?shù)據(jù)Arc存在缺失或錯(cuò)誤,另一部分可用上下文數(shù)據(jù)為Aob。預(yù)處理任務(wù)的目的是學(xué)習(xí)條件概率分布p(Arc|Aob)。本文所考慮的預(yù)處理包含了:1)對(duì)序列中缺失數(shù)據(jù)的填補(bǔ);2)對(duì)序列中的離群值、錯(cuò)誤值等進(jìn)行刪除或修正。

    上述兩個(gè)預(yù)處理任務(wù)的含義可分別在雷達(dá)行為的符號(hào)-脈沖層和符號(hào)層映射。在符號(hào)-脈沖層,偵收脈沖序列存在由于偵察設(shè)備帶來(lái)的檢測(cè)信號(hào)缺失、雷達(dá)波束調(diào)度等原因造成的稀疏觀測(cè)情況;由于信號(hào)發(fā)射-傳播-接收過程帶來(lái)的噪聲與虛假干擾等非理想情況。在符號(hào)層,符號(hào)序列存在由于前級(jí)符號(hào)提取算法造成的符號(hào)缺失、符號(hào)錯(cuò)誤以及符號(hào)額外插入等情況。因而,無(wú)論是對(duì)符號(hào)-脈沖層還是符號(hào)層,都需要先對(duì)序列進(jìn)行預(yù)處理,盡可能降低上述非理想性對(duì)行為序列的影響。從電子偵察的視角重建雷達(dá)行為序列的時(shí)序模型,對(duì)精確掌握雷達(dá)情報(bào)并支持后續(xù)識(shí)別、預(yù)測(cè)和干擾等應(yīng)用具有重大現(xiàn)實(shí)意義,但相關(guān)的研究相較于識(shí)別也較少。

    最早開始研究上述預(yù)處理的是國(guó)防科技大學(xué)的劉海軍[107],其在博士論文中針對(duì)三種雷達(dá)字序列中的雷達(dá)字符號(hào)錯(cuò)誤,引入隨機(jī)句法引導(dǎo)的翻譯器,對(duì)錯(cuò)誤的雷達(dá)字符號(hào)進(jìn)行校正。該方法在利用隨機(jī)翻譯器實(shí)現(xiàn)符號(hào)層符號(hào)序列重建任務(wù)的同時(shí),完成對(duì)多功能雷達(dá)的行為識(shí)別。國(guó)防科技大學(xué)的李雪瓊等人[108]基于去噪自編碼器對(duì)存在噪聲、虛假和缺失脈沖的脈沖序列進(jìn)行去噪重建處理,能夠在存在復(fù)雜脈間調(diào)制類型的情況下實(shí)現(xiàn)較好的脈沖序列重建。但該方法基于神經(jīng)網(wǎng)絡(luò),訓(xùn)練開銷和樣本需求不一定能得到滿足。國(guó)防科技大學(xué)的劉章孟等人[109]基于機(jī)器學(xué)習(xí)中的頻繁項(xiàng)挖掘技術(shù),提出了基于提取和擴(kuò)展到達(dá)時(shí)間(Time Of Arrival,TOA)一階差分頻繁項(xiàng)的PRI序列重建方法。該方法能夠?qū)崿F(xiàn)在線和并行處理。但該方法主要針對(duì)常數(shù)、參差和組參差PRI 調(diào)制類型設(shè)計(jì),難以適應(yīng)更為廣泛且復(fù)雜的先進(jìn)多功能雷達(dá)脈間調(diào)制。國(guó)防科技大學(xué)的袁碩在文獻(xiàn)[109]基礎(chǔ)上,基于語(yǔ)義編碼[110]設(shè)計(jì)了脈沖序列重建方法。袁碩所提出的語(yǔ)義編碼方法需要設(shè)置的參數(shù)少,能夠適應(yīng)的調(diào)制類型更多,對(duì)虛假和缺失脈沖非理想情況的魯棒性也更好。

    4.3 狀態(tài)識(shí)別

    符號(hào)-脈沖層符號(hào)識(shí)別的目的是根據(jù)輸入脈沖序列P=(p1,p2,…,pT) ∈RM×T,輸出對(duì)應(yīng)的符號(hào)序列即學(xué)習(xí)映射fsym:P→Ssym,其中P為脈沖序列空間,Ssym為符號(hào)序列空間[97,99,105-106,111]。例如圖14 中“a,b,a,a”對(duì)應(yīng)了四個(gè)工作狀態(tài)符號(hào),在雷達(dá)中被轉(zhuǎn)換成對(duì)應(yīng)的脈沖序列。偵察方的任務(wù)是基于這四個(gè)符號(hào)對(duì)應(yīng)的脈沖序列,識(shí)別這四個(gè)符號(hào)。

    4.3.1 狀態(tài)符號(hào)先驗(yàn)已知

    在各個(gè)狀態(tài)符號(hào)對(duì)應(yīng)脈沖序列的映射關(guān)系已知情況下,偵察方可以根據(jù)對(duì)應(yīng)關(guān)系將脈沖序列轉(zhuǎn)換成對(duì)應(yīng)的狀態(tài)符號(hào)。此時(shí)的狀態(tài)符號(hào)即為雷達(dá)在“符號(hào)-脈沖層”調(diào)度的基本元素。狀態(tài)符號(hào)序列的準(zhǔn)確識(shí)別是后續(xù)符號(hào)層識(shí)別推理的基礎(chǔ)。例如國(guó)防科技大學(xué)劉海軍和歐健等人各自的博士論文中均指出,隨著雷達(dá)字提取錯(cuò)誤率提升,后續(xù)的雷達(dá)命令等高層符號(hào)識(shí)別準(zhǔn)確率降低[50,107]。

    Visnevski Nikita使用隱馬爾可夫模型從脈沖序列提取雷達(dá)字[105],其根據(jù)不同雷達(dá)字的TOA 特性,將連續(xù)時(shí)間離散化然后構(gòu)建轉(zhuǎn)移矩陣不同的多個(gè)兩狀態(tài)(Two state)HMM 模板表征不同雷達(dá)字。通過并行求解給定HMM 模型參數(shù)和觀測(cè)序列情況下的HMM 模型評(píng)估問題,從帶噪脈沖序列中給每個(gè)脈沖標(biāo)記對(duì)應(yīng)的雷達(dá)字標(biāo)簽。國(guó)防科技大學(xué)的劉海軍提出一種數(shù)據(jù)庫(kù)等級(jí),脈沖等級(jí)和編碼序列等級(jí)三級(jí)匹配的雷達(dá)字提取算法[96-97]。王勇軍[106]在此基礎(chǔ)上,提出一種改進(jìn)的事件驅(qū)動(dòng)雷達(dá)字提取方法,能夠更好適應(yīng)虛假脈沖和缺失脈沖環(huán)境。上述研究主要針對(duì)“水星”多功能雷達(dá),雷達(dá)字模板較為固定。在文獻(xiàn)[112]中,劉海軍考慮現(xiàn)代雷達(dá)的復(fù)雜調(diào)制類型給狀態(tài)識(shí)別帶來(lái)的挑戰(zhàn),提出一種基于聯(lián)合參數(shù)建模的雷達(dá)輻射源識(shí)別方法。該方法可以認(rèn)為是考慮了信號(hào)時(shí)間序列特征和多參數(shù)聯(lián)合變化規(guī)律情況下的模板表征,與傳統(tǒng)基于統(tǒng)計(jì)參數(shù)建模的識(shí)別方法相比取得了明顯的性能提升。但面臨較強(qiáng)的非理想情況時(shí)性能下降嚴(yán)重,且為了計(jì)算置信度需要準(zhǔn)確地對(duì)脈沖序列子序列進(jìn)行劃分。

    4.3.2 最小可分辨單元識(shí)別

    當(dāng)偵察方未知各個(gè)狀態(tài)符號(hào)所對(duì)應(yīng)脈沖序列的映射關(guān)系時(shí),雷達(dá)發(fā)射脈沖序列的時(shí)間序列特征與多參數(shù)聯(lián)合變化規(guī)律信息則被認(rèn)為可以反映雷達(dá)的行為意圖,受到研究者們的廣泛關(guān)注[113-116]。此外,在部分雷達(dá)工作狀態(tài)識(shí)別的研究中,研究者將雷達(dá)符號(hào)-脈沖層符號(hào)元素定義為多維脈沖參數(shù),如PRI,載頻(Radio Frequency,RF)和脈沖寬度(Pulse Width,PW)等參數(shù)上的聯(lián)合調(diào)制類型與調(diào)制參數(shù)組合,以支撐映射關(guān)系未知情況下的算法研究。此時(shí)識(shí)別得到的符號(hào)不是雷達(dá)正向調(diào)度過程中所使用的真符號(hào),將存在由于非合作視角導(dǎo)致的映射差異。在本團(tuán)隊(duì)的研究中[80],將此類情況下的識(shí)別稱為最小可分辨單元識(shí)別。

    典型的研究如Kauppi 等,人為設(shè)計(jì)了專用于PRI 調(diào)制類型識(shí)別的無(wú)偏特征提取方法[114],利用提取到的特征和多層感知機(jī),設(shè)計(jì)分層分類算法,實(shí)現(xiàn)了對(duì)六種典型PRI脈間調(diào)制類型的準(zhǔn)確識(shí)別。國(guó)防科技大學(xué)和電子科技大學(xué)的研究者[115,117-118]使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)進(jìn)行PRI 脈間調(diào)制識(shí)別,相比于傳統(tǒng)手工特征取得了顯著的性能提升。最小可分辨單元可以定義為多維脈沖描述字(Pulse Descriptive Word,PDW)上的不同調(diào)制類型組合??紤]到不同最小可分辨單元的脈沖數(shù)目往往是不等的,國(guó)防科技大學(xué)的劉章孟、李雪瓊等人[104,116,119-120]在使用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)進(jìn)行多功能雷達(dá)最小可分辨單元的識(shí)別方面做了大量的工作。RNN提取時(shí)序特征,能夠適應(yīng)不同時(shí)間長(zhǎng)度的輸入數(shù)據(jù),因而處理雷達(dá)脈沖流數(shù)據(jù)更為合適。

    MFR的脈沖序列往往連續(xù)到達(dá),一段輸入脈沖信息往往包含多個(gè)雷達(dá)工作狀態(tài)的脈沖,針對(duì)此類輸入,傳統(tǒng)方法多基于分類器結(jié)合滑窗法進(jìn)行雷達(dá)工作狀態(tài)的識(shí)別。作者團(tuán)隊(duì)[121]從非合作的視角給出MFR 信號(hào)的層次化描述,提出序列到序列學(xué)習(xí)(Sequence to Sequence,Seq2Seq)方法,使得所提出的層次化序列到序列長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Hierarchical Sequence to Sequence Long Short Term Memory Network,HSSLSTM)可以適應(yīng)同時(shí)輸入連續(xù)多個(gè)雷達(dá)工作狀態(tài)的脈沖的情況,并且可以給每一個(gè)脈沖都標(biāo)記上其所屬的雷達(dá)工作狀態(tài)類別。

    先進(jìn)體制MFR 具備調(diào)整或者優(yōu)化其調(diào)制參數(shù)的能力,對(duì)脈間調(diào)制參數(shù)的估計(jì)也引起人們的關(guān)注。作者團(tuán)隊(duì)[79]基于多任務(wù)學(xué)習(xí),提出聯(lián)合調(diào)制類型識(shí)別與調(diào)制參數(shù)估計(jì)網(wǎng)絡(luò)(Joint Modulation Recognition and Parameter Estimation Network,JMRPENet)。通過多任務(wù)學(xué)習(xí),網(wǎng)絡(luò)能夠利用任務(wù)之間相關(guān)性,取得更好的性能和泛化能力;且多任務(wù)學(xué)習(xí)只需要一個(gè)網(wǎng)絡(luò)便能夠同時(shí)完成多個(gè)電子偵察任務(wù),從而簡(jiǎn)化電子偵察設(shè)備的任務(wù)流程。此外傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的輸入結(jié)點(diǎn)數(shù)目是固定的,不能適應(yīng)如參差調(diào)制類型所需要的可變數(shù)目的參數(shù)估計(jì)結(jié)點(diǎn)輸出。本團(tuán)隊(duì)結(jié)合Transformer 神經(jīng)網(wǎng)絡(luò)[122],提出多任務(wù)LSTM-Transformer[123],在任務(wù)特定輸出部分采取序列到序列結(jié)構(gòu),使得神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)靈活的輸出結(jié)構(gòu),包括標(biāo)量結(jié)構(gòu)輸出、固定長(zhǎng)度矢量結(jié)構(gòu)輸出與可變長(zhǎng)度矢量結(jié)構(gòu)輸出,解決上述參數(shù)估計(jì)任務(wù)存在的問題。

    4.3.3 少先驗(yàn)情況識(shí)別

    上述4.3.1-4.3.2 的方法,都是依賴于有監(jiān)督學(xué)習(xí),對(duì)非合作MFR 需要事先通過偵察接收、專家分析等獲得訓(xùn)練樣本。在缺乏訓(xùn)練樣本或可能存在未知樣本的條件下,已有識(shí)別方法主要基于如小樣本學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和序貫分析理論,進(jìn)行狀態(tài)符號(hào)的識(shí)別處理。

    (1)小樣本學(xué)習(xí)識(shí)別

    在小樣本學(xué)習(xí)方面,北京理工大學(xué)的張滋林等人[124]提出了雙路變分自編碼器(Variational Auto-Encoder,VAE)間局部、交叉和分布對(duì)齊(VAE with Local,Cross and Distribution Alignment,LACADA VAE)的生成式小樣本識(shí)別方法。通過將樣本擴(kuò)展成多種模態(tài)并進(jìn)行復(fù)合對(duì)齊,使得學(xué)習(xí)到的概率分布更加可靠。北京理工大學(xué)的翟啟航等人[125]提出編碼細(xì)化原型隨機(jī)游走網(wǎng)絡(luò)(Coding Refined Prototypical Random Walk network,C-RPRWN),該網(wǎng)絡(luò)能夠從具有大量可用訓(xùn)練樣本數(shù)據(jù)集中提取通用信息,并將這些信息遷移至僅有少量可用樣本的新任務(wù)中。同時(shí)為了提升網(wǎng)絡(luò)性能,新任務(wù)中未標(biāo)記樣本也被用于提供數(shù)據(jù)的流形信息。C-RPRWN 通過結(jié)合通用信息與流形信息,有效提升了小樣本條件下的識(shí)別性能。

    (2)無(wú)監(jiān)督學(xué)習(xí)識(shí)別

    在無(wú)監(jiān)督學(xué)習(xí)方面,國(guó)防科技大學(xué)的馬爽[126]將生物基因分析中的異?;驒z測(cè)技術(shù)引入雷達(dá)電子偵察,利用循環(huán)二分算法提取雷達(dá)波形單元(即本文所述雷達(dá)狀態(tài))。該方法不需要任何狀態(tài)先驗(yàn)信息,在較低信噪比情況下也能夠取得較好的提取結(jié)果。進(jìn)一步,他引入生物序列分析中的點(diǎn)陣圖分析技術(shù)和多序列比對(duì)技術(shù),提出一種基于序列相似性分析的搜索規(guī)律重建方法,能夠?qū)Σㄐ涡蛄胁煌侄沃g的相似部分進(jìn)行檢測(cè)和計(jì)算,實(shí)現(xiàn)高精度搜索規(guī)律重建。海軍航空大學(xué)的關(guān)欣等人[127]分析了電子掃描雷達(dá)搜索和跟蹤工作模式序列的生成和不同時(shí)間序列特點(diǎn),結(jié)合Needleman-Wunsch算法思想,提出將兩個(gè)脈沖列提取的公共序列作為對(duì)應(yīng)于搜索模式的主干序列,而不同的序列部分則對(duì)應(yīng)于其他高優(yōu)先級(jí)的序列,如跟蹤或制導(dǎo)模式的信號(hào)序列(符號(hào))。這些算法可以在無(wú)先驗(yàn)信息情況下,通過對(duì)序列的比對(duì)處理獲取HMM 模型和句法模型無(wú)法得到的搜索模式規(guī)律,但無(wú)法辨識(shí)搜索模式外的其他工作模式。另一方面,由于待比對(duì)序列集合只包含有限個(gè)元素,不適用于頻率和PRI 采用隨機(jī)調(diào)制的新體制雷達(dá)。國(guó)防科技大學(xué)的方旖等人[100]基于貝葉斯準(zhǔn)則提出了一種無(wú)監(jiān)督工作狀態(tài)切換點(diǎn)檢測(cè)算法,該方法基于離散的脈沖描述字進(jìn)行處理,對(duì)具有連續(xù)取值空間的捷變調(diào)制脈沖序列以及環(huán)境非理想因素適應(yīng)性需要進(jìn)一步研究。國(guó)防科技大學(xué)的劉章孟[89]基于模型簡(jiǎn)潔性[128](奧卡姆剃刀定律)原理、信息論和壓縮編碼理論[129],提出了對(duì)MFR 脈沖序列的語(yǔ)義編碼模型與編碼策略優(yōu)化方法,能夠自動(dòng)發(fā)掘MFR脈沖序列信號(hào)的序列規(guī)律,并以最簡(jiǎn)潔的形式進(jìn)行表征提取。但該方法對(duì)于如存在狀態(tài)轉(zhuǎn)移模型階數(shù)可變、多子陣同時(shí)工作等情況,信號(hào)形式更為復(fù)雜的先進(jìn)MFR 系統(tǒng),需要依據(jù)編碼理論進(jìn)一步深入研究。

    (3)序貫分析理論識(shí)別

    此外隨著序貫分析理論[130]的發(fā)展,如時(shí)間序列聚類[131-140]和切換點(diǎn)檢測(cè)理論[141-145]研究的進(jìn)展也被應(yīng)用于MFR 序列無(wú)監(jiān)督聚類或切換點(diǎn)檢測(cè)。這些方法利用脈沖序列時(shí)間序列特征對(duì)連續(xù)到達(dá)的多個(gè)雷達(dá)工作狀態(tài)進(jìn)行序列聚類或切換檢測(cè)。北京理工大學(xué)的馬溢浩等人[146]根據(jù)脈間調(diào)制類型的特點(diǎn)與層次化聚類思想,提出基于時(shí)間序列特征的MFR工作模式聚類算法,逐層實(shí)現(xiàn)不同調(diào)制類型信號(hào)序列的聚類。航天工程大學(xué)的高天昊等人[147]利用PRI,RF 和PW 三維參數(shù)的時(shí)空信息,提出改進(jìn)的基于子空間的聚類算法,聚類性能優(yōu)于傳統(tǒng)方法。本團(tuán)隊(duì)在文獻(xiàn)[140]中基于時(shí)間序列子序列聚類原理設(shè)計(jì)算法實(shí)現(xiàn)在無(wú)監(jiān)督條件下,工作狀態(tài)片段的聚類。對(duì)四種典型雷達(dá)調(diào)制類型設(shè)計(jì)對(duì)應(yīng)的參數(shù)化概率模型,然后在三種不同先驗(yàn)可得條件下設(shè)計(jì)聚類算法。但所提出的方法在模型表征、推理和學(xué)習(xí)方面,均需要進(jìn)一步針對(duì)實(shí)際電磁環(huán)境中存在的非理想脈沖序列情況進(jìn)行針對(duì)性優(yōu)化設(shè)計(jì)。進(jìn)一步,本團(tuán)隊(duì)在文獻(xiàn)[81]中對(duì)工作狀態(tài)的表征模型進(jìn)行了改進(jìn),使得模型能夠適應(yīng)可能存在的虛假、缺失脈沖非理想情況,并將聚類問題建模成切換點(diǎn)檢測(cè)問題,提高模式切換時(shí)偵察方判別的實(shí)時(shí)性。哈爾濱工程大學(xué)的遲坤等人[148]提出了基于遞歸圖和奇異值分解的MFR工作模式分割算法,該方法利用遞歸圖揭示脈沖序列的特征變化,并通過奇異值分解進(jìn)行定量分析。最后采用差異測(cè)量來(lái)檢測(cè)模式切換的邊界,能夠?qū)崿F(xiàn)不同粒度模式切換邊界的準(zhǔn)確檢測(cè)。

    一方面,基于無(wú)監(jiān)督學(xué)習(xí)的工作狀態(tài)識(shí)別研究相對(duì)較少。另一方面,當(dāng)前新體制雷達(dá)多采用載頻捷變和PRI抖動(dòng)的隨機(jī)調(diào)制來(lái)增強(qiáng)抗干擾性能。而具備認(rèn)知和軟件自定義能力的雷達(dá)[14,17,149]則具有脈沖-脈沖或者脈沖組-脈沖組級(jí)別的捷變能力,復(fù)雜度和靈活性進(jìn)一步提升,因此需要進(jìn)一步優(yōu)化算法,提高算法對(duì)真實(shí)電子偵察任務(wù)的適應(yīng)性。

    4.4 基于符號(hào)輸入的行為識(shí)別

    行為識(shí)別任務(wù)的輸入是低層行為符號(hào)序列,輸出是高層行為符號(hào)類別(如雷達(dá)命令)。此類研究多在第3.2 節(jié)中所述行為層次化模型框架下開展,基于脈沖序列逐級(jí)向上遞推高層行為類別,同時(shí)還可以估計(jì)模型對(duì)應(yīng)的符號(hào)轉(zhuǎn)移概率。

    在有先驗(yàn)的情況下,可直接基于符號(hào)序列識(shí)別的方法識(shí)別行為符號(hào)類別。例如輸入狀態(tài)符號(hào)序列S,輸出行為類別標(biāo)簽M為求解下述最大條件概率問題:

    其中M為S對(duì)應(yīng)的高層符號(hào)類別標(biāo)簽,∑mode為符號(hào)字母表。也可以考慮序列到序列的識(shí)別設(shè)置,即求解下述問題:

    其中M=(M1,M2,…,M|S|),Mi為第i個(gè)輸入符號(hào)對(duì)應(yīng)的高層符號(hào)標(biāo)簽,|S|為序列長(zhǎng)度,即識(shí)別每一個(gè)輸入符號(hào)對(duì)應(yīng)的高層符號(hào)類別。

    國(guó)外對(duì)行為識(shí)別的研究以Visnevski 本人及其課題組展開的相關(guān)工作[68,90,105,150-151]為代表。如在文獻(xiàn)[67,90]中,他們系統(tǒng)地研究了在使用SCFG模型建模符號(hào)層行為基礎(chǔ)上的兩類經(jīng)典任務(wù)。第一類任務(wù)使用經(jīng)典的維特比算法在給定句法模型參數(shù)的基礎(chǔ)上結(jié)合觀測(cè)符號(hào)序列實(shí)現(xiàn)MFR高層符號(hào)類別的識(shí)別;第二類任務(wù)在給定觀測(cè)符號(hào)序列的基礎(chǔ)上實(shí)現(xiàn)對(duì)SCFG 模型參數(shù)的估計(jì)。但他們研究中估計(jì)模型參數(shù)所使用的Inside Outside(IO)算法和維特比評(píng)分(Viterbi Score,VS)算法均為迭代算法,在面臨詞匯表巨大、語(yǔ)法規(guī)則復(fù)雜的句法模型時(shí),計(jì)算復(fù)雜度過大。加拿大蒙特利爾大學(xué)的Guillaume Latombe等人[152-153]針對(duì)上述問題,基于IO和VS 算法基本原理,和圖期望最大(graphical Expectation-Maximization,gEM)原理,提出了句法模型的增量式學(xué)習(xí)算法和句法生成規(guī)則的快速學(xué)習(xí)算法,能夠在保持參數(shù)估計(jì)準(zhǔn)確率的前提下顯著降低算法時(shí)間復(fù)雜度和收斂時(shí)間。空軍工程大學(xué)的代鸝鵬等人[92-93,95]構(gòu)造CKY 解析表,排除了未參與序列派生過程的句法模型產(chǎn)生式,然后采用改進(jìn)的IO 算法P(IO)和改進(jìn)的VS 算法P(VS),實(shí)現(xiàn)對(duì)SCFG 產(chǎn)生式概率和狀態(tài)轉(zhuǎn)移概率的快速估計(jì)。其中P(VS)算法還支持多文法并行計(jì)算,計(jì)算復(fù)雜度低于IO,VS和P(IO)算法。上述研究未考慮雷達(dá)層次化模型中,雷達(dá)與目標(biāo)存在的交互。航天工程大學(xué)的陳維高等人[74]引入目標(biāo)狀態(tài)信息,構(gòu)建雙鏈HMM,然后利用Dempster-Shafer(D-S)證據(jù)理論優(yōu)化估計(jì)結(jié)果,提出一種基于HMM 的雷達(dá)狀態(tài)轉(zhuǎn)移估計(jì)方法。相較于傳統(tǒng)HMM 算法,雙鏈HMM 算法提升了模型的魯棒性和識(shí)別的準(zhǔn)確率。

    但基于句法模型或HMM 進(jìn)行識(shí)別的研究,要求MFR信號(hào)各個(gè)層次符號(hào)已預(yù)先進(jìn)行了精準(zhǔn)提取,且往往假定模型結(jié)構(gòu)已知,只需要根據(jù)觀測(cè)進(jìn)行模型參數(shù)估計(jì)。識(shí)別方面若出現(xiàn)如符號(hào)-脈沖層符號(hào)識(shí)別錯(cuò)誤(如雷達(dá)字提取錯(cuò)誤)的情況,就會(huì)造成識(shí)別出錯(cuò);估計(jì)方面,模型結(jié)構(gòu)先驗(yàn)不一定總是可以獲取,往往只能獲取部分結(jié)構(gòu)信息,此種情況無(wú)法實(shí)現(xiàn)準(zhǔn)確估計(jì)。針對(duì)第一個(gè)問題,國(guó)防科技大學(xué)的歐健等人[154-155]考慮基于貝葉斯的識(shí)別方法,使用預(yù)測(cè)狀態(tài)表示(Predictive State Representations,PSR)模型替代句法模型、HMM 實(shí)現(xiàn)對(duì)MFR 的建模。PSR 模型具備通用性好、模型簡(jiǎn)潔、易于學(xué)習(xí)、表征能力強(qiáng)等特點(diǎn)。隨后歐健提出基于柵格濾波器和基于預(yù)測(cè)狀態(tài)累積的符號(hào)識(shí)別方法,無(wú)先驗(yàn)信息情況下,通過對(duì)預(yù)測(cè)狀態(tài)的累積動(dòng)態(tài)獲取符號(hào)轉(zhuǎn)移信息,實(shí)現(xiàn)最大后驗(yàn)意義上的符號(hào)層符號(hào)識(shí)別。第二個(gè)問題需要實(shí)現(xiàn)模型結(jié)構(gòu)和參數(shù)的聯(lián)合估計(jì)[156],目前仍然存在較大的挑戰(zhàn),但在雷達(dá)領(lǐng)域存在較多相關(guān)研究,如雷達(dá)目標(biāo)跟蹤研究中一系列基于模型的方法[157]和雷達(dá)目標(biāo)自動(dòng)識(shí)別研究中[158]一系列基于參數(shù)化統(tǒng)計(jì)模型的方法,可以為偵察方提供一定的理論和模型基礎(chǔ)。

    深度學(xué)習(xí)模型也被用于符號(hào)層符號(hào)識(shí)別任務(wù)。相較于傳統(tǒng)常用句法模型、HMM 模型以及PSR 模型,深度學(xué)習(xí)模型能夠從大量帶噪聲數(shù)據(jù)中學(xué)習(xí),學(xué)習(xí)輸入符號(hào)序列與標(biāo)簽類別之間任意復(fù)雜的映射關(guān)系。如邁阿密大學(xué)的Jayson Rook等人[159]基于LSTM 網(wǎng)絡(luò),構(gòu)建半監(jiān)督識(shí)別方法,在識(shí)別已知雷達(dá)行為的同時(shí)對(duì)未知雷達(dá)行為進(jìn)行拒識(shí)。

    4.5 基于脈沖輸入的行為識(shí)別

    基于脈沖輸入的行為識(shí)別方法又可以根據(jù)是否輸出中間結(jié)果,劃分為級(jí)聯(lián)識(shí)別方法和端到端識(shí)別方法。其中級(jí)聯(lián)識(shí)別方法輸入脈沖序列,逐級(jí)輸出符號(hào)層更高層的符號(hào)。端到端識(shí)別方法輸入脈沖序列,直接輸出最終所要識(shí)別的符號(hào)層的符號(hào)結(jié)果。

    (1)級(jí)聯(lián)行為識(shí)別

    級(jí)聯(lián)行為識(shí)別的研究工作可以按實(shí)現(xiàn)雷達(dá)系統(tǒng)行為識(shí)別的兩個(gè)階段進(jìn)行劃分,如圖16所示。第一個(gè)階段完成狀態(tài)符號(hào)提取。第二個(gè)階段基于第一階段識(shí)別得到的符號(hào)序列推知高層行為符號(hào)。

    圖16 級(jí)聯(lián)行為識(shí)別框架Fig.16 Cascaded behavior recognition framework

    電子科技大學(xué)的代策宇[160]和中國(guó)船舶集團(tuán)有限公司第八研究院的周姝婧等人[161]考慮級(jí)聯(lián)識(shí)別方法,級(jí)聯(lián)符號(hào)-脈沖層識(shí)別網(wǎng)絡(luò)與符號(hào)層識(shí)別網(wǎng)絡(luò),實(shí)現(xiàn)行為識(shí)別。針對(duì)級(jí)聯(lián)識(shí)別中容易出現(xiàn)級(jí)聯(lián)誤差的問題,國(guó)防科技大學(xué)的許信松等人[102,162]基于門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(Gate Recurrent Unit,GRU)實(shí)現(xiàn)行為識(shí)別。通過將輸入雷達(dá)字脈沖序列分割,第一級(jí)網(wǎng)絡(luò)給出各段對(duì)應(yīng)的識(shí)別結(jié)果,第二級(jí)基于該識(shí)別結(jié)果進(jìn)行最大后驗(yàn)估計(jì),得到高層符號(hào)識(shí)別結(jié)果。本團(tuán)隊(duì)[80]則提出由狀態(tài)符號(hào)序列生成和符號(hào)層符號(hào)識(shí)別兩步組成的算法以降低級(jí)聯(lián)誤差。首先通過HSSLSTM 網(wǎng)絡(luò)[121]識(shí)別得到每個(gè)脈沖對(duì)應(yīng)的工作狀態(tài)符號(hào)標(biāo)簽,然后通過自適應(yīng)或固定轉(zhuǎn)換對(duì)識(shí)別得到的狀態(tài)標(biāo)簽序列進(jìn)行轉(zhuǎn)換得到狀態(tài)符號(hào)序列,如圖17所示。最后提出基于兩種不同LSTM 架構(gòu)的符號(hào)層符號(hào)識(shí)別算法,如圖18所示。其中基于序列到序列的識(shí)別網(wǎng)絡(luò)結(jié)構(gòu),能夠?qū)斎氲陌鄠€(gè)符號(hào)的低層符號(hào)序列,輸出每個(gè)輸入符號(hào)對(duì)應(yīng)的高層符號(hào)類別。此外由于不同的高層符號(hào)類別可能存在相同的低層符號(hào)序列(公共符號(hào)序列),通過序列到序列學(xué)習(xí)可以利用高層符號(hào)間的符號(hào)轉(zhuǎn)移關(guān)系,一定程度上緩解對(duì)這些公共符號(hào)序列的識(shí)別錯(cuò)誤。

    圖17 狀態(tài)符號(hào)序列識(shí)別Fig.17 State symbol sequence recognition

    圖18 基于不同LSTM結(jié)構(gòu)的符號(hào)層符號(hào)識(shí)別示意圖Fig.18 Schematic diagram of symbol layer symbol recognition based on different LSTM structures

    (2)端到端行為識(shí)別

    端到端行為識(shí)別輸入脈沖序列,直接輸出符號(hào)層高層符號(hào),實(shí)現(xiàn)端到端行為識(shí)別。此類研究多以雷達(dá)工作模式(高層行為)為識(shí)別對(duì)象,例如邊搜索邊跟蹤(Track While Scan,TWS),搜索加跟蹤(Track And Scan,TAS),多目標(biāo)跟蹤(Multiple Target Tracking,MTT)等。

    此種高層雷達(dá)行為,具有控制參數(shù)種類多、維度高等特點(diǎn),以及考慮MFR 執(zhí)行任務(wù)的多目標(biāo)特點(diǎn),對(duì)如多目標(biāo)跟蹤、邊搜索邊跟蹤、搜索加跟蹤等工作模式識(shí)別往往需要融合多偵收參數(shù)和多觀測(cè)平臺(tái)的觀測(cè)信息。因此,端到端行為識(shí)別研究多基于多域信息融合識(shí)別。西南交通大學(xué)的李輝等人[163]針對(duì)機(jī)載相控陣?yán)走_(dá)工作模式,結(jié)合雷達(dá)對(duì)目標(biāo)搜索、跟蹤時(shí)數(shù)據(jù)率及接收信號(hào)幅值的變化規(guī)律,提出了一種基于脈沖多層次參數(shù)建模與關(guān)聯(lián)的識(shí)別算法??哲姽こ檀髮W(xué)的王玉冰等人[164]考慮機(jī)載火控雷達(dá)執(zhí)行多目標(biāo)任務(wù),基于D-S 證據(jù)理論[165]進(jìn)行單平臺(tái)多周期時(shí)域融合和多平臺(tái)空域信息融合,有效提升雷達(dá)工作模式識(shí)別準(zhǔn)確率。國(guó)防科技大學(xué)的唐文龍等人[166]考慮三坐標(biāo)對(duì)空情報(bào)雷達(dá)的工作特點(diǎn),提出了一種基于波位建模的工作模式識(shí)別方法,并結(jié)合D-S 證據(jù)理論對(duì)多波位傳感器信息進(jìn)行融合識(shí)別,提升了對(duì)此類雷達(dá)的識(shí)別準(zhǔn)確率??哲姽こ檀髮W(xué)的董曉璇等人[167]針對(duì)偵察設(shè)備對(duì)雷達(dá)信號(hào)參數(shù)的測(cè)量誤差嚴(yán)重影響識(shí)別效果的情況,提出了時(shí)域模糊決策融合的雷達(dá)工作模式識(shí)別方法,利用多個(gè)時(shí)刻的模糊決策基于D-S 證據(jù)理論進(jìn)行融合識(shí)別,從而提高工作模式識(shí)別率??哲婎A(yù)警學(xué)院的唐玉文等人[168]提出了一種基于復(fù)合賦權(quán)優(yōu)劣解距離(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)的識(shí)別方法,將雷達(dá)工作模式識(shí)別問題轉(zhuǎn)化為多屬性決策問題,對(duì)6種雷達(dá)空空工作模式取得了較好的識(shí)別穩(wěn)定性和較高的識(shí)別性能。國(guó)防科技大學(xué)的馬珂針對(duì)機(jī)載火控雷達(dá)空空工作模式反推識(shí)別局限性大的問題[169-170],從電子情報(bào)的角度重新定義了8 種工作狀態(tài),分別設(shè)計(jì)了多種手工特征,并基于DS 證據(jù)理論開展多參數(shù)和多周期融合識(shí)別。最后通過信號(hào)模擬器仿真數(shù)據(jù)驗(yàn)證了識(shí)別方法的時(shí)效性,具有較好的工程應(yīng)用價(jià)值。

    隨著人工智能領(lǐng)域的發(fā)展,利用深度神經(jīng)網(wǎng)絡(luò),如卷積神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò)等的自動(dòng)特征提取能力,提取脈沖序列多參數(shù)時(shí)間序列特征,并結(jié)合分類器實(shí)現(xiàn)端到端行為識(shí)別的研究也得到廣泛發(fā)展。西南交通大學(xué)李輝等人[171]使用堆疊去噪自編碼器對(duì)機(jī)載多功能雷達(dá)的截獲信號(hào)幅值變化規(guī)律進(jìn)行自動(dòng)學(xué)習(xí),在存在較高的環(huán)境非理想性情況下取得了超過90%的識(shí)別結(jié)果,驗(yàn)證了深度學(xué)習(xí)模型的強(qiáng)大特征提取能力與非理想性適應(yīng)能力。國(guó)防科技大學(xué)的杜明洋等人[172]提出魯棒貝葉斯注意力機(jī)制信念神經(jīng)網(wǎng)絡(luò)以增強(qiáng)在信號(hào)非理想情況下深度網(wǎng)絡(luò)模型的表征能力,提升工作模式識(shí)別能力。該方法結(jié)合補(bǔ)零、CNN 和注意力機(jī)制實(shí)現(xiàn)非RNN 類結(jié)構(gòu)的并行脈沖時(shí)間序列特征提取。西安電子科技大學(xué)的田甜等人[173]針對(duì)艦載多功能雷達(dá)工作模式識(shí)別問題,提出了雙路注意力時(shí)序卷積神經(jīng)網(wǎng)絡(luò),將PDW序列特征映射至高維時(shí)序特征空間,能夠保證識(shí)別準(zhǔn)確率的同時(shí)提升時(shí)效性。國(guó)防科技大學(xué)的馬珂等人[174]提出一維CNN 結(jié)構(gòu)進(jìn)行機(jī)載火控雷達(dá)空空工作模式,通過一維卷積降低特征提取計(jì)算復(fù)雜度,提升了識(shí)別的實(shí)時(shí)性,具備良好的應(yīng)用潛力。

    當(dāng)深度網(wǎng)絡(luò)所需要的訓(xùn)練樣本有限,或者測(cè)試樣本將存在與訓(xùn)練樣本分布不一致的可能時(shí),深度網(wǎng)絡(luò)識(shí)別性能將急劇下降。北京郵電大學(xué)的張居圓[175]開展了基于已有數(shù)據(jù)庫(kù)大樣本學(xué)習(xí)和基于孿生神經(jīng)網(wǎng)絡(luò)的小樣本微調(diào)算法設(shè)計(jì),實(shí)現(xiàn)對(duì)7種雷達(dá)工作模式小樣本條件下的準(zhǔn)確識(shí)別。電子科技大學(xué)的利強(qiáng)等人[176]考慮多功能雷達(dá)工作模式的多樣性、隱藏性,以及電子偵察系統(tǒng)截獲樣本數(shù)可能較少的問題,提出了基于知識(shí)原型網(wǎng)絡(luò)的小樣本多功能雷達(dá)工作模式識(shí)別方法,將通用領(lǐng)域先驗(yàn)知識(shí)進(jìn)行編碼映射,實(shí)現(xiàn)知識(shí)在網(wǎng)絡(luò)模型中的嵌入,顯著提升了網(wǎng)絡(luò)在小樣本條件下的識(shí)別性能。國(guó)防科技大學(xué)的潘繼飛等人[177]考慮通用識(shí)別模型,設(shè)計(jì)多源聯(lián)合識(shí)別框架,將雷達(dá)工作模式的領(lǐng)域知識(shí)融入網(wǎng)絡(luò)訓(xùn)練,從而提升訓(xùn)練和測(cè)試數(shù)據(jù)分布存在失配情況下的識(shí)別性能。

    5 多功能雷達(dá)內(nèi)隱行為的推理

    偵察方需要通過對(duì)外顯行為的識(shí)別結(jié)果,推理內(nèi)隱行為。具體的,對(duì)內(nèi)隱行為中的內(nèi)隱管理行為推理其決策過程的準(zhǔn)則。對(duì)內(nèi)隱行為中的評(píng)估分支行為,推理雷達(dá)方評(píng)估的結(jié)果和性能。

    5.1 行為推理的研究路線分類

    內(nèi)隱行為推理在逆向推理的框架下實(shí)現(xiàn)。逆向推理指的是通過研究系統(tǒng)外部行為或表現(xiàn)逆向分析系統(tǒng)內(nèi)部細(xì)節(jié)的過程。1964 年卡爾曼(Kalman)在文獻(xiàn)[178]中研究了逆最優(yōu)控制問題,目的是確定給定控制策略的成本準(zhǔn)則是最優(yōu)的。近年來(lái)逆向推理在多個(gè)領(lǐng)域引起了關(guān)注,且在不同領(lǐng)域,逆向推理有不同的具體問題及其解決方法。

    在認(rèn)知電子戰(zhàn)領(lǐng)域[179],人工智能等先進(jìn)技術(shù)已經(jīng)得到不斷發(fā)展與應(yīng)用,雷達(dá)方和偵察方系統(tǒng)各自的精準(zhǔn)對(duì)抗博弈能力不斷提升。如第4 節(jié)所述,偵察方可以對(duì)多功能雷達(dá)的行為以及行為動(dòng)態(tài)特性實(shí)現(xiàn)快速準(zhǔn)確識(shí)別與估計(jì);雷達(dá)方則往往基于深度學(xué)習(xí)框架構(gòu)建各類神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)對(duì)復(fù)雜干擾信號(hào)的高效精準(zhǔn)識(shí)別[180-183],基于序貫決策或博弈理論設(shè)計(jì)抗干擾策略[184-185],提升抗干擾能力。對(duì)抗雙方系統(tǒng)都亟須尋求根據(jù)所掌握先驗(yàn)信息及部分可觀測(cè)結(jié)果獲取更豐富和更準(zhǔn)確對(duì)手系統(tǒng)信息的技術(shù)手段,以便在對(duì)抗博弈過程中取得優(yōu)勢(shì)。因此,針對(duì)無(wú)法直接觀測(cè)得到的對(duì)手系統(tǒng)內(nèi)部細(xì)節(jié)信息(如雷達(dá)方目標(biāo)跟蹤環(huán)節(jié)的跟蹤精度)進(jìn)行逆向推理技術(shù)研究開始進(jìn)入研究者的視線。

    Vikram Krishnamurthy 在文獻(xiàn)[66]中構(gòu)建了針對(duì)認(rèn)知雷達(dá)的“信號(hào)層-功能層-策略層”的逆推理框架,提出在功能層應(yīng)用逆濾波實(shí)現(xiàn)對(duì)雷達(dá)跟蹤功能的逆推理,在策略層使用逆強(qiáng)化學(xué)習(xí)完成對(duì)雷達(dá)認(rèn)知能力的分析,在信號(hào)層設(shè)計(jì)干擾信號(hào)以迷惑對(duì)手雷達(dá)。作者團(tuán)隊(duì)在文獻(xiàn)[186]中給出了雷達(dá)對(duì)抗場(chǎng)景中的反智能技術(shù)定義,指對(duì)抗一方針對(duì)對(duì)手系統(tǒng)中感知、推理、決策等不同層次上具備的智能化技術(shù)功能和性能,實(shí)現(xiàn)逆向處理、反演推理和反制決策的相應(yīng)技術(shù)措施總稱。

    具體的,作者團(tuán)隊(duì)在文獻(xiàn)[187]中給出雷達(dá)對(duì)抗場(chǎng)景中的逆向推理框架。無(wú)論是雷達(dá)方還是偵察方系統(tǒng),均可概括為如圖19所示的主要的系統(tǒng)功能實(shí)現(xiàn)環(huán)節(jié),即收發(fā)天線、接收機(jī)和發(fā)射機(jī)、信號(hào)與信息處理、資源管理調(diào)度、發(fā)射/干擾信號(hào)優(yōu)化模塊。在偵察方對(duì)雷達(dá)方進(jìn)行逆向分析處理時(shí),可根據(jù)分析對(duì)象在偵察方系統(tǒng)處理鏈路中的所處位置,映射為逆信號(hào)/信息處理、逆資源調(diào)度、逆信號(hào)優(yōu)化的三個(gè)基本功能模塊。逆向推理模塊的輸入是偵察方的接收模塊對(duì)雷達(dá)方系統(tǒng)外部可觀測(cè)行為的量測(cè)結(jié)果(即第4 節(jié)所述識(shí)別結(jié)果),其輸出可支撐自身智能化對(duì)抗行為的決策。偵察方逆推理模塊所針對(duì)雷達(dá)系統(tǒng)行為的具體環(huán)節(jié)、逆推理輸入及作用總結(jié)如表6。各個(gè)環(huán)節(jié)逆推理所采取的主要方法分為逆濾波處理和逆強(qiáng)化學(xué)習(xí)兩類。

    表6 偵察方逆向推理模塊的具體映射Tab.6 Mappings of the inverse inference module from reconnaissance’s perspective

    圖19 雷達(dá)對(duì)抗場(chǎng)景下的逆向推理框架Fig.19 Inverse inference Framework in radar countermeasure scenarios

    5.2 基于逆濾波處理的內(nèi)隱推理行為推理

    逆濾波是對(duì)雷達(dá)系統(tǒng)信號(hào)和信息處理中關(guān)鍵推理節(jié)點(diǎn)的逆向推理問題。如偵察方根據(jù)對(duì)雷達(dá)行為的感知,實(shí)時(shí)對(duì)雷達(dá)信號(hào)及信息處理環(huán)節(jié)中的目標(biāo)跟蹤濾波環(huán)節(jié)的輸出狀態(tài)進(jìn)行逆向推理,估計(jì)雷達(dá)方目標(biāo)跟蹤濾波的跟蹤誤差。進(jìn)一步可支撐后續(xù)干擾效果評(píng)估和干擾策略優(yōu)化。

    目標(biāo)跟蹤是雷達(dá)最基礎(chǔ)和最核心的功能,濾波算法則是雷達(dá)目標(biāo)跟蹤功能的核心。雷達(dá)通過相關(guān)和濾波算法建立目標(biāo)運(yùn)動(dòng)軌跡。如對(duì)目標(biāo)運(yùn)動(dòng)狀態(tài)進(jìn)行預(yù)測(cè),再根據(jù)由雷達(dá)信號(hào)處理模塊輸入的目標(biāo)運(yùn)動(dòng)狀態(tài)的觀測(cè)值進(jìn)行修正,從而得到對(duì)目標(biāo)運(yùn)動(dòng)狀態(tài)的估計(jì),實(shí)現(xiàn)目標(biāo)跟蹤。最后根據(jù)雷達(dá)跟蹤等環(huán)節(jié)的輸出進(jìn)行資源管理、波形優(yōu)化、平臺(tái)運(yùn)動(dòng)等決策,并通過發(fā)射機(jī)發(fā)射信號(hào)。對(duì)偵察方而言,就需要考慮通過可感知得到的雷達(dá)外在行為,實(shí)現(xiàn)對(duì)雷達(dá)內(nèi)部信號(hào)及信息處理環(huán)節(jié)性能的估計(jì)。

    經(jīng)典的逆濾波處理主要討論如何通過貝葉斯濾波輸出的狀態(tài)后驗(yàn)來(lái)估計(jì)濾波輸入或傳感器精度[188]。從1979年開始,就已經(jīng)有專家學(xué)者對(duì)卡爾曼濾波的逆濾波問題進(jìn)行了研究。文獻(xiàn)[141,189]中討論了包括最優(yōu)卡爾曼濾波器設(shè)計(jì)在內(nèi)的一系列逆問題。文獻(xiàn)[188]針對(duì)線性高斯?fàn)顟B(tài)空間系統(tǒng)的逆濾波問題進(jìn)行了探討,在給定貝葉斯后驗(yàn)(即均值和協(xié)方差的樣本路徑)的情況下重建量測(cè)和某些未知傳感器參數(shù),并對(duì)已知狀態(tài)后驗(yàn)帶噪聲情況下的逆濾波問題進(jìn)行分析,提出了這兩種情況下的逆濾波算法。最后通過數(shù)值仿真評(píng)估了算法對(duì)量測(cè)誤差的魯棒性。文獻(xiàn)[190]討論了隱馬爾可夫模型下的逆濾波問題,提出了基于聚類算法的逆HMM濾波算法。

    在控制領(lǐng)域,利用逆濾波對(duì)狀態(tài)估計(jì)進(jìn)行逆推理的研究最早可以追溯到2006 年,Paul Sundvall 等人在文獻(xiàn)[191]中將其用于機(jī)器人導(dǎo)航系統(tǒng)的故障檢測(cè)。移動(dòng)機(jī)器人導(dǎo)航系統(tǒng)需要在避免碰撞的同時(shí)到達(dá)目的地,通過如計(jì)算機(jī)視覺、激光、聲吶等傳感器系統(tǒng)測(cè)量障礙物姿態(tài)并進(jìn)行路徑規(guī)劃。由于系統(tǒng)中傳感器和狀態(tài)估計(jì)器事先經(jīng)過了集成和封裝,因此需要從外部對(duì)狀態(tài)估計(jì)器進(jìn)行逆推理,得出機(jī)器人導(dǎo)航系統(tǒng)的狀態(tài)估計(jì)輸出,并基于此分析其傳感器輸出和傳感器系統(tǒng)的精度。2009 年,Wahlberg和Bittencourt對(duì)汽車導(dǎo)航系統(tǒng)故障定位問題進(jìn)行了研究,采用逆濾波的方法對(duì)導(dǎo)航系統(tǒng)狀態(tài)估計(jì)模型進(jìn)行逆分析[192]。2017 年,為了實(shí)現(xiàn)人機(jī)交互過程中機(jī)器對(duì)力度和位置的控制,文獻(xiàn)[193]結(jié)合模型參考設(shè)計(jì)和自適應(yīng)逆濾波提出了一種阻抗控制方法,通過自適應(yīng)地調(diào)整機(jī)器人中阻抗參數(shù),提升對(duì)力度和位置的跟蹤性能。2018 年,文獻(xiàn)[194]基于多輸入-多輸出(MIMO)系統(tǒng)模型,提出了一種針對(duì)具有多個(gè)輸入信號(hào)系統(tǒng)的逆濾波方法,通過將多個(gè)輸入信號(hào)的影響分離并進(jìn)行逆濾波處理可以有效地恢復(fù)出各個(gè)輸入信號(hào),并且對(duì)于不同輸入信號(hào)之間的干擾具有較好的抑制能力。2019 年,文獻(xiàn)[195]將自適應(yīng)學(xué)習(xí)機(jī)制引入到逆濾波器構(gòu)成動(dòng)態(tài)逆濾波器用于前饋跟蹤控制,動(dòng)態(tài)濾波過程運(yùn)用迭代學(xué)習(xí)控制跟蹤目標(biāo)信號(hào)并更新濾波器,從而顯著改善前饋跟蹤控制性能,并在不確定性和變化的環(huán)境下實(shí)現(xiàn)精確跟蹤。2022 年,文獻(xiàn)[196]針對(duì)跟蹤非線性和復(fù)雜系統(tǒng)在控制器收斂速度和跟蹤精度方面存在限制的問題,探討了如何交錯(cuò)應(yīng)用迭代學(xué)習(xí)控制和逆動(dòng)力學(xué)識(shí)別方法構(gòu)建逆濾波模型,用以加速收斂并提高控制性能。

    上述領(lǐng)域的研究均是針對(duì)自身或合作系統(tǒng)的某些環(huán)節(jié)進(jìn)行逆向推理,無(wú)法滿足雷達(dá)對(duì)抗領(lǐng)域非合作特點(diǎn)引入的新的問題。2019 年,以美國(guó)康奈爾大學(xué)的Vikram Krishnamurthy 教授為首的學(xué)者首次將逆濾波問題擴(kuò)展至非合作對(duì)象,以具有認(rèn)知能力的無(wú)人機(jī)系統(tǒng)或雷達(dá)系統(tǒng)作為對(duì)手,探討如何使用逆濾波方法實(shí)現(xiàn)對(duì)非合作對(duì)手系統(tǒng)目標(biāo)跟蹤環(huán)節(jié)的逆推理,或稱為逆向跟蹤,并估計(jì)對(duì)手傳感器的觀測(cè)精度[82]。同年,學(xué)者Robert Mattila在文獻(xiàn)[197]中討論了對(duì)抗認(rèn)知雷達(dá)系統(tǒng)的固定間隔平滑問題,考慮對(duì)手雷達(dá)對(duì)己方的離散狀態(tài)進(jìn)行估計(jì)時(shí),構(gòu)建平滑器,根據(jù)可觀測(cè)雷達(dá)動(dòng)作逆向推理對(duì)手雷達(dá)對(duì)己方離散狀態(tài)的估計(jì)結(jié)果。文獻(xiàn)[85]將離散狀態(tài)空間的HMM 模型逆濾波問題在雷達(dá)對(duì)抗領(lǐng)域進(jìn)行擴(kuò)展,討論了電子對(duì)抗背景下的逆HMM 濾波與經(jīng)典的逆HMM 濾波問題的不同之處,并給出在電子對(duì)抗背景下如何應(yīng)用逆HMM 濾波方法實(shí)現(xiàn)對(duì)雷達(dá)傳感器觀測(cè)精度的估計(jì)。

    已有雷達(dá)對(duì)抗逆濾波研究多針對(duì)基本的卡爾曼濾波。2023年印度理工學(xué)院的Himali Singh等人基于Vikram Krishnamurthy 所提出的反對(duì)手自治系統(tǒng)(Counter-adversarial autonomous system)對(duì)先進(jìn)逆濾波方法和理論的研究需求,分別從逆擴(kuò)展卡爾曼濾波[198-200](Inverse Extended Kalman Filter,IEKF)、逆立方體和正交卡爾曼濾波(Inverse Cubature and Quadrature Kalman Filters)等方面研究了相應(yīng)的逆濾波方法。在文獻(xiàn)[198]中,作者假定具有完美的系統(tǒng)模型信息,并在已知和未知輸入的情況下,對(duì)前向?yàn)V波和逆向逆濾波均為非線性狀態(tài)空間模型的情況下提出了相應(yīng)的I-EKF算法。進(jìn)一步,作者在文獻(xiàn)[199]中將I-EKF 算法擴(kuò)展至對(duì)高度非線性的二階擴(kuò)展卡爾曼濾波中,提出了基于希爾伯特空間再生核EKF 算法,以處理存在不完全系統(tǒng)模型信息情況下的濾波與逆濾波處理。需要注意的是,在此篇文獻(xiàn)中作者首次考慮了偵察方存在的模型失配情況。但EKF 算法是基于非線性高斯?fàn)顟B(tài)空間模型,先進(jìn)的自動(dòng)化系統(tǒng)通常具有更為復(fù)雜、非線性程度更高的濾波方法,Himali Singh 基于高效數(shù)值積分技術(shù),提出了逆立方體和正交卡爾曼濾波(Inverse Cubature KF I-CKF,Inverse Quadrature KF,I-QKF)。雷達(dá)目標(biāo)跟蹤領(lǐng)域?qū)嶋H上存在大量更為先進(jìn)和復(fù)雜的濾波算法[201],不同的雷達(dá)濾波算法均需要設(shè)計(jì)與其匹配的逆濾波處理算法。

    本團(tuán)隊(duì)在Vikram Krishnamurthy 研究的基礎(chǔ)上,針對(duì)可以適用雜波背景的概率數(shù)據(jù)關(guān)聯(lián)(Probabilistic Data Association,PDA)濾波算法設(shè)計(jì)了逆PDA 濾波算法[202],并將逆PDA 濾波的結(jié)果實(shí)現(xiàn)干擾效果評(píng)估,進(jìn)一步指導(dǎo)我方干擾策略、干擾樣式優(yōu)化。文獻(xiàn)[202]是通過逆濾波設(shè)計(jì)實(shí)現(xiàn)雷達(dá)系統(tǒng)更多內(nèi)部狀態(tài)感知和推理的一次有益探索。

    上述已有逆濾波研究對(duì)非合作雷達(dá)系統(tǒng)內(nèi)部的各個(gè)處理環(huán)節(jié)的假設(shè)較強(qiáng),例如需要假定對(duì)手系統(tǒng)所使用的濾波算法、狀態(tài)轉(zhuǎn)移矩陣、觀測(cè)函數(shù)均已知。此種情況下的逆濾波問題轉(zhuǎn)變?yōu)榻o定觀測(cè)和概率圖模型情況下,對(duì)未知變量節(jié)點(diǎn)的后驗(yàn)計(jì)算問題。但上述先驗(yàn)信息在實(shí)際對(duì)抗過程中難以準(zhǔn)確獲取。本團(tuán)隊(duì)[203]考慮構(gòu)建隱變量的方式,利用隱變量和狀態(tài)轉(zhuǎn)移矩陣、觀測(cè)矩陣分別表征交互過程中的中間變量和條件概率分布,設(shè)計(jì)了少先驗(yàn)情況下對(duì)離散狀態(tài)和觀測(cè)空間的濾波模型的逆濾波算法。

    總的來(lái)說,國(guó)外對(duì)于雷達(dá)對(duì)抗中的逆濾波技術(shù)研究處于起步階段,而國(guó)內(nèi)對(duì)該問題的研究較少。

    5.3 基于逆強(qiáng)化學(xué)習(xí)的內(nèi)隱決策行為推理

    逆強(qiáng)化學(xué)習(xí)則針對(duì)雷達(dá)系統(tǒng)的決策類行為。在決策行為中,通常雷達(dá)優(yōu)化特定的目標(biāo)函數(shù)實(shí)現(xiàn)最優(yōu)決策。偵察方通過逆強(qiáng)化學(xué)習(xí)算法,實(shí)現(xiàn)對(duì)對(duì)手優(yōu)化問題目標(biāo)函數(shù)的估計(jì)。

    對(duì)雷達(dá)而言,隨機(jī)優(yōu)化框架給雷達(dá)提供了在量測(cè)和環(huán)境演變預(yù)期存在不確定性情況下進(jìn)行決策的規(guī)范理論[38,40,42,87,204-205]。在隨機(jī)優(yōu)化理論框架下,先進(jìn)體制雷達(dá)通過在時(shí)間線上最優(yōu)化預(yù)先設(shè)定的目標(biāo)函數(shù)獲得最優(yōu)動(dòng)作策略。該策略將到當(dāng)前時(shí)刻所有可得狀態(tài)信息映射成下一時(shí)刻待執(zhí)行的最優(yōu)動(dòng)作、或所有待執(zhí)行動(dòng)作的概率分布。常用的隨機(jī)優(yōu)化模型包括馬爾可夫決策過程和部分可觀測(cè)馬爾可夫決策過程,被廣泛用于雷達(dá)領(lǐng)域[37-42]。對(duì)偵察方而言,則需要由表及里、由果溯因,從可觀測(cè)的認(rèn)知雷達(dá)和環(huán)境的“狀態(tài)-動(dòng)作”交互過程,反演出生成該交互序列的雷達(dá)隨機(jī)優(yōu)化過程(argmax過程)。

    對(duì)argmax 系統(tǒng)進(jìn)行逆向分析推知或估計(jì)其目標(biāo)函數(shù)屬于偏好學(xué)習(xí)范疇,目的是從一個(gè)智能體的選擇或者決定中推斷出他的偏好(Preference)和信念(Beliefs)。偏好學(xué)習(xí)已經(jīng)在社會(huì)科學(xué)[206-207],人工智能[208-210],經(jīng)濟(jì)學(xué)[211-212],自動(dòng)控制[213-214]等許多領(lǐng)域得到了研究。例如在計(jì)量經(jīng)濟(jì)學(xué)中,研究者通過結(jié)構(gòu)化估計(jì)(Structural estimation),從觀察到的人對(duì)工作和教育的選擇中推斷人對(duì)教育回報(bào)的信念,以及吸煙行為對(duì)健康結(jié)果的偏好等[211]。結(jié)構(gòu)化估計(jì)的開創(chuàng)性工作如John Rust[215-216],近期也有相關(guān)的綜述文章[211]。在控制論中,相應(yīng)的研究?jī)?nèi)容為逆最優(yōu)控制(Inverse optimal control)。

    在機(jī)器學(xué)習(xí)領(lǐng)域,偏好學(xué)習(xí)被稱為逆強(qiáng)化學(xué)習(xí),并已經(jīng)被廣泛用于不同的計(jì)劃和決策任務(wù)中[208-210]。真實(shí)世界中很多智能體實(shí)現(xiàn)任務(wù)的回報(bào)函數(shù)難以建模表征,但是這些任務(wù)大多存在較多專家示范經(jīng)驗(yàn)。IRL的目的則是從專家的示范行為中學(xué)習(xí)其潛在的回報(bào)函數(shù)。IRL的研究始于文獻(xiàn)[217],而后在文獻(xiàn)[209]中學(xué)者吳恩達(dá)首次正式提出IRL的概念。通過IRL可以借助其他智能體(或人)在完成特定任務(wù)時(shí)記錄的數(shù)據(jù)(稱為專家示范)估計(jì)或擬合出該智能體行為背后隱含的目標(biāo)函數(shù)(在強(qiáng)化學(xué)習(xí)中,目標(biāo)函數(shù)又稱為回報(bào)函數(shù))。然后基于該目標(biāo)函數(shù),構(gòu)建其他可以完成該任務(wù)的自動(dòng)化智能體。例如在自動(dòng)駕駛領(lǐng)域,研究者基于生活中大量可見易收集的司機(jī)駕駛軌跡數(shù)據(jù)構(gòu)建IRL 模型,而后從這些示范軌跡數(shù)據(jù)中學(xué)習(xí)示范專家關(guān)于駕駛?cè)蝿?wù)潛在的目標(biāo)函數(shù)。通過學(xué)習(xí)到的目標(biāo)函數(shù),可以指導(dǎo)得到具有和示范專家相同駕駛能力與偏好的智能體。已有IRL 研究中,示范專家和學(xué)習(xí)者均是合作關(guān)系,即學(xué)習(xí)者在反演分析時(shí),可以以合作的形式獲取示范專家感知結(jié)果和執(zhí)行動(dòng)作的相關(guān)信息。但即使在完全合作情況下的反演分析中,示范專家和學(xué)習(xí)者之間也存在如永久無(wú)法觀測(cè)到的異質(zhì)性(Permanent unobserved heterogeneity)、初始條件分布、刪失結(jié)果(Censored outcomes)和樣本選擇偏差、測(cè)量誤差、內(nèi)生性(Endogeneity)、模型辨識(shí)等問題。在非合作對(duì)抗條件下,還會(huì)引入由于視角、可觀測(cè)性差異帶來(lái)的新問題[211],使得對(duì)雷達(dá)的反演分析更加復(fù)雜與困難。上述偏好學(xué)習(xí)基本理論與方法可以給針對(duì)認(rèn)知雷達(dá)的非合作分析與雷達(dá)方隨機(jī)優(yōu)化過程反演提供有益思路,但無(wú)法直接應(yīng)用于對(duì)雷達(dá)的反演分析。

    在雷達(dá)對(duì)抗領(lǐng)域的反演研究方面,Vikram Krishnamurthy 于2020 年首次提出了對(duì)認(rèn)知智能雷達(dá)目標(biāo)函數(shù)進(jìn)行逆向反演分析的概念[84]。他們基于微觀經(jīng)濟(jì)學(xué)領(lǐng)域1954 年所提出的顯示偏好理論和Afriat 定理[218],對(duì)最大化其目標(biāo)函數(shù)的認(rèn)知雷達(dá)進(jìn)行目標(biāo)函數(shù)的反演估計(jì)。該文獻(xiàn)[84]是目前世界范圍內(nèi)首篇針對(duì)認(rèn)知雷達(dá)系統(tǒng)進(jìn)行逆強(qiáng)化學(xué)習(xí)的論文。基于顯示偏好理論與Afriat 定理[84],Vikram Krishnamurthy 和美國(guó)洛克希德·馬丁公司、美國(guó)陸軍研究局(Army research office)以及美國(guó)空軍科學(xué)研究局(Air force office of scientific research)在雷達(dá)及其反演對(duì)抗兩方面開展了一系列研究[82-85,219-220]。在對(duì)雷達(dá)逆向反演研究的理論基礎(chǔ)上,Vikram Krishnamurthy 近期還從雷達(dá)方研究了故意隱藏其認(rèn)知能力的雷達(dá)決策方法[219-220](即逆-逆強(qiáng)化學(xué)習(xí)算法,inverse-inverse reinforcement learning),使得偵察方無(wú)法從觀測(cè)的“狀態(tài)-動(dòng)作”序列準(zhǔn)確反演認(rèn)知雷達(dá)的目標(biāo)函數(shù),實(shí)現(xiàn)雷達(dá)策略層對(duì)偵察方的射頻隱身。隨著體系作戰(zhàn)的發(fā)展,雷達(dá)方往往采取組網(wǎng)的形式,通過設(shè)計(jì)博弈算法、均衡條件實(shí)現(xiàn)組網(wǎng)資源分配、協(xié)同等任務(wù)。Vikram Krishnamurthy針對(duì)雷達(dá)網(wǎng)之間存在的博弈關(guān)系,基于多智能體逆強(qiáng)化學(xué)習(xí)提出了對(duì)雷達(dá)網(wǎng)目標(biāo)函數(shù)的反演方法[221]。

    綜上所述,美國(guó)已率先開展了對(duì)認(rèn)知智能雷達(dá)的逆向反演研究,也已取得了相應(yīng)理論成果并嘗試在工程實(shí)踐中進(jìn)行應(yīng)用,但該部分的研究仍然處于起步階段。具體的,Vikram Krishnamurthy 等人已開展的研究均在顯示偏好理論與Afriat定理的框架下進(jìn)行,從偵察方視角對(duì)認(rèn)知雷達(dá)和電子偵察方雙方視角差異,以及雷達(dá)方信號(hào)處理方法與處理流程做了較強(qiáng)的先驗(yàn)信息可得性假設(shè),從而在面臨真實(shí)世界非合作強(qiáng)約束情況下的反演問題時(shí)具有較大的局限,需要從以下四個(gè)方面進(jìn)一步深入研究:

    1)他們假定對(duì)抗雙方均能完美觀測(cè)到對(duì)方的動(dòng)作和狀態(tài),這個(gè)假設(shè)在真實(shí)非合作環(huán)境中不成立,需要研究雙方視角均存在部分可觀測(cè)情況下的方法。

    2)他們要求認(rèn)知雷達(dá)的優(yōu)化目標(biāo)函數(shù)為單調(diào)函數(shù)且偵察方已知該目標(biāo)函數(shù)所屬的函數(shù)族,從而偵察方僅需要根據(jù)觀測(cè)估計(jì)給定函數(shù)結(jié)構(gòu)情況下的函數(shù)參數(shù),這個(gè)假設(shè)在真實(shí)認(rèn)知雷達(dá)研究中也難以滿足,反演方法需要適應(yīng)任意結(jié)構(gòu)與參數(shù)均未知且復(fù)雜的目標(biāo)函數(shù)。

    3)他們要求認(rèn)知雷達(dá)的行為必須為嚴(yán)格最優(yōu),即目標(biāo)函數(shù)存在唯一全局最優(yōu)解且該解能被雷達(dá)達(dá)到,這在真實(shí)認(rèn)知雷達(dá)研究中也無(wú)法滿足。如認(rèn)知雷達(dá)的目標(biāo)函數(shù)可能非凸,從而嚴(yán)格最優(yōu)解無(wú)法取得;或者凸目標(biāo)函數(shù)通過數(shù)值優(yōu)化得到的? 次優(yōu)解(? suboptimal),也不滿足他們提出的反演算法對(duì)嚴(yán)格最優(yōu)的要求。因而反演方法要能解決最優(yōu)解集合(Optimal set)與內(nèi)隱目標(biāo)函數(shù)集合(Objective function set)之間存在的集值映射[222]情況。

    4)他們考慮認(rèn)知雷達(dá)基于近視性的方式優(yōu)化其目標(biāo)函數(shù),未考慮對(duì)環(huán)境的預(yù)見性(Anticipation),難以適應(yīng)不同體制、型號(hào)、智能水平以及認(rèn)知推理深度等認(rèn)知雷達(dá)多樣性帶來(lái)的復(fù)雜而廣泛的反演問題,因而非合作偵察分析模型和反演方法需要具有普適性和泛化能力,適應(yīng)各種未知且復(fù)雜的認(rèn)知雷達(dá)技術(shù)具體實(shí)現(xiàn)。

    國(guó)內(nèi)對(duì)先進(jìn)體制雷達(dá)的偵察對(duì)抗研究大多聚焦于對(duì)雷達(dá)行為動(dòng)作進(jìn)行感知識(shí)別,能夠發(fā)掘偵收信號(hào)和雷達(dá)工作機(jī)理之間的相關(guān)性,但實(shí)現(xiàn)雷達(dá)行為動(dòng)作形成策略的因果關(guān)系反演研究還少有涉及[223-224]。本團(tuán)隊(duì)在文獻(xiàn)[80]中初步探索了馬爾可夫決策過程框架下的反演估計(jì)問題,提出基于最大熵深度IRL 的雷達(dá)回報(bào)函數(shù)反演方法,交替優(yōu)化強(qiáng)化學(xué)習(xí)算法和最大似然回報(bào)函數(shù)估計(jì),以盡可能少的先驗(yàn)信息需求實(shí)現(xiàn)回報(bào)函數(shù)估計(jì)。

    6 多功能雷達(dá)未來(lái)行為的預(yù)測(cè)

    對(duì)先進(jìn)體制雷達(dá)未來(lái)時(shí)刻可能采取的雷達(dá)行為動(dòng)作進(jìn)行推理預(yù)測(cè),對(duì)于干擾方實(shí)施干擾對(duì)抗具有重要意義。根據(jù)識(shí)別或推理的結(jié)果,可以開展多功能雷達(dá)行為的預(yù)測(cè)。

    6.1 行為預(yù)測(cè)的研究路線分類

    考慮雷達(dá)脈沖或符號(hào)序列數(shù)據(jù)A={a1,a2,…,aT|ai∈RD},D為行為對(duì)應(yīng)的特征維度,T為時(shí)間序列的長(zhǎng)度。未來(lái)行為預(yù)測(cè)的任務(wù)是根據(jù)歷史行為序列At0:c={at0,at0+2,…,ac}預(yù)測(cè)Ac:T={ac,ac+1,…,aT},其中At0:c為預(yù)測(cè)的上下文窗數(shù)據(jù),Ac:T為待預(yù)測(cè)的數(shù)據(jù)。預(yù)測(cè)任務(wù)的目的是最大化p(Ac:T|At0:c)。

    預(yù)測(cè)任務(wù)方法設(shè)計(jì)與雷達(dá)的決策行為有關(guān)。將預(yù)測(cè)任務(wù)方法劃分為表7 所示兩類,原理示意圖如圖20所示。第一種方法在經(jīng)濟(jì)學(xué)領(lǐng)域,稱為“Reduced form estimation”[225-226],基于歷史數(shù)據(jù)對(duì)未來(lái)數(shù)據(jù)進(jìn)行趨勢(shì)外推。第二種方法則稱為“Structural estimation”[211],學(xué)習(xí)數(shù)據(jù)背后對(duì)應(yīng)決策問題的結(jié)構(gòu)化參數(shù)(如回報(bào)函數(shù)),然后基于學(xué)習(xí)到的結(jié)構(gòu)化參數(shù),再次求解決策問題,實(shí)現(xiàn)預(yù)測(cè)。

    表7 已有MFR行為預(yù)測(cè)研究的分類Tab.7 Categorization of existing MFR behavioral prediction studies

    圖20 行為預(yù)測(cè)方法示意Fig.20 Schematic diagram of behavior prediction methods

    6.2 基于識(shí)別結(jié)果的直接預(yù)測(cè)

    基于識(shí)別結(jié)果的直接預(yù)測(cè),需要學(xué)習(xí)待預(yù)測(cè)數(shù)據(jù)的聯(lián)合條件概率分布p(Ac:T|At0:c)。此外在預(yù)測(cè)時(shí),還可能存在一些輔助預(yù)測(cè)的信息,記為St0:T,該輔助信息需要盡可能地包括所有可能影響預(yù)測(cè)結(jié)果的信息。此時(shí)的預(yù)測(cè)任務(wù)需要學(xué)習(xí)p(Ac:T|At0:c,St0:T)。

    目前相關(guān)研究的主要對(duì)象為多功能雷達(dá),基于歷史雷達(dá)行為預(yù)測(cè)未來(lái)時(shí)刻的雷達(dá)行為。如國(guó)防科技大學(xué)的歐健[50,154]針對(duì)多功能雷達(dá)行為預(yù)測(cè),研究了基于PSR 的多功能雷達(dá)信號(hào)預(yù)測(cè)。在他的研究中,將MFR 的信號(hào)建模成離散時(shí)間動(dòng)態(tài)系統(tǒng),基于全概率公式實(shí)現(xiàn)對(duì)MFR 信號(hào)的預(yù)測(cè)。為了實(shí)現(xiàn)多步預(yù)測(cè),他將PSR 和反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)結(jié)合,構(gòu)建PSR-BP 神經(jīng)網(wǎng)絡(luò)模型,能夠把復(fù)雜度較高的計(jì)算部分留在離線訓(xùn)練階段,以保證算法在線預(yù)測(cè)的實(shí)時(shí)性。以“水星”MFR 數(shù)據(jù)為例,在預(yù)測(cè)步數(shù)較少、雷達(dá)字識(shí)別錯(cuò)誤率較低、訓(xùn)練數(shù)據(jù)充足的條件下PSR-BP 模型取得了很好的預(yù)測(cè)性能。航天工程大學(xué)的陳維高等人[227]將載機(jī)機(jī)動(dòng)信息與常規(guī)偵收參數(shù)共同作為預(yù)測(cè)特征集,利用D-S 證據(jù)理論融合MFR各個(gè)狀態(tài)之間的轉(zhuǎn)移概率,實(shí)現(xiàn)最終的狀態(tài)預(yù)測(cè)。機(jī)動(dòng)信息即為前文所述的預(yù)測(cè)輔助信息。電子科技大學(xué)的代策宇[160]基于HMM 模型,對(duì)下一時(shí)刻雷達(dá)狀態(tài)進(jìn)行預(yù)測(cè),對(duì)多功能雷達(dá)能取得不錯(cuò)的預(yù)測(cè)效果。該方法中預(yù)測(cè)準(zhǔn)確率隨著歷史雷達(dá)行為序列長(zhǎng)度的增加逐漸增加,然后趨于平穩(wěn)。上述研究從歷史數(shù)據(jù)中學(xué)習(xí)構(gòu)建當(dāng)前時(shí)刻行為和歷史行為的各種假定馬爾可夫階次下的條件概率模型,對(duì)于典型的“水星”MFR能夠取得不錯(cuò)的效果。

    深度學(xué)習(xí)算法由于其具備自動(dòng)提取特征、表征非線性映射關(guān)系、表征任意階次時(shí)間序列關(guān)系的能力也被應(yīng)用到多功能雷達(dá)行為預(yù)測(cè)中,如德國(guó)的研究者Sabine Apfeld 研究了長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)和馬爾可夫鏈對(duì)多功能雷達(dá)各個(gè)層次資源管理操作的預(yù)測(cè)能力[69,228]。結(jié)果表明,LSTM 在處理具有多種可能的復(fù)雜行為時(shí)性能和魯棒性均優(yōu)于傳統(tǒng)馬爾可夫鏈預(yù)測(cè)方法。西安電子科技大學(xué)的侯超[229]將CNN 與LSTM 結(jié)構(gòu)結(jié)合,提出了CNN-LSTM 混合網(wǎng)絡(luò)用于多功能雷達(dá)行為預(yù)測(cè),相較于傳統(tǒng)的LSTM 網(wǎng)絡(luò)取得了更好的預(yù)測(cè)效果。西安電子科技大學(xué)的惠曉龍[230]比較了不同的RNN 結(jié)構(gòu)對(duì)多功能雷達(dá)行為預(yù)測(cè)的影響,表明GRU 網(wǎng)絡(luò)無(wú)論是從參數(shù)規(guī)模還是訓(xùn)練用時(shí)上都明顯優(yōu)于LSTM 網(wǎng)絡(luò)。西安電子科技大學(xué)的田衛(wèi)東[231]進(jìn)一步,結(jié)合一維CNN(1D-CNN)和雙向GRU(Bi-GRU)網(wǎng)絡(luò)結(jié)構(gòu)各自的優(yōu)勢(shì),提出了1D-CNN-Bi-GRU 網(wǎng)絡(luò),將雷達(dá)時(shí)間序列通過1D-CNN 提取信息再連入雙向GRU 網(wǎng)絡(luò)中得到預(yù)測(cè)結(jié)果,降低了傳統(tǒng)CNN特征提取的計(jì)算復(fù)雜度,并相較于Bi-GRU 網(wǎng)絡(luò)取得了更好的預(yù)測(cè)效果。上述方法研究的對(duì)象均為符號(hào)層元素,如“雷達(dá)字”。國(guó)防科技大學(xué)的袁碩等人[232]則利用RNN 預(yù)測(cè)脈沖序列未來(lái)時(shí)刻的PRI 值。他比較了RNN 與其他不同結(jié)構(gòu)模型,以及RNN 的不同變體之間的預(yù)測(cè)效果。結(jié)果表明LSTM 網(wǎng)絡(luò)具有最佳的預(yù)測(cè)性能和魯棒性。

    上述方法對(duì)于多功能雷達(dá)能夠取得不錯(cuò)的效果。因?yàn)槎喙δ芾走_(dá)雖然靈活捷變,但無(wú)論是脈沖序列還是低層符號(hào)序列,往往都對(duì)應(yīng)預(yù)先設(shè)計(jì)的模板,人為設(shè)計(jì)所體現(xiàn)出的規(guī)律性較強(qiáng)(如“水星”雷達(dá)一個(gè)雷達(dá)命令對(duì)應(yīng)四個(gè)雷達(dá)字模板)。因而在序列形式上具有較強(qiáng)的規(guī)律性可供預(yù)測(cè)算法學(xué)習(xí)。

    對(duì)先進(jìn)體制雷達(dá)行為的預(yù)測(cè)本質(zhì)上是一個(gè)求解因果交互過程的問題[233]。即多功能雷達(dá)系統(tǒng)行為受環(huán)境影響,而認(rèn)知多功能雷達(dá)行為動(dòng)作更是和環(huán)境息息相關(guān)。因而若僅依據(jù)歷史行為預(yù)測(cè)未來(lái)行為,會(huì)發(fā)生一定的預(yù)測(cè)偏差。本團(tuán)隊(duì)在文獻(xiàn)[80]中將雷達(dá)動(dòng)作序列視為隨機(jī)變量序列,構(gòu)建了雷達(dá)動(dòng)作和環(huán)境狀態(tài)之間的概率圖模型。在三種不同的雷達(dá)-環(huán)境交互情況下構(gòu)建了對(duì)應(yīng)的圖模型。其中最簡(jiǎn)化的概率圖模型僅考慮當(dāng)前動(dòng)作和歷史動(dòng)作之間的條件概率,也就是目前已有的預(yù)測(cè)方法主要考慮的模型。第二個(gè)模型考慮當(dāng)前動(dòng)作和歷史動(dòng)作以及環(huán)境狀態(tài)之間的條件概率。最復(fù)雜的模型則認(rèn)為雷達(dá)和環(huán)境之間存在博弈,雷達(dá)和環(huán)境之間是一個(gè)互相影響的因果交互過程。在已有研究的基礎(chǔ)上,針對(duì)第二個(gè)概率圖模型研究了多功能雷達(dá)或者認(rèn)知雷達(dá)的動(dòng)作預(yù)測(cè)問題。借助行為克隆原理[234-235]與深度時(shí)序?qū)W習(xí)模型的發(fā)展[122,236-237],對(duì)概率圖模型進(jìn)行簡(jiǎn)潔有效的參數(shù)化,從而表征輸入和輸出之間的任意概率分布關(guān)系。而對(duì)第三個(gè)模型,由于雷達(dá)和環(huán)境(或偵察方)之間的博弈研究,無(wú)論是雷達(dá)方還是偵察對(duì)抗方視角,均處于不斷研究中,尚無(wú)典型明確的范式。

    6.3 基于推理結(jié)果的演化預(yù)測(cè)

    此類預(yù)測(cè)研究在電子偵察領(lǐng)域,主要是Vikram Krishnamurthy在顯示偏好的框架下進(jìn)行了嘗試[84]。方法的核心在于對(duì)優(yōu)化問題的結(jié)構(gòu)化參數(shù)估計(jì)?;诠烙?jì)得到的結(jié)構(gòu)化參數(shù),以及對(duì)環(huán)境狀態(tài)未來(lái)的演變預(yù)期對(duì)雷達(dá)行為未來(lái)的演變情況進(jìn)行預(yù)測(cè)。

    相較于基于識(shí)別結(jié)果的直接預(yù)測(cè)方法[235,238],基于推理結(jié)果的演化預(yù)測(cè)具有許多好處:1)推理得到的回報(bào)函數(shù),相較于直接學(xué)習(xí)到的行為策略,在表征雷達(dá)的行為規(guī)律與偏好方面要更簡(jiǎn)潔(Succinct)和緊湊(Compact);2)相較于直接學(xué)習(xí)到的策略,推理得到的回報(bào)函數(shù)可遷移性更好,對(duì)環(huán)境、動(dòng)作、目標(biāo)等的噪聲適應(yīng)性也更好。但相應(yīng)的,由于需要對(duì)數(shù)據(jù)中隱含的回報(bào)函數(shù)進(jìn)行推理,所需要的計(jì)算復(fù)雜度高,問題非凸性和不適定性帶來(lái)的求解難度也相應(yīng)更大。因此需要根據(jù)實(shí)際任務(wù)需求、數(shù)據(jù)可得性、數(shù)據(jù)質(zhì)量、計(jì)算資源等進(jìn)行權(quán)衡,在兩種預(yù)測(cè)方法中選取適合任務(wù)的方法。

    7 未來(lái)研究重點(diǎn)展望

    對(duì)先進(jìn)體制多功能雷達(dá)行為的建模與識(shí)別方法是電子偵察與對(duì)抗領(lǐng)域重點(diǎn)和難點(diǎn)研究問題。盡管目前眾多學(xué)者已圍繞上述研究熱點(diǎn)研究出一系列成果,但電子對(duì)抗和電子反對(duì)抗永遠(yuǎn)是一個(gè)此消彼長(zhǎng)、相互不斷發(fā)展的過程,了解和掌握先進(jìn)多功能雷達(dá)資源管理基本原理和方法,跟蹤雷達(dá)方資源管理研究的最新進(jìn)展和趨勢(shì),對(duì)偵察方動(dòng)態(tài)調(diào)整自身策略、研究方向和研究側(cè)重具有重要意義。目前仍然存在許多需要繼續(xù)研究改善的地方,主要包括以下幾個(gè)方面:

    (1)先進(jìn)體制多功能雷達(dá)系統(tǒng)行為建模

    需要構(gòu)建更好的非合作行為表征數(shù)學(xué)模型,在模型的表征、推理與學(xué)習(xí)設(shè)計(jì)上均需要盡可能全面地考慮電子偵察與對(duì)抗實(shí)際任務(wù)中所面臨的問題(如模型可泛化性、少先驗(yàn)、無(wú)先驗(yàn)情況下模型的魯棒性、未知?jiǎng)討B(tài)環(huán)境適應(yīng)性等),進(jìn)一步推動(dòng)研究從理論研究走向?qū)嶋H應(yīng)用,解決實(shí)際電子偵察問題。

    (2)電磁域通用大模型方法

    在人工智能領(lǐng)域,以ChatGPT、文心一言等為代表的大模型正在掀起研究熱潮。一個(gè)通用大模型能夠解決多個(gè)下游任務(wù),模型能力也相較于傳統(tǒng)專用模型得到顯著提升。在電磁領(lǐng)域研究相應(yīng)的垂直領(lǐng)域大模型方法,可打通各個(gè)電子偵察任務(wù)環(huán)節(jié),提升模型通用性、魯棒性和泛化能力。

    (3)快速準(zhǔn)確的逆信號(hào)處理與回報(bào)函數(shù)反演方法

    具備認(rèn)知能力的雷達(dá)處于不斷發(fā)展的過程,對(duì)抗雙方采用的濾波和逆濾波算法、隨機(jī)優(yōu)化和逆強(qiáng)化學(xué)習(xí)算法本身紛繁復(fù)雜。在雷達(dá)方與對(duì)抗方的可觀測(cè)性、智能性、交互性等方面又衍生出許多新的問題。需要構(gòu)建出更符合真實(shí)情況的模型和快速迭代求解方法,以獲得準(zhǔn)確、實(shí)時(shí)的逆向推理結(jié)果。

    (4)基于行為博弈理論的先進(jìn)雷達(dá)高效對(duì)抗方法

    無(wú)論是對(duì)先進(jìn)體制雷達(dá)的行為識(shí)別還是推理預(yù)測(cè),都是為認(rèn)知電子戰(zhàn)“感知-判斷-決策-行動(dòng)”環(huán)路(Observation-Orientation-Decision-Action,OODA)中的決策做服務(wù)。如根據(jù)感知識(shí)別結(jié)果,可直接實(shí)現(xiàn)對(duì)未來(lái)雷達(dá)行為動(dòng)作的“精準(zhǔn)預(yù)測(cè)”,支撐后續(xù)精準(zhǔn)干擾與博弈對(duì)抗;另一方面可通過有意“調(diào)制”我方干擾動(dòng)作的未來(lái)轉(zhuǎn)移,實(shí)現(xiàn)對(duì)雷達(dá)方動(dòng)作策略的“調(diào)制”,間接“控制”雷達(dá)未來(lái)采取的行為動(dòng)作朝我方預(yù)期的方向演變,實(shí)現(xiàn)對(duì)電磁空間的認(rèn)知與智能控制。因此,結(jié)合感知識(shí)別與行為博弈理論,在多階段、多層次、多維度、多智能水平和多認(rèn)知推理深度的動(dòng)態(tài)交互/博弈過程中,生成最優(yōu)干擾策略,以智勝智。

    (5)電子偵察任務(wù)和方法的理論誤差分析

    從公開發(fā)表的文獻(xiàn)看,目前還缺乏對(duì)電子偵察任務(wù)系統(tǒng)和深入的數(shù)學(xué)理論框架研究。有了好的數(shù)學(xué)模型和理論基礎(chǔ),對(duì)各個(gè)電子對(duì)抗任務(wù)就可以研究對(duì)應(yīng)的理論誤差分析方法,從數(shù)學(xué)理論上對(duì)問題進(jìn)行深入分析,推導(dǎo)各個(gè)問題和方法的理論邊界,實(shí)現(xiàn)電子偵察系統(tǒng)在數(shù)學(xué)理論上的閉環(huán)。

    (6)通用行為數(shù)據(jù)集及方法性能基準(zhǔn)比較

    目前在雷達(dá)電子對(duì)抗領(lǐng)域,尚缺乏受到廣泛認(rèn)可、具有代表意義、可用于定量評(píng)價(jià)各類型算法性能的公開的仿真或采集數(shù)據(jù)集,因而本文暫未對(duì)各文獻(xiàn)算法進(jìn)行復(fù)現(xiàn)并進(jìn)行算法定量比較。上述包括整體性或任務(wù)特定數(shù)據(jù)集的建立、以及各文獻(xiàn)算法在各個(gè)問題下的定量性能基準(zhǔn)比較對(duì)研究者和實(shí)踐者將具有重要意義。

    8 結(jié)論

    隨著計(jì)算智能、優(yōu)化理論、軟件自定義及硬件可重構(gòu)系統(tǒng)的不斷發(fā)展,先進(jìn)體制雷達(dá)系統(tǒng)的自由度不斷提升,使得雷達(dá)行為具有可供優(yōu)化的控制參數(shù)數(shù)目多、參數(shù)空間大等特點(diǎn)。本文圍繞新的先進(jìn)體制多功能雷達(dá)系統(tǒng)行為建模表征研究、適應(yīng)先進(jìn)多功能雷達(dá)復(fù)雜靈活信號(hào)形式的系統(tǒng)行為識(shí)別、推理和預(yù)測(cè)研究展開綜述,并基于已有的研究成果,針對(duì)當(dāng)前研究中存在的不足,從系統(tǒng)行為模型建模表征、電磁域通用大模型方法、快速準(zhǔn)確的逆信號(hào)處理與回報(bào)函數(shù)反演方法、基于行為博弈理論的先進(jìn)雷達(dá)高效對(duì)抗方法、電子偵察任務(wù)和方法的理論誤差分析、通用行為數(shù)據(jù)集及方法性能基準(zhǔn)比較六個(gè)方面進(jìn)行了展望。希望本文能夠給相關(guān)研究者一些啟發(fā),加強(qiáng)在先進(jìn)體制雷達(dá)行為建模與識(shí)別方法方面的深入研究,博采眾長(zhǎng),提高算法的實(shí)時(shí)性、魯棒性和泛化能力,以進(jìn)一步推動(dòng)算法技術(shù)在實(shí)際戰(zhàn)場(chǎng)復(fù)雜電磁環(huán)境下的應(yīng)用。

    猜你喜歡
    符號(hào)模型
    一半模型
    學(xué)符號(hào),比多少
    幼兒園(2021年6期)2021-07-28 07:42:14
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
    “+”“-”符號(hào)的由來(lái)
    變符號(hào)
    3D打印中的模型分割與打包
    FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
    倍圖的全符號(hào)點(diǎn)控制數(shù)
    圖的有效符號(hào)邊控制數(shù)
    九色成人免费人妻av| 亚洲精品乱码久久久v下载方式| 国产免费又黄又爽又色| 欧美区成人在线视频| 中文欧美无线码| 国产亚洲欧美精品永久| 国产成人精品一,二区| 国产精品99久久久久久久久| a级毛片在线看网站| 国产欧美另类精品又又久久亚洲欧美| 国产精品久久久久久av不卡| 国产精品久久久久久久久免| 伦精品一区二区三区| 日韩av在线免费看完整版不卡| 国产精品国产三级国产av玫瑰| av国产精品久久久久影院| 在线免费观看不下载黄p国产| 久久国产精品男人的天堂亚洲 | 国产91av在线免费观看| 久久久久久久久久成人| 2022亚洲国产成人精品| 欧美少妇被猛烈插入视频| 色婷婷久久久亚洲欧美| 免费黄频网站在线观看国产| 精品国产露脸久久av麻豆| 久久久久精品久久久久真实原创| av国产精品久久久久影院| 久久精品国产亚洲网站| 午夜视频国产福利| 日韩一本色道免费dvd| 777米奇影视久久| 一本久久精品| 久久久国产欧美日韩av| 久久国产精品大桥未久av | 观看免费一级毛片| 精品少妇黑人巨大在线播放| 久久人妻熟女aⅴ| 婷婷色麻豆天堂久久| av福利片在线| 777米奇影视久久| 高清欧美精品videossex| 涩涩av久久男人的天堂| 熟女电影av网| 丰满人妻一区二区三区视频av| 好男人视频免费观看在线| 久久久久久久大尺度免费视频| 欧美+日韩+精品| 免费人妻精品一区二区三区视频| 成人18禁高潮啪啪吃奶动态图 | 中文字幕亚洲精品专区| 欧美激情极品国产一区二区三区 | 日日啪夜夜撸| 日韩 亚洲 欧美在线| 国产成人aa在线观看| 欧美丝袜亚洲另类| 成年av动漫网址| 大又大粗又爽又黄少妇毛片口| 亚洲精华国产精华液的使用体验| 亚洲国产日韩一区二区| 黑丝袜美女国产一区| 美女大奶头黄色视频| 亚洲精品,欧美精品| 少妇人妻久久综合中文| 亚洲精品乱久久久久久| 9色porny在线观看| av国产久精品久网站免费入址| 亚洲国产色片| 国产欧美日韩一区二区三区在线 | 黄色日韩在线| 天堂中文最新版在线下载| 日韩欧美 国产精品| 国产亚洲5aaaaa淫片| 亚洲美女黄色视频免费看| 国产极品粉嫩免费观看在线 | 国产精品一区www在线观看| 亚洲四区av| 亚洲精品456在线播放app| 成人综合一区亚洲| 日韩,欧美,国产一区二区三区| 久久毛片免费看一区二区三区| 久久97久久精品| 偷拍熟女少妇极品色| 亚洲情色 制服丝袜| 免费av中文字幕在线| 美女福利国产在线| 少妇 在线观看| av线在线观看网站| 人妻一区二区av| 高清午夜精品一区二区三区| av播播在线观看一区| 十分钟在线观看高清视频www | 春色校园在线视频观看| 在线观看www视频免费| 国产免费又黄又爽又色| 三级经典国产精品| 国产极品天堂在线| 有码 亚洲区| 欧美xxxx性猛交bbbb| 日韩在线高清观看一区二区三区| 少妇人妻一区二区三区视频| 久久韩国三级中文字幕| 国产高清三级在线| 亚洲av欧美aⅴ国产| av一本久久久久| 久久精品久久久久久久性| 不卡视频在线观看欧美| 一区二区av电影网| 亚洲国产最新在线播放| 亚洲三级黄色毛片| 汤姆久久久久久久影院中文字幕| 伦理电影免费视频| 老司机影院成人| 男女边吃奶边做爰视频| 十分钟在线观看高清视频www | 久久精品久久精品一区二区三区| 国产黄色视频一区二区在线观看| 亚洲精品国产av蜜桃| 欧美老熟妇乱子伦牲交| 一区二区三区精品91| 久久久精品94久久精品| 精品一区二区三区视频在线| av线在线观看网站| 久久精品熟女亚洲av麻豆精品| 免费观看av网站的网址| 高清午夜精品一区二区三区| 一区二区av电影网| 久久99热这里只频精品6学生| 麻豆成人午夜福利视频| 熟妇人妻不卡中文字幕| 建设人人有责人人尽责人人享有的| 久久久久久久大尺度免费视频| 夜夜爽夜夜爽视频| av天堂中文字幕网| 国产一区二区三区av在线| 少妇的逼好多水| 六月丁香七月| 亚洲av综合色区一区| 亚洲丝袜综合中文字幕| 精品国产露脸久久av麻豆| 久久精品国产自在天天线| 美女xxoo啪啪120秒动态图| 男人爽女人下面视频在线观看| 国产乱人偷精品视频| 国产精品一区二区三区四区免费观看| av播播在线观看一区| 亚洲欧洲精品一区二区精品久久久 | 亚洲av二区三区四区| 人妻少妇偷人精品九色| 18禁动态无遮挡网站| 老女人水多毛片| 99国产精品免费福利视频| 精品人妻偷拍中文字幕| 草草在线视频免费看| av在线播放精品| 在线观看人妻少妇| 亚洲激情五月婷婷啪啪| av卡一久久| 国产日韩欧美在线精品| av在线观看视频网站免费| 男男h啪啪无遮挡| 午夜影院在线不卡| 91aial.com中文字幕在线观看| 国产精品久久久久久av不卡| 午夜免费观看性视频| 欧美精品一区二区免费开放| 午夜福利影视在线免费观看| 亚洲精品一二三| 久久久久精品久久久久真实原创| 丝袜脚勾引网站| 国产精品99久久久久久久久| 黑人高潮一二区| 三级国产精品片| 看十八女毛片水多多多| 亚洲内射少妇av| 人妻系列 视频| 欧美最新免费一区二区三区| 欧美少妇被猛烈插入视频| 在线亚洲精品国产二区图片欧美 | av免费观看日本| 亚洲欧美清纯卡通| 国产毛片在线视频| 丰满人妻一区二区三区视频av| 一级黄片播放器| 久久久国产精品麻豆| 777米奇影视久久| 超碰97精品在线观看| .国产精品久久| 国国产精品蜜臀av免费| 丝瓜视频免费看黄片| 亚洲av欧美aⅴ国产| 亚洲欧美日韩卡通动漫| h视频一区二区三区| 观看av在线不卡| 国产精品熟女久久久久浪| 在线精品无人区一区二区三| 亚洲av福利一区| 成人二区视频| 纵有疾风起免费观看全集完整版| 久久6这里有精品| 国产免费又黄又爽又色| 日韩中字成人| 黄色视频在线播放观看不卡| 女性生殖器流出的白浆| 成人影院久久| av在线老鸭窝| 五月伊人婷婷丁香| 亚洲欧美中文字幕日韩二区| 久久久国产精品麻豆| 国产精品欧美亚洲77777| 婷婷色av中文字幕| 天天操日日干夜夜撸| 91在线精品国自产拍蜜月| 大又大粗又爽又黄少妇毛片口| 精华霜和精华液先用哪个| 日韩亚洲欧美综合| 久久久久国产网址| av一本久久久久| av黄色大香蕉| 亚洲天堂av无毛| 国内精品宾馆在线| 精品酒店卫生间| 免费av中文字幕在线| av线在线观看网站| av播播在线观看一区| 2021少妇久久久久久久久久久| 亚洲国产精品999| 桃花免费在线播放| 久热久热在线精品观看| 久久久亚洲精品成人影院| 午夜福利视频精品| 国产精品不卡视频一区二区| 国产欧美另类精品又又久久亚洲欧美| 在线亚洲精品国产二区图片欧美 | 久久久久人妻精品一区果冻| 日本91视频免费播放| 久久99蜜桃精品久久| 欧美 亚洲 国产 日韩一| 久久久久久久久久成人| 国产亚洲午夜精品一区二区久久| 新久久久久国产一级毛片| 欧美精品一区二区免费开放| 精品人妻熟女av久视频| 欧美日韩综合久久久久久| 青春草亚洲视频在线观看| 亚洲精品中文字幕在线视频 | 蜜臀久久99精品久久宅男| 国产精品国产av在线观看| 亚洲性久久影院| 亚洲欧美精品自产自拍| 国产视频首页在线观看| 婷婷色av中文字幕| 夫妻性生交免费视频一级片| 免费不卡的大黄色大毛片视频在线观看| av国产久精品久网站免费入址| 中文字幕久久专区| 69精品国产乱码久久久| 人妻人人澡人人爽人人| 日韩成人伦理影院| 十分钟在线观看高清视频www | 精品一品国产午夜福利视频| 最新的欧美精品一区二区| 国产av国产精品国产| 亚洲成人一二三区av| 十八禁网站网址无遮挡 | 国产91av在线免费观看| 亚洲欧美精品自产自拍| 激情五月婷婷亚洲| 狠狠精品人妻久久久久久综合| 日韩熟女老妇一区二区性免费视频| 免费不卡的大黄色大毛片视频在线观看| 久久精品夜色国产| 不卡视频在线观看欧美| www.色视频.com| 插阴视频在线观看视频| 免费看不卡的av| 又大又黄又爽视频免费| 国产精品熟女久久久久浪| 亚洲人成网站在线观看播放| 午夜日本视频在线| 久久ye,这里只有精品| 久久国内精品自在自线图片| 男女无遮挡免费网站观看| 午夜日本视频在线| 久久97久久精品| 乱码一卡2卡4卡精品| 欧美精品人与动牲交sv欧美| 久久综合国产亚洲精品| 精品99又大又爽又粗少妇毛片| 看十八女毛片水多多多| 黑人高潮一二区| 久久久久国产精品人妻一区二区| 亚洲性久久影院| 亚洲美女视频黄频| 高清欧美精品videossex| 少妇被粗大的猛进出69影院 | 欧美日韩av久久| 尾随美女入室| 成人国产麻豆网| 老司机亚洲免费影院| 久久av网站| 日日撸夜夜添| 一级黄片播放器| 久久女婷五月综合色啪小说| 国产国拍精品亚洲av在线观看| 自线自在国产av| 国产精品无大码| 狂野欧美激情性bbbbbb| 22中文网久久字幕| 久久久久精品性色| 男女免费视频国产| 亚洲va在线va天堂va国产| 国产白丝娇喘喷水9色精品| 午夜免费鲁丝| 高清视频免费观看一区二区| 99九九线精品视频在线观看视频| 欧美高清成人免费视频www| 国产男女内射视频| 成年女人在线观看亚洲视频| 大片电影免费在线观看免费| tube8黄色片| 少妇人妻久久综合中文| 精品亚洲乱码少妇综合久久| 99久久精品热视频| 亚洲精品乱码久久久v下载方式| 观看av在线不卡| 另类精品久久| 黄片无遮挡物在线观看| 免费看av在线观看网站| 国产精品无大码| 99热这里只有是精品在线观看| 天天操日日干夜夜撸| 亚洲av免费高清在线观看| 国产av精品麻豆| 嫩草影院入口| 国产成人精品福利久久| 日日爽夜夜爽网站| 女人久久www免费人成看片| 校园人妻丝袜中文字幕| 亚洲在久久综合| 国产精品一区二区在线不卡| 97超碰精品成人国产| 欧美国产精品一级二级三级 | 在线观看国产h片| 亚洲人成网站在线观看播放| 国产高清国产精品国产三级| 日韩成人伦理影院| 久久人人爽av亚洲精品天堂| 亚洲国产精品999| 久久午夜综合久久蜜桃| 日韩成人伦理影院| 少妇裸体淫交视频免费看高清| 欧美老熟妇乱子伦牲交| 久久久久久久久大av| 免费在线观看成人毛片| 亚洲成色77777| 欧美国产精品一级二级三级 | 3wmmmm亚洲av在线观看| 狂野欧美白嫩少妇大欣赏| 国产黄片美女视频| 国产亚洲午夜精品一区二区久久| 亚洲av不卡在线观看| h日本视频在线播放| av又黄又爽大尺度在线免费看| 亚洲av综合色区一区| 国产成人精品久久久久久| 美女xxoo啪啪120秒动态图| 国产亚洲av片在线观看秒播厂| 男人舔奶头视频| 日韩欧美精品免费久久| 91精品一卡2卡3卡4卡| 国产成人免费观看mmmm| 热re99久久精品国产66热6| av.在线天堂| 校园人妻丝袜中文字幕| 男人添女人高潮全过程视频| 一区二区av电影网| 一级黄片播放器| 精品国产露脸久久av麻豆| 一二三四中文在线观看免费高清| h日本视频在线播放| 美女内射精品一级片tv| 夜夜看夜夜爽夜夜摸| 一本大道久久a久久精品| 成年美女黄网站色视频大全免费 | 免费少妇av软件| 在线观看三级黄色| 久久这里有精品视频免费| 中国三级夫妇交换| 亚洲精品国产av蜜桃| 日本av免费视频播放| 久久精品久久久久久久性| 午夜福利在线观看免费完整高清在| 国产黄片视频在线免费观看| 伦理电影大哥的女人| 18禁在线无遮挡免费观看视频| 黄色日韩在线| 亚洲av免费高清在线观看| 两个人的视频大全免费| 在线免费观看不下载黄p国产| 国产亚洲5aaaaa淫片| 免费看av在线观看网站| 日韩不卡一区二区三区视频在线| 老女人水多毛片| 自拍欧美九色日韩亚洲蝌蚪91 | 亚洲欧美日韩卡通动漫| 99精国产麻豆久久婷婷| 大香蕉97超碰在线| 91久久精品电影网| 99热全是精品| 国产熟女午夜一区二区三区 | 国产精品一区二区在线观看99| 精品卡一卡二卡四卡免费| 精品国产一区二区三区久久久樱花| 国产在视频线精品| 美女大奶头黄色视频| 秋霞在线观看毛片| 最黄视频免费看| 亚洲精品一区蜜桃| 国产亚洲91精品色在线| 国产成人午夜福利电影在线观看| 天堂8中文在线网| 日本黄色日本黄色录像| videossex国产| 免费观看av网站的网址| 少妇 在线观看| 国产欧美日韩一区二区三区在线 | 午夜老司机福利剧场| 亚洲第一区二区三区不卡| 久久久久精品性色| 国产精品成人在线| 中文字幕免费在线视频6| 亚洲伊人久久精品综合| 精品视频人人做人人爽| 青青草视频在线视频观看| av有码第一页| 高清欧美精品videossex| 91久久精品电影网| 另类精品久久| 26uuu在线亚洲综合色| 亚洲不卡免费看| 免费不卡的大黄色大毛片视频在线观看| 美女中出高潮动态图| 噜噜噜噜噜久久久久久91| 久久精品国产亚洲av涩爱| 中文字幕av电影在线播放| 老司机影院毛片| 国内精品宾馆在线| 免费高清在线观看视频在线观看| 中文字幕制服av| 99热网站在线观看| 日韩欧美一区视频在线观看 | 99热6这里只有精品| 永久免费av网站大全| 人妻系列 视频| 3wmmmm亚洲av在线观看| 国产色爽女视频免费观看| 国产精品三级大全| 人人妻人人爽人人添夜夜欢视频 | a级片在线免费高清观看视频| 亚洲情色 制服丝袜| 欧美激情极品国产一区二区三区 | 偷拍熟女少妇极品色| 内射极品少妇av片p| 91精品伊人久久大香线蕉| 久久鲁丝午夜福利片| 在线观看免费高清a一片| 亚洲电影在线观看av| 国产成人aa在线观看| 亚洲天堂av无毛| av在线app专区| 少妇的逼好多水| 高清视频免费观看一区二区| 能在线免费看毛片的网站| 大话2 男鬼变身卡| 韩国高清视频一区二区三区| 草草在线视频免费看| 中文字幕久久专区| 18禁在线播放成人免费| 亚洲成色77777| 成年人午夜在线观看视频| 亚洲av欧美aⅴ国产| 男人狂女人下面高潮的视频| 一级毛片 在线播放| 国产av一区二区精品久久| av在线播放精品| 人人妻人人澡人人爽人人夜夜| 亚洲精品日本国产第一区| 国产精品成人在线| videos熟女内射| 色哟哟·www| 内射极品少妇av片p| 一区二区三区乱码不卡18| 中文天堂在线官网| 亚洲av不卡在线观看| 国产一区亚洲一区在线观看| 欧美高清成人免费视频www| 国产免费视频播放在线视频| 日韩欧美 国产精品| 妹子高潮喷水视频| 亚洲精品乱久久久久久| 97超碰精品成人国产| 国产精品久久久久久av不卡| 国产成人精品无人区| 国产视频内射| 少妇人妻久久综合中文| 国产又色又爽无遮挡免| 久久韩国三级中文字幕| 午夜福利网站1000一区二区三区| 一级av片app| 日韩三级伦理在线观看| 中文资源天堂在线| 亚洲综合精品二区| 在线观看免费日韩欧美大片 | 亚洲av二区三区四区| 久久久久网色| 国产亚洲5aaaaa淫片| 蜜桃久久精品国产亚洲av| 啦啦啦在线观看免费高清www| 欧美人与善性xxx| 亚洲国产最新在线播放| 欧美亚洲 丝袜 人妻 在线| 亚洲国产精品国产精品| 一级毛片电影观看| 久久女婷五月综合色啪小说| 免费黄色在线免费观看| 久久精品国产自在天天线| 青春草视频在线免费观看| 欧美性感艳星| 欧美日韩一区二区视频在线观看视频在线| 韩国高清视频一区二区三区| 99热网站在线观看| 亚洲国产精品999| 亚洲欧美清纯卡通| 国产精品偷伦视频观看了| av在线app专区| 亚洲精品国产成人久久av| 亚洲av二区三区四区| 国产老妇伦熟女老妇高清| 久久久亚洲精品成人影院| 99热6这里只有精品| 亚洲激情五月婷婷啪啪| 51国产日韩欧美| 男人舔奶头视频| 国产精品一二三区在线看| 日本色播在线视频| 国产深夜福利视频在线观看| 一本—道久久a久久精品蜜桃钙片| 成人美女网站在线观看视频| 伦理电影免费视频| 欧美人与善性xxx| 日日爽夜夜爽网站| 欧美人与善性xxx| 免费观看性生交大片5| 免费观看在线日韩| 超碰97精品在线观看| 亚洲av福利一区| 欧美激情极品国产一区二区三区 | 少妇猛男粗大的猛烈进出视频| 国产成人精品无人区| 国产91av在线免费观看| √禁漫天堂资源中文www| 波野结衣二区三区在线| 久久精品国产亚洲网站| 99久久精品热视频| 久久av网站| 一本一本综合久久| av播播在线观看一区| 亚洲av不卡在线观看| 色婷婷av一区二区三区视频| 人人澡人人妻人| 又黄又爽又刺激的免费视频.| 国国产精品蜜臀av免费| 久久亚洲国产成人精品v| 久久 成人 亚洲| 亚洲电影在线观看av| 乱系列少妇在线播放| 精华霜和精华液先用哪个| 十八禁高潮呻吟视频 | 性色av一级| 国产欧美日韩综合在线一区二区 | 国产成人精品无人区| 另类精品久久| 成人国产麻豆网| 精品一品国产午夜福利视频| 丰满迷人的少妇在线观看| 亚洲av二区三区四区| av不卡在线播放| 亚洲av中文av极速乱| 天堂俺去俺来也www色官网| 欧美日韩视频精品一区| 亚洲精品一区蜜桃| 国产亚洲欧美精品永久| 精品人妻熟女毛片av久久网站| 国产精品久久久久久av不卡| 高清黄色对白视频在线免费看 | 成人毛片60女人毛片免费| 国产亚洲一区二区精品| 又大又黄又爽视频免费| 十八禁高潮呻吟视频 | 日韩一区二区视频免费看| 免费大片18禁| 大陆偷拍与自拍| 97精品久久久久久久久久精品| 国产精品成人在线| 日日啪夜夜爽| 九色成人免费人妻av| 99国产精品免费福利视频| 久久韩国三级中文字幕| 男的添女的下面高潮视频| 一级av片app| 我的女老师完整版在线观看| 成人午夜精彩视频在线观看| 日本爱情动作片www.在线观看| 日本免费在线观看一区| 国产 精品1|