黃知濤,王 翔,趙雨睿
(1. 國防科技大學 電子科學學院, 湖南 長沙 410073; 2. 國防科技大學 電子對抗學院, 安徽 合肥 230037)
電子戰(zhàn)是爭奪制電磁權的關鍵,其旨在利用電磁能、定向能等實現(xiàn)對電磁頻譜的控制,包括掌握、攻擊敵方電子信息系統(tǒng)和電子系統(tǒng)等,以及保護己方電子信息系統(tǒng)和電子系統(tǒng)等[1]。電子戰(zhàn)的發(fā)展經(jīng)歷了三個演變過程,即傳統(tǒng)電子戰(zhàn)、自適應電子戰(zhàn)以及認知電子戰(zhàn)。傳統(tǒng)電子戰(zhàn)是指采用預置的干擾方式破壞敵方雷達、通信等電子信息系統(tǒng)的正常工作;自適應電子戰(zhàn)則是融合自適應技術,使電子戰(zhàn)系統(tǒng)具備適應電磁環(huán)境變化的能力;而認知電子戰(zhàn)則代表了電子戰(zhàn)演變的最新形態(tài),具備推理、學習等認知能力,能夠對未知的目標和環(huán)境進行分析并自主做出有效的對抗決策。
催生電子戰(zhàn)形態(tài)改變的關鍵因素是人工智能技術的蓬勃發(fā)展。在20世紀70年代時期,電子戰(zhàn)系統(tǒng)高度依賴以特征工程為主導的專家系統(tǒng)。進入21世紀以來,數(shù)據(jù)規(guī)模和算力的急劇增加促使以深度學習等為代表的人工智能學習模型不斷涌現(xiàn),電子戰(zhàn)系統(tǒng)中的關鍵算法從特征工程走向機器學習。自今年以來,以生成式大語言模型為代表的新一代人工智能技術突起,為認知電子戰(zhàn)的發(fā)展提供了進一步的機遇。
美國最先意識到人工智能技術給電子戰(zhàn)發(fā)展帶來的機遇。從2008年起,美軍以提高電子戰(zhàn)裝備認知能力為核心,陸續(xù)啟動和開展了多個認知電子戰(zhàn)項目的研究[2]。中國從2013年開始跟蹤研究認知電子戰(zhàn)技術,主要團隊包括中國電子科技集團公司第三十六研究所的楊小牛院士團隊[3]、軍事科學院的王沙飛院士團隊[4]等。
隨著人工智能技術的快速發(fā)展,學術界對認知這一概念已經(jīng)邁進了嶄新的階段。因此,重新梳理認知電子戰(zhàn)的發(fā)展脈絡,剖析其核心技術原理,進一步捕捉其發(fā)展趨勢就顯得尤為重要。
本文結合人工智能領域的最新研究進展,對認知電子戰(zhàn)系統(tǒng)從概念內涵、典型項目、系統(tǒng)架構、關鍵技術與未來挑戰(zhàn)五個方面進行全面總結及深入分析,進而為領域研究墊下基石。
傳統(tǒng)電子戰(zhàn)系統(tǒng)主要基于人工經(jīng)驗知識,缺乏足夠的自學習能力,長期面臨著“新型電磁目標”“未知目標難以識別”“難以生成干擾措施”“對抗效果難以評估”等問題。新一代雷達、通信等電子信息系統(tǒng)正在向智能化方向發(fā)展,急需電子戰(zhàn)系統(tǒng)提升智能化水平,實現(xiàn)“以智對智”。認知電子戰(zhàn)正是在這個背景下應運而生,其具備對電磁環(huán)境和輻射源目標深層次的“認知”能力,能夠在極短的時間內自主地生成最佳對抗策略,通過實時在線評估對抗效果不斷優(yōu)化對抗策略[5]。
目前,國內外對認知電子戰(zhàn)尚未有統(tǒng)一的定義,研究人員先后給出過不同定義,總結如表1所示。雖然不同研究人員對認知電子戰(zhàn)定義的側重不同,但是核心都在強調對環(huán)境和目標的自主認知和理解,從而持續(xù)實現(xiàn)對目標輻射源的高效干擾策略生成與優(yōu)化。然而,對目標輻射源究竟要認知什么、理解什么,才能有助于高效對抗,這方面國內外公開文獻都沒有深入研究。
表1 國內外認知電子戰(zhàn)定義總結Tab.1 Summary of the definition of cognitive electronic warfare at home and abroad
雖然不同研究人員對認知電子戰(zhàn)的定義側重不同,但是核心都在強調對環(huán)境和目標的自主認知和理解,從而持續(xù)實現(xiàn)對目標輻射源的高效干擾策略生成與優(yōu)化。但是已有定義并未充分考慮目標不同特性給認知以及策略優(yōu)化帶來的差異性。綜合已有研究成果,并結合人工智能的新發(fā)展,本文結合不同目標變化特性詳細闡述不同等級的認知電子戰(zhàn)。
從目標變化程度的角度出發(fā),認知電子戰(zhàn)可以分為三個層次:一是當輻射源目標信號參數(shù)以及工作模式不變或者緩慢變化時,認知電子戰(zhàn)核心是如何基于盡可能少的偵測數(shù)據(jù)做出高效決策;二是當輻射源目標信號采用事先設定的規(guī)則實現(xiàn)變化時,認知電子戰(zhàn)的核心是基于歷史偵測數(shù)據(jù)實現(xiàn)對目標輻射源工作規(guī)則的認知,并基于認知結果實現(xiàn)干擾策略生成與預測;三是當輻射源目標是智能化目標,即其參數(shù)或工作模式能夠自主隨環(huán)境動態(tài)變化時,認知電子戰(zhàn)的核心是如何基于歷史偵測數(shù)據(jù)和實時偵測數(shù)據(jù)完成對目標智能學習模型的在線認知,實現(xiàn)“以智對智”,并形成智能對抗決策模型對目標智能規(guī)劃模型的“先發(fā)制人”優(yōu)勢。
可見,認知電子戰(zhàn)最大的優(yōu)勢是實現(xiàn)對未知目標的認知與對抗。從目標未知屬性的角度出發(fā),認知又可以進一步細分為兩個部分:一是當目標采用未知波形時,認知電子戰(zhàn)需要實現(xiàn)對波形的認知以及最佳干擾波形的生成;二是當目標采用未知工作模式時,認知電子戰(zhàn)需要實現(xiàn)對目標工作模式規(guī)律的認知以及針對該模式最佳干擾策略的生成。
認知電子戰(zhàn)能夠實時感知電磁環(huán)境,高效自主地調整系統(tǒng)以適應目標和環(huán)境的變化,提高系統(tǒng)的反應力、精確性和適應水平等綜合效能。結合1.1節(jié)中的定義與內涵,本文從感知、判斷、決策三個方面對電子戰(zhàn)系統(tǒng)的能力進行描述。
一是感知能力,即實現(xiàn)對復雜電磁環(huán)境中雷達、通信等不同輻射源的精確檢測、分析、識別、測向定位等能力,并能對輻射源的工作模式進行智能分析;二是判斷能力,即實現(xiàn)對敵輻射源行為規(guī)律的精確建模及異常檢測,從較長時間尺度上對目標進行深層次認知,并能推斷輻射源及所在平臺的意圖的能力;三是干擾決策能力,即實現(xiàn)最佳干擾決策并生成最佳干擾波形,能基于實時評估干擾效果實現(xiàn)干擾策略優(yōu)化,具備先發(fā)致人式、預測性干擾能力。
自2008年起,美國軍方和工業(yè)界就陸續(xù)啟動了多個認知電子戰(zhàn)項目,分別從關鍵技術攻關、系統(tǒng)架構、應用集成和演示驗證等方面推動認知電子戰(zhàn)的發(fā)展[11]。
在關鍵技術攻關方面,美國海軍實施的反應式電子攻擊措施項目重點聚焦雷達信號探測和分類技術,用于識別敏捷雷達威脅目標,并計劃應用于EA-18G“咆哮者”電子戰(zhàn)飛機;美國國防部建立的“算法戰(zhàn)跨職能小組”開展基于人工智能的海量光電偵察數(shù)據(jù)態(tài)勢分析、目標識別、光電對抗等技術研究;美國DeepSig公司于2020年開發(fā)了一套OmniSIG人工智能軟件,開展信號檢測、識別、推理等關鍵技術驗證,為動態(tài)頻譜感知與決策提供支撐。
在系統(tǒng)架構研究方面,DARPA資助的“寬帶傳感器系統(tǒng)的處理器重構”項目聚焦開發(fā)高吞吐量、流數(shù)據(jù)處理器,大幅提升硬件反應速度和處理能力,為認知電子戰(zhàn)提供實時運算平臺支持;“射頻機器學習系統(tǒng)”聚焦研究如何將機器學習等人工智能理念與方法應用于射頻系統(tǒng)設計。美國空軍針對認知電子戰(zhàn)面臨新威脅的特點,實施了“電子支援關鍵試驗”項目,試驗具有新目標適應能力的開放式機載電子攻擊系統(tǒng)。
在應用集成和演示驗證方面,美國工業(yè)界在DARPA的資助下分別針對雷達對抗、通信對抗等開展了驗證。在雷達對抗方面,主要代表項目是“自適應雷達對抗”項目;在通信對抗方面,主要代表性項目包括“自適應電子戰(zhàn)行為學習”“認知干擾機”“城市軍刀”等。而“極端射頻頻譜條件下的通信”項目則聚焦認知通信防御問題,提高在遭受干擾壓制情況下的通信自適應能力和靈活性。2022年,美國空軍發(fā)布的“怪獸”項目是美軍公開的認知電子戰(zhàn)最新項目,其包括了數(shù)據(jù)框架、硬軟件架構(軟件無線電研究)、多頻譜模擬仿真環(huán)境、可重構的電子攻擊處理、實時算法開發(fā)、關鍵技術重編程(檢測、分選、識別、去模糊和跟蹤等)、分布式對抗等,實現(xiàn)機載認知電子戰(zhàn)能力的全面驗證。
綜合國內外研究,認知電子戰(zhàn)系統(tǒng)架構一般由可重構射頻模塊、偵察感知模塊、干擾生成模塊、推理學習模塊、動態(tài)知識庫等組成,如圖1所示。可重構射頻模塊主要負責與電磁環(huán)境的交互,包括接收環(huán)境中的射頻信號與發(fā)射干擾信號。偵察感知模塊主要負責射頻信號接收與智能分析識別、信息提取以及輻射源行為分析、意圖識別等,為對抗決策提供輸入依據(jù),同時也為在線干擾效果評估提供輸入依據(jù);干擾生成模塊主要負責對抗策略以及干擾波形的實時生成;推理學習模塊為整個系統(tǒng)提供運算條件,支撐離線學習以及在線運算等,充當認知電子戰(zhàn)系統(tǒng)的大腦;動態(tài)知識庫存儲感知判斷得到的目標輻射源波形、模式規(guī)律等知識并能夠進行動態(tài)更新。認知電子戰(zhàn)系統(tǒng)的核心特征是通過智能賦能,動態(tài)適應電磁環(huán)境和目標變化,敏銳發(fā)現(xiàn)、精確識別和高效干擾威脅目標,并能自適應實現(xiàn)資源動態(tài)調度,通過學習不斷優(yōu)化策略。
圖1 通用的認知電子戰(zhàn)系統(tǒng)體系結構Fig.1 General architecture of cognitive electronic warfare system
在系統(tǒng)架構的基礎上,認知電子戰(zhàn)系統(tǒng)還可以進一步根據(jù)不同的功能層次進行詳細設計與劃分。
根據(jù)自頂向下的設計原則,采用分層架構將認知電子戰(zhàn)系統(tǒng)劃分為用戶層、應用層、算法層、數(shù)據(jù)層和硬件層,如圖2所示。層次越向上,其抽象層次就越面向業(yè)務、面向用戶;層次越向下,其抽象層次就變得越通用、面向設備。
圖2 認知電子戰(zhàn)系統(tǒng)的分層架構Fig.2 Layered architecture of cognitive electronic warfare system
認知電子戰(zhàn)的核心是感知能力、判斷能力、決策能力??紤]到感知、判斷、決策每個方面具有不同評價方式,認知電子戰(zhàn)的效能函數(shù)可以表示為
(1)
其中:mob、mor、mde分別表示感知、判斷、決策三個方面的性能指標向量;cob、cor、cde分別表示感知、判斷、決策三個方面的控制參數(shù);U(·)表示系統(tǒng)效能函數(shù),將多個性能指標m合成單一標量值,w是不同模塊對應指標的權重系數(shù)。通過尋找最優(yōu)的cob、cor、cde,使得認知電子戰(zhàn)系統(tǒng)的效能函數(shù)最大化。mob、mor、mde等每一個指標的提升都應該會帶來認知電子戰(zhàn)系統(tǒng)性能的提升,但是單一的指標提升只能在一定程度范圍內提升認知電子戰(zhàn)系統(tǒng)的效能,而不能無限提高。Ceq(·)、Cnon-eq(·)分別代表優(yōu)化問題中的等式限制條件與不等式限制條件,即表示認知電子戰(zhàn)系統(tǒng)在學習優(yōu)化控制參數(shù)過程中需要遵循的約束條件。例如,電子戰(zhàn)系統(tǒng)的干擾樣式集、偵察與干擾的開窗時間限制等。
從每個功能模塊的角度出發(fā),效能函數(shù)可以進一步表示為
U(mob(cob),mor(cor),mde(cde),w)
Ude(mde(cde),wde),w]
(2)
4.1.1 問題模型
感知的目標是對截獲到的信號進行處理,獲取信號的基本參數(shù)、信號樣式、個體身份等信息,能夠為對抗波形生成提供基礎參數(shù)。其核心在于如何根據(jù)不同的需求,構造不同的特征提取模型,可以表示為
(3)
為了完成對目標的感知任務,需要對接收到的信號進行分步驟處理,包含信號檢測、測向、信號識別、個體識別等,從而實現(xiàn)從復雜電磁環(huán)境中發(fā)現(xiàn)、識別輻射源目標,為后續(xù)干擾決策提供目標指引??刂茀?shù)cob中核心控制變量為特征提取函數(shù)f(·),f(·)在很大程度上決定了感知模塊的效能。目前,在認知電子戰(zhàn)感知技術研究中,f(·)一般采用不同的深度學習模型。下面分別對感知技術中涉及的檢測、測向、信號識別和個體識別技術進行介紹。
4.1.2 檢測技術
信號檢測的目的是從接收的無線電數(shù)據(jù)中檢測出潛在的目標信號,是實現(xiàn)認知電子戰(zhàn)感知技術的第一步。傳統(tǒng)信號窄帶檢測方法主要分為匹配濾波法[12-13]、循環(huán)平穩(wěn)法[14]、特征值檢測法[15-18]和能量檢測法四大類。但是這些經(jīng)典檢測方法重點關注的是信號存在性判定問題,大都未對信號參數(shù)估計進行研究,而全面準確的信號參數(shù)獲取對于后續(xù)盲處理是至關重要的。
近幾年隨著深度學習技術的飛速發(fā)展和巨大性能突破,將其引入寬帶信號檢測效果十分顯著?;舅悸肥且詴r頻圖作為輸入,預測信號在時頻圖上的邊界框和類型;再將預測的邊界框進行簡單的轉換,即可得到信號的起止時間、中心頻率、帶寬以及信號類別等參數(shù)。Yuan等在時頻圖上利用能量檢測方法獲取感興趣區(qū)域(regions of interest, RoI),然后利用多層卷積神經(jīng)網(wǎng)絡(convolutional neural networks, CNN)組成的分類器對RoI進行識別以檢測Morse信號[19]。該方法的性能瓶頸主要在于能量檢測在信道環(huán)境復雜時魯棒性較差。Prasad等認為信號檢測任務復雜性低于通用目標檢測,因此采用了一個簡化的Faster R-CNN模型來從含干擾時頻圖中檢測Wi-Fi信號,并且對模型不同超參數(shù)進行了詳細討論和優(yōu)化[20]。Zha等采用單階段目標檢測器從寬帶時頻圖中檢測多種調制類型的信號[21]。Li等采用YOLOv3針對寬帶時頻圖中檢測多調制類型信號開展了實驗驗證[22]。
隨著新體制信號的出現(xiàn),信號帶寬范圍大,一次通聯(lián)涉及多種不同突發(fā)寬度、多頻點、多帶寬,如何應對時間頻域尺度差異較大的不同類型信號的檢測成為亟待解決的難題。
4.1.3 測向技術
空間信號波達方向(direction of arrival, DOA)估計,也稱為陣列測向,其主要目的是對空間某區(qū)域目標信源進行精確的測向。
經(jīng)典的DOA估計方法,即模型驅動類方法,通過預先建立的陣列觀測數(shù)據(jù)與信號角度之間的數(shù)學模型,計算出相應準則下的信號方向。該類方法需要經(jīng)過特征值分解、多維搜索、迭代運算等計算過程,會產生巨大的計算量,并且當預設模型與實際情況不匹配或存在較大偏差時,該類方法的性能將會出現(xiàn)急劇惡化甚至完全失效,難以滿足日益復雜的電磁環(huán)境下對測向準確性、實時性和穩(wěn)健性的要求。
近年來,很多國內外研究者開始引入了機器學習技術,如支持向量回歸[23-24]、徑向基函數(shù)[25-26]、深度神經(jīng)網(wǎng)絡[27-29]等來解決DOA估計問題。以機器學習為代表的數(shù)據(jù)驅動類方法能夠直接基于對數(shù)據(jù)的學習提取特征與入射角度之間的非線性映射關系,可表示為f(s)→θ′,對難以建模的復雜環(huán)境具有較強的適應性。同時,其在線測試過程能夠被硬件高效地并行實現(xiàn),在計算效率方面也具備顯著優(yōu)勢。但對該類方法的研究目前還處于探索階段,仍然面臨著很多問題,如問題條件理想化、先驗信息挖掘不充分、少樣本問題以及在線學習問題等。
4.1.4 信號識別技術
信號識別是指對接收到的電磁信號進行特征測量,識別信號規(guī)格或者信號樣式,具體包括雷達、通信信號的調制方式等。
目前,智能信號識別算法根據(jù)數(shù)據(jù)預處理階段所使用的信號表示技術可以劃分為基于序列表示、特征表示、圖像表示或它們的組合表示的智能信號識別四類方法。
序列表示是最直觀的信號表示,常用的方法是使用同相正交(inphase and quadrature, IQ)序列、幅度相位(amplitude and phase, AP)序列和快速傅里葉變換(fast Fourier transform, FFT)序列等表示信號。文獻[30]基于相同CNN和RadioML2016.10a[31]中的相同數(shù)據(jù)集研究了IQ序列、AP序列和FFT序列表示對識別性能的影響,實際應用中應根據(jù)具體的場景和信號特點進行綜合考慮以選擇合適的序列表示方法。
基于特征表示的智能信號識別算法由傳統(tǒng)的基于特征提取算法發(fā)展而來。它通過提取多個特征來表示接收信號,再輸入深度學習模型完成識別。常使用的特征有高階累積量、瞬時特征、循環(huán)統(tǒng)計量、小波變換特征和近似熵特征等。因為提取的特征數(shù)目通常小于接收信號的長度,故可以使用具有較少神經(jīng)元的簡單神經(jīng)網(wǎng)絡。但也存在以下幾點不足:一是信號特征的計算導致額外的計算復雜度;二是需要根據(jù)候選信號樣式選擇適當?shù)奶卣?依賴于專業(yè)知識和經(jīng)驗;三是提取信號的某些特征,可能丟失一些關鍵信息,并影響調制識別的性能。
基于圖像表示的智能信號識別算法是在數(shù)據(jù)預處理階段將接收信號轉換為星座圖、特征點圖像、模糊函數(shù)圖像、眼圖、譜相關函數(shù)圖像等,通過圖像識別來完成信號識別。
由于單一一種信號表示方式均存在片面性,很難僅利用某一種表示技術完整地表征信號全部特性。因此,現(xiàn)有研究中也有考慮使用多個特征、圖像或序列的組合來表示接收信號,作為深度學習模型的輸入用于信號智能識別。通過綜合運用多種信號表示,多種表示優(yōu)勢互補,解決了單一表示對信號反映不完整的問題,可以提高識別的魯棒性和準確率。
4.1.5 個體識別技術
特定輻射源個體識別(specific emitter identification, SEI)技術,又稱輻射源指紋識別技術,是指對接收的電磁信號進行特征測量,并根據(jù)已有的先驗信息確定產生信號的輻射源的個體識別過程。現(xiàn)有SEI技術根據(jù)特征提取方式可以劃分為基于特征工程的輻射源個體識別技術與基于深度學習的輻射源個體識別技術[32]兩大類。人工設計指紋特征面臨的挑戰(zhàn)主要表現(xiàn)在兩個方面:一是特征設計函數(shù)復雜度較低導致指紋特征表征能力較弱;二是隨著加工工藝不斷進步,輻射源個體差異日益縮小,同時新體制輻射源信號日益復雜,導致SEI特征設計難度顯著增加[32]。
因此,研究人員提出采用深度學習技術代替人工設計指紋特征步驟,即在損失函數(shù)的約束下,通過不斷優(yōu)化網(wǎng)絡結構參數(shù),自動提取有效的指紋特征,并完成個體身份識別任務[32-33]。根據(jù)網(wǎng)絡輸入的數(shù)據(jù)格式不同,該類技術可以劃分為兩類,即基于原始IQ數(shù)據(jù)的指紋特征提取與基于信號變換域的指紋特征提取?;谠糏Q數(shù)據(jù)的指紋特征提取技術的優(yōu)勢在于原始數(shù)據(jù)無信息丟失,可以為深度學習模型提供全部可用的信息,但卻同時帶來了冗余信息干擾訓練的問題。針對這一問題,部分學者首先將信號映射至變換域再輸入深度學習模型,以降低訓練難度,進而提高SEI系統(tǒng)識別準確率和魯棒性。
4.2.1 問題模型
判斷的目標是對感知模型輸出的信號基本參數(shù)、信號樣式等特征進行時間維度上建模,分析目標的行為規(guī)律,檢測是否異常并識別目標意圖,能夠為對抗策略生成與優(yōu)化提供支撐。判斷模型的效用函數(shù)可表示為
(4)
判斷過程包括行為建模、異常檢測和意圖識別。其輸入為偵察感知模塊的輸出,包括信號識別結果、個體識別結果、信號方向、信號參數(shù)等。
在提取行為描述特征后,通過異常檢測計算fAD(·)進行判斷,根據(jù)經(jīng)驗誤差設定閾值ρ判別是否為異常行為。
當檢測到目標信號波形或工作模式等的異常行為后,可以進一步分析并確定其對應的事件或意圖YIR,構建意圖識別函數(shù)fIR(·)與事件YIR作對應,即可得到意圖識別結果。
4.2.2 行為建模
行為建模是通過對特定輻射源的長期行為觀察、描述和統(tǒng)計分析,從數(shù)據(jù)中獲取目標的行為描述和規(guī)律特征。電磁目標行為是指目標面對任務需求及外界環(huán)境時做出的決策反應。通過建立電磁目標在信號參數(shù)和工作狀態(tài)等方面的行為模型,便于對后續(xù)的行為進行判別。
隨著智能化認知設備的發(fā)展,電磁目標行為分析相關的研究逐漸興起[34],相繼提出雷達行為[35]、電磁輻射源行為學[36]等相關概念。根據(jù)現(xiàn)有研究,電磁目標行為可分為個體行為和群體行為。個體行為通常表現(xiàn)為輻射源信號參數(shù)的變化、所搭載平臺運動規(guī)律的改變,以及環(huán)境因素等其他能夠引起個體行為發(fā)生反應并可被非合作單位識別的變化等,例如輻射源掃描方式的改變、電磁目標工作時間段的變化等;群體行為則需要注重空間相互關系的影響,包括電磁密度、電磁頻譜占用度的劃分,群體陣列的結構構成,以及任務事件的進程等。要建立龐大的行為知識體系,行為建模不僅要包含個體行為和群體行為,還要考慮時間粒度、空間粒度的劃分。目前關于電磁目標行為建模一般采用人工或機器學習的方法提取行為描述特征,也有采用多層級語義建模的方法[37],還有學者構建實時動態(tài)的頻譜行為知識圖譜,利用采集頻譜數(shù)據(jù)中提取的語義與知識進行建模[38]。通過行為建模來獲得電磁目標的內部決策機制,進而為后續(xù)干擾策略優(yōu)化提供基礎參數(shù)。
4.2.3 異常檢測
異常檢測就是將被視為正常的活動定義與觀察到的事件進行比較,以識別顯著偏差的過程[39]。深度學習未發(fā)展之前,異常檢測分析主要基于統(tǒng)計的方法[39]。但隨著數(shù)據(jù)量呈指數(shù)型增長且參數(shù)靈活多變,過時的模型導致誤報率更高,文獻[40]證明基于統(tǒng)計的算法在檢測圖像和序列數(shù)據(jù)集上的異常值方面性能是次優(yōu)的。而深度學習的方法可以學習大規(guī)模數(shù)據(jù)的深層特征,從而獲得良好的性能。
以標簽數(shù)據(jù)劃分,基于深度學習的異常檢測可分為有監(jiān)督、無監(jiān)督和半監(jiān)督三類。有監(jiān)督的異常檢測使用標注的正常和異常數(shù)據(jù)來訓練深度分類器,盡管相對于傳統(tǒng)方法性能有所提高,但數(shù)據(jù)類別不平衡,即正類標簽的總數(shù)遠遠多于負類標簽的總數(shù)的問題常常導致性能次優(yōu)。此外,在電子戰(zhàn)領域的輻射源行為特征數(shù)據(jù)通常難以準確完善地標注,因此有監(jiān)督的方法不如無監(jiān)督或半監(jiān)督的方法有效。無監(jiān)督的異常檢測僅基于數(shù)據(jù)的內在分布特性來區(qū)分異常,大多采用聚類的方法。而半監(jiān)督的異常檢測通常采用正類的單類標簽來分離異常,利用異常數(shù)據(jù)與正常數(shù)據(jù)的特征差異性,在模型訓練時學習正類數(shù)據(jù)特征,在測試時對包含有正常和異常的數(shù)據(jù)進行分類,進而識別出異常數(shù)據(jù)。
4.2.4 意圖識別
意圖識別[41]也被稱為目的識別,是通過分析目標的部分或所有行動,或者分析其行動導致的狀態(tài)或環(huán)境變化來識別意圖的任務,而行為預測更側重于通過分析歷史數(shù)據(jù)來預測未來的行為,這是兩個相關但不完全相同的概念。在認知電子戰(zhàn)中,既要考慮對方意圖具備的欺騙性、動態(tài)性以及對抗性等諸多特性,同時還要考慮意圖誤判的代價敏感性。識別對方意圖是一個由諸多細微信息綜合提煉、依靠經(jīng)驗數(shù)據(jù)支持的推理分析和概率計算過程。
由于智能算法在處理復雜大數(shù)據(jù)的優(yōu)越表現(xiàn),意圖識別的研究已經(jīng)逐漸從基于模板匹配、貝葉斯網(wǎng)絡[42]以及隱馬爾可夫模型等依靠領域專家知識的傳統(tǒng)方法轉為深度學習的方法。因為作戰(zhàn)意圖具有時間關聯(lián)性,目前意圖識別中深度學習的方法多采用門控循環(huán)單元、長短時記憶網(wǎng)絡等時間序列網(wǎng)絡模型。但是考慮到認知電子戰(zhàn)中決策的時效性,網(wǎng)絡模型的快速性同樣不可忽視。而且現(xiàn)有方法的參數(shù)選擇多從信號層面,環(huán)境建模較為理想化,要構建更為完善的意圖識別系統(tǒng),還需要綜合考慮信號、時間、空間層面,甚至輿論層面的各種因素影響。最終通過不斷改進完善,在保證準確率和誤判代價的前提下,逐步發(fā)展為更具先進性的意圖預測[43]。
決策技術,即干擾決策,其目標是基于感知和判斷的結果實時生成最佳的干擾策略與波形。
4.3.1 問題模型
最佳干擾策略的關鍵是最佳干擾波形序列的生成,包括干擾樣式、干擾時刻、干擾能量等。在此基礎上,根據(jù)干擾目標不同狀態(tài)變化情況,對干擾效能進行評估,進而優(yōu)化干擾策略,對后續(xù)的干擾資源調度進行引導,從而保證干擾持續(xù)有效。核心目標是基于可觀測參數(shù)向量[o(0),…,o(t)](如目標信號特征、干擾信號特征、接收機狀態(tài)、環(huán)境因素、任務目標等)、不可觀測參數(shù)向量[z(0),…,z(t)](如未知環(huán)境因素、未知輻射源狀態(tài)等)和控制參數(shù)向量[c(0),…,c(t-1)](如干擾信號j(t)生成參數(shù)、干擾模式、發(fā)射機參數(shù)、節(jié)點部署方式等)來確定控制參數(shù)向量c(t),使得效用函數(shù)U(t+1)最大,目標函數(shù)表示為
=ζ(o(0),…,o(t),c(0),…,c(t),z(0),…,z(t))
(5)
其中滿足條件的c(t)構成t時刻最佳干擾策略s(t)。
4.3.2 認知干擾策略生成
在傳統(tǒng)對抗過程中,獲取目標信號偵察信息后主要依靠從預設干擾策略庫中或憑借經(jīng)驗制定干擾策略,選取預存儲的干擾波形進行對抗,而當目標先驗缺失、目標信號參數(shù)動態(tài)變化或出現(xiàn)新目標時,傳統(tǒng)基于“劇本”的對抗方式無法自適應地調整干擾策略以完成有效干擾,對抗效果將會被極大地削弱甚至完全失效。
現(xiàn)有的認知干擾重點是基于偵察中獲取的目標特征信息進行最優(yōu)化干擾決策,其能夠適應數(shù)據(jù)庫中有類似波形對抗策略的未知目標對抗問題。
目前,認知干擾策略生成的主要方法是基于強化學習的決策方法。常用的強化學習算法主要包括動態(tài)規(guī)劃、時序差分學習、Q-Learning等[44]。但該類方法實現(xiàn)的前提是實時獲取并修正干擾獎勵函數(shù),而對于快速變化的對抗場景,獎勵函數(shù)的定義本身就是一個難題。因此,該類方法目前只能針對特定緩慢變化目標的干擾任務,當目標信號參數(shù)快速變化時,仍然難以發(fā)揮作用。另外,對于多種已有波形組合或者是全新波形的對抗問題,一般性的推理和決策也難以找到最優(yōu)的干擾波形。
認知干擾決策難題在于如何基于對威脅目標未知波形的認知實現(xiàn)實時高效對抗策略的優(yōu)化。生成式深度學習技術[45-46]、零樣本學習技術[47]以及知識-數(shù)據(jù)聯(lián)合驅動學習技術[48]的興起為解決這個問題提供了新的思路。面對潛在未知目標波形,由于學習過程中數(shù)據(jù)樣本的缺失,需要融合領域知識進行聯(lián)合驅動,使系統(tǒng)具有對信號的“深度”理解能力,進而縮短對未知威脅的干擾反應時間, 提升電子戰(zhàn)系統(tǒng)干擾成功率。
4.3.3 在線效果評估
傳統(tǒng)電子戰(zhàn)不能實時評估干擾效果,感知—判斷—決策—行動環(huán)始終是“偵察—干擾”的開環(huán)模式,無法實現(xiàn)“偵察—干擾—偵察”的閉環(huán)模式。閉環(huán)對抗要實時獲取干擾效果信息,即要能夠做到基于干擾方的干擾效果評估。以雷達對抗為例,雷達在受到干擾后,在工作模式、行為特征、信號特征等方面會存在一定的變化,主要包括:工作模式切換如跟蹤模式受到干擾后會切換到搜索模式,或者采用一些抗干擾措施如頻率捷變、重頻抖動、功率管控等。通過工作模式、行為特征、信號特征等的變化能評估雷達受到干擾的效果。
目前,在線干擾效果評估是認知電子戰(zhàn)領域的研究難題。學術界的研究成果較少,其核心在于構建目標電子系統(tǒng)的狀態(tài)變化集、狀態(tài)變化集如何與干擾決策過程進行耦合,以及修正干擾目標獎勵函數(shù)并共同引導決策過程在線優(yōu)化。
認知電子戰(zhàn)概念自提出以來,已經(jīng)經(jīng)歷了十多年的發(fā)展,但現(xiàn)有的系統(tǒng)距離真正意義上的“認知能力”還具有一定的差距,本節(jié)將闡述認知電子戰(zhàn)所面臨的挑戰(zhàn)與其關鍵技術發(fā)展方向。
雖然人工智能技術已經(jīng)在計算機視覺、自然語言處理領域得到了廣泛應用,但是在與電子戰(zhàn)結合的過程中依舊面臨諸多挑戰(zhàn),主要表現(xiàn)為開放性電磁環(huán)境帶來的變化引起的智能學習過程的非魯棒性。
一是未知目標。認知電子戰(zhàn)中的信號識別、個體識別、行為建模、意圖識別等環(huán)節(jié)都面臨著新增的未知目標的挑戰(zhàn)。一方面,隨著電子信息系統(tǒng)的數(shù)量與種類不斷增加,新的波形層出不窮,信號識別與個體識別等任務必須具有開集識別和新目標認知能力;另一方面,不同目標執(zhí)行的任務多導致信號工作模式等更加多樣化,未知行為分析和意圖識別挑戰(zhàn)大。
二是未知環(huán)境?,F(xiàn)代戰(zhàn)場的電磁空間斗爭激烈,多種電磁信號、干擾和噪聲相互交織。檢測、測向、信號識別、個體識別等環(huán)節(jié)均易受到復雜多變環(huán)境的影響,即復雜多變的電磁環(huán)境使平時積累的數(shù)據(jù)分布特性與模型應用時實時接收到的數(shù)據(jù)分布特性存在不同程度的差異,從而導致學習訓練模型失配,性能大幅度下降。
三是頻譜對抗?,F(xiàn)實中大部分偵察活動面臨著干擾的挑戰(zhàn)。干擾技術旨在破壞或掩蓋原始信號,通常采用高功率、捷變頻等手段,使偵察系統(tǒng)難以檢測和區(qū)分所需的信號和干擾信號?,F(xiàn)有列裝的設備大多依賴于時域或頻域分離信號。如何應對時頻混疊干擾信號的威脅,保證干擾條件下偵察系統(tǒng)的可靠性、穩(wěn)定性、準確性(即擾中偵),已成為重中之重。
5.2.1 基于零樣本學習的信號與目標認知
如前文所述,認知電子戰(zhàn)的最大優(yōu)勢在于可以針對未知目標進行分析識別,這一過程所涉及的關鍵技術為零樣本學習。
零樣本學習允許人工智能模型識別以前從未見過的目標或概念。與傳統(tǒng)的監(jiān)督學習不同,模型從訓練實例中學習,只能在它所訓練的類別中對物體進行分類,零樣本允許人工智能模型使用語義屬性和關系來建模所學的目標。
在零樣本學習中,模型學習信號數(shù)據(jù)和特征語義信息之間的映射,如信號不同特征描述、信號屬性的層次和關系。根據(jù)這些語義屬性為新的未知目標預測一個標簽。因此,在認知電子戰(zhàn)關鍵技術研究中,面對潛在的未知目標與未知波形,需要融合關于輻射源信號領域知識進行語義建模與關聯(lián),實現(xiàn)對未知波形的特征提取。
5.2.2 魯棒性學習推理
認知電子戰(zhàn)技術發(fā)展和系統(tǒng)研制離不開多樣化數(shù)據(jù)的支撐,這就要求研究人員以及工程師們高度重視電子戰(zhàn)數(shù)據(jù)工程問題。但是,現(xiàn)有研究揭示了以深度學習為代表的人工智能模型存在明顯的脆弱性[49-50],以對抗樣本為代表的攻擊技術將會制約未來智能化手段部署到電子戰(zhàn)裝備中的安全性。因此,認知電子戰(zhàn)模型的魯棒性和安全性不容忽視。近年來,世界各主要軍事強國在智能化電磁頻譜對抗樣本攻防領域的研究飛速發(fā)展[51-60]。
自2019年始,對抗樣本的研究成果開始應用于電磁信號領域。Sadeghi等首次在基于深度學習的無線信號調制識別任務中提出了一種白盒對抗攻擊方法和通用對抗攻擊方法[61]。結果表明對抗攻擊可以在極小的擾動下大大降低智能調制識別的分類性能,這給使用基于深度學習的識別算法帶來了重大的安全性問題。隨后,不同研究人員先后開展各類對抗樣本攻擊算法在調制識別、個體識別等領域的應用。2021年開始,研究人員開始結合真實物理場景,結合領域特有的知識,優(yōu)化對抗樣本的生成算法,不斷增強對抗樣本對真實物理場景的適應能力。
綜上,現(xiàn)有認知電子戰(zhàn)關鍵技術中基于深度學習模型的各類方法由于缺乏可解釋性,極容易受到對抗樣本攻擊的威脅,給模型在復雜電磁環(huán)境下強對抗場景中的實際應用帶來嚴重安全隱患,亟待開展適應對抗樣本波形的魯棒性學習推理方法研究。
5.2.3 時頻混疊信號實時分離
在實際對抗過程中,當電子戰(zhàn)系統(tǒng)實施干擾時,由于干擾信號與目標時頻重疊,無法同步開展偵察,這就帶來兩個挑戰(zhàn):一是無法實時偵測目標信號的變化從而及時做出反應,導致認知電子戰(zhàn)過程無法持續(xù)進行;二是干擾過程中無法偵察到目標信號的變化從而直接影響在線效果評估。因此,需要開展時頻混疊信號實時分離技術研究,為實現(xiàn)認知電子戰(zhàn)過程中的“干擾中偵察”以及在線效果評估提供實時不斷的目標數(shù)據(jù)。
5.2.4 分布式認知對抗技術
群體智能是一個受社會昆蟲群落集體行為啟發(fā)的概念,其中個體代理在本地相互作用以實現(xiàn)全球目標。這一概念已成功應用于各個領域,包括機器人、優(yōu)化和決策。通過利用群體的集體智慧,可以實現(xiàn)卓越的性能并克服傳統(tǒng)集中式方法的局限性。在認知電子戰(zhàn)的背景下,群體智能可以增強其分布式感知和通信、自適應和彈性行為、合作干擾和欺騙、動態(tài)任務分配等能力,大幅提升系統(tǒng)適應性、彈性和有效性。
隨著人工智能理論的高速發(fā)展和不斷涌現(xiàn),更加先進的機器學習算法和技術將會不斷出現(xiàn),認知電子戰(zhàn)技術將逐漸成熟并進入應用,不斷提升電子戰(zhàn)在強對抗、快變化電磁環(huán)境下的敏捷性與整體作戰(zhàn)能力。