楊 柳,利 強(qiáng),邵懷宗
(電子科技大學(xué)信息與通信工程學(xué)院,四川成都 611731)
近年來(lái),電磁頻譜已成為不可或缺的國(guó)家戰(zhàn)略資源,是繼陸、海、空、天、網(wǎng)之后的第六維作戰(zhàn)空間,對(duì)電磁頻譜的智能認(rèn)知是實(shí)現(xiàn)制電磁權(quán)的關(guān)鍵. 然而,戰(zhàn)場(chǎng)復(fù)雜、開(kāi)放的電磁空間和不斷出現(xiàn)的未知輻射源,給電磁頻譜認(rèn)知帶來(lái)了巨大挑戰(zhàn). 其中,從偵收信號(hào)中快速、準(zhǔn)確地識(shí)別出輻射源是未知目標(biāo)還是已知目標(biāo)的未知工作模式,是電磁目標(biāo)認(rèn)知需要解決的首要問(wèn)題.由于缺少未知目標(biāo)訓(xùn)練樣本,對(duì)于未知目標(biāo)的識(shí)別本質(zhì)上屬于開(kāi)集識(shí)別[1](open set recognition),也被稱為開(kāi)放世界識(shí)別[2](open world recognition)或開(kāi)放類識(shí)別(open category learning),本文使用開(kāi)集識(shí)別這一術(shù)語(yǔ).在開(kāi)集識(shí)別的測(cè)試中,測(cè)試樣本可能來(lái)自訓(xùn)練集所包含的類別以外的數(shù)據(jù),開(kāi)集識(shí)別算法的目的是學(xué)習(xí)一種分類預(yù)測(cè)模型,將已知類的樣本分類成正確的類,并識(shí)別出未知類的樣本.
與開(kāi)集識(shí)別相對(duì)應(yīng)的是閉集識(shí)別,即訓(xùn)練集中的類別和測(cè)試集中的類別是一致的,數(shù)據(jù)集中所有的樣本的類別都是已知的,沒(méi)有未知類別的樣本. 所以閉集識(shí)別在訓(xùn)練集與測(cè)試集數(shù)據(jù)分布相同的假設(shè)下,只需要尋找各個(gè)類別之間的分界線,將各類別分開(kāi)即可. 自從2010 年AlexNet[3]在ImageNet LSVRC-2010(Ima?geNet Large-Scale Visual Recognition Challenge-2010)上奪冠,基于深度學(xué)習(xí)的分類識(shí)別技術(shù)在圖像、語(yǔ)音和電磁等領(lǐng)域受到了極大的關(guān)注. 但是,將現(xiàn)有基于閉集的識(shí)別網(wǎng)絡(luò)直接應(yīng)用到開(kāi)集識(shí)別中,仍然面臨許多問(wèn)題.
近年來(lái),基于深度學(xué)習(xí)的電磁信號(hào)識(shí)別取得了不錯(cuò)的成績(jī). O’Shea 等人[4]使用殘差神經(jīng)網(wǎng)絡(luò)[5]在考慮了載波頻偏、多徑衰落和信道損傷等的情況下解決了信號(hào)分類識(shí)別問(wèn)題,并討論了設(shè)計(jì)此類模型的注意事項(xiàng). Peng 等人[6]使用AlexNet 和GoogLeNet 來(lái)處理調(diào)制分類問(wèn)題,體現(xiàn)了深度學(xué)習(xí)在電磁領(lǐng)域的顯著優(yōu)勢(shì).Duan 等人[7]提出了一種多載波波形自動(dòng)分類方法,并利用主成分分析抑制加性高斯白噪聲,降低神經(jīng)網(wǎng)絡(luò)的輸入維數(shù). 此外,Wong 等人[8]使用卷積神經(jīng)網(wǎng)絡(luò)來(lái)估計(jì)每個(gè)發(fā)射器的同向/正交(I/Q)不平衡參數(shù).Huang等人[9]提出了一種用于自動(dòng)調(diào)制分類的壓縮卷積神經(jīng)網(wǎng)絡(luò),并提出了使用壓縮損失來(lái)訓(xùn)練該網(wǎng)絡(luò).Zhang 等人[10]通過(guò)使用頻帶選擇、信噪比選擇和樣本選擇來(lái)減少模型訓(xùn)練所需的時(shí)間,并證明了深度學(xué)習(xí)在無(wú)線干擾識(shí)別的可行性.Liang 等人[11]提出了一種基于深度學(xué)習(xí)的功率控制方法,旨在解決最大化衰落多用戶干擾信道總和率的非凸優(yōu)化問(wèn)題.
本文主要研究開(kāi)集識(shí)別問(wèn)題,即在訓(xùn)練階段沒(méi)有未知類的信息:既沒(méi)有這些類的實(shí)例信息,也沒(méi)有屬性信息. 訓(xùn)練完成后,在測(cè)試和使用階段,算法需要對(duì)未知類的實(shí)例樣本進(jìn)行分辨. 對(duì)于開(kāi)集識(shí)別問(wèn)題,如今已經(jīng)有了一些研究,這些研究大體可以分為兩類:基于判別模型和基于生成模型.
從基于判別模型的方面看,主要有基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法和基于深度神經(jīng)網(wǎng)絡(luò)的方法. 傳統(tǒng)的機(jī)器學(xué)習(xí)方法通常是基于訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)分布相同的假設(shè)的,為了使這些方法能夠運(yùn)用在開(kāi)集識(shí)別問(wèn)題里,學(xué)者們進(jìn)行了許多研究. Cevikalp[12,13]在SVM(Support Vector Machine)的基礎(chǔ)上,對(duì)已知類樣本增加約束,提出了最佳擬合超平面分類器(best-fit hyperplane classi?fier).Bendale 等人[2]通過(guò)擴(kuò)展最近類均值(nearest class mean)分類器,開(kāi)發(fā)了最近鄰非離群點(diǎn)(Nearest Neigh?bor non-Outlier,NNO)算法來(lái)解決開(kāi)集識(shí)別問(wèn)題. NNO算法根據(jù)樣本與各個(gè)已知類中心的距離進(jìn)行分類,如果所有已知類的分類器都判斷該樣本不屬于已知類,則將該樣本判定為未知類. 對(duì)于深度神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),其本身就具有強(qiáng)大的學(xué)習(xí)表示能力,分類時(shí)通常使用SoftMax 層與交叉熵?fù)p失,使得其本質(zhì)上具有封閉性.對(duì)于此問(wèn)題,Bendale 等人[1]提出了OpenMax 模型,首先用SoftMax 層通過(guò)最小化交叉熵?fù)p失來(lái)訓(xùn)練網(wǎng)絡(luò),然后計(jì)算訓(xùn)練樣本的特征到其對(duì)應(yīng)類的平均特征向量的距離,并用于擬合每個(gè)已知類單獨(dú)的威布爾分布,根據(jù)韋布爾分布擬合分?jǐn)?shù)對(duì)特征向量進(jìn)行重新分布,最后再利用SoftMax 計(jì)算已知類和未知類的概率. Dhamija 等人[14]將SoftMax 與新的熵開(kāi)集損失和Objectosphere 損失.Shu[15]提出了DOC(Deep Open Classifier)模型,采用了1-vs-rest 的Sigmoid 層將SoftMax 替代. Liu 等人[16]采用動(dòng)態(tài)元嵌入結(jié)合了直接圖像特征和相關(guān)的記憶特征,其特征范數(shù)表明對(duì)已知類的熟悉程度,以此來(lái)實(shí)現(xiàn)對(duì)未知類的識(shí)別. Hassen 等人[17]提出了ii-loss 與交叉熵?fù)p失共同訓(xùn)練網(wǎng)絡(luò),使得其產(chǎn)生的特征更適合開(kāi)集識(shí)別場(chǎng)景. 幾乎所有的基于判別模型的開(kāi)集識(shí)別算法都需要指定閾值,閾值在算法中起到了非常關(guān)鍵的作用,后面會(huì)對(duì)閾值的選定過(guò)程進(jìn)行討論說(shuō)明.
從基于生成模型的方面看,Ge 等人[18]采用條件生成網(wǎng)絡(luò)來(lái)生成未知類的樣本,并與OpenMax 結(jié)合,提出了G-OpenMax 算法,可以對(duì)生成的未知類樣本進(jìn)行概率估計(jì). Yu 等人[19]提出了對(duì)抗樣本生成框架(adver?sarial sample generation framework),可以用它生成與已知類樣本相近的未知類樣本,必要時(shí)也可以生成已知類樣本來(lái)擴(kuò)充已知類數(shù)據(jù)集.Chen 等人[20]提出了一種稱為對(duì)抗互易點(diǎn)學(xué)習(xí)(Adversarial Reciprocal Point Learning,ARPL)的方法,以在不損失已知分類精度的情況下最小化已知分布與未知分布的重疊部分. 這些方法已經(jīng)取得了一些成果,但如何生成更有效的未知類樣本仍需探索.
在機(jī)器學(xué)習(xí)中,對(duì)高維數(shù)據(jù)進(jìn)行各種形式的降維,主要是為了學(xué)習(xí)數(shù)據(jù)表示,即尋找一個(gè)可以更好地表示數(shù)據(jù)特征的低維空間,這個(gè)數(shù)據(jù)特征可以直接用于解決任務(wù). 度量學(xué)習(xí)是傳統(tǒng)機(jī)器學(xué)習(xí)的一種,就是在空間中尋找合適的空間或合適的距離度量函數(shù),并用距離來(lái)度量樣本之間的相似度. 通過(guò)訓(xùn)練,相似樣本之間的距離小,不同樣本之間的距離大.
傳統(tǒng)的度量學(xué)習(xí)主要是學(xué)習(xí)一個(gè)距離度量函數(shù).例如馬氏距離[21]需要學(xué)習(xí)一個(gè)(半)正定對(duì)稱矩陣. 在深度度量學(xué)習(xí)中,主要是利用一定的損失函數(shù)作為距離度量,讓網(wǎng)絡(luò)學(xué)習(xí)一個(gè)低維的特征空間(通常稱為Embedding),達(dá)到同類聚合和異類分離的效果. 這個(gè)距離度量可以固定,不需要學(xué)習(xí),比如歐式距離和余弦距離. 度量學(xué)習(xí)大致可以分為基于樣本對(duì)和基于代理[22]兩種. 許多度量學(xué)習(xí)算法都是基于樣本對(duì)的,主要有Contrastive Loss 和Triplet Loss等. 基于代理的方法則使用全局信息進(jìn)行優(yōu)化,例如Center Loss 和Proxy-NCA等.
開(kāi)集識(shí)別的問(wèn)題可以用以下數(shù)學(xué)語(yǔ)言來(lái)描述:給定一個(gè)訓(xùn)練集T={(xi,yi)|i=1,2,…,N},其中xi?Rsample,訓(xùn)練集中樣本的類別集S={1,2,…,K},其中yi?S. 在訓(xùn)練階段,只能訪問(wèn)和使用訓(xùn)練集中的樣本及其標(biāo)簽,而沒(méi)有任何其他未知類的信息;而在測(cè)試階段,有測(cè)試集TO={(xi,yi)|i=1,2,…,M},測(cè)試集的樣本類別集合SO={1,2,…,K,K+1,…,P},其中K+1,…,P表示訓(xùn)練階段未出現(xiàn)的類別. 鑒于上述定義,開(kāi)集識(shí)別算法需要將以下風(fēng)險(xiǎn)最小化,即
其中,f是需要訓(xùn)練的開(kāi)放集識(shí)別模型;CO和Cε分別代表開(kāi)放空間風(fēng)險(xiǎn)和經(jīng)驗(yàn)風(fēng)險(xiǎn);V是訓(xùn)練數(shù)據(jù),且只包含已知類;λ為常數(shù). 這個(gè)風(fēng)險(xiǎn)旨在平衡經(jīng)驗(yàn)風(fēng)險(xiǎn)和開(kāi)放空間風(fēng)險(xiǎn),在已知樣本識(shí)別率高的情況下,將未知樣本分辨出來(lái).
針對(duì)以上問(wèn)題,本文提出基于特征子空間分解與投影的開(kāi)集識(shí)別Open-MUSIC 算法. 該算法主要包括3個(gè)步驟.
步驟1 通過(guò)結(jié)合交叉熵?fù)p失與中心損失來(lái)訓(xùn)練一個(gè)分類網(wǎng)絡(luò),訓(xùn)練完成后,該分類網(wǎng)絡(luò)輸出層的前一層輸出結(jié)果用作數(shù)據(jù)特征提取,得到從數(shù)據(jù)到特征的映射模型,如圖1所示.
圖1 基于神經(jīng)網(wǎng)絡(luò)的映射特征模型訓(xùn)練算法
步驟2 將所有訓(xùn)練樣本輸入模型中,得到各個(gè)已知類的中心特征向量,將各個(gè)向量組合形成已知類中心特征矩陣,對(duì)該矩陣進(jìn)行正交子空間分解,得到其值域子空間與零域子空間,用于步驟3 中評(píng)估指標(biāo)的計(jì)算,具體如圖2所示.
圖2 特征子空間分解并計(jì)算投影比值
步驟3 將測(cè)試數(shù)據(jù)輸入步驟1 中的特征提取網(wǎng)絡(luò),并將提取到的特征分別投影到步驟2中的值域子空間和零域子空間,并計(jì)算投影長(zhǎng)度比值. 若比值大于設(shè)定的閾值,則判定為屬于已知類;否則,為未知類,具體如圖3 所示. 值得注意的是,閾值的設(shè)定對(duì)性能影響較大,后面本文會(huì)對(duì)閾值的設(shè)定進(jìn)行詳細(xì)討論.
圖3 確定閾值或判決方案
綜上所述,算法主要包含:獲得映射特征、特征子空間分解并計(jì)算投影比值、閾值確定. 下面對(duì)各步驟進(jìn)行詳細(xì)說(shuō)明.
獲得映射特征就是只使用已知訓(xùn)練數(shù)據(jù),學(xué)習(xí)一個(gè)模型,完成樣本空間到特征空間的映射,即F(x):Rsample→Rd. 在開(kāi)集識(shí)別環(huán)境下,映射的特征需要滿足2 個(gè)條件:縮小類內(nèi)距離,擴(kuò)大類間距離. 前者保證從已知目標(biāo)數(shù)據(jù)中學(xué)習(xí)到目標(biāo)特征最本質(zhì)的表征,而后者保證已知和未知類邊界劃分更容易,使得式(1)中開(kāi)放空間風(fēng)險(xiǎn)與經(jīng)驗(yàn)風(fēng)險(xiǎn)都較小. 該想法與Fisher 判別法類似,F(xiàn)isher 判別法目標(biāo)是通過(guò)最大化2類質(zhì)心距離與類內(nèi)距離的比值,來(lái)得到一個(gè)映射矩陣,可以將2 類樣本映射到一維空間. 而本文可以使用神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)映射函數(shù),將樣本投影映射到高維空間.
一般情況下,映射網(wǎng)絡(luò)為卷積神經(jīng)網(wǎng)絡(luò),且采用交叉熵?fù)p失來(lái)監(jiān)督訓(xùn)練網(wǎng)絡(luò),該損失函數(shù)由如下公式定義:
其中,xi為訓(xùn)練集中的第i個(gè)樣本;yi為該樣本的分類標(biāo)簽;F(x)為該樣本通過(guò)模型映射得到的映射特征,且F(x)?Rd;Wj?Rd為分類器的最后一個(gè)全連接層權(quán)重W第j行;b為該全連接層的偏置;m和K分別為訓(xùn)練批大小與已知類個(gè)數(shù).
由其定義可知,最小化交叉熵?fù)p失只能保證通過(guò)映射網(wǎng)絡(luò)得到的特征可分,即在一定程度上可以將各類之間的距離拉大,但并不能保證每類類內(nèi)聚合. 為此,本文在交叉熵?fù)p失基礎(chǔ)上,引入中心損失,即
并使用交叉熵?fù)p失與中心損失聯(lián)合監(jiān)督訓(xùn)練網(wǎng)絡(luò)[23],聯(lián)合的損失由下式定義:
其中,ci為第i類的中心特征向量;λ≥0 為常數(shù),用來(lái)平衡兩種損失函數(shù)所占的比重,若λ為0,則該損失函數(shù)與交叉熵?fù)p失相同. 交叉熵?fù)p失主要對(duì)類間的分離做貢獻(xiàn),中心損失主要對(duì)類內(nèi)的聚合做貢獻(xiàn). 其網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖1 所示,其中Embedding 向量為維度為d(>K)的特征. 映射網(wǎng)絡(luò)參數(shù)的訓(xùn)練過(guò)程如算法1所示.
算法1 映射網(wǎng)絡(luò)訓(xùn)練算法輸入:T:訓(xùn)練數(shù)據(jù)集(xi,yi)N i=1 θC,W:映射網(wǎng)絡(luò)與最后一層全連接層參數(shù)cj| j=1,2,…,K:中心特征λ,α,μ:超參數(shù)輸出:θC 1:WHILE NOT 網(wǎng)絡(luò)收斂條件DO 2:Lt=Lt S+λLt C 3:S ?Lt ?Lt C?Lt?xi=?xi+λ?xi 4:Wt+1=Wt-μ?Lt?Lt?Wt =Wt-μ S?Wt 5:θt+1 C =θtC-μ∑i?xi?Lt?xi·N()θtC Nδ(yi=j)(cj-xi)6:ct+1j =ct j-α∑i Nδ(yi=j)1+∑i 7:t ←t+1 8:END WHILE 9:返回θC
在完成數(shù)據(jù)特征提取后,已有多種方法對(duì)特征進(jìn)行處理以適應(yīng)開(kāi)集識(shí)別場(chǎng)景. 比如,采用通過(guò)SoftMax層后的概率計(jì)算熵,并制定閾值,熵大于閾值,則為未知類;熵小于閾值,則為已知類. 或者采用離群值,計(jì)算實(shí)例到K個(gè)已知類中最近類平均值的距離作為決策量[24]. 受子空間MUSIC(MUltiple SIgnal Classification)算法啟發(fā),本文提出一種基于特征子空間分解投影的開(kāi)集識(shí)別算法.
其中,中心特征矩陣D由所有已知類的中心特征向量組成. 對(duì)D進(jìn)行奇異值分解,得到它的值域子空間和零域子空間,兩個(gè)空間相互正交. 容易看出,如果待分類樣本來(lái)自某個(gè)已知類,其特征可以近似由D的值域子空間刻畫,因此,其在D的零域子空間投影近似為零.同樣地,如果待分類樣本為未知類,其特征無(wú)法由已知類的中心特征矩陣D完全表征,即未知類特征在D的零空間有(較大)投影. 因此,可以利用已知類和未知類在D的兩個(gè)正交子空間投影長(zhǎng)度的差異來(lái)區(qū)分已知和未知. 基于此,定義如下比值:
算法2 子空間投影比算法輸入:F:特征映射網(wǎng)絡(luò)T:訓(xùn)練數(shù)據(jù)集(xi,yi)N i=1 K:已知類個(gè)數(shù)x:測(cè)試樣例輸出:該測(cè)試樣例的比值? 1:Ni ←0,i=1,2,…,K 2:FOR(xi,yi)in T DO 3:Ayi Ni+1 ←F(xi)4:Nyi ←Nyi+1 5:END FOR 6:FOR k ?[1,2,…,K]DO 7:FOR n ?[1,2,…,Nk]DO 8:Bk ←Bk+Akn/Nk 9:END FOR 10:END FOR 11:D ←[B1,B2,…,BK]T 12:v1,v2 ←SVD(D)=UΣVT=[U]Σ[v1,v2]T 13:對(duì)于測(cè)試樣例x有A ←F(x)14:?=‖‖a·v1 2‖‖a·v2 2 15:返回?
如式(9)所示,閾值直接用于判斷是否是未知類的樣本,且閾值的好壞直接影響算法的準(zhǔn)確性. 下面主要介紹兩種確定閾值的方法.
4.3.1 通過(guò)正確率確定閾值
第一種方法,閾值只使用已知類樣本來(lái)確定. 將所有已知類樣本經(jīng)過(guò)映射模型,獲得特征后,可由式(8)計(jì)算該樣本比值,并按從大到小排序,其序列記為S.然后固定已知類識(shí)別準(zhǔn)確率Accuracy,如:90%,95%或99%,劃分閾值門限為S中下標(biāo)為round(length(S)?Accuracy)所對(duì)應(yīng)的比值作為閾值. 實(shí)驗(yàn)發(fā)現(xiàn),依據(jù)已知類準(zhǔn)確率的劃分方式,可避免門限劃分過(guò)低,導(dǎo)致未知類誤判為已知類.
4.3.2 通過(guò)似然比確定閾值
第二種方法,利用生成對(duì)抗模型生成一些與訓(xùn)練樣本相近的負(fù)樣本,與訓(xùn)練樣本或生成的正樣本一起,經(jīng)過(guò)步驟1 和步驟2 后,得到各個(gè)樣本的比值,畫出統(tǒng)計(jì)直方圖(圖4). 由圖可以看出,假定正樣本的比值與負(fù)樣本的比值遵循某個(gè)分布,如正態(tài)分布或威布爾分布等,則可以用似然比對(duì)測(cè)試集做分類預(yù)測(cè). 以威布爾分布為例,有
圖4 已知類與未知類比值分布直方圖
其中,H0為未知類;H1為已知類;k0,λ0,k1,λ1可以通過(guò)正負(fù)樣本的比值計(jì)算出來(lái).
當(dāng)p(H0|x)>p(H1|x)時(shí),表示該樣本屬于未知類;否則該樣本屬于已知類. 而由貝葉斯公式可知,p(H0|x)>p(H1|x) 與p(x,H0)>p(x,H1)等價(jià),而p(x,H)=p(x|H)?p(H),故設(shè)
假設(shè)樣本屬于已知類與未知類的先驗(yàn)概率相等,即p(H0)=p(H1)=0.5,則有
所以,有判決準(zhǔn)則:
即L(x)≤τ時(shí),該樣本屬于未知類;否則,該樣本屬于已知類.
在本節(jié)中,我們將在3個(gè)數(shù)據(jù)集上進(jìn)行算法有效性驗(yàn)證.3 個(gè)數(shù)據(jù)集分別為MNIST 手寫數(shù)字?jǐn)?shù)據(jù)集、雷達(dá)PDW數(shù)據(jù)集、無(wú)人機(jī)信號(hào)數(shù)據(jù)集.
本文主要使用識(shí)別精度(Accuracy)、F 值(Fmeasure)與ROC 曲線(Receiver Operating Characteristic Curve)下的面積AUC-ROC來(lái)衡量各種算法在開(kāi)放集上的效果,F(xiàn)-measure由下式定義:
其中,Precision為準(zhǔn)確率,Recall為召回率,F(xiàn)-measure為準(zhǔn)確率與召回率的調(diào)和平均值. Precision 與Recall 定義為
其中,TP 為將正類預(yù)測(cè)為正類的數(shù)量;FP 為負(fù)類預(yù)測(cè)為正類的數(shù)量,即誤報(bào)率;FN 為將正類預(yù)測(cè)為負(fù)類數(shù),即漏報(bào)率.
第二個(gè)指標(biāo)為準(zhǔn)確率,計(jì)算式為
其中,TP、FP、FN 與上述相同;TN 為將負(fù)類預(yù)測(cè)為負(fù)類的數(shù)量.
由于F-measure 與Accuracy 受閾值影響較大,故引入ROC 曲線下的面積AUC-ROC 來(lái)衡量算法的性能.ROC 曲線又稱接受者操作特征曲線. 該曲線最早應(yīng)用于雷達(dá)信號(hào)檢測(cè)領(lǐng)域,用于區(qū)分信號(hào)與噪聲. 后來(lái)人們將其用于評(píng)價(jià)模型的預(yù)測(cè)能力. 對(duì)于一個(gè)二分類模型,其閾值可能設(shè)定或高或低,每種閾值的設(shè)定會(huì)得出不同的FP 和TP,將同一模型每個(gè)閾值的(FP,TP)坐標(biāo)都畫在ROC 空間里,就成為特定模型的ROC 曲線. 而ROC 曲線與FP 軸所包圍的面積越大,表示該模型性能越強(qiáng).
5.1.1 MNIST手寫數(shù)字?jǐn)?shù)據(jù)集
MNIST 數(shù)據(jù)集是手寫數(shù)字的灰度圖像數(shù)據(jù)集,數(shù)據(jù)集中共包括6 萬(wàn)多張訓(xùn)練圖像樣本與1 萬(wàn)多張測(cè)試圖像樣本,共分為10 類,且每個(gè)樣本大小為28×28. 因?yàn)樵摂?shù)據(jù)集中的灰度圖像樣本已經(jīng)可以直接在模型中使用,所以不需要對(duì)數(shù)據(jù)集做任何預(yù)處理操作.
在MNIST 數(shù)據(jù)集中,樣本分為10 類. 為適應(yīng)開(kāi)集識(shí)別場(chǎng)景,我們選取0,1,2,3,4,5 為已知類進(jìn)行訓(xùn)練;設(shè)定6,7,8,9為未知類,在訓(xùn)練階段不可見(jiàn).
5.1.2 多功能雷達(dá)工作模式數(shù)據(jù)集
多功能雷達(dá)數(shù)據(jù)集是通過(guò)仿真生成的多功能雷達(dá)不同工作模式的脈沖描述字(PDW)數(shù)據(jù),一共包含55個(gè)已知工作模式和6 個(gè)未知工作模式,每條PDW 數(shù)據(jù)主要包括:脈沖到達(dá)時(shí)間(TOA)、載波頻率(RF)、脈沖寬度(PW)、脈沖幅度(PA)、脈沖到達(dá)角度(DOA)等參數(shù). 由于在偵收中,PA和DOA受環(huán)境影響較大,不作為工作模式識(shí)別的特征. 已知和未知模式分別包含757個(gè)和120個(gè)樣本,每個(gè)樣本包含100個(gè)脈沖記錄.
在使用雷達(dá)數(shù)據(jù)集之前需要對(duì)數(shù)據(jù)做預(yù)處理. 將TOA 轉(zhuǎn)為脈沖重復(fù)間隔(PRI)后,每條PDW 樣本的PRI,RF 和PW 作為3 個(gè)通道,形成3×100 的類圖片樣本. 為了更適合CNN 提取特征,將樣本延展為3×100×100 的圖片,并將每個(gè)通道按下式進(jìn)行歸一化,得到預(yù)處理后的數(shù)據(jù)集.
在訓(xùn)練階段,隨機(jī)將757個(gè)已知類樣本劃分為訓(xùn)練集(637 個(gè)樣本)與測(cè)試集(120 個(gè)樣本),訓(xùn)練集主要用于模型訓(xùn)練,測(cè)試集可與未知類數(shù)據(jù)(120個(gè)樣本)共同用于開(kāi)集識(shí)別測(cè)試.
5.1.3 無(wú)人機(jī)個(gè)體識(shí)別信號(hào)數(shù)據(jù)集
無(wú)人機(jī)個(gè)體識(shí)別信號(hào)數(shù)據(jù)集由實(shí)際采集的9 款無(wú)人機(jī)時(shí)域信號(hào)數(shù)據(jù)組成,用于對(duì)無(wú)人機(jī)個(gè)體指紋的識(shí)別. 部分時(shí)域信號(hào)如圖5所示.
對(duì)無(wú)人機(jī)采集信號(hào)需要進(jìn)行預(yù)處理. 預(yù)處理主要包含提取有效信號(hào)部分和將時(shí)域信號(hào)處理為類圖片形式,方便CNN 提取特征. 采用能量檢測(cè)方法對(duì)有效信號(hào)部分進(jìn)行提取切片,即計(jì)算窗內(nèi)數(shù)據(jù)的能量,大于閾值則為信號(hào)部分,小于閾值則為噪聲部分. 之后對(duì)提取出的有效信號(hào)進(jìn)行短時(shí)傅里葉變換(Short-Time Fourier Transform,STFT)形成時(shí)頻圖片. 圖6 給出了圖5 有效信號(hào)在STFT變換后的時(shí)頻圖.
圖5 無(wú)人機(jī)信號(hào)時(shí)域圖
圖6 無(wú)人機(jī)信號(hào)時(shí)頻圖
通過(guò)上述預(yù)處理過(guò)程,為每架無(wú)人機(jī)提取了600張時(shí)頻圖樣本,共5 400 個(gè)樣本,并將9 架無(wú)人機(jī)中的5 架作為已知類,其余4 架作為未知類,已知類和未知類樣本大小分別為3 000和2 400.
本實(shí)驗(yàn)將Open-MUSIC 與OpenMax[1]、OLTR[16]、iiloss[17]和ARPL[20]在MNIST 手寫數(shù)字識(shí)別、雷達(dá)工作模式識(shí)別和無(wú)人機(jī)個(gè)體指紋識(shí)別上進(jìn)行實(shí)驗(yàn)對(duì)比,通過(guò)F-measure、Accuracy 與AUC-ROC 等指標(biāo)對(duì)各個(gè)模型進(jìn)行評(píng)估.Open-MUSIC 在3 個(gè)數(shù)據(jù)集上映射網(wǎng)絡(luò)模型分別如表1~表3所示.
表1 MNIST數(shù)據(jù)集所使用特征映射網(wǎng)絡(luò)參數(shù)表
表3 無(wú)人機(jī)數(shù)據(jù)集所使用特征映射網(wǎng)絡(luò)參數(shù)表
表4~表6 分別給出了各個(gè)算法在MNIST 數(shù)據(jù)集、雷達(dá)數(shù)據(jù)集與無(wú)人機(jī)信號(hào)數(shù)據(jù)集上的結(jié)果.
表4 MNIST數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
表6 無(wú)人機(jī)信號(hào)數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
在MNIST 數(shù)據(jù)集上,ARPL 算法在3 個(gè)指標(biāo)上都表現(xiàn)最佳. Open-MUSIC 算法雖然AUC-ROC 略低于其他算法,但是F-measure 與Accuracy 等指標(biāo)都僅次于ARPL 算法,優(yōu)于其他方法.OpenMax、OLTR 和ii-loss 等方法雖然AUC-ROC 較高,但其余兩個(gè)指標(biāo)較低,這表明這些算法的性能受閾值影響較大,也說(shuō)明了Open-MUSIC設(shè)定的閾值效果較好.
在雷達(dá)數(shù)據(jù)集上,Open-MUSIC 較其他方法性能提升了3%以上,較表現(xiàn)最差的OpenMax 算法性能提升了近40%. 在無(wú)人機(jī)信號(hào)數(shù)據(jù)集上,Open-MUSIC 的Fmeasure 與Accuracy 保持在90%以上,AUC-ROC 在95%以上,性能顯著高于其他算法.
綜合以上結(jié)果來(lái)看,Open-MUSIC 相對(duì)于其他方法更適合處理電磁數(shù)據(jù),比如在無(wú)人機(jī)數(shù)據(jù)集上,其性能相較于其他方法至少提升了4%. 同時(shí),Open-MUSIC 更適合處理類數(shù)較多且每類樣本數(shù)較少數(shù)據(jù),如在雷達(dá)數(shù)據(jù)集中,每類所含樣本最少只有4 個(gè)樣本. 此時(shí)OpenMax 這種依賴每類訓(xùn)練數(shù)據(jù)的得分來(lái)擬合分布的算法效果較差,而Open-MUSIC 使用中心損失訓(xùn)練映射網(wǎng)絡(luò),為每個(gè)類單獨(dú)維護(hù)一個(gè)中心,且子空間分解時(shí)每類中心都有相同的權(quán)重,在一定程度上可以減小樣本數(shù)少所帶來(lái)的影響.Open-MUSIC 在3個(gè)數(shù)據(jù)上的AUCROC 均超過(guò)了95%,表明本文算法較其他算法魯棒性較強(qiáng),且更適合于電磁數(shù)據(jù).
表2 雷達(dá)PDW數(shù)據(jù)集所使用特征映射網(wǎng)絡(luò)參數(shù)表
表5 雷達(dá)數(shù)據(jù)集實(shí)驗(yàn)結(jié)果
本文針對(duì)電磁頻譜認(rèn)知領(lǐng)域內(nèi)的電磁目標(biāo)開(kāi)集識(shí)別問(wèn)題,借鑒MUSIC 算法,提出了基于正交子空間分解的開(kāi)集識(shí)別方法Open-MUSIC. 該方法通過(guò)使用映射網(wǎng)絡(luò)得到的已知類特征,組成已知類中心特征矩陣,進(jìn)而對(duì)該矩陣進(jìn)行正交子空間分解,得到其值域子空間與零域子空間,通過(guò)計(jì)算測(cè)試樣本特征在兩個(gè)子空間內(nèi)的投影比值來(lái)對(duì)未知類進(jìn)行識(shí)別,以提升識(shí)別效果. 實(shí)驗(yàn)表明Open-MUSIC 算法在電磁數(shù)據(jù)集上效果較其他開(kāi)集識(shí)別算法更好.