譚凱文 張立民 閆文君 徐從安 凌青 劉恒燕
(海軍航空大學信息融合研究所 煙臺 264001)
特定輻射源識別(Specific Emitter Identification,SEI)是指從接收信號中提取細微差異用于關聯(lián)單個輻射源的技術[1]。隨著物聯(lián)網(wǎng)(Internet of Things,IoT)應用的大規(guī)模普及和IoT接入設備數(shù)量的迅速增長,高效、安全、穩(wěn)定的物聯(lián)網(wǎng)設備認證方案是防范惡意攻擊、確保用戶隱私安全的關鍵[2]。由于發(fā)射機的物理層缺陷不可避免且難以復制,例如功率放大器的非線性失真[3—5],因此相比于采用協(xié)議分析、MAC地址關聯(lián)或密鑰驗證的無線設備認證技術,基于物理層射頻指紋(Radio Frequency Fingerprint,RFF)提取的SEI方法可靠性更強。根據(jù)發(fā)射機的工作特點,現(xiàn)有的輻射源識別技術通常可劃分為瞬態(tài)方法[6—8]和穩(wěn)態(tài)方法。瞬態(tài)方法利用發(fā)射機開關瞬間產生的狀態(tài)畸變用于特征提取,但這類畸變持續(xù)時間通常較短,且性能易受噪聲及非理想的信道條件影響發(fā)生惡化。相比于瞬態(tài)方法,穩(wěn)態(tài)方法從發(fā)射機傳輸?shù)姆€(wěn)定信號中提取RFF用于分類,因而應用更加廣泛。包括高階累積量(Higher Order Cumulant,HOC)[9,10]、希爾伯特變換(Hilbert Transform,HT)[11—13]、無意調相特征[14]、變分模態(tài)分解(Variational Mode Decomposition,VMD)[15]和功率譜密度(Power Spectral Density,PSD)[16]等在內的手工特征已經(jīng)被證明是有效的穩(wěn)態(tài)RFF,但上述基于變換域分析的穩(wěn)態(tài)特征提取依賴大量的先驗知識,且特征提取的有效性易受傳輸數(shù)據(jù)影響,導致算法的泛化性降低。
近年來,以卷積神經(jīng)網(wǎng)絡(Convolution Neural Network,CNN)為代表的深度學習(Deep Learning,DL)模型憑借其特征檢索能力在SEI中表現(xiàn)出巨大潛力[17—22]。Merchant等人[17]開發(fā)了基于時域復基帶誤差信號輸入的CNN框架,在一組7個 2.4 GHz商用ZigBee設備上實現(xiàn)了92.29%的識別精度;Qian等人[18]將從CNN中提取的隱藏淺層特征和深層特征與船舶自動識別系統(tǒng)(Automatic Identification System,AIS)信號拼接為多級字典,并使用主成分分析(Principal Component Analysis,PCA)方法進行基于稀疏表示的字典識別;Wu等人[19]提出了一種基于長-短記憶結構(Long Short-Term Memory,LSTM)的遞歸神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)用于自動識別硬件特征,在信噪比(Signal to Noise Ratio,SNR)低至—12 dB的情況下仍能實現(xiàn)較高的檢測精度;Wang等人[20]提出了一種基于雷達脈沖波形和CNN結合的SEI方法,通過對全脈沖信號進行建模提取精細的差異特征,并利用小卷積核神經(jīng)網(wǎng)絡進行監(jiān)督訓練;何遵文等人[21]基于多通道變換投影和生成式對抗網(wǎng)絡(Generative Adversarial Networks,GAN)設計了一種多特征融合的SEI方法,在多徑衰落信道下仍具有較強魯棒性。
目前基于DL模型的SEI方案通常是在大量標記樣本上進行的監(jiān)督學習。但在實際非合作場景中,受信號采集條件、電子干擾等因素制約,數(shù)據(jù)集的標簽往往不完整,一定程度上限制了監(jiān)督學習的分類性能[22]。其次,輻射源數(shù)據(jù)的類別間失衡導致DL模型性能的下降。在類別不平衡的數(shù)據(jù)集中,大量樣本屬于少數(shù)類別,而多數(shù)類別中只包含少量樣本。目前處理類不平衡數(shù)據(jù)的方法大致可分為數(shù)據(jù)平衡算法和代價敏感算法。數(shù)據(jù)平衡算法[23—26]通過對樣本進行過采樣和欠采樣以改善訓練集的樣本分布:過采樣是指增加少數(shù)類樣本以平衡類別數(shù)量,欠采樣則從多數(shù)類樣本中進行采樣以達到所需的類別分布。Abdi等人[23]提出了一種基于Mahalanobis距離的過采樣技術(Mahalanobis Distance-based Over-sampling technique,MDO),通過保留少數(shù)類樣本的協(xié)方差結構并在特征密集區(qū)域生成新樣本,從而降低類別重疊風險;Bunkhumpornpat等人[24]將密度聚類引入過采樣當中,通過求取正樣本到少數(shù)類別集合的最短路徑來生成新樣本;Kang等人[25]指出少數(shù)類樣本可能會向分類器中引入無關噪聲,因而提出一種結合噪聲濾波器的欠采樣框架;Hou等人[26]提出一種基于密度的欠采樣算法(Density-Based Under-sampling algorithm,DBU),并將其與AdaBoost進行集成從而保留有效類別?;跀?shù)據(jù)平衡的方法無法利用來自負類實例的信息,重復的采樣將導致數(shù)據(jù)規(guī)模的擴大,提高訓練過程中的計算成本,甚至在少數(shù)類樣本上出現(xiàn)過擬合;而且原始數(shù)據(jù)分布的改變可能會向分類模型中引入噪聲。代價敏感算法[27—30]通過引入類間錯誤分類因子以改善非均勻的誤分類代價。Krawczyk等人[27]提出用于不平衡分類的集成代價敏感決策樹,并在隨機特征子空間上進行訓練,以確保集合的多樣性;Duan等人[28]設計基于信息熵的代價敏感支持向量機(Cost Sensitive Support Vector Machine,CSSVM),利用數(shù)據(jù)集中的信息熵確定CSSVM的懲罰因子值,改善SVM在不平衡數(shù)據(jù)集上的分類性能;Zhang等人[29]將多分類問題分解為多個二元子問題對,并利用成本敏感反向傳播神經(jīng)網(wǎng)絡(Cost-Sensitive Back-Propagation Neural Networks,CSBPNN)進行協(xié)同二進制分類;Dhar等人[30]在通用支持向量機(Universum-Support Vector Machine,U-SVM)中為假陽性和假陰性錯誤提供不同的錯誤分類成本,在稀疏的高維數(shù)據(jù)集上表現(xiàn)出較高的識別精度。但錯誤分類代價的設置依賴基分類器的建模,導致代價敏感函數(shù)的可遷移性較差;而且需要具體的語義標簽以確定數(shù)據(jù)的誤分類信息,因此面對類別高度失衡的半監(jiān)督數(shù)據(jù)集時性能改善有限。
基于此,本文提出一種基于半監(jiān)督生成式對抗網(wǎng)絡和代價敏感學習的SEI方法。該方法利用二元博弈結構挖掘無標記實例的潛在分布特征,并設計類不平衡損失彌補由標記實例置信度不同導致的誤分類代價差異。在判別網(wǎng)絡中,將殘差單元串聯(lián)以提高梯度傳播效率,并嵌入多尺度拓撲模塊提取一維時間序列的多維分辨率特征。實驗結果表明,該框架提高了無標記樣本的利用效率,所設計的代價敏感損失有效提升了對于類別失衡數(shù)據(jù)集的識別性能。
考慮一個由K個輻射源組成的通信場景,輻射源物理層特征主要來源于功率放大器的非線性系統(tǒng)響應,功放的輸入信號s(nT)可表示為
式中,m(nT)表 示基帶調制信號,fc和fs分別表示載頻和采樣頻率。引入泰勒多項式描述功放的特異性,功放輸出T(i)(·)可表示為
式中,w(i)(nT)為信道加性噪聲。
GAN[31]由判別網(wǎng)絡和生成網(wǎng)絡組成,生成器的目標是輸出逼近真實樣本分布的數(shù)據(jù),判別器對生成器的輸出和真實樣本進行真假判別,生成器又通過反向傳播的梯度信息更新自身參數(shù)。生成器的優(yōu)化目標表示為
式中,V(G,D)表 示待優(yōu)化函數(shù),z~Pz(z)為輸入噪聲,D(x)表 示判別器的正確判別概率,G(z)表示生成器輸出,E (·)表示期望算子。判別器通過訓練提高真假分類能力,其優(yōu)化目標為
x~Pdata(x)表 示樣本服從真實分布,D(G(z))表示判別器將生成樣本判別為真實樣本的概率。網(wǎng)絡的損失函數(shù)可表示為
生成器和判別器在二元博弈過程中不斷調整優(yōu)化,當生成樣本和真實樣本匹配時達到納什均衡,此時的V(G,D)為全局最優(yōu)解。
針對GAN無法有效利用標簽和樣本之間的互相關信息,對抗訓練過程中存在模式崩塌等問題,本文將半監(jiān)督學習引入GAN框架中,提出了一種面向非均衡類別的輻射源識別方法(Semi-supervised GAN for imbalance category,IC-SGAN),框架在圖1給出。
圖1 IC-SGAN整體結構Fig.1 The overall structure of IC-SGAN
在IC-SGAN中,生成器的輸入為噪聲向量z,經(jīng)過卷積操作后輸出樣本G(z)以欺騙判別器。判別網(wǎng)絡則同時接收生成器輸出G(z)、標記樣本(x,y)~Pdata(x,y)和無標記樣本x~Pdata(x)進行半監(jiān)督分類??紤]一個存在K個輻射源的半監(jiān)督分類任務,對于生成器輸出G(z)和無標記樣本x~Pdata(x),IC-SGAN分別賦予其標簽為“0”和“1”,判別網(wǎng)絡利用輸出層的Sigmoid函數(shù)完成對于G(z)和x~Pdata(x)的二元真假判別
式中,xi為二分類矢量中的輸出。在無監(jiān)督部分中,無標記樣本被統(tǒng)一視作為真實類別,而生成器的輸出G(z)被作為“假樣本”,二者共同完成二進制真假判別。在監(jiān)督部分中,判別器的輸入為K類標記樣本,利用Softmax函數(shù)實現(xiàn)K維監(jiān)督分類
式中,lk,k=1,2,...,K為K維分類矢量。對于采集到的信號樣本,將其隨機劃分為訓練集和測試集,并采樣得到類不均衡訓練集。定義標記比為標記樣本數(shù)NL與訓練樣本數(shù)NT的比值,并按照所設置的標記比隨機抽取樣本對半監(jiān)督判別網(wǎng)絡進行在線訓練。訓練結束后保存模型并將測試集輸入判別網(wǎng)絡進行離線測試,選取混淆矩陣、識別準確率作為衡量模型性能的指標。
DCGAN[32]將卷積層引入生成器和判別器,提高模型的特征提取能力。本文在殘差網(wǎng)絡[33]的基礎上引入多尺度拓撲模塊(Multiscale Topological Block,MTB)融合信號在不同尺度下的分辨率特征,圖2給出了網(wǎng)絡結構。網(wǎng)絡輸入為1×1000維的時域信號包絡R(i)(nT),經(jīng)過全連接層和維度變換后輸出2×512×1的三維張量,便于后續(xù)進行2D卷積。由于時域信號中附加了功率放大失真,連續(xù)時間內的幅度信息能夠表示輻射源的辨識特征,因此可以利用MTB提取采樣序列的時域互相關特性。如圖2所示,該結構中存在①—④ 4條支路,其中支路①—③的結構相同,均由3個卷積層串聯(lián)組成,每層的卷積核個數(shù)為256,卷積核大小分別為1×7,1×5和1×3。設置不同尺寸卷積核的目的是從多個尺度縱向提取R(i)(nT)的時間跨域關聯(lián)信息,實現(xiàn)時域特征的跨層流動;而構建的支路①—③則從橫向維度豐富通道信息,提高網(wǎng)絡的多維表征能力,卷積層后添加修正線性單元(Rectified Linear Unit,ReLU)、批歸一化層(Batch Normalization,BN)和最大池化層防止梯度爆炸。為避免3條并聯(lián)支路中的卷積層堆疊而導致的特征丟失,添加支路④的跨越連接將前端初始特征直接傳遞至后端感受野,利用拼接操作(concatenate)融合時域信號的細微信息和并聯(lián)支路映射的高維特征。
圖2 基于MTB和殘差單元構建的判別網(wǎng)絡Fig.2 The discriminator based on MTB and residual units
為解決由于卷積層數(shù)的增加而導致的梯度消失,網(wǎng)絡主體采用串聯(lián)的殘差單元提高多尺度融合特征的利用效率。每個殘差單元均由3個卷積層構成,每一卷積層后添加BN層和ReLU層提高網(wǎng)絡的非線性表征能力,卷積步長設置為1用于保留高維特征映射。4個殘差單元的卷積核個數(shù)分別為128,64,32和16。特征向量經(jīng)過展平操作后分別由Softmax層和Sigmoid層輸出判別網(wǎng)絡的監(jiān)督分類概率和無監(jiān)督二元“0-1”判別概率。
表1給出了生成器的網(wǎng)絡結構。輸入為1×100的隨機噪聲向量,每個卷積層后添加批歸一化層和泄露修正線性單元(Leaky Rectified Linear Unit,LReLU)層,斜率設為0.2,卷積核大小為1×3,步長設置為1。全連接層的激活函數(shù)設置為tanh,用于將輸出信號限幅為[0,1]。
表1 生成器結構Tab.1 The structure of generator
本文提出一種面向非均衡類別的改進交叉熵,用于抵消由于樣本類別不均勻所導致的梯度失衡,提高低置信度樣本對于損失值的貢獻度。標準交叉熵(Cross Entropy,CE)損失表示為
式中,yi∈(0,1)為 置信概率,pi∈(0,1)為預測概率,N為樣本類別。CE損失通過假設損失權重與所屬類別頻率的無關性以實現(xiàn)訓練誤差的最小化,對于置信度高的多數(shù)類樣本和分類困難的少數(shù)類樣本分配相等權重。但這將導致多數(shù)類誤導梯度的下降方向,因此需要足夠的類別頻率樣本才能實現(xiàn)分離邊界的泛化。非均衡類別損失(Imbalanced Category Loss,ICL)定義為
式中,η,χ和μ為超參數(shù)。其中η代表權重因子,當樣本集合中存在標簽信息極少的困難分類樣本時,可以通過增大權重因子η提高對于低置信度樣本的損失加權;χ表示調制系數(shù),用于調節(jié)ICL損失曲線的斜率,其實質是對不同置信樣本的損耗分離度進行設置;μ則定義為縮放系數(shù),主要決定模型對于多數(shù)類樣本的損失抑制程度,可以用于高置信度樣本的損失向下加權。Zhang等人[34]和Lin等人[35]分別提出焦點損失(Focal Loss,F(xiàn)L)LFL和類不平衡(Class Imbalance,CI) 損失LCI,其表示為
式中,γ,υ和λ表示超參數(shù)。
圖3描述了CE損失、FL、CI損失和ICL的損失值隨置信度變化的曲線。圖示幾類損失均能根據(jù)樣本的置信度自適應地調整模型損耗:對于易分類樣本,降低權重直至接近于0;對于置信概率較低的困難分類樣本,圖示幾類損失均通過附加增益提高對于該部分數(shù)據(jù)的“損失注意力”。相比于FL采用的冪函數(shù)調制因子和CI損失的三角函數(shù)因子,采用指數(shù)因子的ICL擴展了易分類樣本的低損失值范圍,對于困難分類樣本附加更低的損失增益。而且指數(shù)縮放因子使得ICL具有比FL和CI損失更大的導數(shù)絕對值,這在圖3中表現(xiàn)為ICL曲線具有更大的“陡峭度”,能夠提高損失函數(shù)針對不同置信樣本的損耗分離度。權重因子η主要決定對于低置信度樣本的損失加權,當η=1.02時,ICL損失與FL損失和CI損失的左端點相同;而χ=0.06,μ=0.41參數(shù)組合能夠保證ICL損失具有比CE損失和FL損失更高的向下加權速率,而且相比于CI損失具有更好的邊界分離性能。超參數(shù)υ和γ取值分別為0.25和2[34]。
圖3 5類代價敏感損失曲線Fig.3 Five types of cost-sensitive loss curve
在回歸或者分類任務當中,可導性是設計損失函數(shù)的重要原則,即通過迭代得到損失函數(shù)的最小值或鞍點,從而確定輸入輸出之間的最佳非線性映射。圖4表示神經(jīng)元的基本結構。圖4中b表示偏置項,σ(·)表示激活函數(shù),第i個神經(jīng)元的輸出zi為
圖4 基本神經(jīng)元結構Fig.4 The basic neuron structure
其中,wij表示第i個神經(jīng)元的第j個權重值,Softmax層的輸出ai表示為
在IC-SGAN中,判別網(wǎng)絡的監(jiān)督部分利用ICL損失實現(xiàn)K維分類??蓪宰C明詳見附錄,由證明過程可知網(wǎng)絡對于神經(jīng)元輸出的梯度?L/?zi存在,通過比較真實值yi與網(wǎng)絡預測值ai的加權誤差,網(wǎng)絡能夠依靠梯度的反向傳播收斂至全局最優(yōu)解。
本節(jié)在仿真數(shù)據(jù)集上針對IC-SGAN的性能進行驗證和分析。首先選取泰勒多項式對來自5個發(fā)射機的非線性失真進行建模[12],多項式的階數(shù)M=3。調制方式為BPSK,采樣頻率為200 MHz,載波頻率設置為20 MHz,碼元速率為1M Baud,碼元序列為隨機比特流B∈{0,1}。利用5 組泰勒系數(shù)β[1]=[1,0.01,0.01],β[2]=[1,0.6,0.08],β[3]=[1,0.08,0.6],β[4]=[1,0.4,0.01],β[5]=[1,0.5,0.3]代表不同的功放響應。SNR的取值范圍為0~24 dB,w(i)(nT)為服從N(0,σ2)分布的高斯白噪聲。單一SNR下采集4800條樣本,每條樣本的采樣點數(shù)為1000,測試集和標準訓練集的劃分比為1:1。在標準訓練集中隨機采樣得到不平衡數(shù)據(jù)集,訓練集和測試集的設置如表2所示。
表2 仿真數(shù)據(jù)的訓練集和測試集設置Tab.2 Training and test set settings for simulation data
本文模型的搭建在基于Tensorflow 2.2.0的ker-as 2.3.1框架下實現(xiàn),操作系統(tǒng)為Windows 10,CPU為Intel(R) core(TM) i7-10750H,GPU為NVIDIA GeForce RTX 3080,運行內存大小為16 GB。
4.3.1 網(wǎng)絡收斂性分析
由于引入了反目標優(yōu)化的生成器和判別器,因此GAN模型的收斂特性值得關注。圖5記錄了IC-SGAN在訓練集2上迭代后的損失函數(shù)曲線,batch-size為128,信噪比為16 dB,訓練集的標記比為0.6,選取Adam作為優(yōu)化器,學習率設置為0.002。曲線表明判別器的損失值在訓練過程中存在波動,而生成器損失則在低值范圍內平穩(wěn)下降,二者在訓練60個epoch之后均能達到穩(wěn)定。
圖5 判別器和生成器損失值變化曲線Fig.5 The loss value change of the discriminator and generator
4.3.2 網(wǎng)絡參數(shù)尋優(yōu)
IC-SGAN的核心是充分利用無標記樣本分布實現(xiàn)判別網(wǎng)絡前端權重的共享,因此網(wǎng)絡的參數(shù)設置對于識別性能具有重要影響。選取識別準確率對網(wǎng)絡性能進行衡量,實驗在標準訓練集上進行,仿真結果如圖6所示。當殘差單元內的卷積層數(shù)為2時,識別準確率隨殘差單元數(shù)量的增加而顯著提高;而卷積層數(shù)為3或4時,識別準確率均超過89%和90%。這表明IC-SGAN的識別精度與卷積層數(shù)量和殘差單元個數(shù)呈非線性的正比關系。
圖6 判別器結構參數(shù)對識別準確率的影響Fig.6 The influence of discriminator structure parameters on recognition accuracy
4.3.3 MTB有效性驗證
為了證明判別網(wǎng)絡中引入的多尺度拓撲模塊的有效性,選取MTB-ResNet和去除MTB的原始Res-Net進行識別性能對比。二者除了是否保留MTB,網(wǎng)絡其余參數(shù)和結構完全一致,實驗在同一均衡訓練集和測試集上進行。訓練樣本數(shù)量NT為2000,標記比為0.3,MTB-ResNet與ResNet的識別準確率對比如圖7所示。
圖7 MTB-ResNet與ResNet的識別準確率對比Fig.7 Comparison of recognition accuracy between MTB-ResNet and ResNet
相比于原始ResNet,添加了多尺度拓撲模塊的MTB-ResNet在低SNR下表現(xiàn)出更為明顯的性能優(yōu)勢。在SNR為0 dB和4 dB時,MTB-ResNet的識別準確率較ResNet分別提升6.1%和6.7%,說明提出的MTB能夠利用多維卷積核和多通道結構改善低SNR下網(wǎng)絡對于信號的互相關特征提取能力。隨著SNR的提高,MTB-ResNet與原始ResNet的識別性能差距逐漸縮小,這是由于采用殘差單元作為骨干結構,在增強非線性映射能力的同時避免卷積層堆疊導致的梯度消失;在SNR超過22 dB的高SNR條件下,二者識別準確率的差異來自參數(shù)更新的不確定性。
4.3.4 網(wǎng)絡魯棒性分析
對標準訓練集進行均勻隨機采樣,從而驗證訓練樣本數(shù)量NT對于網(wǎng)絡性能的影響。訓練集標記比為0.6,損失函數(shù)設置為CE由圖8可知,各個SNR下的識別率隨NT的增加而穩(wěn)定提升。當SNR為0~10 dB時,不同NT條件下的識別準確率相差不大,NT為2400時的識別率高于NT=1200大約10%,即NT缺失50%情況下識別準確率降低10%左右。當SNR高于12 dB時,該指標上升至20%,主要由于判別網(wǎng)絡的卷積層數(shù)較多,在NT=1200的少樣本情況下發(fā)生過擬合,此時可以通過精簡網(wǎng)絡改善識別準確率。
圖8 不同訓練樣本數(shù)下識別性能對比Fig.8 Comparison of recognition performance under different numbers of training samples
4.3.5 半監(jiān)督分類性能分析
對IC-SGAN在不同標記樣本數(shù)NL下的識別性能進行驗證,損失函數(shù)設置為ICL,SNR分別選擇為16 dB和 20 dB,實驗結果如圖9所示。
圖9 不同標記比下的混淆矩陣Fig.9 Confusion matrix under different labeled ratios
IC-SGAN在標準訓練集3類標記比下的識別準確率分別為95.4%,94.8%和90.9%,在訓練集3的3類標記比下的識別準確率分別為75.8%,74.2%和72.4%,說明NL的增加能夠提高網(wǎng)絡的識別性能。在標記樣本數(shù)量相差40%的情況下,兩種數(shù)據(jù)集的識別準確率僅相差了4.5%和3.4%,說明IC-SGAN能夠利用較少的標簽信息實現(xiàn)較高的識別精度,對于標簽信息的規(guī)模表現(xiàn)出較強的適應性。
4.3.6 非均衡類別損失性能評估
利用3類損失函數(shù)(CE損失、FL損失和ICL損失)在1個均衡數(shù)據(jù)集和4個失衡數(shù)據(jù)集上進行訓練,訓練集的標記比為0.6,并在標準測試集上給出測試準確率,結果在表3給出。
表3 不同損失函數(shù)在不同信噪比下的性能評估(%)Tab.3 Performance evaluation of loss functions under different SNRs (%)
橫向對比來看,識別準確率能夠隨SNR的改善而穩(wěn)定提高。在SNR<10 dB的惡劣信道條件下,SNR的增加對于識別性能的提高十分顯著,這是由于表征個體差異的功放響應失真淹沒在高斯白噪聲中,模型無法從當前信號中獲取足夠的差異信息;當SNR超過某一閾值時,當前信道環(huán)境下的功放失真差異較為明顯,SNR的提高對于識別性能并未表現(xiàn)出較大的貢獻度。
縱向對比來看,在標準訓練集上CE損失、FL損失和ICL損失的識別準確率差異較小,F(xiàn)L損失和ICL損失未表現(xiàn)出明顯優(yōu)勢,這是由于標準訓練集中的樣本類別呈現(xiàn)均勻分布,因此FL損失和ICL損失無法根據(jù)置信概率對梯度進行加權。對于4種類不均衡訓練集,F(xiàn)L損失的識別性能高于CE損失,而且ICL損失在大多數(shù)情況下表現(xiàn)出最高的識別準確率,由此驗證了FL損失和ICL損失均能利用置信概率自適應地調整損耗值,對于易分類的多類樣本附加向下的加權速率。在4種類不平衡數(shù)據(jù)集上,ICL損失的平均識別準確率相比CE損失和FL損失分別提高5.34%和2.69%。
4.3.7 算法識別性能比較
為驗證IC-SGAN的性能優(yōu)勢,選擇文獻[22]、文獻[9]、文獻[11]以及文獻[13]中的方法進行對比,實驗在訓練集4上進行。文獻[22]引入特征匹配損失指導網(wǎng)絡的訓練,作為方法1;文獻[9]提出了基于信息最大化生成對抗網(wǎng)絡(InfoGAN)和RFF嵌入的無監(jiān)督SEI框架,作為方法2;文獻[11]提取Hilbert光譜特征并利用SVM進行分類,作為方法3;文獻[13]采用深度殘差網(wǎng)絡學習Hilbert譜圖像中的視覺差異,作為方法4。識別準確率的對比結果如表4所示,標記比為0.6。
表4 不同算法識別準確率對比(%)Tab.4 Comparison of recognition accuracy of different schemes (%)
橫向對比來看,IC-SGAN在所給條件下均具有最高的識別準確率。相比于方法1,IC-SGAN嵌入MTB提取信號的多維分辨率特征,且利用殘差單元改善梯度消失,特征挖掘能力更強;方法2將高階矩作為RFF嵌入到InfoGAN框架當中,但判別網(wǎng)絡的分類效率低于IC-SGAN,識別性能相比于方法1有所提升;方法3利用SVM提取Hilbert譜的熵特征,但SVM處理類不均衡數(shù)據(jù)的能力有待提高;方法4本質屬于監(jiān)督網(wǎng)絡,因此只能從60%的標記數(shù)據(jù)中學習樣本分布,無法利用未標記數(shù)據(jù),模型容易過擬合??v向對比來看,相比于CE損失,ICL損失能夠明顯改善方法1和方法2在非平衡數(shù)據(jù)集上的分類性能,證明了ICL損失的可遷移性。
4.3.8 網(wǎng)絡復雜度分析
對兩種改進GAN結構的復雜度進行比較,并將空間復雜度和時間復雜度作為算法復雜度的衡量指標??臻g復雜度指網(wǎng)絡中待優(yōu)化的參數(shù)NO,時間復雜度從迭代平均耗時ttrain和平均識別時間ttest方面進行考慮。3類模型均在SNR=24 dB的標準訓練集上進行訓練,樣本數(shù)量為2500,標記比為0.4,并在標準測試集上進行預測。
表5給出了IC-SGAN與RFFE-InfoGAN[9]以及E3SGAN[22]的計算復雜度比較。其中NO為判別網(wǎng)絡和生成器的可優(yōu)化參數(shù)總和,迭代平均耗時ttrain為模型訓練迭代100次的平均時間,平均識別時間ttest為模型在標準測試集上的預測時間。由表5可知,IC-SGAN的空間復雜度NO和迭代平均耗時ttrain最低,這得益于殘差學習結構利用短連接提高了特征傳遞效率。在RFFE-InfoGAN中,判別網(wǎng)絡采用多層感知機(Multi-Layer Perceptron,MLP)進行特征降維,導致參數(shù)數(shù)量大幅增加。3種模型的平均識別時間相差較小,均具有較強的識別實時性。
表5 網(wǎng)絡復雜度對比Tab.5 Network complexity comparison
采用基于GNU Radio和USRP的軟件定義無線電(Software Defined Radio,SDR)平臺收集經(jīng)過真實信道傳輸?shù)妮椛湓葱盘枴4罱ㄓ裳b有GNU Radio軟件的計算機和6臺USRP-B210組成的SDR平臺作為信號采集系統(tǒng),信號的采集過程如圖10所示。其中1臺USRP-B210固定為接收機,其余5臺USRP-B210作為發(fā)射機,每臺USRP-B210 具有兩個射頻發(fā)射、接收通道,因此可以模擬10個目標輻射源。
在GNU Radio的GUI界面中,將發(fā)射信號的參數(shù)設置如下:信號的調制方式為BPSK,載波頻率為2.4 GHz,帶寬為100 kHz,收/發(fā)增益為50,USRP的降采樣率為1 MHz,碼元序列為方波。收發(fā)天線距離為0.15 m。每臺USRP的采集樣本數(shù)量為720,訓練集和測試集的劃分比例為2:1,單條樣本的采樣點數(shù)為1000。
圖11給出了輻射源個數(shù)改變時的混淆矩陣。實驗在類別均衡訓練集上進行,損失函數(shù)選擇為CE,樣本的標記比為0.7。顯然,識別性能隨著輻射源數(shù)量的增加逐漸下降。輻射源數(shù)量K=10時,ICSGAN的整體識別準確率能夠達到81.4%,而且6號、8號以及10號個體的射頻指紋特征較為接近,識別時發(fā)生混淆。
圖11 IC-SGAN對于不同輻射源數(shù)量的識別結果Fig.11 The recognition results for different numbers of emitters
為驗證ICL在真實場景下處理類不均衡樣本的有效性,從采集的USRP -B210信號樣本中采樣得到類不均衡數(shù)據(jù)集。選擇奇偶交叉采樣法[36]構造類不均衡訓練集。將原始訓練集中的偶數(shù)類全部作為訓練集,奇數(shù)類中選擇10%和25%的樣本作為訓練集,反之亦然。數(shù)據(jù)集參數(shù)在表6給出。
選擇3類損失函數(shù)(標準交叉熵CE、焦點損失FL和非均衡類別損失ICL)在5個訓練集上進行訓練,訓練樣本的標記比為0.6,并在標準測試集上進行預測。當K小于10時,取表6中前K類作為新的訓練集。表7給出了3種損失函數(shù)在不同數(shù)據(jù)集上訓練后的測試結果。
表6 真實數(shù)據(jù)的訓練集和測試集設置Tab.6 Training set and test set settings for real data
表7 3類損失函數(shù)的識別性能評估(%)Tab.7 Recognition performance evaluation of three loss functions (%)
在K相等的情況下,在類不均衡數(shù)據(jù)集上的識別準確率相比于標準訓練集均發(fā)生下降。這是由于某類別下的訓練樣本數(shù)量劇減,導致模型無法從當前樣本中獲取該類別足夠的特征表示,而且樣本置信概率的不均加劇了梯度傳播的失衡。同一訓練集下,ICL損失表現(xiàn)出最高的平均識別準確率,由此驗證其在真實場景下的泛化性。
針對訓練樣本標簽不完整和類別不均衡導致個體識別性能受限的問題,本文提出了一種基于SSGAN和代價敏感損失的SEI方法。通過定義新的優(yōu)化函數(shù)并向判別網(wǎng)絡中引入多尺度拓撲模塊和殘差單元,直接對一維時間序列進行數(shù)據(jù)增強和分類,克服RFF提取泛化性較差的問題;利用修正后的交叉熵損失克服多數(shù)類樣本帶來的梯度主導,在多個類不平衡數(shù)據(jù)集上表現(xiàn)出較高的識別性能,為非均衡類別場景下的半監(jiān)督SEI問題提供新的解決方案。
附錄
根據(jù)鏈式求導法則,損失函數(shù)L對于第i個神經(jīng)元的輸出的梯度可表示為
將式(A-2)代入式(A-1),則得到
式中,ai表 示預測值,η和c表示常數(shù),φ(ai)是關于預測值ai的函數(shù),用來調節(jié)不同類頻率樣本引起的權重變化速率。