黃天禹,李雨鍇,楊 萌
(西南交通大學(xué),四川 成都 611756)
現(xiàn)代信息技術(shù)的飛速發(fā)展,使得數(shù)字集群通信技術(shù)在通信領(lǐng)域的應(yīng)用越來(lái)越廣泛,特別是在現(xiàn)場(chǎng)指揮調(diào)度要求較高的公安、消防、鐵路等政府管理部門(mén)。陸地集群無(wú)線(xiàn)電(Terrestrial Trunked Radio,TETRA)系統(tǒng)是一種基于數(shù)字時(shí)分多址技術(shù)的無(wú)線(xiàn)集群移動(dòng)通信系統(tǒng)。由于TETRA 標(biāo)準(zhǔn)具有非常多的優(yōu)點(diǎn),如標(biāo)準(zhǔn)開(kāi)放、技術(shù)和標(biāo)準(zhǔn)成熟及靈活的組網(wǎng)等,所以在全球范圍內(nèi)得到了非常廣泛的應(yīng)用。但無(wú)線(xiàn)信道的空間是開(kāi)放的,因此數(shù)字集群通信系統(tǒng)容易遭受系統(tǒng)內(nèi)外部的電磁干擾,而各種相關(guān)電子設(shè)備的增加,也讓無(wú)線(xiàn)信道的環(huán)境越來(lái)越復(fù)雜。
在通信過(guò)程中,如果干擾信號(hào)類(lèi)型可以被通信方識(shí)別,那么就可以采取相應(yīng)的抗干擾措施,最大限度地規(guī)避或抑制干擾。干擾信號(hào)種類(lèi)很多,本文主要針對(duì)幾種典型的干擾信號(hào)——單音干擾信號(hào)、多音干擾信號(hào)、寬帶線(xiàn)性?huà)哳l干擾信號(hào)和窄帶噪聲干擾信號(hào),進(jìn)行分析、研究和識(shí)別。
干擾信號(hào)識(shí)別的方法可以分為理論決策和模式識(shí)別兩種。一般模式識(shí)別的過(guò)程分為信號(hào)的預(yù)處理、特征提取和分類(lèi)識(shí)別3 個(gè)部分。其中特征提取和分類(lèi)識(shí)別對(duì)識(shí)別效果起關(guān)鍵作用。
干擾信號(hào)的特征一般是從信號(hào)的時(shí)域、頻域和時(shí)頻域等這些方面提取出來(lái)的。文獻(xiàn)[1]基于原子分解理論的時(shí)延與頻偏匹配度進(jìn)行特征提取,提取的特征對(duì)雷達(dá)欺騙干擾信號(hào)具有較高的識(shí)別率。文獻(xiàn)[2]從多維域上提取特征,并采用決策樹(shù)和支持向量機(jī)兩種決策模型對(duì)多種典型干擾樣式進(jìn)行仿真識(shí)別。文獻(xiàn)[3]提出基于信號(hào)特征空間的概率神經(jīng)網(wǎng)絡(luò)識(shí)別算法,有效解決了大樣本下未知干擾類(lèi)型的分類(lèi)識(shí)別問(wèn)題。
特征提取后需要將提取的特征參數(shù)輸入分類(lèi)算法中進(jìn)行分類(lèi)識(shí)別。目前對(duì)于干擾信號(hào)識(shí)別的研究大多基于傳統(tǒng)的機(jī)器學(xué)習(xí)的算法,比如支持向量機(jī)(Support Vector Machine,SVM)、決策樹(shù)、K 近鄰、反向傳播神經(jīng)網(wǎng)絡(luò)等。文獻(xiàn)[4]采用了分層決策樹(shù)的方法有效識(shí)別了直接序列擴(kuò)頻通信中的多種干擾信號(hào)。文獻(xiàn)[5]使用了支持向量機(jī)來(lái)識(shí)別直接序列擴(kuò)頻中的干擾,實(shí)驗(yàn)結(jié)果表明,當(dāng)干擾信號(hào)比大于或等于9 dB 時(shí),便可以準(zhǔn)確識(shí)別干擾信號(hào)的類(lèi)型。文獻(xiàn)[6]基于短時(shí)傅里葉變換的方法對(duì)信號(hào)的時(shí)頻特性進(jìn)行了分析,并對(duì)單音、多音和掃頻干擾信號(hào)進(jìn)行了有效的識(shí)別。
綜合國(guó)內(nèi)外研究現(xiàn)狀,目前對(duì)于TETRA 系統(tǒng)干擾信號(hào)識(shí)別的研究成果較少,但可以借鑒通信或雷達(dá)領(lǐng)域較為成熟的信號(hào)識(shí)別研究成果。本文從低復(fù)雜度、高識(shí)別率出發(fā),使用支持向量機(jī)、CART決策樹(shù)、隨機(jī)森林3 種分類(lèi)器,提取能區(qū)分單音、多音、窄帶噪聲、寬帶線(xiàn)性?huà)哳l干擾的4 種特征參數(shù),實(shí)現(xiàn)對(duì)TETRA 系統(tǒng)中的信號(hào)的智能干擾識(shí)別。實(shí)驗(yàn)結(jié)果表明,本文采用的3 種分類(lèi)器均具有出色的識(shí)別能力,其中決策樹(shù)模型表現(xiàn)最為突出,取得了最高99.99%的識(shí)別率。
本文結(jié)構(gòu)安排:第1 節(jié)簡(jiǎn)要介紹模式識(shí)別系統(tǒng);第2 節(jié)描述幾種常見(jiàn)干擾的數(shù)學(xué)模型,介紹干擾信號(hào)的幾種典型特征;第3節(jié)研究支持向量機(jī)、決策樹(shù)、隨機(jī)森林的分類(lèi)方法;第4 節(jié)基于第3 節(jié)所提及的分類(lèi)模型,進(jìn)行仿真實(shí)驗(yàn);第5 節(jié)總結(jié)全文,并指出今后相關(guān)技術(shù)改進(jìn)和研究的方向。
一般基于統(tǒng)計(jì)方法的模式識(shí)別系統(tǒng)都包括學(xué)習(xí)和預(yù)測(cè)兩個(gè)過(guò)程,主要由數(shù)據(jù)采集、預(yù)處理、特征提取、分類(lèi)識(shí)別4 個(gè)部分組成。在學(xué)習(xí)過(guò)程中,干擾信號(hào)采集模塊包含數(shù)據(jù)錄入和數(shù)據(jù)擴(kuò)充兩部分;預(yù)處理及特征提取將已知干擾類(lèi)型的樣本“數(shù)值化”后,刪除對(duì)分類(lèi)無(wú)效或無(wú)法被計(jì)算機(jī)識(shí)別的字符,盡可能保留對(duì)分類(lèi)差異有效的特征,進(jìn)行特征選擇,并對(duì)這些已知干擾類(lèi)型的特征數(shù)據(jù)進(jìn)行標(biāo)注;分類(lèi)識(shí)別模塊是利用得到的特征數(shù)據(jù)根據(jù)分類(lèi)算法識(shí)別訓(xùn)練樣本的結(jié)果對(duì)算法的參數(shù)進(jìn)行調(diào)整,得到準(zhǔn)確率較高的分類(lèi)模型。在預(yù)測(cè)過(guò)程中,通常先對(duì)未知干擾測(cè)試數(shù)據(jù)集進(jìn)行預(yù)處理并提取特征,得到測(cè)試數(shù)據(jù)集的特征數(shù)據(jù),最后用分類(lèi)決策模型對(duì)其進(jìn)行分類(lèi)和預(yù)測(cè)。模式識(shí)別過(guò)程如圖1 所示。
圖1 模式識(shí)別系統(tǒng)流程
本小節(jié)將研究單音干擾、多音干擾、窄帶噪聲干擾和寬帶線(xiàn)性?huà)哳l干擾4 種典型干擾,并主要分析時(shí)域、頻域上的4 種特征。
2.1.1 單音干擾
單音干擾[7](Continuous Wave Interference,CWI)是指在特定頻率上產(chǎn)生的通信頻帶內(nèi)的單頻率連續(xù)波干擾。單音干擾使通信信號(hào)的功率在某一個(gè)特定頻率點(diǎn)上放大,而對(duì)其他頻率點(diǎn)沒(méi)有影響。單音干擾時(shí)域上的數(shù)學(xué)模型可表示為:
式中:Pw為單音干擾的功率;fc為單音干擾的中心頻率;φ為隨機(jī)相位,在[0,2π]內(nèi)均勻分布。
2.1.2 多音干擾
多音干擾[8](Surplus Continuous Wave Interference,SCWI)指的是在通信頻帶中多個(gè)隨機(jī)或固定頻點(diǎn)處存在單個(gè)頻點(diǎn)的干擾,多音干擾類(lèi)似于單音干擾,具有能量集中、易于實(shí)現(xiàn)的特點(diǎn)。其時(shí)域上的數(shù)學(xué)模型表達(dá)式為:
式中:fI,i為多音干擾的第i個(gè)載波頻率;J為頻點(diǎn)總個(gè)數(shù);φi為fI,i對(duì)應(yīng)的相位,在[0,2π)內(nèi)服從均勻分布。
2.1.3 窄帶噪聲干擾
窄帶噪聲干擾[9](Narrow Band Interference,NBI)是指在整個(gè)通信頻帶中所占比例相對(duì)較小,干擾能量相對(duì)集中的一種噪聲干擾。如果通信信號(hào)的載頻跳到窄帶干擾頻帶范圍內(nèi),通信誤碼率將大大增加,通信性能將受到嚴(yán)重影響。窄帶噪聲干擾的產(chǎn)生過(guò)程比較簡(jiǎn)單。首先產(chǎn)生隨機(jī)高斯白噪聲n(t),它是全頻帶噪聲,其次讓n(t)經(jīng)過(guò)時(shí)域脈沖響應(yīng)為h(t)的窄帶濾波器,可得窄帶噪聲干擾在時(shí)域上的表示:
式中:τ為時(shí)延;h(t)可由窗函數(shù)H(j2πf)傅里葉逆變換得到。H(j2πf)的表達(dá)式為:
式中:f表示瞄準(zhǔn)頻率;fc為窄帶噪聲干擾的中心頻率;W1為干擾帶寬。
2.1.4 寬帶線(xiàn)性?huà)哳l干擾
寬帶線(xiàn)性?huà)哳l干擾[10](Linear Frequency Modulation Interference,LFMI)是指干擾的瞬時(shí)頻率隨時(shí)間呈線(xiàn)性變化。
寬帶線(xiàn)性?huà)哳l干擾在一段時(shí)間內(nèi)的頻率表現(xiàn)為寬頻帶,在一個(gè)時(shí)間點(diǎn)表現(xiàn)為單音,其頻率在一個(gè)掃頻周期內(nèi)隨時(shí)間線(xiàn)性變化。寬帶線(xiàn)性?huà)哳l干擾時(shí)域表達(dá)式為:
其中,線(xiàn)性?huà)哳l信號(hào)時(shí)域幅度為:
式中:f0為初始頻率;μ0為掃頻速率;φ0為初始相位;T為掃頻周期。
通常真實(shí)環(huán)境中的原始樣本的維度較高,含有很多冗余信息,如果不對(duì)原始樣本進(jìn)行特征提取,而將其直接作為分類(lèi)算法的輸入,往往無(wú)法取得很好的分類(lèi)識(shí)別效果。
本小節(jié)通過(guò)對(duì)常見(jiàn)的無(wú)線(xiàn)干擾信號(hào)進(jìn)行分析,在歸一化預(yù)處理后,針對(duì)干擾信號(hào)在時(shí)域、頻域以及變化域所表現(xiàn)出的不同特性,選取時(shí)域峰峰值、頻域波形指標(biāo)、功率譜熵、時(shí)域矩偏度系數(shù)4 種特征數(shù)據(jù)作為識(shí)別算法的輸入[11]。
2.2.1 時(shí)域峰峰值
時(shí)域峰峰值[11]是指在一個(gè)周期內(nèi)信號(hào)的最高值和最低值之間的差值,表示信號(hào)值的變化范圍的大小,定義為:
式中:Xmax為時(shí)域中的信號(hào)幅度最大值;Xmin為幅度最小值。
2.2.2 頻域波形指標(biāo)
頻域波形指標(biāo)[11]表示信號(hào)的實(shí)際波形與標(biāo)準(zhǔn)正弦波的差異和畸變。其值等于信號(hào)的均方根值除以絕對(duì)平均值,即
2.2.3 功率譜熵
功率譜熵[12]表示信號(hào)功率譜的不確定性,描述被分析信號(hào)的譜形結(jié)構(gòu),反映了信號(hào)頻譜的不確定性和復(fù)雜程度,定義為:
式中:pi為在頻率i處的功率譜概率密度分布函數(shù)值。
2.2.4 時(shí)域矩偏度系數(shù)a3
對(duì)接收信號(hào)Xi求平均值和標(biāo)準(zhǔn)差,則a3時(shí)域矩偏度系數(shù)[13]為:
時(shí)域矩偏度系數(shù)a3描述信號(hào)相對(duì)于正態(tài)分布的偏離程度,a3越大,偏離正態(tài)分布程度越大。
基于特征提取的干擾識(shí)別,已經(jīng)有很多的分類(lèi)算法,如支持向量機(jī)[14-15](Support Vector Machine,SVM)、決策樹(shù)[16]、反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)[17]等。本文基于監(jiān)督學(xué)習(xí)的不同算法對(duì)第2 節(jié)研究的干擾信號(hào)進(jìn)行分類(lèi)識(shí)別。
支持向量機(jī)是一種對(duì)分類(lèi)、回歸任務(wù)具有優(yōu)良效果的機(jī)器學(xué)習(xí)模型。二分類(lèi)支持向量機(jī)的基本思想是找到一個(gè)超平面使得正負(fù)兩類(lèi)樣本被分割在超平面的兩側(cè)。典型的支持向量機(jī)只能處理二分類(lèi)的問(wèn)題,不適用于大規(guī)模樣本及多分類(lèi)問(wèn)題。目前,多分類(lèi)支持向量機(jī)的分類(lèi)方法主要包括兩種:一是將多個(gè)分類(lèi)平面的參數(shù)求解組合成一個(gè)最優(yōu)化問(wèn)題,通過(guò)求解該最優(yōu)化問(wèn)題實(shí)現(xiàn)多類(lèi)分類(lèi);二是將多分類(lèi)問(wèn)題拆為多個(gè)二分類(lèi)問(wèn)題,再采取某種方法將多個(gè)二分類(lèi)器的輸出組合到一起并完成多類(lèi)分類(lèi)。
SVM 又可分為線(xiàn)性與非線(xiàn)性模型,線(xiàn)性SVM的前提假設(shè)是輸入空間線(xiàn)性可分,即存在劃分超平面。但真實(shí)的數(shù)據(jù)往往非線(xiàn)性可分,即不存在劃分超平面,這時(shí)可以利用核函數(shù)把低維空間中的非線(xiàn)性可分問(wèn)題,轉(zhuǎn)化為高維空間中的線(xiàn)性可分問(wèn)題。具體地,通過(guò)核函數(shù)K(·,·)來(lái)實(shí)現(xiàn)數(shù)據(jù)到高維空間的映射,從而解決在原始空間中線(xiàn)性不可分的問(wèn)題。
核函數(shù)的選擇對(duì)于SVM 模型至關(guān)重要,如果核函數(shù)的選擇不合適,那么就無(wú)法實(shí)現(xiàn)輸入空間到線(xiàn)性可分的特征空間的映射。常用的核函數(shù)見(jiàn)表1[18]。
表1 常用核函數(shù)
決策樹(shù)是一種常見(jiàn)的基于樹(shù)的學(xué)習(xí)算法,主要包括樹(shù)的構(gòu)造和剪枝過(guò)程,其構(gòu)造揭示了決策樹(shù)的生成過(guò)程,其中最關(guān)鍵的一步是選擇什么屬性作為分叉的節(jié)點(diǎn),即特征選擇。常用的特征選擇的準(zhǔn)則是信息增益或基尼指數(shù)。根據(jù)生成算法遞歸地產(chǎn)生的決策樹(shù)往往對(duì)訓(xùn)練數(shù)據(jù)具有很高的分類(lèi)準(zhǔn)確率,但在未知測(cè)試數(shù)據(jù)上的分類(lèi)準(zhǔn)確率顯著降低,即出現(xiàn)過(guò)擬合現(xiàn)象。針對(duì)這個(gè)問(wèn)題,目前采取的措施都是對(duì)已生成的決策樹(shù)進(jìn)行剪枝,以達(dá)到簡(jiǎn)化分類(lèi)樹(shù)模型的目的。決策樹(shù)常用的算法有ID3(Iterative Dichotomiser 3)、C4.5 和分類(lèi)與回歸樹(shù)(Classification And Regression Tree,CART)算法。本文使用的是CART 算法。圖2 是一個(gè)簡(jiǎn)單的決策樹(shù)的示意圖。
圖2 決策樹(shù)模型
隨機(jī)森林是將決策樹(shù)作為基分類(lèi)器的一種集成算法,它可以用于分類(lèi)和回歸任務(wù)。隨機(jī)森林是由很多通過(guò)隨機(jī)選擇產(chǎn)生的互不相關(guān)的決策樹(shù)組成的。相比決策樹(shù)而言,隨機(jī)森林沒(méi)有剪枝的過(guò)程,通過(guò)兩個(gè)隨機(jī)采樣的過(guò)程,就可降低過(guò)擬合的風(fēng)險(xiǎn)。首先,通過(guò)自助法有放回地抽樣得到N個(gè)子數(shù)據(jù)集;其次,每個(gè)子數(shù)據(jù)集訓(xùn)練出1 個(gè)決策樹(shù),根據(jù)每個(gè)決策樹(shù)的判決結(jié)果進(jìn)行投票,將票數(shù)最多的結(jié)果作為最終的分類(lèi)結(jié)果。隨機(jī)森林的基本模型如圖3所示。
圖3 隨機(jī)森林基本模型
本文通過(guò)MATLAB 軟件對(duì)采樣數(shù)據(jù)進(jìn)行預(yù)處理及特征提取,得到5 種待識(shí)別信號(hào)的特征數(shù)據(jù):未受干擾的TETRA 通信信號(hào)特征數(shù)據(jù),TETRA信號(hào)受到單音干擾后的特征數(shù)據(jù)(在表2 中簡(jiǎn)記為T(mén)ETRA+CWI),TETRA 信號(hào)受到多音干擾后的特征數(shù)據(jù)(簡(jiǎn)記為T(mén)ETRA+SCWI),TETRA 信號(hào)受到寬帶線(xiàn)性?huà)哳l干擾后的特征數(shù)據(jù)(簡(jiǎn)記為T(mén)ETRA+LFMI),TETRA 信號(hào)受到窄帶噪聲干擾后的特征數(shù)據(jù)(簡(jiǎn)記為T(mén)ETRA+NBI)。信號(hào)參數(shù)設(shè)置為:TETRA 通信信號(hào)采樣率為9.21 MHz,中心頻率為380 MHz,帶寬為600 kHz,調(diào)制方式為4/π-DQPSK;疊加的單音干擾信號(hào)采樣頻率的20 kHz,頻率為1 kHz、幅值為1 V;疊加的多音干擾信號(hào)是由7 個(gè)獨(dú)立的余弦信號(hào)組合而成,中心頻率分別是850 Hz、900 Hz、950 Hz、1 000 Hz、1 050 Hz、1 100 Hz、1 150 Hz,采樣頻率為20 kHz,幅值為1 V;窄帶噪聲為高斯白噪聲,噪聲功率為3 dBw,采樣頻率為1 kHz;寬帶線(xiàn)性?huà)哳l干擾信號(hào)的掃頻斜率為95 Hz/s,信號(hào)幅度為1 V。
實(shí)驗(yàn)特征數(shù)據(jù)如表2 所示。本文將這5 種特征數(shù)據(jù)作為分類(lèi)器的輸入,然后使用不同的分類(lèi)算法進(jìn)行識(shí)別并比較了不同參數(shù)對(duì)它們的識(shí)別效果的影響。
表2 TETRA 系統(tǒng)信號(hào)特征數(shù)據(jù)庫(kù)信息
盡管線(xiàn)性SVM 分類(lèi)器在很多案例上表現(xiàn)得很好,但現(xiàn)實(shí)中的很多數(shù)據(jù)集并不是線(xiàn)性可分的。本實(shí)驗(yàn)對(duì)比了幾種核函數(shù)支持向量機(jī)。
常用的非線(xiàn)性核函數(shù)有多項(xiàng)式核、高斯核。很多分類(lèi)問(wèn)題應(yīng)用高斯核函數(shù)比多項(xiàng)式核函數(shù)能獲得更好的精確度[19-21]。為了驗(yàn)證這一點(diǎn),本文比較了三種核函數(shù)在同一特征集中的分類(lèi)效果。
本實(shí)驗(yàn)選擇了γ=0.1、C=500,γ=0.1、C=1 000,γ=0.01、C=500,γ=0.01、C=1 000,4 種高斯核和兩種次數(shù)分別為2 和4 的多項(xiàng)式核函數(shù)進(jìn)行實(shí)驗(yàn)。表3 所示的仿真實(shí)驗(yàn)表明,雖然這些方法的準(zhǔn)確率相差不大,但在測(cè)試集中,不同的參數(shù)對(duì)精度也有不同程度的影響。采用四次多項(xiàng)式核函數(shù)的SVM 的分類(lèi)效果略好于二次多項(xiàng)式核函數(shù)。如果采用高斯核,C越大,訓(xùn)練得到的模型準(zhǔn)確率越低,而參數(shù)γ的值對(duì)精度的影響與C有關(guān)。如表3 所示。
表3 采用不同核函數(shù)的SVM 對(duì)TETRA 數(shù)據(jù)庫(kù)的分類(lèi)結(jié)果
本次實(shí)驗(yàn)采用CART 決策樹(shù)算法,對(duì)TETRA特征數(shù)據(jù)庫(kù)(5 類(lèi)信號(hào)特征數(shù)據(jù)集)進(jìn)行分類(lèi)識(shí)別?;跊Q策樹(shù)的識(shí)別流程如圖4 所示。
為了對(duì)比不同特征參數(shù)對(duì)決策樹(shù)識(shí)別結(jié)果的影響,采用主成分分析(Principal Components Analysis,PCA)算法對(duì)特征參數(shù)降維,使用基尼指數(shù)來(lái)選擇特征得到貢獻(xiàn)度最大的4 個(gè)特征作為決策樹(shù)的輸入進(jìn)行識(shí)別,識(shí)別流程如圖4 所示。
圖4 基于CART 決策樹(shù)算法的信號(hào)識(shí)別流程
從圖4 可以看出,通過(guò)時(shí)域峰峰值,將信號(hào)分成兩類(lèi):TETRA 信號(hào)、受到寬帶線(xiàn)性?huà)哳l干擾的信號(hào)、受到窄帶噪聲干擾的信號(hào),以及受到多音干擾的信號(hào)、受到單音干擾的信號(hào)。
針對(duì)TETRA 信號(hào)、受到寬帶線(xiàn)性?huà)哳l干擾的信號(hào)、受到窄帶噪聲干擾的這3 種信號(hào),通過(guò)頻域波形指標(biāo)識(shí)別出TETRA 信號(hào),并利用功率譜熵,識(shí)別出受到寬帶線(xiàn)性?huà)哳l的信號(hào)和受到窄帶噪聲干擾的信號(hào)。
針對(duì)受到多音干擾、單音干擾的信號(hào),利用時(shí)域矩偏度系數(shù)將受到多音干擾和受到單音干擾的信號(hào)識(shí)別開(kāi)來(lái)。
再將上述仿真實(shí)驗(yàn)與時(shí)頻域32 個(gè)全部特征作為決策樹(shù)的輸入結(jié)果進(jìn)行比較,仿真結(jié)果對(duì)比如表4 所示??梢钥闯觯黾犹卣鱾€(gè)數(shù),基于決策樹(shù)的5 種信號(hào)的識(shí)別率變化不大。選擇貢獻(xiàn)度最大的4 個(gè)特征參數(shù)對(duì)信號(hào)的識(shí)別率高達(dá)99.98%,因此決策樹(shù)模型對(duì)TETRA 數(shù)據(jù)庫(kù)具有非常好的識(shí)別效果。
表4 不同特征數(shù)目下的TETRA 數(shù)據(jù)庫(kù)識(shí)別結(jié)果
同樣對(duì)TETRA 數(shù)據(jù)集進(jìn)行仿真實(shí)驗(yàn),共5 種待識(shí)別信號(hào)。決策樹(shù)數(shù)目以1 為間隔,從1 到21取值,本節(jié)算法在整個(gè)測(cè)試集上所有測(cè)試數(shù)據(jù)平均正確識(shí)別率如圖5 所示??梢钥闯?,信號(hào)平均正確識(shí)別率隨決策樹(shù)數(shù)目增加而有所提高,但決策樹(shù)數(shù)目大于7 時(shí),增長(zhǎng)趨于平穩(wěn)。因此當(dāng)決策樹(shù)數(shù)目為7 時(shí),隨機(jī)森林模型已達(dá)到最高98%的識(shí)別率,因此本模型選擇的決策樹(shù)數(shù)目為7。
圖5 信號(hào)平均識(shí)別率
為了在復(fù)雜電磁環(huán)境中快速、準(zhǔn)確地識(shí)別TETRA通信信號(hào)受到的干擾樣式,本文深入分析信號(hào)的時(shí)域、頻域以及時(shí)頻域的特征參數(shù),使用了SVM、決策樹(shù)以及隨機(jī)森林3 種算法對(duì)信號(hào)進(jìn)行智能識(shí)別,并根據(jù)不同的參數(shù)對(duì)識(shí)別性能的影響進(jìn)行了對(duì)比分析。
在實(shí)際應(yīng)用中TETRA 系統(tǒng)的干擾普遍存在,而關(guān)于干擾信號(hào)的識(shí)別研究比較少,本研究彌補(bǔ)了TETRA 系統(tǒng)干擾信號(hào)識(shí)別的空缺,具有重大的現(xiàn)實(shí)意義。本文的主要貢獻(xiàn)包括以下4 個(gè)方面。
(1)構(gòu)建了TETRA 系統(tǒng)信號(hào)特征數(shù)據(jù)庫(kù)。無(wú)干擾的信號(hào)(TETRA 系統(tǒng)中的原始信號(hào))和受到干擾(單音、多音、寬帶線(xiàn)性?huà)哳l、窄帶噪聲)的信號(hào)特征數(shù)據(jù)庫(kù)。以往的干擾信號(hào)識(shí)別的研究?jī)H針對(duì)幾個(gè)單一干擾信號(hào)的識(shí)別,然而現(xiàn)實(shí)中接收器接收到的信號(hào)常常是疊加了干擾后的信號(hào),因此本文首先在原始信號(hào)上分別疊加4 種不同的干擾,其次將未受干擾的原始信號(hào)和這4 種疊加干擾后的信號(hào)作為分類(lèi)識(shí)別算法的輸入進(jìn)行分類(lèi)識(shí)別。故本文的研究更具現(xiàn)實(shí)意義。
(2)不同的核函數(shù)被應(yīng)用到SVM 中來(lái)識(shí)別不同類(lèi)型的信號(hào)。
(3)使用不同的特征個(gè)數(shù)的決策樹(shù)的實(shí)驗(yàn)結(jié)果表明,只需要幾個(gè)有分類(lèi)能力的特征就可以對(duì)信號(hào)進(jìn)行有效的識(shí)別。
(4)仿真研究了隨機(jī)森林中的決策樹(shù)數(shù)目的不同取值對(duì)識(shí)別率的影響,并找到了最佳的決策樹(shù)數(shù)目。
本文使用的3 種分類(lèi)識(shí)別算法都具有較高的識(shí)別率,如果用SVM 處理多元分類(lèi)通常要消耗更多的內(nèi)存且比較費(fèi)時(shí),而隨機(jī)森林和決策樹(shù)結(jié)構(gòu)簡(jiǎn)單,訓(xùn)練速度快,更適合多元分類(lèi)。由于隨機(jī)森林的一個(gè)缺點(diǎn)是對(duì)于有不同取值的屬性的數(shù)據(jù),取值劃分較多的屬性會(huì)對(duì)隨機(jī)森林產(chǎn)生很大的影響,故結(jié)合實(shí)驗(yàn)結(jié)果可知,決策樹(shù)對(duì)于本文的數(shù)據(jù)識(shí)別效果最好。
筆者后續(xù)可研究的方向?yàn)槿绾斡行ёR(shí)別疊加了多種干擾的信號(hào),以及深度學(xué)習(xí)在干擾識(shí)別中的應(yīng)用等。