馮祥??,陳良彬
(空軍第一航空學(xué)院,河南信陽464000)
基于主成分分析和獨(dú)立成分分析的調(diào)制分類算法?
馮祥??,陳良彬
(空軍第一航空學(xué)院,河南信陽464000)
基于主成分分析(PCA)和獨(dú)立成分分析(ICA),提出了一種新的調(diào)制分類算法。算法采用PCA對樣本數(shù)據(jù)降維、去除冗余成分,采用FastICA方法提取分類特征;采用支持矢量機(jī)(SVM)作為分類器,以解決數(shù)據(jù)在低維空間中的不可分問題。該算法具有較低的復(fù)雜度和較高的訓(xùn)練速度。仿真表明,與最大似然(ML)算法相比,算法僅具有1.8 dB的信噪比損失,在Rayleigh慢衰落信道和中速運(yùn)動的條件下,算法對5種QAM調(diào)制類型具有較好的分類性能。
通信信號;調(diào)制分類;主成分分析;獨(dú)立成分分析;支持矢量機(jī)
通信信號調(diào)制類型自動分類技術(shù)是軟件無線電、認(rèn)知無線電的重要技術(shù)基礎(chǔ),在軍事和民用通信系統(tǒng)中均具有廣泛應(yīng)用價值,自該技術(shù)引起人們注意以來,相關(guān)研究一直是人們的關(guān)注熱點(diǎn),提出了很多分類算法[1-5]。隨著研究的深入,人們關(guān)注的焦點(diǎn)集中在如何在小樣本、低信噪比、衰落信道條件下設(shè)計出性能較好的調(diào)制分類器,使該分類器能夠以較高的正確識別率,有效識別種類盡可能多的調(diào)制類型,并且要求分類器具有盡可能小的計算量,以滿足在線、訓(xùn)練對速度的要求。達(dá)到上述目的采取的技術(shù)途徑主要有兩種:一種是采用先進(jìn)的信號處理技術(shù)[4-5],通過對觀測樣本的有效處理,達(dá)到對抗信道衰落、有效提取分類特征的目的,最后通過求得歐式距離實(shí)現(xiàn)對樣本調(diào)制類型的識別,這種方法的缺點(diǎn)是環(huán)境適應(yīng)性不好;另一種方法是以統(tǒng)計學(xué)習(xí)理論為基礎(chǔ),設(shè)計穩(wěn)健的分類器,使調(diào)制類型分類器具有較為廣泛的適應(yīng)、推廣能力,該方法在小樣本條件下的性能一般較差。分集技術(shù)是第一種辦法采用的技術(shù)途徑之一,通過分集達(dá)到對抗多徑衰落、獲得一定的分集增益、提高低信噪比環(huán)境下調(diào)制分類器性能的目的[5];主成分分析(PCA)和獨(dú)立成分分析(ICA)[6-7]是通過多觀測樣本壓縮、降維以及尋求反映樣本內(nèi)在獨(dú)立成分的辦法,提取分類特征,以滿足減小計算量、對抗干擾和衰落的目的,PCA/ICA也屬于先進(jìn)信號處理范疇,ICA與基函數(shù)確定的小波變換不同,它是根據(jù)樣本數(shù)據(jù)本身進(jìn)行變換,對處理樣本具有一定的適應(yīng)性;支持矢量機(jī)(SVM)是求解模式識別問題的有效工具,其最大的優(yōu)點(diǎn)是可在樣本有限的情況下獲得最優(yōu)解[2,8]。本文在Rayleigh衰落信道下,將PCA/ICA和SVM結(jié)合,研究了幾種MQAM(Multiple Quadrature Amplitude Modulation)調(diào)制類型的分類問題,通過理論分析證明了算法的正確性,并通過仿真實(shí)驗(yàn)驗(yàn)證了算法的環(huán)境適應(yīng)性。
2.1 主成分分析
主成分分析(PCA)的核心去掉樣本的冗余信息,只留下代表樣本主要信息的成分,以實(shí)現(xiàn)對樣本數(shù)據(jù)降維,達(dá)到減少計算量的目的,通過PCA變換后的新成分分量不相關(guān)或正交。
設(shè)樣本來自備擇集合中的L種調(diào)制類型,獨(dú)立等概率地選取每種調(diào)制類型的K個樣本數(shù)據(jù),將這些原始樣本構(gòu)成一個數(shù)據(jù)矩陣XL×K,其協(xié)方差矩陣為R=XXT,可對該協(xié)方差矩陣作特征值分解:
其中,T表示轉(zhuǎn)置,Λ為協(xié)方差矩陣的特征值對角陣,U為相應(yīng)的特征矩陣,對原始樣本作如下變換:
式中,P為原始樣本矩陣的主成分,p1是第一主成分,pk為第k主成分,選取前d個主成分,舍棄其余主成分,構(gòu)成新的特征樣本P′,新的特征樣本是對原始樣本的降維、壓縮,去掉了一些冗余信息。
2.2 獨(dú)立成分分析
在模式識別方法中,高階統(tǒng)計量中包含了樣本的很多重要信息,獨(dú)立成分分析(ICA)正是一種基于高階統(tǒng)計量,尋求樣本內(nèi)在統(tǒng)計獨(dú)立成分的方法,并將相互獨(dú)立的原始樣本成分從混合樣本中提取出來,它屬于盲信號分離的范疇,其一般模型為[6]
其中,X是觀測樣本,獨(dú)立成分分析就是在混合矩陣A和獨(dú)立源信號S未知的情況下,尋求分離矩陣W(W=A-1),使y=WX是對S的最優(yōu)估計。從本質(zhì)上來講,ICA的求解問題可以轉(zhuǎn)化為使y非高斯性最大化的問題。根據(jù)信息論的知識,高斯變量具有最大的熵,因此一般采用負(fù)熵作為度量變量非高斯的準(zhǔn)則,其表達(dá)式為
其中,v是標(biāo)準(zhǔn)高斯隨機(jī)變量,函數(shù)G可以取Hyvarinen推薦的兩個函數(shù)[6-7]:
分離矩陣W可以用基于負(fù)熵最大化的快速算法FastICA[7]獲得,該算法比其他ICA算法收斂速度更快。
將PCA、ICA應(yīng)用到調(diào)制分類領(lǐng)域,核心就是通過對樣本的處理,減少環(huán)境、干擾對信號的影響,以獲得識別不同調(diào)制類型的本質(zhì)特征,基于PCA/ICA的調(diào)制分類特征提取步驟總結(jié)如下:
(1)對每種調(diào)制類型的訓(xùn)練樣本去中心化:S=S-E(S);
(2)求協(xié)方差矩陣R;
(3)求主成分矩陣P′;
(4)運(yùn)用FastICA算法求分離矩陣W,進(jìn)而得到ICA獨(dú)立基子空間Y=WP′;
(5)對備擇集合每種調(diào)制類型,求其對應(yīng)的特征向量Fn=Y(jié)Sn,并組成特征矢量矩陣F=[F1,F(xiàn)2,…FN]T。
支持矢量機(jī)(SVM)是V.Vapnik提出的一種基于結(jié)構(gòu)風(fēng)險最小化的一種有監(jiān)督的分類方法,該方法的核心思想是通過非線性映射將輸入向量變換到高維特征空間,在高維特征空間中構(gòu)造最優(yōu)分類超平面,并在此特征空間中達(dá)到分類樣本的目的[8]。
對于線性可分問題,利用拉格朗日乘子法求解,得到最優(yōu)分類函數(shù)為
其中,sgn(·)是符號函數(shù),ai為拉格朗日乘子。對于線性不可分問題,V.Vapnik[8]引入核空間理論,通過選擇合適的映射函數(shù),將低維空間不可分的問題,轉(zhuǎn)化為高維空間的線性可分問題。理論上來說,滿足Mercer條件的對稱函數(shù)K(xi,x)都可以實(shí)現(xiàn)這種映射關(guān)系:
這就是支撐矢量機(jī)(SVM),其基本思想可以概括為:首先通過滿足Mercer條件的核函數(shù)(如徑向基核函數(shù)、多項(xiàng)式核函數(shù))將輸入樣本變換到高維空間,然后在高維空間中求取最優(yōu)分類超平面,實(shí)現(xiàn)對樣本的分類。
利用經(jīng)過PCA壓縮、降維和ICA提取的分類特征,就可訓(xùn)練和設(shè)計SVM分類器,本文選擇徑向基核函數(shù)K(xi,x)=exp{-|x-xi|2/(2c2)},c為核函數(shù)寬度,其大小影響支持矢量的個數(shù),因而核函數(shù)寬度會對分類面的形成產(chǎn)生影響。此外,由于標(biāo)準(zhǔn)SVM是一個二值分類器,將SVM應(yīng)用到多種調(diào)制類型的分類情形時,涉及一個將標(biāo)準(zhǔn)SVM推廣到多值分類的問題,構(gòu)造一個基于SVM的多值分類器的基本方法是將多個二值分類器進(jìn)行組合,具體實(shí)現(xiàn)方法有1對1、1對多、DDAG等3種。這3種方法各有特點(diǎn):1對1的實(shí)現(xiàn)方法的優(yōu)點(diǎn)是思路簡單、容易實(shí)現(xiàn)且分類識別效果較好,缺點(diǎn)是需要訓(xùn)練的SVM子分類器的數(shù)目較多;1對多的實(shí)現(xiàn)方法的優(yōu)點(diǎn)是需要訓(xùn)練的SVM分類器數(shù)目較少,對一個L分類問題,需要設(shè)計和訓(xùn)練的SVM子分類器個數(shù)為L個,缺點(diǎn)是容易出現(xiàn)不可分和分類重疊的問題;DDAG分類器的優(yōu)點(diǎn)是測試速度較快,缺點(diǎn)是分類精度依賴于DAG上類別的順序。
綜合考慮,我們選擇采用1對1的方法實(shí)現(xiàn)調(diào)制類型分類器,具體實(shí)現(xiàn)方法如下:在SVM的分類器設(shè)計中,每次只考慮兩類調(diào)制類型樣本,即對每兩類調(diào)制類型樣本設(shè)計一個SVM子分類器,假設(shè)備擇分類集合共有L類調(diào)制類型樣本,需要設(shè)計的SVM子分類器總個數(shù)為L(L-1)/2個。設(shè)用于識別第i類和第j類調(diào)制類型的分類函數(shù)是fij(x),如果fij(x)>0,則認(rèn)為x是第i類調(diào)制類型,給第i類調(diào)制類型加1,否則給第j類調(diào)制類型加1。這樣測試樣本經(jīng)過L(L-1)/2個SVM子分類器的判決后,選擇計數(shù)最多的那類調(diào)制類型作為最終的分類識別類型。
為了評估本文提出的基于PCA/ICA調(diào)制分類算法的性能,我們在Rayleigh慢衰落信道下對算法進(jìn)行了仿真,觀測樣本模型為
式中,{s(n)=sI(n)+j·sQ(n)}是一個獨(dú)立同分布的復(fù)符號序列,均值為零,它的取值來自于與調(diào)制類型相對應(yīng)的星座圖,信號能量為E;w(n)是一個均值為零、方差為N0的高斯噪聲序列,信噪比定義為SNR=E/N0;hejφ表示Rayleigh信道復(fù)衰落因子。
仿真中,考慮備擇分類集合{2QAM,4QAM,8QAM,16QAM,64QAM},信道采用Jakes模型,考慮低速移動及普通商用頻段的情況,移動設(shè)備速度取2 m/s,載波頻率取900 MHz。
訓(xùn)練分類器階段,在0 dB、3 dB和6 dB 3種信噪比條件下,備擇集合的每種調(diào)制類型各產(chǎn)生50個訓(xùn)練樣本組成訓(xùn)練集合對分類器訓(xùn)練,取徑向基核函數(shù)的寬度c=0.5。
仿真實(shí)驗(yàn)一本實(shí)驗(yàn)的目的是為了觀察算法隨信噪比的變化情況,以驗(yàn)證算法的有效性。表1給出了信噪比(SNR)為10 dB、觀測樣本為300時分類算法識別率的混淆矩陣,可以看出,5種調(diào)制類型的正確識別率均在0.98以上。為了進(jìn)一步考察信噪比對分類算法性能的影響,圖1給出了算法總體正確識別率隨信噪比的變化情況,觀測樣本分別為200和300,信噪比從0 dB變化到16 dB,當(dāng)觀測樣本為200,信噪比大于10 dB時,總體識別率接近0.99。
表1 正確識別率的混淆矩陣(SNR=10 dB)Table 1 The confusion matrix of the correct classification probability when SNR=10 dB
圖1PCA/ICA調(diào)制分類算法性能Fig.1 Performance of the PCA/ICA modulation classification algorithm
最大似然(ML)分類算法對同一分類集合的識別性能,可以視為其他算法分類性能的所能達(dá)到的上限[1],為了進(jìn)一步說明本文算法的有效性,圖1還給出了最大似然分類法對備擇集合的分類性能,可以看出,在信噪比大于10 dB時,本文算法和ML算法的識別性能極為接近,當(dāng)觀測樣本為200、總體正確識別率到達(dá)0.9時,本文算法與最大似然分類算法相比較僅有1.8 dB的信噪比損失。
仿真實(shí)驗(yàn)二本實(shí)驗(yàn)的目的是為了考察算法對移動設(shè)備速度的適應(yīng)性。實(shí)驗(yàn)中觀測樣本為200個和300個,SNR=10 dB,信道采用Jakes模型,圖2給出了備擇分類集合中5種調(diào)制類型的正確識別率隨歸一化多普勒頻率(與設(shè)備移動速度對應(yīng))的變化曲線,可以看出,當(dāng)歸一化多普勒頻率小于2.0×10-4(對應(yīng)的移動速度為20 m/s)時,算法的識別性能隨歸一化多普勒頻率變化較小,當(dāng)設(shè)備的移動速度越來越快時,算法的識別性能越來越差,并且觀測樣本數(shù)目越多,設(shè)備的移動速度對算法性能的影響越大。
圖2 多普勒頻率對算法性能的影響(SNR=10 dB)Fig.2 The effect of Doppler frequency on modulation classification algorithm when SNR=10 dB
通信信號調(diào)制分類本質(zhì)上是一個模式識別問題,其核心是分類特征的提取和分類器的設(shè)計。本文提出的基于PCA/ICA提取樣本分類特征的方法,實(shí)現(xiàn)了對樣本數(shù)據(jù)的壓縮和降維,在有效提取分類特征的前提下,減少了運(yùn)算量。在設(shè)計分類器時,我們采用基于結(jié)構(gòu)風(fēng)險最小化的SVM方法,以保證分類器在小樣本條件下的識別性能,解決了低維空間的不可分問題。仿真實(shí)驗(yàn)表明,在Rayleigh慢衰落信道下,算法在較大的信噪比范圍內(nèi)對5種調(diào)制類型具有較高的正確識別率,當(dāng)信噪比大于10 dB時,其識別性能與ML算法非常接近,在正確識別率為0.9時,與ML算法相比較,本文算法僅具有1.8 dB
的信噪比損失。同時,在低速移動(速度小于20 m/s)的情況下,算法也具有較好的適應(yīng)性能。
[1]Hameed F,Dobre O A,Popescu D C.Likelihood-based modulation classification:On the computational complexity and performance bounds[J].IEEE Transactions on Wireless Communications,2009,52(8):5884-5892.
[2]李一兵,葛娟,林云.基于熵特征和支持向量機(jī)的調(diào)制識別方法[J].系統(tǒng)工程與電子技術(shù),2012,34(8):1691-1695. LI Yi-bing,GE Juan,LIN Yun.Modulation recognition usingentropy features and SVM[J].Systems Engineering and Electronics,2012,34(8):1691-1695.(in Chinese)
[3]LIU Ai-sheng ZHU Qi.Automatic modulation classification based on the combination of clustering and neural network[J].China Universities of Posts and Telecommunicatons,2011,18(4):13-19,38.
[4]Orlic V D,Dukic M L.Automatic modulation classification algorithm using higher-order cumulants under real-world channel conditions[J].IEEE Communications Letters,2009,13(12):917-919.
[5]李艷玲,李兵兵,劉明騫.瑞利衰落信道中基于分集技術(shù)的MQAM信號的識別[J].北京郵電大學(xué)學(xué)報,2012,35(4):64-67. LI Yan-ling,LI Bing-bing,LIU Ming-qian.Spatial Diversity Based MQAM Modulation Classification in Rayleigh Fading Channel[J].Journal of Beijing University of Posts and Telecommunications,2012,35(4):64-67.(in Chinese)
[6]Hyvarinen A,Oja E.Independent component analysis:algorithms and applications[J].Neural Networks,2000,13(4-5):411-430.
[7]Hyvarinen A.Fast and robust fixed-point algorithm for independent component analysis[J].IEEE Transactions on Neural Network,1999,10(3):626-634.
[8]張學(xué)工.統(tǒng)計學(xué)習(xí)理論的本質(zhì)[M].北京:清華大學(xué)出版社,2000. ZHANG Xue-gong.The nature of statistical learning theory[M]. Beijing:Tsinghua University Press,2000.(in Chinese)
FENG Xiang was born in Xinyang,Henan Province,in 1968.He received the Ph.D.degree from Xidian University in 2008.He is now a professor.His research interests include communication countermeasure,digital signal processing and adaptive transmission.
Email:wirelessfx@126.com
陳良彬(1976—),女,河南信陽人,碩士,講師,主要研究方向?yàn)榫W(wǎng)絡(luò)安全、保密通信等。
CHEN Liang-bin was born in Xinyang,Henan Province,in 1976.She is now a lecturer with the M.S.degree.Her research concerns network security and secret communication.
Modulation Classification Algorithm Based on PCA and ICA
FENG Xiang,CHEN Liang-bin
(The First Aeronautical Institute of Air Force,Xinyang 464000,China)
A principal component analysis(PCA)and independent component analysis(ICA)based modulation classification algorithm is presented.The samples are first processed by PCA to reduce their dimension and eliminate their redundancies,and then the classification features are obtained by the FastICA algorithm.The Support Vector Machine(SVM)is applied to solve the non-separable problem in low dimension space.The algorithm is less complex computationally and has faster classifier training speed compared with other algorithms.The extensive simulation results show that the proposed algorithm has only 1.8 dB SNR loss,and exhibits better classification performance under Rayleigh channel and medium movement condition.
communication signal;modulation classification;principal component analysis;independent component analysis;support vector machine
date:2013-05-16;Revised date:2013-06-18
??通訊作者:wirelessfx@126.comCorresponding author:wirelessfx@126.com
TN911
A
1001-893X(2013)07-0864-04
馮祥(1968—),男,河南信陽人,博士,教授,主要研究方向?yàn)橥ㄐ艑?、?shù)字信號處理、自適應(yīng)傳輸?shù)龋?/p>
10.3969/j.issn.1001-893x.2013.07.008
2013-05-16;
2013-06-18