任 靜,李維勤,惠 鏸
REN Jing1,LI Weiqin2,HUI Hui2
1.西安航空學(xué)院 計(jì)算機(jī)工程系,西安 710077
2.西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,西安 710048
1.Department of Computer Engineering,Xi’an Aeronautical University,Xi’an 710077,China
2.School of Automation and Information Engineering,Xi’an University of Technology,Xi’an 710048,China
盲信號(hào)分離是目前信號(hào)處理領(lǐng)域的研究熱點(diǎn)問題,獲得了迅速發(fā)展和廣泛應(yīng)用[1-5]。盲信號(hào)分離是指在未知源信號(hào)和傳輸通道參數(shù)的情況下,依據(jù)某種準(zhǔn)則,僅僅由觀測(cè)信號(hào)恢復(fù)出源信號(hào),其算法的性能依賴于信號(hào)的概率分布特性。信號(hào)的峭度(峰度)對(duì)信號(hào)概率分布特性的影響較大。一個(gè)信號(hào)y的歸一化峭度定義為:
當(dāng)歸一化峭度為負(fù)值時(shí),則稱該信號(hào)為輕拖尾信號(hào),也稱亞高斯信號(hào);當(dāng)峭度為正值時(shí),則該信號(hào)為重拖尾信號(hào),也稱超高斯信號(hào)。重拖尾信號(hào)的概率密度函數(shù)的拖尾較重。
傳統(tǒng)的盲分離算法對(duì)于輕拖尾和重拖尾信號(hào)混合時(shí)的分離效果一般。為此,相關(guān)學(xué)者提出一些改進(jìn)算法,其核心是自適應(yīng)動(dòng)態(tài)切換,對(duì)重拖尾信號(hào)和輕拖尾信號(hào)分別取不同的非線性函數(shù)。但是由于評(píng)價(jià)函數(shù)采用固定非線性函數(shù),因而分離準(zhǔn)確度一般。近年來,針對(duì)此問題逐漸發(fā)展了一些參數(shù)化和無參化學(xué)習(xí)算法[6-9],這類算法采用準(zhǔn)確的概率分布估計(jì)方法,準(zhǔn)確估計(jì)信號(hào)的概率密度函數(shù)和評(píng)價(jià)函數(shù),從而提高了算法的分離性能,但是計(jì)算復(fù)雜度較高,并要求源信號(hào)為平穩(wěn)信號(hào)。
然而,當(dāng)源信號(hào)為重拖尾信號(hào)時(shí),特別是沖擊特性較強(qiáng)的非平穩(wěn)信號(hào),其二階及以上各階矩趨于無窮大,傳統(tǒng)的盲信號(hào)分離算法效果一般。針對(duì)此問題,相關(guān)人員開展了相關(guān)研究工作,取得了一定進(jìn)展[10-14]。但是,這些算法的計(jì)算復(fù)雜度較高,分離效果一般,難以滿足在線學(xué)習(xí)算法的需要。
本文基于alpha穩(wěn)定分布的概率分布估計(jì)方法,采用數(shù)值計(jì)算方法和人工神經(jīng)網(wǎng)絡(luò)方法估計(jì)信號(hào)的概率密度函數(shù)和評(píng)價(jià)函數(shù),提出基于alpha穩(wěn)定分布的盲信號(hào)分離算法,最后對(duì)算法進(jìn)行仿真實(shí)驗(yàn)分析。
假設(shè)S(t)為源信號(hào),其維數(shù)為m,A為m×n階混合矩陣,X(t)=AS(t)為實(shí)際觀測(cè)得到的m維數(shù)據(jù)向量。盲信號(hào)分離問題就是在A和S(t)均未知的情況下,在僅知道觀測(cè)數(shù)據(jù)X(t)的條件下,依照某種分離準(zhǔn)則,找出分離矩陣W,使得恢復(fù)信號(hào)Y(t)=WX(t)盡可能接近源信號(hào)S(t)。由于對(duì)源信號(hào)和混合矩陣未知,因此對(duì)于盲信號(hào)分離問題必須知道分離準(zhǔn)則,一般假定源信號(hào)之間統(tǒng)計(jì)獨(dú)立。
基于最小互信息的自然梯度學(xué)習(xí)算法目前得到了廣泛應(yīng)用[3]。一個(gè)多維隨機(jī)信號(hào)Y的獨(dú)立性可以由其互信息表示,即聯(lián)合概率密度函數(shù) p(Y;W)和邊緣概率密度函數(shù)乘積之間的Kullback-Leibler距離:
當(dāng)信號(hào)Y的各維變量 yi之間的互信息越小時(shí),其各維分量之間相互統(tǒng)計(jì)獨(dú)立。其代價(jià)函數(shù)為:
式中,H(yi)表示信息熵。
采用自然梯度算法,可得到[3]:
式中,I表示單位矩陣,η代表學(xué)習(xí)率,?(y)是評(píng)價(jià)函數(shù),如下式所示:
式中,p(yi)和 p′(yi)分別表示概率密度函數(shù)及其一階導(dǎo)數(shù)。
近年來提出的一些盲信號(hào)分離算法,包括Kernel ICA、非參數(shù)ICA算法,通過準(zhǔn)確估計(jì)信號(hào)的概率密度函數(shù),可以實(shí)現(xiàn)源信號(hào)的準(zhǔn)確分離[6-9]。但是這類算法計(jì)算復(fù)雜度較大,并假定源信號(hào)為平穩(wěn)信號(hào),當(dāng)源信號(hào)包含非平穩(wěn)信號(hào)時(shí),算法可能不收斂。而alpha穩(wěn)定分布可以準(zhǔn)確描述信號(hào)的概率分布特性。
Alpha穩(wěn)定分布是一種連續(xù)概率分布類型,它是一類允許重拖尾和偏度的概率分布的總和。Alpha穩(wěn)定分布形態(tài)取決于其四個(gè)參數(shù),即特征參數(shù)、對(duì)稱參數(shù)、尺度參數(shù)和位置參數(shù)。特征參數(shù)控制密度函數(shù)拖尾的厚度和長(zhǎng)度,其值越小拖尾越長(zhǎng)。對(duì)稱參數(shù)決定穩(wěn)定分布的斜度,其值越大信號(hào)的概率密度函數(shù)越不對(duì)稱。尺度參數(shù)決定概率密度函數(shù)的聚集程度,其值越大信號(hào)的分布越集中。位置參數(shù)決定信號(hào)的中心點(diǎn)位置。
雖然alpha穩(wěn)定分布具有廣義特性,但是無法用具體的函數(shù)形式表示其概率密度函數(shù)。一般情況下,alpha穩(wěn)定分布用其特征方程來描述,如下式所示[15-16]:
一個(gè)信號(hào)Y的概率密度函數(shù)是其特征函數(shù)的傅里葉變換,即
對(duì)于一個(gè)服從標(biāo)準(zhǔn)alpha穩(wěn)定分布的隨機(jī)變量Y(γ=1且 δ=0),公式(7)可簡(jiǎn)化為:
對(duì)于盲信號(hào)分離問題來說,由于每次迭代過程需要對(duì)數(shù)據(jù)進(jìn)行中心化處理,位置參數(shù)δ為零。這種情況下一個(gè)服從非標(biāo)準(zhǔn)alpha穩(wěn)定分布的信號(hào)X的概率密度函數(shù)可通過如下變換來生成:
其中,X=Y/γ。
對(duì)于一個(gè)經(jīng)過中心化處理的信號(hào)Y,首先估計(jì)其三個(gè)參數(shù)值 α,β,γ[17],然后對(duì)式(8)用快速傅里葉變換(FFT)算法求解,并通過式(9)變換得到一個(gè)樣本點(diǎn)所對(duì)應(yīng)的概率密度函數(shù)值[18-19]。FFT算法具有較好的計(jì)算精度和較快的計(jì)算速度,然而,F(xiàn)FT難以滿足實(shí)際在線盲信號(hào)分離算法的需要,特別是對(duì)于大樣本信號(hào),其計(jì)算復(fù)雜度較高。
為此,本文提出如下的離線和在線結(jié)合的兩步概率密度函數(shù)估計(jì)方法。即采用FFT算法離線計(jì)算標(biāo)準(zhǔn)alpha穩(wěn)定分布的概率密度函數(shù)庫查找表,然后在線估計(jì)信號(hào)的三個(gè)參數(shù)并進(jìn)行查找。具體過程如下:首先,對(duì)具有不同特征參數(shù)和對(duì)稱參數(shù)值的標(biāo)準(zhǔn)alpha穩(wěn)定分布,離線建立概率密度函數(shù)庫查找表,即對(duì)特征參數(shù)α和對(duì)稱參數(shù)β分別在其可取的區(qū)間,均勻選取有限個(gè)樣本。例如,對(duì)于 α ,可取 α0,α1,…,αi,…,αn,αi=2i/n 。在每一個(gè)離散點(diǎn)(αi,βj),計(jì)算其概率密度函數(shù)值,建立查找表。接下來,對(duì)于待估計(jì)信號(hào)X,在線估計(jì)信號(hào)的特征參數(shù)、對(duì)稱參數(shù)和尺度參數(shù),然后查找(αi,βj)所對(duì)應(yīng)的概率密度函數(shù)值,最后根據(jù)式(9)進(jìn)行變換就可得到概率密度函數(shù)值。
估計(jì)信號(hào)的評(píng)價(jià)函數(shù)需要估計(jì)概率密度函數(shù)導(dǎo)數(shù),傳統(tǒng)的數(shù)值微分方法并不準(zhǔn)確。由于神經(jīng)網(wǎng)絡(luò)具有很好的非線性逼近能力,因此本文采用一個(gè)單隱層神經(jīng)網(wǎng)絡(luò)來估計(jì)概率密度函數(shù)的導(dǎo)數(shù)。
讓 yi,i=1,2,…,m 是神經(jīng)網(wǎng)絡(luò)的輸入,p(yi),i=1,2,…,m是神經(jīng)網(wǎng)絡(luò)的輸出,m表示樣本的個(gè)數(shù),隱層神經(jīng)元的激活函數(shù)為tanh,如圖1所示,當(dāng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成時(shí),網(wǎng)絡(luò)的傳遞函數(shù)滿足H(y,W)=p(y),即
圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
因此,概率密度函數(shù)的導(dǎo)數(shù) p′(y)為:
上述神經(jīng)網(wǎng)絡(luò)求解概率密度函數(shù)導(dǎo)數(shù)的過程如下:首先設(shè)置神經(jīng)網(wǎng)絡(luò)的初始權(quán)值,令 p(y)為神經(jīng)網(wǎng)絡(luò)目標(biāo)輸出;接下來迭代調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)重w(t+1)=w(t)+η(t)?ε(w)/?w,ε(w)表示目標(biāo)函數(shù);重復(fù)執(zhí)行上述過程,直到收斂為止;最后當(dāng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成時(shí),通過求解式(11)可得到信號(hào) y的概率密度函數(shù)的導(dǎo)數(shù)。一旦得到了概率密度函數(shù)的導(dǎo)數(shù),則可以通過式(5)獲得信號(hào)的評(píng)價(jià)函數(shù)?(y)。
綜上所述,本文算法的簡(jiǎn)化過程如下:
(1)對(duì)特征參數(shù)和對(duì)稱參數(shù)在其可取的區(qū)間內(nèi),均勻選取有限個(gè)離散點(diǎn);對(duì)每一個(gè)離散點(diǎn),采用FFT算法離線計(jì)算標(biāo)準(zhǔn)重拖尾信號(hào)的概率密度函數(shù),建立查找表。
(2)在線估計(jì)混合信號(hào)每一維數(shù)據(jù) yi的特征參數(shù)、對(duì)稱參數(shù)和尺度參數(shù)。
(3)在查找表中查找參數(shù)值所對(duì)應(yīng)的概率密度函數(shù)f(yi);根據(jù)式(9)求得概率密度函數(shù)值。
(4)根據(jù)式(11)和式(5)計(jì)算信號(hào)的評(píng)價(jià)函數(shù)。
(5)根據(jù)式(4)迭代求解分離矩陣W 。
信號(hào)源如圖2所示,圖中從上到下依次是一個(gè)沖擊信號(hào)、高斯白噪聲、正弦波信號(hào)、鋸齒波信號(hào),其歸一化峭度分別為14 465,0,-0.377 8,-0.127 8。這屬于重拖尾信號(hào)和輕拖尾信號(hào)混合情況,其中第一個(gè)源信號(hào)具有典型的重拖尾分布特性,沖擊特性較強(qiáng)?;旌暇仃嘇為4×4的隨機(jī)矩陣,即觀測(cè)信號(hào)維數(shù)等于源信號(hào)維數(shù)。然而,實(shí)際情況信源維數(shù)是未知的。如果觀測(cè)信號(hào)維數(shù)大于源信號(hào)維數(shù)時(shí),屬于超定問題,常見的方法是先估計(jì)信號(hào)的維數(shù),然后再進(jìn)行信號(hào)的分離[20-22]。如果觀測(cè)信號(hào)維數(shù)小于源信號(hào)維數(shù)時(shí),則屬于欠定問題[23-25]。本文僅考慮觀測(cè)信號(hào)維數(shù)等于源信號(hào)維數(shù)情況。
圖2 源信號(hào)
分別選取擴(kuò)展最大熵算法[4]、Kernel ICA算法[9]、非參數(shù)ICA算法[6]以及本文提出的算法,分析算法的分離效果。圖3是混合信號(hào),混合矩陣A為隨機(jī)矩陣。從圖中可以看出,混合后的信號(hào)均呈現(xiàn)高斯白噪聲和沖擊信號(hào)的特征。
圖3 混合信號(hào)
圖4是采用本文算法估計(jì)的結(jié)果。從圖中可以看出,本文算法可以恢復(fù)出源信號(hào)。需要指出的是,恢復(fù)信號(hào)的順序與源信號(hào)不一致,這是盲信號(hào)分離的固有特性[5]。
圖4 恢復(fù)信號(hào)
圖5是非參數(shù)化ICA算法的分離結(jié)果。從圖中可以看出,該算法也可以恢復(fù)源信號(hào)。但是,算法的恢復(fù)效果一般,特別是鋸齒波分離信號(hào)受沖擊信號(hào)的干擾并未完全消除。
圖5 基于非參數(shù)ICA的分離結(jié)果
為比較各分離算法的分離性能,定義源信號(hào)S與源信號(hào)和恢復(fù)信號(hào)Y之差的比值作為恢復(fù)信號(hào)的信噪比(SNR),作為衡量分離效果的指標(biāo)[5],即
式中,M表示信號(hào)樣本維數(shù)。顯然,恢復(fù)信號(hào)與源信號(hào)越接近,L值越大,信號(hào)恢復(fù)效果越好。
圖6給出了幾種算法的分離效果。從圖中可看出,不管是小樣本和大樣本數(shù)據(jù),本文提出算法的分離效果優(yōu)于其他算法。
圖6 不同算法的分離效果
接下來分析算法的計(jì)算復(fù)雜度。以非參數(shù)ICA算法和本文提出的算法作比較。圖7給出了取不同樣本個(gè)數(shù)時(shí)兩種算法所消耗的計(jì)算時(shí)間,源信號(hào)的維數(shù)為6。從圖中可看出,當(dāng)樣本數(shù)目較小時(shí),本文算法與非參數(shù)ICA算法計(jì)算時(shí)間基本相等;當(dāng)樣本數(shù)目較大時(shí),本文算法的計(jì)算時(shí)間明顯小于非參數(shù)ICA算法。實(shí)際上,非參數(shù)ICA算法一般需要用到大部分樣本,其計(jì)算復(fù)雜度近似為O(M2N2+M2N),M和N分別表示樣本維數(shù)和個(gè)數(shù)[6]。而本文算法的計(jì)算復(fù)雜度包含兩個(gè)方面,一方面參數(shù)估計(jì)算法的計(jì)算復(fù)雜度約為O(BMN2C),其中,B為迭代次數(shù),NC表示選取的樣本個(gè)數(shù);其次是評(píng)價(jià)函數(shù)估計(jì),其計(jì)算復(fù)雜度約為O(MN)。總的計(jì)算復(fù)雜度近似為O(AMN2C+MN)。當(dāng)樣本個(gè)數(shù)較大時(shí),NC遠(yuǎn)小于N,本文算法計(jì)算復(fù)雜度較低。
圖7 不同算法的計(jì)算時(shí)間
下面分析不同拖尾特性混合信號(hào)的算法分離性能。表1給出了源信號(hào)維數(shù)為2時(shí)的不同拖尾特性混合信號(hào)分離結(jié)果的信噪比,樣本數(shù)目為5 000,表中前兩行、第三行、最后兩行分別是重拖尾混合信號(hào)、重拖尾輕拖尾混合信號(hào)、拖尾特性非常弱的混合信號(hào)的分離結(jié)果??梢钥闯觯瑢?duì)于不同拖尾特性混合信號(hào),本文算法均具有較好的分離性能。
表1 不同拖尾特性混合信號(hào)分離結(jié)果的信噪比
本文提出了一種基于alpha穩(wěn)定分布的盲信號(hào)分離算法。首先采用FFT方法估計(jì)信號(hào)的概率密度函數(shù),建立標(biāo)準(zhǔn)alpha穩(wěn)定分布概率密度函數(shù)庫查找表。然后在線估計(jì)混合信號(hào)的特征參數(shù)、對(duì)稱參數(shù)和尺度參數(shù),從而獲得其概率密度函數(shù)。最后采用多層神經(jīng)網(wǎng)絡(luò)準(zhǔn)確估計(jì)信號(hào)的評(píng)價(jià)函數(shù)。本文算法不需要源信號(hào)的先驗(yàn)知識(shí),適用于具有任意概率分布特性信號(hào)的盲分離。仿真結(jié)果表明,本文算法具有較高的分離性能和較低的時(shí)間復(fù)雜度。
[1]Common P.Independent component analysis,a new concept?[J].Signal Processing,1994,36:287-314.
[2]Pham D T,Cardoso J F.Blind separation of instantaneous mixtures of nonstationary sources[J].IEEE Transactions on Signal Processing,2001,49(9):1837-1848.
[3]Yong H H,Amari S.Adaptive on-line learning algorithm for blind separation:maximum entropy and minimum mutual information[J].Neural Computation,1997,7:1457-1482.
[4]Lee T W,Girolami M,Sejnowski T J.Independent component analysis using an extended infomax algorithm for mixed sub-Gaussian and super-Gaussian sources[J].Neural Computation,1999,11(2):417-441.
[5]張賢達(dá),保錚.盲信號(hào)分離[J].電子學(xué)報(bào),2001,29(12A):1766-1770.
[6]Boscolo R,Pan H,Vwani P R.Independent component analysis based on nonparametric density estimation[J].IEEE Transactions on Neural Networks,2004,15(1):154-161.
[7]Novey M,Adal T.Complex ICA by negentropy maximization[J].IEEE Transactions on Neural Networks,2008,19(4):596-609.
[8]Li W Q,Zhang H B,Zhao F.Independent component analysis using multilayer networks[J].IEEE Signal Processing Letters,2007,14(11):856-858.
[9]Bach F R,Jordan M I.Kernel independent component analysis[J].Journal of Machine Learning Research,2002,3:1-48.
[10]Zarzoso V,Common P.Robust independent component analysis by iterative maximization of the kurtosis contrast with algebraic optimal step size[J].IEEE Transactions on Neural Networks,2010,21(2):248-261.
[11]Yeredor A.Blind separation of Gaussian sources with general covariance structures:bounds and optimal estimation[J].IEEE Transactions on Signal Processing,2010,58(10):5057-5068.
[12]Zarzoso V,Comon P,Phlypo R.A contrast function for independent component analysis without permutation ambiguity[J].IEEE Transactions on Neural Networks,2010,21(5):863-868.
[13]Lahat D,Cardoso J F,Messer H.Second-order multidimensional ICA:performance analysis[J].IEEE Trans on Signal Processing,2012,60(9):4598-4600.
[14]王瑩,李宏偉,付紅偉.HT-LSM的欠定混合盲信號(hào)分離方法的研究[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(32):133-136.
[15]Nolan J P.Numerical calculation of stable densities and distribution functions[J].Communication Statist-Stochastic Models,1997,13:759-774.
[16]Wang B J,Ercan E K,Zhang J Y.ICA by maximizing non-stability[C]//8th International Conference on ICA and Signal Separation,Paraty,Brazil,2009,5441:179-186.
[17]郝燕玲,單志明,沈鋒.基于DRAM算法的α穩(wěn)定分布參數(shù)估計(jì)[J].華中科技大學(xué)學(xué)報(bào),2011,39(10):73-78.
[18]Diego S G,Kuruoglu E E,Ruiz D P.A heavy-tailed empirical Bayes method for replicated microarray data[J].Computational Statistics and Data Analysis,2009,53(5):1533-1546.
[19]Kuruoglu E E.Density parameter estimation of skewed α-stable distributions[J].IEEE Transactions on Signal Processing,2001,49(10):2192-2201.
[20]Cao J,Murata N,Amari S,et al.A robust approach to Independent Component Analysis of signals with high level noise measurements[J].IEEE Transactions on Neural Networks,2003,14(3):631-645.
[21]李維勤.基于混合信號(hào)概率密度函數(shù)估計(jì)的盲信號(hào)分離[D].西安:西安電子科技大學(xué),2005.
[22]冶繼民,張賢達(dá),金海紅.超定盲信號(hào)分離的半?yún)?shù)統(tǒng)計(jì)方法[J].電波科學(xué)學(xué)報(bào),2006,21(3):331-336.
[23]冶繼民,張賢達(dá),朱孝龍.信源數(shù)目未知和動(dòng)態(tài)變化時(shí)的盲信號(hào)分離[J].中國科學(xué):E輯,2005,35(12):1277-1287.
[24]肖明,謝勝利,傅予力.基于超平面法矢量的欠定盲信號(hào)分離算法[J].自動(dòng)化學(xué)報(bào),2008,34(2):142-149.
[25]馮濤.欠定盲源分離算法研究[D].成都:電子科技大學(xué),2012.