王 鋼,孫 斌
(哈爾濱工業(yè)大學通信技術研究所,黑龍江哈爾濱150001)
盲信號分離技術及算法研究
王 鋼,孫 斌
(哈爾濱工業(yè)大學通信技術研究所,黑龍江哈爾濱150001)
盲信號分離是只依靠傳感器觀測到的混合信號來估計源信號的一門技術。介紹了盲信號分離的三種基本混合模型,重點闡述了正定線性瞬時盲分離的成熟算法,簡單總結了目前針對欠定、單通道混合信號的常用盲分離方法,最后展望了盲信號分離技術發(fā)展的難點、趨勢和應用。
盲信號分離(BSS);混合模型;盲分離算法;單通道盲分離
盲信號分離(BSS)亦稱獨立分量分析(ICA),是在對源信息和傳輸通道完全未知的條件下,僅根據觀測的混合信號矢量來提取源信號各分量的一種信號處理方法。1986年,法國著名學者Herault和Jutten完成盲信號分離的先驅性工作[1],并于1991年在Signal Process上發(fā)表了著名的H-J盲分離算法[2-4]。之后Tong[5]初步探討了多階累積量分離算法,Comon[6]提出了獨立分量分析,Bell和Sejnowski提出信息最大化算法(Informax)[7],Lee提出擴展信息最大化算法(Ex Informax)[8],Amari提出梯度互信息最小化法[9],Hyvarinen等提出固定點算法FastICA[10]。1996年清華大學出版了張賢達的《時間序列分析——高階統(tǒng)計量方法》。焦衛(wèi)東等將盲分離技術應于信息安全領域,李加文等提出在頻域瞬時盲分離/主成分分析/瞬時混合盲分離結構,黃青華提出基于貝葉斯估計的狀態(tài)空間分離模型求解盲分離[11]。
進入21世紀以來,盲信號分離從正定混合到欠定混合甚至到更加復雜的單通道混合的研究?;旌夏P鸵矎木€性瞬時混合方式擴展到線性卷積混合方式再到非線性混合方式。而線性瞬時混合是其他混合方式的基礎,因此本文予以重點介紹。
根據源信號與傳輸信道混合方式的不同,盲信號分離的混合模型主要分線性與非線性兩類。其中線性混合模型可以細分為線性瞬時混合模型和線性卷積混合模型。
1.1 線性瞬時混合模型
線性瞬時混合指觀測信號僅僅是源信號的簡單線性組合,不考慮源信號的時延特性,是最簡單的一種混合方式,其表達式為:
式中,X=(x1,x2,…,xm)T指各傳感器觀測到的源信號的不同混合信號矢量,S=(s1,s2,…,sn)T是源信號矢量,H=(hi,j)為M×N維混合矩陣,hi,j為常數。N=(n1,n2,…,nm)為加性噪聲,可忽略不計。
線性混合模型的分解過程表達式為:
式中,W=(wi,j)為N×M維分離矩陣,理想情況下W=H-1,這時Y=S。一般情況下,分離后的Y=DPX,D為對角矩陣,P為交換矩陣。式(2)說明盲信號分離本質上存在不確定性,主要表現在輸出信號幅度和順序的不確定性,但不會影響盲信號分離技術的應用,因為信號攜帶的信息是包含在源信號的波形特征中。盲信號分離系統(tǒng)示意圖如圖1所示。
圖1 盲信號分離原理框圖
1.2 線性卷積混合模型
與線性瞬時混合方式相比,線性卷積混合方式更接近實際信號傳輸的多徑效應,考慮了源信號的不同傳輸時延特性,觀察結果為源信號與傳輸信道的卷積,其數學表達式為:
式中,k∈[0,L],A(k)表示延時為k的混合信道矩陣,當L=0時,線性卷積混合方式就變?yōu)榫€性瞬時混合方式。
1.3 非線性混合模型
在實際場景中,信號的線性混合方式幾乎不存在,一般為準線性混合或者為非線性混合方式。非線性混合方式主要分為兩類,對應的模型有一般非線性混合模型和后非線性混合模型(PNL)。一般非線性混合模型的數學表達式為:
式中,f為一個Rn到Rm的非線性映射。
后非線性混合模型是線型混合模型與非線性混合模型的一種組合推廣,即源信號先經線性混合后再經非線性混合。其數學表達式為:
后非線性的混合方式的分離過程為混合過程的逆過程,即對觀測到的信號先進行非線性分離,后進行線性分離。表達式為:
正定盲信號分離算法中,觀測信號的維數M與源信號的維數相等,即:M=N。欠定盲信號分離算法中,M<N。如果M=1,則稱為單通道混合盲分離。
2.1 線性瞬時盲信號分離算法
2.1.1 聯合對角化算法(JADE)
聯合對角化(JADE)算法是批處理算法的典型代表,是四階盲辨識(FOBI)算法的改進。該算法通過對信號的四階累積量的特征分解和聯合對角化得到分離矩陣和分離信號(源信號的估計)。但算法需要的計算存貯空間較大,不適于高維盲分離。
正交聯合對角化盲分離的基本思想是利用觀測信號的統(tǒng)計特性構造具有可聯合對角化結構的目標矩陣組,建立起混合矩陣、白化矩陣、分離矩陣之間的關系,再通過聯合對角化方法估計混合矩陣。非正交盲分離則直接根據觀測信號構造目標矩陣、直接進行非正交聯合對角化估計,而不做白化處理。JADE盲分離算法的一般實現步驟如下:
1)求觀測信號矢量協方差Rx,計算一個白化矩陣w;
2)求解觀測信號矢量的白化過程z(t)=wx(t)的四階累積量,再計算最大不超過n的兩個特征值:Ne=(λr,mr|1≤r≤n);
3)用一個正交(酉)矩陣把集合Ne聯合對角化;
4)混合矩陣A的估計為:A=wU。
聯合對角化盲分離的原理如圖2所示。
圖2 JADE盲分離算法的原理框圖
2.1.2 信息最大化算法(Informax)
信息最大化算法是自適應算法的典型代表。Informax是基于信息論的一種算法,該算法核心思想是通過非線性函數使分離信號的嫡最大化,即分離信號之間盡可能地相互獨立。其原理如圖3所示。
圖3 Informax盲分離算法的原理框圖
圖3 中,ψ(y)是單調可逆的非線性轉換函數,U=(u1,u2,…,un)為非線性輸出。Informax算法的獨立性判據就是信息傳輸的最大原則,更新分離矩陣H改變分離信號Y,使輸出U中各分量的總嫡達到極大值,這時分離信號Y各分量之間互信號最小,也即各分量之間獨立性最大,分離信號更接近源信號S。分離矩陣的自適應公式為:
式(9)中的迭代公式是基于隨機梯度得到的,需要矩陣求逆,計算效率低,后由Cardoso和Cichocki等改進為:
式中,ψ(y)=tanh(y)。
經典的自適應算法有擴展的信息最大化算法(ExInformax)、非線性主量分析(NLPCA)、互信息最小化算法(MMI)等,它們都具有統(tǒng)一的自適應算法更新公式ΔW∝(I-2ψ(y)yT)W,只是非線性函數ψ(y)的選擇不同,這里不再贅述。
2.1.3 快速算法(FastICA)
盡管自適應算法能適應環(huán)境的變化,但收斂速度較慢,其收斂速率主要取決于學習速率,且學習速率選擇不當時可能引起算法不收斂。
芬蘭學者Hyvarinen于1997年提出基于峭度的FastICA算法,1999年提出基于負嫡的改進FastICA算法?;谪摰盏腇astICA算法是一個曰棒的度量,能較好地克服因某個不準確的值可能引起峭度發(fā)生巨大變化的缺點。
FastICA算法是基于非高斯性最大化原則得到的一種批處理算法,它的收斂速率快且易于實現。下面舉例以四階累積量作為輸出信號相互獨立的判據來說明FastICA算法流程:第一,對觀測信號x(t)去均值預處理后進行白化處理。第二,采用FastICA算法分離出源信號各分量,具體步驟如下:
1)任取初始向量ui(0),且滿足‖ui(0)‖22= 1(k=0);
2)求ui(k+1)=E(z(ui(k)Tz)3),其中,E(·)用對z(t)的采樣點求均值代替;
3)歸一化ui(k+1)/(‖ui(k+1)‖2)→ui(k+1);
4)若|ui(k+1)ui(k)T|≠1(或者不接近1),返回步驟2)繼續(xù)迭代,否則迭代結束,令ui=ui(k+1);
5)提取yi(k)=uTiz(k)作為si的估計。
FastICA的基本原理如圖4所示。
圖4 FastICA盲分離原理框圖
球化過程可以使z(t)各分量之間不相關,且方差為1。正交變換過程使分離信號之間盡可能相互獨立。
2.2 線性卷積盲信號分離算法線性卷積混合模型可以更好地刻劃信號在真實環(huán)境中的傳播特性,其盲分離算法可以分為兩類:時域盲分離算法和頻域盲分離算法。
2.2.1 時域盲分離算法
1)轉化為線性瞬時盲分離
重新定義源信號為:
重新定義觀測信號為:
2)Bussgang算法
Bussgang算法的核心思想是使分離后的信號經過一個非線性函數后用其輸出與輸入信號做差,用該差值調整分離矩陣。該算法的優(yōu)點是簡單易實現,缺點是存在局部極小點,收斂解可能有誤。根據非線性函數的不同,Bussgang有不同類型,如Godard算法,B2G算法等。
3)高階統(tǒng)計量方法
高階統(tǒng)計量方法具體可分為顯累計量法和隱累計量法。前者利用高階累計量作對比函數,使用隨機梯度法求解分離矩陣。后者利用神經網絡和非線性函數來近似反映高階統(tǒng)計量,逐步更新分離矩陣。
2.2.2 頻域盲分離算法
根據時域卷積對應頻域乘積的理論基礎,將時域卷積轉換到頻域乘積而不改變混合矩陣。實際應用中一般采用短時傅里葉變換將信號變換到若干個頻點上,解混后再變換回時域,從而實現卷積盲信號分離。該算法優(yōu)點是計算量小,缺點是分離信號存在順序上的不確定性,在時域中可能不能正確拼接。
2.3 非線性盲信號分離算法
非線性盲分離要比線性盲分離更加復雜。常用的非線性分離算法有自組織映射(SOM)算法、Bayesian集合學習算法和遺傳算法。
1)自組織映射算法:算法的核心思想是抽取觀測信號的非線性特征,確定可能的非線性函數從而達到分離信號的目的。優(yōu)點是靈活性高,缺點是當信源增加時,計算復雜度呈指數增加。
2)Bayesian集合學習算法:亦稱為多變量貝葉斯學習法,是利用一個適于估計后驗分布參數的極限分布來實現盲分離。
3)遺傳算法(GA):為更好地估計非線性函數參數,避免局部極小值問題,Rojas等人引入了遺傳算法,從全局出發(fā)逼近全局最優(yōu)解,該算法比傳統(tǒng)的梯度法收斂速度更快,穩(wěn)定性更好。
欠定盲分離是一個病態(tài)分離,混合矩陣的逆矩陣不存在,分離結果通常不唯一。目前欠定盲分離的常用算法有基于信號稀疏性的算法、Bayesian方法和二元掩蔽法。
1)基于信號稀疏性的算法:若源信號滿足稀疏性,混合信號具有線性聚類特性,此時可以用聚類法估計混合矩陣以實現欠定盲分離。如果源信號在時域不滿足稀疏性條件,可將信號通過某種變換使其在變換域中滿足稀疏性,實現信號分離后再反變換回時域。目前最常用的變換主要有傅里葉變換、短時傅里葉變換、小波變換、離散余弦變換等。
2)Bayesian方法:Bayesian方法充分利用了源信號的概率分布,即使源信號非稀疏,從而實現盲分離。Bayesian方法一般適用于相互獨立的實源信號的欠定盲分離。
3)二元掩蔽法:二元掩蔽法的主要思想是在變換域上使混合信號盡可能稀疏,再通過構造二元掩蔽函數將欠定問題轉化為正定問題。二元掩蔽法計算簡單分離效果較好,適于線性盲分離,該方法也是目前最常用的盲分離算法之一。
單通道盲分離(SCBSS)是在觀測信號數目為1的條件下的欠定盲分離,是一個更加病態(tài)的盲分離問題。SCBSS必須已知源信號的某些先驗信息才可進行分離。下面簡單介紹幾種目前研究較多的單通道混合盲信號分離算法。
1)變換域濾波法:將時域混疊,通過傅里葉變換、小波變換、循環(huán)譜等,在變換域中分離信號后再變換到時域,該方法的本質為變換域濾波。
2)基函數法:基函數單通道盲分離法分為兩個階段,訓練階段和分離階段。訓練階段采用沒有混合的源信號作為訓練數據,用某種經典算法學習得到源信號的基函數作為先驗信息。分離階段基于上述基函數采用最大似然函數優(yōu)化方法估計源信號。
3)基于粒子濾波的算法:粒子濾波的基本思想是利用離散樣本點替代后驗分布,將貝葉斯積分轉換為求和,從而可實現未知變量的后驗概率分布,不斷利用輸入的信號實現參數與符號的聯合估計。粒子濾波在處理非線性、非高斯問題中優(yōu)勢明顯。
除了上面介紹的幾種方法外,還有一些其他方法,如因子分析、線性預測LP、恒模算法、PSP算法等。
在盲信號分離領域,線性盲分離理論的發(fā)展相對比較成熟,而非線性盲分離、欠定盲分離還有許多問題函待解決。此外,含噪盲分離(特別是低信噪比情況下)、復數情況下的盲分離、單通道盲分離均為研究的熱點與難點。目前盲信號處理技術已在生物醫(yī)學、雷達信號分選、電子偵查、圖像處理等領域廣泛應用。與實際應用的結合,會使盲信號分離技術獲得更強大的生命力和更廣闊的應用前景?!?/p>
[1] Jutten C,Herault J.Space or time adaptive sign al processing by neural network models[C]∥Snowbird,Utah,USA:Intern.Conf.on Neural Network for Computing,1986:206-211.
[2] Common P,Jutten C,Herault J.Blind separation of sources,part II:problems statement[J].Signal Processing,1991,24(1):11-20.
[3] Jutten C,Herault J.Blind separation of sources,part I:an adaptive algorithm based on neuromimetic architecture[J].Signal Processing,1991,24(1):21-30.
[4] Sorouchyari E.Blind separation of sources,part III:stability analysis[J].Signal Processing,1991,24:21 -29.
[5] Tong L,Liu R,Soon V.Indeterminacy and identifiability of blind identification[J].IEEE Transactions on Circuits and Systems,1991,38(5):499-509.
[6] Comon P.Independent component analysis,a new concept[J].Signal Processing,1994,36:287-314.
[7] Bell AJ,Sejnowski TJ.An information maximization approach to blind separation and blind deconvolution[J]. Neural Computation,1995,7(6):1004-1034.
[8] Lee T,Girolami M,Sejnowski T.Independent component analysis using an extended information algorithm for mixed sub-gaussian and super-gaussian sources[J]. Neural Com Putation,1999,9(7):1483-1492.
[9] Amari S,Cichocki A.Adaptive blind signal processingneural network approaches[J].Proceedings of IEEE,1998,86(10):2026-2046.
[10]Hyvarinen A,Oja E.A fast fixed-point algorithm for independent component analysis[J].Neural Computation,1997,9(7):1483-1492.
[11]黃青華.基于源信號模型的盲分離技術研究及應用[D].上海:上海交通大學,2007.
Research on blind signal separation technology and algorithm
Wang Gang,Sun Bin
(Harbin Institute of technology,Communication Research Center,Harbin 150001,Heilongjiang,China)
BSS is used to estimate and separate the source signals only from the observed signals by sensors.The BSS's three essential math models are presented.The mature algorithms of positive-definite BSS technology is mainly introduced.Some common algorithms of underdetermined signals and single-channel mixed signal are briefly summarized.Finally,BSS's challenges,trends and applications are forecasted.
blind signal separation;mixed model;BSS algorithm;single-channel BSS
TN971
A
2014-08-20;2015-03-18修回。
王鋼(1962-),男,教授,主要研究方向為數據通信。