孫潔娣, 李玉霞, 溫江濤, 閆盛楠
(1.燕山大學(xué) 信息科學(xué)與工程學(xué)院,河北,秦皇島 066004;2.燕山大學(xué) 河北省測(cè)試計(jì)量技術(shù)及儀器重點(diǎn)實(shí)驗(yàn)室, 河北,秦皇島 066004)
?
基于方向密度檢測(cè)與霍夫變換的混合矩陣估計(jì)
孫潔娣1, 李玉霞1, 溫江濤2, 閆盛楠1
(1.燕山大學(xué) 信息科學(xué)與工程學(xué)院,河北,秦皇島 066004;2.燕山大學(xué) 河北省測(cè)試計(jì)量技術(shù)及儀器重點(diǎn)實(shí)驗(yàn)室, 河北,秦皇島 066004)
針對(duì)欠定盲源分離混合矩陣的估計(jì)問(wèn)題,提出一種基于局部方向密度檢測(cè)的孤立時(shí)頻點(diǎn)處理與霍夫變換相結(jié)合的混合矩陣估計(jì)算法. 首先通過(guò)變換域單源時(shí)頻點(diǎn)處理增強(qiáng)信號(hào)的稀疏性,對(duì)散點(diǎn)圖中的方向直線進(jìn)行霍夫變換,通過(guò)判斷局部極大值點(diǎn)確定源信號(hào)數(shù)量并估計(jì)混合矩陣. 針對(duì)霍夫變換易出現(xiàn)的峰值簇?fù)韱?wèn)題,提出采用局部方向密度檢測(cè)方法先判別并去除孤立時(shí)頻點(diǎn),之后再進(jìn)行霍夫變換,提高了混合矩陣的估計(jì)精度. 實(shí)驗(yàn)結(jié)果表明本文所提出的方法能夠在未知源信號(hào)數(shù)量情況下實(shí)現(xiàn)混合矩陣估計(jì),且估計(jì)精度高于K-means等常用方法.
欠定盲源分離;混合矩陣估計(jì);霍夫變換;局部方向密度;孤立時(shí)頻點(diǎn)
盲源分離(blind source separation,BSS)是指在源信號(hào)及傳輸信道參數(shù)均未知的情況下,根據(jù)輸入源信號(hào)的統(tǒng)計(jì)特征,僅利用觀測(cè)信號(hào)來(lái)恢復(fù)源信號(hào)的過(guò)程. 由于其在數(shù)字通信、語(yǔ)音識(shí)別和陣列信號(hào)處理等領(lǐng)域具有廣泛的應(yīng)用,近年來(lái)已成為研究熱點(diǎn). 對(duì)于觀測(cè)信號(hào)數(shù)量少于源信號(hào)數(shù)量的欠定盲源分離(underdetermined blind source separation, UBSS)問(wèn)題,目前研究較多的是稀疏分量分析(sparse component analysis,SCA)方法. SCA利用信號(hào)的稀疏特性,通常采用兩步法:① 估計(jì)混合矩陣;② 恢復(fù)源信號(hào). 其中混合矩陣的估計(jì)是實(shí)現(xiàn)欠定盲分離的重要步驟,估計(jì)精度會(huì)直接影響信號(hào)分離質(zhì)量.
利用信號(hào)的稀疏性,Bofill等[1]提出基于勢(shì)函數(shù)的欠定混合矩陣估計(jì)算方法,但是此方法對(duì)勢(shì)函數(shù)的參數(shù)選擇缺乏理論指導(dǎo). 付寧等[2]將K-means聚類(lèi)與霍夫變換結(jié)合估計(jì)混合矩陣,但K-means算法不僅依賴(lài)初始聚類(lèi)中心的選擇,還要預(yù)先知道源信號(hào)數(shù)量,無(wú)法處理源信號(hào)數(shù)量未知情況. 譚北海等[3]提出概率統(tǒng)計(jì)方法估計(jì)信號(hào)源的數(shù)量,但該方法不易擴(kuò)展到高維空間,且對(duì)信號(hào)稀疏度[4-8]要求較高. 為了降低對(duì)信號(hào)稀疏度的要求,有學(xué)者提出了基于單源時(shí)頻點(diǎn)[9-11]的方法增強(qiáng)信號(hào)稀疏性[12],但是存在定義方法多樣,符合條件不易等問(wèn)題.
本文針對(duì)傳統(tǒng)聚類(lèi)方法進(jìn)行混合矩陣估計(jì)時(shí),信號(hào)稀疏性不強(qiáng),且依賴(lài)初始聚類(lèi)中心的選擇,以及需要預(yù)先設(shè)定源信號(hào)數(shù)量的不足,研究了基于孤立時(shí)頻點(diǎn)檢測(cè)與霍夫變換相結(jié)合的混合矩陣估計(jì)算法. 通過(guò)變換域中單源時(shí)頻點(diǎn)處理增強(qiáng)信號(hào)的稀疏性;并采用霍夫變換將直線方向檢測(cè)轉(zhuǎn)化為變換空間中局部極值點(diǎn)檢測(cè),達(dá)到估計(jì)混合矩陣的目的. 針對(duì)霍夫變換產(chǎn)生的峰值簇?fù)韱?wèn)題,本文提出進(jìn)一步去除孤立時(shí)頻點(diǎn)來(lái)解決峰值簇?fù)韱?wèn)題.
不考慮噪聲影響的UBSS混合模型為
x(t)=As(t), t=1,2, …,T.
(1)
式中:x(t)=[x1(t)x2(t) …xm(t)]T為m個(gè)觀測(cè)信號(hào);A=[a1a2…an]為混合矩陣,A∈Rm×n;s(t)=[s1(t)s2(t) …sn(t)]T為n個(gè)未知的源信號(hào);m (2) 由式(2)可得觀測(cè)信號(hào)分布在過(guò)原點(diǎn)的直線上,直線的方向取決于混合矩陣的列向量ai,即稀疏信號(hào)具有線性聚類(lèi)特征,并且線性聚類(lèi)的強(qiáng)弱直接影響混合矩陣的估計(jì)精度. 大多數(shù)信號(hào)在變換域中具有稀疏性,本文主要研究變換域中的稀疏處理,對(duì)式(1)進(jìn)行短時(shí)傅里葉變換(STFT),可得 (3) 式中:X(t,k)為觀測(cè)信號(hào)的STFT系數(shù);Si(t,k)為第i個(gè)源信號(hào)的STFT系數(shù). 當(dāng)稀疏性較弱的信號(hào)變換到時(shí)頻域后,時(shí)頻域中任一時(shí)頻點(diǎn)上僅有一個(gè)源信號(hào)存在的點(diǎn)為有效時(shí)頻點(diǎn),稱(chēng)之為單源點(diǎn). 本文研究采用單源點(diǎn)檢測(cè)方法來(lái)進(jìn)一步增強(qiáng)信號(hào)稀疏性. 設(shè)某時(shí)頻點(diǎn)(t1,k1)處只有一個(gè)信號(hào)s1存在,此時(shí)式(3)表示為 X(t1,k1)=a1S1(t,k). (4) 取式(4)兩邊的實(shí)部R{·}和虛部I{·},由稀疏信號(hào)的線性聚類(lèi)特性得R{X(t1,k1)}和I{X(t1,k1)},各分量比值均為a1. 若在時(shí)頻點(diǎn)(t2,k2)處有多個(gè)源信號(hào)s1和s2存在,則觀測(cè)向量的實(shí)部和虛部分別為 R{X(t2,k2)}=a1R{S1(t2,k2)}+a2R{S2(t2,k2)}. (5) I{X(t2,k2)}=a1I{S1(t2,k2)}+a2I{S2(t2,k2)}. (6) 若觀測(cè)向量實(shí)部與虛部各分量比值相同,則 (7) 即需滿(mǎn)足R{Xi}/I{Xi}=R{Xj}/I{Xj},其中i,j∈[1,m]且i≠j,式(7)成立的概率極低,考慮實(shí)際誤差,設(shè)閾值ε范圍為0.01~0.1[11],可得 (8) 式(8)即為單源點(diǎn)檢測(cè)公式. 為克服低能量時(shí)頻點(diǎn)的影響,根據(jù)式(9)過(guò)濾一些低能量點(diǎn): (9) 式中λ∈(0,1). 經(jīng)過(guò)上述處理后信號(hào)的稀疏性得到較大增強(qiáng),為混合矩陣的估計(jì)提供了基礎(chǔ). 2.1 基于霍夫變換的方向直線轉(zhuǎn)換 霍夫變換(Hough transform,HT)是一種實(shí)現(xiàn)從圖形空間到參數(shù)空間轉(zhuǎn)化的映射方法,它通過(guò)對(duì)圖形空間中的對(duì)象進(jìn)行坐標(biāo)變換,將原始圖形空間中給定曲線上的所有點(diǎn)都集中到變換空間上的某些位置,形成一系列局部累加值極大點(diǎn). 假設(shè)原圖形空間中經(jīng)過(guò)點(diǎn)(x1,x2)的某一直線為:x2=ax1+b,通過(guò)坐標(biāo)變換映射到變換空間ρ-θ中,轉(zhuǎn)化成相應(yīng)的極坐標(biāo)形式為 ρ=x1sin θ+x2cos θ. (10) 則式(10)為點(diǎn)(x1,x2)的霍夫變換,其中θ為直線與x1軸的夾角,tanθ=x2/x1. 霍夫變換應(yīng)用于混合矩陣估計(jì)中的思想為:將原始空間中共線的點(diǎn)經(jīng)坐標(biāo)變換轉(zhuǎn)化為參數(shù)空間里相交的曲線,由于稀疏性的源信號(hào)具有線性聚類(lèi)的特點(diǎn),因此觀測(cè)信號(hào)進(jìn)行HT后在變換空間將形成一系列相交的曲線,統(tǒng)計(jì)曲線的交點(diǎn)并進(jìn)行累加形成為局部極值點(diǎn),統(tǒng)計(jì)所得的局部極值點(diǎn)數(shù)量即為源信號(hào)數(shù)量;通過(guò)檢測(cè)極值點(diǎn)位置可以估計(jì)直線方向,即混合矩陣列向量,進(jìn)而估計(jì)混合矩陣. 由于稀疏觀測(cè)信號(hào)的線性聚類(lèi)特性,觀測(cè)數(shù)據(jù)點(diǎn)主要集中在n條直線上,則直線向量l表示為 ρ=lTx. (12) 由于HT算法統(tǒng)計(jì)的是變換空間中的局部極值點(diǎn),在提取中常會(huì)出現(xiàn)峰值簇?fù)韱?wèn)題. 圖1為單源時(shí)頻點(diǎn)圖及經(jīng)過(guò)HT后統(tǒng)計(jì)的局部極值分布圖. 由圖1可知由于存在孤立點(diǎn)使得時(shí)頻點(diǎn)線性聚類(lèi)不夠清晰,經(jīng)過(guò)HT統(tǒng)計(jì)局部極值時(shí),產(chǎn)生局部峰值簇?fù)韱?wèn)題,導(dǎo)致難以準(zhǔn)確估計(jì)源信號(hào)數(shù)量. 2.2 基于方向密度檢測(cè)孤立點(diǎn)的混合矩陣估計(jì) 局部峰值簇?fù)韱?wèn)題產(chǎn)生主要是由于該區(qū)域內(nèi)時(shí)頻點(diǎn)較少、線性聚類(lèi)特性不清晰,且偏離混合矩陣列向量的主方向,因此可將這些無(wú)效的時(shí)頻點(diǎn)稱(chēng)為孤立時(shí)頻點(diǎn). 本文研究了通過(guò)局部方向時(shí)頻點(diǎn)密度檢測(cè)方法去除孤立點(diǎn),解決霍夫變換的峰值簇?fù)韱?wèn)題,提高源信號(hào)數(shù)量及混合矩陣估計(jì)精度. Di(φ)=N(Ci(φ))/N. (13) 對(duì)圖1去除孤立點(diǎn)并進(jìn)行HT結(jié)果如圖2所示. 對(duì)比圖1(b)與圖2可知本文處理方法可以有效抑制峰值簇?fù)?,?zhǔn)確估計(jì)源信號(hào)數(shù)量. 本文提出的基于局部方向時(shí)頻點(diǎn)密度檢測(cè)與霍夫變換的混合矩陣估計(jì)算法步驟如下: ① 通過(guò)STFT將觀測(cè)信號(hào)變換到時(shí)頻域; ② 檢測(cè)單源時(shí)頻點(diǎn)并去除低能量點(diǎn),再將觀測(cè)數(shù)據(jù)對(duì)稱(chēng)到上半單位超球面上并進(jìn)行歸一化; ③ 統(tǒng)計(jì)局部方向時(shí)頻點(diǎn)密度去除孤立點(diǎn); ④ 設(shè)置分辨率參數(shù)構(gòu)成累加數(shù)組進(jìn)行HT,統(tǒng)計(jì)累加數(shù)組的極值數(shù)量即為源信號(hào)數(shù)量,通過(guò)極值坐標(biāo)參數(shù)得直線向量,即為混合矩陣A的列向量. 為驗(yàn)證本文算法的有效性,通過(guò)兩個(gè)實(shí)驗(yàn)進(jìn)行仿真與分析,并利用歸一化均方誤差(normalized mean square error,NMSE)及偏離角度兩種指標(biāo)評(píng)價(jià)混合矩陣估計(jì)性能. 歸一化均方誤差定義為 偏離角度表達(dá)式為 3.1 實(shí)驗(yàn)1及結(jié)果分析 實(shí)驗(yàn)1采用的源信號(hào)為3個(gè)不同的語(yǔ)音片段,按照式(1)將其混合成兩路,隨機(jī)選擇A為 混合所得的觀測(cè)信號(hào)如圖3. 觀測(cè)信號(hào)的時(shí)域與時(shí)頻域散點(diǎn)圖如圖4所示. 由圖可見(jiàn)時(shí)頻域中觀測(cè)信號(hào)方向性較弱,因此進(jìn)行單源時(shí)頻點(diǎn)處理增強(qiáng)信號(hào)稀疏性. 單源點(diǎn)檢測(cè)時(shí)取ε=0.06,所得單源時(shí)頻點(diǎn)如圖5(a),通常λ范圍為0.05~0.10[3],本文取λ=0.1,將數(shù)據(jù)歸一化并進(jìn)行HT,綜合大量實(shí)驗(yàn)與實(shí)際情況,取β=180,則HT的局部極值分布如圖5(b)所示. 單源點(diǎn)檢測(cè)后觀測(cè)信號(hào)的方向性變得比較清晰,但仍有少量孤立點(diǎn)導(dǎo)致峰值簇?fù)韱?wèn)題,影響源信號(hào)數(shù)量的估計(jì),采用本文提出的局部方向時(shí)頻點(diǎn)密度檢測(cè)方法去除孤立點(diǎn),取φ=1°;δ決定了去除數(shù)據(jù)點(diǎn)的多少,通常δ∈[min(Di(φ)),mean(Di(φ))],統(tǒng)計(jì)δ與剩余時(shí)頻點(diǎn)所占比例如圖6所示. 圖6顯示δ越大,剩余時(shí)頻點(diǎn)比值越小,當(dāng)比值趨于穩(wěn)定時(shí),表明已去除大部分孤立點(diǎn),由圖可得從δ=0.025開(kāi)始該比值較穩(wěn)定,因此取δ=0.025,則所得歸一化散點(diǎn)圖與HT結(jié)果如圖7所示. 為了準(zhǔn)確比較幾種算法的估計(jì)精度,將估計(jì)矩陣與A的NMSE以及偏離角度的結(jié)果列入表1. 表1 估計(jì)的與初始A的性能對(duì)比表 由表1對(duì)比幾種算法可得,去除孤立點(diǎn)能較大提高混合矩陣估計(jì)精度,解決峰值簇?fù)韱?wèn)題,驗(yàn)證了去除孤立點(diǎn)的必要性,并且HT算法能夠在準(zhǔn)確估計(jì)源信號(hào)數(shù)量基礎(chǔ)上進(jìn)一步提高混合矩陣估計(jì)精度. 實(shí)驗(yàn)結(jié)果表明本文算法的估計(jì)準(zhǔn)確性更高. 3.2 實(shí)驗(yàn)2及結(jié)果分析 實(shí)驗(yàn)2采用的源信號(hào)為文獻(xiàn)[1]中稀疏性較弱的語(yǔ)音信號(hào),取數(shù)據(jù)長(zhǎng)度為63 856的4段信號(hào)作為源信號(hào),根據(jù)式(1)將其混合為3路觀測(cè)信號(hào),即m=3,n=4,隨機(jī)選擇混合矩陣A為 混合之后得到的觀測(cè)信號(hào)如圖8所示. 將觀測(cè)信號(hào)變換到時(shí)頻域后,檢測(cè)單源點(diǎn)并歸一化后直接進(jìn)行HT,得到結(jié)果如圖9所示. 針對(duì)峰值簇?fù)韺?dǎo)致不能準(zhǔn)確估計(jì)源信號(hào)數(shù)量問(wèn)題,統(tǒng)計(jì)δ與剩余時(shí)頻點(diǎn)所占比例選取δ=0.02,去除孤立點(diǎn)經(jīng)HT后得到的結(jié)果如圖10所示. 為了對(duì)比算法的性能,將估計(jì)的混合矩陣根據(jù)式(15)計(jì)算各個(gè)估計(jì)矩陣的NMSE,統(tǒng)計(jì)結(jié)果如表2所示. 表2 估計(jì)的與初始A的NMSE對(duì)比表 統(tǒng)計(jì)實(shí)驗(yàn)二的偏離角度的對(duì)比結(jié)果如表3. 表3 估計(jì)的與初始A的偏角對(duì)比表 分析仿真結(jié)果可知,將觀測(cè)信號(hào)擴(kuò)展到三維空間之后應(yīng)用本文算法估計(jì)所得到混合矩陣精度得到較大提高. 通過(guò)以上不同算法的實(shí)驗(yàn)結(jié)果對(duì)比,能夠有效驗(yàn)證去除孤立點(diǎn)的必要性,以及HT算法的優(yōu)越性,說(shuō)明本文所提算法的有效性. 實(shí)驗(yàn)結(jié)果表明,與常用的K-means聚類(lèi)算法以及K-Hough算法比較,本文所提出的方法較大程度提高了混合矩陣估計(jì)精度. [1] Bofill P, Zibulevsky M. Underdetermined blind source separation using sparse representations[J]. Signal Processing, 2001,81(11):2353-2362. [2] 付寧,彭喜元.K-Hough欠定盲信道估計(jì)算法[J].電子測(cè)量與儀器學(xué)報(bào),2008,22(5):63-67. Fu Ning, Peng Xiyuan. K-Hough underdetermined blind mixing model recovery algorithm[J]. Journal of Electronic Measurement and Instrument, 2008,22(5):63-67. (in Chinese) [3] 譚北海,謝勝利.基于源信號(hào)數(shù)目估計(jì)的欠定盲分離[J].電子與信息學(xué)報(bào),2008,30(4):863-867. Tan Beihai, Xie Shengli. Underdetermined blind separation based on source signals’ number estimation[J]. Journal of Electronics & Information Technology, 2008,30(4):863-867. (in Chinese) [4] Zhou G X, Yang Z Y, Xie S L, et al. Mixing matrix estimation from sparse mixtures with unknown number of sources[J]. IEEE Transactions on Neural Networks, 2011,22(2):211-221. [5] Peng D Z, Xiang Y. Underdetermined blind sources separation based on relaxed sparsity condition of sources[J]. IEEE Transactions on Signal Processing, 2009,57(2):809-814. [6] Kim S G, Yoo C D. Underdetermined blind source separation based on subspace representation[J]. IEEE Transactions on Signal Processing, 2009,57(7):2604-2614. [7] Li Y Q, Amari S, Cichochi A, et al. Underdetermined blind source separation based on sparse representation[J]. IEEE Transactions on Signal Processing, 2006,54(2):423-437. [8] Bofill P. Identifying single source data for mixing matrix estimation in instantaneous blind source separation[C]∥Proceedings of 18th International Conference on Artificial Neural Networks. Prague, Czech Republic: Springer, 2008: 759-767. [9] Reju V G, Koh S N, Soon I Y. An algorithm for mixing matrix estimation in instantaneous blind source separation[J]. Signal Processing, 2009,89(9):1762-1773. [10] Dong T B, Lei Y K, Yang J S. An algorithm for underdetermined mixing matrix estimation[J]. Neurocomputing, 2013,104(15):26-34. [11] Xie S L, Yang L, Yang J M, et al. Time-frequency approach to underdetermined blind source separation[J]. IEEE Transactions on Neural Networks and Learning Systems, 2012,23(2):306-316. [12] Syed M N, Georgiev P G, Pardalos P M. A hierarchical approach for sparse source blind signal separation problem[J]. Computers& Operations Research, 2014,41:386-398. (責(zé)任編輯:劉芳) Mixing Matrix Estimation Based on Local Direction Density of Time-Frequency Coefficients and Hough Transform SUN Jie-di1, LI Yu-xia1, WEN Jiang-tao2, YAN Sheng-nan1 (1.School of Information Science and Engineering,Yanshan University, Qinhuangdao, Hebei 066004, China; 2.Key Laboratory of Measurement Technology and Instrumentation of Hebei Province, Yanshan University, Qinhuangdao, Hebei 066004, China) A mixing matrix estimation method based on local directional density of time-frequency coefficients and Hough transform was proposed for underdetermined blind source separation. The signals were transformed to time-frequency domain by STFT to improve sparsity; and then Hough transform was applied to transform the coefficients of directional line in scatter plot. Mixing matrix estimation was accomplished by determining the numbers of local maximum values and calculating their values. In order to eliminate the peak cluster in Hough transform, a method was proposed, i.e. detecting directional density of time-frequency coefficients to determine these outlier points and then removing them, taking Hough transform again to improve Mixing matrix estimation accuracy. The experiment results show this algorithm can accomplish the source numbers estimation under unknown source numbers, and the mixing matrix estimation accuracy is obviously higher than those normal K-means methods. underdetermined blind source separation; mixing matrix estimation; Hough transform; local directional density; outlier time-frequency coefficients 2014-09-22 國(guó)家自然科學(xué)基金資助項(xiàng)目(51204145,61102110);河北省自然科學(xué)基金資助項(xiàng)目(E2013203300,E2016203223);河北省高等學(xué)校自然科學(xué)研究計(jì)劃項(xiàng)目(Q2012087);秦皇島市科學(xué)技術(shù)研究與發(fā)展計(jì)劃項(xiàng)目(201302A033) 孫潔娣(1975—),女,博士,副教授,E-mail:wjtsjd@163.com. TN 911.7 A 1001-0645(2016)11-1188-06 10.15918/j.tbit1001-0645.2016.11.0172 孤立點(diǎn)檢測(cè)與霍夫變換結(jié)合的混合矩陣估計(jì)
3 實(shí)驗(yàn)結(jié)果及分析
4 結(jié)束語(yǔ)