姚建麗,胡紅萍,白艷萍,王建中
(中北大學(xué) 理學(xué)院, 太原 030051)
在20世紀(jì)50年代,矢量水聽器的研制就已經(jīng)出現(xiàn)在美國。它的出現(xiàn)及時地彌補了聲壓水聽器的缺陷,即不能完整地接受聲場的信息[1]。自此,很多研究人員對矢量水聽器進行了研究。其中,矢量水聽器的陣列處理方法和波達方向角是人們研究的重點及熱點[2]。
通常解決DOA估計的方法有兩種。第1種方法是傳統(tǒng)的方法,利用純數(shù)學(xué)模型,但要進行大量的運算才能得到最終的結(jié)果,比較典型的是1975年Schmidt[3]提出的多重信號分類(multiple signal classification,MUSIC)算法以及Roy等[4]提出的旋轉(zhuǎn)不變子空間(estimating signal parameters via rotational Invariance techniques,ESPRIT)算法。在此基礎(chǔ)上,這些算法又衍生出一系列新的算法,如在MUSIC算法的基礎(chǔ)上出現(xiàn)了解求根MUSIC算法[5]、波束空間求根 MUSIC算法[6]等。在ESPIT算法的基礎(chǔ)上也出現(xiàn)了一些算法,比較有代表性的包括LS-ESPRIT算法[7]、TLS-ESPRIT算法[8]等。另一種是利用智能學(xué)習(xí)、“軟建模”的方式進行DOA估計,其中的重要方法是采用神經(jīng)網(wǎng)絡(luò)。張旻等[9]選取協(xié)方差矩陣的上三角特征作為網(wǎng)絡(luò)的輸入,采用RBF神經(jīng)網(wǎng)絡(luò)來進行DOA估計。孟非等[10]同樣選取協(xié)方差矩陣的上三角特征作為輸入,運用PSO-BP算法對DOA進行估計。趙曉萌等[11]針對BP神經(jīng)網(wǎng)絡(luò)的缺陷,運用模擬退火算法對BP神經(jīng)網(wǎng)絡(luò)進行優(yōu)化,提升其效果。
本文對陣列信號的協(xié)方差矩陣依次進行實值化和特征分解,選取信號子空間的基作為網(wǎng)絡(luò)的輸入,利用提出的模擬退火粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),實現(xiàn)DOA估計。
收集信號數(shù)據(jù)時通常情況下需要用比較規(guī)律的天線陣元來進行,本文以均勻等間距線陣為例進行討論,如圖1所示。
圖1 DOA估計的一般模型(均勻線性)
考慮N個遠場窄帶信號以{θ1,θ2,…,θN}的角度入射到M元陣列,陣列的接受信號為
Z(t)=A(t)S(t)+N(t)
(1)
其中:Z(t)是陣列輸出矢量;S(t)信號源矢量;N(t)是高斯白噪聲矢量,信號與噪聲是相互獨立的;A(θ)是矢量水聽器的方向矢量矩陣。
A(θ)=[a(θ1),a(θ2),…,a(θN)]=
[a(θ1)?u1,a(θ2)?u2,…,a(θN)?uN]
(2)
R=E[Z(t)Z(t)H]=
AE[S(t)S(t)H]AH+E[N(t)N(t)H]=
ARsAH+σ2I
(3)
其中:Rs是入射信號的協(xié)方差矩陣;σ2是陣列接收信號中噪聲的功率;I是歸一化下噪聲的相關(guān)矩陣;(·)H代表復(fù)共軛轉(zhuǎn)置。
根據(jù)子空間分解理論,特征分解為
(4)
其中有特征值為λ1≥λ2≥…≥λN≥…≥λ3M,∑s=diag(λ1,λ2,…,λN),∑n=diag(λN+1,λN+2,…,λ3M)。Us是信號子空間,它是由前大N個特征值對應(yīng)矢量張成的子空間,有Us=[e1,e2,…,en],e1,e2,…,en是它的特征向量。UN是噪聲子空間,它是由 3M-N個特征值對應(yīng)矢量張成的子空間,UN=[eN+1,eN+2,…,e3M],eN+1,eN+2,…,e3M是它的特征向量。
(5)
粒子群(particle swarm optimization,PSO)算法是Eberhart和Kennedy在1995年根據(jù)對鳥類捕食行為的研究提出的一種群優(yōu)化算法[12]。在PSO算法中,每個粒子被看作是一個潛在解,每個粒子對應(yīng)適應(yīng)度函數(shù)的適應(yīng)度值,粒子的速度決定粒子本身的運動方向和距離,粒子的速度根據(jù)自身及其他粒子的運動情況可以進行動態(tài)調(diào)節(jié),從而可以得到最優(yōu)解。
在每一次迭代過程中,粒子更新自身的速度和位置的核心公式如下:
(6)
(7)
本文中所使用的慣性權(quán)重公式為:
(8)
式中:max gen為最大的迭代次數(shù);wstart和wend分別為初始的慣性權(quán)重和最大迭代數(shù)時的慣性權(quán)重。本文中wstrat=0.95,wend=0.4。
SA算法最開始是在1953年由N.Metropolis等提出的。1983年,S.kirkpatrick等將SA思想成功地引入組合優(yōu)化領(lǐng)域[13]。SA是一種隨機尋優(yōu)算法,是基于Monte-Carlo迭代方法求解形式進行的,它以物理固體物質(zhì)的退火過程與一般組合優(yōu)化問題之間的相似性為出發(fā)點。SA算法由于獨特的概率突跳能力,在全局搜索極值中起到了很大的作用,并被應(yīng)用于很多方面。
用熱力學(xué)系統(tǒng)來進行解釋,SA算法的基本思想是把系統(tǒng)的能量看成目標(biāo)函數(shù),把系統(tǒng)逐步降溫達到最低能量狀態(tài)的過程看作優(yōu)化過程。SA算法設(shè)定一個較高的溫度,從這一個溫度開始,隨著溫度的不斷下降,結(jié)合概率突跳的特點在解空間范圍內(nèi)尋找全局最優(yōu)解。也就是說,當(dāng)目標(biāo)函數(shù)得到局部最優(yōu)解時,可以一定的概率跳出局部最優(yōu)并最終趨于全局最優(yōu)解。SA 算法在搜索過程中具有一定概率的突跳能力,能有效地避免在搜索過程陷入局部最優(yōu)解。
PSO算法所需的參數(shù)少,操作較為簡單,具有很強的適用性。在算法初期時收斂速度快,但在后期容易受到隨機振蕩的影響,從而導(dǎo)致收斂速度降低,陷入局部最小值。本文借鑒模擬退火算法中的概率突跳能力,使粒子以一定的概率跳出已搜索的最優(yōu)區(qū)域在更大空間中開展搜索,提出了模擬退火例子群算法,記為SAPSO算法,具體步驟如下:
1) 對粒子的速度和位置進行初始化,對退火速度進行初始化。
2) 種群中每個粒子根據(jù)適應(yīng)度函數(shù)計算其適應(yīng)度值。
3) 比較粒子新位置的適應(yīng)度值與之前找到的最佳適應(yīng)度值的大小,如果新位置的適應(yīng)度值更佳,則更新當(dāng)前位置為最佳位置。
4) 將所有粒子的歷史最優(yōu)適應(yīng)度值與群體經(jīng)歷過的最佳位置進行比較,如果目前的位置最佳,則用當(dāng)前位置取代原來位置作為全局最佳位置。
5) 更新粒子的位置和速度。
6) 判斷是否達到終止條件,若是則將權(quán)、閾值賦予BP網(wǎng)絡(luò)的初始權(quán)值w和閾值B;否則,返回步驟3)繼續(xù)。
7) 引入模擬退火算法繼續(xù)訓(xùn)練尋優(yōu),令wi′ =wi+Δwi,Bi′ =Bi+ΔBi,Δw、ΔB均為很小的均勻分布的隨機擾動。目標(biāo)函數(shù)為
(9)
式中:N是訓(xùn)練樣本總數(shù);y(k)是期望輸出;d(k)是實際輸出。得到兩個位置的適應(yīng)度值變化量為ΔE=E(pi′)-E(pi)。
8) 如果ΔE<0,則把w′,B′作為新的權(quán)值和閾值,否則以概率為P=exp(-ΔE/Ti)接受w′、B′為新的當(dāng)前解,并更新參數(shù)。
9) 重復(fù)步驟7)和8),直到系統(tǒng)得到平衡狀態(tài)。
10) 進行降溫,T逐漸減少,退火機制為
Tk=aT0
(10)
其中:a表示退火速度;T0為初始溫度。
11) 重復(fù)步驟7)~9),直到T=0或者達到預(yù)設(shè)溫度。
12) 網(wǎng)絡(luò)訓(xùn)練結(jié)束,得到的最新權(quán)值和閾值為BP神經(jīng)網(wǎng)絡(luò)的權(quán)、閾值。
BP(back propagation)神經(jīng)網(wǎng)絡(luò)由Rumelhart和McCelland為首的科研人員在1986年提出,它是一種多層反饋網(wǎng)絡(luò),是目前應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)模型之一[14-19]。BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱層和輸出層3部分網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)成。它的學(xué)習(xí)規(guī)則是梯度下降法,通過信號的正向傳播以及誤差的反向傳播不斷調(diào)整網(wǎng)絡(luò)的權(quán)、閾值,最終實現(xiàn)誤差的平方和最小。
本文采用SAPSO算法得到的最優(yōu)解作為BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)、閾值,選取信號子空間的基作為BP神經(jīng)網(wǎng)絡(luò)的輸入,經(jīng)過BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練其權(quán)、閾值,建立DOA估計預(yù)測模型,流程如圖2所示。
實驗的天線陣列為均勻的5元線陣,信號源選用兩個正弦信號,信噪比為10 dB,快拍數(shù)為1 000,進行200次Monte-Carlo仿真實驗。
圖2 基于信號子空間的SAPSO-BP算法流程
訓(xùn)練數(shù)據(jù):信號源之間的間隔分別取12和18,當(dāng)間隔取12時,從-90到65每隔0.5取1個樣本,得到樣本數(shù)311個。如果用向量X1、X2分別表示兩個信號的角度,則X1=[-90,-89.5,-89,…,64.5,65]T,X2=[-78,-77.5,-77,…,76.5,77]T。通常采用的是二維矢量水聽器,可輸出聲壓p(t)、振速vx(t)、vy(t)3路信號,本文采用5元線陣,會產(chǎn)生15路信號。同樣地,當(dāng)間隔取18時,從-90到65每隔0.5取1個樣本,得到樣本數(shù)311個,兩個信號的角度為:X1=[-90,-89.5,-89,…,64.5,65]T,X2=[-78,-77.5,-77,…,82.5,83]T,同樣會產(chǎn)生15路信號。訓(xùn)練數(shù)據(jù)的總樣本為622。
測試數(shù)據(jù):從-90到65每隔1取一個樣本,得到測試樣本156個。
本文分別利用BP神經(jīng)網(wǎng)絡(luò)、PSO-BP網(wǎng)絡(luò)、SAPSO-BP網(wǎng)絡(luò)對兩信號源的DOA方向進行估計,得到雙信號的DOA估計和估計誤差,分別如圖3~6所示。
圖3 第1個信號的DOA估計輸出曲線
圖4 第2個信號的DOA估計輸出曲線
圖5 第1個信號的DOA估計誤差曲線
圖6 第2個信號的DOA估計誤差曲線
圖3是第1個信號在3種模型下的DOA估計值和實際值,圖4是第2個信號在3種模型下的DOA估計值和實際值。通過圖3、4可以看出:在SAPSO-BP情況下的預(yù)測值更接近實際值,而BP神經(jīng)網(wǎng)絡(luò)的預(yù)測值與實際值的差距最大,PSO-BP網(wǎng)絡(luò)的預(yù)測值與實際值情況居中。圖5是第1個信號在3種模型下的DOA估計的誤差曲線,圖6是第2個信號在3種模型下的DOA估計的誤差曲線。從圖5、6可以看出:使用SAPSO-BP網(wǎng)絡(luò)估計DOA的誤差最小,而BP神經(jīng)網(wǎng)絡(luò)估計DOA得到的誤差最大。通過DOA輸出曲線和誤差曲線可以看出,本文提出SAPSO-BP方法用于DOA估計有更高的精度。
表1是3種模型下的MAE、MSE、RMSE值。在不同的模型中,左側(cè)一列為第1個信源的各個指標(biāo),右側(cè)為第2個信源的指標(biāo)。從數(shù)據(jù)中可以看出:SAPSO-BP的MAE、MSE、RMSE都是最小的,BP的各項指標(biāo)是最大的,可以得到采用SAPSO-BP對DOA進行估計有一定的優(yōu)勢。
仿真條件與實驗1情況相同,依次估計在信噪比-10、-5、0、5、10、15 dB之間的均方根誤差。表2為3種算法在不同的信噪比下的均方根誤差。均方根誤差的公式為
(11)
表2中選取的值為兩個信號源均方根誤差的均值,從表2可以看出:隨著信噪比的不斷增加,信源的均方根誤差在不斷減小。PSO-BP和SAPSO-BP網(wǎng)絡(luò)的均方根誤差要比BP網(wǎng)絡(luò)好的多,對比PSO-BP和SAPSO-BP,SAPSO-BP整體來說要比PSO-BP的均方根誤差低。因此,本文提出的SAPSO-BP方法有較好的估計精度。
本文針對PSO算法后期容易受到隨機振蕩的影響而導(dǎo)致收斂速度降低的問題,借鑒模擬退火算法中的概率突跳能力,提出了模擬退火粒子群算法(SAPSO算法)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)(SAPSO-BP),實現(xiàn)雙信號的DOA估計和在不同信噪比下的誤差估計。將矢量水聽器陣列的信號處理模型的協(xié)方差矩陣進行實值化并特征分解,選取信號子空間的基作為BP神經(jīng)網(wǎng)絡(luò)、PSO-BP網(wǎng)絡(luò)和SAPSO-BP網(wǎng)絡(luò)的輸入。通過比較,本文提出的SAPSO-PSO網(wǎng)絡(luò)優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和PSO-BP網(wǎng)絡(luò),具有更好的估計精度。但由于BP神經(jīng)網(wǎng)絡(luò)自身的局限性,對于DOA估計仍有一定的不足,需要進一步改善。
[1] 王鵬.基于MEMS矢量水聽器陣列的聲目標(biāo)定向定位技術(shù)研究[D].太原:中北大學(xué),2013.
[2] LI B,PENG C Y,BISWAS S.Association of DOA Estimation from Two ULAs[J].IEEE Transactions n Instrumentation and Measurement,2008,57(6):1094-1101.
[3] SCHMIDT R O.Multiple emitter location and signal parameter estimation[J].IEEE Transactions on Antennas and Propagation,1986,34(3):276-280.
[4] ROY R,PAULRAJ A,KAILATH T.Estimation of signal parameters via rotational invariance techniques-ESPRIT[C]//California:Conference on C ircuits,Systems and Computers.1985:83-89.
[5] RAO B D,HARI K.Performance analysis of root-MUSIC[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1989,37(12):1939-1949.
[6] ZOLTOWSKI M D,KAUTZ G M,SILVERSTEIN S D.Beamspace root-MUSIC[J].IEEE Transactions on Signal Processing,1993,41(1):344-364.
[7] ROY R,PAULRAJ A,KAILATH T.ESPRIT—A subspace rotation approach to estimation of parameters of cisoids in noise[J].IEEE Transactions on Acoustics,Speech,and Signal Processing,1986,34(5):1340-1342.
[8] ROY R,KAILATH T.ESPRIT-estimation of signal parameters via rotational invariance techniques[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1989,37(7):984-995.
[9] 張旻,李鵬飛.基于分層神經(jīng)網(wǎng)絡(luò)的寬頻段DOA估計方法[J].電子與信息學(xué)報,2009,31(9):2118-2122.
[10] 孟非.基于PSO-BP神經(jīng)網(wǎng)絡(luò)的DOA估計方法[J].電訊技術(shù),2012,52(5):694-698.
[11] 趙曉萌,劉李楠.基于模擬退火方法BP神經(jīng)網(wǎng)絡(luò)的測向定位方法[J].安陽工學(xué)院學(xué)報,2012,11(2):35-38.
[12] 潘昊,候清蘭.基于粒子群優(yōu)化算法BP網(wǎng)絡(luò)學(xué)習(xí)研究[J].計算機工程與應(yīng)用,2016(16):41-42.
[13] KIRKPATRCK S,GELATT C D,VECCHI M P.0ptimization by simulated amealing[J].Science,1983(220):67l-680.
[14] 齊浩淳,黃大鵬,魏久南,等.基于BP神經(jīng)網(wǎng)絡(luò)的高寒山地彈藥消耗需求分析[J].兵器裝備工程學(xué)報,2016,37(6):97-101.
[15] 王永杰,白艷萍.基于主成分分析的PSO-BP算法在GDP和CPI預(yù)測中的應(yīng)用[J].重慶理工大學(xué)學(xué)報(自然科學(xué)),2017,31(4):150-154.
[16] 李紅連.BP神經(jīng)網(wǎng)絡(luò)在車輛組合導(dǎo)航中的應(yīng)用研究[J].壓電與聲光,2011,33(1):45-48.
[17] 張虹,王丹.一種改進的BP神經(jīng)網(wǎng)絡(luò)剪枝算法研究[J].西南大學(xué)學(xué)報(自然科學(xué)版),2016,38(3):165-170.
[18] 劉彩紅.一種優(yōu)化BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本的方法[J].重慶師范大學(xué)學(xué)報(自然科學(xué)版),2007,24(3):51-53.
[19] 高雋.人工神經(jīng)網(wǎng)絡(luò)原理及仿真實例[M].2版.北京:機械工業(yè)出版社,2007:10-11.