王 磊, 張志勇, 曾維貴, 曹司磊, 張?zhí)旌?/p>
(1. 海軍航空大學(xué)岸防兵學(xué)院, 山東 煙臺(tái) 264001; 2. 中國(guó)人民解放軍91827部隊(duì), 山東 威海 264000)
雷達(dá)信號(hào)偵察作為電子偵察的重要組成,指通過對(duì)偵收到的雷達(dá)信號(hào)進(jìn)行參數(shù)測(cè)量、聚類分選等,進(jìn)而實(shí)現(xiàn)對(duì)雷達(dá)輻射源目標(biāo)的定位、識(shí)別和威脅判定。隨著電子信息技術(shù)的不斷發(fā)展,戰(zhàn)場(chǎng)電磁環(huán)境變得更加復(fù)雜多變,同一空間中雷達(dá)輻射源數(shù)量猛增、雷達(dá)信號(hào)形式變得更加復(fù)雜多樣、混合信號(hào)在參數(shù)空間交疊嚴(yán)重以及雜波干擾等問題對(duì)雷達(dá)信號(hào)分類提出了嚴(yán)峻挑戰(zhàn)。
為了解決雷達(dá)信號(hào)分類面臨的問題,近年來國(guó)內(nèi)外研究者針對(duì)無(wú)監(jiān)督聚類提出了一些系列新算法或改進(jìn)措施。李德毅院士2006年首次將物理世界中場(chǎng)的概念引入到數(shù)據(jù)處理領(lǐng)域,創(chuàng)造性地提出了數(shù)據(jù)場(chǎng)理論,因其可自動(dòng)確定聚類中心和聚類數(shù)目的優(yōu)點(diǎn),為雷達(dá)信號(hào)分類處理提供了一種新思路。針對(duì)K-means算法需要預(yù)先設(shè)定聚類中心和聚類數(shù)目的缺點(diǎn),趙喜貴等將數(shù)據(jù)場(chǎng)引入到雷達(dá)信號(hào)分選,并與K-means算法結(jié)合提出一種融合算法,提高了在缺少先驗(yàn)知識(shí)的情況下處理未知雷達(dá)信號(hào)的能力。張怡霄等提出將數(shù)據(jù)場(chǎng)與脈沖重復(fù)間隔(pulse repetition interval, PRI)變換相結(jié)合,根據(jù)PRI估值結(jié)果對(duì)待分類脈沖進(jìn)行預(yù)分選和類中心合并,自動(dòng)得到K-means初始聚類中心和聚類數(shù)目,在一定程度上改善了K-means算法的局限性,但存在相關(guān)參數(shù)設(shè)置復(fù)雜等問題,且仍存在對(duì)非球體數(shù)據(jù)對(duì)象聚類效果差的問題。沙作金將數(shù)據(jù)場(chǎng)與平面變換算法相結(jié)合,提升了復(fù)雜電磁環(huán)境下的雷達(dá)信號(hào)分選能力。后來郜麗鵬和沙作金又針對(duì)數(shù)據(jù)場(chǎng)聚類在雷達(dá)信號(hào)分類中的應(yīng)用對(duì)場(chǎng)強(qiáng)函數(shù)做了改進(jìn),提高了算法對(duì)孤立噪聲脈沖的抗干擾能力。2014年Rodriguez 等在Science上發(fā)表了一種快速搜索密度峰值聚類(clustering by fast search and find of density peaks, CFSFDP)方法,在人工參與的情況下借助密度距離決策圖可以快速確定聚類中心和聚類數(shù)目,具有計(jì)算速度快等優(yōu)點(diǎn),但缺點(diǎn)也很明顯,即需要人為參與,自主性有待提高。Zhu等針對(duì)CFSFDP方法需要手動(dòng)設(shè)置簇中心和截?cái)嗑嚯x的問題,提出利用粒子群優(yōu)化算法自動(dòng)確定聚類中心和截止距離,并成功應(yīng)用于提高癌癥預(yù)測(cè)準(zhǔn)確率。Li等提出了一種閾值曲線自確定方法,利用閾值曲線對(duì)決策圖進(jìn)行劃分,實(shí)現(xiàn)對(duì)聚類中心和聚類數(shù)目的自確定,并將改進(jìn)的CFSFDP方法應(yīng)用于雷達(dá)信號(hào)分選,無(wú)需設(shè)定任何參數(shù),自動(dòng)實(shí)現(xiàn)了對(duì)待分類數(shù)據(jù)聚類分選,但算法對(duì)孤立噪聲脈沖干擾較敏感。
現(xiàn)代電子偵察設(shè)備偵收到的雷達(dá)信號(hào)參數(shù)錯(cuò)綜復(fù)雜且密集程度高,要求分選算法具備抗干擾能力強(qiáng)、人為依賴性低、處理時(shí)效性高等能力。傳統(tǒng)常用于雷達(dá)信號(hào)的聚類分選方法如K-means、模糊C均值、基于密度的噪聲應(yīng)用空間聚類(density-based spatial clustering of applications with noise, DBSCAN)、高斯混合模型(Gaussian mixture model, GMM)等算法,不同程度存在適用范圍窄、抗干擾能力弱、需要人為設(shè)置參數(shù)、計(jì)算復(fù)雜度高等問題。上述提到的部分改進(jìn)方法,往往針對(duì)聚類算法的某一方面進(jìn)行改進(jìn),在復(fù)雜環(huán)境下處理雷達(dá)信號(hào)分選時(shí),依然存在不少問題。為此,本文提出一種基于數(shù)據(jù)場(chǎng)聯(lián)合決策圖改進(jìn)的GMM聚類算法,通過累加數(shù)據(jù)對(duì)象場(chǎng)強(qiáng)函數(shù)值形成數(shù)據(jù)勢(shì)能,根據(jù)孤立點(diǎn)勢(shì)能明顯低于目標(biāo)區(qū)域的特征對(duì)孤立點(diǎn)進(jìn)行剔除。該方法借鑒密度峰值聚類中決策圖的思想,根據(jù)數(shù)據(jù)對(duì)象勢(shì)能與其到達(dá)最近大勢(shì)能點(diǎn)之間的距離構(gòu)建勢(shì)能-距離決策圖,通過勢(shì)能距離積下降率確定邊界點(diǎn),來自動(dòng)確定聚類中心和聚類數(shù)目,最后通過GMM聚類算法完成數(shù)據(jù)對(duì)象的聚類分選。
本文結(jié)構(gòu)安排如下:第一部分介紹了數(shù)據(jù)場(chǎng)聚類原理及其相關(guān)改進(jìn);第二部分介紹了決策圖的基本思想、聚類中心點(diǎn)和聚類數(shù)目的自確定方法;第三部分對(duì)現(xiàn)有算法進(jìn)行改進(jìn),并就總體實(shí)現(xiàn)方式進(jìn)行了介紹;第四部分對(duì)本文方法就聚類準(zhǔn)確度、算法魯棒性、時(shí)間復(fù)雜度等方面進(jìn)行了仿真對(duì)比;最后進(jìn)行了總結(jié)分析。
“場(chǎng)”是一種描述事物之間相互作用的概念,現(xiàn)實(shí)生活中廣泛存在著各種場(chǎng),如電場(chǎng)、磁場(chǎng)、引力場(chǎng)等。在數(shù)據(jù)場(chǎng)中,數(shù)據(jù)對(duì)象的勢(shì)能正比于該對(duì)象所處空間位置的場(chǎng)強(qiáng),受空間中所有數(shù)據(jù)對(duì)象的輻射場(chǎng)強(qiáng)共同作用決定。數(shù)據(jù)場(chǎng)中數(shù)據(jù)對(duì)象之間的作用力類似庫(kù)侖力,距離越近作用力越大,距離越遠(yuǎn)作用力越小,所有數(shù)據(jù)對(duì)象之間的作用力和作用范圍共同構(gòu)成了整個(gè)數(shù)據(jù)空間的數(shù)據(jù)場(chǎng)。
類似于電場(chǎng)和引力場(chǎng),場(chǎng)強(qiáng)函數(shù)被定義為用于描述數(shù)據(jù)對(duì)象對(duì)其他數(shù)據(jù)對(duì)象作用能力的概念,位于數(shù)據(jù)對(duì)象附近的空間中由該對(duì)象產(chǎn)生的數(shù)據(jù)場(chǎng)場(chǎng)強(qiáng)較大,相反距該數(shù)據(jù)對(duì)象較遠(yuǎn)的空間中由該對(duì)象產(chǎn)生的數(shù)據(jù)場(chǎng)場(chǎng)強(qiáng)較小。場(chǎng)強(qiáng)函數(shù)一般用高斯函數(shù)表示,定義數(shù)據(jù)空間中數(shù)據(jù)對(duì)象在數(shù)據(jù)對(duì)象處產(chǎn)生的數(shù)據(jù)場(chǎng)場(chǎng)強(qiáng)為
(,)=·exp[-(,)·(2)]
(1)
式中:為數(shù)據(jù)對(duì)象的影響因子,類似于引力場(chǎng)中物體的質(zhì)量、電場(chǎng)中物體帶電量等屬性,鑒于數(shù)據(jù)場(chǎng)中各數(shù)據(jù)對(duì)象的獨(dú)立性和完備性,一般將影響因子設(shè)為1;(·)為歐式距離函數(shù);為描述數(shù)據(jù)對(duì)象間輻射作用能力的輻射因子。從數(shù)據(jù)場(chǎng)場(chǎng)強(qiáng)公式可以看出,輻射因子越大,數(shù)據(jù)對(duì)象對(duì)外輻射能力越強(qiáng)。
設(shè)定影響因子為1,則數(shù)據(jù)空間中數(shù)據(jù)對(duì)象受到來自數(shù)據(jù)對(duì)象的輻射作用可以表示為
(,)=·exp[-(,)·(2)]=
exp[-(,)·(2)]
(2)
數(shù)據(jù)場(chǎng)中數(shù)據(jù)對(duì)象所受的所有輻射作用的標(biāo)量和定義為該數(shù)據(jù)對(duì)象的勢(shì)函數(shù),其數(shù)值稱為數(shù)據(jù)對(duì)象的勢(shì)能。假設(shè)數(shù)據(jù)空間中存在個(gè)數(shù)據(jù)對(duì)象,,…,,數(shù)據(jù)對(duì)象的勢(shì)函數(shù)可以表示為
(3)
輻射因子是描述數(shù)據(jù)對(duì)象對(duì)外輻射能力的參數(shù),單個(gè)數(shù)據(jù)對(duì)象在不同輻射因子設(shè)定情況下的場(chǎng)強(qiáng)函數(shù)如圖1所示。
圖1 不同輻射因子下場(chǎng)強(qiáng)函數(shù)曲線Fig.1 Curves of field intensity function under different radiation factors
場(chǎng)強(qiáng)隨距離增大整體呈下降趨勢(shì),在輻射因子設(shè)置較小時(shí),場(chǎng)強(qiáng)隨距離下降較快,在輻射因子設(shè)置較大時(shí),場(chǎng)強(qiáng)隨距離下降較慢,輻射因子設(shè)定是否合理直接影響數(shù)據(jù)場(chǎng)聚類效果。為了提高數(shù)據(jù)場(chǎng)聚類算法的適應(yīng)能力和聚類效果,減少對(duì)人為設(shè)定參數(shù)的依賴,后續(xù)需對(duì)輻射因子的選取方法進(jìn)行改進(jìn),根據(jù)數(shù)據(jù)對(duì)象分布情況自動(dòng)確定最優(yōu)輻射因子。
傳統(tǒng)的基于劃分的聚類需要提前設(shè)定聚類中心和聚類數(shù)目,再通過不斷的迭代運(yùn)算調(diào)整聚類中心和數(shù)據(jù)對(duì)象的劃分,最后達(dá)到設(shè)定條件下的最優(yōu)。而決策圖方法根據(jù)數(shù)據(jù)對(duì)象局部密度值與該對(duì)象到最近大密度點(diǎn)的距離構(gòu)成密度-距離決策圖,根據(jù)決策圖中數(shù)據(jù)對(duì)象的分布實(shí)現(xiàn)快速確定聚類中心和聚類數(shù)目,故該算法又稱為決策圖聚類。
決策圖思想基于兩點(diǎn)基本假設(shè):一是聚類簇中聚類中心是該簇中局部密度最大的數(shù)據(jù)對(duì)象;二是不同聚類簇對(duì)應(yīng)的聚類中心之間相距較遠(yuǎn)?;谝陨蟽牲c(diǎn)假設(shè),在決策圖中引入局部密度和最近大密度點(diǎn)距離的概念。根據(jù)決策圖可以容易判定哪些數(shù)據(jù)對(duì)象是孤立噪聲點(diǎn),哪些數(shù)據(jù)對(duì)象是聚類中心點(diǎn)。即具有較小局部密度和較大最近大密度點(diǎn)距離的是孤立噪聲點(diǎn),具有較大局部密度和較大最近大密度點(diǎn)距離的是聚類中心點(diǎn)。
密度峰值聚類中數(shù)據(jù)對(duì)象對(duì)應(yīng)的局部密度定義為
(4)
式中:局部密度表示在數(shù)據(jù)對(duì)象的鄰域內(nèi)存在的數(shù)據(jù)對(duì)象個(gè)數(shù);為空間中數(shù)據(jù)對(duì)象個(gè)數(shù);為截?cái)嗑嚯x,其作用與密度聚類中的鄰域半徑和數(shù)據(jù)場(chǎng)聚類中的輻射因子概念基本相同;階躍函數(shù)定義如下:
(5)
該算法截?cái)嗑嚯x需要為人設(shè)置,且該參數(shù)設(shè)定的合適與否對(duì)聚類結(jié)果影響較大。
數(shù)據(jù)對(duì)象的最近大密度點(diǎn)距離定義如下:
(6)
即如果該數(shù)據(jù)對(duì)象的局部密度為全局最大,則其為與其相距最遠(yuǎn)的數(shù)據(jù)對(duì)象之間距離的一半,否則其為與比其局部密度高且距離最近的數(shù)據(jù)對(duì)象之間的距離。
根據(jù)各數(shù)據(jù)對(duì)象的局部密度和最近大密度點(diǎn)距離,生成密度-距離決策圖,圖2為密度峰值聚類中典型的決策圖。從決策圖右上角向左向下框選密度和距離較大的點(diǎn),對(duì)應(yīng)的數(shù)據(jù)對(duì)象即為聚類中心,進(jìn)而依據(jù)距離最近原則將其他數(shù)據(jù)對(duì)象進(jìn)行劃分歸類。
圖2 典型決策圖示意Fig.2 A typical decision diagram
數(shù)據(jù)場(chǎng)聚類對(duì)于孤立噪聲點(diǎn)不敏感,能夠輕易發(fā)現(xiàn)并排除孤立點(diǎn)干擾,但后續(xù)聚類過程計(jì)算復(fù)雜度高;決策圖是一種簡(jiǎn)單、快速尋找聚類中心點(diǎn)的方法,但易受孤立噪聲點(diǎn)干擾。因此,本文擬結(jié)合數(shù)據(jù)場(chǎng)與決策圖的優(yōu)勢(shì),實(shí)現(xiàn)對(duì)孤立噪聲點(diǎn)不敏感的快速聚類。根據(jù)數(shù)據(jù)場(chǎng)與決策圖的基本原理易知,數(shù)據(jù)場(chǎng)中輻射因子參數(shù)需要人為設(shè)定且直接影響聚類效果,決策圖中截?cái)嗑嚯x需要人為設(shè)定,聚類中心點(diǎn)需要根據(jù)決策圖人為選取。為了提高算法自主程度,本文對(duì)以上問題提出如下改進(jìn)。
(7)
假定數(shù)據(jù)空間中存在個(gè)數(shù)據(jù)對(duì)象,根據(jù)勢(shì)熵表達(dá)式可知,當(dāng)輻射因子取值非常小或非常大時(shí),每個(gè)數(shù)據(jù)對(duì)象的勢(shì)能均為1或均為,此時(shí)數(shù)據(jù)場(chǎng)中數(shù)據(jù)對(duì)象分布最均勻,對(duì)應(yīng)的勢(shì)熵取得最大值log。勢(shì)熵En隨輻射因子的變化趨勢(shì)如圖3所示,隨著的增大,勢(shì)熵先減小后增大。因此,輻射因子的尋優(yōu)問題可以轉(zhuǎn)換成勢(shì)熵的最小值求解問題,即無(wú)約束一維極值問題,可用斐波那契法求解。
圖3 勢(shì)熵隨輻射因子的變化趨勢(shì)Fig.3 Variation of potential entropy with radiation factor
已知斐波那契數(shù)列可以表示為==1,=-1+-2(≥2)。根據(jù)一般經(jīng)驗(yàn),如數(shù)據(jù)空間中數(shù)據(jù)對(duì)象總數(shù)為,輻射因子的最優(yōu)取值一般在10數(shù)量級(jí),因此設(shè)定輻射因子的初始取值范圍∈[0,100]。
利用斐波那契法對(duì)輻射因子進(jìn)行最優(yōu)逼近,算法流程如圖4所示,進(jìn)而得到滿足設(shè)定精度要求的輻射因子參數(shù)。
圖4 輻射因子尋優(yōu)算法流程圖Fig.4 Flowsheet of radiation factor optimization algorithm
為了提高應(yīng)對(duì)孤立噪聲脈沖干擾的能力,對(duì)數(shù)據(jù)場(chǎng)中場(chǎng)強(qiáng)函數(shù)進(jìn)行一定調(diào)整,使孤立噪聲脈沖僅受自身輻射影響,進(jìn)而方便利用勢(shì)能值進(jìn)行剔除。根據(jù)場(chǎng)強(qiáng)函數(shù)可知,在任意數(shù)據(jù)對(duì)象的[0,3]區(qū)間內(nèi)包含了該數(shù)據(jù)輻射作用的9974%,因此為了降低聚類簇對(duì)孤立噪聲的輻射作用,將數(shù)據(jù)點(diǎn)的場(chǎng)強(qiáng)函數(shù)改為
(8)
一方面,為了解決決策圖對(duì)孤立噪聲點(diǎn)敏感的問題,采用數(shù)據(jù)場(chǎng)中數(shù)據(jù)對(duì)象的勢(shì)能代替決策圖中的局部密度,構(gòu)建勢(shì)能-距離決策圖,不僅避免了決策圖中需要人為設(shè)定截?cái)嗑嚯x的缺點(diǎn)還提高了對(duì)孤立噪聲點(diǎn)的處理能力。另一方面,根據(jù)決策圖特點(diǎn)可知,聚類中心對(duì)應(yīng)的勢(shì)能和最近大勢(shì)能點(diǎn)距離均較大,孤立噪聲點(diǎn)勢(shì)能較小而最近大勢(shì)能點(diǎn)距離較大,聚類簇中除聚類中心點(diǎn)以外的其他點(diǎn)表現(xiàn)為勢(shì)能較大而最近大勢(shì)能點(diǎn)距離較小。因此,為了自動(dòng)選擇聚類中心,在決策圖中引入勢(shì)能距離積的概念,假定數(shù)據(jù)場(chǎng)中數(shù)據(jù)對(duì)象對(duì)應(yīng)的勢(shì)函數(shù)值為,最近大勢(shì)能點(diǎn)距離(等同于最近大密度點(diǎn)距離概念)為,則該數(shù)據(jù)對(duì)象的勢(shì)能距離積可表示為
=·
(9)
將所有數(shù)據(jù)對(duì)象按照勢(shì)能距離積由大到小的順序重新排列,圖2中各數(shù)據(jù)點(diǎn)按照勢(shì)能距離積重新排序后的勢(shì)能距離積如圖5所示,則勢(shì)能距離積較大的前幾個(gè)數(shù)據(jù)對(duì)象即為聚類中心。
圖5 降序重排后的勢(shì)能距離積Fig.5 Product of potential energy and distance after descending rearrangement
已知該決策圖對(duì)應(yīng)的原待分類數(shù)據(jù)包含7個(gè)聚類簇和一些孤立噪聲點(diǎn)。由圖6中勢(shì)能距離積下降率易知,在根據(jù)勢(shì)能距離積降序重排后的第7個(gè)數(shù)據(jù)對(duì)象對(duì)應(yīng)的勢(shì)能距離積下降率最大,依此設(shè)定第7個(gè)數(shù)據(jù)對(duì)象為聚類中心與其他數(shù)據(jù)對(duì)象的分界,即選擇前7個(gè)數(shù)據(jù)對(duì)象為聚類中心,與原待分類數(shù)據(jù)真實(shí)分布情況相符。
圖6 勢(shì)能距離積下降率Fig.6 Descent rate of product of potential energy and distance
根據(jù)上述數(shù)據(jù)場(chǎng)聯(lián)合決策圖的方法,結(jié)合數(shù)據(jù)場(chǎng)對(duì)孤立噪聲不敏感的特點(diǎn)及決策圖在確定聚類中心方面的優(yōu)勢(shì),完成對(duì)孤立噪聲點(diǎn)的篩除、聚類數(shù)目和聚類中心的確定。然而在雷達(dá)信號(hào)分選應(yīng)用中,由于不同屬性參數(shù)在參數(shù)穩(wěn)定性方面存在差異,該類參數(shù)分布不一致無(wú)法用歸一化消除,會(huì)對(duì)最后的數(shù)據(jù)劃分造成影響。如某部雷達(dá)信號(hào)所得的測(cè)角誤差較大,而載頻參數(shù)相對(duì)穩(wěn)定,就會(huì)造成來自該雷達(dá)的信號(hào)在數(shù)據(jù)空間呈現(xiàn)橢球體特征,在得到聚類中心和聚類數(shù)目后,若采取靠近原則對(duì)待聚類數(shù)據(jù)進(jìn)行劃分,則勢(shì)必很難得到很好的分類結(jié)果。因此,根據(jù)待分類雷達(dá)信號(hào)的數(shù)據(jù)空間呈現(xiàn)橢球體的特征,本文提出采用GMM聚類算法來完成最后的數(shù)據(jù)劃分任務(wù),具體的實(shí)現(xiàn)步驟如下:
對(duì)待分類雷達(dá)信號(hào)數(shù)據(jù)進(jìn)行歸一化處理;
計(jì)算所有數(shù)據(jù)對(duì)象兩兩之間的歐氏距離;
利用斐波那契法對(duì)數(shù)據(jù)場(chǎng)中輻射因子參數(shù)進(jìn)行最優(yōu)化選擇;
根據(jù)輻射因子計(jì)算各數(shù)據(jù)對(duì)象的勢(shì)能和最近大勢(shì)能點(diǎn),根據(jù)勢(shì)能對(duì)孤立噪聲點(diǎn)進(jìn)行剔除;
計(jì)算各數(shù)據(jù)對(duì)象的勢(shì)能距離積,并進(jìn)行降序排列;
計(jì)算各數(shù)據(jù)對(duì)象的勢(shì)能距離積下降率,選擇下降率最大的點(diǎn)為聚類中心與其他數(shù)據(jù)點(diǎn)的分界,得到聚類中心和聚類數(shù)目;
采用GMM聚類算法對(duì)剩余雷達(dá)信號(hào)進(jìn)行劃分聚類。
為了驗(yàn)證本文算法在雷達(dá)信號(hào)聚類分選中的有效性,模擬13部雷達(dá)共2 549個(gè)脈沖信號(hào)。為逼近真實(shí)情形,在脈沖方位到達(dá)角(direction of arrival, DOA)和載頻(radio frequency, RF)中加入測(cè)量誤差,一般情況下脈沖寬度(pulse width, PW)越小、信噪比越低,引起的DOA、RF測(cè)量誤差越大,且這種測(cè)量誤差一般服從高斯分布。因此,在信號(hào)模擬中,對(duì)DOA、RF參數(shù)中加入的零均值高斯噪聲,方差與PW大致呈反比關(guān)系。為消除不同維度數(shù)值量級(jí)對(duì)聚類算法的影響,每次仿真實(shí)驗(yàn)均對(duì)待分類數(shù)據(jù)進(jìn)行0~1標(biāo)準(zhǔn)化處理。待分選脈沖數(shù)據(jù)在參數(shù)空間中的三維展示如圖7所示,模擬雷達(dá)信號(hào)具體參數(shù)如表1所示。
圖7 13部雷達(dá)脈沖信號(hào)在參數(shù)空間分布情況Fig.7 Distribution of pulse signals of 13 radars in parameter space
表1 模擬雷達(dá)信號(hào)參數(shù)信息Table 1 Parameter information of radar signal simulation
將本文方法同具備中心點(diǎn)自選擇能力的改進(jìn)K-means、改進(jìn)數(shù)據(jù)場(chǎng)聚類、改進(jìn)CFSFDP算法進(jìn)行對(duì)比,分別從聚類準(zhǔn)確度、算法魯棒性和時(shí)間復(fù)雜度3個(gè)方面對(duì)本文算法性能進(jìn)行驗(yàn)證。實(shí)驗(yàn)平臺(tái)及參數(shù)設(shè)置如表2所示。
表2 實(shí)驗(yàn)平臺(tái)及參數(shù)設(shè)置Table 2 Experimental platform and parameter setting
4.1.1 聚類中心的選取準(zhǔn)確度
為了對(duì)各算法在確定聚類數(shù)目和選擇聚類中心方面進(jìn)行對(duì)比分析,定義聚類中心選取誤差為真實(shí)雷達(dá)目標(biāo)中心點(diǎn)集合與算法選擇的聚類中心點(diǎn)集合之間的Hausdorff距離。為了消除偶然性,每組實(shí)驗(yàn)進(jìn)行100次,每次仿真均重新按照表1對(duì)待聚類脈沖數(shù)據(jù)進(jìn)行重建和標(biāo)準(zhǔn)化,仿真結(jié)果如圖8所示。
圖8 聚類中心選取誤差對(duì)比Fig.8 Comparison of cluster center selection errors
由圖8可知,改進(jìn)的K-means和改進(jìn)數(shù)據(jù)場(chǎng)聚類算法出現(xiàn)幾次誤差較高的情況,考慮是聚類數(shù)目選擇錯(cuò)誤引起的較大誤差。而改進(jìn)CFSFDP總體呈現(xiàn)較小的聚類中心誤差,本文方法采用自動(dòng)中心點(diǎn)選擇的策略得到的聚類中心誤差與改進(jìn)CFSFDP大致相當(dāng),本文提出的勢(shì)能距離積下降率求邊界點(diǎn)的方法用于聚類中心的選取是可行的。
4.1.2 整體聚類準(zhǔn)確度方面
為評(píng)價(jià)各算法整體聚類準(zhǔn)確度性能,采用聚類正確率評(píng)價(jià)指標(biāo)對(duì)各算法分別進(jìn)行仿真實(shí)驗(yàn),各組實(shí)驗(yàn)分別進(jìn)行100次評(píng)價(jià)指標(biāo)取均值。仿真結(jié)果對(duì)比如表3所示。
表3 算法運(yùn)行時(shí)間比較Table 3 Comparison of algorithm run time
根據(jù)表3結(jié)果可知,本文方法在聚類正確率方面整體優(yōu)于其他3種方法,而改進(jìn)CFSFDP算法雖然在聚類中心選擇方面具有性能優(yōu)勢(shì),但在聚類準(zhǔn)確度方面卻低于改進(jìn)數(shù)據(jù)場(chǎng)聚類算法,考慮是因?yàn)樵诖_定聚類中心點(diǎn)以后,CFSFDP算法采用的是靠近原則對(duì)剩余脈沖數(shù)據(jù)進(jìn)行劃分聚類,而當(dāng)兩類雷達(dá)信號(hào)相距較近時(shí),此類超球體的方式就容易發(fā)生錯(cuò)誤劃分。而本文方法在較高的聚類中心選擇正確率基礎(chǔ)上,采用GMM方法以橢球體的方式對(duì)剩余脈沖數(shù)據(jù)進(jìn)行劃分,從而取得了較高的聚類正確率。
在實(shí)際外場(chǎng)環(huán)境中,由于噪聲的起伏和檢波門限設(shè)定等其他多方面原因,待聚類數(shù)據(jù)不會(huì)只有純凈的目標(biāo)信號(hào),往往存在孤立噪聲干擾和目標(biāo)脈沖丟失的情況。圖9為加入20%孤立噪聲脈沖干擾且經(jīng)過標(biāo)準(zhǔn)化處理的待聚類數(shù)據(jù),可以看出由于孤立噪聲脈沖的存在,使得相對(duì)純凈的數(shù)據(jù)空間變得更為復(fù)雜,某些雷達(dá)信號(hào)之間由邊界清晰變得相對(duì)難以界定,更加符合真實(shí)戰(zhàn)場(chǎng)中的電磁環(huán)境。
圖9 加入20%孤立脈沖干擾的標(biāo)準(zhǔn)化后待分類數(shù)據(jù)Fig.9 Standardized data to be classified after adding 20% isolated pulse interference
為驗(yàn)證在模擬真實(shí)電磁環(huán)境下算法的魯棒性,在表1所列目標(biāo)信號(hào)基礎(chǔ)上分別加入脈沖總數(shù)5%、10%、15%、20%的孤立噪聲脈沖和脈沖丟失,將4種方法分別用于對(duì)上述混合信號(hào)進(jìn)行分類處理,對(duì)比不同算法的聚類正確率。每組實(shí)驗(yàn)進(jìn)行100次蒙特卡羅仿真,聚類正確率取均值,仿真結(jié)果如圖10和圖11所示。
圖10 存在孤立噪聲干擾時(shí)聚類準(zhǔn)確率對(duì)比Fig.10 Comparison of clustering accuracy in the presence of isolated noise
圖11 存在脈沖丟失時(shí)聚類準(zhǔn)確率對(duì)比Fig.11 Comparison of clustering accuracy in the presence of pulse loss
對(duì)比分析圖10,在存在孤立噪聲脈沖干擾的情況下,各算法聚類準(zhǔn)確度均不同程度受到影響。其中文獻(xiàn)[8]中的改進(jìn)K-means算法需要先根據(jù)PRI變換法進(jìn)行基于PRI的預(yù)分選,孤立噪聲脈沖的存在會(huì)使PRI值估計(jì)誤差變大,脈沖序列抽取過程中的干擾脈沖增多,準(zhǔn)確率降低,導(dǎo)致后續(xù)基于K-means的聚類準(zhǔn)確率隨著孤立噪聲脈沖的增加而出現(xiàn)嚴(yán)重下降。改進(jìn)數(shù)據(jù)場(chǎng)聚類和改進(jìn)CFSFDP聚類由于噪聲脈沖的存在,一方面會(huì)不可避免地將部分噪聲脈沖歸入類中,另一方面將原本相近的兩個(gè)雷達(dá)信號(hào)誤判為一個(gè)聯(lián)通的聚類簇,從而出現(xiàn)聚類中心選擇錯(cuò)誤的情況,導(dǎo)致聚類準(zhǔn)確度隨著孤立噪聲脈沖的增加而出現(xiàn)不同程度的下降。而本文方法在加入孤立噪聲脈沖后,雖然在確定聚類中心后的數(shù)據(jù)劃分階段受到一定的噪聲干擾影響,聚類準(zhǔn)確度隨孤立噪聲脈沖數(shù)量增加而有所下降,但由于首先根據(jù)數(shù)據(jù)分布選取最優(yōu)輻射因子后對(duì)噪聲脈沖進(jìn)行了剔除,降低了孤立噪聲脈沖在聚類中心選取階段的影響,聚類中心選擇相對(duì)準(zhǔn)確穩(wěn)定,且最后數(shù)據(jù)劃分階段采用了更適合處理非球體類聚類簇的GMM聚類。因此,在4種聚類方法中始終保持最高的聚類準(zhǔn)確度,即使在存在20%孤立噪聲脈沖的情況下,依然能夠保持95%以上的聚類準(zhǔn)確度。
根據(jù)圖11可知改進(jìn)K-means和改進(jìn)CFSFDP算法隨著脈沖丟失數(shù)量的增加聚類準(zhǔn)確度存在一定下降,特別是改進(jìn)K-means算法對(duì)脈沖丟失尤其敏感。主要是改進(jìn)K-means算法中基于PRI的預(yù)分選階段由于脈沖丟失的存在,導(dǎo)致脈沖串出現(xiàn)部分中斷,影響了基于PRI的脈沖串標(biāo)記,進(jìn)而降低了整體的聚類準(zhǔn)確度。由于改進(jìn)CFSFDP算法采用固定的截?cái)嗑嚯x設(shè)定,而脈沖丟失改變了原數(shù)據(jù)密度分布,一定程度上影響了改進(jìn)CFSFDP算法的聚類中心選擇,導(dǎo)致聚類準(zhǔn)確度有所降低。盡管數(shù)據(jù)場(chǎng)聚類算法對(duì)脈沖丟失不敏感,隨著脈沖丟失的增多聚類準(zhǔn)確度并未出現(xiàn)明顯下降,但本文方法由于采用了最優(yōu)輻射因子的數(shù)據(jù)場(chǎng)和聚類中心顯著性自確定方法,以及在數(shù)據(jù)劃分方面的改進(jìn),更加適合處理類似測(cè)量誤差和有意調(diào)制導(dǎo)致的參數(shù)抖動(dòng)信號(hào)的分類,使得本文方法聚類準(zhǔn)確度略高于改進(jìn)數(shù)據(jù)場(chǎng)聚類算法。
電子偵察中的雷達(dá)信號(hào)處理分為實(shí)時(shí)處理和事后處理,其中實(shí)時(shí)處理作為戰(zhàn)術(shù)偵察和電子支援系統(tǒng)的關(guān)鍵環(huán)節(jié)對(duì)算法處理速度提出了很高的要求,在目標(biāo)信號(hào)較多的情況下處理不及時(shí)就會(huì)出現(xiàn)數(shù)據(jù)溢出的情況,可能會(huì)導(dǎo)致丟失重要目標(biāo)數(shù)據(jù)。因此,為考察計(jì)算復(fù)雜度,對(duì)比不同算法、不同數(shù)據(jù)維數(shù)時(shí)的相對(duì)計(jì)算時(shí)間,根據(jù)表1中所列目標(biāo)參數(shù),生成共2 549個(gè)待分類脈沖數(shù)據(jù),選取到達(dá)角和脈寬兩個(gè)屬性參數(shù)構(gòu)成一組二維待分類數(shù)據(jù),對(duì)二維和原DOA、PW、RF三維待分類數(shù)據(jù)分別進(jìn)行聚類仿真實(shí)驗(yàn),各組實(shí)驗(yàn)進(jìn)行100次蒙特卡羅仿真,計(jì)算耗時(shí)取平均值,實(shí)驗(yàn)結(jié)果如圖12所示。
圖12 各算法計(jì)算耗時(shí)對(duì)比Fig.12 Comparison of calculation time of each algorithm
本文算法的時(shí)間復(fù)雜度主要由以下幾部分組成:一是利用斐波那契法根據(jù)勢(shì)熵迭代優(yōu)化輻射因子,時(shí)間復(fù)雜度近似為();二是計(jì)算各點(diǎn)最近大勢(shì)能點(diǎn)距離,并依勢(shì)能距離積進(jìn)行降序重排,時(shí)間復(fù)雜度近似為();三是確定聚類中心后對(duì)剩余數(shù)據(jù)進(jìn)行基于GMM的聚類,該部分滿足線性時(shí)間復(fù)雜度()。因此,本文算法的時(shí)間復(fù)雜度為(++)≈(),與上述改進(jìn)K-means、改進(jìn)數(shù)據(jù)場(chǎng)聚類和改進(jìn)CFSFDP聚類算法()的時(shí)間復(fù)雜度基本相當(dāng),從圖12中算法耗時(shí)的橫向?qū)Ρ纫驳玫搅擞∽C??梢哉f本文算法在提高了聚類準(zhǔn)確率和魯棒性的同時(shí),并未顯著提高算法的時(shí)間復(fù)雜度。但由于本文在最后數(shù)據(jù)劃分階段采用GMM聚類,需要在各維度上尋優(yōu),導(dǎo)致在數(shù)據(jù)維度增加后算法的計(jì)算時(shí)間上升幅度明顯大于改進(jìn)CFSFDP算法,后續(xù)需要針對(duì)數(shù)據(jù)維數(shù)增加對(duì)本文算法進(jìn)行降低復(fù)雜度的針對(duì)性優(yōu)化。值得說明的是,本實(shí)驗(yàn)所得各算法時(shí)間消耗受仿真平臺(tái)和仿真軟件限制,并不能如實(shí)反映算法在實(shí)際應(yīng)用中的表現(xiàn),僅限于同等條件下不同算法之間的性能比較。
本文針對(duì)雷達(dá)輻射源信號(hào)分選應(yīng)用需求,提出了一種基于數(shù)據(jù)場(chǎng)聯(lián)合決策圖改進(jìn)的GMM聚類算法。針對(duì)GMM算法需要輸入初始聚類中心和聚類數(shù)目以及不斷迭代帶來的運(yùn)算消耗大的缺點(diǎn),提出將對(duì)噪聲和脈沖丟失不敏感的數(shù)據(jù)場(chǎng)聚類和能夠快速提出聚類中心的CFSFDP算法進(jìn)行聯(lián)合,優(yōu)化了數(shù)據(jù)場(chǎng)中輻射因子參數(shù)設(shè)定和決策圖中聚類中心點(diǎn)自選擇方法。本文方法無(wú)需人工設(shè)定參數(shù)和人工輔助參與,能夠根據(jù)待分類數(shù)據(jù)分布情況自動(dòng)完成聚類。仿真實(shí)驗(yàn)分別從準(zhǔn)確度、魯棒性、計(jì)算量3個(gè)方面對(duì)算法進(jìn)行了對(duì)比分析,實(shí)驗(yàn)結(jié)果表明,本文方法相較于改進(jìn)K-means、改進(jìn)數(shù)據(jù)場(chǎng)聚類和改進(jìn)CFSFDP算法具有較高的準(zhǔn)確度和魯棒性,相較于改進(jìn)CFSFDP提高了算法適應(yīng)性的同時(shí)并未增加過多計(jì)算復(fù)雜度。對(duì)于存在一定測(cè)量誤差和孤立噪聲干擾的工程應(yīng)用,本文算法對(duì)于提高分選能力具有一定的參考價(jià)值。
但限于GMM聚類算法僅適用于處理類橢球形數(shù)據(jù),對(duì)于雷達(dá)輻射源信號(hào)可能存在的頻率和脈寬捷變、分集等調(diào)制樣式,本文算法聚類效果不夠理想,可能存在將同一雷達(dá)的信號(hào)判定為多個(gè)不同的聚類。因此,下一步可以通過增加判別融合環(huán)節(jié),將聚類后的可能來自同一雷達(dá)的不同類信號(hào)進(jìn)行合并,以提高本文算法適應(yīng)能力。