國 強,宋文明,南普龍,萬 建
(哈爾濱工程大學信息與通信工程學院,150001哈爾濱)
基于數(shù)據(jù)場與云模型的多模雷達信號分選算法
國 強,宋文明,南普龍,萬 建
(哈爾濱工程大學信息與通信工程學院,150001哈爾濱)
針對傳統(tǒng)分選算法處理多模雷達信號效果較差的問題,提出一種基于數(shù)據(jù)場的層次聚類信號分選算法,以克服多模雷達信號分選時存在的“增批”問題.將數(shù)據(jù)場理論應用于多模雷達輻射源信號的分選,利用數(shù)據(jù)場勢函數(shù)劃分輻射源信號數(shù)據(jù)的層次,通過等勢圖的繪制完成數(shù)據(jù)的自組織層次聚類.提出一種基于云模型的分選結果有效性評估算法,可在脫離雷達輻射源庫的情況下驗證信號分選結果的有效性.仿真實驗驗證了提出算法的有效性.
多模雷達;數(shù)據(jù)場;云模型;信號分選
多模雷達是指集多種體制雷達功能于一身,具備多種工作模式,可以同時完成多種作戰(zhàn)任務的新型雷達[1].為提高工作性能并滿足抗干擾的需求,多模雷達多采用復雜多變的波形設計,雷達發(fā)射脈沖的頻率、時域參數(shù)都進行復雜的變化,其雷達信號特征參數(shù)空間復雜多變、不具備明顯的相關性和規(guī)律性.隨著電子對抗設備的日益先進和脈沖密度的迅猛增加,電子偵察設備接收到的雷達信號及雷達輻射源數(shù)據(jù)庫常呈現(xiàn)出明顯的隨機性和模糊性.因此在對多模雷達信號分選時,往往會將一個輻射源的不同模式分選為多個輻射源,造成“增批”現(xiàn)象[2].
從數(shù)據(jù)挖掘的角度來看,領域內提出的多模雷達信號分選算法分為分類算法和聚類算法.典型的分類方法主要包括基于神經(jīng)網(wǎng)絡[3]和基于支持向量機[4]的分選方法.此類方法在處理未知信息過多、樣本集過于復雜、樣本隨機性與模糊性較高的雷達信號時,會產(chǎn)生大量不可預測結果.聚類算法相比于分類算法在處理高密度、具有隨機性和模糊性、數(shù)據(jù)成分復雜的雷達信號更有優(yōu)勢.具有代表性的聚類分選算法法有K-means算法[5]以及網(wǎng)格密度聚類算法[6].當前應用于雷達信號分選的聚類算法存在以下問題:抗噪能力和發(fā)現(xiàn)任意形狀、大小聚類的能力較弱,處理離散數(shù)據(jù)效果較差.
本文受數(shù)據(jù)挖掘理論[7]啟發(fā),提出一種基于數(shù)據(jù)場與云模型的多模雷達信號分選算法.為驗證算法分選結果的有效性,提出一種基于云模型理論的多模雷達信號分選結果評估算法,將每個預分選算法得到的聚類結果歸納為一個云模型,根據(jù)提出的評價判定準則比較、處理不同云模型間的隸屬度,從而驗證分選結果的有效性并進一步提高分選正確率.
由于層次聚類具有通過層次構架模式遞歸地對數(shù)據(jù)進行合并或分裂,形成一種嵌套的類層次結構或類譜系圖的特點,可將一部多模雷達的不同模式雷達信號歸納為同一譜系,適用于多模雷達信號的分選.考慮到當前復雜密集電磁環(huán)境中截獲到的雷達信號存在大量噪聲與離群數(shù)據(jù),且由于雷達信號先驗信息的缺失,層次聚類的參數(shù)無法進行設定.因此本文引入數(shù)據(jù)場理論,利用數(shù)據(jù)場構建輻射源信號的等勢線劃分,采用削除勢心法確定信號樣本的勢心作為層次聚類的聚類中心,通過勢場的建立完成數(shù)據(jù)的自組織層次聚類.
1.1 數(shù)據(jù)場理論
數(shù)據(jù)場理論借用物理中場的概念,將數(shù)據(jù)空間中每個數(shù)據(jù)點視為多維數(shù)據(jù)空間中具有一定質量的粒子,每個粒子周圍存在一個虛擬作用場,數(shù)據(jù)空間中其他數(shù)據(jù)點將受到該點場力的作用,同時該粒子也會受到其他粒子場力的作用.設已知空間Ω中包含n個對象的數(shù)據(jù)集D={x1,x2,…,xn},數(shù)據(jù)空間中任一點的勢是數(shù)據(jù)空間其他點到該點的勢值加和[8],即
式中:‖x-xi‖為數(shù)據(jù)點數(shù)據(jù)對象x到空間任意點xi的歐式空間距離;σ是影響因子,用于控制對象間的相互作用力.
這里需要指出,由于雷達樣本信號不同特征參數(shù)的數(shù)值差異很大,在利用式(1)求取數(shù)據(jù)空間某一點的數(shù)值前,須對雷達信號各參數(shù)進行歸一化處理:雷達某一特征參數(shù)向量A=[a1,a2,…,an]歸一化后得到A′=[a1′,a2′,…,an′],其中ai′=-1+2×(ai-amin)/(amax-amin).數(shù)據(jù)的歸一化處理可以簡化數(shù)據(jù)場的構建,更有效地表現(xiàn)數(shù)據(jù)的密集程度.為了更好地對勢場進行量化分析,將勢值相同的點連接起來構成等勢線.等勢線是數(shù)據(jù)空間中所有數(shù)據(jù)形成的數(shù)據(jù)場疊加而形成的嵌套模型,可以定量描述數(shù)據(jù)空間中數(shù)據(jù)點的分布.圖1是數(shù)據(jù)場等勢線分布示意圖,可見等勢線密度與數(shù)據(jù)點的密集程度成正比.圖1中等勢線圍繞的位置為勢心,是勢場中勢值的極大值點.勢心由代表數(shù)據(jù)點的某個或多個特征參數(shù)的空間分布情況決定,可以最大程度代表該勢心附近所有點的空間特征.當將數(shù)據(jù)場應用于聚類算法中時,可將勢心作為數(shù)據(jù)空間中特征參數(shù)聚類分選算法的聚類中心.
圖1 數(shù)據(jù)場等勢線分布圖
1.2 改進的影響因子選取方法
根據(jù)式(1)可知,數(shù)據(jù)對象的作用距離與σ值的大小成正比.圖2給出當σ取不同值時勢場的分布情況.若σ值足夠大,整個數(shù)據(jù)場可以理解為只有一個勢心的數(shù)據(jù)集合,如圖2(c)所示.此時的數(shù)據(jù)場顯然不能準確反映數(shù)據(jù)點的分布情況,因此一個合適的影響因子值對數(shù)據(jù)場的構建至關重要.本文提出一種改進的影響因子選擇方法,以克服數(shù)據(jù)挖掘算法需要用戶仔細選擇參數(shù)的問題.
圖2 影響因子σ對數(shù)據(jù)勢場分布的影響
基于信息論中表征系統(tǒng)不確定性的熵的概念,引入勢熵來衡量不同影響因子對構成勢場的影響.
令數(shù)據(jù)點x1,x2,…,xn的勢值分別為Ψ1,Ψ2,…,Ψn,則勢熵可以定義為
圖3 勢熵H與σ間的關系曲線
根據(jù)上述分析,σ的選擇可以轉化為尋找勢熵最小值的過程.該改進算法可以在不需要人工選擇的情況下自動選擇最佳的影響因子.
1.3 基于數(shù)據(jù)場的層次聚類算法實現(xiàn)步驟
已知樣本空間Ω?R3中n個輸入多模雷達信號樣本集D={x1,x2,…,xn},每個樣本由特征參數(shù)DOA、PW、RF構成.基于數(shù)據(jù)場的層次聚類多模雷達信號分選的具體步驟為:
1)從信號樣本集D中隨機抽取nsample?n雷達信號,對信號各參數(shù)進行歸一化處理,采用影響因子優(yōu)化選取算法確定影響因子σ.
3)對劃分后的網(wǎng)格空間進行數(shù)據(jù)場勢值計算,并繪制等勢線.
4)采用削除勢心法找到數(shù)據(jù)空間中的勢心值.
5)將數(shù)據(jù)空間中的所有勢心值作為層次聚類的聚類中心,按照等勢線所形成的嵌套結構進行層次劃分,完成多模雷達信號的分選.
1.4 仿真實驗分析
為驗證基于數(shù)據(jù)場的層次聚類算法處理多模雷達信號的有效性,利用表1中的多模雷達信號脈沖仿真數(shù)據(jù)對該分選算法進行仿真實驗.
表1中雷達1與雷達4分別為具有3種工作模式的先進體制多模雷達信號,圖4為表1中雷達信號的和二維仿真圖.如圖4所示,雷達1與雷達4的信號不同工作模式間參數(shù)差異性明顯,采用傳統(tǒng)模糊聚類分選算法[9]進行分選,結果如圖5所示,此時會出現(xiàn)將雷達信號的某一工作模式分選為其他輻射源的情況,出現(xiàn)“增批”現(xiàn)象.
表1 雷達脈沖參數(shù)仿真數(shù)據(jù)
圖4 雷達信號脈沖數(shù)據(jù)二維顯示圖
圖5 模糊聚類處理信號樣本的分選結果
采用基于數(shù)據(jù)場的層次聚類算法對雷達信號樣本進行處理,歸一化各組特征參數(shù)數(shù)值,確定最優(yōu)影響因子值,計算信號樣本的勢值,進而生成數(shù)據(jù)場繪制等勢線,結果如圖6所示.
圖6 數(shù)據(jù)場算法處理信號樣本生成的數(shù)據(jù)場等勢線二維圖
利用圖6中生成的等勢線分布和削除勢心法得到的聚類中心值與聚類數(shù)目,對信號樣本進行層次聚類分選,結果如表2所示.
表2 基于數(shù)據(jù)場的層次聚類算法分選結果
將基于數(shù)據(jù)場的層次聚類算法分選結果與表3中傳統(tǒng)模糊聚類分選結果比較,可以發(fā)現(xiàn)本文所提出方法可以較好處理多模雷達信號,分選性能優(yōu)于傳統(tǒng)聚類算法.但從表2中可以發(fā)現(xiàn),雷達1與雷達4仍有部分信號被誤分選為普通雷達信號.
表3 基于Kohonen網(wǎng)絡模型的聚類算法分選結果
由于雷達輻射源都存在固有參數(shù),對多模雷達信號進行分選時同一部雷達的脈沖序列相比于不同輻射源的脈沖序列相似性更高.因此,在利用基于數(shù)據(jù)場的層次聚類對多模雷達信號進行處理后,引入云模型來對分選結果進行分析,可對處于一部雷達的多種工作模式下的雷達信號進行相似度判定[10],根據(jù)提出的評估確定是否將其歸為一部雷達輻射源.
2.1 云的基本概念
云模型是一種可以描述自然語言和數(shù)據(jù)挖掘領域中未知概念的模糊性和隨機性的數(shù)學工具[11].設U是一個用精確數(shù)值表示的論域(可以是一維的、二維的或多維的),C是U上的定性概念,U中的元素x對于T所表達的定性概念是一個具有穩(wěn)定傾向的隨機數(shù),x在論域上的分布稱為隸屬云,簡稱為云.U在[0,1]取值,云是從論域U到區(qū)間[0,1]的映射,其中每一個x稱為每一個云滴[3].
云的數(shù)字特征包括期望Ex,熵En和超熵He三種特征參量,它們反映了定性概念在整體上的定量特征.期望Ex在數(shù)域中代表所有數(shù)據(jù)的重心位置,可以認為它是一個定性的概念點.熵En在數(shù)域中可以理解為可接受的數(shù)值散度的范圍,代表了數(shù)域中定性概念的不確定性.超熵He是熵En的熵,在數(shù)域中代表數(shù)據(jù)的凝聚性,是定性概念的不確定性度量[3].
2.2 基于云模型的分選結果評估算法
2.2.1 云模型隸屬度計算
求取云模型隸屬度作為相似度判定參數(shù).云模型隸屬度計算的基本思想為:首先對基于數(shù)據(jù)場的層次聚類分選后的每個聚類分別根據(jù)逆向云模型發(fā)生器建立云模型,然后根據(jù)正向云模型發(fā)生器分別求取其他聚類對該云模型的穩(wěn)定傾向度,即隸屬度.
將聚類分選結果中的每個輻射源都看作一個定性概念,設第i個聚類的信號樣本為xijk,i=1,2,…,m,j=1,2,…n,k=1,2,3,其中m是分選結果中雷達輻射源的數(shù)目,n為每個雷達輻射源中信號樣本的數(shù)目,k代表每個信號樣本的特征參數(shù)個數(shù).選取RF、PW、DOA三參數(shù)作為分選向量,因此k=3.設xij1為載頻樣本,xij2為脈寬樣本,xij3為脈沖到達方向樣本.根據(jù)涉及的不需要確定度信息的逆向云發(fā)生器算法[12],求取構成多維云模型各維度的特征參數(shù)Exk、Enk和Hek:
根據(jù)正向云模型發(fā)生器原理[11],生成針對其雷達輻射源信號的多維云模型.以Enk為期望,以為方差生成正態(tài)隨機數(shù)為
進而生成三維云模型
式中:μi(xjl)代表分選結果中的第j個聚類結果中第l個信號樣本對第i個聚類結果構成的云模型的隸屬度,xjlk是第j個聚類結果中第l個信號樣本,n是第j個聚類結果中信號樣本的個數(shù),Exik表示第i個聚類結果中第k維特征的期望值.
式(3)可以表征其他聚類結果中信號樣本對某聚類結果構成的多維云模型的相似度.從云模型理論分析,該式表征的是信號樣本對某聚類結果抽象成的定向概念的隸屬度.利用式(3)求取每個聚類結果中所有信號樣本對其他聚類結果的隸屬度均值Eμij:
2.2.2 分選結果評估準則
當多模雷達信號分選時,在得到不同聚類結果之間的隸屬度均值后,設定分選結果判定規(guī)則:
1)利用第i個聚類與第j個聚類的云模型數(shù)字特征(Exi,Eni,Hei),(Exj,Enj,Hej),采用自適應閾值生成方法[13]確定閾值εμ.
2)當?shù)趇個聚類與第j個聚類的隸屬度均值Eμij大于閾值εμ時,比較兩個聚類結果的ExDOA的差值Δ=|ExDOA(i)-ExDOA(j)|,若差值Δ小于設定閾值εdoa,則認定這兩個聚類為同一雷達輻射源信號的不同工作模式.
3)若第i個聚類與第j個聚類的隸屬度均值Eμij大于閾值εμ,且DOA均值的差值Δ大于設定閾值εdoa,說明該兩個聚類并不來自同一輻射源,卻具有較大的聚類相似度,則雷達信號多參數(shù)分選過程中的參數(shù)設定不是最優(yōu),將該隸屬度均值反饋到多參數(shù)信號分選環(huán)節(jié),用于聚類分選的參數(shù)優(yōu)化.
4)若第i個聚類與第j個聚類的隸屬度均值Eμij小于閾值εμ,則雷達信號得到了正確度較高的多參數(shù)分選,可將分選結果直接傳輸?shù)嚼走_信號識別環(huán)節(jié)和威脅等級判定環(huán)節(jié).
具體實現(xiàn)的流程圖如圖7所示.
圖7 分選結果有效性評估準則
2.3 仿真實驗分析
為驗證基于云模型的分選結果評估算法的有效性,利用基于數(shù)據(jù)場的層次聚類算法分選結果進行仿真實驗.
從表2中分選結果可知,雷達1和雷達4的一部分多模雷達信號被誤分選為雷達2與雷達3的輻射源信號.在采用分選結果評估算法進行處理后,雷達2與雷達3的聚類結果不符合分選有效性評估準則,將分選結果反饋到了層次聚類環(huán)節(jié),對層次聚類的參數(shù)進行了修改,重新進行了計算,分選結果如圖8所示.
圖8 經(jīng)分選結果評估算法反饋優(yōu)化參數(shù)后分選處理結果二維顯示圖
經(jīng)基于云模型的分選結果有效性評估算法反饋優(yōu)化層次聚類參數(shù)后,分選結果出現(xiàn)了較大改進,如表4所示.
表4 經(jīng)分選結果評估算法優(yōu)化參數(shù)后基于數(shù)據(jù)場的層次聚類算法分選結果
基于云模型的分選結果有效性評估算法可準確有效評估多參數(shù)信號分選結果,并可反饋優(yōu)化多參數(shù)分選算法的參數(shù).應用于多模雷達信號分選中時,可判別聚類結果是否屬于同一輻射源的不同工作模式,避免“增批”現(xiàn)象的出現(xiàn),大幅度提高了雷達信號分選過程的準確性和分選結果的可靠性,具有較高的實用價值.
1)針對傳統(tǒng)分選算法不能有效處理多模雷達信號問題,提出基于數(shù)據(jù)場的層次聚類多參數(shù)分選算法,利用數(shù)據(jù)場勢函數(shù)的構建描述雷達信號數(shù)據(jù)的空間分布,通過等勢線的繪制完成信號的自組織層次聚類.
2)針對聚類算法類間分離能力較差的問題,提出基于云模型的雷達信號分選有效性評估體制,利用云模型可以從小數(shù)據(jù)樣本總結出帶有不確定性定性概念的特點,將多參數(shù)分選結果中的每個聚類看作定性概念,采用逆向云模型發(fā)生算法生成云模型,計算每個聚類與其他聚類的平均隸屬度值,根據(jù)分選結果評價規(guī)則處理分選結果.
3)仿真實驗證明,提出的分選結果評價算法可有效減少多模雷達信號分選過程中“增批”現(xiàn)象的出現(xiàn),并能有效對信號分選參數(shù)進行優(yōu)化,進而增加了信號分選準確率.
[1]何明浩.雷達對抗信息處理[M].北京:清華大學出版社,2010:4-100.
[2]趙玉,陸志宏.一種多模雷達信號分選方法的研究[J].現(xiàn)代電子技術,2010,33(13):99-102.
[3]曲衛(wèi),劉孝剛,潘顯俊.神經(jīng)網(wǎng)絡在電子對抗與反對抗中的應用[J].計算機與網(wǎng)絡,2011(34):271-272.
[4]國強,王常虹,李崢.支持向量聚類聯(lián)合類型熵識別的雷達信號分選方法[J].西安交通大學學報,2010,44(8):63-67.
[5]聶曉偉.基于K-Means算法的雷達信號預分選方法[J].電子科技,2013,26(11):55-58.
[6]王軍,張冰.基于動態(tài)網(wǎng)格密度聚類的雷達信號分選算法[J].現(xiàn)代電子技術,2013,36(21):1-4.
[7]李德毅,杜鹢.不確定性人工智能[M].北京:國防工業(yè)出版社2005:190-210.
[8]王樹良.基于數(shù)據(jù)場與云模型的空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)[D].武漢:武漢大學,2002.
[9]郭杰,陳軍文.一種處理未知雷達信號的聚類分選方法[J].系統(tǒng)工程與電子技術,2006,25(6):853-856.
[10]李海林,郭崇慧,邱望仁.正態(tài)云模型相似度計算方法[J].電子學報,2011,39(11):2561-2567.
[11]李德毅,劉常昱.論正態(tài)云模型的普適性[J].中國工程科學,2004,6(8):28-34.
[12]李德毅,知識表示中的不確定性[J].中國工程科學,2000,2(10):73-79.
[13]張家精,王煥寶,倪友聰,等.云模型的隸屬概念判定中閾值生成[J].計算機工程與應用,2011,47(24):125-128.
(編輯王小唯)
The research of sorting method for multimode radar signal based on data field and cloud model
GUO Qiang,SONGWenming,NAN Pulong,WAN Jian
(College of Information and Communication Engineering,Harbin Engineering University,150001 Harbin,China)
To solve the problem that traditional sorting methods can not effectively deal with multimode radar signals,a new signal sorting method based on date field and hierarchical clustering is proposed to avoid the appearance of increasing-batch phenomenon when sortingmultimode radar signals,and then a new algorithm based on cloud model used to evaluate the effectiveness of sorting results without database of radar radiation source is presented.The proposed algorithm is verified by simulations.
multimode radar;data field;cloud model;radar signal sorting
TN974
:A
:0367-6234(2015)11-0076-06
10.11918/j.issn.0367-6234.2015.11.013
2014-03-25.
國家自然科學基金(61371172,61240007);黑龍江省科技攻關(GC13A307);黑龍江省博士后科研啟動金資助(LBH-Q12122);海洋工程國家重點實驗室基金(1213);哈爾濱市應用技術與開發(fā)(2013RFJGJ009).
國 強(1972—),男,博士,教授.
南普龍,npl1108@163.com.