張國亮楊春玲王暕來
①(哈爾濱工業(yè)大學(xué)電氣工程及自動化學(xué)院 哈爾濱 150001)②(中國運載火箭技術(shù)研究院 北京 100076)
在自動目標識別(Automatic Target Recognition, ATR)研究領(lǐng)域,大氣層外空間彈道目標的自動識別是一個挑戰(zhàn)性的難題[1]。這主要是因為空間彈道目標的自動識別具有如下難點:(1)彈道目標存在多樣性,包括彈頭,導(dǎo)彈碎片以及誘餌(可能又包含重誘餌和輕誘餌)等;(2)彈道目標的輻射特性表現(xiàn)出動態(tài)時變性;(3)遠距離探測時,獲取目標的信息量非常有限。這些難點反應(yīng)在實際應(yīng)用中主要就是如何提取用于目標識別的有效特征以及如何設(shè)計有效的目標分類算法。針對空間目標識別的這些問題,很多學(xué)者進行了此方面的研究[24]-。文獻[2-4]中的方法主要是利用雷達的時頻域量測特征進行的目標識別,其中主要包括目標的雷達散射截面積(Radar Cross Section, RCS),目標的運動軌跡,以及目標的多普勒特征等。但當(dāng)有多個真假目標同時在中段飛行時,彈頭并不存在區(qū)別其它誘餌的固有頻率,而且彈頭和誘餌的軌跡相近[5],這給彈道目標的識別造成很大困難。光譜信息是由物體內(nèi)在的物理性質(zhì)決定的,所以通過分析物體光譜信息,可以獲得其它方法不能獲得的目標固有屬性。因此目標的光譜差異信息可以作為識別目標的一種重要手段。另外,由于人工神經(jīng)網(wǎng)絡(luò)良好的并行性和自學(xué)習(xí)能力,近年來被廣泛用于空間彈道目標識別。文獻[6]設(shè)計了三波段的空間彈道目標識別算法,采用反向傳播(Back Propagation, BP)神經(jīng)網(wǎng)絡(luò)對空間彈道目標進行了識別。文獻[7]利用雙波段紅外輻射特性提出了一種時延回歸神經(jīng)網(wǎng)絡(luò)(Time-Delay Recurrent Neural Network, TDRNN)用于空間彈道目標識別。文獻[8]利用目標的紅外特性提出一種時延神經(jīng)網(wǎng)絡(luò)(Time-Delay Neural Network, TDNN)彈道目標識別方法。文獻[9]提出了一種自適應(yīng)時延神經(jīng)網(wǎng)絡(luò)(Adaptive Time-Delay Neural Network,ATNN)識別大氣層外彈道目標。通過分析可知,TDNN在空間目標識別中較為常用,如 ATNN和TDRNN就是TDNN的變種。但TDNN本質(zhì)上和BP極為相似,屬于BP神經(jīng)網(wǎng)絡(luò)的“增強版”[8]。BP類神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和記憶具有不穩(wěn)定性,即如果增加學(xué)習(xí)樣本,訓(xùn)練好的網(wǎng)絡(luò)需要從頭重新訓(xùn)練,對以前網(wǎng)絡(luò)的權(quán)值和閾值沒有記憶,且易陷入局部極小值。另外上述神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法復(fù)雜度較高,這可能會限制它們在實際中的應(yīng)用。
概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,PNN)近年來已在不同模式識別領(lǐng)域得到應(yīng)用[10,11],因為PNN具有學(xué)習(xí)過程簡單,收斂于貝葉斯最優(yōu)解等優(yōu)點。另外,近年來多光譜紅外數(shù)據(jù)在ATR領(lǐng)域表現(xiàn)出極大的潛力,主要是它們可同時提供目標的時域特征和光譜特征。因此利用多光譜數(shù)據(jù)融合目標的時譜特性可能會進一步提高目標識別性能。本文就是從多光譜數(shù)據(jù)融合的優(yōu)勢出發(fā),通過對大氣層外空間彈道目標的多光譜紅外輻射序列的仿真和實驗研究,提出一種基于粒子群優(yōu)化PNN的空間彈道目標識別方法。該方法通過融合彈道目標的多光譜紅外輻射數(shù)據(jù),提高了目標識別的穩(wěn)健性,利用提出的多比色測溫方法提高了動態(tài)特征提取的精確度。文中首先介紹了PNN模型及其學(xué)習(xí)算法。其次采用粒子群優(yōu)化方法對PNN進行優(yōu)化。然后提出一種基于比色測溫的多色測溫方法對空間彈道目標的動態(tài)特征進行提取。最后利用仿真實驗數(shù)據(jù)對4類典型空間彈道目標進行了識別研究。
PNN是由徑向基神經(jīng)網(wǎng)絡(luò)發(fā)展而來的一種前饋型神經(jīng)網(wǎng)絡(luò),最早由Specht[12]提出。其基本原理為假設(shè)有d維輸入特征向量,它屬于c個分類之一。和分別為類iω的先驗概率和類條件概率密度函數(shù)(似然函數(shù))。貝葉斯決策理論通過最小化總風(fēng)險做出相應(yīng)決策,如果正確分類損失為0,錯誤分類損失為1,即損失函數(shù)為0-1函數(shù),其判決規(guī)則為
式(2)的iN是類iω的訓(xùn)練樣本個數(shù),為類iω的第j個訓(xùn)練樣本,σ為平滑因子。
PNN模型包括輸入層、模式層、求和層和輸出層4部分。輸入層神經(jīng)元個數(shù)與特征矢量x的維數(shù)相等,該層負責(zé)接收測試集的樣本并將該樣本的特征矢量傳遞給網(wǎng)絡(luò)。模式層含有c組神經(jīng)元(每組神經(jīng)元對應(yīng)一個模式類),每組神經(jīng)元的個數(shù)與訓(xùn)練集該類別的樣本數(shù)相同,該層負責(zé)計算特征矢量x與訓(xùn)練集各個樣本的匹配關(guān)系,因而每個神經(jīng)元都與輸入層完全連接,第i組第j個神經(jīng)元的輸出為
其中是類iω的第j個訓(xùn)練樣本,同時也是該神經(jīng)元的權(quán)值向量。求和層含有c個神經(jīng)元(每個神經(jīng)元對應(yīng)一個模式類),每個神經(jīng)元只與屬于自己類別的模式層神經(jīng)元相連,將模式層所有該類神經(jīng)元的輸出累積后取均值,得到
由式(4)可知,求和層各神經(jīng)元的輸出與類條件概率密度函數(shù)的Parzen窗估計相等。輸出層含有c個神經(jīng)元(每個神經(jīng)元對應(yīng)一個模式類),該層負責(zé)接收求和層輸出的各類別條件概率密度函數(shù),每個神經(jīng)元的輸出為
需要指出的是,在仿真實驗中平滑因子σ對PNN的性能有一定的影響。平滑因子較小時會造成網(wǎng)絡(luò)的過擬合,易受噪聲干擾。雖σ越大時逼近函數(shù)越平滑,但σ過大會造成模式層的神經(jīng)元個數(shù)過多,進而增加計算量。因此應(yīng)用PNN的關(guān)鍵是如何選取合適的σ值。
粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是一種基于種群智能方法的演化計算技術(shù)[13]。PSO具有收斂速度快、算法簡單等優(yōu)點,而且它不要求被優(yōu)化函數(shù)具有可導(dǎo)、可微等性質(zhì)。由于經(jīng)典的 PSO算法嚴重依賴加速度常數(shù)和慣性權(quán)值的設(shè)置,本文擬采用一種高斯粒子群優(yōu)化(Gaussian PSO,GPSO)[14]方法對PNN的σ值進行優(yōu)化。
設(shè)粒子群數(shù)目為N,第n個粒子在D維空間中的位置和速度分別為和代表粒子n的歷史最好位置(最好擬合值的位置),是第n個粒子所在鄰域的歷史最佳位置(通常將鄰域選為整個種群,即全局模型)。粒子速度迭代方程為
其中k為種群代數(shù)(或迭代次數(shù))。|rand|和|Rand|是正隨機數(shù),可由高斯概率密度的絕對值產(chǎn)生,即abs[(0,1)]N ,其中 (0,1)N 表示零均值、單位方差的標準正態(tài)分布。
粒子的位置更新方程為
式(8)中粒子速度和位置都是隨機矢量。式(7)和式(8)顯示GPSO只需要用戶設(shè)置粒子數(shù)N,不需要別的參數(shù)。
本文計算每一個網(wǎng)絡(luò)在訓(xùn)練集上產(chǎn)生的均方誤差,并以此作為目標函數(shù)。通過目標函數(shù)構(gòu)造相應(yīng)的適應(yīng)度函數(shù),用來計算每個粒子的適應(yīng)度。目標函數(shù)為
綜上所述,本文提出的高斯粒子群優(yōu)化 PNN(GPSO-PNN)算法流程如下:(1)訓(xùn)練集中的樣本都歸一化為單位長度,即;(2)將 PNN 的目標函數(shù)設(shè)置為GPSO的目標函數(shù),進而求得適應(yīng)度函數(shù),即式(10);(3)將 PNN 中的待優(yōu)化參數(shù)寫為GPSO的粒子位置;(4)初始化GPSO中的主要參數(shù),限定粒子的搜索空間,并確定算法的終止條件;(5)利用歸一化訓(xùn)樣本訓(xùn)練每個 PNN。運行GPSO算法,按式(7)和式(8)更新,直到滿足終止條件;(6)如果終止條件不滿足,返回到第(4)步;(7)返回粒子群全局最優(yōu)值gp作為平滑因子的最優(yōu)值,并利用此值進行實驗得到最終識別結(jié)果。
通過大量的仿真實驗研究,我們決定將溫度變化率和有效輻射面積變化范圍作為空間目標識別的有效特征。當(dāng)前空間目標的溫度測量通常采用比色測溫法[15]。假設(shè)絕對溫度為T的空間目標在紅外探測系統(tǒng)處產(chǎn)生的輻照度為
式(12)中1c和2c是輻射常數(shù)。當(dāng)時,式(12)可以近似表示為
式(13)又稱為維恩輻射定律。對于比色測溫,結(jié)合式(11)和式(13),在假設(shè)的情況下,雙波段比色測溫法可表示為
整理式(14)后得到
在傳統(tǒng)的多光譜輻射測溫方法中,發(fā)射率通常用一個含有未知參數(shù)的關(guān)于波長的平滑函數(shù)來描述。為此,本文將式(17)中發(fā)射率比的自然對數(shù)用一個關(guān)于波長的多項式函數(shù)來描述,即
誤差函數(shù)一般用誤差平方和來表示,即
通過減小未知目標發(fā)射率的不確定性,上述方法能夠進一步提高溫度測量的精確度。一旦獲取了空間目標的絕對溫度,利用空間目標測軌所提供的距離信息,還可以得到另一個識別特征量目標的有效輻射面積,由式(11)可得
紅外探測器接收到的目標信號強度受諸多因素的影響(如目標動力學(xué)特性,表面溫度,有效輻射面積,目標距探測器距離等),因此很難精確描述目標的紅外輻射強度。目標信號時間序列的仿真只能依托于某些特定模型,其中較為常用的是 BODE(Bhattacharyya Optical Decoy Evaluation)模型。利用簡化后的二階BODE模型,則t時刻目標在第l個波段的相對光譜輻照度可以表示為
其中l(wèi)A,lB和lC分別代表目標相對光譜輻照度在該波段隨時間零次項,一次項和二次項的變化程度;和φ分別為正弦調(diào)制項的幅值,角速度和初相角,以上3個參數(shù)用于描述空間目標的進動運動對目標相對光譜輻照度造成的影響,因此對某一特定目標而言,ω和φ在各個波段的值是相同的。認為是均值為0的加性噪聲。第i波段的信噪比(單波段信噪比)SNR定義為正弦調(diào)制項幅值lS與噪聲方差的比值。
根據(jù)BODE模型和表1中的參數(shù),4種典型空間目標某波段的相對光譜輻照度隨時間的變化曲線如圖1所示,這里的單波段信噪比SNR=1。本文采用12個光譜波段數(shù)據(jù)做測試,這些波段均勻地分布在4~15μm。
根據(jù)上述仿真實驗數(shù)據(jù),利用本文提出的多比色測溫法可以很容易地提取出該目標的動態(tài)溫度。圖2比較了兩種不同測溫法提取出的目標溫度與目標原始溫度的差異,其中前者為傳統(tǒng)的雙色測溫法,后者為本文提出的多比色測溫法。觀察圖2可以發(fā)現(xiàn),相比傳統(tǒng)的雙色測溫法,多比色測溫法的測量誤差更小。因此多比色測溫方法進一步提高了溫度測量的準確性。
為衡量兩個時變特征對彈頭、重誘餌、導(dǎo)彈碎片以及氣球誘餌4種典型空間目標的識別能力,我們給出了上述4種目標針對每個特征的概率密度函數(shù),如圖3(a)和圖3(b)所示。這里把目標特征隨時間的變化曲線視為該目標特征的概率密度函數(shù),從而可以利用其差異達到識別目標的目的。觀察上述兩圖可以發(fā)現(xiàn),以上4種空間目標的概率密度函數(shù)差異明顯,因此利用上述兩個時變特征可有效對目標進行區(qū)分。由于重誘餌和彈頭在形狀上相似,本文將詳細闡述利用上述特征識別彈頭和重誘餌的有效性。盡管重誘餌初始釋放溫度跟彈頭相近或者相同,但重誘餌的溫度變化率大于彈頭,也就是說重誘餌的溫度相比彈頭下降要快。另外,重誘餌不可能做到和彈頭一模一樣,且往往由于實際條件的限制其尺寸和重量比彈頭小的多,因此重誘餌的有效輻射面積變化范圍通常是小于彈頭的。因此利用上述特征可對彈頭和重誘餌有效區(qū)分。
表1 空間目標的基本物理參數(shù)
圖1 利用BODE模型生成的目標相對光譜輻照度(SNR=1)
圖2 原始溫度與預(yù)測溫度的比較
圖3 4種典型空間目標特征的概率密度函數(shù)
訓(xùn)練數(shù)據(jù)集共有400個樣本數(shù)據(jù),其中彈頭、重誘餌、導(dǎo)彈碎片和氣球誘餌各100個。將提取出的目標時變溫度和時變有效輻射面積以0.5 s的時間間隔進行采樣,共持續(xù) 5 s,即每個動態(tài)特征均有11個樣本點用于構(gòu)建其概率密度函數(shù),將22維的特征矢量送入 GPSO-PNN神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,具體訓(xùn)練過程參見本文第3節(jié)。由于本文使用了GPSO技術(shù)對PNN優(yōu)化,不需要反復(fù)手動調(diào)節(jié)PNN的平滑因子。
本文比較了不同單波段信噪比條件下采用GPSO-PNN神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)進行目標識別的結(jié)果,如表2所示。其中W, HD, F和BD分別代表彈頭、重誘餌、導(dǎo)彈碎片和氣球誘餌,其余參數(shù)設(shè)置同前。表2的識別結(jié)果證明本文提出的方法對4類典型空間目標是有效的。另外觀察表2可以發(fā)現(xiàn),在低信噪比條件下,與傳統(tǒng) BP神經(jīng)網(wǎng)絡(luò)相比,GPSO-PNN神經(jīng)網(wǎng)絡(luò)能夠獲得更好的分類識別性能。
本文提出了一種基于優(yōu)化概率神經(jīng)網(wǎng)絡(luò)和多光譜紅外數(shù)據(jù)融合的方法用于大氣層外空間彈道目標的識別。該方法充分融合了多光譜紅外數(shù)據(jù)的時間信息和光譜信息,在此基礎(chǔ)上提出了一種基于比色測溫的多色測溫方法用于提取目標的動態(tài)特征,提高了溫度測量的精確度,進而提高了目標識別的準確率。利用PNN訓(xùn)練得到各模式類的后驗概率,優(yōu)于傳統(tǒng)的硬性判決。針對PNN中的平滑因子選取問題,本文采用GPSO優(yōu)化方法進行了優(yōu)化,避免了手動操作。利用仿真實驗數(shù)據(jù)進行了測試,并比較了不同單波段信噪比條件下的平均識別成功率。仿真結(jié)果顯示在低信噪比條件下,本文算法的識別性能優(yōu)于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)。
表2 GPSO-PNN和BP兩類識別方法的結(jié)果比較
[1] 高乾, 周林, 王森, 等. 彈道導(dǎo)彈中段目標特性及識別綜述[J].裝備指揮技術(shù)學(xué)院學(xué)報, 2011, 22(1): 78-82.Gao Qian, Zhou Lin, Wang Sen, et al.. Summarize of target characteristics and recognition of ballistic missile in trajectory midcourse[J]. Journal of the Academy of Equipment Command & Technology, 2011, 22(1): 78-82.
[2] 范成禮, 邢清華, 付強, 等. 基于直覺模糊核聚類的彈道中段目標識別方法[J]. 系統(tǒng)工程與電子技術(shù), 2013, 35(7):1362-1367.Fan Cheng-li, Xing Qing-hua, Fu Qiang, et al.. Technique for target recognition in ballistic midcourse based on intuitionistic fuzzy kernel clustering[J]. Systems Engineering and Electronics, 2013, 35(7): 1362-1367.
[3] 寇鵬, 劉永祥, 朱得糠, 等. 基于軌跡特性的中段目標識別方法[J]. 宇航學(xué)報, 2012, 33(1): 91-99.Kou Peng, Liu Yong-xiang, Zhu De-kang, et al..Discrimination strategy for midcourse target based on trajectory characteristics[J]. Journal of Astronautics, 2012,33(1): 91-99.
[4] 田巳睿, 蔣躍紅, 郭汝江, 等. 基于時頻變換的彈道目標微多普勒特征提取[J]. 現(xiàn)代雷達, 2012, 34(1): 40-43, 48.Tian Si-rui, Jiang Yue-hong, Guo Ru-jiang, et al.. Ballistic target micro-doppler feature extraction method based on the time-frequency analysis[J]. Modern Radar, 2012, 34(1): 40-43,48.
[5] 武春風(fēng), 張偉, 李潔, 等. 基于時空信息的紅外成像系統(tǒng)在探測識別目標時所面臨的問題及分析[J]. 光學(xué)技術(shù), 2005, 31(2):231-234.Wu Chun-feng, Zhang Wei, Li Jie, et al.. Problems and its analysis of infrared imaging detection and identification facing[J]. Optical Technique, 2005, 31(2): 231-234.
[6] Haberstroh R and Kadar I. Multispectral data fusion using neural networks[C]. Conference on Signal Processing, Sensor Fusion, and Target Recognition, Orlando, USA, 1993: 65-75.
[7] 劉濤, 呂江北, 王書宏, 等. 基于TDRNN的大氣層外彈道式空間紅外目標識別[J]. 電子與信息學(xué)報, 2010, 32(1): 80-85.Liu Tao, Lü Jiang-bei, Wang Shu-hong, et al.. Exoatmospheric discrimination of infrared ballistic space target based on the time-delay recurrent neural network[J]. Journalof Electronics & Information Technology, 2010, 32(1): 80-85.
[8] Resch C. Exo-atmospheric discrimination of thrust termination debris and missile segments[J]. Johns Hopkins APL Technical Digest, 1998, 19(3): 315-321.
[9] Lin D T. Target components discrimination using adaptive time-delay neural network[J]. Journal of Information Science and Engineering, 2004, 20(5): 959-980.
[10] 李新德, 楊偉東, Dezert Jean. 一種飛機圖像目標多特征信息融合識別方法[J]. 自動化學(xué)報, 2012, 38(8): 1298-1307.Li Xin-de, Yang Wei-dong, and Dezert Jean. An airplane image target’s multi-feature fusion recognition method[J].Acta Automatica Sinica, 2012, 38(8): 1298-1307.
[11] 高志華, 賁可榮, 章林柯. 一種基于直推置信的遺傳優(yōu)化概率神經(jīng)網(wǎng)絡(luò)[J]. 南京大學(xué)學(xué)報(自然科學(xué)), 2012, 48(1): 48-54.Gao Zhi-hua, Ben Ke-rong, and Zhang Lin-ke. An optimized probabilistic neural network based on transductive confidence[J]. Journal of Nanjing University (Natural Sciences), 2012, 48(1): 48-54.
[12] Specht D F. Probabilistic neural networks[J]. Neural Networks, 1990, 3(1): 109-118.
[13] Kennedy J and Eberhart R. Particle swarm optimization[C].Proceedings of the IEEE International Conference on Neural Networks, Piscataway, USA, 1995, 4: 1942-1948.
[14] Krohling R A. Gaussian swarm: a novel particle swarm optimization algorithm[C]. Proceedings of the IEEE Conference on Cybernetics and Intelligent Systems,Singapore, 2004: 372-376.
[15] 李云紅, 王瑞華, 李禹萱. 雙波段比色測溫技術(shù)及實驗測試[J].激光與紅外, 2013, 43(1): 71-75.Li Yun-hong, Wang Rui-hua, and Li Yu-xuan. Dual waveband colorimetric temperature measurement technology and experiment[J]. Laser & Infrared, 2013, 43(1): 71-75.