汪高武
(中船重工第七一六研究所,江蘇 連云港 222006)
傳感器多目標信息探測是通過對傳感器系統(tǒng)進行優(yōu)化分配和工作模式設(shè)定,以使系統(tǒng)盡可能多地獲得環(huán)境中存在的目標的信息。傳感器多目標信息探測的實質(zhì)是一個優(yōu)化問題。早期的優(yōu)化對象是運動學(xué)中的數(shù)據(jù),但是這種優(yōu)化算法僅考慮了目標運動的因素,而沒有考慮傳感器探測和識別等因素。例如,利用卡爾曼濾波估計目標的未來位置,通過目標位置的方差控制傳感器的采樣頻率就屬于這類優(yōu)化算法。這類算法很難控制傳感器工作模式(探測、跟蹤和識別)的轉(zhuǎn)換,并且難以實現(xiàn)對一組傳感器同時進行優(yōu)化分配。后來的優(yōu)化對象綜合考慮了動力學(xué)中的數(shù)據(jù)和傳感器工作模式等因素。為綜合考慮多個因素,實現(xiàn)傳感器多目標信息探測的優(yōu)化,許多專家提出了信息論的方法。本文利用信息增量進行傳感器多目標信息探測,提出了基于信息增量的傳感器多目標信息探測算法。
1948年,香濃將熱力學(xué)的熵引入到信息論,因此信息熵(Information entropy)又被稱為香濃熵(Shannon entropy)。信息論中,熵被用來衡量一個隨機變量出現(xiàn)的期望值。它代表被接受之前信號傳輸過程中損失的信息量。信息熵也稱信源熵、平均自信息量。一個值域為{x1,…,xn}的隨機變量X的熵H 定義為[1-2]
其中:E 代表了期望的函數(shù);I(X)是X 的信息量(又稱為信息本體),I(X)本身是個隨機變量。如果p 代表了X 的概率分布,則離散信源的信息熵公式可以表示為
如果p 代表了X 的概率密度函數(shù),則連續(xù)信源的信息熵公式可以表示為
其中,b 是對數(shù)所使用的底,如上所述,通常是2、自然常數(shù)e或10。信息熵并不是負熵,它描述信源的不確定性,而不是不確定性的減少。信息熵大表示信源的不確定程度較大。
潛艇聲探測傳感器每隔一定時間對環(huán)境進行采樣,這將增強作戰(zhàn)系統(tǒng)對環(huán)境的認識,即減少目標信號的不確定性。信息論中,信息熵是信號不確定性的度量。潛艇聲探測傳感器采樣前后信息不確定性減少的數(shù)量用信息增量描述[3-5]
其中:(x-)為先驗概率;(x+)為后驗概率。
為了說明信息增量在傳感器多目標信息探測中的應(yīng)用,首先考慮單個探測單元,并假設(shè)該探測單元內(nèi)最多只能存在1 個目標。
用~s 表示單元的真實狀態(tài),~s =1 表示單元中沒有目標,~s=2,…,S 表示單元中存在1 個目標類型。在先驗信息的基礎(chǔ)上,一個單元處于狀態(tài)s 的概率由先驗分布Q(s)給出。設(shè)P(s)是后驗概率,表示基于某些量測,單元處于狀態(tài)s 的估計概率。當(dāng)P=Q 時,先驗分布得出了最少的信息。由下面的概率表示了完備的信息:
假設(shè)對象集O 是一個無限集,其中每個元素下標取自于有限集s=0,…,S。從集合O 中隨機抽取了n 個對象。先驗概率Q[s]=qs給出了抽取一個由下標s 標識的對象的概率(Q 可以統(tǒng)一取qs=1/S)。隨機抽取n 個對象,對象s 出現(xiàn)了ns次的概率由多項分布描述:
其中o(n)函數(shù)隨n 次線性增長。
式(4)的意義:當(dāng)分布P 很小,則I 擴大,并且相對于先驗信息,后驗信息P 具更大的信息量,在探測/分類問題中,后驗估計與先驗概率相差很懸殊的那些單元包含了大量的信息,相反,后驗估計與先驗概率相近的那些單元包含了少量的信息。對于目標信息探測來講,從那些后驗估計與先驗概率接近的單元中只能獲得相對較少的信息;對于那些具有較低識別值的單元,其后驗信息P 具有大量的信息,所以期望的信息增量是最大的。
信息增量的大小可以反映一次探測所獲得的目標信息的多少。為了計算多目標探測問題的信息增量,首先對探測環(huán)境建模:
將探測環(huán)境劃分為C 個離散的單元c =1,…,C,每個單元的狀態(tài)取自集合s=0,1,…,S,其中s=0 代表單元中不存在目標,s=1,2,…,S 代表單元中存在的目標類型,每個單元至多存在1 個目標。由1 個傳感器探測這些環(huán)境單元,可以導(dǎo)引這個傳感器使其探測任何一個環(huán)境單元,該傳感器1 次只能監(jiān)視1 個環(huán)境單元。對1 個單元探測完畢,傳感器可以對同一單元或者任何其他單元進行探測。當(dāng)傳感器對一個單元進行探測時,該傳感器會輸出1 個離散的測量向量或測量集合z。這些觀測輸出是獨立同分布的隨機事件。單元c處于狀態(tài)s 的條件下輸出z 的條件概率Pc[z|s]已知,c 處于狀態(tài)s 的先驗概率Pc[s]已知。
綜上所述,多目標探測問題就是基于一組觀測集合,確定每個單元所處的狀態(tài)。單元c 的第k 次觀測輸出為zk(k=1,2,…,K),設(shè)ZK=(z1,…,zK)。總共觀測了K 次,在K 次觀測后,基于這些觀測推算單元c 處于狀態(tài)s 的后驗概率為Pc[s|ZK]。對于每一個單元c,多目標探測的目標是通過選擇s 獲得最大的Pc[s|ZK]。
多目標信息探測問題就是為傳感器確定最優(yōu)的環(huán)境單元探測序列,使信息增量獲得最大值。根據(jù)任一環(huán)境單元的探測可以獲得信息增量I,通過計算當(dāng)前環(huán)境單元狀態(tài)的概率計算I??刂苽鞲衅髅看芜x擇使I 最大的那個環(huán)境單元進行探測。這個過程將耗費大量的計算,因為算法包括了根據(jù)每一次觀測c 推算出的所有Pc[s|ZK]的累加。但是,我們評價ΔD 的計算是良性的,因為通過Pc[s|ZK-1]和Pc[zK|s]可以遞歸地計算Pc[s|ZK],從Pc[s|ZK]可以計算I,過程如下:
對于每個單元,使用貝葉斯公式計算K 次觀測的條件下單元處于狀態(tài)s 的概率。觀測ZK的總概率是
因為集合ZK的數(shù)據(jù)是獨立同分布的,所有
當(dāng)前環(huán)境單元所處的狀態(tài)的概率為
分母的累加形式中,t 描述了環(huán)境單元的狀態(tài)。
K 次觀測后,使用當(dāng)前的P[s|ZK]計算信息熵:
傳感器每次采樣,都需要重新解算式(11)。但是,若式(10)可以用遞歸的方法計算,那么式(11)也可以用遞歸的方法計算,可以大大減少計算量。
將式(12)代入式(10)得
注意到對1 個單元進行K -1 次觀測后,由于狀態(tài)s 互斥且完備,所以第K 次觀測的概率密度計算公式為
對單元c 進行探測、識別的信息增量為
基于識別的傳感器管理策略就是選擇使I 最大的單元c。其中K 是當(dāng)前對單元c 的觀測次數(shù),對于不同的單元觀測次數(shù)一般不同。
首先,研究Bernouli 探測問題,單次觀測的檢測概率pd=0.8,單次觀測的誤警率pfa=0.5。觀測系統(tǒng)中期望的目標數(shù)量為1。系統(tǒng)先驗?zāi)繕朔植际且恢碌?,所以每個單元中包含目標的概率為q=1/C。對于這樣的問題,單元狀態(tài)S=2,相對的概率和分布就容易評估。例如,如果一個單元包含目標的概率為pt,則使用式(10)計算信息熵
設(shè)對于一個包含目標的單元來講檢測出目標存在,這種情況的平均后驗概率用式(12)計算是一個不包含目標的單元被檢測出目標存在的平均后驗概率。在導(dǎo)向查找的識別和導(dǎo)向查找(C=100 個單元、這些單元的狀態(tài)取幾次試驗的平均結(jié)果的情況下進行的直接查找)之間進行比較。在導(dǎo)向查找的情況下,系統(tǒng)中的每個單元被連續(xù)地采樣,并且對每個單元采用的次數(shù)相同。50 次試驗、每個單元進行10次采樣的結(jié)果:對于導(dǎo)向查找的識別對于導(dǎo)向查找比較上述2 個結(jié)果,使用識別-導(dǎo)向查找的概率估計的準確性潛在的提高了。
其次,使用閾值數(shù)據(jù)在白噪聲背景下的高斯目標檢測問題是較復(fù)雜的問題。當(dāng)無目標出現(xiàn)時,期望的信號強度是N0;當(dāng)目標出現(xiàn)時,期望的信號強度是S0+N0。對于這個問題優(yōu)化的信號采用檢測器是一個遵從Neyman-Person 閾值測試的諾斯過濾器。過濾器的輸出λ 被閾值限制以產(chǎn)生一次量測的z,λ=1 代表閾值通過,λ≠1 代表閾值沒通過。使用多次量測Zk,使用式(12)估計目標出現(xiàn)或未出現(xiàn)的概率。當(dāng)沒有目標出現(xiàn)時,λ 的方差為σ2=2S0/N0,分布為
當(dāng)目標出現(xiàn)時,λ 的分布為
一次采樣的誤警率為
對于每一次單元采樣,利用傳感器對目標進行探測必須解決2 個問題:選擇哪一個環(huán)境單元進行探測?閾值τ 為多大?可以選擇τ 使每一次采樣期望的信息增量I 最大。圖1顯示了信噪比是0 dB 時,目標位于某單元的估計概率pt取不同值時,I 隨閾值τ 的變化。當(dāng)pt=0.5 時,期望的信息增量最大,此時最優(yōu)的閾值是τ*=/2。當(dāng)pt≠0.5 時,最優(yōu)閾值也不是/2。作為pt的函數(shù),信息增量用于優(yōu)化每個單元的閾值。但是,注意到,隨著pt遠離0.5,τ -獨立性降低通過使用固定的閾值。
圖1 信息增量隨單元狀態(tài)的變化曲線
本文提出了利用傳感器進行多目標信息探測的一種方法,介紹了信息熵的概念和信息增量的計算方法。通過仿真實驗說明了算法的正確性與實用性。
[1]吳湘淇.信號、系統(tǒng)與信號處理[M].北京:電子工業(yè)出版社,1999:263-276.
[2]田寶玉.信息論基礎(chǔ)[M].北京:人民郵電出版社,2008.
[3]Keith K.Discrimination gain to optimize detection and classification.[J]. IEEE Transactions on SMC,1997,27(1):112-116.
[4]Stan M,Keith K.Comparison of sensor management strategies for detection and classification[M].[S. l.]:International Symposium on Sensor Fusion,1996:128-137.
[5]劉先省,周林,杜曉玉.基于目標權(quán)重和信息增量的傳感器管理方法[J].電子學(xué)報,2005,33(9):1684-1687.
[6]李琪,郭娜,劉先省,等.基于Unscented 粒子濾波的傳感器管理算法[J].火力與指揮控制,2011(6):77-80.