陳元超
(中國空空導彈研究院,河南 洛陽 471009)
證據(jù)理論由Dempster于1967年研究上下概率問題時首先提出,后由其學生Shafer將信任函數(shù)概念引入而正式形成[1]。證據(jù)理論作為一種多源信息融合方法,有著堅實的數(shù)學基礎,是不確定性推理方法的一種[2-3]。證據(jù)理論通過對不完整性、不確定性問題的數(shù)學建模,為多傳感器信息融合提供了一個很好的方向。
證據(jù)理論由于其優(yōu)越的特性被應用到軍事信息融合系統(tǒng)中,然而由于復雜的自然環(huán)境和人為干擾,某些探測傳感器得到的信息被干擾而與其它傳感器產(chǎn)生沖突。對于高度沖突的證據(jù)信息,經(jīng)典的證據(jù)理論融合會產(chǎn)生有悖常理的結果,很難正確對目標進行識別。對于這一問題,很多學者進行了研究,提出了多種解決方法[4-9],但在某種程度上存在精度低、收斂效率低的問題。
針對證據(jù)沖突的融合問題,本文結合Jousselme距離[10]和Pignistic概率距離[11]的優(yōu)點提出了優(yōu)化的證據(jù)沖突融合方法。
在同一識別框架Θ下,設來自兩個證據(jù)源的基本概率分配函數(shù)m1和m2,對于?A?Θ,命題A的信任函數(shù)通過證據(jù)體m1和m2的正交和得到,其合成規(guī)則為[12]:
m(A)=m1(A)⊕m2(A)=
(1)
式(1)中,A1,A2為命題A的子命題;k為經(jīng)典沖突系數(shù),表達式為:
(2)
而(1-k)-1被稱為歸一化因子。對于在識別框架Θ下,如果對于命題A存在多個證據(jù)體m1,m2,…,mn時,它們合成過程可以通過兩個證據(jù)體時的前兩項的情況進行推導,合成規(guī)則如式(3):
m2(A2)×…×mn(An),A≠Φ
(3)
沖突系數(shù)k表達式為:
(4)
它用來表示證據(jù)間的沖突情況。
證據(jù)理論在實際應用中,對于來自多源的證據(jù)體,當證據(jù)體之間存在明顯的沖突時,經(jīng)典證據(jù)理論所融合的結果往往得出錯誤的結果。對于證據(jù)沖突問題,現(xiàn)舉一例進行詳細說明。
例1 對于一個假定的識別框架Θ=(A,B,C),來自兩個證據(jù)源的證據(jù)體,
證據(jù)體m1:
m1[A]=0.99,m1[B]=0.01,m1[C]=0;
證據(jù)體m2:
m2[A]=0,m2[B]=0.01,m2[C]=0.99。
從證據(jù)體m1可以看出對目標A的支持最大,對其他兩個目標的支持概率明顯小于目標A;而證據(jù)體m2的概率分布情況和證據(jù)體m1明顯不同,證據(jù)體m2支持的目標是C。可以看出兩個證據(jù)源得到的證據(jù)體是高度矛盾的,根據(jù)證據(jù)理論的合成規(guī)則對兩個證據(jù)體進行合成,得到如下的概率分布結果,合成證據(jù)體m:m[A]=0,m[B]=1,m[C]=0。
從合成結果可以看出,對于兩個高沖突的證據(jù)體,如果以經(jīng)典的證據(jù)理論合成規(guī)則進行融合,會得出有悖常理的結果。原證據(jù)體m1和m2分別支持目標A和C,而合成結果卻完全支持本來概率較低目
標B,這明顯不符合實際情況。這一算例也體現(xiàn)了證據(jù)理論合成規(guī)則的另一個問題,一票否決問題,即當證據(jù)體中某一命題被徹底否定時,該命題的融合結果也被一票否決,如例1中證據(jù)體m1否決目標A,融合結果A被否決。另外,根據(jù)證據(jù)理論合成規(guī)則的合成公式(1)可知,當沖突系數(shù)k趨近于1時,即兩個證據(jù)體完全沖突時,合成公式分母趨于零,證據(jù)理論合成規(guī)則失效。
本文應用證據(jù)理論主要是針對軍工系統(tǒng)的目標識別領域,對系統(tǒng)得到的多源信息,如果證據(jù)體間存在沖突,可以認為信息源存在干擾,是證據(jù)源本身的問題。所以采用的第二大類思想對證據(jù)理論進行優(yōu)化,優(yōu)化證據(jù)理論方法的思想流程如圖1所示。
圖1 證據(jù)理論優(yōu)化流程圖Fig.1 Flow chart of optimized evidence theory
從圖1可以看出,首先從多個證據(jù)源得到信息,通過一定的方法計算各個信息源的證據(jù)體;其次計算各個證據(jù)體之間的沖突性,如果兩個證據(jù)體間存在沖突,通過一定方法計算各證據(jù)體的權重,然后得到新的證據(jù)體,否則直接合成;最后將新的證據(jù)體通過經(jīng)典證據(jù)理論合成規(guī)則得到最終結果。
對證據(jù)體進行測量來分配證據(jù)體間的權重,通常認為兩個證據(jù)體間的距離越大,證據(jù)間的相似度越小,它們沖突性就越高。為了全面反映證據(jù)間的沖突情況,引入兩種距離函數(shù)來測量證據(jù)體。
2001年Jousselme等學者將向量空間引入證據(jù)理論[10],提出了一種距離函數(shù)來度量兩個證據(jù)間的相似情況,當距離函數(shù)值越大,表明兩個證據(jù)間的相似度越小。因此可以將Jousselme距離函數(shù)作為判斷證據(jù)間沖突情況的一個測量指標。Jousselme距離函數(shù)定義如下:
假定Θ為一包含N個兩兩不同的命題的完備的識別框架,m1和m2是在識別框架上的兩個概率分配函數(shù),即兩個證據(jù)源的證據(jù)體,則m1和m2的Jousselme距離的具體的計算方法如式(5)所示。
(5)
式(5)中,m為證據(jù)體m的向量表示,‖m‖2=〈m,m〉為向量的內(nèi)積,而內(nèi)積具體算法如式(6)所示:
(6)
Pignistic概率距離,于2006年由學者Liu引入證據(jù)理論中[11]。Pignistic概率距離描述證據(jù)體間對于不同焦元支持程度的最大差別, Pignistic概率距離越大, 表明兩個證據(jù)體之間沖突越大。Pignistic概率距離具體定義如下:
假定Θ為一個的完備的識別框架,m為識別框架下的概率分配函數(shù),Pignistic概率函數(shù)為:
1.4.1 檢查因素:為了明確病變的部位、病因、病理解剖和病理生理等診斷要素,除了問診和體檢,還需要做一系列的檢查,但各種檢查都存在敏感性和特異性的問題,也就是說這些檢查客觀上不是百分之百正確無誤的。至于正常值則是一個參考范圍,必然有一部分患者會納入正常,也會有一部分正常人歸為異常。此外,檢查結果有測定前誤差、測定誤差和測定后誤差。上述因素都會從客觀上干擾我們的思維,影響疾病的診斷。病理檢查的結果應當是特異性最高的實驗檢查,也是臨床醫(yī)師最為重視的報告。但病理檢查的各個環(huán)節(jié)都會影響結果,如標本的采集、固定和保存,切片染色以及閱片等等。
(7)
式(7)中,|A|為焦元A中包含的元素個數(shù),BetPm的含義為各個子命題在識別框架上的概率分布情況,即對子事件的支持程度。
兩個證據(jù)體mi和mj之間的Pignistic概率距離定義為Pignistic函數(shù)差的最大值:
dP(mi,mj)=max(|BetPmi(A)-BetPmj(A)|)
(8)
對某一系統(tǒng),從n個信息源得到n個證據(jù)體,當中間存在證據(jù)體與其他證據(jù)體沖突時,不可以按經(jīng)典合成規(guī)則進行合成,需要將證據(jù)體進行調(diào)整。首先對于n個證據(jù)體,計算兩兩證據(jù)體之間的距離dij(Jousselme距離函數(shù)dJ和Pignistic概率距離dP),得到一個n×n的距離矩陣D:
(9)
通常認為,兩個證據(jù)體間的距離越大,相似度就越小,沖突性就越高。因為距離的范圍為0到1,所以定義兩個證據(jù)體之間的相似度sij為:
sij=1-dij,i,j=1,2,…,n
(10)
得到距離矩陣D后,計算兩兩證據(jù)體之間的相似度sij,可以得到相似度矩陣S:
(11)
接下來將相似度矩陣中每一行除自身的相似度之外的所有元素的和定義為每個證據(jù)體mi的支持度zi:
(12)
證據(jù)體mi的支持度zi反映了mi被其他證據(jù)體所支持的程度,從式(12)可以看出,它是相似度的函數(shù)。如果一個證據(jù)體與其他證據(jù)體比較相似,它們間相似度較高,則證據(jù)體的支持度數(shù)值越大; 如果一個證據(jù)體與其他證據(jù)體相似度較低,則證據(jù)體的支持度數(shù)值越小。將每個證據(jù)體的支持度歸一化處理后定義為可信度,它反映的是一個證據(jù)體的可信程度??梢哉J為,一個證據(jù)體被其他證據(jù)支持的程度越高,該證據(jù)體就越可信,它的權值就越大;如果一個證據(jù)體不被其他證據(jù)體所支持,則認為該證據(jù)的可信較低,權值就小。求得證據(jù)體mi的支持度zi之后,可以計算得到證據(jù)體mi的權值qi:
(13)
m(A)=q1×m1(A)+q2×m2(A)+…+
(14)
通過Jousselme距離dJ和Pignistic概率距離dP分別將n個證據(jù)體處理得到兩個新的證據(jù)體,將它們進行證據(jù)理論合成之后,用合成結果與得到新證據(jù)體dJ和dP的均值合成n-2次,得到最終結果。
為了驗證優(yōu)化沖突證據(jù)融合方法的可行性與優(yōu)越性,通過2個算例來仿真驗證。
例2 對于一個假定的識別框架Θ=(A,B,C),A,B,C為要識別的目標,來自同一探測系統(tǒng)的三個傳感器的探測結果為:
探測器1m1:
m1[A]=0.7,m1[B]=0.1,m1[C]=0.2;
探測器2m2:
m2[A]=0.8,m2[B]=0.1,m2[C]=0.1;
探測器3m3:
m3[A]=0.1,m3[B]=0,m3[C]=0.9。
以概率最大為判別原則,從例2可以看出,探測器1和2識別的目標為A,而證據(jù)體探測器3則為C,說明探測器3與探測器1,2的結果是沖突的,因此,應用本文介紹的優(yōu)化方法,計算Jousselme距離函數(shù)下3個證據(jù)體的權值qJ=(0.42,0.39,0.19),繼而通過權值排序去除干擾項,得到Jousselme距離函數(shù)下新的證據(jù)體mJ=(0.706 9,0.094 3,0.199 0),計算Pignistic概率距離下3個證據(jù)體的權值qP=(0.43,0.39,0.18),同樣的處理得到Pignistic概率距離下新的證據(jù)體mP=(0.708 4,0.094 6,0.197 0)。有三個探測器的證據(jù)體,需要合成兩次。第一次為mJ和mP用證據(jù)理論合成規(guī)則合成,合成之后的結果再和mJ與mP均值合成一次,得到最終的融合結果:m=(0.976 3,0.002 3,0.021 4)。
從最終合成結果可以看出,三個探測器合成之后對目標A的支持度最大,符合實際情況,說明證據(jù)理論優(yōu)化方法在處理沖突證據(jù)時是有效的。
例3 對于一個假定的識別框架Θ=(A,B,C),A,B,C為要識別的目標,來自同一探測系統(tǒng)的5個傳感器的探測結果為,
探測器1m1:
m1[A]=0.5,m1[B]=0.2,m1[C]=0.3;
探測器2m2:
m2[A]=0.0,m2[B]=0.9,m2[C]=0.1;
探測器3m3:
m3[A]=0.55,m3[B]=0.1,m3[C]=0.35;
探測器4m4:
m4[A]=0.55,m4[B]=0.1,m4[C]=0.35;
探測器5m5:
m5[A]=0.55,m5[B]=0.1,m5[C]=0.35。
分別用經(jīng)典D-S證據(jù)理論方法、Mruphy合成方法[5]、Jousselme距離方法[6]、Pignistic概率距離方法[7]和本文優(yōu)化方法對例3中的探測結果進行融合計算,計算結果如表1所示。
從例3題中可以看出,探測器1,3,4和5支持目標A,而探測器2支持目標B,與其他探測器結果沖突,可以認為探測器2受到干擾。通過表1的融合結果可以看出:對于經(jīng)典D-S證據(jù)理論方法,目標A的識別概率一直為0,盡管其他的探測器都是支持目標A的,由于探測器2否決了目標A,最終結果也否決了目標A。Mruphy合成方法克服了經(jīng)典D-S算法的缺點,從表1可以看出,隨著支持目標A的證據(jù)體增多,目標A的支持概率也隨之增大,如果以概率最大作為識別標準,Mruphy合成方法要在4個證據(jù)體融合時才能識別出目標A。Jousselme距離方法和Pignistic概率距離方法也隨著證據(jù)體的增多,克服了沖突探測器2對目標A的識別的干擾,對目標A的支持概率越來越大,識別目標A的情況越明顯,但收斂效率較低。本文新優(yōu)化方法對沖突證據(jù)體做了很好的處理,在探測器2受到干擾時,通過加權處理能快速準確地識別目標A。優(yōu)化方法考慮了證據(jù)體之間的相互關聯(lián)性,考慮了各個證據(jù)體的有效作用,降低了干擾項對最終融合結果的影響,在較少的證據(jù)體下就能使融合結果收斂為正確的目標。在多于兩個證據(jù)體融合的情況下,對目標A的識別概率,本文新優(yōu)化方法明顯高于其他改進方法。
表1 各種方法融合結果對比表Tab.1 Comparison of various methods of fusion results
本文提出了優(yōu)化的證據(jù)沖突融合方法。該方法綜合Jousselme距離和Pignistic概率距離在證據(jù)測量方面的優(yōu)點,對沖突證據(jù)體進行了加權處理,并剔除了干擾項的影響。通過仿真計算和對比分析,結果表明本文所提出的優(yōu)化的證據(jù)沖突融合方法相比于與幾種典型改進方法更好地解決了沖突證據(jù)體融合時出現(xiàn)的問題,且收斂效率高,提升了融合結果的可靠性和合理性,能準確有效地識別出目標,為軍事信息融合系統(tǒng)精準目標識別提供了重要的參考意義。