蔣 斌,梁小安,張 亮,高楊軍
空軍工程大學(xué) 裝備管理與無人機工程學(xué)院,西安710051
D-S證據(jù)理論[1-2]具備堅實的數(shù)學(xué)理論基礎(chǔ),相較于傳統(tǒng)概率論能夠更好地進行不確定信息的表達、處理和融合,因此自提出以來就逐步在信息融合[3-4]、風(fēng)險評估[5]、模式識別[6-7]、決策分析[8-9]等諸多領(lǐng)域得到了廣泛應(yīng)用。同時,針對D-S證據(jù)理論在處理高沖突證據(jù)時出現(xiàn)的悖論問題[10-11],眾多學(xué)者進行了針對性研究[12-15],其中,修正證據(jù)源的解決方法保留了經(jīng)典Dempster組合規(guī)則滿足交換律、結(jié)合律等性質(zhì)的優(yōu)良特性,更有利于降低證據(jù)理論在工程應(yīng)用中的計算復(fù)雜度。為此,本文從修正證據(jù)源的思路出發(fā),以修正權(quán)重的確定為研究重點,通過對證據(jù)源的預(yù)處理提出證據(jù)信息有效組合的科學(xué)方法。
針對證據(jù)修正權(quán)重的確定問題,Murphy[16]提出的證據(jù)算術(shù)平均組合方法對每條證據(jù)賦予了相同的權(quán)重,在解決證據(jù)沖突的同時卻忽視了證據(jù)間的關(guān)聯(lián)關(guān)系。我國學(xué)者鄧勇[17]引入Jousselme距離衡量證據(jù)間的沖突程度,進而通過對證據(jù)關(guān)聯(lián)關(guān)系的有效量化確定了修正權(quán)重,為此類問題的解決提供了全新思路。隨后,文獻[18]和文獻[19]則分別利用Pignistic概率距離和蘭氏距離對證據(jù)沖突進行了度量,提出了相應(yīng)的修正權(quán)重確定方法;文獻[20]將證據(jù)看作向量,基于向量相似度對沖突證據(jù)進行了修正組合,克服了傳統(tǒng)沖突度量方法存在的不足;文獻[21]在利用Pignistic概率函數(shù)對非單子集進行轉(zhuǎn)換的基礎(chǔ)上,引入了相關(guān)系數(shù),實現(xiàn)了相關(guān)系數(shù)在證據(jù)修正權(quán)重確定中的有效應(yīng)用;文獻[22]則通過對相關(guān)閾值的設(shè)定比較,給出了局部沖突修正和全局沖突分配的不同策略,進一步豐富了沖突證據(jù)修正的方法。上述研究成果基于證據(jù)沖突程度的不同計算方法對證據(jù)修正權(quán)重的確定進行了有益的探索,在實際應(yīng)用中改進了沖突證據(jù)組合的收斂性,但這一類方法僅僅關(guān)注證據(jù)間的關(guān)聯(lián)關(guān)系,沒有考慮證據(jù)綜合不確定度對修正權(quán)重的影響,弱化了待組合證據(jù)的信息價值,導(dǎo)致修正權(quán)重的確定存在一定的片面性,證據(jù)組合結(jié)果的可信度有待進一步提升。
事實上,關(guān)聯(lián)關(guān)系是衡量證據(jù)可用與否的關(guān)鍵因素之一,它從證據(jù)的外部關(guān)系反映了證據(jù)間的相似性。而不確定度作為反映證據(jù)內(nèi)部可靠性的重要指標(biāo),是衡量證據(jù)可用與否的另一個重要因素。基于上述分析,本文在對證據(jù)綜合不確定度進行系統(tǒng)闡述的基礎(chǔ)上,從證據(jù)外部的關(guān)聯(lián)關(guān)系和內(nèi)部的不確定度入手,分別提出基于改進沖突度的相似性權(quán)重確定方法和基于綜合不確定度的可靠性權(quán)重確定方法,進而得到一種改進的證據(jù)修正權(quán)重,應(yīng)用Dempster組合規(guī)則對修正后的加權(quán)平均證據(jù)進行組合,并通過實例驗證分析了所提方法的有效性和合理性。
定義1[23]在辨識框架Θ中,若集函數(shù)滿足,則稱m為Θ上的基本概率分配(Basic Probability Assignment,BPA),也稱為mass函數(shù),m()A表示證據(jù)對命題A的信任程度。若A?Θ且m(A)>0,則稱A為m的焦元,所有焦元的集合稱為核。
定義2[23]Dempster組合規(guī)則。設(shè)m1,m2,…,mn為同一辨識框架Θ上相互獨立的mass函數(shù),則對于?A?Θ,滿足:
式中,k∈[0],1為沖突系數(shù),表示證據(jù)間的沖突程度且
定義3[24]Jousselme距離。設(shè)m1和m2是辨識框架Θ上的兩個mass函數(shù),則兩者之間的Jousselme距離可以表示為:
式中,m1和m2為mass函數(shù)的向量形式的相似性矩陣,其元素表示為:
定義4[25]Pignistic概率函數(shù)。設(shè)m為辨識框架Θ上的mass函數(shù),對于?A?Θ,其Pignistic概率函數(shù)為:
式中,m(?)≠1,|·|表示子集中所含元素的個數(shù)。
證據(jù)理論中證據(jù)信息的不確定度反映證據(jù)的可靠性,對不確定度的有效度量將影響證據(jù)組合結(jié)果的準(zhǔn)確性。文獻[26]和文獻[27]分別給出Deng熵和證據(jù)精度的概念定義,用來衡量證據(jù)的不確定度;文獻[28]借鑒模糊熵的表達形式,通過對證據(jù)體中的命題進行Pignistic概率轉(zhuǎn)換,用求得的熵值表征不確定度的大?。晃墨I[29]對多義度進行了改進,以修正證據(jù)向量的Shannon熵實現(xiàn)了對不確定度的度量。證據(jù)理論將概率論中的基本事件空間拓展為辨識框架,并在辨識框架上建立了基本概率分配函數(shù),這是其相較于其他不確定性推理方法更能有效表達和處理不確定信息的優(yōu)勢所在,因此,基于對證據(jù)體數(shù)據(jù)結(jié)構(gòu)的分析,提出綜合不確定度的科學(xué)度量方法。
辨識框架和焦元是證據(jù)理論中最基本的數(shù)據(jù)結(jié)構(gòu),證據(jù)理論通過對不確定信息的分解提煉,將其轉(zhuǎn)化為某一辨識框架下的焦元形式,并賦予一定的基本概率分配,實現(xiàn)對不確定信息的有效表達。因此,證據(jù)體中包含了不確定性的多維特性,即隨機性和不具體性[30-31],其中,隨機性表現(xiàn)為辨識框架下各焦元的分散性,不具體性表現(xiàn)為焦元內(nèi)部的不精確性,綜合這兩個方面能夠?qū)ψC據(jù)信息的綜合不確定度進行科學(xué)完整的度量。
Shannon熵是描述概率理論隨機性最好的方式,基于對Shannon熵的認(rèn)識理解,文獻[32]對度量證據(jù)體隨機性的多種不同形式進行了對比分析,認(rèn)為式(5)的ST(m)相較于其他形式在絕大多數(shù)情況下滿足次相加性,能夠?qū)﹄S機性進行有效表達。
因此,使用ST(m)表示證據(jù)信息的隨機性,特別地,當(dāng)證據(jù)信息只有一個焦元A且m(A)=1時,ST(m)=0,說明這一信息對于此問題能夠給出明確唯一的證據(jù),不具有隨機性。
類哈利熵[33-34]是在借鑒哈利熵的基礎(chǔ)上提出的,具體表達形式如式(6),因其符合不確定性公式的所有公理性要求,被公認(rèn)為是表達證據(jù)不具體性的理想公式。
當(dāng)焦元內(nèi)部的元素越多,其不具體性越大,特別地,當(dāng)證據(jù)體中所有焦元均只有一個元素時,V(m=)0,說明焦元內(nèi)部沒有可選擇的元素,在純粹隨機性證據(jù)體中沒有不具體性。
綜上所述,證據(jù)體的綜合不確定度應(yīng)由隨機性和不具體性兩部分組成,隨機性用ST(m)確定,表示辨識框架下焦元的分散性,不具體性用V()m確定,表示焦元內(nèi)部的不精確性,綜合兩者之和得到式(7),能夠較為全面地度量證據(jù)的綜合不確定度。
從人的認(rèn)知角度來看,更傾向于選擇與其他證據(jù)更為相似、證據(jù)信息更為可靠的證據(jù)作為自身決策判斷的依據(jù),因此在確定證據(jù)修正權(quán)重的過程中,應(yīng)綜合考慮證據(jù)間的相似性與證據(jù)自身的可靠性兩個方面因素。通過對基于改進沖突度的相似性權(quán)重和基于綜合不確定度的可靠性權(quán)重的計算,提出一種改進的證據(jù)修正權(quán)重確定方法。
沖突系數(shù)和Jousselme距離作為衡量證據(jù)沖突度的常用指標(biāo),在實際應(yīng)用中還會出現(xiàn)違背常理的情況,但兩者存在一定的互補性。因此,基于沖突系數(shù)和Jousselme距離確定證據(jù)間的改進沖突度,通過改進沖突度得到證據(jù)與其他證據(jù)的相似性系數(shù),相似性系數(shù)越大,則應(yīng)賦予較大的權(quán)重,反之,則應(yīng)賦予較小的權(quán)重。
若θ為Θ中的任一命題,則證據(jù)m的最大支持假設(shè)為另k12和d12分別表示證據(jù)m1和m2之間的沖突系數(shù)和Jousselme距離,則證據(jù)m1和m2之間改進的沖突度cf12為:
假設(shè)有n個待組合證據(jù),則由改進沖突度可計算得到改進沖突度矩陣CF:
進而計算mi的相似性系數(shù)矩陣SM:
從而得到mi的相似性系數(shù)S(mi):
因此,基于改進沖突度的證據(jù)相似性權(quán)重為:
基于第2章對綜合不確定度的定義,本節(jié)提出基于綜合不確定度的證據(jù)可靠性權(quán)重確定方法。證據(jù)的綜合不確定度越大,其可靠性越低,則應(yīng)賦予較小的權(quán)重,反之,則應(yīng)賦予較大的權(quán)重。
對于證據(jù)mi(i=1,2,…,n),由式(5)和式(6)分別求得證據(jù)的隨機性ST(mi)和不具體性V(mi),從而由式(7)得到證據(jù)的綜合不確定度T(mi)。
因此,基于綜合不確定度的證據(jù)可靠性權(quán)重為:
證據(jù)之間的相似性和自身的可靠性對于證據(jù)組合結(jié)果均有較大的影響,只有綜合考慮這兩個方面才能對證據(jù)進行合理的修正。因此,在分別基于改進沖突度確定相似性權(quán)重和基于綜合不確定度確定可靠性權(quán)重的基礎(chǔ)上,能夠得到改進的證據(jù)修正權(quán)重為:
式中,η(0≤η≤1)為折衷系數(shù),根據(jù)個人偏好確定,若偏好相似性權(quán)重,則取0.5<η≤1;若偏好可靠性權(quán)重,則取0≤η<0.5;若無偏好,則取η=0.5。本文在實例應(yīng)用中取η=0.5。
通過改進修正權(quán)重對待組合證據(jù)進行加權(quán)平均后,可以利用Dempster組合規(guī)則對證據(jù)進行組合,從而得到基于改進修正權(quán)重的證據(jù)組合完整流程,如圖1所示。
圖1 證據(jù)組合流程Fig.1 Process of evidence combination
假設(shè)識別框架Θ={A,B,C},有5個證據(jù)的基本概率分配函數(shù)分別為:
步驟1計算證據(jù)相似性權(quán)重。由式(2)和式(3)分別計算證據(jù)間的沖突系數(shù)kij和Jousselme距離dij,進而由式(8)求得改進沖突度cfij(1≤i≤5,1≤j≤5)。這里以cf12為例對計算過程進行說明,由式(2)可得k12=0.709 0,由式(3)可得d12=0.538 6,由式(4)計算m1和m2的Pignistic概率函數(shù)為:
所以
由式(8)可知:
同理,可構(gòu)建改進沖突度矩陣CF5×5為:
由式(11)得到證據(jù)mi(1 ≤i≤5)的相似性系數(shù)為:
由式(12)得到基于改進沖突度的證據(jù)相似性權(quán)重為:
當(dāng)證據(jù)組合數(shù)量變化時,可得到證據(jù)的相似性權(quán)重如表1所示。
表1 相似性權(quán)重Table 1 Similarity weights
步驟2計算證據(jù)可靠性權(quán)重。由式(5)和式(6)計算證據(jù)的隨機性ST(mi)和不具體性V(mi),并由式(7)得到綜合不確定度T(mi),計算結(jié)果見表2。
表2 證據(jù)不確定度Table 2 Uncertainty degree of evidence
則由式(13)得到證據(jù)的可靠性權(quán)重如表3所示。
表3 可靠性權(quán)重Table 3 Reliability weights
步驟3由式(14)得到改進的修正權(quán)重如表4所示。
表4 改進的修正權(quán)重Table 4 Improved modified weights
步驟4通過改進的修正權(quán)重對原始證據(jù)進行修正,得到修正后的加權(quán)平均證據(jù)m′,如表5所示。
表5 修正后的加權(quán)平均證據(jù)Table 5 Modified weighted average evidence
步驟5對n個證據(jù)進行組合時,應(yīng)用Dempster組合規(guī)則對修正后的證據(jù)m′進行n-1次組合,得到組合后最終的BPA如表6所示。
表6 組合后的BPA Table 6 Combined BPA
為驗證本文所提方法的有效性和合理性,分別應(yīng)用Dempster組合方法[1]、Murphy組合方法[16]和Deng組合方法[17]對上例中的證據(jù)進行組合計算,各方法的計算結(jié)果見表7,同時對組合后的m(A)和m(B)進行對比,如圖2和圖3所示。
圖2 m(A)的組合結(jié)果對比Fig.2 Comparison of m(A)’combination result
圖3 m(B)的組合結(jié)果對比Fig.3 Comparison of m(B)’combination result
表7 不同組合方法的組合結(jié)果Table 7 Combination results of different combination methods
通過對組合結(jié)果的對比分析可知:
(1)從直觀來看,本例中m1、m3、m4、m5認(rèn)為A的可能性更大,而證據(jù)m2則更支持B,因此從證據(jù)整體來看,相較于其他證據(jù),證據(jù)m2為一條高沖突證據(jù)。但由于證據(jù)m2中m2(A)=0的存在,使得Dempster組合規(guī)
則無法在更多證據(jù)支持A的情況下做出合理的決策,始終認(rèn)為組合后A的值m(A)=0,導(dǎo)致了“一票否決”悖論問題的出現(xiàn),說明Dempster組合規(guī)則無法對沖突證據(jù)進行有效組合;而隨著證據(jù)信息的增加,其他三種方法均能得到合理的組合結(jié)果,但Murphy組合方法只是對證據(jù)進行了簡單的平均,沒有考慮證據(jù)間的關(guān)聯(lián)關(guān)系和自身的可靠性,本文所提方法在綜合考慮這兩個方面的基礎(chǔ)上,在收斂性上相較于Murphy方法也有一定優(yōu)勢。
(2)從圖2和圖3可以看出,本文所提方法在收斂性上不如Deng組合方法,但結(jié)合綜合不確定度的計算結(jié)果表2就可以給出合理的解釋。Deng組合方法在確定修正權(quán)重過程中僅僅考慮沖突度,而從綜合不確定度的計算結(jié)果來看,證據(jù)m2的綜合不確定度最小,說明m2給出的證據(jù)信息更為可靠,因而在對m1、m2或m1、m2、m3進行組合時,賦予了證據(jù)m2更高的權(quán)重,使得組合結(jié)果的m(A)更小,m(B)更大,表明本文所提方法在沒有充足證據(jù)支持A的情況下,沒有一味地追求收斂速度,過早地否定“沖突”證據(jù),而是充分利用了其信息價值。另外,在加入證據(jù)m4、m5后,明確了證據(jù)m2的沖突性質(zhì),從圖中可以看出,此時本文方法組合結(jié)果的收斂速度更快,說明本文所提方法在證據(jù)信息明確可靠的情況下能夠更快地得到可信的組合結(jié)果。
針對證據(jù)組合過程中修正權(quán)重的確定問題,提出了綜合考慮相似性權(quán)重和可靠性權(quán)重的改進修正權(quán)重確定方法。本文的主要貢獻和結(jié)論如下:
(1)解決了證據(jù)不確定度度量不夠全面的問題,從隨機性和不具體性兩個維度給出了證據(jù)綜合不確定度的計算方法,實現(xiàn)了對證據(jù)不確定度的全面度量。
(2)提出了改進修正權(quán)重的確定方法,通過基于改進沖突度的相似性權(quán)重和基于綜合不確定度的可靠性權(quán)重確定修正權(quán)重,充分考慮了證據(jù)間的相似性和自身的可靠性,所得改進的修正權(quán)重更加科學(xué)合理。
算例分析結(jié)果表明,基于本文改進修正權(quán)重的證據(jù)組合結(jié)果更加客觀、準(zhǔn)確,充分利用了證據(jù)信息,證據(jù)組合過程更加符合人的客觀認(rèn)識,組合結(jié)果可信度更高。