1.2 廣義模糊數(shù)的構造
針對目標識別問題,可以利用已有的歷史數(shù)據(jù)集獲得其中某指標的最大值和最小值,并且求得其中的三等分均值?;谶@三等分均值可以構造出一個梯形模糊數(shù)來描述命題。假設某識別問題的FOD為Θ={θ1,θ2,…θi,…,θn},且Θ中的每個元素都是互斥的。系統(tǒng)中用S表示傳感器,即傳感器收集的識別類別的第m個指標為Sm;系統(tǒng)需要識別的目標可表示為p(p∈θi,i=1,…,n);屬于θi類的樣本為Hik,Tm(Hik)為傳感器Sm對此樣本的度量向量。構造梯形模糊數(shù)表示模型的具體步驟如下:
Step 1:確定度量向量。
針對每個類別θi,各傳感器Sm對于某類別θi的訓練樣本Hik的度量向量為

Step 2:計算梯形模糊數(shù)值。
假設類別θi有Zm個訓練樣本,其中屬于指標m的梯形模糊數(shù)值為:

(2)
(4)
(3)
(5)

Step 3:梯形模糊數(shù)交集分析。


Step 4:確定廣義模糊數(shù)。
梯形模糊數(shù)的交集部分可能為梯形或三角形,根據(jù)實際情況確定隸屬度w,稱此類模糊數(shù)為廣義梯形模糊數(shù)或是廣義三角模糊數(shù)。
2 基于廣義梯形模糊數(shù)的BPA指派


2)若測量值并未出現(xiàn)在初始梯形模糊數(shù)表示模型范圍中,則有兩種處理方式:①當系統(tǒng)屬于開放世界假設情況下,說明此測量值屬于未知的類別,處理方法則是將BPA全部指派給空集?,即表示為m(?)=1。②當系統(tǒng)屬于封閉世界假設情況下,說明訓練集選擇可能不完善,處理方法則是將BPA全部指派給全集Θ,即表示為m(Θ)=1。但是在實際工程應用中,一般在確定此數(shù)據(jù)類型后,然后將其加入到訓練集中,重新修正并確定相應類別的梯形模糊數(shù)。
3)依次計算出各命題的隸屬度之后,可通過以下方法進行BPA的指派:首先用1減去最大隸屬度,然后賦值給全集Θ,即認為此部分的信息屬于未知空間。為計算方便以及保證BPA之和為1,將計算出的隸屬度進行歸一化處理。具體公式如下:
(6)

(7)
(9)
(8)
(10)
其中p,q,z分別是梯形模糊數(shù)、交疊的梯形模糊數(shù)、三角模糊數(shù)模型的焦元個數(shù)。根據(jù)公式依次計算出各屬性的BPA指派。
4)某一證據(jù)對某屬性的基本概率分配為0,會導致最終合成的mass函數(shù)結果為0,即使其他證據(jù)對該事件分配的概率較高或增加新證據(jù)表明該事件有較大概率也無法影響合成結果[10-11]。為避免沖突證據(jù)影響合成結果不準確,故使用以下合成方法:m1,m2,…,mn所對應的證據(jù)集為F1,F2,…,Fn,并設證據(jù)集i和j之間的沖突大小為kij,則
(11)
m(Θ)=0,
m(A)=p(A)+k·ε·q(A),A≠?,X,
(12)
(14)
m(X)=p(X)+k·ε·q(X)+k(1-ε),
(13)
(15)
3 目標識別實驗
鳶尾花數(shù)據(jù)集(Iris data)共有150個樣本數(shù)據(jù),包含3個類別,分別是Setosa(Se)、Versicolour(Ve)和Virginica(Vi),每個類別各有50個實例樣本。并且Iris數(shù)據(jù)集還提供4個屬性:萼片長度(SL)、萼片寬度(SW)、花瓣長度(PL)、花瓣寬度(PW)。在以下實驗中,每個屬性都被認為是獨立的傳感信息源,每類各隨機抽取25個實例樣本數(shù)據(jù),剩下的25個實例樣本數(shù)據(jù)作為測試樣本[12]。
3.1 基本識別實驗
本實驗中,根據(jù)隨機抽取的樣本數(shù)據(jù)得到鳶尾花萼片長度的梯形模糊數(shù)值如表1所示,圖3給出了鳶尾花4個屬性的梯形模糊數(shù)表示模型,表2則是3類鳶尾花交疊部分為三角形的三角模糊數(shù)值。

表1 萼片長度的梯形模糊數(shù)值

表2 3類鳶尾花交疊部分的廣義模糊數(shù)

假設由傳感器系統(tǒng)測得一個鳶尾花的樣本值為(4.70、3.20、1.60、0.20 cm),對于此花的萼片長度4.70 cm,利用本文的BPA指派方法,得到的BPA如下:
m(Se)=0.8696,m(Θ)=0.1304,
此樣本的4個屬性指派的BPA如表3所示。
為避免沖突證據(jù)的影響,使用公式(11)—(15)進行證據(jù)間的合成。其合成結果為:
m(Se)=0.7860,m(Se,Vi)=0.0521,m(Θ)=0.1619。
最后根據(jù)決策支持系統(tǒng)中,BPA最大的種類即為樣本所屬類別,故此樣本屬于Se。

表3 某樣本生成的BPA
3.2 封閉世界假設模擬實驗
采取封閉世界假設實驗[13],即認為樣本數(shù)據(jù)集是完全的,在本實驗中則是確定數(shù)據(jù)集中具有Se、Ve和Vi的類別數(shù)據(jù)。將利用神經(jīng)網(wǎng)絡方法[14],Zhang的三角模糊數(shù)方法[5]和本文的BPA指派方法進行對比實驗。實驗數(shù)據(jù)同上,數(shù)據(jù)中50%作為訓練集,剩下50%作為測試集。實驗結果如表4和表5所示:

表4 有噪聲環(huán)境下完全FOD的不同方法識別率

表5 無噪聲環(huán)境下完全FOD的不同方法識別率
在本節(jié)中,使用Iris數(shù)據(jù)集所有類別來建立目標模型,即識別框架是完全的,測試實例也是已知的。主要區(qū)別是有無噪聲環(huán)境,即訓練數(shù)據(jù)集中是否含有每個類別的最大值與最小值,若無最大值或最小值,則認為是噪聲環(huán)境,反之則認為是無噪聲環(huán)境。從表4和表5中的實驗結果可以得出:在完全FOD下使用神經(jīng)網(wǎng)絡方法進行識別分類,在有無噪聲環(huán)境情況下,平均識別率都為73.3%,這是因為訓練數(shù)據(jù)過少,導致神經(jīng)網(wǎng)絡的學習并不完善,從而影響到識別率較低。Zhang使用的三角模糊數(shù)交叉區(qū)域識別方法在噪聲環(huán)境下的平均識別率為80.00%,無噪聲環(huán)境下平均識別率為81.33%,相比于神經(jīng)網(wǎng)絡方法,識別率顯著提高。但與本文改進的方法相比,由于其焦元的增加,識別率并沒有本文的方法表現(xiàn)優(yōu)良。本文利用梯形模糊數(shù)模型的方法在有無噪聲環(huán)境下的平均識別率分別達到86.67%和89.33%。
3.3 開放世界假設模擬實驗
在開放世界假設實驗下[15-16],將Se類和Ve類視為已知類,Vi類為未知類,其他的參數(shù)與之前實驗相同。通過Se類和Ve類訓練出的梯形模糊數(shù)模型分別識別測試樣本中的Se類和Ve類,同時根據(jù)此模型識別未知類Vi。實驗結果如表6和表7所示:

表6 有噪聲環(huán)境下不完全FOD的不同方法識別率

表7 無噪聲環(huán)境下不完全FOD的不同方法識別率
通過對比實驗發(fā)現(xiàn),在不完全的識別框架下,噪聲環(huán)境是否存在對識別率的影響并不是很大,由于整體的未知量增加,對已知類判斷更加準確。其中本文的改進方法效果最好,在無噪聲環(huán)境下,對各類別的識別率均達到了96.00%。其根本原因是利用梯形模糊數(shù)的模型有效減少了焦元的生成量,可以更加準確地完成BPA的指派,由此說明改進的方法在實際分類中應用有效。
4 結 論
本文利用廣義梯形模糊數(shù)模型中的隸屬度進行證據(jù)理論中的基本概率指派,解決了證據(jù)理論在應用中的關鍵性問題。通過在經(jīng)典的鳶尾花數(shù)據(jù)集上的對比實驗,證明了本文提出的方法在目標分類應用中是有效的,并且此方法在處理小規(guī)模數(shù)據(jù)集時有著獨特的優(yōu)勢,在實際工程應用中,只要有一定的數(shù)據(jù),均能使用此方法進行基本概率的指派。與其他方法相比,此方法生成的焦元更少,可以更準確地得到量化指標,較好地解決了評價體系中的主觀性問題。實驗結果也證明,此方法在開放世界和封閉世界中都可以很好地進行識別。由于利用基本概率賦值函數(shù)的形式構造BPA可以有效處理各類基礎信息,在未來研究中可以將此方法應用在多源信息融合領域中。