馮衛(wèi)兵,韓 玉
(西安科技大學(xué) 理學(xué)院,陜西 西安 710054)
Vague集理論由Gau和Buehrer于1993年提出[1],Vague集相似度量方法是其重點研究內(nèi)容,用于判斷兩個集合之間的相似程度,進(jìn)而判斷大量數(shù)據(jù)間的關(guān)系。目前,學(xué)者大多從支持度和反對度出發(fā)[2-11]研究Vague集的相似性度量方法。
文獻(xiàn)[5]通過對各元素取大取小來研究Vague集相似度量方法,文獻(xiàn)[6]通過包含度理論來研究相似度量,但是這兩種方法都只注重了數(shù)據(jù)之間的關(guān)系,沒有考慮到未知度因素,導(dǎo)致丟失了很多有用信息。文獻(xiàn)[7]對相似度量公式的每部分設(shè)置系數(shù),文獻(xiàn)[8]用函數(shù)來調(diào)節(jié)未知度系數(shù),以此提高相似度量公式的度量能力,但是系數(shù)的合理選取還需進(jìn)一步研究。
文獻(xiàn)[9]從二次投票出發(fā),考慮了二次投票中優(yōu)勢函數(shù)之差和兩端點之間的距離因素,但是并沒有考慮到二次投票后的未知度,造成一些數(shù)據(jù)無法有效區(qū)分。文獻(xiàn)[10-11]同樣從二次投票出發(fā),分別對二次投票后的支持度和反對度進(jìn)行取小,但該方法默認(rèn)二次投票的結(jié)果就是最終的結(jié)果,不會再有三次投票,這說明其并沒有考慮到二次投票后的未知度,即認(rèn)為二次投票后不會存在棄權(quán)的結(jié)果。但事實上,二次投票后還是會存在三次投票的可能,所以導(dǎo)致某些度量結(jié)果與實際不符。目前為止,還是無法找到一個完美的Vague集相似度量方法,所以,繼續(xù)尋找新的Vague集相似度量計算方法是十分有必要的。
本文從二次投票出發(fā),同時考慮二次投票中支持度的包含關(guān)系、反對度的包含關(guān)系和未知度的包含關(guān)系,合理設(shè)置系數(shù),提出了一種基于包含關(guān)系的Vague集新相似度量方法,并驗證本文方法具有較強的區(qū)分能力。并將新方法應(yīng)用于故障診斷等現(xiàn)實問題中,充分地說明了該方法的準(zhǔn)確性與合理性。
Vague值(集)的相關(guān)概念如下:
定義1[1]設(shè)有一論域X,X上的一個Vague集A是由一個真隸屬函數(shù)tA(x)和一個假隸屬函數(shù)fA(x)所確定的。tA(x)是從支持x的證據(jù)導(dǎo)出的x的隸屬度下界,fA(x)則是從反對x的證據(jù)導(dǎo)出的x的非隸屬度下界。πA(x)=1-tA(x)-fA(x)是Vague集A中元素x的未知程度。其中tA:X→[0,1],fA:X→[0,1],且對于?x∈X滿足tA(x)+fA(x)≤1。
定義2[1]若有x∈X,Vague集A在點x的Vague值為閉區(qū)間[tA(x),1-fA(x)]。當(dāng)Vague集只有一個時,簡寫為x=[tx,1-fx]。
定義3[1]設(shè)A和B是論域X上的Vague集,?x∈X,將A和B上的Vague值分別表示為A=[tA(x),1-fA(x)]和B=[tB(x),1-fB(x)]。則有:
A∩B=[tA(x)∧tB(x),1-(fA(x)∨fB(x))];
A∪B=[tA(x)∨tB(x),1-(fA(x)∧fB(x))],
其中:∨和∧分別是取大和取小運算。
為了可以更準(zhǔn)確地對Vague 值(集)之間的相似程度進(jìn)行度量,本文展開了一系列討論。
假設(shè)有一個Vague值x=[tx,1-fx],那么可以將x用一個三元組(tx,fx,πx)進(jìn)行表示,tx、fx、πx分別為一次投票中支持、反對和棄權(quán)部分的大小??紤]到在二次投票中,投票人會受一次投票結(jié)果的影響進(jìn)行投票,所以最終可以將投票結(jié)果細(xì)化為(tx+πxtx,fx+πxfx,1-(tx+πxtx)-(fx+πxfx)),即表示二次投票中支持、反對和棄權(quán)的大小。
包含度理論[6]是描述相似度量的有效方法之一,但其通常會忽略未知度的影響。本文以二次投票為基礎(chǔ),借鑒包含度的理論,分別考慮了二次投票中支持度、反對度和未知度的包含關(guān)系,即對兩輪投票后的支持、反對和棄權(quán)部分同時取小再求和,在此基礎(chǔ)上提出了一種基于包含關(guān)系的Vague集新相似度量方法。
定義4 假設(shè)Vague集A上有Vague值x=[tx,1-fx]。tx是x的支持度,fx是x的反對度,πx=1-tx-fx是x的未知度,下面定義了新的二次投票中的支持度、反對度和未知度:
(Ⅰ)αx=tx+πxtx稱為A中元素x的支持程度。
(Ⅱ)βx=fx+πxfx稱為A中元素x的反對程度。
(Ⅲ)γx=1-(tx+πxtx)-(fx+πxfx)稱為A中元素x的未知程度。
αx、βx和γx都可用投票模型來進(jìn)行解釋,如Vague值[0.2,0.5]表示在投票結(jié)果中,支持票占20%,反對票占50%,棄權(quán)票占30%。那么αx=0.2+0.3×0.2=0.26,可以解釋為:第1次投票支持票為20%,受第1次投票結(jié)果影響,第2次投票可能還會有0.3×0.2=0.06的人支持。
同理,βx=0.5+0.3×0.5=0.65,可解釋為:第1輪投票反對票為50%,受第1次投票結(jié)果影響,第2次投票可能還會有0.3×0.5=0.15的人反對。
同理,γx=1-0.26-0.65=0.09,可解釋為:第1輪投票反對票為30%,受第1次投票結(jié)果影響,第2次投票可能還會有0.09的人棄權(quán)。
定義5 假設(shè)Vague集A上有兩個Vague值x=[tx,1-fx],y=[ty,1-fy]。α、β、γ分別表示二次投票中的支持度、反對度和未知度。當(dāng)tx≠0,fx≠0,ty≠0,fy≠0時,定義x和y的相似度MNEW1(x,y)為:
MNEW1(x,y)=λ1min(αx,αy)+λ2min(βx,βy)+λ3min(γx,γy)。
(1)
在該方法中,λ1、λ2定義為1或0。λ3定義為一個0~1的值,表示決策者在兩輪投票后對信息識別的態(tài)度。λ3=1表示兩輪投票后決策者的態(tài)度是完全支持。λ3=0表示兩輪投票后決策者的態(tài)度是完全不支持。這里選取λ1=λ2=1,表示每輪投票總會有支持和反對的票,選取λ3=1/3表示在兩輪投票后第3輪投票中棄權(quán)的概率是1/3。則確定系數(shù)后的相似度量公式如下:
MNEW1(x,y)=min(αx,αy)+min(βx,βy)+1/3min(γx,γy)。
(2)
當(dāng)tx=0或fx=0或ty=0或fy=0時,式(2)不能很好地區(qū)分Vague集,定義x和y的相似度MNEW2(x,y)為:
(3)
最終得到x和y的相似度MNEW(x,y):
(4)
式(4)為本文提出的一種基于包含關(guān)系的Vague集新相似度量方法。
(5)
如果取wi=1/n,表明各元素的權(quán)重相同。
已有的Vague集相似度區(qū)分能力通常通過分類數(shù)來定義。在已知相似度結(jié)果后,將數(shù)值相等的Vague集相似度量歸為同一類,這樣的類別越多,表明Vague集相似度量方法在該相似度量結(jié)果中區(qū)分能力越好。但是僅僅通過分類數(shù)這一個概念來度量Vague集相似度的區(qū)分能力顯得太片面。因此,本文在此基礎(chǔ)上,對小樣本和大樣本分別定義了新的區(qū)分能力公式。
定義7 設(shè)Vague集相似度為Mi(i=1,2,…,n),對于小樣本數(shù)據(jù),定義新的相似度區(qū)分能力為:
(6)
定義8 設(shè)有Vague集相似度Mi(i=1,2,…,n),對于大樣本數(shù)據(jù),定義新的相似度區(qū)分值為:
D=f×(AVS-AVST),
(7)
下面對部分相似度量性質(zhì)進(jìn)行證明。設(shè)有兩個Vague值x=[tx,1-fx],y=[ty,1-fy]。MNEW(x,y)表示x與y之間的相似度。則MNEW(x,y)滿足以下性質(zhì):
性質(zhì)1 0≤MNEW(x,y)≤1。
證明當(dāng)tx≠0,fx≠0,ty≠0,fy≠0時,
因為MNEW1(x,y)=min(αx,αy)+min(βx,βy)+1/3min(γx,γy);
min(αx,αy)=min(tx+πxtx,ty+πyty);
min(βx,βy)=min(fx+πxfx,fy+πyfy);
min(γx,γy)=min(1-(tx+πxtx)-(fx+πxfx),1-(ty+πyty)-(fy+πyfy)),
則有
0≤tx+πxtx+fx+πxfx+1/3(1-(tx+πxtx)-(fx+πxfx))≤1;
0≤ty+πyty+fy+πyfy+1/3(1-(ty+πyty)-(fy+πyfy))≤1,
所以,0≤MNEW1(x,y)≤1。
當(dāng)tx=0或fx=0或ty=0或fy=0時,
αx-βx=tx+πxtx-(fx+πxfx)=tx(1+πx)-fx(1+πx)=(tx-fx)(2-tx-fx)=
-tx2+2tx+fx2-2fx=(fx-1)2-(tx-1)2,
因為0≤tx≤1,0≤fx≤1,0≤tx+fx≤1,
所以-1≤αx-βx≤1。
同理-1≤αy-βy≤1。即有0≤|αx-βx-(αy-βy)|≤2。
αx=tx+πxtx=tx(1+πx)=tx(2-tx-fx)=-tx2+(2-fx)tx,
因為0≤tx≤1,0≤fx≤1,0≤tx+fx≤1,
所以0≤αx≤1。
同理0≤βx≤1,0≤αy≤1,0≤βy≤1,即有0≤|αx-αy|+|βx-βy|≤2。
則0≤3|αx-βx-(αy-βy)|+3|αx-αy|+|βx-βy|≤12。
所以0+|γx-γy|+γx+γy≤3|αx-βx-(αy-βy)|+3|αx-αy|+|βx-βy|+
|γx-γy|+γx+γy≤12+|γx-γy|+γx+γy,
證得0≤MNEW2≤1。
綜上所述,0≤MNEW≤1。性質(zhì)1證畢。
性質(zhì)2 ?x,y∈A,MNEW(x,y)=MNEW(y,x)。
性質(zhì)4 當(dāng)x=y且γx=γy=0時,有MNEW(x,y)=1。
性質(zhì)5 當(dāng)x=[0,0],y=[1,1]或x=[1,1],y=[0,0]時,有MNEW(x,y)=0。
性質(zhì)6 當(dāng)x=[0,1]∈A且y=[1,1]∈A時,令MNEW(x,y)的值為區(qū)間[0,1]的任意值,記為?[0,1]。
本文選取代表性數(shù)據(jù)[5,9-10]對新方法MNEW與已有的方法進(jìn)行比較,比較結(jié)果如表1所示。
表1中第9組Vague值[0,0]和[1,1]表示的是全部都反對與全部都支持的相似度為0;第10組Vague值[1,1]和[0.5,0.5]表示的是全部支持和一半支持一半反對的相似度為0.5;第11組Vague值[0,1]和[1,1]表示的是全部支持和全部棄權(quán)的相似度為[0,1]中的任何一個數(shù)。以這3組數(shù)據(jù)的相似度為前提構(gòu)造了新的相似度量公式,并對其進(jìn)行對比。
由表1可知:首先,MZX、MW和MG不滿足上述前提條件;對于第1組和第8組數(shù)據(jù),MZX和MJ無法區(qū)分;對于第12~14組數(shù)據(jù),MG、MZ和MLY的相似度都為1,但這幾組數(shù)據(jù)的Vague值是相等的,當(dāng)未知度為0時(第12組),未知度不產(chǎn)生任何影響,所有的度量結(jié)果都一樣為1;但當(dāng)未知度不為0時(第13~14組),MZX、MJ、MW和MNEW可以體現(xiàn)出未知性。且以第13組與第14組為例,MZX的區(qū)分度為0.895-0.857=0.038,MJ的區(qū)分度為0.8-0.7=0.1,MW的區(qū)分度為0.790-0.740=0.050,MNEW的區(qū)分度為0.893-0.760=0.133,顯然,MNEW的區(qū)分度大于MZX、MJ和MW的區(qū)分度。
表1 各相似度量的比較
由于前8組數(shù)據(jù)是以Vague值[0.4,0.8]為中心,分別取與0.4相近的0.3,與0.7和0.8相近的0.7,0.9為新的tx和1-fx與其進(jìn)行對比,所以前8組的相似度可以很好地代表各相似度的區(qū)分能力。下面結(jié)合定義7計算各Vague集相似度量方法的區(qū)分能力,計算結(jié)果如表2所示。
表2 各相似度量的區(qū)分能力
由表2可知:MZX、MLY和MNEW的區(qū)分度較高(都大于0.1),但相比較而言0.140>0.110>0.109,即MNEW>MLY>MZX,所以MNEW的區(qū)分度較好一些。
為了更好地說明新相似度量公式的合理性和有效性,本文擴大了數(shù)據(jù)范圍,對上述幾種Vague集相似性度量方法進(jìn)一步進(jìn)行研究。具體步驟[4]如下:
第1步:設(shè)有Vague值x=[tx,1-fx],其中0≤tx+fx≤1,以0.1為步長找出[0,1]內(nèi)符合要求的所有子區(qū)間,由此得到了60個Vague值。
第2步:將60個Vague值兩兩進(jìn)行組合,得到3 600(60×60)組數(shù)據(jù),去掉重復(fù)的組合(下三角矩陣中的組合)后,得到1 830組組合數(shù)據(jù),將其稱為數(shù)據(jù)集V。
第3步:結(jié)合文中給出的8種相似度量方法,對數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行相似度的計算。得到了1 830個計算結(jié)果,將其稱為相似度集M。
第4步:結(jié)合定義8計算每種相似度量方法的區(qū)分值,為便于數(shù)據(jù)對比,將區(qū)分度的結(jié)果擴大一定倍數(shù)(此處不妨取1 000倍),結(jié)果如表3所示。
表3 各相似度量的區(qū)分值
由表3可知:在同樣的數(shù)據(jù)下,MZX、MW和MNEW的區(qū)分度較高(都大于60)。又因119.8>80.9>65.0,所以新提出的相似度量MNEW的區(qū)分能力更大一些。
隨著人工智能的發(fā)展,故障診斷等問題[12-15]的解決方法有很多,與Vague相似度量的結(jié)合使得故障診斷等問題被更有效地解決[16-20]。本文首先選取文獻(xiàn)[16]中的模式識別案例進(jìn)行討論。
設(shè)有標(biāo)準(zhǔn)模式Ai(i=1,2,3)和待識別模式B:
A1=([0.8,0.9],[0.3,0.4],[0.6,0.8]);A2=([0.1,0.6],[0.7,0.8],[0.8,0.9]);
A3=([0.8,0.9],[0.3,0.4],[0.6,0.8]);B=([0.4,0.5],[0.6,0.7],[0.8,1.0])。
用本文中提到的Vague集相似度量公式進(jìn)行計算,結(jié)果如表4所示。
表4 模式識別結(jié)果比較
由表4可以看出:MZX、MJ、MW、MG、MZ、MLY和新的Vague集相似度量公式MNEW的模式識別結(jié)果是一致的,都為A2>A3>A1,且與文獻(xiàn)[16]結(jié)果一致。因此,待識別模式B應(yīng)該屬于標(biāo)準(zhǔn)模式A2,表明MNEW的識別結(jié)果是合理的。
下面選取文獻(xiàn)[13]中的水輪機故障診斷案例進(jìn)行討論。水輪機常見故障如表5[13]中第1列所示,水輪機不同頻率如表5中第1行所示?,F(xiàn)將表5中譜峰能量值作為Vague值展開計算。
表5 系統(tǒng)故障知識
取第1次待診斷檢測樣本的Vague 集為:
D1=[0.04,0.04]/x1+[0.95,0.95]/x2+[0.10,0.10]/x3+[0.07,0.07]/x4+[0.04,0.04]/x5。
另一個檢測樣本得到的Vague集為:
D2=[0.90,0.90]/x1+[0.25,0.25]/x2+[0.12,0.12]/x3+[0.15,0.15]/x4+[0.25,0.25]/x5。
用本文中提到的Vague集相似度量公式進(jìn)行計算,結(jié)果如表6所示。
表6 故障診斷結(jié)果
由表6可以直觀地看出:檢測樣本D1與A1的相似度最大(即屬于故障轉(zhuǎn)子不平衡)。檢測樣本D2與A4相似度最大(即屬于故障尾水管偏心渦帶)。該故障診斷結(jié)果與文獻(xiàn)[13]診斷結(jié)果一致,說明MNEW的結(jié)果判斷正確。
下面選取文獻(xiàn)[9]中的空調(diào)系統(tǒng)選擇問題進(jìn)行討論。已知有3種空調(diào)系統(tǒng)方案A1、A2和A3。3種準(zhǔn)則C1、C2和C3,分別為經(jīng)濟、功能和有效性。決策者評價結(jié)果如表7[9]所示。
表7 決策矩陣
由表7可得理想方案為:
I={[0.80,0.90],[0.75,0.95],[0.80,0.80]}。
計算各備選方案與理想方案在相應(yīng)準(zhǔn)則下的相似度,如表8所示。
表8 多準(zhǔn)則決策結(jié)果對比
由表8可知:在空調(diào)系統(tǒng)選擇問題中,方案A1為最優(yōu)方案,且所得結(jié)論與文獻(xiàn)[9]一致,由此可見本文提出的相似度量方法MNEW是有效的。
隨著Vague集理論研究的不斷深入,尋找一個合理有效的相似度量方法也受到了人們重視。本文借助二次投票的含義,充分考慮了支持度、反對度和未知度3個方面的包含關(guān)系,給出Vague集相似度的一系列討論。此外,通過數(shù)值算例和模式識別、故障診斷、多準(zhǔn)則決策等應(yīng)用說明了本文方法的有效性和可行性。所以認(rèn)為本文提出的Vague集相似度量方法可以廣泛應(yīng)用于模式識別、近似推理和決策系統(tǒng)等研究領(lǐng)域。最后,由于Vague集存在不確定性,為此下一步工作將重點討論未知度系數(shù)對相似度量影響的大小。