袁澤華,潘小東
(西南交通大學 數(shù)學學院,四川 成都610031)
一種基于新的直覺模糊相似度的聚類方法
袁澤華,潘小東
(西南交通大學 數(shù)學學院,四川 成都610031)
針對現(xiàn)有直覺模糊聚類方法中大多數(shù)未考慮指標權(quán)重,且計算結(jié)果為實數(shù)的問題,提出了一種基于新直覺模糊相似度的聚類方法。運用直覺模糊熵得到指標權(quán)重,構(gòu)造了一種考慮指標權(quán)重的直覺模糊相似度公式,得到直覺模糊相似矩陣,構(gòu)造了滿意度閾值。決策者根據(jù)自身滿意度偏好選擇合適滿意度閾值,將直覺模糊相似矩陣轉(zhuǎn)化為實數(shù)矩陣,然后利用平方自合成方法得到模糊等價矩陣,選擇適當?shù)闹眯胖颠M行聚類,最后通過實例驗證所提方法的有效性和可行性。
直覺模糊相似度;聚類方法;直覺模糊熵;滿意度閾值
1965年美國自動控制專家扎德教授首次提出模糊集理論[1]。隨著該理論的發(fā)展和深入,1986年,保加利亞學者Atanassov提出了直覺模糊集的概念[2]。直覺模糊集是對傳統(tǒng)模糊集的一種擴充和發(fā)展,增加了新的屬性參數(shù):非隸屬度函數(shù)。相對于傳統(tǒng)的模糊集,直覺模糊集在處理不確定性信息時更加的靈活和全面。直覺模糊集理論在模式識別、多屬性決策和醫(yī)療圖像處理等領(lǐng)域得到了廣泛的應(yīng)用。
目前許多學者對基于模糊集提出了很多的聚類方法,比如FCM聚類算法、模糊傳遞閉包法、編網(wǎng)法等。然而,基于直覺模糊集的聚類方法研究尚處于起步階段。文獻[3]將模糊C-均值聚類算法推廣為直覺模糊C-均值聚類,并提出了基于直覺模糊集的聚類方法。該方法雖然考慮了指標權(quán)重問題,但其聚類結(jié)果為實數(shù)。另外,直覺模糊集本身就反映了一定的猶豫程度,其相似度也應(yīng)該為直覺模糊數(shù)的形式;文獻[4]針對聚類問題中樣品屬性值不能直接給出的情況,提出了一種基于集值統(tǒng)計的直覺模糊聚類方法。但該方法直接利用樣本集的隸屬度進行聚類,而忽視了非隸屬度和猶豫度;文獻[5]針對已有直覺模糊集聚類方法的局限性,提出了一種基于加權(quán)直覺模糊集合的聚類模型。然而現(xiàn)有的直覺模糊聚類方法大多數(shù)都是利用直覺模糊集的相似度最終得到一個實數(shù)相似度。直覺模糊集本身反映了一定的猶豫程度,其相似度也應(yīng)該表現(xiàn)出一定的猶豫程度。對此,文獻[6]提出了直覺模糊相似度的概念,其值為直覺模糊數(shù),并構(gòu)建了直覺模糊相似矩陣和直覺模糊等價矩陣及其λ-截矩陣,給出了一種直覺模糊等價矩陣的聚類方法。但其計算量較大且給出的直覺模糊相似度公式不滿足定義中的第4條性質(zhì)。文獻[7]提出了基于直覺模糊相似矩陣聚類方法,并直接利用直覺模糊相似矩陣中樣本的隸屬度對方案直接進行聚類。該方法雖然計算量減小,但未考慮指標權(quán)重問題,得到模糊相似矩陣后僅僅采用隸屬度作參考進行聚類,造成信息的丟失。
針對現(xiàn)有方法存在的問題,本文定義了任意兩個方案之間隸屬度距離:非隸屬度距離和猶豫度距離。以此為基礎(chǔ)構(gòu)建了一種考慮屬性權(quán)重的相似度,得到直覺模糊直覺模糊相似矩陣,設(shè)計滿意度閾值,將直覺模糊相似矩陣轉(zhuǎn)化為實數(shù)矩陣,利用平方自合成方法將實數(shù)矩陣轉(zhuǎn)化為模糊等價矩陣并進行聚類,解決了現(xiàn)有直覺模糊聚類方法沒有考慮指標權(quán)重和計算量較大的問題。
定義1.1[1](模糊集合) 設(shè)X是一個給定論域,則X上一個模糊集合A={〈x,uA(x)〉|x∈X}。其中uA(x)表示x屬于X的隸屬度,uA:X→[0,1]。
定義1.2[2](直覺模糊集) 設(shè)X是一個給定論域,X上的一個直覺模糊集A={〈x,uA(x),vA(x)〉|x∈X}。其中uA(x)和vA(x)分別表示為X中的元素x屬于X的隸屬度和非隸屬度,uA:X→[0,1]vA:X→[0,1],且滿足條件0≤uA(x)+vA(x)≤1,x∈X,稱πA(x)=1-uA(x)-vA(x)為X中元素x屬于A的猶豫度。隸屬度uA(x)表示對象x屬于直覺模糊集A的程度、非隸屬度vA(x)表示對象x不屬于直覺模糊集A以及猶豫度πA(x)表示對象x對直覺模糊集A中立的程度。例如,假設(shè)直覺模糊集A={〈x,0.4,0.5〉|x∈X},即其隸屬度uA(x)=0.4,非隸屬度vA(X)=0.5,猶豫度πA(x)=0.1,表示對象x屬于A的程度為0.4,不屬于A的程度為0.5,中立的程度為0.1。X中的元素x屬于A的隸屬度和非隸屬度組成的有序?qū)Α磚A(x),vA(x)〉稱為直覺模糊數(shù)。直覺模糊集A可以看作是X上的全體直覺模糊數(shù)組成的集合,記為IFS(X)。
定義1.3[8](模糊度) 設(shè)A={〈x,uA(x),vA(x)〉|x∈X}為直覺模糊集,則稱:fA(x)=1-|uA(x)-vA(x)|為x在A中的模糊度。
設(shè)A={〈x,uA(x),vA(x)〉|x∈X}和B={〈x,uB(x),vB(x)〉|x∈X}為直覺模糊集,則有:
(1)A?B當且僅當任意x∈X,有uA(x)≤uB(x)且vA(x)≥vB(x);
(2)A=B當且僅當任意x∈X,有uA(x)=uB(x)且vA(x)=vB(x)。
設(shè)C=(cij)m×n是一個m×n矩陣,如果任意cij(i=1,2,...,m,j=1,2,...,n)為直覺模糊數(shù),則稱C為直覺模糊矩陣。在模糊集理論中,相似矩陣是一種常見的具有自反性和對稱性的矩陣。文獻[6]將直覺模糊集理論與相似矩陣結(jié)合,提出了直覺模糊相似度和直覺模糊相似矩陣的概念。
定義1.4[6]設(shè)σ:Ω2→Θ,Ω為X上所有自覺模糊集的集合,且設(shè)Ai∈Ω(i=1,2,3),若σ(A1,A2)滿足以下條件:(1)σ(A1,A2)是直覺模糊數(shù);(2)σ(A1,A2)=〈1,0〉當且僅當A1=A2;(3)σ(A1,A2)=σ(A2,A1);(4)如果A1?A2?A3,則σ(A1,A3)?σ(A1,A2),且σ(A1,A3)?σ(A2,A3)。則稱σ(A1,A2)為A1和A2的直覺模糊相似度。
定義1.5[4]若直覺模糊矩陣C=(cij)m×n滿足以下兩個條件:(1)自反性:cii=〈1,0〉,i=1,2,...,m;(2)對稱性:cij=cji。則稱C為直覺模糊相似矩陣。
假設(shè)一個多屬性決策問題有m個可行方案A1,A2,...,Am,n個評價指標I1,I2,...,In,可行方案Ai在評價指標Ij下的屬性值為直覺模糊數(shù)dij=〈uij,vij〉,可得到直覺模糊決策矩陣D=(dij)m×n。
下面通過構(gòu)造一種新的直覺模糊相似度進而得到直覺模糊相似矩陣。
定理1 設(shè)Ai和Ak為兩個直覺模糊集,則
σ(Ai,Ak)=〈αij,βij〉=〈1-d1(Ai,Ak)-d3(Ai,Ak),d2(Ai,Ak)〉
(1)
為Ai和Ak的直覺模糊相似度。
證明: 需要證明公式(1)滿足定義4的4個條件。
(1)先證明σ(Ai,Ak)為直覺模糊數(shù)。d1(Ai,Ak)≥0,d3(Ai,Ak)≥0;αij=1-d1(Ai,Ak)-d3(Ai-Ak)≤1。
又因為 0≤d1(Ai,Ak)+d2(Ai,Ak)+d3(Ai,Ak)≤1,所以αij=1-d1(Ai,Ak)-d3(Ai,Ak)≥d2(Ai,Ak)≥0。
顯然0≤βij=d2(Ai,Ak)≤1,證明了σ(Ai,Ak)為直覺模糊數(shù)。
(2)當Ai和Ak相等時,σ(Ai,Ak)=〈1,0〉成立。同理,當σ(Ai,Ak)=〈1,0〉,即αij=1,βij=0,根據(jù)所給出的公式可得出Ai和Ak是相等的。
(4)如果A1?A2?A3,即u1j≤u2j≤u3j,v1j≥v2j≥v3j,j=1,2,...,n則
;
;且 |u1j-u2j|≤|u1j-u3j|,|v1j-v2j|≤|v1j-v3j|,由文獻[4]得到|π1j-π2j|≤|π1j-π3j|。所以
即σ(A1,A3)≤σ(A1,A2),同理也可得到σ(A1,A3)≤σ(A2,A3)。
通過上面提出的直覺模糊相似度公式可將直覺模糊決策矩陣轉(zhuǎn)化為直覺模糊相似矩陣D=(dij)m×n,其中cij=σ(Ai,Ak)=〈αij,βij〉為直覺模糊數(shù)。
令fij=αij+η(1-αij-βij),η∈[0,1]為滿意度閾值,則可將直覺模糊相似矩陣轉(zhuǎn)化為實數(shù)矩陣F=(fij)m×n,然后用平方自合成方法將實數(shù)矩陣轉(zhuǎn)化為模糊等價矩陣,再選擇合適的置信度λ∈[0,1]對實數(shù)矩陣進行聚類。
假如各個指標權(quán)重已知的話,直接帶入上述公式進行計算,然而在實際中很難直接得到各指標的權(quán)重,下面結(jié)合直覺模糊熵來計算各個指標的權(quán)重。文獻[9]提出的直覺模糊熵的公理化定義。
定義2.1[9]?A,B∈IFS(X),隸屬度函數(shù)分別為uA(x)和uB(x),非隸屬度函數(shù)分別為vA(x)和vB(x),猶豫度分別為πA(x)和πB(x)。稱映射E:IFS(X)→R+為IFS(X)上的熵,如果映射E滿足下列條件:
(1)E(A)=0?A∈P(X)(P(X)為普通集合的全體);
(2)E(A)=1??x∈X,uA(x)=vA(x)=0;
(3)?x∈X,若πA(x)=πB(x)且fA(x)≤fB(x),則E(A)≤E(B)。若fA(x)=fB(x)且πA(x)≤πB(x),則E(A)≤E(B);
(4)E(A)=E(AC)。
設(shè)論域X={x1,x2,...,xn},A={〈xi,uA(xi),vA(xi)〉|xi∈X}是X上的直覺模糊集,由文獻[10]可得到A的模糊熵為:
(2)
特別地,對于直覺模糊數(shù)a=〈uA(x),vA(x)〉,其模糊熵為:
(3)
(4)
綜上得到新的直覺模糊聚類方法如下:
步驟1:查看指標的權(quán)重是否給出。若已經(jīng)給出,則轉(zhuǎn)步驟3;若未給出,則轉(zhuǎn)步驟2;
步驟2:通過式(4)計算指標權(quán)重w=(w1,w2,...,wn);
步驟3:運用式(1)得到直覺模糊相似矩陣C=(cij)m×n;選擇合適的合適的滿意度閾值,將直覺模糊相似矩陣C=(cij)m×n轉(zhuǎn)化為實數(shù)矩陣F=(fij)m×n,利用平方自合成方法求得模糊等價矩陣。
步驟4:選擇合適的置信度λ∈[0,1]對模糊等價矩陣進行聚類。
本文提出的基于直覺模糊相似度的聚類方法與現(xiàn)有的方法對比具有以下兩個優(yōu)點:(1)本文提出的直覺模糊相似度公式的結(jié)果仍然是直覺模糊數(shù)形式且考慮了指標權(quán)重的問題,更加的符合實際情況;(2)本文提出的聚類方法設(shè)計了滿意度閾值,決策者可根據(jù)自身偏好選擇合適的滿意度閾值,充分考慮隸屬度、非隸屬度以及猶豫度 3方面的信息。
為了方便對比,本文引用文獻[9]的實例(由于直覺模糊數(shù)的定義不同,我們在數(shù)據(jù)形式上進行了修改,但不影響后面的計算和聚類)。某汽車市場欲對5種不同的車Ai(i=1,2,3,4,5)進行分類,每輛車有6個可供評價的屬性指標:燃料消耗量(G1)、摩擦度(G2)、價格(G3)、舒適度(G4)、車身設(shè)計(G5)、安全性(G6)。每輛車在各評價屬性下的特征信息用直覺模糊數(shù)表示,如表1所示。
表1 每輛車在各評價屬性下的特征信息
由于指標的權(quán)重未知,需計算各指標的權(quán)重,根據(jù)式(3)和式(4)可得到w1=0.13,w2=0.17,w3=0.17,w4=0.23,w5=0.16,w6=0.14,運用式(1)得到直覺模糊相似矩陣:
選擇滿意度閾值η=0.5,即滿意度中性,得到實數(shù)矩陣:
利用自合成方法得到等價矩陣
選取合適的置信水平值λ∈[0,1],按λ截矩陣t(R)λ進行動態(tài)聚類
當0.81<λ≤1,車組Ai(i=1,2,3,4,5)分為5類,即{A1}、{A2}、{A3}、{A4}、{A5};
當0.80<λ≤0.81,車組Ai(i=1,2,3,4,5)分為4類,即{A1}、{A2,A3}、{A4}、{A5};
當0.79<λ≤0.80,車組Ai(i=1,2,3,4,5)分為3類,即{A1,A2,A3}、{A4}、{A5};
當0.74<λ≤0.79,車組Ai(i=1,2,3,4,5)分為2類,即{A1,A2,A3,A4}、{A5};
當0<λ≤0.74,車主Ai(i=1,2,3,4,5)分為1類,即{A1,A2,A3,A4,A5}。
文獻[8]提出的聚類方法如下:當0.78<λ≤1,車組分為5類;當0.71<λ≤0.78,車組分為3類,為{A1,A2,A3},{A4},{A5};當0<λ≤0.71,車組分為1類;沒有考慮指標的權(quán)重,默認為指標的權(quán)重是相同的;利用用戶對汽車指標指的隸屬度進行聚類而忽視非隸屬度和猶豫度,造成用戶對汽車評價信息的丟失。從上述結(jié)果可以看出,本文提出的新的直覺模糊相似度是有效的。提出的新的聚類方法分類更加詳細??梢愿鶕?jù)取值不同,分為1到5類。
本文提出的聚類方法分別考慮了指標權(quán)重已知和未知兩種情況,對于未知的情況運用直覺模糊熵方法得到權(quán)重;在得到直覺模糊相似矩陣后,決策者根據(jù)自己滿意度偏好選擇合適的滿意度閾值η,并將直覺模糊相似矩陣轉(zhuǎn)化為實數(shù)矩陣F,觀察實數(shù)矩陣是否為等價矩陣,如果不是,則利用平方自合成方法求出實數(shù)矩陣的傳遞閉包t(R),選擇合適的置信值λ進行聚類。從實例看出本方法的有效性和可行性。
[1] Zadeh L A.Fuzzy sets[J].Information and Control,1965,8(3):338-353.
[2] Atanassov K T.Intuitionistic fuzzy sets[J].Fuzzy Sets and Systems,1986,20(1):87-96.
[3] 賀正洪,雷英杰.直覺模糊C-均值聚類算法研究[J].控制與決策,2011,26(6):847-850.
[4] 陳曉明,姚澤清.基于集值統(tǒng)計的直覺模糊聚類[J].模糊系統(tǒng)與數(shù)學,2011,25(3):100-108.
[5] 呂燕,張仕斌.基于加權(quán)直覺模糊集合的聚類模型[J].計算機應(yīng)用,2012,32(4):1070-1073.
[6] 張洪美,徐澤水,陳琦.直覺模糊集的聚類方法研究[J].控制與決策,2007,22(8):882-888.
[7] Wang Z,Xu Z S,liu S S.A netting clustering analysis method under intuitionistic fuzzy environment[J].Applied Soft Computing,2011,11(8):5558-5564.
[8] 呂印超,郭嗣琮.直覺模糊集的熵及其一般形式[J].計算機工程與應(yīng)用,2011,47(28):52-55.
[9] 吳濤,白禮虎,劉二寶.直覺模糊集新的熵公式及應(yīng)用[J].計算機工與應(yīng)用,2013,49(23):48-51.
[10] 沈小雪,郭嗣琮.新的直覺模糊熵公式及其應(yīng)用[J].計算機工程與應(yīng)用,2013,49(23):28-31.
Clustering Method Based on New Intuitionistic Fuzzy Similarity Degree
YUAN Zhehua, PAN Xiaodong
(Xinan Jiaotong Univesity, Chengdu 610031, China)
Aiming at the problem, which most of the existing intuitionistic fuzzy clustering methods do not take the weight of the index into account and the calculation result is real number, a clustering method based on the new intuitionistic fuzzy similarity degree is proposed. By using the intuitionistic fuzzy entropy, the index weight is obtained, and an intuitionistic fuzzy similarity degree formula for attribute weight is constructed as well as an approach is developed to construct an intuitionistic fuzzy similarity matrix. A satisfaction threshold is designed and the decision maker selects the appropriate satisfaction threshold according to their own preference, and transforms the intuitionistic fuzzy similarity matrix into real matrix, then, the fuzzy equivalence matrix is obtained by using the square self synthesis method, selects the appropriate confidence value to cluster. Finally, an example shows the validity and feasibility of this method.
intuitionistic fuzzy similarity degree; cluster method; intuitionistic fuzzy entropy; satisfaction threshold
10.3969/j.issn.1674-5403.2017.04.019
TP18
A
1674-5403(2017)04-0085-05
2017-07-20
袁澤華(1993-),男,江西九江人,在讀碩士研究生,主要從事模糊決策和數(shù)據(jù)挖掘的研究.