孫爽爽,黃德才,陸億紅
(浙江工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,杭州 310023)
聚類(lèi)分析是數(shù)據(jù)挖掘領(lǐng)域的重要方法之一,也是目前研究最為活躍、內(nèi)容最為豐富的領(lǐng)域之一.聚類(lèi)通常是將一個(gè)數(shù)據(jù)對(duì)象集劃分成若干個(gè)稱(chēng)為簇的子集[1],使得同一個(gè)簇中的數(shù)據(jù)對(duì)象之間的相似度較高,不同簇之間的對(duì)象相似度較低,這些簇有助于解析數(shù)據(jù)潛在的分布特征并為其它數(shù)據(jù)分析技術(shù)或服務(wù)奠定基礎(chǔ).聚類(lèi)分析在幫助人們獲取潛在的、有價(jià)值的信息過(guò)程中起到至關(guān)重要的作用.
傳統(tǒng)的聚類(lèi)方法大致分為基于劃分聚類(lèi)、層次聚類(lèi)、基于密度的聚類(lèi)、基于網(wǎng)格的聚類(lèi)、基于圖論的聚類(lèi)等.這些針對(duì)確定性數(shù)據(jù)的聚類(lèi)算法已相對(duì)成熟,并在圖像分析[2,3]、模式識(shí)別[4]、知識(shí)發(fā)現(xiàn)[5]和生物信息學(xué)[6,7]等領(lǐng)域得到了廣泛應(yīng)用.基于圖論的譜聚類(lèi)算法更是受到了廣泛的研究和應(yīng)用,1973年Donath和Hoffman[8]首次提出譜聚類(lèi)的最初模型,該模型是基于鄰接矩陣特征向量的圖劃分方法.2000年,Shi和Malik[9]根據(jù)規(guī)范化割集準(zhǔn)則提出了進(jìn)行圖分割的譜聚類(lèi)算法—NCut算法.2002年,Hagen和Kahng[10]根據(jù)比例割集準(zhǔn)則提出了進(jìn)行圖分割的譜聚類(lèi)算法—RCut算法.譜聚類(lèi)算法是基于譜圖理論中圖的最優(yōu)劃分思想提出的,其本質(zhì)是把數(shù)據(jù)的聚類(lèi)問(wèn)題轉(zhuǎn)化為尋求一種對(duì)圖的最優(yōu)劃分的問(wèn)題.理論上譜聚類(lèi)算法能夠?qū)θ我庑螤畹臉颖究臻g聚類(lèi),并得到全局最優(yōu)解.
隨著信息時(shí)代數(shù)據(jù)量的爆發(fā),也使得不確定性數(shù)據(jù)更為常見(jiàn),如何從海量的不確定性數(shù)據(jù)中挖掘有價(jià)值的信息成為了近年來(lái)的一個(gè)研究焦點(diǎn).1965年Zadeh[11]首先提出了模糊理論,用來(lái)處理不確定信息和模糊數(shù)據(jù),其模糊性是通過(guò)一個(gè)元素屬于一個(gè)集合的隸屬度進(jìn)行表示的,后來(lái)他又提出了采用[0,1]區(qū)間來(lái)表示一個(gè)元素屬于一個(gè)集合的不確定性程度[12].Atanassov[13]提出了直覺(jué)模糊理論,直覺(jué)模糊集包含元素的隸屬度,非隸屬度和不確定度這3個(gè)部分.隨后有不同學(xué)者提出了type-2型模糊集理論和n-型模糊集理論[14],以及多重模糊集理論[15]等適用于不同情況的模糊集理論.
2010年,Torra和Narukawa[16,17]提出了猶豫模糊集的概念,它也是模糊集理論的一種擴(kuò)展,與其他模糊集理論不同的是其允許元素的隸屬度在一定的區(qū)間變動(dòng),可以解決猶豫度不確定的情況.2014年,Chen[18]提出了猶豫模糊數(shù)據(jù)對(duì)象集的層次k-means聚類(lèi)算法(HFHC),僅僅給出了實(shí)例說(shuō)明聚類(lèi)計(jì)算過(guò)程,并沒(méi)有給出仿真分析結(jié)果.該算法是層次聚類(lèi)算法與k-means算法的結(jié)合,把層次聚類(lèi)算法的結(jié)果作為k-mean算法初始的簇中心,解決了k-means算法對(duì)初始簇中心敏感的問(wèn)題,但存在對(duì)異常點(diǎn)敏感的問(wèn)題,容易聚成鏈狀的問(wèn)題.王等[19]提出了凝聚中心猶豫度恒定的模糊層次聚類(lèi)算法(FHCA),并進(jìn)行了模擬數(shù)據(jù)的仿真分析.該算法根據(jù)數(shù)據(jù)本身設(shè)計(jì)了新的權(quán)重公式,提出了新的層次聚類(lèi)簇中心計(jì)算方法,雖然降低了算法的時(shí)間和空間復(fù)雜度,但損失了原始數(shù)據(jù)的不確定性,且與HFHC算法存在同樣的問(wèn)題.張等人[20]提出了一種基于密度峰值的加權(quán)猶豫模糊數(shù)據(jù)對(duì)象集的聚類(lèi)算法,降低了簇中心計(jì)算的復(fù)雜度,并提高了對(duì)不同規(guī)模以及任意形狀數(shù)據(jù)集的適應(yīng)性.
目前,現(xiàn)有的猶豫模糊數(shù)據(jù)對(duì)象集層次聚類(lèi)算法受異常點(diǎn)影響較大且容易聚成鏈狀,首先改進(jìn)了猶豫模糊集之間相似度的計(jì)算方法,提出了一種可擴(kuò)展的猶豫模糊集之間的加權(quán)相似度計(jì)算方法,該方法不僅可以利用不同的函數(shù)計(jì)算相似度,還可以根據(jù)實(shí)際問(wèn)題構(gòu)造最優(yōu)的相似度函數(shù).在此基礎(chǔ)上,結(jié)合經(jīng)典的譜聚類(lèi)算法,提出了基于猶豫模糊數(shù)據(jù)對(duì)象集的譜聚類(lèi)算法SCHF.針對(duì)目前國(guó)內(nèi)外還沒(méi)有可用于猶豫模糊數(shù)據(jù)對(duì)象集聚類(lèi)的標(biāo)準(zhǔn)數(shù)據(jù)集的現(xiàn)實(shí)情況,提出了一種確定性數(shù)據(jù)的猶豫模糊方法來(lái)構(gòu)造模擬的猶豫模糊數(shù)據(jù)對(duì)象集,并在仿真實(shí)驗(yàn)中應(yīng)用.仿真實(shí)驗(yàn)不僅驗(yàn)證了SCHF算法的有效性,而且表明SCHF算法比已知的兩種猶豫模糊聚類(lèi)算法有更好的聚類(lèi)效果.
定義1.對(duì)于定論域X,X上的猶豫模糊集A是指集合X通過(guò)函數(shù)h映射到[0,1]區(qū)間的一個(gè)子集合.Xia和Xu[21]總結(jié)給出了猶豫模糊集合(hesitant fuzzy sets,HFS)的數(shù)學(xué)表達(dá)式如下:
A={
其中的hA(x)是一個(gè)取值在[0,1]之間的集合,表示元素x∈A的不確定性程度,即元素的隸屬度集合.hA(x)是猶豫模糊集A的基本單位,稱(chēng)其為猶豫模糊元(HFE).hA(x)有下面兩個(gè)性質(zhì)
1)若?x∈X,hA(x)={0},則A=φ;
2)若?x∈X,hA(x)={1},則A=X.
定義2.λ=|hA(xj)|為猶豫模糊元hA(xj)的猶豫度.猶豫度λ表示猶豫模糊元中的隸屬度的個(gè)數(shù).
Torra和Narukawa[16]定義了對(duì)于任意給定的兩個(gè)猶豫模糊元h1,h2,并、交、補(bǔ)、指數(shù)、數(shù)乘運(yùn)算方式.
1)h1∪h2=∪γ1∈h1,γ2∈h2{γ1,γ2};
2)h1∩h2=∪γ1∈h1,γ2∈h2{min{γ1,γ2}},|h1|=|h2|;
5)λh1=∪γ1∈h1{1-(1-γ1)λ},λ>0.
在計(jì)算兩個(gè)猶豫模糊元的交集時(shí),要求兩個(gè)猶豫模糊元的猶豫度相等.需要對(duì)兩個(gè)猶豫度不同的猶豫模糊元中猶豫度小的一方進(jìn)行補(bǔ)充,在對(duì)猶豫度小的模糊元補(bǔ)充隸屬度時(shí)并沒(méi)有特定的標(biāo)準(zhǔn),理論上0~1之間的任何數(shù)都可以.本文采用均值法,在根據(jù)隸屬度決策時(shí),隸屬度的取平均值進(jìn)行填充.
例1.兩個(gè)給定的猶豫模糊元h1={0.3,0.5},h2={0.2,0.6,0.9},對(duì)h1進(jìn)行數(shù)乘、指數(shù)和補(bǔ)集的運(yùn)算,對(duì)h1和h2進(jìn)行并集和交集的運(yùn)算.
數(shù)乘:λh1=∪γ1∈h1{1-(1-γ1)k}={1-(1-0.3)k}∪{1-(1-0.5)k},若取k=2,則2h1={1-(1-0.3)2}∪{1-(1-0.5)2}={0.51,0.75}.
并集:h1∪h2=∪γ1∈h1,γ2∈h2{γ1,γ2}={0.3,0.5,0.2,0.6,0.9}.
交集:λ1=|h1|=2,λ2=|h2|=3,因此對(duì)h1采用均值進(jìn)行補(bǔ)充,補(bǔ)充之后的h1={0.3,0.4,0.5}.
h1∩h2=∪γ1∈h1,γ2∈h2{min{γ1,γ2}}=
{min(0.3,0.2)}∪{min(0.4,0.6)}∪{min(0.5,0.9)}={0.2,0.4,0.5}
定義3.若X={x1,x2,…,xj,…,xd},其中每個(gè)分量xj都是猶豫模糊元,則稱(chēng)X為d維的猶豫模糊集合,簡(jiǎn)稱(chēng)猶豫模糊集.
定義4.若D={X1,X2,…,Xi,…,Xn},其中每個(gè)Xi都是d維猶豫模糊集,則稱(chēng)D為猶豫模糊數(shù)據(jù)對(duì)象集.
譜聚類(lèi)算法是將聚類(lèi)問(wèn)題轉(zhuǎn)化為圖的最優(yōu)劃分問(wèn)題,然后通過(guò)引入拉普拉斯矩陣,對(duì)數(shù)據(jù)進(jìn)行降維表示,轉(zhuǎn)化為對(duì)其向量空間的聚類(lèi),理論上可以得到全局最優(yōu)解.譜聚類(lèi)算法的主要步驟如下:
步驟1.根據(jù)輸入的數(shù)據(jù)構(gòu)造相似度矩陣S;
步驟2.根據(jù)相似度矩陣得到鄰接矩陣W和度矩陣,并求出拉普拉斯矩陣L;
步驟3.計(jì)算歸一化拉普拉斯矩陣的最小的k個(gè)特征向量;
步驟4.對(duì)k個(gè)特征向量進(jìn)行聚類(lèi),得到聚類(lèi)結(jié)果.
定義5.設(shè)A,B,C是論域X的3個(gè)猶豫模糊集,若S(A,B)滿(mǎn)足以下4點(diǎn),則稱(chēng)S(A,B)為猶豫模糊集A和B的加權(quán)猶豫模糊相似度:
1)S(A,B)=0,當(dāng)且僅當(dāng)A=φ,B=X或B=φ,A=X時(shí);
2)S(A,B)=1,當(dāng)且僅當(dāng)A=B時(shí);
3)若A?B?C,則有S(A,C)≤S(B,C),S(A,C)≤S(A,B);
4)S(A,B)=S(B,A).
定理1.設(shè)對(duì)象集D={X1,X2,…,Xi,…,Xn},對(duì)于X∈D,設(shè)X={x1,x2,…,xj,…,xd}的3個(gè)猶豫模糊集A,B,C的第j個(gè)屬性對(duì)應(yīng)的3個(gè)猶豫模糊元分別為hA(xj),hB(xj),hC(xj),定義S(A,B)如公式(1)所示:
(1)
f:[-1,1]→[0,1]表示f是集合[-1,1]到集合[0,1]的一個(gè)映射函數(shù).f(x)滿(mǎn)足:
1)對(duì)稱(chēng)性,?x∈[-1,1],f(x)=f(-x);
2)單調(diào)性,f(x)在[-1,0]上單調(diào)遞減,在[0,1]上單調(diào)遞增,且f(0)=0,f(1)=1.
g:[0,1]→[0,1]表示g是集合[0,1]到集合[0,1]的一個(gè)映射函數(shù),g(x)滿(mǎn)足在[0, 1]上單調(diào)遞增, 且g(0)=0,
g(1)=1.
那么S(A,B)稱(chēng)為猶豫模糊集A和B的加權(quán)相似度.
證明:
由f(x)在[-1,0]單調(diào)遞減,可得出:
由g(x)在[0,1]上單調(diào)遞增,可得:
當(dāng)選擇滿(mǎn)足以下條件的函數(shù)f和函數(shù)g時(shí),可以得到不同的加權(quán)相似度函數(shù),也可以根據(jù)實(shí)際問(wèn)題構(gòu)造加權(quán)相似度函數(shù).
f:[-1,1]→[0,1]表示f是集合[-1,1]到集合[0,1]的一個(gè)映射函數(shù).f(x)滿(mǎn)足:
1)對(duì)稱(chēng)性,?x∈[-1,1],f(x)=f(-x);
2)單調(diào)性,f(x)在[-1,0]上單調(diào)遞減,f(x)在[0,1]上單調(diào)遞增,且f(0)=0,f(1)=1.
g:[0,1]→[0,1],表示g是集合[0,1]到集合[0,1]的一個(gè)映射函數(shù),g(x)滿(mǎn)足在[0,1]上單調(diào)遞增,且g(0)=0,g(1)=1.
取f(x)=|x|,取g(x)=x.將其帶入公式(1)得到絕對(duì)值加權(quán)相似度S(A,B),如公式(2)所示,1-S(A,B)可得文獻(xiàn)[19]中的加權(quán)距離公式.
(2)
進(jìn)行一般性的推廣,令f(|x|)=|x|p,g(x)=xq,p∈R+,q∈R+,此時(shí)f(x)與g(x)均滿(mǎn)足條件.得到A和B的加權(quán)猶豫模糊相似度公式,如公式(3)所示,指數(shù)曲線(xiàn)f(x)與g(x)如圖1所示.由于f(x)=f(-x),為了方便,只展示0-1部分.
圖1 f(x)與g(x)的指數(shù)曲線(xiàn)Fig.1 Exponential curve of f(x)and g(x)
(3)
圖2 f(x)與g(x)的球形曲線(xiàn)Fig.2 Spherical curve of f(x)and g(x)
圖3 f(x)與g(x)的S形曲線(xiàn)Fig.3 S-shaped curve of f(x)and g(x)
(4)
(5)
(6)
(7)
定義6.設(shè)猶豫模糊對(duì)象集D={X1,X2,…,Xi,…,Xn},Xi∈D都是d維猶豫模糊集,稱(chēng)MSnxn為猶豫模糊對(duì)象集的加權(quán)相似度矩陣.對(duì)任意D中任意兩個(gè)猶豫模糊集有Xi,Xj∈D,MSij=S(Xi,Xj),i,j∈(1,2,…,n).對(duì)于MS有一下兩個(gè)性質(zhì):
1)MSii=1,i=n;
2)MS是一個(gè)對(duì)稱(chēng)矩陣.
在譜聚類(lèi)算法中,需要根據(jù)相似度矩陣MS構(gòu)造對(duì)應(yīng)鄰接矩陣W,目前方法有σ閾值法、互為k近鄰法、k近鄰法和全連接法[22]等.
1)σ閾值法:當(dāng)MS中任意兩個(gè)猶豫模糊集的相似度大于σ時(shí),兩個(gè)猶豫模糊集之間的wij即為該邊的相似度,否則,該猶豫模糊集之間的相似度為0,計(jì)算方法如公式(8)所示:
(8)
2)互為k近鄰方法:利用KNN算法遍歷MS,取每最近的互為k近鄰的k個(gè)猶豫模糊集,鄰接矩陣的生成方法如公式(9)所示:
(9)
3)k近鄰方法:利用KNN算法遍歷MS,取每個(gè)樣本最近的k個(gè)猶豫模糊集,鄰接矩陣的生成方法如公式(10)所示:
(10)
4)全連接:全連接常通過(guò)的是高斯核進(jìn)行轉(zhuǎn)換,得到所有的猶豫模糊集的wij都不為0,鄰接矩陣的生成方法如公式(11)所示:
(11)
設(shè)猶豫模糊數(shù)據(jù)對(duì)象集D={X1,X2,…,Xi,…,Xn},對(duì)于X∈D,X={x1,x2,…,xj,…,xd}.猶豫模糊數(shù)據(jù)對(duì)象集的譜聚類(lèi)算法(Spectral clustering algorithm for hesitating fuzzy data object set,SCHF)的步驟如下.
輸入:猶豫模糊數(shù)據(jù)對(duì)象集D,鄰接數(shù)k1,降維后的維度k2,簇的數(shù)目C
輸出:C個(gè)簇的聚類(lèi)結(jié)果
SCHF算法步驟如下:
步驟1.由公式(7)計(jì)算權(quán)值向量W,由公式(4)、公式(5)和公式(1)計(jì)算D中任意兩個(gè)猶豫模糊集的加權(quán)相似度,得到相似度矩陣MSnxn;
步驟3.計(jì)算拉普拉斯矩陣Lnxn,L=Dm-MS;
步驟4.計(jì)算拉普拉斯矩陣L進(jìn)行特征分解,得到的前k2小的特征值對(duì)應(yīng)的特征向量,組成特征向量矩陣Vnxk2,其中矩陣中的每一行是一個(gè)猶豫模糊集在k2維空間中的表示;
步驟5.使用k-means對(duì)Vnxk2進(jìn)行聚類(lèi),得到C個(gè)簇的聚類(lèi)結(jié)果.
目前國(guó)內(nèi)外沒(méi)有可用于聚類(lèi)的標(biāo)準(zhǔn)化猶豫模糊數(shù)據(jù)集,因此提出了一種確定性數(shù)據(jù)的猶豫模糊化方法(Hesitant fuzzification of deterministic data,HFD)構(gòu)建模擬的實(shí)驗(yàn)仿真數(shù)據(jù).
maxj=max(X1j,X2j,…,Xij,…,Xnj)
(12)
minj=min(X1j,X2j,…,Xij,…,Xnj)
(13)
(14)
輸入:確定性數(shù)據(jù)集D,猶豫度λ
步驟1.對(duì)數(shù)據(jù)集D根據(jù)公式(14)進(jìn)行歸一化,得D′;
從確定性數(shù)據(jù)猶豫模糊化方法步驟可以得出,HFD只對(duì)數(shù)據(jù)集本身進(jìn)行猶豫模糊化,并不會(huì)對(duì)原來(lái)數(shù)據(jù)屬于某個(gè)簇做出改變,猶豫模糊化后的數(shù)據(jù)集與未模糊化集簇的屬性一致.
下面通過(guò)由8個(gè)猶豫模糊集組成的猶豫模糊對(duì)象集,驗(yàn)證猶豫模糊譜聚類(lèi)(SCHF)的有效性,猶豫模糊集屬性維度為3,數(shù)據(jù)本身為2個(gè)簇.數(shù)據(jù)如表1所示.
表1 猶豫模糊對(duì)象集Table 1 Hesitant fuzzy object set
首先計(jì)算權(quán)值W,通過(guò)公式(7)計(jì)算得到權(quán)值向量W=[0.334 0.354 0.312]T.通過(guò)公式(4)、公式(5)和公式(1)計(jì)算得到S形加權(quán)相似度矩陣MS1.
為了對(duì)比S曲線(xiàn)得到相似度矩陣與絕對(duì)值曲線(xiàn)相似度矩陣的效果,給出了f(x)=|x|,g(x)=x計(jì)算得到的相似度矩陣MS2,與上面的S曲線(xiàn)相似度矩陣對(duì)比后,可以看出上面S曲線(xiàn)得到的相似度矩陣起到了放縮的作用,在絕對(duì)值矩陣中值大于0.5的進(jìn)行了放大,小于0.5的進(jìn)行了縮小.
取k1=4,S曲線(xiàn)相似度矩陣MS1經(jīng)過(guò)計(jì)算得到的鄰接矩陣W.
取k2=2,根據(jù)鄰接矩陣W計(jì)算度矩陣Dm,然后計(jì)算拉普拉斯矩陣L,對(duì)L特征分解得到前k2小的特征向量矩陣V.其中每一行是一個(gè)猶豫模糊集在二維空間的表示.
最后特征向量矩陣經(jīng)過(guò)k-means聚類(lèi),得到兩個(gè)簇{X1,X2,X3,X4},{X5,X6,X7,X8}.
為了驗(yàn)證算法SCHF的聚類(lèi)效果,選擇了4個(gè)常用的合成數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),數(shù)據(jù)集信息如表2所示,數(shù)據(jù)分布如圖4所示.分別取猶豫度λ=2、λ=4和λ=8通過(guò)算法HFD進(jìn)行猶豫模糊化.SCHF算法中近鄰數(shù)k1取4,譜聚類(lèi)算法中一般降維后的維度與簇?cái)?shù)相等,所以取k2等于輸入簇的數(shù)目.這里采用常用的準(zhǔn)確率ACC、調(diào)整互信息AMI和調(diào)整蘭德里系數(shù)ARI指標(biāo)對(duì)聚類(lèi)結(jié)果進(jìn)行評(píng)估,其中ACC值的范圍為[0,1],ARI和AMI 值的范圍為[-1,1],它們都是值越大表示聚類(lèi)效果越好.并對(duì)結(jié)果進(jìn)行比較,結(jié)果如表3所示.
圖4 可視化數(shù)據(jù)集Fig.4 Visualized data set
表2 數(shù)據(jù)集Table 2 Data sets
表3 SCHF聚類(lèi)結(jié)果Table 3 Clustering results of SCHF algorithm
從仿真實(shí)驗(yàn)結(jié)果可以看出,SCHF算法對(duì)確定性數(shù)據(jù)猶豫模糊化后的聚類(lèi)結(jié)果基本達(dá)到90%以上的準(zhǔn)確率.從數(shù)據(jù)集4_blobs和five_cluster來(lái)看,SCHF對(duì)球形數(shù)據(jù)能夠得到很好的聚類(lèi)效果,從moons數(shù)據(jù)集來(lái)看對(duì)流形數(shù)據(jù)也得到了很好的聚類(lèi)效果.從數(shù)據(jù)集five_cluster和anisol來(lái)看,隨著猶豫度的增加,而增加了確定性數(shù)據(jù)的不確定程度,聚類(lèi)效果沒(méi)有下降反而有所提升.
對(duì)文獻(xiàn)[18]的算法HFHC和文獻(xiàn)[19]的算法FHCA進(jìn)行對(duì)比驗(yàn)證.為了增加算法比較的公平性,各個(gè)算法在每個(gè)數(shù)據(jù)集上進(jìn)行20次實(shí)驗(yàn),取平均值,以調(diào)整蘭德里系數(shù)ARI作為評(píng)價(jià)指標(biāo).表4是猶豫度為4的實(shí)驗(yàn)結(jié)果,表5是猶豫度為8的實(shí)驗(yàn)結(jié)果.
從表4和表5,可以看出算法SCHF整體優(yōu)于算法HFHC和FHCA.而算法HFHC和FHCA對(duì)數(shù)據(jù)集moons和aniso的準(zhǔn)確性較低, 因?yàn)樗惴℉FHC和FHCA都是基于層次算法的猶豫模糊數(shù)據(jù)對(duì)象集的聚類(lèi)算法,而層次算法本身受異常點(diǎn)影響較大且容易聚成鏈狀,因而對(duì)模擬的猶豫模糊數(shù)據(jù)對(duì)象集moons和aniso的聚類(lèi)效果較差.SCHF算法的相似度計(jì)算方法有一定的縮放作用,而譜聚類(lèi)算法理論上能夠?qū)θ我庑螤畹拇氐玫嚼碚撋系淖顑?yōu)解,實(shí)驗(yàn)對(duì)比結(jié)果體現(xiàn)了本文提出的可擴(kuò)展加權(quán)相似度計(jì)算方法基礎(chǔ)上SCHF算法的優(yōu)勢(shì).仿真實(shí)驗(yàn)表明,本文算法SCHF整體優(yōu)于算法HFHC和FHCA,通過(guò)實(shí)驗(yàn)的對(duì)比驗(yàn)證了SCHF的有效性和準(zhǔn)確率.
表4 λ=4各算法的ARITable 4 ARI of different algorithms
表5 λ=8各算法的ARITable 5 ARI of different algorithms
本文針對(duì)猶豫模糊數(shù)據(jù)對(duì)象集層次聚類(lèi)算法受異常點(diǎn)影響較大且容易聚成鏈狀的問(wèn)題,首先提出了猶豫模糊集之間可擴(kuò)展的加權(quán)相似度計(jì)算方法,在此基礎(chǔ)上提出了猶豫模糊數(shù)據(jù)對(duì)象集的譜聚類(lèi)算法SCHF,通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了算法的有效性和準(zhǔn)確率.下一步的研究方向是在猶豫模糊集加權(quán)相似度的基礎(chǔ)上結(jié)合其他聚類(lèi)算法對(duì)猶豫模糊數(shù)據(jù)對(duì)象集的聚類(lèi)進(jìn)行研究,并在真實(shí)環(huán)境下的猶豫模糊數(shù)據(jù)對(duì)象集上進(jìn)行實(shí)驗(yàn)驗(yàn)證.