• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于簇內(nèi)簇間相異度的k-modes算法

    2021-09-16 02:29:20賈子琪
    計算機(jī)工程與設(shè)計 2021年9期
    關(guān)鍵詞:漢明鄰域特征值

    賈子琪,宋 玲

    (1.南陽理工學(xué)院 計算機(jī)與軟件學(xué)院,河南 南陽 473004;2.廣西大學(xué) 計算機(jī)與電子信息學(xué)院,廣西 南寧 530004)

    0 引 言

    經(jīng)典k-means算法[1]在計算簇的均值以及數(shù)據(jù)對象之間的相異度時使用的是歐式距離,僅適用于連續(xù)特征的數(shù)值型數(shù)據(jù)集,對于離散特征的分類型數(shù)據(jù)集,k-means算法不再適用。Huang對k-means算法[1]進(jìn)行擴(kuò)展,使用“modes”代替“means”,提出適用于分類型數(shù)據(jù)聚類的k-modes算法[2]。k-modes算法采用簡單漢明距離計算相異度,忽略了數(shù)據(jù)對象間同一分類特征的差異性,弱化了簇內(nèi)相似性,沒有充分反映同一分類特征下兩個特征值之間的相異度;采用隨機(jī)選擇的方法確定初始簇中心和k值,采用基于頻率的方法重新計算和更新簇中心,給聚類結(jié)果帶來很大的不確定性。

    1 相關(guān)工作

    Ahmad等[3]通過共現(xiàn)分析來反映同一特征下特征值之間的距離,如果特征值之間的共現(xiàn)程度高,則將該特征作為新的簇中心。該方法反映了特征之間的潛在關(guān)系,改善了同一特征下特征值相異度系數(shù)的計算,但忽略了數(shù)據(jù)對象本身的異同。Hus等[4]提出了一種基于概念層次的相異度系數(shù)。該方法過于依賴用戶的經(jīng)驗(yàn)以及對待聚類數(shù)據(jù)集專業(yè)知識的了解,不利于一般用戶的使用,聚類范圍有局限性。Ng等[5]擴(kuò)展了簡單漢明距離,考慮當(dāng)前聚類中modes的影響,基于特征值在簇內(nèi)出現(xiàn)的頻率提出了新的相異度系數(shù)。該方法最小化了目標(biāo)函數(shù),提高了聚類精度,但其相異度系數(shù)的計算仍然存在問題。IDMKCA算法只反映了相同特征之間的內(nèi)在關(guān)系,沒有考慮不同特征值之間的相似性。如果兩個數(shù)據(jù)對象的特征值不匹配,那么這兩個特征值的相異度系數(shù)計算結(jié)果始終為“1”。Cao等[6]提出基于新相異度系數(shù)的IMCDC算法。在新相異度系數(shù)下k-modes算法的性能得到了提高,但由于假定數(shù)據(jù)對象的重要性相同,導(dǎo)致不能充分考慮分類型數(shù)據(jù)的特點(diǎn),不能準(zhǔn)確地計算數(shù)據(jù)對象間的相異度。Sangam等[7]在IDMKCA算法基礎(chǔ)上提出了基于新的相異度系數(shù)的EKACMD算法。該算法在一些情況下確實(shí)能夠解決IDMKCA算法的部分不足,但是在簇內(nèi)簇間特征值出現(xiàn)頻率相等的情況下,EKACMD算法和IDMKCA算法都存在問題。

    2 經(jīng)典k-modes聚類算法及相關(guān)符號說明

    2.1 相關(guān)符號說明

    本文使用的相關(guān)符號及含義說明見表1。

    表1 符號說明

    2.2 k-modes聚類算法

    以數(shù)據(jù)對象xi和簇中心ql為例,定義經(jīng)典k-modes算法的簡單漢明距離,如式(1)所示,此計算賦予各特征相同的權(quán)重[8]

    (1)

    k-modes算法通過簡單漢明距離來最小化的目標(biāo)函數(shù)。如式(2)所示[9]

    (2)

    3 基于簇內(nèi)簇間相異度的k-modes算法(IKMCA)

    3.1 IKMCA算法的基本思想

    如果選用的相異度系數(shù)可以發(fā)現(xiàn)數(shù)據(jù)集內(nèi)全部或部分潛在的modes,那么對基于劃分的k-modes算法來說事半功倍。使k-modes算法產(chǎn)生高效的聚類結(jié)果需滿足簇內(nèi)數(shù)據(jù)對象之間的相異度最?。淮亻g數(shù)據(jù)對象之間的相異度最大的條件。因此,本節(jié)基于簇內(nèi)簇間相似性提出一種相異度系數(shù)“簇內(nèi)簇間相異度系數(shù)”。IKMCA算法使用基于改進(jìn)的密度峰值算法確定初始簇中心,使用簇內(nèi)簇間相異度系數(shù)計算各數(shù)據(jù)對象與簇中心之間的相異度,并更新簇中心。

    3.2 經(jīng)典k-modes算法及其變體算法存在的問題

    3.2.1 在相異度系數(shù)上存在的問題

    經(jīng)典k-modes算法的相異度系數(shù)沒有考慮簇內(nèi)特征值出現(xiàn)的相對頻率,也沒有考慮各特征的簇內(nèi)簇間結(jié)構(gòu)。導(dǎo)致新數(shù)據(jù)對象劃分過程中,一些簇分配了較少的相似數(shù)據(jù)。為方便說明,采用表2所示的人工數(shù)據(jù)集D1對相異度系數(shù)進(jìn)行論證。D1由3個特征描述A={A1,A2,A3}。其中,DOM(A1)={A,B}, DOM(A2)={E,F}, DOM(A3)={H,I}。D1有兩個聚類簇C1和C2分別對應(yīng)的簇中心q1(A,E,H)和q2(A,E,H)。

    表2 人工數(shù)據(jù)集D1

    假設(shè)需要對x7=(A,E,H)進(jìn)行聚類劃分。使用簡單滿名距離可得d(x7,q1)=d(x7,q2)=0+0+0=0。但以簇內(nèi)相似性而言,應(yīng)該將x7劃分給簇C1。

    3.2.2 在初始簇中心選擇上存在的問題

    經(jīng)典k-modes算法對初始簇中心非常敏感,初始簇中心的選擇采用隨機(jī)初始化法或者人工設(shè)置法,這兩種方法都在一定程度上導(dǎo)致了聚類結(jié)果不穩(wěn)定。選擇不同位置和k值的初始簇中心,會產(chǎn)生不同的聚類結(jié)果。如圖1所示,該數(shù)據(jù)集的真實(shí)簇數(shù)是3。選擇不同初始簇中心,設(shè)置不同的k值,可能產(chǎn)生不同聚類結(jié)果,圖1內(nèi)容從左到右依次為:隨機(jī)選取初始簇中心、聚類迭代過程、最終聚類結(jié)果。可見尋找合適的初始簇中心非常重要。

    圖1 k-modes算法對初始簇中心選取的敏感性

    3.3 考慮簇內(nèi)相似性的相異度系數(shù)

    簇內(nèi)簇間相異度系數(shù)考慮特征值在同一簇內(nèi)分布的相對頻率。屬于同簇的數(shù)據(jù)對象,其相同的特征值出現(xiàn)的頻率較高,簇內(nèi)相似性也較高。簇內(nèi)相異度定義如式(3)所示[10]

    1≤i≤n, 1≤s≤m

    (3)

    使用數(shù)據(jù)集D1,根據(jù)式(3)可得d(x10,q1)=(1-2/3)+(1-2/3)+(1-1)=2/3,d(x10,q2)=(1-2/3)+(1-2/3)+(1-2/3)=1。由計算結(jié)果可知,x7與簇C1具有最小相異度,因此x7應(yīng)該被劃分到簇C1內(nèi)。式(3)雖然考慮了簇內(nèi)特征值的相對頻率,但沒有考慮簇間特征值的分布。使用表3所示人工數(shù)據(jù)集D2討論不考慮簇間相似度的缺陷。D2由3個分類型特征描述A={A1,A2,A3}。

    表3 人工數(shù)據(jù)集D2

    其中,DOM=(A1)={A,B,C}, DOM(A2)={E,F},DOM(A3)={H,I,J}。D2有3個聚類簇C1,C2和C3分別對應(yīng)簇中心q1=(A,E,H),q2=(A,E,H)和q3=(B,E,I)。

    假設(shè)需要對x10=(A,E,H)進(jìn)行聚類劃分。使用簡單漢明距離可得d(x10,q1)=d(x10,q2)=d(x10,q3)=0+0+0=0。使用式(3)可得d(x10,q1)=(1-2/3)+(1-2/3)+(1-3/3)=2/3,d(x10,q2)=(1-2/3)+(1-3/3)+(1-2/3)=2/3,d(x10,q3)=1+0+1=2。由上述計算結(jié)果可知,簡單漢明距離不能對x10進(jìn)行聚類劃分;式(3)可以將x10劃分給簇C1或簇C2,即式(3)無法準(zhǔn)確地確定x10的正確聚類劃分。從“低簇內(nèi)相異度高簇間相異度”角度觀察數(shù)據(jù)集D2,可知將x10分配給簇C1更合適。因?yàn)閷10分配給簇C1后,會讓簇C1和簇C2之間的相異度最大化。

    3.4 考慮簇內(nèi)簇間相似性的相異度系數(shù)

    簇間相異度考慮特征值相對于所有簇分布的總頻率。假設(shè)特征值僅在一個簇內(nèi)頻繁分布,意味該特征值和其它簇之間的差異性很大。簇內(nèi)簇間相異度系數(shù)定義如式(4)所示[11]

    1≤i≤n, 1≤s≤m

    (4)

    使用式(4)數(shù)據(jù)集D2進(jìn)行計算d(x10,q1)=(1-2/3×2/4)+(1-2/3×2/8)+(1-3/3×3/5)=1.9;d(x10,q2)=(1-2/3×2/4)+(1-3/3×3/8)+(1-2/3×2/5)=2.025;d(x10,q3)=(1-0×1)+(1-3/3×3/8)+(1-0×1)=2.625。根據(jù)式(4)的計算結(jié)果可知,x10與簇C1之間的相異度更小,這個結(jié)果與之前的分析一致,成功的對x10進(jìn)行了聚類劃分。下面使用式(4)驗(yàn)證更為特殊的人工數(shù)據(jù)集D3。如表4所示,D3由3個特征描述A={A1,A2,A3}。其中,DOM=(A1)={A,B},DOM(A2)={E,F},DOM(A3)={H,I},3個聚類簇C1,C2和C3分別對應(yīng)簇中心q1=(A,E,H),q2=(A,E,H)和q3=(A,E,H),A,E和H在D3中均勻分布,均出現(xiàn)6次。

    表4 人工數(shù)據(jù)集D3

    分別使用簡單漢明距離、式(3)和式(4)對x10(A,E,H)進(jìn)行聚類劃分。使用簡單漢明距離可得d(x10,q1)=d(x10,q2)=d(x10,q3)=0+0+0=0;使用式(3)可得d(x10,q1)=d(x10,q2)=d(x10,q3)=(1-2/3)+(1-2/3)+(1-2/3)=1;使用式(4)可得d(x10,q1)=d(x10,q2)=d(x10,q3)=(1-2/3×2/6)+(1-2/3×2/6)+(1-2/3×2/6)=21/9。由上述計算結(jié)果可知,當(dāng)特征值均勻分布時,上述3種相異度系數(shù)都無法正確對x10進(jìn)行聚類劃分。因此再一次考慮完善簇內(nèi)簇間相異度系數(shù)。

    3.5 完善的簇內(nèi)簇間相異度系數(shù)

    取數(shù)據(jù)對象xi的特征值分布與所在簇的整體特征值分布進(jìn)行比較,完善算子ζl的定義如式(5)所示

    (5)

    xi是待劃分?jǐn)?shù)據(jù)對象,xj是簇Cl內(nèi)的數(shù)據(jù)對象。重新定義的簇內(nèi)簇間相異度系數(shù)如式(6)所示

    (6)

    對任意xi,xj∈D,d均有以下性質(zhì):

    自身距離:對所有xi,每個對象與自身的距離等于零d(xi,xi)=0。

    對稱性:對所有xi和xj,xi到xj的距離等于xj到xi的距離,即d(xi,xj)=d(xj,xi)。

    非負(fù)性:對所有xi和xj,距離d是個非負(fù)值,當(dāng)且僅當(dāng)xi=xj時,d(xi,xj)=0。

    滿足三角不等式:對所有xi和xj,存在d(xi,xj)≤d(xi,xh)+d(xh,xj)。

    3.6 分類型數(shù)據(jù)初始化方法

    2014年,Rodriguez等提出密度峰值(DP)算法[12]。DP算法是一種基于相對距離和局部鄰域密度的新型聚類算法,處理的是數(shù)值型數(shù)據(jù),其輸入是數(shù)據(jù)對象間的相異度矩陣,因此通過合適的相異度系數(shù)計算出分類型數(shù)據(jù)之間的相異度,就可將DP算法應(yīng)用到分類型數(shù)據(jù)聚類上。本節(jié)利用DP算法可以自動確定聚類簇數(shù)的優(yōu)點(diǎn)去確定初始簇中心。

    3.6.1 數(shù)據(jù)對象xi的局部鄰域密度ρi

    局部鄰域密度ρi的值等價于以數(shù)據(jù)對象xi為圓心,以截斷距離dc為半徑區(qū)域內(nèi)的數(shù)據(jù)對象個數(shù)。xi的局部鄰域密度有方波內(nèi)核函數(shù)法和高斯核函數(shù)法兩種定義方法。方波內(nèi)核函數(shù)法適用于大規(guī)模數(shù)據(jù)集,高斯核函數(shù)法適用于小規(guī)模數(shù)據(jù)集。方波內(nèi)核函數(shù)法求ρi的定義如式(7)所示

    (7)

    K(x)=exp{-x2}

    (8)

    從式(7)和式(8)可知,dc的取值會直接影響ρi的大小,進(jìn)而影響簇中心的選擇和整個聚類結(jié)果。因此,確定合適的dc值對算法來說很重要。

    3.6.2 數(shù)據(jù)對象xi和xj之間的相對距離Li

    xi和xj之間的相對距離Li的定義如式(9)所示

    (9)

    當(dāng)xi的ρi不是最大密度時,Li定義為在所有局部鄰域密度比xi大的數(shù)據(jù)對象中,與xi距離最近的數(shù)據(jù)對象與xi之間的距離,如式(10)和圖2所示

    圖2 xi的局部鄰域密度不是最大密度時的情況

    (10)

    當(dāng)xi的ρi是最大密度時,Li定義為在所有局部鄰域密度比xi大的數(shù)據(jù)對象中,距xi最遠(yuǎn)的數(shù)據(jù)對象與xi之間的距離,如式(11)和圖3所示。同時具備高Li和高ρi的數(shù)據(jù)對象即為簇中心

    圖3 xi的局部鄰域密度是最大密度時的情況

    (11)

    3.6.3 截斷距離

    截斷距離dc是一個限定距離搜索范圍的臨界值。DP算法的dc值需要人為確定,將數(shù)據(jù)集中兩兩數(shù)據(jù)對象間的距離升序排列,取前1%至2%位置處的值即為dc值,是一個大概范圍。在實(shí)際聚類問題中dc值設(shè)置過大,會導(dǎo)致求得的ρi重疊,dc值設(shè)置過小,會導(dǎo)致聚類簇分布稀疏。受文獻(xiàn)[13]啟發(fā)本節(jié)給出詳細(xì)的dc值確定方法。設(shè)定di,j=[di,1,di,2,…,di,n]為數(shù)據(jù)對象xi與xj的相異度。用式(1)計算di,j值,然后對di,j升序排序得到d′i,j=[d′i,1,d′i,2,…,d′i,n]。xi的截斷距離dc,i定義如式(12)所示

    (12)

    max(d′i,j+1-d′i,j)是d′i,j中相鄰相異度的最大差值,設(shè)定d′i,j=da,d′i,j+1=db。如圖4所示,數(shù)據(jù)對象xi與和它同簇的數(shù)據(jù)對象相異度較小,與和它不同簇的數(shù)據(jù)對象相異度較大。因此,在d′i,j=[d′i,1,d′i,2,…,d′i,j,d′i,j+1,…,d′i,n]內(nèi)一定存在一個臨界位置使得d′i,j+1與d′i,j的差值最大,認(rèn)為數(shù)據(jù)對象xi和數(shù)據(jù)對象a屬于同一簇,與數(shù)據(jù)對象b屬于不同簇。數(shù)據(jù)對象xi的dc,i值定義如式(13)所示

    圖4 dc,i值的確定

    (13)

    dc值定義為集合dc,i的最小值如式(14)所示

    dc=min(dc,i)

    (14)

    3.6.4 簇中心的確定

    IKMCA基于以下兩個假設(shè)確定初始簇中心:①簇中心的局部鄰域密度高于周圍非簇中心點(diǎn);②各簇中心之間的相對距離較大?;谏鲜黾僭O(shè),本節(jié)給出初始簇中心自動確定的方法。如圖5所示是一個二維示例數(shù)據(jù)集,共有93個數(shù)據(jù)對象,2個聚類簇,對應(yīng)2個簇中心。

    圖5 二維數(shù)據(jù)集

    DP算法簇中心的選擇是通過決策圖確定的。如圖6所示決策圖的橫軸為數(shù)據(jù)對象xi的局部鄰域密度ρi,縱軸為相對距離Li。ρi和Li的值同時大的值即為數(shù)據(jù)集的簇中心。圖6右上角的兩個點(diǎn)即為圖6中兩個簇對應(yīng)的簇中心。簇中心周圍包圍著大量的數(shù)據(jù)對象,其局部鄰域密度ρi和相對距離Li都較大。

    圖6 決策圖

    為了更加直觀觀察和確定簇中心,考慮使用Zi決策圖來選擇簇中心。通過式(8)和式(9)得到每個數(shù)據(jù)對象的局部鄰域密度和相對距離。根據(jù)公式Zi=ρi×Li計算出所有數(shù)據(jù)對象的Zi值,將Zi值降序排序得到排序序列Z(1)>Z(2)>…Z(n),其中Z(1)>Z(2)>…Z(k),(k

    圖7 Zi決策圖

    3.7 IKMCA描述

    新的簇內(nèi)簇間相異度系數(shù)使分類型數(shù)據(jù)相異度計算更加準(zhǔn)確。初始簇中心的自主選取避免了經(jīng)典k-modes算法隨機(jī)選取或者人為手動設(shè)置帶來的聚類結(jié)果不確定。DP算法只給出dc的大致范圍,本文在DP算法的基礎(chǔ)上給出了dc的明確確定方法。將簇內(nèi)簇間相異度系數(shù)應(yīng)用到經(jīng)典k-modes 算法中,其目標(biāo)函數(shù)定義如式(15)所示。定理1展示了如何最小化目標(biāo)函數(shù)F(U,Q)

    (15)

    uil∈{0,1}, 1≤i≤n, 1≤l≤k

    (16)

    (17)

    (18)

    Un×k是滿足約束條件(16)~(18)的隸屬度矩陣,uil=1表示xi屬于簇Cl。在滿足約束條件(16)~(18)的情況下,目標(biāo)函數(shù)F(U,Q)達(dá)到極小值,此時可以判斷聚類算法結(jié)束。

    定理1 IKMCA的簇中心選取應(yīng)使得函數(shù)F(U,Q)被最小化,當(dāng)且僅當(dāng)fs,ts(xi)≥fs,th(xi),ts≠th(1≤s≤m)。文字描述為,簇中心的各特征值應(yīng)選取數(shù)據(jù)集中各特征上出現(xiàn)頻率最大的特征值。fs,t(xi)(1≤s≤m, 1≤t≤ns)表示xi在第s個特征下取值為As,t的個數(shù),如式(19)所示

    fs,t(xi)=|{xi∈D,xi,s=As,t}|

    (19)

    當(dāng)且僅當(dāng)ql=DOM(As), 1≤s≤m并且滿足式(20)

    fs,ts(xi)≥fs,th(xi),且ts≠th(1≤s≤m)

    (20)

    時,函數(shù)F(U,Q)被最小化。為了使目標(biāo)函數(shù)F(U,Q)達(dá)到極小值,改進(jìn)后的算法步驟描述如下:

    基于簇內(nèi)簇間相異度的k-modes算法(IKMCA)

    輸入:包含有n個對象,m個分類型特征的分類型數(shù)據(jù)集D;

    (1)通過式(1)計算相異度di,j,并得到相異矩陣dn×n;

    (2)根據(jù)式(14)計算截斷距離dc;

    (3)利用式(7)或式(8)計算局部鄰域密度ρi;

    (4)利用式(9)計算相對距離Li;

    (5)根據(jù)公式Zi=ρi×Li,計算得到Zi={Z1,Z2,…,Zn};

    (6)將Zi降序排序,得到排序序列Z(1)>Z(2)>…>Z(n)。以數(shù)據(jù)對象xi的下標(biāo)為橫坐標(biāo),以Zi為縱坐標(biāo)繪制Zi決策圖,確定圖中的拐點(diǎn),拐點(diǎn)處的值即為最佳k值。

    (7)確定k值和初始簇中心集合q(0)={q1,q2,…,qk};

    (8)根據(jù)式(6)計算數(shù)據(jù)集中n-k個數(shù)據(jù)對象與k個簇中心之間的相異度d(xi,ql);

    (9)根據(jù)就近原則將數(shù)據(jù)對象分配到離它最近的初始簇中去,分配完成后,得到k個聚類簇C(1)={C1,C2,…,Ck},標(biāo)記這(n-k)個數(shù)據(jù)對象的簇標(biāo)簽;

    (10)在新形成的聚類簇上根據(jù)定理1更新簇中心q(1)={q1,q2,…,qk};

    (11)重復(fù)上述步驟(8)~步驟(10),直到目標(biāo)函數(shù)不再發(fā)生變化。如果不再發(fā)生變化,則算法結(jié)束;否則,跳至步驟(8)繼續(xù)執(zhí)行。

    (12)算法結(jié)束,完成聚類。

    輸出:聚類完成的簇集合C={C1,C2,…,Ck};

    IKMCA流程如圖8所示。

    圖8 IKMCA流程

    假設(shè)l是算法收斂所需的迭代次數(shù),通常情況下n>>m,k,l。IKMAC算法的時間復(fù)雜度主要是在每次迭代中更新簇中心和相異度。初始化簇中心需要人工觀察決策圖決定,因此此階段的時間復(fù)雜度暫不考慮進(jìn)總體算法中。使用簇內(nèi)簇間相異度在每次迭代中更新簇中心和相異度計算的時間復(fù)雜度是l(O(nmk)+O(nmk))=O(nmkl),所以IKMCA的總時間復(fù)雜度是O(nmkl)。從上述分析可以發(fā)現(xiàn),使簇內(nèi)簇間相異度的IKMCA算法的時間復(fù)雜度相對數(shù)據(jù)對象的數(shù)量、聚類個數(shù)和特征個數(shù)是線性可縮放的。

    3.8 實(shí)驗(yàn)及結(jié)果分析

    3.8.1 性能指標(biāo)

    為評估提出算法的有效性,下面分別從聚類精度AC[14]、純度PR[15]、召回率RE[2]這3個指標(biāo)對聚類結(jié)果進(jìn)行評價,分別如式(21)~式(23)所示。NUM+表示被正確劃分到簇Cl的數(shù)據(jù)對象個數(shù);NUM-表示沒有被正確劃分到簇Cl的數(shù)據(jù)對象個數(shù);NUM*表示應(yīng)該被劃分到簇Cl但實(shí)際上沒有被劃分到簇Cl的數(shù)據(jù)對象個數(shù)。聚類結(jié)果與數(shù)據(jù)集的真實(shí)劃分越接近,AC、PE和RE的值就越大,算法越有效

    (21)

    (22)

    (23)

    3.8.2 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)集描述

    算法用Python語言實(shí)現(xiàn),所有實(shí)驗(yàn)均在intel(R)Core(TM)處理器i7-8700K CPU@3.70 GHz,Windows 10操作系統(tǒng)上運(yùn)行。使用數(shù)據(jù)集來自真實(shí)數(shù)據(jù)集。UCI[16]是加州大學(xué)歐文分校提供的專門用于機(jī)器學(xué)習(xí)的真實(shí)數(shù)據(jù)集。為了測試算法的有效性,從UCI數(shù)據(jù)集中選取Mushroom(簡稱Mus),Breast-cancer(簡稱Bre),Car和Soybean-small(簡稱Soy)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證。表5列出了這些數(shù)據(jù)集詳細(xì)信息。

    表5 數(shù)據(jù)集描述

    3.8.3 實(shí)驗(yàn)結(jié)果分析

    將本文提出的IKMCA算法與Huang提出的k-modes算法、Ng等提出IDMKCA算法和Ravi等提出EKACMD算法分別運(yùn)行30次取平均值。AC、PE和RE的計算結(jié)果見表6~表9。

    表6 4種算法在Mus數(shù)據(jù)集下的實(shí)驗(yàn)結(jié)果

    表7 4種算法在Bre數(shù)據(jù)集下的實(shí)驗(yàn)結(jié)果

    表8 4種算法在Car數(shù)據(jù)集下的實(shí)驗(yàn)結(jié)果

    表9 4種算法在Soy數(shù)據(jù)集下的實(shí)驗(yàn)結(jié)果

    從上述實(shí)驗(yàn)結(jié)果可以看出,對于Mus、Bre、Car和Soy數(shù)據(jù)集而言,大多數(shù)情況下IKMCA在AC、PR和RE上優(yōu)于k-modes算法、IDMKCA算法和EKACMD算法。IMKCA算法優(yōu)于經(jīng)典k-modes算法的原因是,k-modes算法的預(yù)處理破壞了分類型特征的原始結(jié)構(gòu)。轉(zhuǎn)換后的分類特征值使用簡單漢明距離計算相異度系數(shù)并不能揭示分類型數(shù)據(jù)之間的相異度。當(dāng)數(shù)據(jù)集的特征非常多時,簡單的0-1對比可能產(chǎn)生非常大的相異度,也可能產(chǎn)生非常小的相異度甚至是相異差異度。跟經(jīng)典k-modes算法和IDMKCA、EKACMD算法相比,提出的簇內(nèi)簇間相異度可以更好地揭示數(shù)據(jù)集的結(jié)構(gòu)。

    4 結(jié)束語

    經(jīng)典k-modes算法使用簡單漢明距離進(jìn)行相異度計算,弱化了類內(nèi)相似性,忽略了簇間相似性。針對這些問題,本文基于簇內(nèi)簇間相似性提出相異度計算方法。該方法可以防止聚類過程中的重要特征值的丟失,強(qiáng)化了簇內(nèi)特征值之間的相似性,弱化了簇間特征值之間的相似性。提出的簇中心自動選擇方法大大減少了隨機(jī)選取簇中心或者手動選擇選取簇中心給聚類帶來的誤差。本文用一些說明性例子討論了k-modes算法中使用簡單漢明距離等其它幾種相異度系數(shù)的局限性,并提出了一種相異度系數(shù)?;诒疚奶岢鱿喈惗认禂?shù)改進(jìn)的分類型數(shù)據(jù)聚類算法與基于其它相異度系數(shù)的k-modes算法在UCI數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文提出的相異度系數(shù)計算方法保留了數(shù)據(jù)的特征,做到了低簇內(nèi)相異度高簇間相異性的標(biāo)準(zhǔn),在聚類精度、純度和召回率方面均有提高,有效提高了分類型數(shù)據(jù)的聚類效果。

    猜你喜歡
    漢明鄰域特征值
    一類帶強(qiáng)制位勢的p-Laplace特征值問題
    單圈圖關(guān)聯(lián)矩陣的特征值
    稀疏圖平方圖的染色數(shù)上界
    基于鄰域競賽的多目標(biāo)優(yōu)化算法
    關(guān)于-型鄰域空間
    媳婦管錢
    基于商奇異值分解的一類二次特征值反問題
    中年研究
    漢明距離矩陣的研究
    關(guān)于兩個M-矩陣Hadamard積的特征值的新估計
    久久久精品国产亚洲av高清涩受| 欧美人与性动交α欧美软件| 亚洲专区国产一区二区| 一区二区日韩欧美中文字幕| 免费女性裸体啪啪无遮挡网站| 男女边摸边吃奶| 桃花免费在线播放| 亚洲欧美清纯卡通| 欧美 日韩 精品 国产| kizo精华| 久久性视频一级片| 久久人人爽av亚洲精品天堂| 97精品久久久久久久久久精品| 欧美+亚洲+日韩+国产| 人人妻人人爽人人添夜夜欢视频| 亚洲av日韩精品久久久久久密 | 中文字幕最新亚洲高清| 色婷婷久久久亚洲欧美| av在线老鸭窝| 国产亚洲欧美在线一区二区| 亚洲欧美成人综合另类久久久| av一本久久久久| 成年人午夜在线观看视频| 午夜福利视频在线观看免费| 男女之事视频高清在线观看 | 免费日韩欧美在线观看| 欧美在线黄色| 一级片免费观看大全| 91麻豆av在线| 亚洲国产精品成人久久小说| 午夜福利乱码中文字幕| 男女免费视频国产| 欧美中文综合在线视频| 欧美精品亚洲一区二区| 亚洲精品一二三| 色精品久久人妻99蜜桃| 久久人人爽av亚洲精品天堂| 中文字幕亚洲精品专区| 成人亚洲精品一区在线观看| 久久久久久亚洲精品国产蜜桃av| 人妻人人澡人人爽人人| 欧美精品高潮呻吟av久久| 色网站视频免费| 又大又爽又粗| 亚洲欧洲国产日韩| 国产精品免费大片| 黑人猛操日本美女一级片| 人人澡人人妻人| 91九色精品人成在线观看| 国产在视频线精品| 丝袜脚勾引网站| 免费在线观看影片大全网站 | 国产精品二区激情视频| videosex国产| 亚洲国产精品一区二区三区在线| 母亲3免费完整高清在线观看| 亚洲一区二区三区欧美精品| 精品国产乱码久久久久久小说| 精品久久久久久电影网| 一级片'在线观看视频| 脱女人内裤的视频| 老司机影院成人| 女人被躁到高潮嗷嗷叫费观| 少妇被粗大的猛进出69影院| 日韩av在线免费看完整版不卡| 大片电影免费在线观看免费| 亚洲精品成人av观看孕妇| 欧美在线黄色| 久久精品成人免费网站| 青青草视频在线视频观看| 久久精品久久久久久久性| 一本一本久久a久久精品综合妖精| 1024视频免费在线观看| 久久ye,这里只有精品| 亚洲五月色婷婷综合| 热99久久久久精品小说推荐| 亚洲精品久久久久久婷婷小说| 午夜久久久在线观看| 精品福利观看| 男女床上黄色一级片免费看| 欧美日韩福利视频一区二区| 一级毛片我不卡| 国产日韩欧美亚洲二区| 人成视频在线观看免费观看| www.熟女人妻精品国产| 午夜视频精品福利| 欧美日韩亚洲综合一区二区三区_| 国产成人av教育| 亚洲成人手机| 亚洲欧美色中文字幕在线| 国产成人精品久久久久久| 777米奇影视久久| 男人爽女人下面视频在线观看| 国产免费又黄又爽又色| 超色免费av| 一级毛片女人18水好多 | 美女福利国产在线| 久久久久久免费高清国产稀缺| 国产不卡av网站在线观看| 亚洲人成电影观看| 亚洲中文日韩欧美视频| 无遮挡黄片免费观看| 国产伦人伦偷精品视频| 国产麻豆69| 久久久久久久久免费视频了| 亚洲 欧美一区二区三区| 九草在线视频观看| 精品福利永久在线观看| 欧美黄色淫秽网站| 精品国产国语对白av| 亚洲专区中文字幕在线| 欧美黄色片欧美黄色片| 天天添夜夜摸| 这个男人来自地球电影免费观看| 天天添夜夜摸| 国产成人91sexporn| 国产成人精品久久二区二区免费| 韩国高清视频一区二区三区| 成人午夜精彩视频在线观看| 大话2 男鬼变身卡| 亚洲五月婷婷丁香| 大片电影免费在线观看免费| av国产久精品久网站免费入址| 日韩一区二区三区影片| 精品亚洲成a人片在线观看| 99国产精品免费福利视频| 国产黄频视频在线观看| 精品熟女少妇八av免费久了| 欧美少妇被猛烈插入视频| 欧美乱码精品一区二区三区| 国产深夜福利视频在线观看| 国产一区二区三区综合在线观看| 天天躁夜夜躁狠狠久久av| 91麻豆av在线| 无限看片的www在线观看| 国产亚洲精品第一综合不卡| 黄色一级大片看看| 在线观看免费午夜福利视频| 国产人伦9x9x在线观看| 色婷婷久久久亚洲欧美| 日本91视频免费播放| 国产精品.久久久| 麻豆国产av国片精品| 搡老乐熟女国产| 免费在线观看视频国产中文字幕亚洲 | 午夜福利视频在线观看免费| www.av在线官网国产| 在线观看免费日韩欧美大片| 欧美中文综合在线视频| 国产免费一区二区三区四区乱码| 蜜桃国产av成人99| 18禁国产床啪视频网站| 日本a在线网址| 亚洲欧美成人综合另类久久久| 欧美大码av| 亚洲欧美一区二区三区国产| 国产日韩欧美在线精品| 成年人免费黄色播放视频| 日韩av在线免费看完整版不卡| 亚洲av男天堂| 一级毛片女人18水好多 | videosex国产| 视频在线观看一区二区三区| 免费不卡黄色视频| 久久ye,这里只有精品| 热99国产精品久久久久久7| 欧美+亚洲+日韩+国产| 午夜福利,免费看| 51午夜福利影视在线观看| 精品一区二区三区四区五区乱码 | 亚洲av综合色区一区| 日韩电影二区| 最近中文字幕2019免费版| av福利片在线| 青青草视频在线视频观看| 亚洲欧美激情在线| 日韩精品免费视频一区二区三区| 性高湖久久久久久久久免费观看| 老鸭窝网址在线观看| 久久这里只有精品19| 黄色怎么调成土黄色| 超碰成人久久| 婷婷成人精品国产| 欧美在线黄色| 国产精品av久久久久免费| 欧美日韩福利视频一区二区| av天堂久久9| 国语对白做爰xxxⅹ性视频网站| 另类精品久久| 国产精品久久久人人做人人爽| 国产精品偷伦视频观看了| 成人国语在线视频| av国产久精品久网站免费入址| 亚洲精品第二区| 无遮挡黄片免费观看| 国产亚洲欧美在线一区二区| 欧美成狂野欧美在线观看| 欧美少妇被猛烈插入视频| 成年人午夜在线观看视频| 一个人免费看片子| 国产精品九九99| av福利片在线| 久久99热这里只频精品6学生| 男人爽女人下面视频在线观看| 亚洲专区中文字幕在线| 亚洲精品美女久久av网站| 欧美成狂野欧美在线观看| 久久午夜综合久久蜜桃| 又紧又爽又黄一区二区| 亚洲精品久久成人aⅴ小说| 久久免费观看电影| 2018国产大陆天天弄谢| 亚洲图色成人| 亚洲男人天堂网一区| 色精品久久人妻99蜜桃| 男女国产视频网站| 男人爽女人下面视频在线观看| 中文字幕亚洲精品专区| 欧美日本中文国产一区发布| 亚洲欧洲国产日韩| av国产久精品久网站免费入址| 晚上一个人看的免费电影| 精品国产一区二区三区四区第35| 免费高清在线观看日韩| 人人妻人人澡人人看| 黄色毛片三级朝国网站| 一区二区三区激情视频| 少妇被粗大的猛进出69影院| 黄频高清免费视频| 一本色道久久久久久精品综合| 啦啦啦在线免费观看视频4| 欧美亚洲日本最大视频资源| 久久久久精品人妻al黑| 日本av免费视频播放| 色视频在线一区二区三区| 午夜视频精品福利| 成人亚洲精品一区在线观看| 亚洲一卡2卡3卡4卡5卡精品中文| 久久ye,这里只有精品| 超碰97精品在线观看| 久久精品国产亚洲av涩爱| 99香蕉大伊视频| 亚洲,一卡二卡三卡| 一边摸一边做爽爽视频免费| 国产淫语在线视频| 丝袜人妻中文字幕| av一本久久久久| 美女视频免费永久观看网站| 国产在线免费精品| 国产精品秋霞免费鲁丝片| 欧美乱码精品一区二区三区| 韩国高清视频一区二区三区| 久久av网站| 精品免费久久久久久久清纯 | 亚洲精品一区蜜桃| 黄片小视频在线播放| 男女床上黄色一级片免费看| 久久天躁狠狠躁夜夜2o2o | 在线观看免费高清a一片| av电影中文网址| 国产黄色视频一区二区在线观看| 国产精品国产三级国产专区5o| 妹子高潮喷水视频| 日韩电影二区| 国产一区二区激情短视频 | 欧美黄色片欧美黄色片| 人成视频在线观看免费观看| 亚洲五月婷婷丁香| 最新在线观看一区二区三区 | 国产精品久久久久成人av| 亚洲欧美精品综合一区二区三区| 精品福利观看| 一个人免费看片子| 天天添夜夜摸| 99香蕉大伊视频| 欧美大码av| 亚洲国产欧美网| av线在线观看网站| 人人妻人人澡人人爽人人夜夜| 免费在线观看黄色视频的| 日日爽夜夜爽网站| 免费在线观看影片大全网站 | 成年人黄色毛片网站| 黄色怎么调成土黄色| 欧美日韩黄片免| 国产一区二区激情短视频 | 国产黄色免费在线视频| 又粗又硬又长又爽又黄的视频| 人人妻人人添人人爽欧美一区卜| 亚洲精品中文字幕在线视频| 日韩熟女老妇一区二区性免费视频| 操美女的视频在线观看| 99国产精品一区二区三区| 国产午夜精品一二区理论片| 中文欧美无线码| 丁香六月欧美| 涩涩av久久男人的天堂| 丝袜美腿诱惑在线| 久久久精品国产亚洲av高清涩受| 久久精品久久精品一区二区三区| 免费看av在线观看网站| 久久鲁丝午夜福利片| 99热网站在线观看| 国产片特级美女逼逼视频| 国产欧美日韩一区二区三 | 国产精品一区二区在线观看99| 少妇人妻久久综合中文| 一本大道久久a久久精品| 亚洲av成人不卡在线观看播放网 | 亚洲天堂av无毛| 国产精品欧美亚洲77777| 秋霞在线观看毛片| 久久天堂一区二区三区四区| 久久99精品国语久久久| 久久综合国产亚洲精品| 美女视频免费永久观看网站| 亚洲九九香蕉| 国产激情久久老熟女| 国产一级毛片在线| 久久天堂一区二区三区四区| 麻豆国产av国片精品| 不卡av一区二区三区| 久久久欧美国产精品| 久久九九热精品免费| 精品少妇久久久久久888优播| 激情视频va一区二区三区| 久久精品人人爽人人爽视色| 亚洲成人免费电影在线观看 | 成人三级做爰电影| 国产精品一二三区在线看| 久久中文字幕一级| 中文字幕最新亚洲高清| 久久久久久久国产电影| 大型av网站在线播放| 国产99久久九九免费精品| 美女午夜性视频免费| 观看av在线不卡| 2021少妇久久久久久久久久久| 少妇被粗大的猛进出69影院| 国产成人免费观看mmmm| 国产精品99久久99久久久不卡| www.999成人在线观看| 精品一区二区三区四区五区乱码 | 亚洲伊人色综图| cao死你这个sao货| 亚洲精品久久午夜乱码| 波多野结衣av一区二区av| 只有这里有精品99| 丝袜美足系列| h视频一区二区三区| 免费观看a级毛片全部| 欧美国产精品va在线观看不卡| 国产又色又爽无遮挡免| 少妇人妻 视频| 黄色视频在线播放观看不卡| 精品久久久久久久毛片微露脸 | 日本一区二区免费在线视频| 国产精品熟女久久久久浪| 欧美日本中文国产一区发布| 亚洲欧美日韩高清在线视频 | 巨乳人妻的诱惑在线观看| 国产97色在线日韩免费| 国产免费又黄又爽又色| 国产男女内射视频| 精品一品国产午夜福利视频| 亚洲国产中文字幕在线视频| 欧美变态另类bdsm刘玥| 国产一区二区 视频在线| 国产欧美日韩一区二区三 | 人人妻人人添人人爽欧美一区卜| 亚洲国产精品999| 在线观看国产h片| 午夜免费男女啪啪视频观看| 9色porny在线观看| 成年人免费黄色播放视频| 校园人妻丝袜中文字幕| 美女高潮到喷水免费观看| 中文字幕av电影在线播放| 老汉色av国产亚洲站长工具| 高清不卡的av网站| 精品久久久久久久毛片微露脸 | 国产男人的电影天堂91| 亚洲成人免费av在线播放| 国产黄频视频在线观看| 国产精品99久久99久久久不卡| 男女下面插进去视频免费观看| 高清欧美精品videossex| 人体艺术视频欧美日本| 亚洲精品日本国产第一区| cao死你这个sao货| 一边摸一边做爽爽视频免费| 亚洲熟女精品中文字幕| 自线自在国产av| 日本vs欧美在线观看视频| 亚洲av在线观看美女高潮| 国产一区二区在线观看av| 亚洲伊人色综图| 国产成人免费观看mmmm| 男人添女人高潮全过程视频| av一本久久久久| 18禁国产床啪视频网站| 亚洲 欧美一区二区三区| 国产一区二区激情短视频 | 国产欧美日韩一区二区三区在线| 波多野结衣一区麻豆| 国产欧美日韩一区二区三区在线| 国产国语露脸激情在线看| 国产在线一区二区三区精| 亚洲免费av在线视频| 国产在线观看jvid| 国产片内射在线| 欧美激情 高清一区二区三区| 一级毛片电影观看| 久久av网站| 50天的宝宝边吃奶边哭怎么回事| 一本一本久久a久久精品综合妖精| 亚洲欧洲精品一区二区精品久久久| 成人午夜精彩视频在线观看| 91老司机精品| 老汉色av国产亚洲站长工具| av国产久精品久网站免费入址| 亚洲成色77777| 午夜91福利影院| 久久人妻福利社区极品人妻图片 | 亚洲欧美一区二区三区黑人| 国产片特级美女逼逼视频| 男女边摸边吃奶| 亚洲精品在线美女| 欧美人与性动交α欧美精品济南到| 97精品久久久久久久久久精品| 久久久亚洲精品成人影院| 9热在线视频观看99| 国产精品av久久久久免费| av一本久久久久| 精品一区在线观看国产| 亚洲专区国产一区二区| 精品免费久久久久久久清纯 | 欧美成人精品欧美一级黄| 亚洲激情五月婷婷啪啪| 老司机亚洲免费影院| av在线老鸭窝| 国产精品.久久久| 久久青草综合色| 一本一本久久a久久精品综合妖精| 日韩一卡2卡3卡4卡2021年| 一边摸一边做爽爽视频免费| 久久精品成人免费网站| 国产精品免费视频内射| 亚洲中文av在线| 国产成人av激情在线播放| 成人午夜精彩视频在线观看| 日韩中文字幕视频在线看片| 新久久久久国产一级毛片| 又大又黄又爽视频免费| 国产精品一二三区在线看| 永久免费av网站大全| 天天躁日日躁夜夜躁夜夜| 久久鲁丝午夜福利片| 亚洲情色 制服丝袜| 欧美变态另类bdsm刘玥| 777米奇影视久久| 91成人精品电影| 亚洲欧美成人综合另类久久久| 亚洲精品第二区| 欧美在线一区亚洲| av不卡在线播放| 久久国产精品大桥未久av| 高清不卡的av网站| 久久精品国产亚洲av涩爱| 丰满迷人的少妇在线观看| av欧美777| 精品欧美一区二区三区在线| 国产在线一区二区三区精| 99热国产这里只有精品6| 欧美日韩亚洲高清精品| 大香蕉久久成人网| 久久久久国产精品人妻一区二区| 亚洲国产欧美在线一区| 午夜免费男女啪啪视频观看| 99国产精品99久久久久| 纵有疾风起免费观看全集完整版| 国产日韩欧美视频二区| 18禁黄网站禁片午夜丰满| 搡老岳熟女国产| 制服人妻中文乱码| 老司机影院毛片| 曰老女人黄片| 免费观看a级毛片全部| videos熟女内射| 男女高潮啪啪啪动态图| 看十八女毛片水多多多| a 毛片基地| 久9热在线精品视频| 丝袜喷水一区| 两个人看的免费小视频| 国产男女超爽视频在线观看| 97精品久久久久久久久久精品| 如日韩欧美国产精品一区二区三区| 999久久久国产精品视频| 一本—道久久a久久精品蜜桃钙片| 男人添女人高潮全过程视频| xxxhd国产人妻xxx| 男女之事视频高清在线观看 | 在线观看免费视频网站a站| 黄色怎么调成土黄色| 久久人妻福利社区极品人妻图片 | 69精品国产乱码久久久| 欧美av亚洲av综合av国产av| 制服人妻中文乱码| 国产av精品麻豆| 一边摸一边抽搐一进一出视频| 超色免费av| av天堂在线播放| 欧美另类一区| 成人免费观看视频高清| 午夜激情av网站| 最黄视频免费看| 欧美97在线视频| xxxhd国产人妻xxx| 在线看a的网站| 丝袜在线中文字幕| 成人三级做爰电影| 19禁男女啪啪无遮挡网站| 五月天丁香电影| 又大又爽又粗| 极品少妇高潮喷水抽搐| 久久久久精品国产欧美久久久 | 最近最新中文字幕大全免费视频 | 精品久久久久久电影网| 国产精品久久久人人做人人爽| 精品一区二区三区av网在线观看 | 丝袜喷水一区| 黄片播放在线免费| 精品免费久久久久久久清纯 | 亚洲av男天堂| a级片在线免费高清观看视频| 免费一级毛片在线播放高清视频 | 天天添夜夜摸| 亚洲三区欧美一区| 一本—道久久a久久精品蜜桃钙片| 国产午夜精品一二区理论片| 国产成人精品久久二区二区免费| 国产精品久久久久久人妻精品电影 | 国产成人91sexporn| 国产午夜精品一二区理论片| 亚洲国产欧美网| 国产成人影院久久av| 亚洲少妇的诱惑av| av天堂久久9| 免费观看人在逋| 婷婷成人精品国产| 一边亲一边摸免费视频| 国产免费现黄频在线看| 亚洲五月色婷婷综合| 两人在一起打扑克的视频| 亚洲国产精品999| 2021少妇久久久久久久久久久| 只有这里有精品99| 少妇精品久久久久久久| 丰满迷人的少妇在线观看| 国产亚洲精品久久久久5区| 婷婷成人精品国产| 国产成人91sexporn| 丰满饥渴人妻一区二区三| 后天国语完整版免费观看| 少妇粗大呻吟视频| 日韩制服骚丝袜av| 国产又色又爽无遮挡免| 无限看片的www在线观看| 成人黄色视频免费在线看| 久久精品熟女亚洲av麻豆精品| 国产日韩一区二区三区精品不卡| 波野结衣二区三区在线| 韩国高清视频一区二区三区| xxx大片免费视频| 亚洲国产日韩一区二区| 狂野欧美激情性bbbbbb| 两人在一起打扑克的视频| 亚洲久久久国产精品| 国产精品久久久久久精品电影小说| 久9热在线精品视频| 精品人妻在线不人妻| 国产成人精品久久二区二区免费| 亚洲国产欧美一区二区综合| 亚洲 国产 在线| 亚洲精品国产色婷婷电影| 少妇裸体淫交视频免费看高清 | 巨乳人妻的诱惑在线观看| 啦啦啦视频在线资源免费观看| 你懂的网址亚洲精品在线观看| 亚洲精品成人av观看孕妇| 免费不卡黄色视频| 久久精品国产亚洲av涩爱| 欧美日韩精品网址| 色婷婷av一区二区三区视频| 亚洲成av片中文字幕在线观看| 日本欧美国产在线视频| 亚洲欧洲国产日韩| 亚洲,欧美精品.| 欧美精品啪啪一区二区三区 | 国产日韩欧美视频二区| 亚洲成人国产一区在线观看 | 伊人久久大香线蕉亚洲五| 精品国产一区二区久久| 男女午夜视频在线观看| 国产一区亚洲一区在线观看| 欧美av亚洲av综合av国产av| 国产精品一区二区免费欧美 | 久久天躁狠狠躁夜夜2o2o | 日本wwww免费看| 赤兔流量卡办理| 男男h啪啪无遮挡| 亚洲一区二区三区欧美精品| 老熟女久久久| 国产片内射在线|