• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    拓展差異度的高維數(shù)據(jù)聚類算法

    2020-12-07 08:20:12何慧霞范巖巖
    計算機工程與應(yīng)用 2020年23期
    關(guān)鍵詞:高維個數(shù)聚類

    武 森,何慧霞,范巖巖

    北京科技大學(xué) 經(jīng)濟管理學(xué)院,北京 100083

    1 引言

    高維數(shù)據(jù)聚類是文本挖掘、客戶管理以及圖文聲像等應(yīng)用領(lǐng)域的常見研究課題[1-3]。大部分傳統(tǒng)聚類算法為低維數(shù)據(jù)而設(shè)計,但是當(dāng)數(shù)據(jù)量和數(shù)據(jù)維數(shù)呈指數(shù)增長時,傳統(tǒng)算法的局限就日益顯現(xiàn)[4]。高維數(shù)據(jù)具有稀疏性、維度災(zāi)難等特性,并且噪聲變量降低了在所有維中識別類的可能性[5]。如何在高維數(shù)據(jù)下進行有效的聚類,成為一項有意義且具有挑戰(zhàn)性的課題。

    CABOSFV[6]是一種針對高維數(shù)據(jù)的稀疏特征進行聚類的算法,只需對數(shù)據(jù)進行一次掃描就能生成最終聚類結(jié)果,計算效率大幅提升。CABOSFV算法因其高效性幫助解決了一系列高維數(shù)據(jù)聚類問題,黃月等[7]采用CABOSFV 的思想構(gòu)建了基于“文獻-關(guān)鍵詞”矩陣的知識結(jié)構(gòu)識別方法;Wang 等[8]基于CABOSFV 對肺癌患者的癥候進行聚類,歸納出肺癌的三種中醫(yī)證候分類;劉希宋等[9]將CABOSFV用于客戶知識管理的應(yīng)用場景中,驗證了CABOSFV 相對于傳統(tǒng)聚類算法的優(yōu)越性。然而CABOSFV 由于參數(shù)指定復(fù)雜性和順序敏感性造成了聚類結(jié)果不穩(wěn)定。文獻[10]采用層次聚類的思想,繞過了參數(shù)指定的要求并避免了數(shù)據(jù)對象的輸入順序?qū)垲惤Y(jié)果的影響,但其改變了CABOSFV 的效率優(yōu)勢,增加了算法的計算復(fù)雜度,隨著數(shù)據(jù)數(shù)量和維數(shù)的增加,算法的時間效率明顯降低。

    如何在保證并進一步提高算法效率的同時獲得更高的聚類質(zhì)量成為本文研究的出發(fā)點?;诖?,針對CABOSFV算法數(shù)據(jù)對象分配受類大小影響這一問題,提出拓展差異度的CABOSFV_D 聚類算法。引入調(diào)整指數(shù)p,拓展稀疏差異度度量方式,降低類中對象個數(shù)對對象分配的影響,使聚類過程更加準(zhǔn)確合理。在此基礎(chǔ)上結(jié)合位集(BitSet)運算速度快的優(yōu)點,提出用位集的方式實現(xiàn)CABOSFV_D 算法,提高算法的運行效率?;诹鶄€UCI標(biāo)準(zhǔn)數(shù)據(jù)集進行聚類實驗,分析討論調(diào)整指數(shù)的分布范圍,并給出確定差異度上限的方法。

    2 相關(guān)工作

    2.1 高維數(shù)據(jù)聚類

    目前對高維數(shù)據(jù)的聚類主要包括:基于降維的聚類[11-12]、子空間聚類[13-14]、基于超圖的聚類[15]以及基于稀疏特征聚類[16]。基于降維的聚類,通過特征選擇[17-18]或特征變換[19]對高維數(shù)據(jù)進行降維處理再完成聚類。這類算法應(yīng)用廣泛,但其不足在于:降維后數(shù)據(jù)空間改變,可能損失部分重要聚類信息。由于高維數(shù)據(jù)在全維空間進行聚類比較困難,一些學(xué)者利用子空間思想在相同數(shù)據(jù)集的不同子空間中發(fā)現(xiàn)類。子空間聚類可以從多角度、多屬性綜合考慮來進行聚類,但其缺陷是子空間的劃分和選取標(biāo)準(zhǔn)難以界定?;诔瑘D聚類算法的主要思想是把高維數(shù)據(jù)處理問題轉(zhuǎn)換為圖劃分問題,可以根據(jù)用戶需要靈活調(diào)整聚類效果和質(zhì)量,但相關(guān)參數(shù)的選取將直接影響著聚類質(zhì)量的好壞。還有一類針對高維數(shù)據(jù)的稀疏特征進行聚類的算法,代表算法是CABOSFV算法[6],將在下一部分進行介紹。

    2.2 CABOSFV算法

    CABOSFV算法是針對二態(tài)變量高維稀疏數(shù)據(jù)的高效聚類算法。該算法定義了集合的稀疏差異度(SFD),反映二態(tài)變量高維稀疏數(shù)據(jù)集合中對象的相似性。CABOSFV算法還定義了稀疏特征向量(SFV)及其可加性定理,能夠?qū)崿F(xiàn)只對數(shù)據(jù)進行一次掃描就完成聚類。因此,CABOSFV算法可以節(jié)省大量數(shù)據(jù)掃描和比較的時間,計算效率得到很大的提高[20]。CABOSFV 算法具有高效性,但受參數(shù)指定和輸入順序的影響造成聚類質(zhì)量不穩(wěn)定。現(xiàn)有的相關(guān)改進算法[10]對聚類過程進行調(diào)整和優(yōu)化,以避免上述缺陷,但是增加了算法的復(fù)雜性,聚類效率受到較大影響。如何在保證算法效率的同時提高聚類質(zhì)量是本文要解決的一個問題。

    稀疏差異度是CABOSFV的一個核心概念,其計算公式為SFD(X)=e/(|X| ×a),其中 |X|指集合X中的對象個數(shù),e為該子集中所有對象取值不全相同的屬性個數(shù),a為取值全為1的屬性個數(shù)。閾值b是算法的一個參數(shù),代表一個類內(nèi)對象的差異度上限。稀疏差異度SFD 和閾值b共同決定當(dāng)前對象是否被分配到集合X中。根據(jù)CABOSFV算法步驟,當(dāng)前對象需要從已存在的k個類中尋找與其合并后稀疏差異度最小的類,然后根據(jù)差異度上限b判斷是否加入該類。然而隨著現(xiàn)存集合中的數(shù)據(jù)對象逐漸變多,即 |X|變大,|X|這一項對SFD的影響起到主導(dǎo)作用,使得即使不是十分相似的對象構(gòu)成集合的SFD 也很小,小于等于提前指定好的b,從而把本不太相似的對象分到同一類。即CABOSFV算法更傾向于將對象分配到數(shù)據(jù)對象較多的類中。針對上述問題,提出一種拓展差異度的CABOSFV_D聚類算法。

    3 CABOSFV_D聚類算法

    針對CABOSFV算法稀疏差異度的不足,本文提出拓展的差異度度量方式,同時用位集實現(xiàn)算法,使聚類效果和計算效率都得到提升。

    3.1 拓展的差異度度量方式

    在CABOSFV算法中,集合的稀疏差異度SFD是計算相似度的基礎(chǔ),由于集合內(nèi)的差異度決定了是否將當(dāng)前對象加入到某一集合(類),因此其在算法流程中起到至關(guān)重要的作用。通過分析傳統(tǒng)CABOSFV 中稀疏差異度計算公式的局限性,發(fā)現(xiàn)問題主要在于算法的執(zhí)行過程中稀疏差異度公式中數(shù)據(jù)對象 |X|變化幅度過大,調(diào)節(jié)趨勢過度,而e a這一項的變化趨勢緩慢。因此,提出一種拓展的集合稀疏差異度定義方式。

    定義1(拓展集合差異度)設(shè)具有n個對象的二態(tài)數(shù)據(jù)集合{x1,x2,…,xn} ,X為其中的一個對象子集,其中的對象個數(shù)記為 |X|,在該子集中所有對象稀疏特征取值皆為1的屬性個數(shù)為a,稀疏特征取值不全相同的屬性個數(shù)為e,p為大于等于1 的常整數(shù),則集合X的拓展差異度表示為:

    拓展的稀疏差異度通過給定指數(shù)p,調(diào)整稀疏差異度公式中分母的變化幅度,使不相似的對象不會誤分到同一類,增強算法的合理性。傳統(tǒng)CABOSFV的稀疏差異度是該拓展定義p=1 時的一種特殊情況。

    假設(shè){x1,x2,…,x10} 是由屬性{a1,a2,…,a5} 描述的數(shù)據(jù)對象,每個數(shù)據(jù)對象的各屬性取值以及外部類標(biāo)簽如表1 所示。給定差異度上限b=0.5,分別使用原始差異度計算公式(p=1) 和拓展的差異度計算公式(p≥1)進行聚類。使用原稀疏差異度聚類的對象分配過程為:(1)將每個數(shù)據(jù)對象視作一個集合;(2)計算,將集合和合并到一個新類中,即={x1,x2};(3)計算SFD(?)=5/(3×0)=∞>b,將視作一個新的類,即;(4)計 算,且,因此將集合(5)對于集合,進行類似于(4)的操作,可得{x1,x2,x4,x5,x6} ;(6)對于集合,計算SFD(?)=b,因此將加入類中,={x1,x2,x4,x5,x6,x7,}。此時發(fā)現(xiàn)使用原始差異度聚類,前六個對象分配結(jié)果和實際情況相符,然而隨著類內(nèi)對象個數(shù)的增加,對象x7被誤分到了標(biāo)簽為1的類中,實際上x7和標(biāo)簽為1 的對象(如x6)并不相似。與原差異度公式中p僅能取1 不同,使用拓展的差異度度量方式進行聚類時,指數(shù)p可取大于等于1 的常整數(shù),此處以p=2 為例,前6個數(shù)據(jù)對象的分配結(jié)果和使用原始差異度聚類的結(jié)果是一致的。對于對象x7,計算SFD(X7(0)?X1(1))=,因此將視作一個新的類,即={x7} ,和實際情況相符。通過進一步分析發(fā)現(xiàn)p取3、4等值時也能得到正確的聚類結(jié)果。因此說明和原差異度p僅能取1的計算方式相比,拓展的集合差異度具有調(diào)整分母的變化幅度的能力,從而能夠更加準(zhǔn)確地進行對象的分配。

    表1 十個數(shù)據(jù)對象取值描述

    3.2 位集及位集差異度

    位集是一種特殊的數(shù)據(jù)結(jié)構(gòu)[21],由二進制位構(gòu)成,保存l、0信息。CABOSFV_D算法適用于二態(tài)變量高維稀疏數(shù)據(jù),結(jié)合二態(tài)變量僅有1和0兩種取值的特殊性,以及位集保存l和0信息這種特殊的數(shù)據(jù)結(jié)構(gòu)。本文提出用位集的方式實現(xiàn)CABOSFV_D聚類算法,把對象用位集表示,繼而所有的稀疏差異度的計算也通過位集運算完成,從而保證整個算法用位集實現(xiàn)。另外,由于位集的大小按需增長,數(shù)據(jù)維度的增加對位集的構(gòu)建與運算沒有影響,分類屬性采用獨熱編碼[22]的方式轉(zhuǎn)化為二態(tài)屬性沒有信息的損失,因此基于拓展差異度的CABOSFV_D算法同樣適用于分類屬性聚類問題。

    3.2.1 二態(tài)數(shù)據(jù)對象的位集表示

    為了有效地運用位集運算進行二態(tài)數(shù)據(jù)對象聚類,需要將描述每個對象的所有二態(tài)數(shù)據(jù)全部存入位集中。假設(shè)具有n個對象的二態(tài)數(shù)據(jù)對象集合X={x1,x2,…,xn},描述對象的m個屬性集合為A={a1,a2,…,am} ,屬性aq(q∈{1,2,…,m} )均有兩種取值,即1 或0。對于每一個對象xi,i∈{1,2,…,n} ,將其所有屬性值按位存儲到位集中,記為B(xi),稱為對象xi的位集表示。其中,第1 位存儲屬性a1取值的信息;第2 位存儲屬性a2取值的信息,以此類推。存儲一個對象的位集所需的位數(shù)為m。按照這種方式將描述每個對象的所有二態(tài)屬性數(shù)據(jù)以二進制形式全部存儲到位集中,不同的對象對應(yīng)不同的位集,且不損失任何屬性信息,繼而可以有效地運用位集運算進行二態(tài)變量高維稀疏聚類。

    3.2.2 位集差異度及性質(zhì)

    為將拓展的稀疏差異度計算公式SFD(X)=e/用位集的方式表示,先給出位集差異度的定義。

    定義2(位集差異度)設(shè)二態(tài)數(shù)據(jù)集合表示X={x1,x2,…,xn} ,B(xi)和B(xj)分別為對象xi和xj的位集表示,則這兩個對象之間的位集差異度d(xi,xj)定義為:

    其中,B(xi)ORB(xj)和B(xi)AND(xj)分別表示對應(yīng)的位進行邏輯或(OR)和邏輯與(AND)運算,結(jié)果仍然是位集;| |表示取值為1的位數(shù)。根據(jù)該位集差異度定義,兩對象間取值不同的位數(shù)越多,且取值皆為1 的位數(shù)越少,則兩個對象越具有較大的差異性。根據(jù)邏輯與(AND)和邏輯或(OR)運算滿足冪等率和交換率,位集差異度滿足性質(zhì):(1)d(xi,xi)=0 ;(2)d(xi,xj)=d(xj,xi)。

    定義3(位集差異度推廣)X={x1,x2,…,xn} 為二態(tài)數(shù)據(jù)集合,設(shè)B(xi)為對象xi,i∈{1,2,…,n} 的位集表示,且記BOR(x1,x2,…,xn)和BAND(x1,x2,…,xn)分別為:

    其中BOR(x1,x2,…,xn)和BAND(x1,x2,…,xn)仍然是位集,將兩個對象之間的位集差異度定義推廣到集合X={x1,x2,…,xn} 內(nèi)各對象之間位集差異度的定義為:

    根據(jù)位集差異度推廣的定義,n個對象取值不同的位數(shù)越多,及取值皆為1 的位數(shù)越少,代表這n個對象間的差異越大。其中兩個對象之間的位集差異度是位集差異度推廣的定義在集合中只包含兩個對象時的一種特殊情況。下面給出計算任意兩個非空子集合并后的差異度公式。

    設(shè)二態(tài)數(shù)據(jù)集合表示X={x1,x2,…,xn} ,Y和Z為X的任意兩個非空子集,則Y和Z合并后的差異度表示為:

    式(6)表明,當(dāng)X的任意兩個非空子集Y和Z合并時,可以根據(jù)關(guān)于Y的位集BOR(Y)和BAND(Y)及關(guān)于Z的位集BOR(Z)和BAND(Z)直接計算得到關(guān)于合并后集合的位集BOR(Y?Z)和BAND(Y?Z)及位集差異度d(Y?Z)。特別地,當(dāng)Y=Z時,d(Y?Z)=d(Y)=d(Z)。

    3.3 CABOSFV_D算法步驟

    基于拓展差異度的CABOSFV_D算法步驟如下:

    輸入:對象xi的位集表示B(xi),i=1,2,…,n;閾值b;指數(shù)p。

    輸出:類X1,X2,…,Xc。

    步驟1計算BOR(x1,x2)和BAND(x1,x2),根據(jù)定義2中的公式(2)得到x1和x2的位集差異度,若合并后的位集差異度不大于閾值b,則類為X1={x1,x2} ,類的個數(shù)c=1;否則,將兩個對象分別作為一個初始類,即X1={x1} ,X2={x2} ,類的個數(shù)c=2。

    步驟2對于B(x3),分別計算BOR(Xk?{x3} )和BAND(Xk?{x3} ),k∈{1,2,…,c} ,根據(jù)公式(6)得到集合Xk?{x3} 內(nèi)各對象間的位集差異度d(Xk?{x3} ),尋找使得該位集差異度最小的k0,對應(yīng)的類為Xk0。若求得的最小的位集差異度不大于閾值b,則類Xk0=Xk0?{x3} ,此時類的個數(shù)c不變;否則,新建一個類Xc+1={x3} ,類的個數(shù)更新為c=c+1。

    步驟3對于B(xi),i∈{4,5,…,n} ,重復(fù)進行類似于步驟2的操作。

    步驟4輸出類X1,X2,…,Xc。

    從上述算法步驟可知,CABOSFV_D的算法流程和原CABOSFV 是一致的,因此時間復(fù)雜度沒有變化,兩者的區(qū)別在于CABOSFV 算法在執(zhí)行過程中計算差異度時需要對數(shù)據(jù)對象的所有屬性維分別進行計算,而CABOSFV_D使用位集只需進行一次運算,數(shù)據(jù)維度對位集的構(gòu)建并沒有影響,因此CABOSFV_D能夠提升算法的運算效率。

    CABOSFV_D 聚類算法綜合考慮了算法的聚類準(zhǔn)確性和時間性能,一方面對稀疏差異度計算公式進行拓展,調(diào)整公式中分母的變化幅度,能夠提高聚類過程對象分配的準(zhǔn)確性,另一方面利用位集定義集合差異度并快速實現(xiàn)算法,進一步提高了算法的時間效率。綜合CABOSFV_D的聚類效果和運算效率,其更能有效地解決大規(guī)模高維數(shù)據(jù)聚類問題。

    4 實驗結(jié)果

    4.1 數(shù)據(jù)集選取與處理

    實驗中選取了UCI 機器學(xué)習(xí)庫中的六個真實數(shù)據(jù)集Zoo(ZO)、Soybean-smal(lSS)、Congressional Voting Records(VO)、Lymphography(LYM)、Audiology_Standardized(AS)和Dermatology(DER)進行算法驗證。其中VO數(shù)據(jù)集部分缺失,去除有缺失屬性的對象,最終用于實驗的VO數(shù)據(jù)集的對象個數(shù)是232個。此外CABOSFV_D算法是針對二態(tài)變量高維稀疏數(shù)據(jù)提出的,因此對于非二值的分類屬性,采用獨熱編碼[22]的方式處理成二態(tài)數(shù)據(jù)。實驗數(shù)據(jù)描述如表2所示。

    表2 數(shù)據(jù)集描述

    4.2 評價指標(biāo)

    由于在實驗中使用的數(shù)據(jù)集已經(jīng)有了類別標(biāo)簽,因此選擇外部質(zhì)量評價準(zhǔn)則進行評價,直接將聚類標(biāo)簽與實際標(biāo)簽進行比較。本實驗選擇標(biāo)準(zhǔn)互信息(Normalized Mutual information,NMI)和蘭德指數(shù)(Rand Index,RI)兩個常用聚類評價指標(biāo)對聚類結(jié)果進行評價。

    (1)標(biāo)準(zhǔn)互信息

    其中,X為實際類別信息,Y為聚類結(jié)果信息,MI是互信息,H是信息熵,NMI越大,表明聚類效果與真實情況越吻合。

    (2)蘭德指數(shù)

    其中,X和Y分別是實際類別信息和聚類結(jié)果信息,n1表示在X與Y中均屬于同一類的數(shù)據(jù)對個數(shù),n2表示在X與Y中均不屬于同一類的數(shù)據(jù)對個數(shù)。n為數(shù)據(jù)集中對象個數(shù),表示集合中能夠形成的數(shù)據(jù)對的總個數(shù)。蘭德指數(shù)越大,聚類效果越接近真實結(jié)果。

    4.3 實驗及結(jié)果分析

    4.3.1 實驗設(shè)計

    實驗環(huán)境為Windows 10 操作系統(tǒng),CPU處理器為Intel Core i5 8250U,內(nèi)存8 GB,編程工具為Matlab R2015a。

    為檢驗CABOSFV_D 算法的聚類性能,選取傳統(tǒng)CABOSFV 算法進行對比實驗。實驗中CABOSFV_D和CABOSFV需要預(yù)先設(shè)置差異度閾值,給定閾值范圍b={0.125,0.25,0.375,…,2.875,3} ;CABOSFV_D 需要預(yù)先設(shè)置差異度調(diào)整指數(shù)p,給定范圍p={1,2,…,10} 。對數(shù)據(jù)進行隨機排序,分別使用傳統(tǒng)CABOSFV 算法和CABOSFV_D 算法對數(shù)據(jù)聚類,記為一組實驗。分別在六個數(shù)據(jù)集上進行100 組重復(fù)實驗以消除算法隨機性,每組實驗取參數(shù)b和p最佳情況下的聚類結(jié)果,然后將這100 組最優(yōu)聚類結(jié)果的平均值作為最終聚類結(jié)果。

    4.3.2 結(jié)果分析

    利用Matlab 實現(xiàn)兩種算法在UCI 數(shù)據(jù)集上的聚類實驗,獲得了算法在六個數(shù)據(jù)集上聚類結(jié)果的RI 和NMI評價指標(biāo),如表3和表4所示。圖1和圖2是聚類結(jié)果的評價指標(biāo)對比圖,從中可以看出,當(dāng)算法以拓展的稀疏差異度公式進行聚類時,六個數(shù)據(jù)集的聚類結(jié)果的NMI和RI指標(biāo)值都得到了提高,其中AS數(shù)據(jù)集上聚類評價指標(biāo)值的提升最為明顯。外部評價指標(biāo)NMI和RI代表著聚類結(jié)果和真實結(jié)果的吻合程度,NMI和RI的值越大說明聚類越準(zhǔn)確,因此可以證明CABOSFV_D算法的聚類準(zhǔn)確性要高于CABOSFV算法。鑒于CABOSFV_D的位集實現(xiàn)方式只對算法的運算效率產(chǎn)生影響,因此聚類準(zhǔn)確性的提高主要是由于拓展的稀疏差異度調(diào)整了公式中分母的變化幅度。

    表3 兩種算法聚類結(jié)果的NMI指標(biāo)

    表4 兩種算法聚類結(jié)果的RI指標(biāo)

    圖1 聚類結(jié)果的NMI指標(biāo)對比圖

    圖2 聚類結(jié)果的RI指標(biāo)對比圖

    在實驗中還記錄了各個算法運行所需時間,采用平均運行時間(Average Time,AT)來衡量算法的時間效率。平均運行時間計算方式如公式(9)所示:

    其中,ti表示算法第i次運行所需時間,n表示算法運行的次數(shù)。

    表5顯示了原始CABOSFV算法和CABOSFV_D算法在六個數(shù)據(jù)集上的平均運行時間。其中CABOSFV_D算法使用位集的實現(xiàn)方法進行聚類,在六個數(shù)據(jù)集上的平均運行時間相比原始算法分別減少了80.06%、87.89%、70.02%、90.08%、87.85%、93.70%。

    表5 兩種算法運行時間比較

    綜合以上實驗結(jié)果,CABOSFV_D算法的聚類結(jié)果要優(yōu)于傳統(tǒng)CABOSFV算法,且時間成本遠(yuǎn)遠(yuǎn)低于原始的聚類實現(xiàn)方式。因此可以證明CABOSFV_D 和傳統(tǒng)CABOSFV相比具有更好的聚類性能,在保證且進一步提高算法效率的同時獲得了更高的聚類質(zhì)量。

    4.3.3 差異度調(diào)整指數(shù) p 分析

    CABOSFV_D 算法引入指數(shù)p拓展了集合的稀疏差異度,指數(shù)p影響著稀疏差異度分母的調(diào)整幅度,進而影響算法聚類質(zhì)量,因此選取合適的p對算法至關(guān)重要。不同數(shù)據(jù)集100 組隨機實驗的最優(yōu)指數(shù)p的分布呈現(xiàn)出了不同的規(guī)律。圖3 顯示了在六個數(shù)據(jù)集上最優(yōu)指數(shù)p的分布,其中ZO、SS、LYM、DER 四個數(shù)據(jù)集的分布較為類似,它們的最優(yōu)p值為2的次數(shù)在總實驗次數(shù)中占比最高。LYM 的最優(yōu)p值集中分布在[1,4],在100 次實驗中占比100%。DER 的最優(yōu)p值集中分布在[2,3],在總實驗次數(shù)中占比99%。ZO最優(yōu)p值集中分布在[1,4],在100次實驗中占比97%。SS數(shù)據(jù)集上最優(yōu)p值的分布相對分散,主要集中在[1,4],在實驗中占比74%。AS 數(shù)據(jù)集在p=4 時取得最優(yōu)值的次數(shù)最多,其最優(yōu)p值分布也相對分散,主要集中于[2,4],在實驗中占比57%。對于VO數(shù)據(jù)集,p=1時取得最佳結(jié)果的次數(shù)最多,最優(yōu)p值集中在[1,2],在總實驗次數(shù)中占比97%。

    圖3 六個數(shù)據(jù)集上的最優(yōu)p 值分布

    由上述分析可知,同一數(shù)據(jù)集的最優(yōu)p值分布相對集中,對于不同數(shù)據(jù)集,最優(yōu)p值的分布略有差異,但多集中于[1,4]的范圍內(nèi),在實際應(yīng)用中可在此范圍中選擇合適的p值。

    4.3.4 閾值b 確定方法

    閾值b是集合差異度上限,在本實驗中為了檢驗所提算法的性能采用帶有外部類標(biāo)簽信息的標(biāo)準(zhǔn)數(shù)據(jù)集,通過比較不同參數(shù)下聚類結(jié)果的外部評價指標(biāo)選取合適的b值。然而實際聚類應(yīng)用中的數(shù)據(jù)通常沒有類標(biāo)簽,此時可利用內(nèi)部評價指標(biāo)來確定b。CVTAB[23]是一種二值數(shù)據(jù)內(nèi)部評價指標(biāo),CVTAB取值越大,表明類間差異度越大,聚類效果越好。利用CVTAB 確定閾值b的具體步驟如下:

    輸入:數(shù)據(jù)集data,b可選取值{b1,b2,…,bz} ,其中bi∈[0.125,3],i∈{1,2,…,z},調(diào)整指數(shù)p。

    輸出:最佳b值。

    (1)將 (b1,p,data)輸入CABOSFV_D 中,得到數(shù)據(jù)集data的一個劃分π1。

    (2)計算劃分π1的內(nèi)部有效性評價指標(biāo)CVTAB1。

    (3)對于bi,i∈{2,3,…,z} ,重復(fù)步驟(1)、(2)的操作,得到對應(yīng)的CVTABi。

    (4)尋 找z0使 得CVTABz0=max(CVTABi), i∈{1,2,…,z}。

    (5)輸出最佳b值:bz0。

    5 結(jié)束語

    針對CABOSFV 算法在聚類過程中數(shù)據(jù)對象更易被分配到較大的類中這一問題提出CABOSFV_D 算法。該算法對稀疏差異度度量方式進行了拓展,引入差異度調(diào)整指數(shù)p,從而緩和稀疏差異度公式中對象個數(shù)的影響,使對象分配更加準(zhǔn)確合理。在此基礎(chǔ)上,結(jié)合位集具有運算速度快這一優(yōu)勢,將二態(tài)數(shù)據(jù)對象和稀疏差異度都用位集存儲和表示,提高算法處理大規(guī)模數(shù)據(jù)時的運算效率。在六個UCI 標(biāo)準(zhǔn)數(shù)據(jù)集上進行實驗,結(jié)果表明CABOSFV_D獲得了比CABOSFV更好的聚類結(jié)果,且時間效率明顯提高,更能適用于數(shù)據(jù)規(guī)模較大的實際應(yīng)用場景。最后基于實驗結(jié)果討論了選取調(diào)整指數(shù)p的參考范圍,并給出了確定差異度上限b的方法。

    猜你喜歡
    高維個數(shù)聚類
    怎樣數(shù)出小正方體的個數(shù)
    等腰三角形個數(shù)探索
    怎樣數(shù)出小木塊的個數(shù)
    一種改進的GP-CLIQUE自適應(yīng)高維子空間聚類算法
    怎樣數(shù)出小正方體的個數(shù)
    基于DBSACN聚類算法的XML文檔聚類
    電子測試(2017年15期)2017-12-18 07:19:27
    基于加權(quán)自學(xué)習(xí)散列的高維數(shù)據(jù)最近鄰查詢算法
    基于改進的遺傳算法的模糊聚類算法
    一般非齊次非線性擴散方程的等價變換和高維不變子空間
    一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
    成年人黄色毛片网站| 狠狠婷婷综合久久久久久88av| 久久国产精品男人的天堂亚洲| 97精品久久久久久久久久精品| 啦啦啦在线免费观看视频4| 少妇人妻久久综合中文| 老鸭窝网址在线观看| 夫妻性生交免费视频一级片| 精品国产一区二区三区四区第35| 中文乱码字字幕精品一区二区三区| 国产人伦9x9x在线观看| 久久精品久久久久久噜噜老黄| 欧美激情极品国产一区二区三区| 国产亚洲精品第一综合不卡| 亚洲中文字幕日韩| 亚洲成人手机| 亚洲欧洲精品一区二区精品久久久| 亚洲成国产人片在线观看| 男女边摸边吃奶| 最近中文字幕2019免费版| 日韩欧美一区视频在线观看| 又紧又爽又黄一区二区| 91精品伊人久久大香线蕉| 亚洲精品国产色婷婷电影| 777米奇影视久久| 一区在线观看完整版| 香蕉丝袜av| 深夜精品福利| 成年av动漫网址| 蜜桃国产av成人99| 一边摸一边抽搐一进一出视频| 真人做人爱边吃奶动态| xxxhd国产人妻xxx| 久久青草综合色| 久久国产亚洲av麻豆专区| 一区二区三区乱码不卡18| 亚洲欧美日韩另类电影网站| 亚洲专区国产一区二区| 我要看黄色一级片免费的| 午夜免费鲁丝| 91麻豆av在线| 一区二区av电影网| 日韩一本色道免费dvd| 亚洲成色77777| 天天躁狠狠躁夜夜躁狠狠躁| 美女视频免费永久观看网站| 亚洲第一av免费看| 男男h啪啪无遮挡| 青春草亚洲视频在线观看| av网站在线播放免费| 久久久久国产一级毛片高清牌| 亚洲人成电影观看| 精品国产乱码久久久久久男人| 大香蕉久久网| 亚洲第一青青草原| 久久国产精品男人的天堂亚洲| 国产精品久久久av美女十八| 97在线人人人人妻| 丰满饥渴人妻一区二区三| 老司机在亚洲福利影院| 日本欧美国产在线视频| 真人做人爱边吃奶动态| 欧美日韩视频高清一区二区三区二| 国产成人啪精品午夜网站| cao死你这个sao货| 高清视频免费观看一区二区| 欧美激情 高清一区二区三区| 男女午夜视频在线观看| 三上悠亚av全集在线观看| 美女视频免费永久观看网站| 国产无遮挡羞羞视频在线观看| 老司机影院成人| a级毛片黄视频| 久久国产精品影院| 欧美乱码精品一区二区三区| 午夜日韩欧美国产| 亚洲国产最新在线播放| 青青草视频在线视频观看| 777米奇影视久久| 国产精品秋霞免费鲁丝片| 亚洲精品久久久久久婷婷小说| 最近最新中文字幕大全免费视频 | 欧美精品人与动牲交sv欧美| 国产有黄有色有爽视频| 黄频高清免费视频| 亚洲中文av在线| 亚洲国产精品999| 99re6热这里在线精品视频| www.999成人在线观看| 男女无遮挡免费网站观看| 国产又爽黄色视频| 久久精品熟女亚洲av麻豆精品| av欧美777| av欧美777| kizo精华| 尾随美女入室| kizo精华| 黄片小视频在线播放| 国产主播在线观看一区二区 | 国产黄频视频在线观看| 亚洲九九香蕉| 老汉色av国产亚洲站长工具| 一本一本久久a久久精品综合妖精| 精品一品国产午夜福利视频| 男女无遮挡免费网站观看| 少妇精品久久久久久久| 人人妻,人人澡人人爽秒播 | tube8黄色片| www.自偷自拍.com| 国产深夜福利视频在线观看| 久久久久久久大尺度免费视频| 另类精品久久| 啦啦啦啦在线视频资源| 午夜两性在线视频| 蜜桃国产av成人99| 精品人妻一区二区三区麻豆| 黑人巨大精品欧美一区二区蜜桃| 乱人伦中国视频| 纯流量卡能插随身wifi吗| 国产在线一区二区三区精| 日韩电影二区| 国产一卡二卡三卡精品| 一二三四社区在线视频社区8| 黄色一级大片看看| 久久人妻福利社区极品人妻图片 | 欧美精品av麻豆av| 国产精品 欧美亚洲| 中国国产av一级| 免费一级毛片在线播放高清视频 | 成人国语在线视频| 大码成人一级视频| 欧美日韩亚洲国产一区二区在线观看 | 国产亚洲av高清不卡| 亚洲国产精品成人久久小说| 老司机在亚洲福利影院| 97精品久久久久久久久久精品| 秋霞在线观看毛片| 欧美成人午夜精品| 婷婷色av中文字幕| 中文字幕制服av| 亚洲 国产 在线| 涩涩av久久男人的天堂| 青春草视频在线免费观看| 18禁国产床啪视频网站| 国产成人一区二区在线| 亚洲人成77777在线视频| 久久人妻熟女aⅴ| 精品国产一区二区三区久久久樱花| 岛国毛片在线播放| 久久久久精品人妻al黑| 日韩熟女老妇一区二区性免费视频| 香蕉丝袜av| 视频在线观看一区二区三区| 如日韩欧美国产精品一区二区三区| 日本午夜av视频| 亚洲欧美成人综合另类久久久| 亚洲一区二区三区欧美精品| 免费观看av网站的网址| 少妇裸体淫交视频免费看高清 | 91老司机精品| 色播在线永久视频| 国产精品熟女久久久久浪| 精品少妇内射三级| av电影中文网址| 亚洲国产精品成人久久小说| 久久国产精品影院| 欧美+亚洲+日韩+国产| 赤兔流量卡办理| 大香蕉久久网| 天天躁夜夜躁狠狠久久av| 国产国语露脸激情在线看| xxx大片免费视频| 青春草亚洲视频在线观看| 精品国产国语对白av| 久久人人爽人人片av| 国产成人欧美| 一区福利在线观看| 国产欧美亚洲国产| 永久免费av网站大全| 午夜av观看不卡| 亚洲国产欧美在线一区| 国产日韩一区二区三区精品不卡| 国产成人av激情在线播放| av电影中文网址| 亚洲欧美精品综合一区二区三区| 极品少妇高潮喷水抽搐| 精品人妻熟女毛片av久久网站| 国产成人精品无人区| 国产激情久久老熟女| 在线 av 中文字幕| 亚洲成人免费av在线播放| 国产免费现黄频在线看| 大型av网站在线播放| 亚洲天堂av无毛| 首页视频小说图片口味搜索 | 午夜免费成人在线视频| 国产欧美日韩一区二区三 | a 毛片基地| 亚洲欧美激情在线| 亚洲欧美日韩另类电影网站| 国产深夜福利视频在线观看| 搡老岳熟女国产| 黄片小视频在线播放| 国产成人精品在线电影| 亚洲国产精品一区二区三区在线| 国产精品国产三级专区第一集| 美女主播在线视频| av网站在线播放免费| 夫妻午夜视频| av国产精品久久久久影院| 男人爽女人下面视频在线观看| 97精品久久久久久久久久精品| 久久久久久久大尺度免费视频| 国产又爽黄色视频| 国产成人一区二区在线| 男女之事视频高清在线观看 | 久久这里只有精品19| 在线av久久热| 制服人妻中文乱码| 欧美日韩国产mv在线观看视频| 久久久久久免费高清国产稀缺| 在线观看一区二区三区激情| 亚洲精品一二三| 国产精品偷伦视频观看了| 久久性视频一级片| 少妇的丰满在线观看| 国产99久久九九免费精品| 日韩 亚洲 欧美在线| 中文字幕亚洲精品专区| 在线观看免费视频网站a站| 女人久久www免费人成看片| 这个男人来自地球电影免费观看| 人人妻人人澡人人看| 美女扒开内裤让男人捅视频| 欧美大码av| 久久精品亚洲熟妇少妇任你| 每晚都被弄得嗷嗷叫到高潮| 欧美在线黄色| av有码第一页| 亚洲一区二区三区欧美精品| 日本vs欧美在线观看视频| 一级毛片女人18水好多 | 国产一区二区激情短视频 | 亚洲精品美女久久av网站| 精品免费久久久久久久清纯 | 久久久久久久久久久久大奶| 一区二区av电影网| 成人18禁高潮啪啪吃奶动态图| 9191精品国产免费久久| 99热全是精品| 黄色 视频免费看| 亚洲av在线观看美女高潮| 国产91精品成人一区二区三区 | 国产高清国产精品国产三级| 天天躁日日躁夜夜躁夜夜| 每晚都被弄得嗷嗷叫到高潮| 日韩电影二区| 老司机影院毛片| 亚洲五月婷婷丁香| 亚洲国产欧美在线一区| 午夜91福利影院| 久久精品久久久久久久性| 一个人免费看片子| 欧美日本中文国产一区发布| 99国产精品一区二区蜜桃av | 色婷婷av一区二区三区视频| 我的亚洲天堂| 亚洲欧美一区二区三区国产| 亚洲伊人色综图| 欧美激情 高清一区二区三区| 亚洲国产欧美一区二区综合| 亚洲成国产人片在线观看| 青青草视频在线视频观看| netflix在线观看网站| 又紧又爽又黄一区二区| 国产精品麻豆人妻色哟哟久久| 深夜精品福利| 国产成人精品无人区| 国产成人免费观看mmmm| 99国产精品99久久久久| 啦啦啦啦在线视频资源| 日韩 欧美 亚洲 中文字幕| 波野结衣二区三区在线| 男女边摸边吃奶| 国产精品亚洲av一区麻豆| 一区二区三区四区激情视频| 国产精品久久久久久精品电影小说| 亚洲 国产 在线| 91麻豆精品激情在线观看国产 | 日本av手机在线免费观看| 老司机在亚洲福利影院| 天天影视国产精品| 国产高清不卡午夜福利| 别揉我奶头~嗯~啊~动态视频 | 国产精品一区二区在线不卡| 亚洲午夜精品一区,二区,三区| 亚洲成人免费av在线播放| 亚洲av电影在线进入| 69精品国产乱码久久久| 国产精品一区二区在线不卡| 欧美日韩av久久| 欧美97在线视频| 岛国毛片在线播放| 国产黄频视频在线观看| 欧美另类一区| 女性被躁到高潮视频| 精品亚洲乱码少妇综合久久| 在线精品无人区一区二区三| 日韩大码丰满熟妇| √禁漫天堂资源中文www| a级毛片黄视频| 亚洲国产看品久久| 久久人妻熟女aⅴ| 在线av久久热| 老司机深夜福利视频在线观看 | 欧美日韩黄片免| 国产av一区二区精品久久| 久久女婷五月综合色啪小说| 欧美人与性动交α欧美精品济南到| svipshipincom国产片| 免费在线观看视频国产中文字幕亚洲 | 国产成人一区二区三区免费视频网站 | 最新在线观看一区二区三区 | 欧美亚洲日本最大视频资源| 99re6热这里在线精品视频| 超色免费av| 日韩伦理黄色片| 50天的宝宝边吃奶边哭怎么回事| 狂野欧美激情性bbbbbb| 在线观看一区二区三区激情| 精品久久久久久久毛片微露脸 | 成人免费观看视频高清| 又大又黄又爽视频免费| 50天的宝宝边吃奶边哭怎么回事| 久久人人爽人人片av| 亚洲视频免费观看视频| 日韩av不卡免费在线播放| 男女高潮啪啪啪动态图| 亚洲欧美清纯卡通| 新久久久久国产一级毛片| 欧美激情高清一区二区三区| 菩萨蛮人人尽说江南好唐韦庄| 亚洲色图综合在线观看| 在线观看www视频免费| 18禁国产床啪视频网站| 国产成人影院久久av| 欧美另类一区| 水蜜桃什么品种好| 国产免费又黄又爽又色| 少妇裸体淫交视频免费看高清 | 超色免费av| 在线观看国产h片| 国产精品99久久99久久久不卡| 1024香蕉在线观看| 亚洲精品久久久久久婷婷小说| 欧美另类一区| 亚洲专区国产一区二区| 亚洲视频免费观看视频| 日本av免费视频播放| 啦啦啦中文免费视频观看日本| 少妇粗大呻吟视频| 一二三四社区在线视频社区8| 波多野结衣一区麻豆| 久久久久久久精品精品| 亚洲精品中文字幕在线视频| 国产一区二区激情短视频 | 又大又爽又粗| 激情五月婷婷亚洲| 国产日韩欧美视频二区| 在线精品无人区一区二区三| 国产成人av教育| av电影中文网址| 国产免费又黄又爽又色| 天天操日日干夜夜撸| 国产精品免费大片| 国产男女超爽视频在线观看| 午夜福利免费观看在线| 亚洲av成人精品一二三区| av不卡在线播放| 国产精品香港三级国产av潘金莲 | 国产成人免费无遮挡视频| 久久精品国产a三级三级三级| 99国产综合亚洲精品| 自拍欧美九色日韩亚洲蝌蚪91| 曰老女人黄片| 午夜免费男女啪啪视频观看| 欧美亚洲 丝袜 人妻 在线| 日日摸夜夜添夜夜添小说| 亚洲精品一区av在线观看| 精品国产乱码久久久久久男人| 成年女人毛片免费观看观看9| 两性午夜刺激爽爽歪歪视频在线观看 | 两个人看的免费小视频| 老熟妇仑乱视频hdxx| 制服丝袜大香蕉在线| 欧美国产日韩亚洲一区| 亚洲中文字幕一区二区三区有码在线看 | 99国产精品一区二区蜜桃av| 最新在线观看一区二区三区| 久久久久国产精品人妻aⅴ院| av在线播放免费不卡| 18美女黄网站色大片免费观看| 精品久久久久久久久久免费视频| 欧美一区二区精品小视频在线| 国产一区二区激情短视频| 女警被强在线播放| 9191精品国产免费久久| 亚洲真实伦在线观看| 欧美zozozo另类| 老司机福利观看| 国产精品1区2区在线观看.| 久久婷婷人人爽人人干人人爱| 欧美激情高清一区二区三区| 色av中文字幕| 一级黄色大片毛片| 99在线人妻在线中文字幕| 久久久精品国产亚洲av高清涩受| 成人永久免费在线观看视频| 丁香欧美五月| 午夜精品在线福利| 韩国av一区二区三区四区| 国产又色又爽无遮挡免费看| 一区二区三区精品91| 亚洲午夜精品一区,二区,三区| 天堂√8在线中文| 老司机福利观看| 亚洲电影在线观看av| 在线天堂中文资源库| 亚洲成a人片在线一区二区| 在线十欧美十亚洲十日本专区| 丰满的人妻完整版| 人人妻人人澡人人看| 亚洲va日本ⅴa欧美va伊人久久| 国产成人系列免费观看| 男女视频在线观看网站免费 | 午夜久久久久精精品| 99久久久亚洲精品蜜臀av| 视频区欧美日本亚洲| www国产在线视频色| 手机成人av网站| 国产一卡二卡三卡精品| 久久香蕉激情| 亚洲中文日韩欧美视频| 男人舔奶头视频| 免费看美女性在线毛片视频| 精品久久久久久久久久久久久 | 久久99热这里只有精品18| 女警被强在线播放| 又黄又粗又硬又大视频| 亚洲激情在线av| 久99久视频精品免费| 看免费av毛片| 欧美日韩瑟瑟在线播放| 天堂√8在线中文| 亚洲免费av在线视频| 国产精品国产高清国产av| 美女高潮喷水抽搐中文字幕| 亚洲成国产人片在线观看| 亚洲五月色婷婷综合| 国内毛片毛片毛片毛片毛片| 亚洲国产精品久久男人天堂| 国产成人欧美| 精品久久久久久久毛片微露脸| 国产久久久一区二区三区| 精品一区二区三区视频在线观看免费| 19禁男女啪啪无遮挡网站| 一卡2卡三卡四卡精品乱码亚洲| 一进一出抽搐gif免费好疼| 亚洲欧美一区二区三区黑人| 两个人看的免费小视频| 久久人人精品亚洲av| 色精品久久人妻99蜜桃| 国产1区2区3区精品| 午夜福利欧美成人| 热99re8久久精品国产| 一级黄色大片毛片| 中文字幕另类日韩欧美亚洲嫩草| 久久久久精品国产欧美久久久| 午夜免费成人在线视频| 一区二区三区精品91| 不卡av一区二区三区| 亚洲精品美女久久av网站| 99热这里只有精品一区 | 午夜免费观看网址| 99热6这里只有精品| 国产精品1区2区在线观看.| 亚洲狠狠婷婷综合久久图片| 级片在线观看| 免费看a级黄色片| a在线观看视频网站| 不卡av一区二区三区| 久久久国产精品麻豆| 天堂影院成人在线观看| 搡老岳熟女国产| 一级作爱视频免费观看| 成人国产综合亚洲| or卡值多少钱| 制服人妻中文乱码| 色婷婷久久久亚洲欧美| 国产av在哪里看| 欧美成人一区二区免费高清观看 | 哪里可以看免费的av片| 色av中文字幕| 久久久久亚洲av毛片大全| 这个男人来自地球电影免费观看| 女性被躁到高潮视频| 国产一区二区在线av高清观看| 国产片内射在线| 美女午夜性视频免费| bbb黄色大片| 亚洲精品国产区一区二| 免费人成视频x8x8入口观看| 精品久久久久久久人妻蜜臀av| 国产精品二区激情视频| 高清在线国产一区| 啦啦啦免费观看视频1| 97超级碰碰碰精品色视频在线观看| 久久婷婷成人综合色麻豆| 欧美黑人巨大hd| 欧美绝顶高潮抽搐喷水| 亚洲av日韩精品久久久久久密| 日韩欧美国产在线观看| 美女免费视频网站| xxxwww97欧美| 久久久久久人人人人人| 十八禁人妻一区二区| 亚洲国产精品合色在线| 亚洲狠狠婷婷综合久久图片| 久久 成人 亚洲| 国产91精品成人一区二区三区| 老司机福利观看| 国产男靠女视频免费网站| 亚洲人成电影免费在线| 一区二区三区激情视频| 中亚洲国语对白在线视频| 老熟妇乱子伦视频在线观看| 亚洲av电影在线进入| 免费一级毛片在线播放高清视频| 久久久久久久久久黄片| 国产精品 欧美亚洲| 午夜a级毛片| 色综合欧美亚洲国产小说| 在线视频色国产色| 很黄的视频免费| ponron亚洲| 国产真实乱freesex| 在线观看www视频免费| 亚洲精品久久国产高清桃花| 成人国产综合亚洲| 男女之事视频高清在线观看| 国产亚洲精品av在线| 成人免费观看视频高清| 国产99久久九九免费精品| 宅男免费午夜| 亚洲欧洲精品一区二区精品久久久| 99re在线观看精品视频| 可以免费在线观看a视频的电影网站| 国产精品影院久久| 欧美日韩福利视频一区二区| 亚洲精品一卡2卡三卡4卡5卡| 夜夜爽天天搞| 又黄又爽又免费观看的视频| 精品免费久久久久久久清纯| 国产伦一二天堂av在线观看| 嫩草影院精品99| 亚洲国产欧美网| 久久久国产精品麻豆| 午夜日韩欧美国产| 国产精品九九99| 亚洲精品av麻豆狂野| 天堂√8在线中文| xxx96com| 久久久久久久久久黄片| 中文字幕最新亚洲高清| 男女做爰动态图高潮gif福利片| √禁漫天堂资源中文www| 日韩 欧美 亚洲 中文字幕| 精品日产1卡2卡| 在线观看一区二区三区| 中出人妻视频一区二区| 日韩成人在线观看一区二区三区| 在线看三级毛片| 国产av在哪里看| e午夜精品久久久久久久| 在线观看www视频免费| 日本 欧美在线| 少妇 在线观看| 高清毛片免费观看视频网站| 曰老女人黄片| 国产精品久久久久久人妻精品电影| 国产黄片美女视频| 亚洲精华国产精华精| 日本成人三级电影网站| 一本久久中文字幕| 国产99白浆流出| 一本久久中文字幕| 久久久久久免费高清国产稀缺| 亚洲成av人片免费观看| 老汉色∧v一级毛片| 国产熟女午夜一区二区三区| 每晚都被弄得嗷嗷叫到高潮| 国产国语露脸激情在线看| 久久欧美精品欧美久久欧美| x7x7x7水蜜桃| 波多野结衣av一区二区av| 色av中文字幕| 精品国产美女av久久久久小说| 天堂影院成人在线观看| 91麻豆精品激情在线观看国产| 久久午夜综合久久蜜桃| 精品乱码久久久久久99久播| 亚洲欧美日韩高清在线视频| 久久久国产精品麻豆| 女人爽到高潮嗷嗷叫在线视频| 一夜夜www|