• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于密度峰值多起始中心的融合聚類算法

    2021-11-26 07:21:40魏圓圓許桃勝
    計算機工程與應(yīng)用 2021年22期

    梅 婕,魏圓圓,許桃勝

    1.中國科學(xué)院 合肥物質(zhì)科學(xué)研究院 智能機械研究所,合肥230031

    2.中國科學(xué)技術(shù)大學(xué),合肥230026

    3.安徽省智慧農(nóng)業(yè)工程實驗室,合肥230031

    聚類分析(Clustering Analysis)[1-5]是數(shù)據(jù)分析和信息挖掘的一種重要研究方法。在樣本沒有給定類別信息的情況下,聚類分析基于樣本特征的相似性計算,確定樣本的分組,同一分組的樣本具有高度的相似性,而來自不同分組的樣本之間相異度高。聚類分析方法一般需要確定聚類起始中心,進(jìn)而迭代優(yōu)化獲得聚類結(jié)果。根據(jù)聚類算法的目標(biāo)函數(shù)不同,概括有如下的聚類起始中心的定義方法:

    (1)隨機設(shè)定聚類起始中心[4,6],迭代尋找簇的劃分使得目標(biāo)函數(shù)得到最優(yōu)解。典型算法如K-Means[7]。KMeans算法首先隨機選取K個聚類中心點,計算每個樣本到K個聚類中心點的距離,將樣本劃分到距離其最近的中心點所代表的類別,然后基于目標(biāo)函數(shù)動態(tài)調(diào)整K個聚類中心點,迭代上述過程直至目標(biāo)函數(shù)(即簇內(nèi)距離平方和)最小。K-Means 算法采用樣本空間距離最近的劃分原則,因此不適用于非球型數(shù)據(jù)(如具有空間折疊結(jié)構(gòu)的流型數(shù)據(jù))的聚類問題。

    (2)針對不規(guī)則形狀的數(shù)據(jù)集,根據(jù)密度中心點[8-10]定義聚類簇中心。DBSCAN[11]是一種基于密度的聚類算法,通過將簇定義為密度相連的點的最大集合,能夠?qū)⒏呙芏葏^(qū)域劃分為簇,并可在噪聲數(shù)據(jù)中發(fā)現(xiàn)任意形狀的聚類。在密度聚類方法基礎(chǔ)上,Rodriguez 等提出一種基于密度峰值的聚類算法(Density Peaks Clustering,DPC)[12],聚類中心點的定義是具有較高局部密度且與比它密度大的點持有較大距離。該算法計算出每個數(shù)據(jù)點對應(yīng)的局部密度ρ和距離δ,將其分別作為橫、縱坐標(biāo)構(gòu)建出“決策圖(Decision Graph)”,可在一定程度上幫助確定聚類簇中心。

    (3)基于概率密度分布[13-14]定義聚類起始中心。假設(shè)數(shù)據(jù)集內(nèi)不同的簇符合不同的概率密度分布,所有樣本點收斂于局部密度最大值,最終收斂到相同局部最大值的點被判定為屬于同一簇。此類算法適用于非球型數(shù)據(jù)集,但是計算成本較高,其中較為代表性的聚類算法是Mean Shift算法[15]。

    K-Means作為聚類分析的代表性方法,具有廣泛的引用,其聚類的初始中心通過隨機選取產(chǎn)生,因此KMeans不能保證每次得到一致的聚類結(jié)果。另外,若隨機的初始中心點偏離數(shù)據(jù)區(qū)域過遠(yuǎn),則可能導(dǎo)致該中心點被孤立,沒有樣本會被劃分到該中心點,出現(xiàn)dead-unit[16]問題。同時,K-Means 算法傾向于將數(shù)據(jù)分為相對均衡的簇,這一現(xiàn)象稱為均勻效應(yīng)(Uniform Effect)[17-18],因此對于一些存在由大子集和小子集組成的非均衡數(shù)據(jù)集,采用K-Means 聚類可能導(dǎo)致較多的聚類錯誤。針對上述問題,許多學(xué)者提出一系列K-Means-type 改進(jìn)算法[19-21]。其中,F(xiàn)SCL算法[16]將獲勝頻率作為權(quán)重加入到距離的計算中,使得獲勝次數(shù)較少的中心點具有更大的概率去贏得新的樣本,避免dead-unit 問題。此外,Liang 等人提出一種基于模糊與多聚類簇中心(Multi-Prototypes)機制的算法來避免均勻效應(yīng)。每個prototype代表一個聚類簇的中心點,將數(shù)量確定的prototypes 定位到合適的數(shù)據(jù)區(qū)域,使得大樣本集由更多的prototypes表示,小樣本集由較少的prototypes表示,最后按一定規(guī)則合并相近的prototypes得到最終的聚類結(jié)果。然而該算法不能實現(xiàn)聚類數(shù)的自動收斂,需要預(yù)先設(shè)定聚類的目標(biāo)數(shù)目。

    2019 年Lu 等人提出一種針對非均衡數(shù)據(jù)集的自適應(yīng)算法SMCL(Self-adaptive Multiprototype-based Competitive Learning)[22]。該算法基于Multi-Prototypes思想,在經(jīng)典K-Means 算法的基礎(chǔ)上運用競爭懲罰機制和自適應(yīng)策略來確定初始聚類中心(PNS子算法),隨后根據(jù)一定規(guī)則融合prototypes代表的各個子簇得到最終聚類結(jié)果。其中,PNS算法以少量的prototypes開始,逐漸自適應(yīng)地增加prototypes數(shù)量,在此過程中prototypes的位置不斷改變,直至某一個prototype根據(jù)競爭懲罰機制被淘汰。但是,SMCL 算法在自適應(yīng)調(diào)整prototypes的過程中,初始聚類中心可能被定位到兩個子簇的中間區(qū)域,造成均勻效應(yīng)。另外,SMCL 算法由于動態(tài)自適應(yīng)性導(dǎo)致算法效率低下,不適合大型數(shù)據(jù)集的聚類分析,且隨著prototypes數(shù)量的增加,每個prototype獲勝次數(shù)急劇減少,無法避免PNS子算法非正常終止問題。

    本文針對SMCL算法存在的問題,結(jié)合密度峰值的聚類思想,提出基于多起始中心(Multi-Prototypes)的聚類算法DP-SMCL(Density Peak-SMCL)。DP-SMCL借助Multi-Prototypes思想和SMCL子簇融合機制,通過局部密度ρ和距離δ計算篩選出密度峰值大的樣本點作為prototypes,能夠有效解決dead-unit問題,并且使算法效率得到顯著提高。另外,實驗使用聚類評價指標(biāo)蘭德指數(shù)(RI)和正確率(Accuracy)等對模擬數(shù)據(jù)集和真實數(shù)據(jù)集(來自UCI 數(shù)據(jù)庫)的聚類結(jié)果進(jìn)行對比分析。實驗結(jié)果表明,DP-SMCL算法可實現(xiàn)對非球型數(shù)據(jù)集的聚類分析且聚類結(jié)果優(yōu)于K-Means、DBSCAN和SMCL等經(jīng)典聚類算法。

    1 DP-SMCL聚類算法

    DP-SMCL 算法基于Multi-Prototypes 機制,首先根據(jù)所有樣本的密度峰值預(yù)選出初始聚類中心(prototypes),prototypes 的數(shù)目根據(jù)經(jīng)驗值設(shè)定(見2.2 節(jié))。然后采用1-D 高斯混合概率密度函數(shù)[22]檢測各prototype 子簇間相連區(qū)域的密度,將相連區(qū)域密度值大的子簇優(yōu)先合并,合并過程中根據(jù)設(shè)定的指標(biāo)判斷聚類情況,選出最佳聚類數(shù)目,從而獲得精確的聚類結(jié)果。

    1.1 確定初始聚類中心

    一個樣本被設(shè)定為prototype應(yīng)具備以下條件:(1)該樣本本身的密度較大,即它的周圍都是密度比它小的鄰居;(2)與其他密度值更大的樣本具有較遠(yuǎn)的距離。

    定義1(局部密度)假設(shè)數(shù)據(jù)集為E={x1,}x2,…,xN,樣本點xi的局部密度的定義如下:

    其中,E{xi} 表示除xi外的所有樣本點,d(xi,xj)代表樣本xi和樣本xj之間的歐式距離,dc表示截斷距離[12],N為樣本數(shù)。dc的選取原則是使每個樣本點的平均鄰居個數(shù)約為樣本點總數(shù)的1%~2%(用t表示該比例)。所有樣本兩兩之間的距離構(gòu)成的距離集合D共有項,按照升序關(guān)系進(jìn)行排序,D表示為{d1,d2,…,dk,…,dM},其中dc∈D,且c=M×t。

    定義2(距離δi[12])對所有樣本的局部密度進(jìn)行降序排列,然后基于聚類中心的特點,在密度大于ρi的所有樣本點中選擇與xi距離最近的點,兩者之間距離作為xi的δi。

    特別的,若ρi對應(yīng)最大的局部密度,則

    根據(jù)聚類起始中心的選取原則,樣本點xi的局部密度和距離越大,則越可能作為潛在的聚類起始中心點。為了選擇合適的prototypes,DP-SMCL算法首先對ρ和δ進(jìn)行初步篩選,將的樣本點排除,其中分別對應(yīng)局部密度和距離的均值。隨后,在符合要求的樣本點中選取較大的n個樣本點作為初始聚類中心,是對ρ和δ進(jìn)行歸一化處理之后的值,用于消除不同量綱的影響。

    1.2 基于1-D高斯混合概率密度模型的子簇合并

    由于樣本的分布情況存在不確定性,分析兩個prototypes 所代表子簇的相連區(qū)域的密度時,密度最小的地方并不一定正好處于兩個prototypes 的中點位置。研究表明,有限高斯混合模型可以逼近任意分布的概率密度函數(shù)[23]。針對現(xiàn)實數(shù)據(jù)集樣本分布的不確定性,本文使用高斯混合概率密度函數(shù)準(zhǔn)確描述子簇間相連區(qū)域任意位置的樣本分布情況,確定高斯混合概率密度函數(shù)最小值點,以此作為判斷不同prototypes 子簇之間相互獨立的指標(biāo)。假設(shè)子簇Ci的prototype記作zi,Cj的prototype 記作zj,通過概率密度模型計算出投影區(qū)間[a,b] 內(nèi)最小的密度值以此判定子簇Ci和子簇Cj的獨立程度。越小表明Ci和Cj的分離程度越高,越不可能屬于同一聚類類別。

    借助1-D投影分布[18]分析子簇相連區(qū)域的密度來對Ci和Cj的獨立程度進(jìn)行評估,若相連區(qū)域的密度值高則更可能屬于同一類。具體地,將屬于Ci和Cj內(nèi)的所有樣本點投影到zi和zj所在直線上,設(shè)樣本x的投影點為x′,其計算公式如下:

    假設(shè)待合并的prototypes共有K個,K個組間相互的獨立程度可用矩陣DK×K表示,D(i,j)為Ci和Cj所有prototypes組合的Fmin最大值。

    矩陣D中最大元素Dmax所對應(yīng)兩個子簇Ci和Cj的獨立程度最低,優(yōu)先進(jìn)行合并,在合并后的新子簇集合上再計算出更新的獨立程度矩陣重復(fù)上述合并過程,直至最后只剩下一個子簇,即所有prototypes都被劃分到同一子簇。

    為了獲取數(shù)據(jù)集的真實類別數(shù)目,對于每一輪合并后的聚類結(jié)果由組內(nèi)緊密度和組間分離程度綜合評估[22]。DP-SMCL算法記錄下每輪合并時所依據(jù)的最大D(i,j)元素Dmax。根據(jù)文獻(xiàn)[24]中提出的度量方法,comk=1/Dmax可以表示組內(nèi)數(shù)據(jù)的緊密程度,值越小說明組內(nèi)越緊密,結(jié)果越好。另外,文獻(xiàn)[25]中提出了度量簇間分離程度的指標(biāo)sepk,該指標(biāo)旨在避免在計算簇間分離程度時只用單個集群中心點代表整個集群所造成的局限性,因為單一的點作為整個集群的代表只適用于數(shù)據(jù)集滿足球型簇的情況。sepk在計算簇間分離程度時借助了KNN 一致性[26]思想,若一個數(shù)據(jù)點位于數(shù)據(jù)集的中間,則它的κ個鄰居會和它同屬一個子簇,而對于一個位于分界邊緣的數(shù)據(jù)點,它的鄰居可能屬于其他的子簇,sepk的計算公式如下:

    其中,k表示子簇的數(shù)量,κ是鄰居數(shù),ni代表第i個子簇Ci內(nèi)的樣本總數(shù),qj代表樣本j的不與它同屬一個子集的鄰居數(shù)。綜上,聚類簇數(shù)的選擇標(biāo)準(zhǔn)定義如下:

    子簇合并是將相連區(qū)域密度大的子簇優(yōu)先合并為新的子簇,通過迭代,新子簇集合間相連區(qū)域的密度不斷減小,子簇間界限趨于明顯,直至確定最優(yōu)類別數(shù)目。式(7)中comk度量組內(nèi)緊密度,其值越小,代表類內(nèi)一致性越好。如果屬于不同類的兩個子簇被合并,其對應(yīng)的comk值會顯著大于同屬一類的子簇被合并所得到的comk值。sepk值用于度量簇間分離程度,定義sepk為各分組數(shù)據(jù)點與其各自的κ個鄰居不同屬一類的比例,其取值越小,說明不同分組間界限越清晰,分離程度越大?;谑剑?)comk和sepk取值都盡可能小,可保證確定的分組組內(nèi)緊密度高,組間分離程度大,以此自動確定最佳的聚類數(shù)目。

    DP-SMCL算法描述如下:

    輸入:數(shù)據(jù)集E={x1,x2,…,xN},需預(yù)選的prototypes數(shù)量n(20 ≤n≤40)。

    輸出:聚類結(jié)果。

    階段I

    (1)根據(jù)式(1)和式(2)計算出所有樣本的局部密度ρi和距離δi;

    (2)按照ρi×δi由大到小預(yù)選出n個prototypes,作為階段II的輸入。

    階段II

    (1)以每個prototype 為中心的子簇各自為一組,根據(jù)式(3)~(5)確定合并順序并執(zhí)行合并;

    (2)由式(7)選出最優(yōu)聚類數(shù)目K,得到最終結(jié)果。

    2 實驗與分析

    2.1 實驗環(huán)境

    本文實驗在單機環(huán)境下進(jìn)行,電腦配置如下:處理器為標(biāo)壓銳龍R5-3550H@2.10 GHz,內(nèi)存16 GB,操作系統(tǒng)為64位Windows 10。

    2.2 DP-SMCL算法參數(shù)設(shè)置實驗

    DP-SMCL 算法需要設(shè)定初始聚類中心的數(shù)目(參數(shù)n),為保證得到精確的聚類結(jié)果,n的設(shè)定需要在合理區(qū)間內(nèi),基于4種模擬數(shù)據(jù)集(文獻(xiàn)[22])討論參數(shù)n的設(shè)置。其中DATA_1(banana數(shù)據(jù)集)、DATA_2(Gaussian數(shù)據(jù)集)、DATA_3(ids2 數(shù)據(jù)集)和DATA_4(Lithuanian數(shù)據(jù)集)的數(shù)據(jù)集描述如表1所示。

    表1 模擬數(shù)據(jù)集Table 1 Synthetic datasets

    圖1展示了參數(shù)n對4種模擬數(shù)據(jù)集聚類結(jié)果正確率的影響,分別對應(yīng)參數(shù)n∈{5,15,25,35,45} 時DPSMCL 算法聚類結(jié)果正確率(Accuracy)的變化情況??梢园l(fā)現(xiàn)n的取值對模擬數(shù)據(jù)集“DATA_1”和“DATA_4”的結(jié)果產(chǎn)生較大影響,而對模擬數(shù)據(jù)集“DATA_2”和“DATA_3”的影響較小,原因在于DATA_1 和DATA_4中各子簇數(shù)據(jù)分布的密度差大于數(shù)據(jù)集DATA_2 和DATA_3。

    圖1 參數(shù)n 對4種模擬數(shù)據(jù)集聚類結(jié)果正確率的影響Fig.1 Influence of parameter n on accuracy of clustering results of 4 synthetic datasets

    以數(shù)據(jù)集DATA_1 為例,在參數(shù)n分別取5 和25時,觀察不同的prototypes數(shù)對聚類結(jié)果的影響。

    圖2 展示了參數(shù)n=5 和n=25 對應(yīng)的聚類結(jié)果。其中,(a)和(c)中紅色五角星是根據(jù)局部密度ρ和距離δ選出的初始聚類中心點(prototypes),(b)和(d)分別是初始聚類中心數(shù)n=5 和n=25 的聚類結(jié)果,紅色五角星對應(yīng)著決策圖中五角星代表的樣本點。結(jié)果表明,當(dāng)n=5 時,對于如圖所示的兩個子簇的數(shù)據(jù)分布密度差距較大的非均衡分布數(shù)據(jù)集,低密度區(qū)域的樣本點在競爭成為prototype 的過程中受限于較小的局部密度而缺乏競爭力,導(dǎo)致所有的prototypes 集中在局部密度大的子簇中,聚類失敗,如圖2(b)所示。當(dāng)n=25 時,圖2(c)表明在n足夠大(即prototypes 數(shù)量充足)的情況下,低密度區(qū)域中擁有較大距離δ的樣本點可以被選中為prototypes,圖2(d)展示了子簇密度分布不均衡的數(shù)據(jù)集被準(zhǔn)確劃分為兩類。然而,參數(shù)n的擴大雖然可以增加低密度區(qū)域樣本點成為prototype的概率,但是若參數(shù)n設(shè)置過大,過多的初始聚類中心點將在合并階段消耗不必要的計算資源。

    圖2 Prototypes選擇結(jié)果和DP-SMCL算法聚類結(jié)果Fig.2 Prototypes selection results and DP-SMCL algorithm clustering results

    綜合考慮算法的效率和有效性,將參數(shù)n的范圍限定在[20,40]較為合適。

    2.3 DP-SMCL算法的聚類分析

    2.3.1 聚類數(shù)目的確定

    圖3展示了DP-SMCL算法在4種模擬數(shù)據(jù)集上的最佳聚類數(shù)目的選擇過程。圖中分別表示comk和sepk以及綜合考量comk、sepk的度量值隨聚類數(shù)目k取值不同的變化情況。其中,圖3(a)顯示DP-SMCL 針對非球型數(shù)據(jù)集(DATA_1)的聚類數(shù)目確定情況。k取值從1變化到2,comk值急劇下降,當(dāng)k=1 時不屬于同一類的兩個子簇被合并在一起,其相連區(qū)域樣本分布概率密度極小,造成comk值偏大。另外,k從2增加到5,sepk顯著增大(紅色折線),可以看出同屬一類的子簇被劃分成多個子部分且都單獨作為新的子簇存在,樣本的κ個鄰居中不與其同屬一個子簇的樣本比例明顯增加,由式(6)可知sepk值會不斷增大。因此,根據(jù)圖3(a)可以確定DATA_1 的聚類數(shù)目為2,與真實類別一致。如圖3(c)所示,DP-SMCL算法應(yīng)用于球型數(shù)據(jù)集(DATA_3)確定其聚類數(shù)目為5。相對于k取值從5 增加到6,comk值在k從4到5時的變化更為顯著,表明k=4 時存在不屬于同一類的子簇被合并。k=5 之后的comk趨近于0,表明同屬一類的子簇被合并,被合并子簇間相連區(qū)域的樣本密度大,結(jié)合式(5)和comk的定義可知此時對應(yīng)的comk值極小,符合數(shù)據(jù)代表的實際類別。同時,根據(jù)sepk的變化可知,從k=5 開始sepk顯著上升,表明同屬一個子簇的樣本被錯誤分割成更小的子簇。隨著子簇的數(shù)目不斷增多,子簇間相互緊鄰,由式(6)可知組間分離程度越來越差,sepk值趨于1。將DP-SMCL 算法分別應(yīng)用到數(shù)據(jù)集DATA_2和DATA_4上的結(jié)果如圖3(b)和(d)所示,由comk、sepk值的變化可以確定的聚類簇數(shù)分別為4 和2,與數(shù)據(jù)集實際包含的類別數(shù)一致。實驗結(jié)果表明,DP-SMCL 算法能夠自動確定數(shù)據(jù)集所包含的真實類別數(shù)目。

    圖3 DP-SMCL算法依據(jù)comk、sepk 和comk +sepk 自動確定最佳聚類數(shù)目Fig.3 DP-SMCL algorithm automatically determines optimal number of clusters based on comk,sepk and comk +sepk

    2.3.2 DP-SMCL算法特性分析

    DP-SMCL算法通過借助密度峰值聚類算法(DPC)思想,選定局部密度ρ和距離δ相對較大的樣本點作為起始聚類中心prototypes。相對于K-Means算法隨機選擇起始聚類中心,DP-SMCL 算法可有效排除離群點作為起始聚類中心對聚類結(jié)果的影響,避免K-Means 算法中dead-unit問題。另外,通過引入Multi-Prototypes機制并借助1-D 高斯混合概率密度模型合并以prototype為中心的子簇,使得DP-SMCL 算法可以應(yīng)用于非球型數(shù)據(jù)集。

    圖4為DP-SMCL應(yīng)用于球型數(shù)據(jù)集和非球型數(shù)據(jù)集的聚類結(jié)果(參數(shù)n設(shè)為25)。其中,(a)和(c)分別為兩種數(shù)據(jù)集的分布情況,(b)和(d)為DP-SMCL 算法的聚類結(jié)果,顏色相同的點代表劃分為同一類。圖中的紅色五角星是算法確定出的起始聚類中心,可以看到簇內(nèi)樣本越多密度越大,選出的起始聚類中心越多。DPSMCL 算法首先根據(jù)選定的起始聚類中心將樣本劃分為多個小簇,然后借助1-D高斯混合概率密度模型合并相連區(qū)域密度大的子簇,以子簇為單位進(jìn)行樣本融合,確定出最佳聚類結(jié)果。實驗結(jié)果表明,DP-SMCL 算法對球型和非球型數(shù)據(jù)集都能進(jìn)行有效聚類。

    圖4 DP-SMCL對球型、非球型數(shù)據(jù)集的聚類Fig.4 DP-SMCL clustering of spherical and non-spherical datasets

    2.3.3 模擬數(shù)據(jù)集對比實驗

    本文將DP-SMCL 算法與經(jīng)典K-Means、DBSCAN算法以及SMCL 算法進(jìn)行比較,基于表1 中的4 種模擬數(shù)據(jù)集進(jìn)行實驗,實驗結(jié)果如圖5所示。

    圖5 4種算法聚類結(jié)果對比Fig.5 Clustering results comparison of 4 algorithms

    在進(jìn)行K-Means 算法實驗時,手動設(shè)置類別數(shù)K為各數(shù)據(jù)集的真實類別數(shù),聚類結(jié)果中五角星代表算法最終確定的聚類中心,可以看到在預(yù)設(shè)了正確類別數(shù)目的條件下,K-Means依然可能出現(xiàn)錯誤的劃分。DBSCAN算法處理的聚類結(jié)果表明該算法對數(shù)據(jù)集“DATA_1”和“DATA_4”的劃分效果較好,但在處理“DATA_2”和“DATA_3”時,無論如何調(diào)整聚類半徑,實驗結(jié)果都出現(xiàn)了明顯的錯誤劃分。對比SMCL和DP-SMCL算法對模擬數(shù)據(jù)集的實驗結(jié)果,可以看出兩種算法應(yīng)用在4種模擬數(shù)據(jù)集上都基本可以實現(xiàn)對數(shù)據(jù)集的有效聚類。但SMCL算法在確定初始聚類中心時需不斷調(diào)整prototypes的位置以及判斷是否要添加新的prototype,導(dǎo)致消耗較多的計算資源。相對于SMCL起始中心確定的復(fù)雜性,DP-SMCL算法基于密度峰值算法(DPC)提出的簇中心點特征,根據(jù)樣本點的局部密度ρ和距離δ確定prototypes,可快速完成初始聚類中心點的選定。4種算法在模擬數(shù)據(jù)集上運行時間的對比情況如表2 所示,結(jié)果表明DPSMCL相比于SMCL算法,效率獲得極大提高。

    表2 4種算法運行時間對比Table 2 Running time comparison of 4 algorithms s

    為進(jìn)一步比較4種聚類算法在4種模擬數(shù)據(jù)集上的聚類效果,使用蘭德指數(shù)(RI)對聚類結(jié)果進(jìn)行評價。RI的計算公式如下:

    假設(shè)U為外部評價標(biāo)準(zhǔn),即真實的類別情況,V表示聚類結(jié)果,其中a代表在U和V中同為一類的樣本點對數(shù),b表示在U中為同一類而在V中屬于不同類別的樣本點對數(shù),c表示在U中不在同一類但在V中為同一類別的對數(shù),d表示在U和V中均不屬于同一類別的樣本點對數(shù)。RI 的取值范圍是[0,1],數(shù)值越接近1說明算法的分類結(jié)果與實際結(jié)果越吻合,即聚類模型越好。

    表3 4種算法在4種數(shù)據(jù)集上的評價指標(biāo)比較Table 3 Index value comparison of 4 algorithms on 4 datasets

    2.3.4 UCI數(shù)據(jù)集對比實驗

    為了驗證算法的可靠性,針對UCI(https://archive.ics.uci.edu/ml/index.php)數(shù)據(jù)庫中獲取的6 種代表性數(shù)據(jù)集進(jìn)行實驗驗證。6種數(shù)據(jù)集的描述如表4所示。

    表4 數(shù)據(jù)集描述Table 4 Description of datasets

    分別使用正確率(Accuracy)、蘭德指數(shù)(RI)以及F1-Score三種評價指標(biāo)來對比分析DP-SMCL、K-Means、DBSCAN 以及SMCL 算法的聚類效果。SMCL 算法在實驗時默認(rèn)使用原有參數(shù)設(shè)置,考慮到經(jīng)典K-Means算法隨機選取初始聚類中心和DBSCAN算法參數(shù)設(shè)置的不同會對聚類結(jié)果產(chǎn)生影響,實驗時采用多次實驗取平均獲得各算法結(jié)果。

    從表5 中可以看出,本文提出的DP-SMCL 算法應(yīng)用在6種真實數(shù)據(jù)集上的聚類表現(xiàn)普遍優(yōu)于其他3種算法,其正確率、蘭德指數(shù)和F1-Score都能取得較好結(jié)果。

    表5 4種算法在6種UCI數(shù)據(jù)集上的評價指標(biāo)對比Table 5 Index value comparison of 4 algorithms on 6 UCI datasets

    3 結(jié)束語

    本文借助SMCL 算法中的Multi-Prototypes 思想和融合機制,提出了一種基于密度峰值的聚類算法DPSMCL,對經(jīng)典K-Means算法進(jìn)行了改進(jìn)。通過有條件地選取prototypes 作為初始聚類中心,避免了K-Means算法中因初始聚類中心選取隨機而導(dǎo)致的dead-unit 問題。DP-SMCL算法在合并階段借助高斯混合概率密度模型完成子簇間合并,使算法不再局限于球型數(shù)據(jù)集,再通過comk和sepk指標(biāo)綜合分析來自動確認(rèn)類別數(shù)K,彌補了經(jīng)典K-Means 算法需要人為指定類別數(shù)的不足。實驗結(jié)果表明,DP-SMCL 算法可實現(xiàn)對非球型數(shù)據(jù)集的聚類,對比K-Means 和DBSCAN 算法擁有更好的聚類效果。同時,對比SMCL 算法,在確定初始聚類中心點時,DP-SMCL 算法基于密度峰值算法(DPC)提出的簇中心點特征可快速完成初始聚類中心點的選定,極大地提高了算法效率。DP-SMCL 算法將數(shù)據(jù)集投影到一維空間,并使用概率密度函數(shù)度量相連區(qū)域最小密度作為子簇合并的指標(biāo),結(jié)果表明在低維的數(shù)據(jù)集中該算法表現(xiàn)良好。下一步研究的重點是如何將DPSMCL算法擴展到高維度的數(shù)據(jù)集上。

    免费无遮挡裸体视频| 亚洲欧美日韩东京热| 老女人水多毛片| 又爽又黄无遮挡网站| 亚洲成a人片在线一区二区| 男女之事视频高清在线观看| 97在线视频观看| 男女边吃奶边做爰视频| 国产一区二区亚洲精品在线观看| 国产一区二区亚洲精品在线观看| 欧美一区二区国产精品久久精品| 舔av片在线| 国产精品一及| 亚州av有码| 亚洲熟妇中文字幕五十中出| 免费高清视频大片| 欧美精品国产亚洲| 亚洲av美国av| 欧美性猛交黑人性爽| 国产av不卡久久| 精品一区二区免费观看| 91久久精品电影网| 国产精品一区二区三区四区免费观看 | 精品国内亚洲2022精品成人| 尾随美女入室| 真实男女啪啪啪动态图| 亚洲不卡免费看| 欧洲精品卡2卡3卡4卡5卡区| 啦啦啦啦在线视频资源| 精品人妻熟女av久视频| 综合色丁香网| 国产精品,欧美在线| 少妇的逼好多水| 国产一区二区三区av在线 | 国产亚洲精品av在线| 精品国内亚洲2022精品成人| 久久精品国产亚洲av涩爱 | 亚洲丝袜综合中文字幕| 中文字幕人妻熟人妻熟丝袜美| 亚洲欧美日韩高清专用| 91久久精品国产一区二区成人| 97热精品久久久久久| 久久韩国三级中文字幕| 最后的刺客免费高清国语| 一区二区三区免费毛片| 美女内射精品一级片tv| 一本久久中文字幕| 久久久国产成人免费| 狠狠狠狠99中文字幕| 男女边吃奶边做爰视频| 国产一区二区激情短视频| 久久精品夜夜夜夜夜久久蜜豆| 国产不卡一卡二| 午夜福利18| 久久精品国产自在天天线| 欧美日韩在线观看h| 婷婷色综合大香蕉| 九九久久精品国产亚洲av麻豆| 在线观看一区二区三区| 在线观看一区二区三区| av天堂在线播放| av在线亚洲专区| 国产精品野战在线观看| 青春草视频在线免费观看| 国产高潮美女av| 小说图片视频综合网站| 两性午夜刺激爽爽歪歪视频在线观看| 中国美白少妇内射xxxbb| 久久久久免费精品人妻一区二区| 国产午夜精品论理片| 一个人看视频在线观看www免费| 日韩,欧美,国产一区二区三区 | 99热网站在线观看| 热99在线观看视频| 国产精品国产三级国产av玫瑰| 五月玫瑰六月丁香| 国产欧美日韩精品亚洲av| 久久婷婷人人爽人人干人人爱| 热99在线观看视频| 成人国产麻豆网| 搡女人真爽免费视频火全软件 | 最近视频中文字幕2019在线8| 一区二区三区四区激情视频 | 一区二区三区四区激情视频 | 久久午夜福利片| 我要搜黄色片| 亚洲高清免费不卡视频| 国产淫片久久久久久久久| 秋霞在线观看毛片| 蜜桃亚洲精品一区二区三区| 久久99热6这里只有精品| 晚上一个人看的免费电影| 国产久久久一区二区三区| 级片在线观看| 青春草视频在线免费观看| 欧美人与善性xxx| 午夜福利在线观看免费完整高清在 | a级毛色黄片| 国产真实乱freesex| 亚洲成a人片在线一区二区| 久久久久久久久久久丰满| 特大巨黑吊av在线直播| 亚洲av电影不卡..在线观看| 久久人妻av系列| 日韩欧美在线乱码| 18+在线观看网站| 日本熟妇午夜| 22中文网久久字幕| www日本黄色视频网| 国产伦精品一区二区三区视频9| 久久人人爽人人爽人人片va| 国产精品精品国产色婷婷| 夜夜爽天天搞| 一本久久中文字幕| 可以在线观看的亚洲视频| 桃色一区二区三区在线观看| av黄色大香蕉| 波多野结衣巨乳人妻| 搞女人的毛片| 婷婷亚洲欧美| 欧美日韩一区二区视频在线观看视频在线 | 人人妻,人人澡人人爽秒播| 午夜福利在线在线| 97人妻精品一区二区三区麻豆| 久久这里只有精品中国| 亚洲熟妇熟女久久| 成人漫画全彩无遮挡| 亚洲aⅴ乱码一区二区在线播放| 99久久无色码亚洲精品果冻| av女优亚洲男人天堂| 午夜福利成人在线免费观看| 国产在线男女| 国产精品乱码一区二三区的特点| 久久久久久九九精品二区国产| eeuss影院久久| 久久精品国产清高在天天线| 露出奶头的视频| 国产成人a∨麻豆精品| 国产欧美日韩一区二区精品| 国产精品一二三区在线看| 女人被狂操c到高潮| 在线播放国产精品三级| 国产精品人妻久久久久久| 亚洲精品一卡2卡三卡4卡5卡| 成人毛片a级毛片在线播放| 草草在线视频免费看| 中国国产av一级| 嫩草影院新地址| 毛片女人毛片| 欧美成人免费av一区二区三区| 国产色婷婷99| 国产探花极品一区二区| 不卡一级毛片| 婷婷六月久久综合丁香| 国产精品日韩av在线免费观看| 国模一区二区三区四区视频| 欧美xxxx黑人xx丫x性爽| 国模一区二区三区四区视频| 六月丁香七月| 日韩高清综合在线| 一级av片app| 啦啦啦观看免费观看视频高清| 国产精品久久久久久久电影| 日本-黄色视频高清免费观看| 一级a爱片免费观看的视频| 亚洲av.av天堂| 国产精品三级大全| а√天堂www在线а√下载| 亚洲四区av| 麻豆av噜噜一区二区三区| 观看免费一级毛片| 久久亚洲国产成人精品v| 高清午夜精品一区二区三区 | 1000部很黄的大片| 日韩中字成人| 色综合站精品国产| 中国美女看黄片| 国产单亲对白刺激| 国产精品一区二区免费欧美| 日本熟妇午夜| 不卡一级毛片| 99热网站在线观看| 亚洲七黄色美女视频| 日本撒尿小便嘘嘘汇集6| 乱码一卡2卡4卡精品| 搡老熟女国产l中国老女人| 两个人的视频大全免费| 色吧在线观看| 99在线人妻在线中文字幕| 久久九九热精品免费| 一级黄片播放器| 国产精品一区二区免费欧美| 欧美不卡视频在线免费观看| 国产精品福利在线免费观看| 国产一区二区亚洲精品在线观看| 男人和女人高潮做爰伦理| 尤物成人国产欧美一区二区三区| 熟妇人妻久久中文字幕3abv| 男女啪啪激烈高潮av片| 亚州av有码| 男女视频在线观看网站免费| 国产精品伦人一区二区| 午夜日韩欧美国产| 日本黄大片高清| 97超视频在线观看视频| 最近中文字幕高清免费大全6| 99久国产av精品国产电影| 中出人妻视频一区二区| 国产精品人妻久久久久久| 麻豆久久精品国产亚洲av| 久久久久久伊人网av| 色播亚洲综合网| 非洲黑人性xxxx精品又粗又长| 联通29元200g的流量卡| 在线天堂最新版资源| 免费av毛片视频| 丝袜美腿在线中文| 成年女人毛片免费观看观看9| 日韩欧美在线乱码| 大型黄色视频在线免费观看| 久久久久久久久久黄片| 亚洲婷婷狠狠爱综合网| 午夜福利成人在线免费观看| 搞女人的毛片| 又粗又爽又猛毛片免费看| 久久人人爽人人爽人人片va| 一边摸一边抽搐一进一小说| 成年av动漫网址| 欧美日韩国产亚洲二区| 最好的美女福利视频网| 俄罗斯特黄特色一大片| 最近的中文字幕免费完整| 亚洲三级黄色毛片| 全区人妻精品视频| 免费av毛片视频| 卡戴珊不雅视频在线播放| 日本黄色片子视频| 小蜜桃在线观看免费完整版高清| 午夜福利高清视频| 3wmmmm亚洲av在线观看| 激情 狠狠 欧美| 春色校园在线视频观看| 级片在线观看| av天堂中文字幕网| 精品久久久久久久久亚洲| 超碰av人人做人人爽久久| 非洲黑人性xxxx精品又粗又长| 久久人妻av系列| 婷婷亚洲欧美| 美女大奶头视频| 午夜亚洲福利在线播放| 日本撒尿小便嘘嘘汇集6| 国产在线男女| 亚洲中文字幕一区二区三区有码在线看| 97人妻精品一区二区三区麻豆| 九九热线精品视视频播放| 久99久视频精品免费| 免费观看精品视频网站| 在线a可以看的网站| 少妇被粗大猛烈的视频| 亚洲欧美日韩卡通动漫| 欧美成人免费av一区二区三区| 欧美+日韩+精品| 日韩欧美 国产精品| 久久婷婷人人爽人人干人人爱| 午夜福利在线观看吧| 欧美另类亚洲清纯唯美| 日韩,欧美,国产一区二区三区 | 国产欧美日韩一区二区精品| 欧美国产日韩亚洲一区| 欧美不卡视频在线免费观看| 精品国产三级普通话版| 夜夜爽天天搞| 直男gayav资源| 欧美绝顶高潮抽搐喷水| 美女大奶头视频| 18禁在线无遮挡免费观看视频 | 黄色一级大片看看| 国产片特级美女逼逼视频| 国产私拍福利视频在线观看| 1000部很黄的大片| 国产一级毛片七仙女欲春2| 不卡视频在线观看欧美| 美女高潮的动态| 69av精品久久久久久| 国产一区二区亚洲精品在线观看| 色综合站精品国产| 18禁裸乳无遮挡免费网站照片| 国产在线精品亚洲第一网站| 日本-黄色视频高清免费观看| 久久久久久国产a免费观看| 精品无人区乱码1区二区| 久久久欧美国产精品| 国产高潮美女av| 高清日韩中文字幕在线| 国产成人影院久久av| 别揉我奶头 嗯啊视频| 欧美日韩综合久久久久久| 亚州av有码| 一进一出抽搐动态| 亚洲成av人片在线播放无| 国产av在哪里看| 一区二区三区四区激情视频 | 桃色一区二区三区在线观看| 不卡视频在线观看欧美| 久久精品国产亚洲av香蕉五月| 国产成人影院久久av| 又黄又爽又刺激的免费视频.| 中文亚洲av片在线观看爽| 免费av毛片视频| 99久久无色码亚洲精品果冻| 色尼玛亚洲综合影院| 三级国产精品欧美在线观看| 深夜精品福利| 国产精品嫩草影院av在线观看| 中文字幕av在线有码专区| 国产 一区精品| av视频在线观看入口| av黄色大香蕉| 天天躁夜夜躁狠狠久久av| 日韩成人av中文字幕在线观看 | 亚洲欧美日韩无卡精品| 日本a在线网址| 级片在线观看| 免费av不卡在线播放| 免费av毛片视频| 久久久色成人| 欧美日韩国产亚洲二区| 精品一区二区免费观看| 一本一本综合久久| 波多野结衣巨乳人妻| 18禁黄网站禁片免费观看直播| 日韩高清综合在线| 免费人成在线观看视频色| 欧美又色又爽又黄视频| 两个人视频免费观看高清| 别揉我奶头 嗯啊视频| 女同久久另类99精品国产91| 国产精品人妻久久久影院| 亚洲欧美中文字幕日韩二区| 国产精品不卡视频一区二区| 久久亚洲精品不卡| 久久午夜亚洲精品久久| 国产精品不卡视频一区二区| 日韩欧美一区二区三区在线观看| 国产真实乱freesex| 伊人久久精品亚洲午夜| 亚洲av.av天堂| 韩国av在线不卡| 亚洲av五月六月丁香网| 国产男人的电影天堂91| 免费在线观看成人毛片| 中国美白少妇内射xxxbb| 日本 av在线| 亚洲国产色片| 日韩精品中文字幕看吧| 亚洲国产欧洲综合997久久,| 国产麻豆成人av免费视频| 国产伦在线观看视频一区| 日韩欧美一区二区三区在线观看| 亚洲成人久久爱视频| 久久久久国产精品人妻aⅴ院| 日本精品一区二区三区蜜桃| 午夜激情福利司机影院| 日本熟妇午夜| 国产精品国产三级国产av玫瑰| 麻豆精品久久久久久蜜桃| 99久久九九国产精品国产免费| 免费高清视频大片| 成人二区视频| 成人特级黄色片久久久久久久| 一级毛片电影观看 | 插逼视频在线观看| 噜噜噜噜噜久久久久久91| 别揉我奶头 嗯啊视频| 国产乱人视频| 亚洲高清免费不卡视频| 99久久精品一区二区三区| 少妇丰满av| 简卡轻食公司| 婷婷精品国产亚洲av| 亚洲精品粉嫩美女一区| 国产91av在线免费观看| 久久热精品热| 亚洲aⅴ乱码一区二区在线播放| 青春草视频在线免费观看| 国产一区二区在线观看日韩| 18禁裸乳无遮挡免费网站照片| 亚洲成av人片在线播放无| 一进一出好大好爽视频| 狂野欧美白嫩少妇大欣赏| 看免费成人av毛片| 免费高清视频大片| 女的被弄到高潮叫床怎么办| 久久精品91蜜桃| 最近视频中文字幕2019在线8| 国产久久久一区二区三区| 男女啪啪激烈高潮av片| 男女视频在线观看网站免费| 赤兔流量卡办理| 国产成人91sexporn| 久久人人爽人人片av| 在线a可以看的网站| 18禁在线播放成人免费| 男女那种视频在线观看| 欧美日韩精品成人综合77777| 最近在线观看免费完整版| 大香蕉久久网| a级毛片免费高清观看在线播放| 欧美另类亚洲清纯唯美| 此物有八面人人有两片| 午夜福利在线观看吧| 久久久久久久久中文| 国产精品国产三级国产av玫瑰| 99热6这里只有精品| 国产女主播在线喷水免费视频网站 | 亚洲中文字幕日韩| 我要搜黄色片| 午夜爱爱视频在线播放| 欧美绝顶高潮抽搐喷水| 国产成人福利小说| 中文在线观看免费www的网站| 3wmmmm亚洲av在线观看| 国产美女午夜福利| 成人亚洲欧美一区二区av| 一级毛片久久久久久久久女| 国产探花在线观看一区二区| 搡女人真爽免费视频火全软件 | 国产免费男女视频| 露出奶头的视频| 国产 一区 欧美 日韩| 国产不卡一卡二| 麻豆乱淫一区二区| 人人妻人人澡人人爽人人夜夜 | 国产成人福利小说| 国产精品久久电影中文字幕| 男人舔奶头视频| 一级毛片我不卡| 国产毛片a区久久久久| 久久久精品94久久精品| 中文字幕人妻熟人妻熟丝袜美| 国产午夜精品久久久久久一区二区三区 | 观看美女的网站| 99久久精品一区二区三区| 精品乱码久久久久久99久播| 91精品国产九色| 日产精品乱码卡一卡2卡三| 99久国产av精品国产电影| 婷婷亚洲欧美| 深爱激情五月婷婷| 欧美潮喷喷水| 亚洲精品色激情综合| 精品午夜福利视频在线观看一区| 免费在线观看成人毛片| 成人亚洲欧美一区二区av| 91在线精品国自产拍蜜月| 国产亚洲精品综合一区在线观看| 黑人高潮一二区| 国产久久久一区二区三区| 国产精品无大码| 97超级碰碰碰精品色视频在线观看| 国产高潮美女av| 日本欧美国产在线视频| 免费无遮挡裸体视频| 男女之事视频高清在线观看| 亚洲中文日韩欧美视频| 亚洲18禁久久av| 精品久久久久久久久久久久久| eeuss影院久久| 成年免费大片在线观看| 老熟妇仑乱视频hdxx| 亚洲四区av| 亚洲电影在线观看av| 日韩欧美精品免费久久| 亚洲最大成人中文| 哪里可以看免费的av片| 亚洲av成人精品一区久久| www.色视频.com| 午夜福利成人在线免费观看| 色在线成人网| 麻豆乱淫一区二区| 神马国产精品三级电影在线观看| 麻豆国产av国片精品| 国产白丝娇喘喷水9色精品| 欧美性感艳星| 18+在线观看网站| 国产精品日韩av在线免费观看| 成人一区二区视频在线观看| 日本精品一区二区三区蜜桃| 尤物成人国产欧美一区二区三区| 久久精品国产自在天天线| 欧美成人精品欧美一级黄| 国产精品无大码| a级毛色黄片| 亚洲精品在线观看二区| 亚洲欧美中文字幕日韩二区| av.在线天堂| 美女cb高潮喷水在线观看| 亚洲中文字幕日韩| 一级毛片我不卡| 日本成人三级电影网站| 天天躁日日操中文字幕| 黄色一级大片看看| 成人午夜高清在线视频| 少妇高潮的动态图| av在线播放精品| 日韩,欧美,国产一区二区三区 | av.在线天堂| 国模一区二区三区四区视频| 婷婷精品国产亚洲av| 亚洲婷婷狠狠爱综合网| 白带黄色成豆腐渣| 69人妻影院| 久久久久国产精品人妻aⅴ院| 观看美女的网站| 国产免费男女视频| 观看美女的网站| 国产伦一二天堂av在线观看| 听说在线观看完整版免费高清| 人人妻人人看人人澡| 日韩强制内射视频| 国产亚洲精品综合一区在线观看| 欧美一区二区国产精品久久精品| 国产激情偷乱视频一区二区| 国产精品三级大全| 成人漫画全彩无遮挡| 午夜福利成人在线免费观看| 91av网一区二区| 成人鲁丝片一二三区免费| av中文乱码字幕在线| a级毛色黄片| 成人三级黄色视频| 国产亚洲欧美98| 日本五十路高清| 久久99热6这里只有精品| 久久欧美精品欧美久久欧美| 国产麻豆成人av免费视频| 在线观看av片永久免费下载| 可以在线观看的亚洲视频| 一进一出抽搐gif免费好疼| 午夜爱爱视频在线播放| 一进一出抽搐gif免费好疼| 亚洲最大成人手机在线| 国产一级毛片七仙女欲春2| 免费观看的影片在线观看| 成人亚洲欧美一区二区av| 97热精品久久久久久| 永久网站在线| 国产黄色视频一区二区在线观看 | 国产精品美女特级片免费视频播放器| 1000部很黄的大片| 久久久色成人| 久久热精品热| 免费一级毛片在线播放高清视频| 国产欧美日韩精品亚洲av| 天堂av国产一区二区熟女人妻| 麻豆国产97在线/欧美| 国产精品野战在线观看| 淫秽高清视频在线观看| 在线播放无遮挡| 亚洲av第一区精品v没综合| 欧美激情久久久久久爽电影| 一区二区三区免费毛片| 你懂的网址亚洲精品在线观看 | 亚洲乱码一区二区免费版| 老司机午夜福利在线观看视频| av国产免费在线观看| 国产久久久一区二区三区| 国产精品一及| 青春草视频在线免费观看| 久久久久久国产a免费观看| 日韩成人伦理影院| 精品免费久久久久久久清纯| 欧美不卡视频在线免费观看| 久久久久九九精品影院| 麻豆久久精品国产亚洲av| 51国产日韩欧美| 国产男靠女视频免费网站| 欧美成人免费av一区二区三区| 色噜噜av男人的天堂激情| 中文字幕人妻熟人妻熟丝袜美| 亚洲一级一片aⅴ在线观看| 联通29元200g的流量卡| 国产精品三级大全| 搡老熟女国产l中国老女人| 日日摸夜夜添夜夜爱| 99视频精品全部免费 在线| 最近在线观看免费完整版| 波多野结衣高清无吗| 欧美中文日本在线观看视频| 国产精品av视频在线免费观看| 国产又黄又爽又无遮挡在线| 五月玫瑰六月丁香| 午夜日韩欧美国产| 亚洲七黄色美女视频| 国产视频一区二区在线看| 1024手机看黄色片| 嫩草影视91久久| 亚洲一区高清亚洲精品| 我的女老师完整版在线观看| 最后的刺客免费高清国语| av在线蜜桃| 日韩 亚洲 欧美在线| 波多野结衣高清无吗| 亚洲欧美精品综合久久99| 久久99热这里只有精品18| 久久久精品大字幕| 中国国产av一级| 精品福利观看| 麻豆成人午夜福利视频| 亚洲美女黄片视频| 精品99又大又爽又粗少妇毛片| 免费不卡的大黄色大毛片视频在线观看 | 99在线视频只有这里精品首页| 又粗又爽又猛毛片免费看|