• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于改進(jìn)Canopy-K-means算法的并行化研究

    2021-03-04 13:40:06賈鈞琛

    王 林,賈鈞琛

    (西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,西安 710048)

    0 引言

    隨著互聯(lián)網(wǎng)普及率的不斷提高,網(wǎng)絡(luò)數(shù)據(jù)呈幾何級(jí)增長(zhǎng),面對(duì)海量以及快速增長(zhǎng)的網(wǎng)絡(luò)數(shù)據(jù),通過(guò)聚類分析可以快速準(zhǔn)確地從中挖掘出價(jià)值信息。但是,傳統(tǒng)的聚類算法無(wú)論是在聚類精度,還是在執(zhí)行時(shí)間上都已經(jīng)不能很好地滿足當(dāng)前需求,利用分布式計(jì)算框架對(duì)其進(jìn)行并行化改進(jìn),不僅可以縮短聚類時(shí)間,還可以增強(qiáng)算法的擴(kuò)展性,更好地滿足當(dāng)下數(shù)據(jù)挖掘的需要。

    K-means算法作為一種具有代表性的聚類算法,具備較快的收斂速度、可靠的理論以及容易實(shí)現(xiàn)等諸多優(yōu)勢(shì),因而被人們廣泛應(yīng)用于各行各業(yè),但是算法也存在聚類中心點(diǎn)的選取具有隨機(jī)性,需要提前確定聚類個(gè)數(shù)等不足[1]。對(duì)此,許多學(xué)者對(duì)K-means算法進(jìn)行了改進(jìn)并取得了一定的成果。

    鄧海等人[2]結(jié)合密度法和“最大最小原則”優(yōu)化K-means初始聚類中心點(diǎn)的選擇,算法準(zhǔn)確率得到提高,但是改進(jìn)后算法的時(shí)間復(fù)雜度較高,運(yùn)行時(shí)間較長(zhǎng)。趙慶等人[3]通過(guò)Canopy算法對(duì)數(shù)據(jù)集進(jìn)行“粗”聚類,避免了傳統(tǒng)K-means中心點(diǎn)選取存在的盲目性,極大提升了其準(zhǔn)確性,然而在采用Canopy算法初始閾值需要人為指定,所以聚類結(jié)果不穩(wěn)定。劉紀(jì)偉等人[4]結(jié)合密度思想優(yōu)化了K-means初始中心點(diǎn)的選取,同時(shí)引入聚類有效性判別函數(shù)確定值,提高了算法的準(zhǔn)確度,但是也增加了算法的運(yùn)行時(shí)間,執(zhí)行效率較低。李曉瑜等人[5]結(jié)合MapReduce分布式框架并行化實(shí)現(xiàn)改進(jìn)的Canopy-K-means算法,并行化實(shí)現(xiàn)的算法具有良好的準(zhǔn)確率和擴(kuò)展性,但是Canopy算法初始閾值人為指定的問題仍然存在。

    上述工作均是針對(duì)K-means算法初始中心點(diǎn)隨機(jī)選取的不足進(jìn)行改進(jìn),一定程度上提高了算法的聚類準(zhǔn)確度,然而仍舊存在不足。本文首先針對(duì)Canopy-K-means算法中Canopy中心點(diǎn)隨機(jī)選取的不足,引入“最大最小原則”進(jìn)行優(yōu)化,此外,定義深度指標(biāo)計(jì)算公式,確定Canopy中心點(diǎn)的最優(yōu)個(gè)數(shù)及區(qū)域半徑;接著借助三角不等式定理對(duì)K-means算法進(jìn)行優(yōu)化,減少冗余的距離計(jì)算,加快收斂速度;最后結(jié)合MapReduce分布式框架將改進(jìn)后的算法并行化實(shí)現(xiàn)。在構(gòu)建的微博文本數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明改進(jìn)算法的準(zhǔn)確率和擴(kuò)展性都得到提升。

    1 MapReduce并行框架

    MapReduce[6]是一種用于處理大規(guī)模數(shù)據(jù)的分布式編程模型,可以將大型任務(wù)進(jìn)行拆分處理,從而加快數(shù)據(jù)的處理效率。

    MapReduce主要包括Map和Reduce兩個(gè)函數(shù),在數(shù)據(jù)處理過(guò)程中,數(shù)據(jù)均以鍵/值對(duì)形式保存。其中,Map函數(shù)根據(jù)用戶輸入的鍵/值對(duì)生成中間結(jié)果,而Reduce函數(shù)對(duì)中間結(jié)果進(jìn)行歸并處理,得到的最終結(jié)果同樣以鍵/值對(duì)形式輸出。除了Map和Reduce兩個(gè)核心函數(shù)外,還提供了Combine函數(shù),它在Map后調(diào)用,相當(dāng)于本地的Reduce,主要是為了減少?gòu)腗ap到Reduce的數(shù)據(jù)量。

    2 Canpoy-K-means聚類算法研究與改進(jìn)

    2.1 Canpoy-K-means算法研究

    K-means算法由于算法簡(jiǎn)單、易于實(shí)現(xiàn)等優(yōu)點(diǎn)而被廣泛使用。其基本思想是:從數(shù)據(jù)集中隨機(jī)選取K個(gè)數(shù)據(jù)對(duì)象作為初始聚類中心點(diǎn);將剩余數(shù)據(jù)對(duì)象和簇中心進(jìn)行間距計(jì)算,并且把它劃至間距最短的簇中,持續(xù)該過(guò)程,直到數(shù)據(jù)集為空集;然后根據(jù)簇中的數(shù)據(jù)對(duì)象計(jì)算新的聚類中心點(diǎn),繼續(xù)上述過(guò)程,直到簇的中心點(diǎn)不再發(fā)生變化或者符合停止條件,迭代才會(huì)停止,完成聚類劃分。

    Canpoy-K-means算法是一種借助Canpoy算法改進(jìn)的K-means算法。在Canpoy-K-means算法中,通過(guò)Canpoy算法對(duì)數(shù)據(jù)集進(jìn)行“粗”聚類,得到個(gè)Canpoy子集,隨后再以個(gè)Canopy子集的中心點(diǎn)作為K-means算法的初始中心點(diǎn)進(jìn)行“細(xì)”聚類,生成聚類結(jié)果。Canpoy-K-means算法執(zhí)行步驟如下:

    1)將待聚類數(shù)據(jù)集構(gòu)成List集合,然后指定兩個(gè)距離閾值T1和T2(T1>T2);

    2)隨機(jī)選取List合中的一個(gè)數(shù)據(jù)對(duì)象P,構(gòu)成一個(gè)新的Canpoy,并將對(duì)象P從集合List中移除;

    3)對(duì)于List中剩余的數(shù)據(jù)對(duì)象,計(jì)算與對(duì)象P之間的距離。如果間距小于T1,就把它分配到對(duì)象P所在的Canpoy中;如果與對(duì)象P的間距小于T2,則將它從List中刪除;

    4)重復(fù)步驟2)和3),直到List為空;

    5)將形成的Canpoy子集數(shù)目作為K值,Canpoy子集的中心點(diǎn)作為初始的聚類中心點(diǎn)進(jìn)行K-means聚類,得到較為準(zhǔn)確的聚類結(jié)果。

    Canpoy-K-means算法雖然解決了K-means算法人為指定值和初始中心點(diǎn)隨機(jī)選取的不足,然而其也存在不足:Canopy的初始聚類中心點(diǎn)隨機(jī)選取和初始閾值人為指定,具有盲目性,初始閾值對(duì)聚類所得的最終結(jié)果具有顯著影響,一定程度上降低了聚類結(jié)果的穩(wěn)定性;另外,由于其具備較高的時(shí)間復(fù)雜度,串行執(zhí)行過(guò)程時(shí)所需時(shí)間較長(zhǎng),算法串行執(zhí)行效率較低。

    2.2 Canpoy算法改進(jìn)

    為了改善Canopy算法初始閾值人為指定以及初始中心點(diǎn)隨機(jī)選取的不足,本文引入“最大最小原則”對(duì)其進(jìn)行優(yōu)化,提高算法的準(zhǔn)確率以及聚類結(jié)果的穩(wěn)定性。

    基于“最大最小原則”的中心點(diǎn)選取方法基本思想如下:在將數(shù)據(jù)集劃分為若干個(gè)Canopy的過(guò)程中,任意兩個(gè)Canopy中心點(diǎn)之間的距離應(yīng)盡可能遠(yuǎn),即假設(shè)目前已生成個(gè)Canopy中心點(diǎn),則處于第n+1位的Canopy中心點(diǎn)應(yīng)為其它數(shù)據(jù)點(diǎn)和前n個(gè)中心點(diǎn)間最短間距的最大者[7],其公式如下:

    (1)

    式中,dn表示第n個(gè)中心點(diǎn)與候選數(shù)據(jù)點(diǎn)的最小距離;DistList表示前n個(gè)中心點(diǎn)與候選數(shù)據(jù)點(diǎn)最小距離的集合;DistMin(n+1)則表示集合DistList中最小距離的最大者,即Canopy集合n+1的第個(gè)中心點(diǎn)。

    基于“最大最小原則”的Canopy中心點(diǎn)選擇方法,在實(shí)際應(yīng)用中符合下述情況:如果中心點(diǎn)數(shù)量和最佳中心點(diǎn)的數(shù)量較為接近,此時(shí)DistMin(n+1)具備最大的變化幅度。所以,為了確定最優(yōu)的Canopy中心點(diǎn)個(gè)數(shù)及區(qū)域半徑Depth(i),根據(jù)參考文獻(xiàn)[8]提出的邊界思想,采用深度指標(biāo)T1,描述Canopy中心點(diǎn)的變化幅度,如公式(2)所示:

    Depth(i)=|DistMin(i)-DistMin(i-1)|+

    |DistMin(i+1)-DistMin(i)|

    (2)

    當(dāng)i接近真實(shí)聚類簇?cái)?shù)時(shí),Depth(i)取得最大值,此時(shí)設(shè)置T1=DistMin(i)使得聚類結(jié)果最優(yōu)。

    2.3 K-means算法改進(jìn)

    傳統(tǒng)K-means算法需要迭代計(jì)算數(shù)據(jù)對(duì)象與中心點(diǎn)的間距,完成數(shù)據(jù)對(duì)象的劃分,然而在該過(guò)程中存在許多不必要的距離計(jì)算,為了減少K-means算法的計(jì)算量,加快算法的收斂速度,本文引入三角不等式定理對(duì)其進(jìn)行優(yōu)化改進(jìn)[9]。

    定理1:任意一個(gè)三角形,兩邊之和大于第三邊,兩邊之差小于第三邊。由于歐式距離也滿足三角不等式的特性,因此將其擴(kuò)展到多維的歐幾里得空間可知:對(duì)于歐式空間的任意向量x、b、c,滿足:d(x,b)+d(b,c)≥d(x,c)和d(x,b)-d(b,c)≤d(x,c) 成立。

    對(duì)于任意一個(gè)向量x和兩個(gè)聚類中心b、c,根據(jù)三角不等式定理可得:d(x,b)+d(b,c)≥d(x,c),但是為了避免計(jì)算距離d(x,b),需要得到d(x,b)≤d(x,c)這個(gè)不等式關(guān)系,給出引理及其證明過(guò)程如下:

    引理1:假設(shè)xp是數(shù)據(jù)集中的任意一個(gè)向量,ci是向量xp當(dāng)前的簇中心,d(xp,ci)已知且cj是除ci外的任意一個(gè)簇中心,如果2d(xp,ci)≤d(ci,cj),則有d(xp,ci)≤d(xp,cj)。

    證明:假設(shè)有2d(xp,ci)≤d(ci,cj),兩邊同時(shí)減去,得d(xp,ci)≤d(ci,cj)-d(xp,ci),由定理1可得d(ci,cj)-d(xp,ci)≤d(xp,cj):因此可以得到結(jié)論d(xp,ci)≤d(xp,cj),即向量xp屬于簇中心ci。

    根據(jù)引理的推導(dǎo)過(guò)程可知,基于三角不等式的改進(jìn)方法可以有效減少K-means冗余的距離計(jì)算,應(yīng)用如下:已知是數(shù)據(jù)集中任意一個(gè)向量,ci是向量的當(dāng)前簇中心,d(xp,ci)已知且cj是另外的任一簇中心,根據(jù)引理1可知,如果2d(xp,cj)≤d(ci,cj),則可以確定數(shù)據(jù)向量xp屬于簇中心ci,此時(shí)就不再需要計(jì)算d(xp,cj)。

    2.4 改進(jìn)算法的MapReduce并行化實(shí)現(xiàn)

    本文主要從兩方面對(duì)Canopy-K-means算法進(jìn)行改進(jìn),首先引入“最大最小原則”優(yōu)化Canopy中心點(diǎn)的選??;接著利用三角不等式對(duì)K-means算法進(jìn)行優(yōu)化,減少冗余的距離計(jì)算,加快算法的收斂速度。改進(jìn)后的算法主要分為兩個(gè)階段,其流程如圖1所示。

    圖1 改進(jìn)Canopy-K-means算法流程圖

    階段一:基于“最大最小原則”改進(jìn)的Canopy算法在MapReduce框架上的并行化實(shí)現(xiàn),用來(lái)選取初始聚類中心點(diǎn)及K值。該階段由Map函數(shù)和Reduce函數(shù)兩部分完成。算法的偽代碼如下:

    Map函數(shù)

    輸入:節(jié)點(diǎn)數(shù)據(jù)集合List

    輸出:節(jié)點(diǎn)Canopy中心點(diǎn)集合Ci

    1)Ci=null

    2)While (List!=null)

    3)If (Ci=null)

    4)在List中隨機(jī)選取一個(gè)數(shù)據(jù)點(diǎn)作為Canopy中心點(diǎn),保存至Ci中,并將該數(shù)據(jù)點(diǎn)從中刪除

    5)Else if (Ci!=null)

    6)遍歷計(jì)算中的數(shù)據(jù)點(diǎn)到集合Ci各個(gè)中心點(diǎn)的距離,取距離的最小值dn保存到集合中

    7)求出集合D中的最大值Max(D)

    8)把Max(D)對(duì)應(yīng)的數(shù)據(jù)點(diǎn)作為Canopy集合的下一個(gè)中心點(diǎn),存入集合Ci中

    9)End If

    10)End While

    11)output(Ci)

    Reduce函數(shù):

    輸入:各個(gè)節(jié)點(diǎn)在Map階段產(chǎn)生的局部中心點(diǎn)集合C{C1,C2,C3,…,Cn}

    輸出:Canopy中心點(diǎn)集合U;

    1)計(jì)算集合C中的數(shù)據(jù)總量K=Count(C)且令j=0

    2)while(j

    3)計(jì)算全局Canopy中心點(diǎn)集合C中Depth(i)的最大值

    4)令T1=Max(Depth(i)),j++

    5)把集合C中的前i個(gè)中心點(diǎn)賦值給集合U

    6)End While

    7)K=Count(U)

    8)OutPut(U)

    階段二:將階段一得到的Canopy中心點(diǎn)作為初始中心點(diǎn)完成K-means聚類。此外,在此階段引入三角不等式定理,減少迭代過(guò)程中不必要的距離計(jì)算。該階段由Map函數(shù)、Combine函數(shù)和Reduce函數(shù)三部分組成。算法的偽代碼如下:

    Map函數(shù)

    輸入:K值和Canopy中心點(diǎn)集合U,數(shù)據(jù)集X={x1,x2,x3,…,xn}

    輸出:聚類中心點(diǎn)集合W

    1)While (W!=U)

    2)計(jì)算集合U任意兩中心點(diǎn)間的距離d(c,c′)

    3)保存最短距離S(c)=min(d(c,c′))

    4)計(jì)算數(shù)據(jù)集X中的數(shù)據(jù)點(diǎn)到集合U中第i個(gè)中心點(diǎn)的距離dist[i]

    5)If (2dist[i]≤S(c)),則標(biāo)記該數(shù)據(jù)點(diǎn)屬于第i個(gè)Canopy中心點(diǎn)的簇,然后從X中刪除該數(shù)據(jù)點(diǎn);對(duì)于不符合條件的數(shù)據(jù)點(diǎn),保存其到該中心點(diǎn)的距離

    6)If (X!=null)

    7)計(jì)算不符合條件的數(shù)據(jù)點(diǎn)與中心點(diǎn)的距離,將其劃分給距離最小的簇中心并進(jìn)行標(biāo)記

    8)計(jì)算被標(biāo)記點(diǎn)的新簇中新W′

    9)If (W=W′)

    10)Break

    11)Else 返回2)重新計(jì)算

    12)End While

    Combine函數(shù):

    輸入:X中數(shù)據(jù)點(diǎn)所屬簇下標(biāo)key,key值所屬的鍵值對(duì)列表

    輸出:X中數(shù)據(jù)點(diǎn)所屬簇下標(biāo)key,各個(gè)簇內(nèi)被標(biāo)記數(shù)據(jù)點(diǎn)的各維累加值以及值key所屬的鍵值對(duì)列表;

    在本地解析各維坐標(biāo)值,求出各維的累加值,并保存到對(duì)應(yīng)列表中。

    Reduce函數(shù):

    輸入:X中數(shù)據(jù)點(diǎn)所對(duì)應(yīng)下標(biāo)key,key值所屬的鍵值對(duì)列表

    輸出:X中數(shù)據(jù)點(diǎn)所屬簇的下標(biāo)key,最終的簇心W

    1)初始化Num=0,記錄所屬簇內(nèi)數(shù)據(jù)點(diǎn)的個(gè)數(shù)

    2)While (X.hasNext())

    3)解析X.next()中的各維下標(biāo)值,計(jì)算樣本個(gè)數(shù)num

    4)計(jì)算各維下標(biāo)值的累加和并進(jìn)行存儲(chǔ)

    5)Num+num

    6)End While

    7)用各維下標(biāo)的累加和除以Num,計(jì)算新的簇中心W

    Reduce函數(shù)結(jié)束后,對(duì)比新生成的簇心和之前的簇心是否相同,若簇中心相同,則算法結(jié)束,否則繼續(xù)執(zhí)行上述過(guò)程,直到簇中心不再變化。

    3 實(shí)驗(yàn)與分析

    3.1 實(shí)驗(yàn)環(huán)境及測(cè)試數(shù)據(jù)集

    本文的Hadoop集群環(huán)境搭建在一臺(tái)I7CPU,16 G內(nèi)存,2 TB硬盤服務(wù)器之上。集群包括1個(gè)Master節(jié)點(diǎn)和5個(gè)Slave節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)均為2 GB內(nèi)存,200 G硬盤,操作系統(tǒng)為CentOs 6.5,jdk為jdk1.8.0_181,Hadoop版本為2.7.3,程序開發(fā)工具為Eclipse,算法全部由Java語(yǔ)言完成。

    實(shí)驗(yàn)的數(shù)據(jù)集是經(jīng)過(guò)中文分詞、去停去重和文本特征提取等預(yù)處理后的微博數(shù)據(jù)。本文共構(gòu)造了100 M、500 M、1 G和2 G這4個(gè)數(shù)據(jù)量依次遞增的微博數(shù)據(jù)集,用于改進(jìn)Canopy-K-means算法的測(cè)試。

    3.2 實(shí)驗(yàn)結(jié)果與分析

    3.2.1 算法準(zhǔn)確率分析

    本文以準(zhǔn)確率(precision)、召回率(recall)和F值作為評(píng)判指標(biāo)[10]。對(duì)比傳統(tǒng)K-means算法(算法1),Canopy-K-means算法(算法2)以及本文改進(jìn)算法(算法3)在文本聚類上的優(yōu)劣,分別在100 M、500 M、1 G和2 G數(shù)據(jù)集各聚類10次,取各項(xiàng)指標(biāo)的平均值進(jìn)行比較,結(jié)果如表1所示。

    表1 文本聚類測(cè)試結(jié)果

    由表1中的測(cè)試結(jié)果可知,與常規(guī)K-means算法相比,Canopy-K-means算法的準(zhǔn)確率提升了約10%,而本文改進(jìn)算法與Canopy-K-means算法相比,準(zhǔn)確率提升了約7%。這是由于改進(jìn)后的Canopy-K-means算法,優(yōu)化了Canopy的中心點(diǎn)的選取,根據(jù)深度指標(biāo)計(jì)算公式,確定了Canopy中心點(diǎn)的最優(yōu)個(gè)數(shù)與最佳區(qū)域半徑,從而使得聚類結(jié)果更加穩(wěn)定,算法的準(zhǔn)確率得到提高。

    3.2.2 算法擴(kuò)展性分析

    加速比是常用來(lái)衡量程序并行化執(zhí)行效率的重要指標(biāo)。它的定義如下:Sp=Ts/Tp。此處,為在單機(jī)條件之下算法運(yùn)行的具體時(shí)長(zhǎng),而Tp則是在并行條件之下算法運(yùn)行的具體時(shí)長(zhǎng)。加速比Sp越大,表示算法的效率越高??紤]到單機(jī)環(huán)境處理大規(guī)模數(shù)據(jù)時(shí)系統(tǒng)容易崩潰,因此本文以1個(gè)數(shù)據(jù)節(jié)點(diǎn)下算法的執(zhí)行時(shí)長(zhǎng)作為。

    為了對(duì)比改進(jìn)后算法和未改進(jìn)算法在擴(kuò)展性上的差異。使用K-means算法、Canopy-K-means算法以及改進(jìn)的Canopy-K-means算法分別對(duì)1 G的數(shù)據(jù)集進(jìn)行5次聚類運(yùn)算,取其平均運(yùn)算時(shí)長(zhǎng),計(jì)算其加速比,測(cè)試結(jié)果如圖2所示。

    圖2 相同數(shù)據(jù)集不同算法加速比

    根據(jù)圖2可知,在相同規(guī)模節(jié)點(diǎn)數(shù)目下,本文改進(jìn)算法的執(zhí)行效率明顯優(yōu)于其它兩種算法,這是由于“最大最小原則”的中心點(diǎn)選取方法優(yōu)化了Canopy中心點(diǎn)的選取,減少了算法的迭代次數(shù),并且基于三角不等式定理改進(jìn)的K-means算法,有效減少了迭代過(guò)程中存在的冗余距離計(jì)算,算法的執(zhí)行速度得到提高。

    為了驗(yàn)證改進(jìn)后算法在不同數(shù)據(jù)集上的并行執(zhí)行效率,分別使用100 M、500 M、1 G和2 G這4個(gè)數(shù)據(jù)集,在節(jié)點(diǎn)個(gè)數(shù)為1、3、5的Hadoop集群上聚類5次,取其平均運(yùn)算時(shí)長(zhǎng),計(jì)算加速比。結(jié)果如圖3所示。

    圖3 改進(jìn)算法在不同數(shù)據(jù)集下的加速比

    根據(jù)圖3可知,由于100 M的數(shù)據(jù)集相對(duì)較小,在集群的節(jié)點(diǎn)為2時(shí),算法的加速比有所提升,此時(shí),數(shù)據(jù)處理時(shí)長(zhǎng)超過(guò)節(jié)點(diǎn)間的通信時(shí)長(zhǎng);當(dāng)集群節(jié)點(diǎn)為3時(shí),算法的加速比趨于平穩(wěn),說(shuō)明此時(shí)集群資源的利用率最高;然后隨著節(jié)點(diǎn)數(shù)目的不斷增加,加速比略有下降,說(shuō)明此時(shí)處理數(shù)據(jù)的時(shí)間要小于節(jié)點(diǎn)間的通信時(shí)間,集群資源得到浪費(fèi)。對(duì)于500 M、1 G、2 G這些數(shù)據(jù)規(guī)模較大數(shù)據(jù)集來(lái)說(shuō),隨著節(jié)點(diǎn)數(shù)目的增加,算法的加速比呈現(xiàn)上升狀態(tài),并且由數(shù)據(jù)規(guī)模為500 M的加速比變化曲線可以看出,隨著節(jié)點(diǎn)數(shù)目的不斷增加,加速比增長(zhǎng)的幅度在逐漸變小。由此可以看出改進(jìn)后的Canopy-K-means算法在并行化執(zhí)行時(shí)能夠有效提升聚類效率,并且數(shù)據(jù)量越大時(shí)算法的效率越高。

    4 結(jié)束語(yǔ)

    本文通過(guò)引入“最大最小原則”來(lái)優(yōu)化Canopy中心點(diǎn)的選取,進(jìn)而定義深度指標(biāo)計(jì)算公式,計(jì)算得到最佳的Canopy個(gè)數(shù)及區(qū)域半徑,避免了傳統(tǒng)Canopy算法初始閾值人為指定的問題;接著借助三角不等式定理對(duì)K-means算法進(jìn)行優(yōu)化,減少冗余的距離計(jì)算,加快收斂速度;最后結(jié)合MapReduce分布式框架將改進(jìn)后的算法并行化實(shí)現(xiàn),在構(gòu)建的微博文本數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明改進(jìn)算法的準(zhǔn)確率和擴(kuò)展性都得到提升。但是,由于Canopy中心點(diǎn)的計(jì)算花費(fèi)時(shí)間較長(zhǎng),如何在保證聚類準(zhǔn)確度的同時(shí),提高Canopy中心點(diǎn)的生成效率還有待研究。

    亚洲精品成人av观看孕妇| 亚洲av不卡在线观看| 欧美日韩视频高清一区二区三区二| 国产精品女同一区二区软件| 九色成人免费人妻av| 亚洲精品久久久久久婷婷小说| 国产精品久久久久久久电影| 男女免费视频国产| 国产av精品麻豆| 免费观看av网站的网址| 看十八女毛片水多多多| 亚洲av二区三区四区| 高清午夜精品一区二区三区| 免费观看在线日韩| 久久久亚洲精品成人影院| 丰满人妻一区二区三区视频av| 亚洲,一卡二卡三卡| 亚洲欧美中文字幕日韩二区| 午夜影院在线不卡| 我的老师免费观看完整版| 99久久中文字幕三级久久日本| 久久韩国三级中文字幕| 自线自在国产av| 少妇的逼水好多| 国产淫语在线视频| 久久久久久人妻| 99热这里只有精品一区| 狠狠精品人妻久久久久久综合| 日本黄色片子视频| 少妇 在线观看| 午夜福利影视在线免费观看| 久久久久国产精品人妻一区二区| 欧美 日韩 精品 国产| 久久久久久久久久久久大奶| 久久久国产精品麻豆| 亚洲第一区二区三区不卡| 久久99一区二区三区| a级毛片在线看网站| 国内少妇人妻偷人精品xxx网站| 久久免费观看电影| 国产黄频视频在线观看| 26uuu在线亚洲综合色| 一区二区av电影网| 亚洲国产欧美在线一区| 免费av中文字幕在线| 国产日韩一区二区三区精品不卡 | 日韩伦理黄色片| 最近中文字幕高清免费大全6| 成人二区视频| 女人久久www免费人成看片| 在线观看人妻少妇| 免费看不卡的av| 日日啪夜夜撸| 啦啦啦中文免费视频观看日本| 丝袜在线中文字幕| 国产探花极品一区二区| 国产精品秋霞免费鲁丝片| 啦啦啦视频在线资源免费观看| 国产无遮挡羞羞视频在线观看| 国产伦在线观看视频一区| 亚洲真实伦在线观看| 久久久久人妻精品一区果冻| 水蜜桃什么品种好| 中文字幕免费在线视频6| 久久99热这里只频精品6学生| 久久久久人妻精品一区果冻| 91久久精品国产一区二区成人| 三级国产精品片| 精品亚洲乱码少妇综合久久| 国产午夜精品一二区理论片| av福利片在线观看| 国产极品天堂在线| 成人国产av品久久久| 亚洲国产欧美日韩在线播放 | 亚洲精品日韩在线中文字幕| 在线观看av片永久免费下载| 少妇人妻一区二区三区视频| 国产一区二区在线观看日韩| 少妇人妻 视频| 在线观看三级黄色| 欧美国产精品一级二级三级 | 人人妻人人看人人澡| 色5月婷婷丁香| 大陆偷拍与自拍| 一区二区三区精品91| 日本wwww免费看| 五月玫瑰六月丁香| 嫩草影院新地址| 男人和女人高潮做爰伦理| 狠狠精品人妻久久久久久综合| 精品一品国产午夜福利视频| 在线观看av片永久免费下载| 亚洲色图综合在线观看| 国产高清三级在线| 亚洲精品亚洲一区二区| 日日摸夜夜添夜夜爱| 亚洲国产精品国产精品| 在线看a的网站| 国产精品人妻久久久影院| 久久综合国产亚洲精品| 日韩欧美精品免费久久| 青春草国产在线视频| 久久久国产欧美日韩av| 久久婷婷青草| 亚洲久久久国产精品| 亚洲欧美精品自产自拍| 日本色播在线视频| 七月丁香在线播放| 中国国产av一级| 在线观看免费高清a一片| 成年人午夜在线观看视频| 超碰97精品在线观看| 男人添女人高潮全过程视频| 精品酒店卫生间| 亚洲精品视频女| 99久久精品热视频| 噜噜噜噜噜久久久久久91| 老司机亚洲免费影院| 欧美变态另类bdsm刘玥| 久久精品国产自在天天线| 王馨瑶露胸无遮挡在线观看| 丝袜喷水一区| 欧美亚洲 丝袜 人妻 在线| 免费观看性生交大片5| 丝瓜视频免费看黄片| 国产av码专区亚洲av| 国产男人的电影天堂91| 另类精品久久| 看十八女毛片水多多多| 欧美少妇被猛烈插入视频| a级毛色黄片| 国产在线视频一区二区| 99久久精品热视频| 国产中年淑女户外野战色| 亚洲在久久综合| 精品久久久久久电影网| 2021少妇久久久久久久久久久| 美女中出高潮动态图| 久久久午夜欧美精品| 国产黄片视频在线免费观看| 国产成人精品一,二区| 寂寞人妻少妇视频99o| 三级国产精品欧美在线观看| 中文字幕人妻熟人妻熟丝袜美| 大又大粗又爽又黄少妇毛片口| 黄色一级大片看看| 日本黄大片高清| 国产 一区精品| xxx大片免费视频| 中文字幕av电影在线播放| 日韩一区二区三区影片| 新久久久久国产一级毛片| 久久久久久久久久成人| 国产精品一区二区性色av| 精品久久久久久电影网| 曰老女人黄片| www.av在线官网国产| 亚洲av.av天堂| 欧美日韩av久久| 久久久久久久久久成人| 在线观看三级黄色| 欧美 日韩 精品 国产| 全区人妻精品视频| 亚洲情色 制服丝袜| 熟妇人妻不卡中文字幕| 夜夜看夜夜爽夜夜摸| 一边亲一边摸免费视频| 亚洲国产欧美日韩在线播放 | 精品少妇久久久久久888优播| 中国美白少妇内射xxxbb| 观看av在线不卡| 亚洲欧美清纯卡通| 久久亚洲国产成人精品v| 视频区图区小说| 一本一本综合久久| 黄色一级大片看看| 日韩强制内射视频| 久久久国产欧美日韩av| 亚洲欧美精品专区久久| 国模一区二区三区四区视频| 日韩成人伦理影院| 日日撸夜夜添| 日韩欧美精品免费久久| 精品亚洲成a人片在线观看| 中文字幕亚洲精品专区| 春色校园在线视频观看| 国产91av在线免费观看| 看免费成人av毛片| 男女啪啪激烈高潮av片| 亚洲av福利一区| 黄色毛片三级朝国网站 | 国产伦在线观看视频一区| 伊人亚洲综合成人网| 亚洲国产av新网站| av在线播放精品| 亚洲精品第二区| 国产av一区二区精品久久| 三级国产精品欧美在线观看| 亚洲怡红院男人天堂| 亚洲,一卡二卡三卡| 妹子高潮喷水视频| 女人久久www免费人成看片| 七月丁香在线播放| 国产精品久久久久成人av| 免费人成在线观看视频色| 亚洲天堂av无毛| 美女cb高潮喷水在线观看| 91精品一卡2卡3卡4卡| 99久久精品热视频| 91精品国产九色| 成年美女黄网站色视频大全免费 | 人妻系列 视频| 久久女婷五月综合色啪小说| 日韩成人av中文字幕在线观看| av在线老鸭窝| 如日韩欧美国产精品一区二区三区 | 草草在线视频免费看| 亚洲国产色片| 波野结衣二区三区在线| 中国国产av一级| 老女人水多毛片| 日产精品乱码卡一卡2卡三| 成人无遮挡网站| 97超碰精品成人国产| 亚洲伊人久久精品综合| 日本黄色片子视频| 日韩av不卡免费在线播放| 久久韩国三级中文字幕| 91精品一卡2卡3卡4卡| 成人国产av品久久久| 又黄又爽又刺激的免费视频.| 国产午夜精品久久久久久一区二区三区| 一级毛片我不卡| 人妻一区二区av| 亚洲精品色激情综合| 久热久热在线精品观看| 国产亚洲5aaaaa淫片| 午夜福利影视在线免费观看| 女人久久www免费人成看片| 激情五月婷婷亚洲| 日韩视频在线欧美| 亚洲伊人久久精品综合| 女的被弄到高潮叫床怎么办| 日韩一本色道免费dvd| 精品久久久精品久久久| 看免费成人av毛片| 亚洲精品国产成人久久av| 国产乱人偷精品视频| 2022亚洲国产成人精品| a 毛片基地| 三级经典国产精品| 人人澡人人妻人| 国产日韩欧美在线精品| 99热网站在线观看| 纯流量卡能插随身wifi吗| 交换朋友夫妻互换小说| 91精品国产国语对白视频| 国产av一区二区精品久久| 日日撸夜夜添| 晚上一个人看的免费电影| 精品人妻偷拍中文字幕| 2021少妇久久久久久久久久久| 九草在线视频观看| 偷拍熟女少妇极品色| 国产淫语在线视频| 在线观看三级黄色| av在线老鸭窝| av免费在线看不卡| 亚洲精品一区蜜桃| av免费观看日本| 欧美精品亚洲一区二区| 大话2 男鬼变身卡| 国产精品久久久久成人av| 女性生殖器流出的白浆| 日韩成人av中文字幕在线观看| 久热这里只有精品99| 亚洲国产精品专区欧美| 国产无遮挡羞羞视频在线观看| 天天操日日干夜夜撸| 六月丁香七月| 黄色一级大片看看| 啦啦啦中文免费视频观看日本| 国产又色又爽无遮挡免| 2018国产大陆天天弄谢| 少妇 在线观看| 免费人成在线观看视频色| 蜜桃久久精品国产亚洲av| 成人亚洲精品一区在线观看| 亚洲欧美成人综合另类久久久| 夜夜骑夜夜射夜夜干| 免费人成在线观看视频色| 91久久精品电影网| 一级片'在线观看视频| 水蜜桃什么品种好| 国产又色又爽无遮挡免| 亚洲美女黄色视频免费看| 国国产精品蜜臀av免费| 亚洲av综合色区一区| 色网站视频免费| 午夜激情久久久久久久| 精品少妇久久久久久888优播| 国精品久久久久久国模美| 一级爰片在线观看| 91久久精品电影网| 少妇裸体淫交视频免费看高清| av线在线观看网站| 亚洲av日韩在线播放| 9色porny在线观看| 久久久a久久爽久久v久久| 男女边摸边吃奶| 久久99热这里只频精品6学生| 丁香六月天网| 亚洲精品亚洲一区二区| 国产av国产精品国产| 成人综合一区亚洲| 丁香六月天网| 久久99一区二区三区| 9色porny在线观看| av在线老鸭窝| 国产精品无大码| 欧美 亚洲 国产 日韩一| 18+在线观看网站| 国产伦精品一区二区三区视频9| 精品人妻熟女av久视频| 性高湖久久久久久久久免费观看| 国产精品国产三级国产av玫瑰| 秋霞在线观看毛片| 色网站视频免费| 成人18禁高潮啪啪吃奶动态图 | 国产视频首页在线观看| 国产在线一区二区三区精| 亚洲精品亚洲一区二区| 美女福利国产在线| 日韩精品免费视频一区二区三区 | 婷婷色av中文字幕| 欧美xxⅹ黑人| 黄色怎么调成土黄色| 在线观看一区二区三区激情| 亚洲精品乱码久久久久久按摩| 91久久精品国产一区二区成人| 久久精品熟女亚洲av麻豆精品| 国产精品福利在线免费观看| 久久午夜福利片| 国产成人午夜福利电影在线观看| 菩萨蛮人人尽说江南好唐韦庄| 97精品久久久久久久久久精品| 久久久久久久久久久免费av| 一边亲一边摸免费视频| 亚洲人成网站在线播| 国产成人精品久久久久久| 日本av手机在线免费观看| 高清在线视频一区二区三区| 日韩一本色道免费dvd| 18禁在线无遮挡免费观看视频| 两个人免费观看高清视频 | 熟妇人妻不卡中文字幕| 久久久久久久久久久免费av| 欧美国产精品一级二级三级 | www.色视频.com| 亚洲欧美日韩另类电影网站| av天堂中文字幕网| 国产日韩一区二区三区精品不卡 | 秋霞在线观看毛片| 高清午夜精品一区二区三区| 婷婷色综合www| 亚洲精华国产精华液的使用体验| 精品久久久久久电影网| 熟女人妻精品中文字幕| 九草在线视频观看| 亚洲精品国产成人久久av| 狂野欧美激情性bbbbbb| 国产毛片在线视频| 精品国产一区二区久久| 狂野欧美白嫩少妇大欣赏| 性高湖久久久久久久久免费观看| 国产亚洲午夜精品一区二区久久| 18禁动态无遮挡网站| 日韩av不卡免费在线播放| 亚洲婷婷狠狠爱综合网| 国产又色又爽无遮挡免| 国产精品国产三级国产av玫瑰| 欧美3d第一页| 男女免费视频国产| 久久青草综合色| 99久久精品一区二区三区| 日韩不卡一区二区三区视频在线| 国产精品99久久99久久久不卡 | 精品亚洲成a人片在线观看| 日韩av在线免费看完整版不卡| 国产精品久久久久久av不卡| 久久毛片免费看一区二区三区| 国产精品国产三级国产av玫瑰| 如何舔出高潮| 国产成人精品无人区| 午夜福利视频精品| 在线观看免费视频网站a站| 精品久久久久久电影网| 日本黄色片子视频| 三级国产精品欧美在线观看| 高清不卡的av网站| 赤兔流量卡办理| 桃花免费在线播放| 欧美 日韩 精品 国产| av.在线天堂| 国产免费视频播放在线视频| 97超碰精品成人国产| 亚洲自偷自拍三级| 日韩一区二区三区影片| 色94色欧美一区二区| 欧美日韩视频高清一区二区三区二| 日本欧美视频一区| 久久精品久久久久久噜噜老黄| 丰满饥渴人妻一区二区三| 亚洲电影在线观看av| av在线播放精品| 在线播放无遮挡| 亚洲av福利一区| av线在线观看网站| 国产精品无大码| 狂野欧美激情性bbbbbb| 久久人妻熟女aⅴ| 在线观看免费高清a一片| 欧美人与善性xxx| 亚洲内射少妇av| 久久精品国产鲁丝片午夜精品| 如日韩欧美国产精品一区二区三区 | 亚洲成人av在线免费| 欧美性感艳星| 成人美女网站在线观看视频| 国内揄拍国产精品人妻在线| 一级黄片播放器| 亚洲第一区二区三区不卡| 国产免费视频播放在线视频| 亚洲无线观看免费| 国产精品人妻久久久影院| 亚洲精品国产av蜜桃| 人妻夜夜爽99麻豆av| av国产久精品久网站免费入址| 亚洲久久久国产精品| 一级a做视频免费观看| av在线app专区| 久久国产乱子免费精品| 精品一区二区三区视频在线| 亚洲成色77777| 亚洲av电影在线观看一区二区三区| 成人美女网站在线观看视频| 精品国产乱码久久久久久小说| 少妇人妻精品综合一区二区| 久久人妻熟女aⅴ| 免费观看无遮挡的男女| 中国美白少妇内射xxxbb| 九色成人免费人妻av| 国产日韩欧美亚洲二区| 69精品国产乱码久久久| 99热6这里只有精品| 免费观看av网站的网址| 热re99久久国产66热| 国产在线视频一区二区| 久久久久人妻精品一区果冻| 久久婷婷青草| 黑人巨大精品欧美一区二区蜜桃 | 午夜激情福利司机影院| 天堂中文最新版在线下载| 最黄视频免费看| 高清黄色对白视频在线免费看 | 欧美人与善性xxx| 多毛熟女@视频| 免费黄频网站在线观看国产| 又大又黄又爽视频免费| 国产视频内射| 伊人亚洲综合成人网| 久久国内精品自在自线图片| 亚洲,欧美,日韩| 国产精品一区二区在线不卡| 精品视频人人做人人爽| 中国三级夫妇交换| 熟妇人妻不卡中文字幕| 在线观看免费日韩欧美大片 | 国产视频内射| 国内少妇人妻偷人精品xxx网站| 最后的刺客免费高清国语| 看免费成人av毛片| 国产精品欧美亚洲77777| 久久久国产欧美日韩av| 亚洲国产av新网站| 纯流量卡能插随身wifi吗| 亚洲精品日韩av片在线观看| 狂野欧美白嫩少妇大欣赏| 免费观看在线日韩| 一级毛片我不卡| 大陆偷拍与自拍| 9色porny在线观看| 另类亚洲欧美激情| 国产亚洲91精品色在线| 欧美精品高潮呻吟av久久| 国产成人91sexporn| 九九爱精品视频在线观看| 国产极品天堂在线| 亚洲人与动物交配视频| 永久免费av网站大全| 亚洲va在线va天堂va国产| 波野结衣二区三区在线| 久久6这里有精品| 91精品一卡2卡3卡4卡| a级毛片免费高清观看在线播放| 老女人水多毛片| www.色视频.com| 国产在线一区二区三区精| 少妇丰满av| 自线自在国产av| 深夜a级毛片| 久久精品国产亚洲网站| 美女大奶头黄色视频| 丝袜脚勾引网站| 纵有疾风起免费观看全集完整版| 我要看黄色一级片免费的| 夫妻性生交免费视频一级片| 午夜福利视频精品| 成年人免费黄色播放视频 | 亚洲人与动物交配视频| 亚洲国产精品一区二区三区在线| 大香蕉97超碰在线| 熟女电影av网| 高清欧美精品videossex| 你懂的网址亚洲精品在线观看| 亚洲国产最新在线播放| 欧美日韩综合久久久久久| 精品久久久精品久久久| 欧美日韩综合久久久久久| 日韩免费高清中文字幕av| 熟女电影av网| 高清欧美精品videossex| 亚洲欧美一区二区三区黑人 | 精品99又大又爽又粗少妇毛片| 99热国产这里只有精品6| 欧美 日韩 精品 国产| 看非洲黑人一级黄片| 亚洲国产欧美日韩在线播放 | 亚洲国产成人一精品久久久| 精品国产乱码久久久久久小说| 特大巨黑吊av在线直播| 亚洲天堂av无毛| 纯流量卡能插随身wifi吗| 日本wwww免费看| 在线观看人妻少妇| 国产欧美另类精品又又久久亚洲欧美| 丁香六月天网| 啦啦啦在线观看免费高清www| 少妇精品久久久久久久| 高清av免费在线| 熟女av电影| 久久人人爽av亚洲精品天堂| 日韩,欧美,国产一区二区三区| 一二三四中文在线观看免费高清| 亚洲av二区三区四区| 日韩欧美精品免费久久| av.在线天堂| 亚洲国产色片| 亚洲精品日韩在线中文字幕| 亚洲国产精品成人久久小说| 亚洲国产精品一区二区三区在线| 亚洲国产精品成人久久小说| 男女边摸边吃奶| 韩国高清视频一区二区三区| 亚洲天堂av无毛| 另类精品久久| 久久精品久久久久久噜噜老黄| 久久精品国产鲁丝片午夜精品| 日韩大片免费观看网站| 在线观看免费视频网站a站| 噜噜噜噜噜久久久久久91| av视频免费观看在线观看| 18禁在线播放成人免费| 国产精品一区二区三区四区免费观看| av卡一久久| 高清午夜精品一区二区三区| 下体分泌物呈黄色| 男人舔奶头视频| 国产精品伦人一区二区| 视频区图区小说| 老女人水多毛片| 91久久精品国产一区二区三区| 日韩一区二区视频免费看| 在线观看国产h片| 岛国毛片在线播放| 一区二区三区乱码不卡18| 亚洲精品aⅴ在线观看| 日韩 亚洲 欧美在线| 日本av免费视频播放| 女的被弄到高潮叫床怎么办| 搡女人真爽免费视频火全软件| 免费黄频网站在线观看国产| 免费久久久久久久精品成人欧美视频 | 丰满饥渴人妻一区二区三| 少妇丰满av| 免费黄频网站在线观看国产| 男女边吃奶边做爰视频| 中文资源天堂在线| 天美传媒精品一区二区| 久久国产精品大桥未久av | 永久网站在线| 人妻少妇偷人精品九色| 自拍偷自拍亚洲精品老妇| 久久久久久久国产电影| 一本色道久久久久久精品综合| 日韩电影二区| 亚洲av电影在线观看一区二区三区| 久久久久久久久久成人| 亚洲婷婷狠狠爱综合网| 中文天堂在线官网| 青春草国产在线视频| 少妇人妻 视频| 欧美97在线视频| 人人澡人人妻人| 大陆偷拍与自拍|