• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于云計(jì)算與非負(fù)矩陣分解的數(shù)據(jù)分級(jí)聚類

    2018-03-03 19:32:32趙艷萍徐勝超
    現(xiàn)代電子技術(shù) 2018年5期
    關(guān)鍵詞:聚類算法

    趙艷萍+徐勝超

    摘 要: 為了提高傳統(tǒng)數(shù)據(jù)聚類算法在大數(shù)據(jù)挖掘應(yīng)用中的性能,借助云計(jì)算的相關(guān)技術(shù),并結(jié)合非負(fù)矩陣分解方法設(shè)計(jì)并實(shí)現(xiàn)了一種并行的數(shù)據(jù)層次聚類算法。該算法采用MapReduce編程平臺(tái),利用Hadoop的HDFS存儲(chǔ)大容量的電信運(yùn)營商數(shù)據(jù);描述了MapReduce的數(shù)據(jù)分級(jí)聚類并行處理的工作機(jī)制與流程;通過Map和Reduce這種主?從編程模式很方便地使數(shù)據(jù)分級(jí)聚類的子任務(wù)在Hadoop的PC集群上運(yùn)行。實(shí)驗(yàn)結(jié)果表明,該方法比傳統(tǒng)用于數(shù)據(jù)聚類的非負(fù)矩陣方法具有更好的運(yùn)行時(shí)間與加速比,能夠在可以接受的時(shí)間范圍內(nèi)完成電信運(yùn)營商的大數(shù)據(jù)處理。

    關(guān)鍵詞: 云計(jì)算; 分級(jí)聚類; MapReduce; 非負(fù)矩陣分解; 聚類算法; 并行數(shù)據(jù)

    中圖分類號(hào): TN911.1?34; TP393.03 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)05?0056?05

    Abstract: In order to improve the performance of traditional data clustering methods on big data mining application, a parallel data hierarchical clustering algorithm was designed and realized by means of the correlation technologies of cloud computing and non?negative matrix factorization (NMF) method. The MapReduce programming platform is used in the algorithm. The HDFS (Hadoop distributed file system) based on Hadoop is used to store the large?capacity data of telecom operators. The working mechanism and flow of data hierarchical clustering based on MapReduce are described in detail. The master?slave programming mode based on Map and Reduce makes the subtask of data hierarchical clustering operating on PC clusters based on Hadoop easily. The experimental results show that, in comparison with the traditional non?negative matrix method used in data clustering, the proposed method has shorter run time and smaller speedup ratio, and can realize the big data processing of telecom operator within the acceptable time.

    Keywords: cloud computing; hierarchical clustering; MapReduce; non?negative matrix factorization; clustering algorithm; parallel data

    0 引 言

    近年來移動(dòng)互聯(lián)網(wǎng)與物聯(lián)網(wǎng)的急速發(fā)展積累了大量的數(shù)據(jù)資源,這些海量數(shù)據(jù)中蘊(yùn)藏著大量可以應(yīng)用于個(gè)性化商務(wù)的有效信息[1?3],然而傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)是主要應(yīng)用于中小規(guī)模數(shù)據(jù)中的信息挖掘,為了從海量數(shù)據(jù)資源中挖掘出有用信息,必須采用新型的數(shù)據(jù)挖掘技術(shù),其中基于多維數(shù)據(jù)相似性的數(shù)據(jù)聚類作為一種新型數(shù)據(jù)挖掘技術(shù)正好解決上述問題。

    非負(fù)矩陣分解NMF(Non?negative Matrix Factorization)方法在多維數(shù)據(jù)相似性的數(shù)據(jù)聚類、文本聚類、社交網(wǎng)絡(luò)聚類中都得到了廣泛應(yīng)用,但其串行計(jì)算的時(shí)間復(fù)雜度較高,很難勝任大數(shù)據(jù)處理任務(wù)。早期在多維數(shù)據(jù)相似性的數(shù)據(jù)聚類并行處理領(lǐng)域中,有集群計(jì)算機(jī)與共享內(nèi)存計(jì)算的方式,還有網(wǎng)格計(jì)算、對(duì)等計(jì)算、廣域分布式計(jì)算等模式,這些模型都取得了很好的成果。但是在云計(jì)算、大數(shù)據(jù)時(shí)代,前期的分布式計(jì)算模式對(duì)海量的PB級(jí)的數(shù)據(jù)處理往往顯得不足[4?5],所以基于云計(jì)算的數(shù)據(jù)分級(jí)聚類應(yīng)該得到足夠的重視[6]。因此本文試圖探索利用云計(jì)算方式優(yōu)化傳統(tǒng)的基于非負(fù)矩陣分解的數(shù)據(jù)相似性聚類方法。

    云計(jì)算中的MapReduce技術(shù)[7]最早被Google用于大數(shù)據(jù)并行處理,其基本思想是將大數(shù)據(jù)集分解為成百上千的小數(shù)據(jù)集splits,采用Mapper和Reducer形式的類似主?從(Master?Slave)模式的并行處理。這一方法由于可以實(shí)現(xiàn)海量數(shù)據(jù)的并行處理,通過PC機(jī)就可以實(shí)現(xiàn)大型機(jī)才能完成的計(jì)算任務(wù),因此近年來得到了廣泛應(yīng)用。

    本文以基于非負(fù)矩陣分解的高維數(shù)據(jù)相似性聚類算法作為研究對(duì)象,以某電信運(yùn)營商的大容量數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象,設(shè)計(jì)了一種層次聚類方法并實(shí)現(xiàn)了數(shù)據(jù)聚類方法的MapReduce并行化,同時(shí)將該算法在Hadoop平臺(tái)上進(jìn)行實(shí)驗(yàn)和評(píng)估,最后的實(shí)驗(yàn)結(jié)果驗(yàn)證了該算法的高效性與可擴(kuò)展性。

    1 預(yù)備知識(shí)

    1.1 高維數(shù)據(jù)相似性聚類與非負(fù)矩陣分解

    相似性聚類[8]是基于數(shù)據(jù)在不同維度上的相似程度而對(duì)數(shù)據(jù)進(jìn)行分類,兩個(gè)數(shù)據(jù)點(diǎn)是否歸于同一類,判斷它們的相似度如何。當(dāng)它們之間的相似度大于某一值時(shí),則歸于同一聚類;否則,兩個(gè)數(shù)據(jù)點(diǎn)則分屬不同的聚類。endprint

    由于實(shí)際問題中大規(guī)模數(shù)據(jù)的存在,使得存儲(chǔ)這類大數(shù)據(jù)的矩陣非常龐大,且存放的信息分布不均勻,導(dǎo)致現(xiàn)有方法很難高效快速地處理矩陣存放的數(shù)據(jù)。為了更好地處理這類數(shù)據(jù),一類有效的方法是對(duì)矩陣進(jìn)行分解,從而使得描述問題的維度大大消減,同時(shí)也能夠?qū)?shù)據(jù)進(jìn)行壓縮和概括。針對(duì)這一點(diǎn),目前已有很多矩陣分解方法,如奇異值分解、獨(dú)立成分分析、主成分分析等。基于非負(fù)矩陣分解[9]的聚類分析所輸出的分解結(jié)果可以保證其元素非負(fù),代表真實(shí)的物理意義,因此近年來得到特別關(guān)注。

    基于非負(fù)矩陣分解NMF的聚類[10]方法如下:考慮到數(shù)據(jù)集可以表示為一個(gè)向量集而每一個(gè)向量代表維數(shù)據(jù)點(diǎn), NMF方法的目的是將劃分為兩個(gè)非負(fù)低秩矩陣和可通過盡量優(yōu)化如下公式實(shí)現(xiàn):

    根據(jù)文獻(xiàn)[10],可以通過以下的乘法更新規(guī)則得到:

    經(jīng)過迭代處理后,得到大小為的網(wǎng)絡(luò)的分割矩陣,其中第行對(duì)應(yīng)第個(gè)單元在聚類類型中的成員關(guān)系。進(jìn)一步將標(biāo)準(zhǔn)化,使這樣就對(duì)應(yīng)于第個(gè)單元屬于第個(gè)數(shù)據(jù)聚類的后驗(yàn)概率。

    1.2 MapReduce編程模型

    Hadoop是一個(gè)分布式系統(tǒng)基礎(chǔ)框架,它的核心是分布式文件系統(tǒng)機(jī)制HDFS(Hadoop Distributed File System)和MapReduce的主?從模式(Master?Slave)的編程機(jī)制。MapReduce框架由JobTracker和TaskTracker共同組成,它們分別擔(dān)任管理節(jié)點(diǎn)和執(zhí)行任務(wù)節(jié)點(diǎn)的角色,這兩個(gè)有機(jī)結(jié)合,從而實(shí)現(xiàn)MapReduce的正常運(yùn)轉(zhuǎn),保證任務(wù)的執(zhí)行。

    MapReduce數(shù)據(jù)相似性聚類并行處理的工作機(jī)制與流程如圖1所示,具體步驟如下:

    1) 對(duì)輸入的大數(shù)據(jù)文件進(jìn)行設(shè)置與切片;

    2) 主節(jié)點(diǎn)(Master)調(diào)度從屬節(jié)點(diǎn)(Worker)執(zhí)行Map子任務(wù);

    3) 從屬節(jié)點(diǎn)讀取輸入源片段;

    4) 從屬節(jié)點(diǎn)執(zhí)行Map子任務(wù),并將臨時(shí)結(jié)果文件保存在本地;

    5) 主節(jié)點(diǎn)調(diào)度從節(jié)點(diǎn)執(zhí)行Reduce子任務(wù),Reduce階段的從屬節(jié)點(diǎn)讀取Map子任務(wù)的輸出文件;

    6) 執(zhí)行Reduce子任務(wù),將最后的結(jié)果保存到HDFS分布式文件系統(tǒng)中。

    有了這6個(gè)步驟,數(shù)據(jù)分級(jí)聚類的編程人員就可以擺脫本身分布式計(jì)算的編程細(xì)節(jié),可以使用高級(jí)語言在規(guī)定時(shí)間內(nèi)完成大規(guī)模的數(shù)據(jù)分級(jí)聚類。

    另外,要實(shí)現(xiàn)本文的并行數(shù)據(jù)聚類算法,必須用到Hadoop的開源實(shí)現(xiàn),目前比較好的是Apache的Hadoop實(shí)現(xiàn),訪問地址為http://hadoop.apache.org/,Apache的Hadoop基于Java環(huán)境,它實(shí)現(xiàn)了HDFS文件系統(tǒng)和MapReduce。用戶只要繼承MapReduceBase,提供分別實(shí)現(xiàn)Map和Reduce的兩個(gè)類,并注冊Job即可實(shí)現(xiàn)自動(dòng)分布式運(yùn)行。

    2 NMF算法的MapReduce并行化實(shí)現(xiàn)

    2.1 基于非負(fù)矩陣分解的并行式分級(jí)聚類

    現(xiàn)有的基于相似性的數(shù)據(jù)聚類往往根據(jù)任意兩個(gè)高維數(shù)據(jù)在各個(gè)維度上的歐幾里德距離的緊密程度將數(shù)據(jù)劃分為幾個(gè)不同的聚類,屬于同一聚類的數(shù)據(jù)之間的相似度較高,屬于不同聚類的數(shù)據(jù)之間的相似度相對(duì)較低。然而這一方法的局限在于,無法像模塊度算法[11]那樣計(jì)算聚類的模塊度;無法對(duì)聚類內(nèi)部的相似程度進(jìn)行排序。

    因此,提出基于合適的相似性度量指標(biāo)來構(gòu)建高維數(shù)據(jù)的相似性矩陣,通過對(duì)數(shù)據(jù)集的相似性矩陣進(jìn)行非負(fù)矩陣分解來聚類相似程度較高的數(shù)據(jù)集合,將新的聚類視為新的數(shù)據(jù)點(diǎn),從而在縮小數(shù)據(jù)規(guī)模的同時(shí)增加數(shù)據(jù)的維度,然后重新計(jì)算當(dāng)前數(shù)據(jù)的相似性矩陣進(jìn)行非負(fù)矩陣分解,反復(fù)迭代,直至得到一個(gè)較優(yōu)的聚類序列。在這一計(jì)算過程中,計(jì)算量較大的階段是反復(fù)計(jì)算數(shù)據(jù)點(diǎn)彼此之間的相似程度。由于數(shù)據(jù)是多維的,其相似程度往往需要用給定維度數(shù)值的歐幾里德距離或余弦相似性來描述,在重構(gòu)相似性矩陣時(shí)的計(jì)算量非常大,因此,本文在此階段借用MapReduce分布式編程模型的優(yōu)勢,極大地提高了計(jì)算效率。

    2.2 基于MapReduce的并行數(shù)據(jù)處理

    首先是大數(shù)據(jù)存儲(chǔ)的問題,可以參考利用HDFS來管理這些海量數(shù)據(jù)。HDFS的設(shè)計(jì)本質(zhì)上是為了大量的數(shù)據(jù)能橫跨成百上千臺(tái)機(jī)器,但是看到的是一個(gè)文件系統(tǒng)而不是很多文件系統(tǒng),對(duì)用戶透明。例如,MapReduce系統(tǒng)要獲取/hdfs/tmp/file1的數(shù)據(jù),程序設(shè)計(jì)中引用的是一個(gè)文件路徑,但是實(shí)際的數(shù)據(jù)存放在很多不同的機(jī)器上。HDFS為用戶管理這些海量數(shù)據(jù),并通過MapReduce編程模式讓其在Hadoop集群上分布運(yùn)行[12]。

    考慮到影響分級(jí)聚類算法性能的主要因素是如何計(jì)算高維數(shù)據(jù)彼此之間的相似性,由于該相似性需要同時(shí)度量單一數(shù)據(jù)點(diǎn)在多個(gè)數(shù)據(jù)維度上與其他所有數(shù)據(jù)點(diǎn)的差異,因此,很適合使用MapReduce進(jìn)行計(jì)算。給定迭代次數(shù),即分級(jí)次。級(jí)聚類算法表述如下:

    步驟1: 將初始聚類序列分割為給定的個(gè)片段,對(duì)應(yīng)分配到個(gè)Map任務(wù),基于給定指標(biāo)計(jì)算聚類上下文的相似性,利用Reduce框架輸出各聚類對(duì)之間的相似性集合,重構(gòu)當(dāng)前聚類之間的相似性矩陣;

    步驟2:輸入上一級(jí)聚類的相似性矩陣,基于非負(fù)矩陣分解輸出當(dāng)前對(duì)應(yīng)聚類ID的歸屬度。重構(gòu)當(dāng)前級(jí)別下的聚類序列,輸出當(dāng)前級(jí)別下的聚類集合;

    步驟3: 重構(gòu)當(dāng)前聚類的上下文。重復(fù)步驟1, 步驟2共次;

    步驟4:輸出最終分級(jí)聚類結(jié)果。

    整個(gè)算法的框架圖如圖2所示。

    利用本文非負(fù)矩陣分解的并行數(shù)據(jù)處理中Map函數(shù)相應(yīng)的偽代碼如下:

    Input: text key,vector value

    Output:context context

    Begin

    1: for i=0 to n (cluster sequence) do

    2: t=findCatalog(i);

    3: for all k(* textfile) do

    4: distance=cosinedistance(k,ji);

    5: context, write(key, vector(t,Distance));

    6: end for

    7: end for

    End

    Reduce函數(shù)相應(yīng)的偽代碼如下:

    Input: text key, vector value

    Output: text key, vector value, context context

    Begin

    1: for all key and value do

    2: array list (vector(t,value));

    3: sort(array list);

    4: new arraylist result

    5: if k

    6: for i=0 to k do

    7: result, add(key,arraylist.get(i));

    8: else

    9: system.out,println(“no sufficient training smaples”)

    10: context.write(key,tradition KNN(result));

    11: end for

    12: end if

    End

    在MapReduce編程模型中,HDFS將大數(shù)據(jù)分割成若干blocks,然后存儲(chǔ)在不同的節(jié)點(diǎn)上。每個(gè)節(jié)點(diǎn)根據(jù)Map函數(shù)指定的操作在本地完成相應(yīng)的功能。

    3 實(shí)驗(yàn)結(jié)果與討論

    3.1 實(shí)驗(yàn)數(shù)據(jù)的選取

    作為積累大數(shù)據(jù)的典型行業(yè),電信行業(yè)積累了大量的手機(jī)用戶行為數(shù)據(jù),數(shù)據(jù)里包括用戶撥出電話的基站信息、通話時(shí)間、通話時(shí)長等豐富信息。這些數(shù)據(jù)可以用來研究用戶之間形成的社交網(wǎng);另一方面,由于這些行為數(shù)據(jù)具有地理上下文,因此,也可以基于網(wǎng)絡(luò)理論結(jié)合地理屬性研究城市中不同區(qū)域之間的關(guān)系與功能。

    然而,若將區(qū)域視為網(wǎng)絡(luò)中的點(diǎn),則區(qū)域覆蓋的基站的數(shù)據(jù)容量使得該點(diǎn)擁有極高的數(shù)據(jù)維度,具有上十萬用戶、上百萬的通話記錄數(shù),容量都是PB級(jí)的。如果用數(shù)據(jù)庫連接查詢以及普通的計(jì)算平臺(tái)來計(jì)算上述地理空間網(wǎng)絡(luò),效率會(huì)比較低,甚至難以接受超長的時(shí)間,所以本文提取上述電信運(yùn)營商數(shù)據(jù)作為實(shí)驗(yàn)環(huán)境,構(gòu)造空間網(wǎng)絡(luò)關(guān)系的平臺(tái)是Hadoop集群。

    本文搭建的集群中共有8個(gè)節(jié)點(diǎn):1個(gè)Master節(jié)點(diǎn)和7個(gè)Slave節(jié)點(diǎn),所有節(jié)點(diǎn)的硬件配置如下:CPU型號(hào) 為Intel Xeon E5 3.5 GHz; 內(nèi)存設(shè)為 8 GB。硬盤容量設(shè)為1 TB; 這些節(jié)點(diǎn)之間通過局域網(wǎng)內(nèi)的100M網(wǎng)卡連接,具體信息如表1所示。

    8個(gè)節(jié)點(diǎn)上均是RedHat系統(tǒng),其中Master機(jī)器主要配置NameNode和JobTracker,NameNode負(fù)責(zé)對(duì)文件系統(tǒng)的命名空間進(jìn)行管理,JobTracker負(fù)責(zé)任務(wù)的調(diào)度和分發(fā)。7個(gè)Slave機(jī)器主要配置DataNode和TaskTracker,DataNode負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行分布式存儲(chǔ),TaskTracker主要負(fù)責(zé)接收J(rèn)obTracker分發(fā)的任務(wù)并執(zhí)行具體的數(shù)據(jù)處理任務(wù)。

    3.2 實(shí)驗(yàn)結(jié)果分析

    利用某電信運(yùn)營商的數(shù)據(jù),表2列出了利用本文的數(shù)據(jù)聚類分析并行處理后的計(jì)算結(jié)果,從實(shí)驗(yàn)結(jié)果可以看出,算法的測試結(jié)果符合預(yù)想的情況,在算法的步驟1階段,需要的時(shí)間比較長,差不多4 h,半個(gè)工作日內(nèi)能夠完成,并行處理基本能滿足實(shí)際大數(shù)據(jù)處理的需求,然而傳統(tǒng)的單機(jī)條件下需要30多個(gè)小時(shí)。在步驟3的階段比較短,雖然并行處理的時(shí)間超過了單機(jī)(因?yàn)橛辛送ㄐ砰_銷),但是相對(duì)于算法的整個(gè)過程是不影響速度的。

    以上是并行處理與串行單機(jī)的比較結(jié)果,步驟1~步驟3一共只要4個(gè)多小時(shí),而串行單機(jī)(一個(gè)節(jié)點(diǎn))要30多個(gè)小時(shí)。但是結(jié)果是與串行的比較,而不是并行單節(jié)點(diǎn)的比較(接下來看到一個(gè)Master,一個(gè)Slave共需要的時(shí)間是50 h左右)。

    接著同時(shí)測試了集群配置不同節(jié)點(diǎn)數(shù)量(2~8個(gè),都只有1個(gè)Master,1~7個(gè)Slave)條件下算法的處理性能。圖3表明整個(gè)算法(步驟1~步驟3)隨著節(jié)點(diǎn)數(shù)的增加而運(yùn)行時(shí)間相應(yīng)減少。

    加速比是衡量一個(gè)系統(tǒng)擴(kuò)展性優(yōu)劣的主要指標(biāo),其表達(dá)式為:

    從圖3中可看出,整個(gè)數(shù)據(jù)聚類算法的時(shí)間隨著節(jié)點(diǎn)的增加而急劇減少。

    圖4為聚類算法的可擴(kuò)展性測試結(jié)果。

    從圖4中可看出,多臺(tái)計(jì)算機(jī)能夠很好地縮短所需時(shí)間,這說明MapReduce在處理數(shù)據(jù)聚類分析算法上具有較好的加速比,當(dāng)節(jié)點(diǎn)數(shù)更多時(shí),這種性能優(yōu)勢將更加明顯。在一定的規(guī)模范圍內(nèi),系統(tǒng)具有很好的可擴(kuò)展性。

    4 結(jié) 論

    本文提出云計(jì)算環(huán)境下基于相似性高維數(shù)據(jù)的聚類算法的并行化實(shí)現(xiàn)。根據(jù)非負(fù)矩陣分解和聚類方法的特點(diǎn)設(shè)計(jì)了Map和Reduce函數(shù),并將該算法在Hadoop平臺(tái)下進(jìn)行性能測試。實(shí)驗(yàn)結(jié)果表明,基于MapReduce的算法具有良好的擴(kuò)展性和加速比。在數(shù)據(jù)量急劇增長的大數(shù)據(jù)時(shí)代,在云計(jì)算平臺(tái)上實(shí)現(xiàn)基于MapReduce的數(shù)據(jù)挖掘算法具有重要的意義。

    注:本文通訊作者為徐勝超。

    參考文獻(xiàn)

    [1] ZHENG Y, CAPRA L, WOLFSON O, et al. Urban computing: concepts, methodologies, and applications [J]. ACM transactions on intelligent systems and technology, 2014(1): 1?9.

    [2] 李應(yīng)安.基于MapReduce的聚類算法的并行化研究[D].廣州:中山大學(xué),2011.

    LI Y A. Research on parallelization of clustering algorithm based on MapReduce [D]. Guangzhou: Sun Yat?sen University, 2011.

    [3] 曹澤文,周姚.基于MapReduce的JP算法設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程,2012,38(24):14?16.

    CAO Z W, ZHOU Y. Design and implementation of JP algorithm based on MapReduce [J]. Computer engineering, 2012, 38(24): 14?16.

    [4] 楊燕,王全根,黃波.蟻群聚類算法的并行化設(shè)計(jì)與實(shí)現(xiàn)[J].控制工程,2013,20(3):411?414.

    YANG Yan, WANG Quangen, HUANG Bo. Parallel design and implementation of ant colony clustering algorithm [J]. Control engineering of China, 2013, 20(3): 411?414.

    [5] 楊慧中,董陶,陶洪峰.基于改進(jìn)K?means聚類算法的組合模型建模[J].控制工程,2013,20(2):201?203.

    YANG Huizhong, DONG Tao, TAO Hongfeng. Combination model based on improved K?means clustering algorithm [J]. Control engineering of China, 2013, 20(2): 201?203.

    [6] 李歡,劉鋒,朱二周.基于改進(jìn)K?means算法的海量數(shù)據(jù)分析技術(shù)研究[J].微電子學(xué)與計(jì)算機(jī),2016,33(5):52?57.

    LI Huan, LIU Feng, ZHU Erzhou. Research of an improved K?means algorithm for analyzing mass data [J]. Microelectronics & computer, 2016, 33(5): 52?57.

    [7] LI F, OOI B C, ?ZSU M T, et al. Distributed data management using MapReduce [J]. ACM computing surveys, 2014, 46(3): 31.

    [8] 吳詩極,李川,唐常杰.面向大規(guī)模信息網(wǎng)絡(luò)的高效自適應(yīng)聚類算法[J].計(jì)算機(jī)科學(xué)與探索,2014,8(4):406?416.

    WU Shiji, LI Chuan, TANG Changjie. Efficient adaptive clustering algorithm for large scale information network [J]. Journal of frontiers of computer science & technology, 2014, 8(4): 406?416.

    [9] 任重魯,李金明.非負(fù)矩陣分解在微陣列數(shù)據(jù)分類和聚類發(fā)現(xiàn)中的應(yīng)用[J].計(jì)算機(jī)工程與科學(xué),2014,36(7):1389?1397.

    REN Zhonglu, LI Jinming. Application of non?negative matrix factorization in microarray data classification and clustering discovery [J]. Computer engineering and science, 2014, 36(7): 1389?1397.

    [10] 徐森,盧志茂,顧國昌.結(jié)合K均值和非負(fù)矩陣分解集成文本聚類算法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2011,41(4):1077?1082.

    XU Sen, LU Zhimao, GU Guochang. Integrating K?means and non?negative matrix factorization to ensemble document clustering [J]. Journal of Jilin University (engineering and technology edition), 2011, 41(4): 1077?1082.

    [11] 羅明偉,姚宏亮,李俊照,等.一種基于節(jié)點(diǎn)相異度的社團(tuán)層次劃分算法[J].計(jì)算機(jī)工程,2014,40(1):275?279.

    LUO Mingwei, YAO Hongliang, LI Junzhao, et al. A hierarchical division algorithm for community based on node dissi?milarity [J]. Computer engineering, 2014, 40(1): 275?279.

    [12] Hadoop. Hadoop Open source Web site 2016 [EB/OL]. [2016?10?23]. http://hadoop.apache.org/.endprint

    猜你喜歡
    聚類算法
    數(shù)據(jù)挖掘算法性能優(yōu)化的研究與應(yīng)用
    K—Means聚類算法在MapReduce框架下的實(shí)現(xiàn)
    基于K?均值與AGNES聚類算法的校園網(wǎng)行為分析系統(tǒng)研究
    基于改進(jìn)的K_means算法在圖像分割中的應(yīng)用
    大規(guī)模風(fēng)電場集中接入對(duì)電力系統(tǒng)小干擾穩(wěn)定的影響分析
    科技視界(2016年8期)2016-04-05 18:39:39
    基于暫態(tài)特征聚類的家用負(fù)荷識(shí)別
    亚洲欧美日韩无卡精品| 亚洲欧美一区二区三区黑人 | av卡一久久| 国产黄色小视频在线观看| 久久久精品欧美日韩精品| 日韩三级伦理在线观看| 美女主播在线视频| 国产黄色免费在线视频| 亚洲国产高清在线一区二区三| 高清视频免费观看一区二区 | 高清av免费在线| 亚洲av男天堂| 2018国产大陆天天弄谢| 丰满乱子伦码专区| or卡值多少钱| 青春草亚洲视频在线观看| 噜噜噜噜噜久久久久久91| 夫妻午夜视频| 久久精品综合一区二区三区| 少妇的逼好多水| 丰满乱子伦码专区| 一级毛片电影观看| 精品一区在线观看国产| 色哟哟·www| 综合色av麻豆| 亚洲精品久久午夜乱码| 乱人视频在线观看| 男女边吃奶边做爰视频| 欧美精品国产亚洲| 激情五月婷婷亚洲| 国产黄a三级三级三级人| 一级毛片电影观看| 国产免费视频播放在线视频 | 成人午夜精彩视频在线观看| 欧美变态另类bdsm刘玥| 亚洲无线观看免费| 亚洲成色77777| 在线a可以看的网站| av.在线天堂| 午夜福利在线观看免费完整高清在| 精品熟女少妇av免费看| 久久热精品热| 日本-黄色视频高清免费观看| 亚洲国产高清在线一区二区三| 国产午夜福利久久久久久| 纵有疾风起免费观看全集完整版 | 亚洲欧美成人综合另类久久久| 菩萨蛮人人尽说江南好唐韦庄| 美女黄网站色视频| 国产精品av视频在线免费观看| 在线观看一区二区三区| 亚洲欧洲国产日韩| 色综合色国产| 亚洲av电影不卡..在线观看| 夜夜爽夜夜爽视频| 亚洲av中文字字幕乱码综合| 国产免费又黄又爽又色| a级一级毛片免费在线观看| 男女那种视频在线观看| 日韩视频在线欧美| 国产午夜精品一二区理论片| 九草在线视频观看| 中国美白少妇内射xxxbb| 日韩在线高清观看一区二区三区| 久久亚洲国产成人精品v| 99re6热这里在线精品视频| 大香蕉久久网| 国产高清不卡午夜福利| 熟女电影av网| 91久久精品电影网| 汤姆久久久久久久影院中文字幕 | 色综合亚洲欧美另类图片| 精品国产三级普通话版| 日韩精品有码人妻一区| 久久久成人免费电影| 中文精品一卡2卡3卡4更新| 亚洲精品乱久久久久久| 国产成人精品婷婷| 国产成人精品婷婷| 一级毛片电影观看| 夫妻午夜视频| 亚洲伊人久久精品综合| 夫妻午夜视频| a级毛片免费高清观看在线播放| 久久精品久久精品一区二区三区| 久久韩国三级中文字幕| 亚洲精品国产av成人精品| 熟女人妻精品中文字幕| 精品一区二区三区视频在线| 成年人午夜在线观看视频 | 天堂影院成人在线观看| 国产大屁股一区二区在线视频| 亚洲国产精品国产精品| 午夜免费男女啪啪视频观看| 欧美一级a爱片免费观看看| 国产淫语在线视频| 伦精品一区二区三区| 熟妇人妻久久中文字幕3abv| 成人综合一区亚洲| 国产一区有黄有色的免费视频 | 网址你懂的国产日韩在线| 欧美激情久久久久久爽电影| 看免费成人av毛片| 伦理电影大哥的女人| 三级经典国产精品| 欧美精品一区二区大全| 街头女战士在线观看网站| 国内揄拍国产精品人妻在线| 久久久久精品久久久久真实原创| 久久久成人免费电影| 亚洲18禁久久av| 美女xxoo啪啪120秒动态图| 日日摸夜夜添夜夜爱| 亚洲国产色片| 如何舔出高潮| 久久久a久久爽久久v久久| 国产成人午夜福利电影在线观看| 国产伦在线观看视频一区| 国产白丝娇喘喷水9色精品| 国产熟女欧美一区二区| 久久99精品国语久久久| 久久国产乱子免费精品| 在线观看一区二区三区| 亚洲精品国产成人久久av| 精品久久久精品久久久| 久久99热6这里只有精品| 女的被弄到高潮叫床怎么办| av专区在线播放| 黄色一级大片看看| freevideosex欧美| av国产免费在线观看| 黄片无遮挡物在线观看| 在线免费观看的www视频| 一级二级三级毛片免费看| 午夜福利视频精品| 国产黄色视频一区二区在线观看| 内地一区二区视频在线| 黄色欧美视频在线观看| 亚洲在久久综合| 亚洲欧美一区二区三区黑人 | 极品教师在线视频| 大又大粗又爽又黄少妇毛片口| 熟妇人妻久久中文字幕3abv| 免费观看在线日韩| av免费观看日本| 精品午夜福利在线看| 国产av国产精品国产| 亚洲四区av| 欧美成人午夜免费资源| 亚洲欧美成人精品一区二区| 日本黄大片高清| 中文欧美无线码| 欧美精品国产亚洲| 久久国内精品自在自线图片| 国产亚洲av嫩草精品影院| 久久精品久久久久久久性| av线在线观看网站| av在线老鸭窝| 伦精品一区二区三区| 亚洲经典国产精华液单| 纵有疾风起免费观看全集完整版 | av在线天堂中文字幕| 午夜免费激情av| 三级国产精品片| av黄色大香蕉| 久久久久国产网址| 在线观看av片永久免费下载| 国产不卡一卡二| 日韩大片免费观看网站| 69av精品久久久久久| 亚洲精品第二区| 国产色爽女视频免费观看| 成人亚洲精品一区在线观看 | 偷拍熟女少妇极品色| 美女cb高潮喷水在线观看| 久久精品国产鲁丝片午夜精品| 天堂av国产一区二区熟女人妻| 大陆偷拍与自拍| 日本与韩国留学比较| 日韩制服骚丝袜av| www.色视频.com| 校园人妻丝袜中文字幕| 免费观看的影片在线观看| 亚洲成人一二三区av| 国产大屁股一区二区在线视频| 特级一级黄色大片| 亚洲激情五月婷婷啪啪| 欧美日韩在线观看h| 国国产精品蜜臀av免费| 久久精品久久精品一区二区三区| 午夜老司机福利剧场| 国产精品伦人一区二区| 亚洲三级黄色毛片| 国产精品久久久久久久电影| 国产av在哪里看| 亚洲内射少妇av| 久久久久网色| 天堂影院成人在线观看| 人妻制服诱惑在线中文字幕| 国产精品国产三级专区第一集| 亚州av有码| 国产av国产精品国产| 国产一级毛片在线| 国产欧美日韩精品一区二区| 日本黄大片高清| 中文精品一卡2卡3卡4更新| 亚洲最大成人手机在线| 亚洲不卡免费看| 欧美激情国产日韩精品一区| 边亲边吃奶的免费视频| 日韩精品有码人妻一区| 免费看美女性在线毛片视频| 五月天丁香电影| 亚洲精品乱码久久久v下载方式| 天天一区二区日本电影三级| 蜜臀久久99精品久久宅男| 丰满人妻一区二区三区视频av| 免费看美女性在线毛片视频| 国产精品一二三区在线看| 国产成人a区在线观看| 国产男女超爽视频在线观看| 国产精品福利在线免费观看| 国产成人福利小说| 国产亚洲av嫩草精品影院| 久久久a久久爽久久v久久| 黄色一级大片看看| 寂寞人妻少妇视频99o| 久久精品国产自在天天线| 99九九线精品视频在线观看视频| 97热精品久久久久久| 成人亚洲精品av一区二区| 秋霞伦理黄片| 纵有疾风起免费观看全集完整版 | 久久久久久久久久黄片| 国产精品熟女久久久久浪| 极品少妇高潮喷水抽搐| 伊人久久精品亚洲午夜| 久久久午夜欧美精品| 天堂√8在线中文| 麻豆成人午夜福利视频| 大又大粗又爽又黄少妇毛片口| 少妇高潮的动态图| 深夜a级毛片| 国产综合精华液| 成人二区视频| 精品酒店卫生间| 久久久久久伊人网av| 天天躁日日操中文字幕| 99久国产av精品| 黄色一级大片看看| 久久这里只有精品中国| videossex国产| 国产精品麻豆人妻色哟哟久久 | 69av精品久久久久久| 日韩一区二区三区影片| 国产伦理片在线播放av一区| 身体一侧抽搐| 欧美精品国产亚洲| 亚洲精品影视一区二区三区av| 国产成人aa在线观看| 久久精品熟女亚洲av麻豆精品 | 美女国产视频在线观看| 嫩草影院入口| 成人亚洲精品av一区二区| 国产高清不卡午夜福利| 在线免费观看的www视频| 性插视频无遮挡在线免费观看| 亚洲不卡免费看| 欧美激情国产日韩精品一区| 3wmmmm亚洲av在线观看| 我要看日韩黄色一级片| 狂野欧美白嫩少妇大欣赏| 日韩在线高清观看一区二区三区| 我的老师免费观看完整版| 99久久中文字幕三级久久日本| 在线 av 中文字幕| 亚洲三级黄色毛片| 婷婷色麻豆天堂久久| 午夜激情久久久久久久| 久99久视频精品免费| 成人综合一区亚洲| 中文字幕av成人在线电影| 97超视频在线观看视频| 中文乱码字字幕精品一区二区三区 | 晚上一个人看的免费电影| 国产白丝娇喘喷水9色精品| 哪个播放器可以免费观看大片| 青青草视频在线视频观看| 欧美3d第一页| 九草在线视频观看| 少妇丰满av| 成人无遮挡网站| 亚洲av成人精品一区久久| 蜜臀久久99精品久久宅男| 国产视频首页在线观看| 成人二区视频| av在线亚洲专区| 五月伊人婷婷丁香| 亚洲精品国产av成人精品| 亚洲三级黄色毛片| 中文欧美无线码| 天天躁日日操中文字幕| 在线观看人妻少妇| 纵有疾风起免费观看全集完整版 | 男人和女人高潮做爰伦理| 中文字幕av在线有码专区| 欧美日韩精品成人综合77777| 插阴视频在线观看视频| 国产午夜精品一二区理论片| 欧美日韩在线观看h| 成人午夜高清在线视频| 又爽又黄a免费视频| 最近中文字幕2019免费版| 99热网站在线观看| 一区二区三区乱码不卡18| 免费人成在线观看视频色| 男人舔奶头视频| 18禁在线播放成人免费| 婷婷色av中文字幕| 国产老妇女一区| 丰满乱子伦码专区| 熟妇人妻不卡中文字幕| 你懂的网址亚洲精品在线观看| 日韩三级伦理在线观看| 51国产日韩欧美| 99久久九九国产精品国产免费| 五月玫瑰六月丁香| 久久精品国产亚洲网站| www.av在线官网国产| 久久久久久久久久黄片| 天堂俺去俺来也www色官网 | 国产精品久久久久久精品电影| 高清欧美精品videossex| 国产探花在线观看一区二区| 少妇人妻一区二区三区视频| 亚洲aⅴ乱码一区二区在线播放| 精品人妻一区二区三区麻豆| 美女脱内裤让男人舔精品视频| 亚洲美女视频黄频| 六月丁香七月| 国产 一区 欧美 日韩| 成年女人看的毛片在线观看| 日韩强制内射视频| 成年av动漫网址| 亚洲欧美精品自产自拍| 美女xxoo啪啪120秒动态图| 国产精品伦人一区二区| 久久久久久久久久人人人人人人| 欧美精品国产亚洲| 婷婷色av中文字幕| 精品熟女少妇av免费看| 青青草视频在线视频观看| 日韩欧美国产在线观看| 亚洲精品自拍成人| 日本av手机在线免费观看| 高清在线视频一区二区三区| 国产乱人视频| 亚洲aⅴ乱码一区二区在线播放| 乱码一卡2卡4卡精品| 国产黄色免费在线视频| 最近手机中文字幕大全| 人人妻人人看人人澡| 黄片wwwwww| 亚洲四区av| 18+在线观看网站| 精品人妻视频免费看| 久久久久九九精品影院| 国产午夜精品论理片| 亚洲美女视频黄频| 日韩 亚洲 欧美在线| 亚洲欧美日韩东京热| 久久久久久伊人网av| 亚洲欧美中文字幕日韩二区| 人妻制服诱惑在线中文字幕| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 中文欧美无线码| 亚洲四区av| 国产亚洲精品av在线| 久久这里只有精品中国| 日韩 亚洲 欧美在线| 亚洲成色77777| 99九九线精品视频在线观看视频| 免费黄频网站在线观看国产| 边亲边吃奶的免费视频| 日韩av在线大香蕉| a级一级毛片免费在线观看| 亚洲欧洲国产日韩| 少妇熟女欧美另类| av天堂中文字幕网| 国产成人精品婷婷| 如何舔出高潮| 国产精品一区二区性色av| 69人妻影院| 欧美变态另类bdsm刘玥| 精品一区二区免费观看| 国产片特级美女逼逼视频| 精品酒店卫生间| 久久久国产一区二区| 国产一区有黄有色的免费视频 | 亚洲av一区综合| 婷婷色av中文字幕| 天堂中文最新版在线下载 | 深夜a级毛片| 简卡轻食公司| 国产一区二区三区综合在线观看 | 国内少妇人妻偷人精品xxx网站| 狂野欧美激情性xxxx在线观看| 亚洲av电影不卡..在线观看| 久久久亚洲精品成人影院| 嫩草影院入口| 日日摸夜夜添夜夜添av毛片| 五月玫瑰六月丁香| 国产一级毛片在线| 国产免费一级a男人的天堂| 国产精品爽爽va在线观看网站| 国产亚洲av片在线观看秒播厂 | 精品久久久久久久久av| 成人二区视频| 国产成人精品久久久久久| 69人妻影院| 可以在线观看毛片的网站| 九九久久精品国产亚洲av麻豆| 精品一区二区三区视频在线| 精品酒店卫生间| 夫妻午夜视频| 尤物成人国产欧美一区二区三区| 亚洲精品乱码久久久久久按摩| 亚洲精品影视一区二区三区av| 久久精品熟女亚洲av麻豆精品 | 中国国产av一级| 成人欧美大片| 少妇的逼好多水| 亚洲在线自拍视频| 日韩伦理黄色片| 国产精品一区www在线观看| 国产老妇女一区| 天美传媒精品一区二区| 国产免费又黄又爽又色| 菩萨蛮人人尽说江南好唐韦庄| 极品教师在线视频| 日韩欧美 国产精品| 免费观看无遮挡的男女| 成年女人在线观看亚洲视频 | 国产不卡一卡二| 婷婷色av中文字幕| 边亲边吃奶的免费视频| 嫩草影院入口| 成人欧美大片| 免费电影在线观看免费观看| 女人被狂操c到高潮| 精品一区二区三区人妻视频| 日本爱情动作片www.在线观看| 美女被艹到高潮喷水动态| 免费播放大片免费观看视频在线观看| 非洲黑人性xxxx精品又粗又长| 大陆偷拍与自拍| 日韩 亚洲 欧美在线| 又爽又黄a免费视频| 国产三级在线视频| 国产精品美女特级片免费视频播放器| 亚洲第一区二区三区不卡| 欧美成人一区二区免费高清观看| 国产成人一区二区在线| 777米奇影视久久| 精品久久久久久成人av| 少妇被粗大猛烈的视频| 三级毛片av免费| 亚洲第一区二区三区不卡| 一本久久精品| 欧美不卡视频在线免费观看| 综合色丁香网| 国产欧美日韩精品一区二区| av免费在线看不卡| 国产一级毛片在线| 国产亚洲5aaaaa淫片| 好男人在线观看高清免费视频| 看十八女毛片水多多多| 久久综合国产亚洲精品| 日韩成人伦理影院| 丰满乱子伦码专区| 在线观看人妻少妇| 搡女人真爽免费视频火全软件| 久久久久久久大尺度免费视频| 国产黄频视频在线观看| 一本一本综合久久| 免费观看在线日韩| 一级毛片我不卡| 国内精品一区二区在线观看| 欧美性猛交╳xxx乱大交人| 国产伦精品一区二区三区四那| 777米奇影视久久| 在线观看人妻少妇| 亚洲国产av新网站| 欧美日韩亚洲高清精品| 91aial.com中文字幕在线观看| 能在线免费观看的黄片| 国产av码专区亚洲av| 亚洲国产最新在线播放| 欧美日韩综合久久久久久| 国产精品久久视频播放| 网址你懂的国产日韩在线| 久久99热这里只频精品6学生| 天天一区二区日本电影三级| 一区二区三区四区激情视频| 国产成人freesex在线| 一夜夜www| 国产探花极品一区二区| 少妇裸体淫交视频免费看高清| 亚洲丝袜综合中文字幕| 精品久久久久久久久av| 啦啦啦韩国在线观看视频| 在线免费观看的www视频| 午夜精品国产一区二区电影 | 人妻一区二区av| 欧美另类一区| 国产伦精品一区二区三区四那| 一级a做视频免费观看| 秋霞伦理黄片| 久久久久久久午夜电影| 亚洲三级黄色毛片| 亚洲av.av天堂| 日本一本二区三区精品| 国产一区亚洲一区在线观看| 成人美女网站在线观看视频| 一边亲一边摸免费视频| 免费黄频网站在线观看国产| 热99在线观看视频| 中文字幕人妻熟人妻熟丝袜美| 免费播放大片免费观看视频在线观看| 18禁动态无遮挡网站| av国产免费在线观看| 晚上一个人看的免费电影| 精华霜和精华液先用哪个| 18禁动态无遮挡网站| 草草在线视频免费看| 日韩欧美国产在线观看| 亚洲国产精品专区欧美| videos熟女内射| xxx大片免费视频| 久久精品熟女亚洲av麻豆精品 | 麻豆乱淫一区二区| 午夜日本视频在线| 亚洲人与动物交配视频| 亚洲精品久久久久久婷婷小说| 超碰97精品在线观看| 日本色播在线视频| 亚洲人成网站在线播| 亚洲欧洲国产日韩| 欧美成人精品欧美一级黄| 精品久久久久久久久亚洲| 99久国产av精品| av播播在线观看一区| 成人亚洲精品av一区二区| 亚洲熟女精品中文字幕| 女人被狂操c到高潮| 亚洲熟女精品中文字幕| 免费看日本二区| 99九九线精品视频在线观看视频| 人妻一区二区av| 国产免费视频播放在线视频 | 69人妻影院| 成人高潮视频无遮挡免费网站| 性插视频无遮挡在线免费观看| 国产高清不卡午夜福利| 美女cb高潮喷水在线观看| 国产免费一级a男人的天堂| 国产精品美女特级片免费视频播放器| 国产黄色免费在线视频| 蜜桃亚洲精品一区二区三区| 男女下面进入的视频免费午夜| 亚洲美女搞黄在线观看| 97超视频在线观看视频| 日韩一区二区视频免费看| 听说在线观看完整版免费高清| 91狼人影院| 国产黄色小视频在线观看| 成人亚洲精品一区在线观看 | 欧美潮喷喷水| 国产精品精品国产色婷婷| 91狼人影院| 国产高清有码在线观看视频| 亚洲成人av在线免费| 中文乱码字字幕精品一区二区三区 | 久久久久久久久大av| 大又大粗又爽又黄少妇毛片口| 久久人人爽人人爽人人片va| 99久久精品一区二区三区| 观看美女的网站| av福利片在线观看| av女优亚洲男人天堂| 街头女战士在线观看网站| 干丝袜人妻中文字幕| 美女大奶头视频| 韩国高清视频一区二区三区| 日本与韩国留学比较| 亚洲精品国产av蜜桃| 亚洲国产精品专区欧美| 欧美潮喷喷水| 少妇裸体淫交视频免费看高清| 大香蕉久久网| 国产在视频线精品| 91久久精品电影网| 一级黄片播放器| 在线观看一区二区三区| 午夜精品一区二区三区免费看| or卡值多少钱| 网址你懂的国产日韩在线| 国语对白做爰xxxⅹ性视频网站| 亚洲欧美一区二区三区黑人 | 青青草视频在线视频观看| 欧美最新免费一区二区三区| 日本一二三区视频观看| 欧美xxⅹ黑人| 麻豆乱淫一区二区| 国产伦精品一区二区三区视频9|