• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于MapReduce的DHP算法并行化研究

    2016-07-19 02:07:19周國(guó)軍吳慶軍

    周國(guó)軍 吳慶軍

    (玉林師范學(xué)院數(shù)學(xué)與信息科學(xué)學(xué)院 廣西 玉林 537000)

    ?

    基于MapReduce的DHP算法并行化研究

    周國(guó)軍吳慶軍

    (玉林師范學(xué)院數(shù)學(xué)與信息科學(xué)學(xué)院廣西 玉林 537000)

    摘要針對(duì)DHP(direct hashing and pruning)算法對(duì)大數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則存在執(zhí)行時(shí)間過長(zhǎng)、效率不高的問題,對(duì)DHP算法的并行化策略進(jìn)行了研究。根據(jù)云計(jì)算平臺(tái)Hadoop的MapReduce并行編程模型,設(shè)計(jì)了一種并行DHP算法,給出了算法的總體流程和Map函數(shù)、Reduce函數(shù)的算法描述。與DHP算法相比,并行算法利用了Hadoop集群強(qiáng)大的計(jì)算能力,提高了從大數(shù)據(jù)集中挖掘關(guān)聯(lián)規(guī)則的效率。通過實(shí)例分析了并行DHP算法的執(zhí)行過程,在多個(gè)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明:并行DHP算法對(duì)大數(shù)據(jù)具有較好的加速比和可擴(kuò)展性。

    關(guān)鍵詞MapReduce Hadoop DHP算法關(guān)聯(lián)規(guī)則

    0引言

    關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘領(lǐng)域的一個(gè)重要研究方向,其目標(biāo)是從事務(wù)數(shù)據(jù)庫中發(fā)現(xiàn)項(xiàng)與項(xiàng)之間的相關(guān)聯(lián)系。如何高效地找出所有的頻繁項(xiàng)集是關(guān)聯(lián)規(guī)則挖掘算法要解決的主要問題。DHP算法[1]在Apriori算法[2]的基礎(chǔ)上利用哈希技術(shù)修剪候選項(xiàng)集和事務(wù)數(shù)據(jù)庫,提高了生成頻繁項(xiàng)集的效率,是公認(rèn)的非常有效的算法。由于DHP算法具有很好的性能,在文本數(shù)據(jù)挖掘[3]、Web遍歷路徑挖掘[4]等方面得到了廣泛應(yīng)用。已經(jīng)有較多的文獻(xiàn)對(duì)DHP算法的Hash函數(shù)選取、Hash表結(jié)構(gòu)優(yōu)化、冗余事務(wù)的修剪策略等進(jìn)行了研究和改進(jìn),這些改進(jìn)算法進(jìn)一步提高了發(fā)現(xiàn)頻繁項(xiàng)集的效率。但是,DHP算法是一種時(shí)間復(fù)雜度較高的算法,受單機(jī)存儲(chǔ)空間和計(jì)算能力的限制,DHP算法及其改進(jìn)的串行算法對(duì)大數(shù)據(jù)集挖掘關(guān)聯(lián)規(guī)則存在執(zhí)行時(shí)間太長(zhǎng)、效率較低的性能瓶頸問題。

    云計(jì)算[5]是近年來興起的一種計(jì)算模式,優(yōu)勢(shì)是提供了海量的存儲(chǔ)空間和強(qiáng)大的計(jì)算能力,將云計(jì)算技術(shù)應(yīng)用于數(shù)據(jù)挖掘領(lǐng)域是一個(gè)新的發(fā)展趨勢(shì)[6]。Google公司提出的MapReduce[7]是一種簡(jiǎn)潔高效的并行編程模型,該模型屏蔽了底層實(shí)現(xiàn)細(xì)節(jié),降低了編程難度。MapReduce模型將復(fù)雜的處理任務(wù)抽象成Map函數(shù)和Reduce函數(shù),Map、Reduce函數(shù)在分布式集群的節(jié)點(diǎn)上并行執(zhí)行,從而達(dá)到了對(duì)大規(guī)模計(jì)算任務(wù)進(jìn)行高效處理的要求[8]。Apache軟件基金會(huì)開發(fā)的Hadoop[9]是一個(gè)開源的分布式計(jì)算平臺(tái),該平臺(tái)以高可靠性、高擴(kuò)展性等優(yōu)點(diǎn)得到了學(xué)術(shù)界的認(rèn)可和工業(yè)界的廣泛應(yīng)用。Hadoop實(shí)現(xiàn)了MapReduce模型,用戶可以在大量廉價(jià)設(shè)備組成的Hadoop集群上運(yùn)行MapReduce應(yīng)用程序。

    本文根據(jù)Hadoop平臺(tái)的MapReduce模型,對(duì)DHP算法的并行化方法進(jìn)行了分析,設(shè)計(jì)了一種并行DHP算法。該算法利用Hadoop集群中各節(jié)點(diǎn)的計(jì)算能力,縮短了對(duì)大數(shù)據(jù)集挖掘關(guān)聯(lián)規(guī)則的時(shí)間,具有較好的加速比和可擴(kuò)展性。最后,通過實(shí)驗(yàn)驗(yàn)證了并行DHP算法的性能。

    1Hadoop平臺(tái)的MapReduce模型

    Hadoop的MapReduce框架處理大數(shù)據(jù)集的一般過程是:將大數(shù)據(jù)集分解成許多數(shù)據(jù)分片,JobTracker進(jìn)程將MapReduce任務(wù)分配給TaskTracker節(jié)點(diǎn),TaskTracker進(jìn)程讀取一個(gè)(或多個(gè))數(shù)據(jù)分片、并執(zhí)行MapReduce任務(wù)。

    在Hadoop中,MapReduce應(yīng)用程序的基本結(jié)構(gòu)包括主函數(shù)、Map函數(shù)和Reduce函數(shù)。主函數(shù)對(duì)每個(gè)MapReduce作業(yè)所需的參數(shù)進(jìn)行配置,并在作業(yè)啟動(dòng)后對(duì)程序的執(zhí)行流程進(jìn)行控制。Map函數(shù)定義為一個(gè)類(稱為Mapper類),在Mapper類中可以定義setup、map和cleanup等方法。對(duì)于每個(gè)Map任務(wù),setup方法只在任務(wù)開始之前調(diào)用一次,cleanup方法只在任務(wù)結(jié)束之前調(diào)用一次。相應(yīng)地,Reduce函數(shù)定義為一個(gè)稱為Reducer的類,在Reducer類中可以定義setup、reduce和cleanup等方法,對(duì)于每個(gè)Reduce任務(wù),setup和cleanup方法只調(diào)用一次。map、reduce方法的一般形式[10]表示如下:

    map:(K1,V1) →list(K2,V2)

    reduce:(K2,list(V2)) →list(K3,V3)

    其中,(K1,V1)是數(shù)據(jù)分片的一條記錄經(jīng)過MapReduce框架解析后的鍵/值對(duì)表示形式,list(K2,V2)、list(K3,V3)分別是map和reduce方法輸出的鍵/值對(duì)列表。

    2DHP算法的并行化策略

    文獻(xiàn)[1]給出了DHP算法的詳細(xì)描述,DHP算法的三個(gè)部分都能采用MapReduce模型將其并行化,說明如下:

    第一部分對(duì)候選1-項(xiàng)集的支持度計(jì)數(shù)、哈希表的桶計(jì)數(shù)進(jìn)行并行化。與詞頻統(tǒng)計(jì)方法相似,Map函數(shù)對(duì)數(shù)據(jù)分片的每個(gè)事務(wù)t分解出所有項(xiàng)ij,計(jì)算出所有2-項(xiàng)子集x的哈希桶地址addr=h2[x],輸出、<*addr,1>鍵/值對(duì)。Reduce函數(shù)統(tǒng)計(jì)項(xiàng)ij的支持度和哈希桶addr的計(jì)數(shù)值,輸出所有頻繁1-項(xiàng)集L1和計(jì)數(shù)值大于最小支持度閾值s的哈希桶地址及桶計(jì)數(shù)值。但是,在后續(xù)的迭代過程中區(qū)分項(xiàng)ij與哈希桶地址addr有一個(gè)簡(jiǎn)單的辦法,就是在哈希桶地址前加上一個(gè)不會(huì)在事務(wù)數(shù)據(jù)庫中出現(xiàn)的前綴字符(比如‘*’)。

    第二部分對(duì)事務(wù)數(shù)據(jù)庫Dk的修剪、候選k-項(xiàng)集的支持度計(jì)數(shù)和哈希表的桶計(jì)數(shù)進(jìn)行并行化。該部分是一個(gè)迭代計(jì)算頻繁k項(xiàng)集Lk的過程,每次迭代過程由一個(gè)MapReduce任務(wù)完成,需要解決3個(gè)主要問題。①控制迭代次數(shù)。簡(jiǎn)單的方法是在主函數(shù)中由循環(huán)條件 (|{x|Hk[x]≥s}|≥LARGE) 控制MapReduce任務(wù)迭代的次數(shù)。②Map函數(shù)如何讀取所有頻繁(k-1)-項(xiàng)集Lk-1和哈希表Hk以生成所有候選k-項(xiàng)集Ck。在主函數(shù)中將Lk-1和Hk設(shè)置為分布式緩存文件,由Hadoop的MapReduce框架將Lk-1和Hk分發(fā)到執(zhí)行Map任務(wù)的TaskTracker節(jié)點(diǎn)就解決了這個(gè)問題。③如何輸出修剪后的事務(wù)數(shù)據(jù)庫Dk+1。簡(jiǎn)單的方法是在Hadoop的文件系統(tǒng)HDFS中創(chuàng)建一個(gè)目錄,Map函數(shù)將修剪后的數(shù)據(jù)分片以文件形式寫入到HDFS中。該方法的優(yōu)點(diǎn)是:第k+1次迭代只需在主函數(shù)中設(shè)置MapReduce任務(wù)的輸入路徑為Dk+1的目錄,Map函數(shù)便可讀取Dk+1的數(shù)據(jù)分片。

    第三部分對(duì)事務(wù)數(shù)據(jù)庫Dk的修剪和候選k-項(xiàng)集的支持度計(jì)數(shù)進(jìn)行并行化。在該部分中,主函數(shù)除了控制程序流程之外,還需要完成以下計(jì)算:在第一個(gè)MapReduce任務(wù)執(zhí)行前生成所有候選k-項(xiàng)集Ck,即執(zhí)行g(shù)en_candidate(Lk-1,Hk,Ck),并將Ck分發(fā)給執(zhí)行Map任務(wù)的節(jié)點(diǎn)。在每個(gè)MapReduce任務(wù)結(jié)束后執(zhí)行Ck+1=apriori_gen(Lk),并在下一次迭代前分發(fā)Ck+1。

    3并行DHP算法設(shè)計(jì)與描述

    3.1算法的總體流程及描述

    并行DHP算法的總體流程如圖1所示,其中s是最小支持度閾值,LARGE是預(yù)定義的閾值。

    圖1 并行DHP算法流程圖

    與DHP算法相對(duì)應(yīng),并行DHP算法也分為三部分。算法的流程控制由主函數(shù)實(shí)現(xiàn),各部分的并行計(jì)算由Map和Reduce函數(shù)實(shí)現(xiàn)。Map函數(shù)和Reduce函數(shù)描述如下:

    Part1的Map函數(shù):

    //TID是事務(wù)編號(hào),t是事務(wù)的項(xiàng)列表

    map(key=TID,value=t){

    foreach項(xiàng)ij∈t

    output();

    foreach2-項(xiàng)子集x∈t{

    addr=h2(x);

    //“*”是哈希地址addr的前綴字符

    output(<*addr,1>);

    }

    }

    Part1的Reduce函數(shù):

    reduce(key=ij或key=*addr,values=list(1)){

    count=0;

    foreach1invalues

    count++;

    /* 輸出滿足條件的頻繁1-項(xiàng)集及支持度、

    輸出哈希表的桶地址及計(jì)數(shù)值 */

    if(count≥s)output();

    }

    Part2的Map函數(shù):

    setup(){

    //生成候選k-項(xiàng)集

    gen_candidate(Lk-1,Hk,Ck);

    Dk+1= ?;

    }

    map(key=TID,value=t){

    foreacht的k-項(xiàng)子集c(=ti1...tik)

    if(c∈Ck) {

    output();

    for(j=1;j≤k;j++)a[ij]++;

    }

    //刪除t中不必要的項(xiàng)

    for(i=0,j=0;i<|t|;i++)

    if(x的所有k-項(xiàng)子集y都滿足Hk[hk(y)]≥s){

    addr=hk+1(x);

    output(<*addr,1>);

    for(j=1;j≤k+1;j++)a[ij]++;

    }

    }

    //刪除數(shù)據(jù)分片中不必要的事務(wù)

    }

    }

    cleanup(){

    在HDFS中創(chuàng)建一個(gè)目錄inputk+1;

    將Dk+1分片保存在inputk+1目錄的一個(gè)文件中;

    }

    Part2的Reduce函數(shù):

    reduce(key=c或key=*addr,values=list(1)){

    count=0;

    foreach1invalues

    count++;

    /* 輸出滿足條件的頻繁k-項(xiàng)集及支持度、

    輸出哈希表的桶地址及計(jì)數(shù)值 */

    if(count≥s)output();

    }

    Part3的Map函數(shù):

    setup(){

    讀取Ck;

    Dk+1= ?;

    }

    map(key=TID,value=t){

    foreacht的k-項(xiàng)子集c(=ti1...tik)

    if(c∈Ck) {

    output();

    for(j=1;j≤k;j++)a[ij]++;

    }

    //刪除t中不必要的項(xiàng)

    for(i=0,j=0;i<|t|;i++)

    //刪除數(shù)據(jù)分片中不必要的事務(wù)

    }

    cleanup(){

    在HDFS中創(chuàng)建一個(gè)目錄inputk+1;

    將Dk+1分片保存在inputk+1目錄的一個(gè)文件中;

    }

    Part3的Reduce函數(shù):

    reduce(key=c,values=list(1)){

    count=0;

    foreach1invalues

    count++;

    //輸出滿足條件的頻繁k-項(xiàng)集及支持度

    if(count≥s)output();

    }

    3.2算法的實(shí)例分析

    下面通過一個(gè)實(shí)例來說明并行DHP算法的執(zhí)行過程,如圖2所示。

    圖2 并行DHP算法執(zhí)行過程示例

    在該實(shí)例中,使用文獻(xiàn)[1]給出的示例數(shù)據(jù)庫。假定Map、Reduce任務(wù)數(shù)各為2,選取s=2、LARGE=3,選取的Hash函數(shù)定義如下:

    hk({i1,i2,…,ik})=((order(i1)+order(i2)+…+order(ik-1))×10+order(ik))modp

    對(duì)于該實(shí)例,算法的執(zhí)行過程需要3個(gè)MapReduce任務(wù)去完成。第1個(gè)MapReduce任務(wù)執(zhí)行Part1的過程,得到L1和H2。由于條件 |{x|H2[x]≥s}|≥LARGE成立,第2個(gè)MapReduce任務(wù)執(zhí)行Part2的過程,得到L2、H3和D3。由于條件 |{x|H3[x]≥s}|≥LARGE不成立,第3個(gè)MapReduce任務(wù)執(zhí)行Part3的過程,得到L3和D4。由于|D4|=0,算法結(jié)束。

    算法的執(zhí)行結(jié)果與文獻(xiàn)[1]的結(jié)果相同,可見,本文設(shè)計(jì)的并行DHP算法是正確的。

    4實(shí)驗(yàn)結(jié)果及分析

    4.1實(shí)驗(yàn)環(huán)境與實(shí)驗(yàn)數(shù)據(jù)

    實(shí)驗(yàn)環(huán)境是7臺(tái)配置相同的計(jì)算機(jī)組成的Hadoop集群,其中1臺(tái)作為JobTracker節(jié)點(diǎn),6臺(tái)作為TaskTracker節(jié)點(diǎn)。計(jì)算機(jī)的配置是:雙核2.93GHzCPU、2GB內(nèi)存和100M網(wǎng)卡。使用的軟件是:Ubuntu12.04LTS、Hadoop1.2.1、JDK1.7.0_51。

    使用Java語言實(shí)現(xiàn)了文獻(xiàn)[1]提出的DHP算法和本文設(shè)計(jì)的并行DHP算法,并對(duì)數(shù)據(jù)集進(jìn)行了3組實(shí)驗(yàn),分別測(cè)試算法的運(yùn)行時(shí)間、加速比和可擴(kuò)展性。實(shí)驗(yàn)選取的數(shù)據(jù)集來自網(wǎng)站http://fimi.ua.ac.be/data/。為了便于測(cè)試算法的可擴(kuò)展性,從數(shù)據(jù)集webdocs中分別隨機(jī)抽取1×105、2×105、3×105、4×105、5×105、6×105條記錄作為6個(gè)實(shí)驗(yàn)數(shù)據(jù)集。

    4.2算法的運(yùn)行時(shí)間測(cè)試

    使用4個(gè)數(shù)據(jù)集測(cè)試算法的運(yùn)行時(shí)間,retail、kosarak是稀疏型數(shù)據(jù)集,設(shè)置了較小的支持度閾值,accidents、pumsb是稠密型數(shù)據(jù)集,設(shè)置了較大的支持度閾值。為了便于與DHP算法比較,分別使用1個(gè)和2個(gè)TaskTracker節(jié)點(diǎn)測(cè)試并行DHP算法的運(yùn)行時(shí)間。實(shí)驗(yàn)結(jié)果如表1所示。

    表1 DHP算法與并行DHP算法的執(zhí)行時(shí)間

    從表1可以看出,使用1個(gè)TaskTracker節(jié)點(diǎn),并行DHP算法在4個(gè)數(shù)據(jù)集上的運(yùn)行時(shí)間都大于DHP算法;使用2個(gè)節(jié)點(diǎn),除retail之外,并行DHP算法在其余3個(gè)數(shù)據(jù)集上的運(yùn)行時(shí)間均小于DHP算法。retail是一個(gè)較小(4.2MB)的稀疏型數(shù)據(jù)集,對(duì)該數(shù)據(jù)集挖掘頻繁項(xiàng)集的計(jì)算時(shí)間較小。但是,并行DHP算法需要5個(gè)MapReduce任務(wù)才能完成對(duì)retail的數(shù)據(jù)處理,每個(gè)任務(wù)的初始化和啟動(dòng)所用的時(shí)間相對(duì)于計(jì)算時(shí)間有較大的比重,所以總的運(yùn)行時(shí)間要大于DHP算法。

    由此可見,并行DHP算法不適合對(duì)計(jì)算量小的數(shù)據(jù)集挖掘頻繁項(xiàng)集;對(duì)于計(jì)算規(guī)模較大的數(shù)據(jù)集,并行DHP算法顯著減少了挖掘頻繁項(xiàng)集的時(shí)間,提高了算法的執(zhí)行效率。

    4.3算法的加速比測(cè)試

    加速比是評(píng)價(jià)并行算法性能的重要指標(biāo)之一,文獻(xiàn)[11]給出了加速比的計(jì)算公式,定義如下:

    Sp=t1/tp

    (1)

    其中,t1、tp分別表示在1個(gè)節(jié)點(diǎn)和p個(gè)節(jié)點(diǎn)上的執(zhí)行時(shí)間。

    使用表1列出的4個(gè)數(shù)據(jù)集和最小支持度測(cè)試并行DHP算法的加速比,實(shí)驗(yàn)結(jié)果如圖3所示。從圖3可以看出,對(duì)于計(jì)算規(guī)模較小的數(shù)據(jù)集retail和kosarak,算法表現(xiàn)出很低的加速比,這是因?yàn)殡S著計(jì)算節(jié)點(diǎn)數(shù)的增加,在節(jié)點(diǎn)之間的通信開銷相對(duì)于計(jì)算時(shí)間的比重顯著增大,不能取得較好的加速比;對(duì)于計(jì)算規(guī)模較大的數(shù)據(jù)集accidents和pumsb,算法取得了較好的加速比。

    圖3 并行DHP算法的加速比

    4.4算法的可擴(kuò)展性測(cè)試

    可擴(kuò)展性是指算法能否隨節(jié)點(diǎn)數(shù)的增加而按比例提高。文獻(xiàn)[12]給出了等速度可擴(kuò)展性的計(jì)算公式,定義如下:

    (2)

    其中,w、p是問題規(guī)模和處理機(jī)規(guī)模,w′、p′是擴(kuò)展后的問題規(guī)模和處理機(jī)規(guī)模。

    對(duì)從webdocs中隨機(jī)抽取的6個(gè)數(shù)據(jù)集(數(shù)據(jù)規(guī)模成倍增加)進(jìn)行可擴(kuò)展性測(cè)試,實(shí)驗(yàn)結(jié)果如圖4所示。實(shí)驗(yàn)結(jié)果表明,對(duì)于兩種不同的最小支持度,并行DHP算法都能取得較好的可擴(kuò)展性。

    圖4 并行DHP算法的可擴(kuò)展性

    5結(jié)語

    DHP算法是一種經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法,受單機(jī)計(jì)算能力和內(nèi)存的限制,DHP算法對(duì)大數(shù)據(jù)挖掘頻繁項(xiàng)集存在執(zhí)行時(shí)間過長(zhǎng)、效率不高的問題。針對(duì)該問題,本文根據(jù)Hadoop平臺(tái)的MapReduce并行編程模型對(duì)DHP算法的并行化策略進(jìn)行了研究,設(shè)計(jì)了一種基于MapReduce模型的并行DHP算法,通過實(shí)例分析了算法的執(zhí)行過程和正確性。與DHP算法相比,本文設(shè)計(jì)的并行算法利用了Hadoop集群強(qiáng)大的計(jì)算能力,縮短了對(duì)大數(shù)據(jù)集挖掘頻繁項(xiàng)集的時(shí)間,具有較高的執(zhí)行效率。在多個(gè)數(shù)據(jù)集上對(duì)算法進(jìn)行了測(cè)試,實(shí)驗(yàn)結(jié)果表明:并行DHP算法對(duì)大數(shù)據(jù)集具有較好的加速比和可擴(kuò)展性。

    參考文獻(xiàn)

    [1]ParkJS,ChenMS,YuPS.Aneffectivehash-basedalgorithmforminingassociationrules[C]//Proceedingsofthe1995ACMSIGMODInternationalConferenceonManagementofData.NewYork:ACM,1995,24(2):175-186.

    [2]AgrawalR,SrikantR.Fastalgorithmsforminingassociationrules[C]//Proceedingsofthe20thInternationalConferenceonVeryLargeDataBases.Santiago,Chile,1994:487-499.

    [3]HoltJD,ChungSM.Efficientminingofassociationrulesintextdatabases[C]//ProceedingsoftheEighthInternationalConferenceonInformationandKnowledgeManagement.NewYork:ACM,1999:234-242.

    [4] 王濤偉,周必水.基于DHP的頻繁遍歷路徑挖掘算法[J].杭州電子科技大學(xué)學(xué)報(bào),2005,25(5):60-63.

    [5]ArmbrustM,FoxA,GriffithR,etal.Abovetheclouds:aBerkeleyviewofcloudcomputing[R/OL].2009-02-10[2015-02-15].http://www.eecs.berkeley.edu/Pubs/TechRpts/2009/EECS-2009-28.html.

    [6] 周麗娟,王翔.云環(huán)境下關(guān)聯(lián)規(guī)則算法的研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2014,35(2):499-503.

    [7]DeanJ,GhemawatS.MapReduce:simplifieddataprocessingonlargeclusters[J].CommunicationsoftheACM,2008,51(1):107-113.

    [8] 李建江,崔健,王聃,等.MapReduce并行編程模型研究綜述[J].電子學(xué)報(bào),2011,39(11):2635-2642.

    [9]TheApacheSoftwareFoundation.Hadoop[EB/OL].2014-12-12[2015-02-15].http://hadoop.apache.org/.

    [10] 黃立勤,柳燕煌.基于MapReduce并行的Apriori算法改進(jìn)研究[J].福州大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,39(5):680-685.

    [11] 陳興蜀,張帥,童浩,等.基于布爾矩陣和MapReduce的FP-Growth算法[J].華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,42(1):135-141.

    [12] 陳軍,莫?jiǎng)t堯,李曉梅,等.大規(guī)模并行應(yīng)用程序的可擴(kuò)展性研究[J].計(jì)算機(jī)研究與發(fā)展,2000,37(11):1382-1388.

    RESEARCH ON PARALLELISATION OF DHP ALGORITHM BASED ON MAPREDUCE

    Zhou GuojunWu Qingjun

    (School of Mathematics and Information Science,Yulin Normal University,Yulin 537000,Guangxi,China)

    AbstractDHP algorithm is confronted with the problems in association rules mining for big data such as long execution time and low efficiency,etc.In order to solve the problems,we studied the parallelisation strategy of DHP algorithm.According to MapReduce parallel programming model of cloud computing platform Hadoop,we designed a parallel DHP algorithm,presented the overall flow of the algorithm and the algorithm descriptions of Map function and Reduce function.Compared with DHP algorithm,the parallel DHP algorithm makes use of the powerful computing capacity of Hadoop cluster,improves the efficiency of mining association rules from big data.We analysed the execution process of parallel DHP algorithm by example,and carried out experiments on a couple of datasets.Experimental results showed that the parallel DHP algorithm has good speedup and scalability on big data.

    KeywordsMapReduceHadoopDHP algorithmAssociation rules

    收稿日期:2015-03-03。廣西高??茖W(xué)技術(shù)研究立項(xiàng)項(xiàng)目(LX20 14300)。周國(guó)軍,講師,主研領(lǐng)域:數(shù)據(jù)挖掘,云計(jì)算。吳慶軍,副教授。

    中圖分類號(hào)TP311.1

    文獻(xiàn)標(biāo)識(shí)碼A

    DOI:10.3969/j.issn.1000-386x.2016.06.012

    久久精品亚洲av国产电影网| 免费久久久久久久精品成人欧美视频| 亚洲欧洲精品一区二区精品久久久| 午夜福利影视在线免费观看| 嫩草影视91久久| 高清视频免费观看一区二区| 男人操女人黄网站| 精品少妇久久久久久888优播| 亚洲自偷自拍图片 自拍| 少妇粗大呻吟视频| 亚洲av美国av| 中文欧美无线码| 久久久国产一区二区| 一级毛片电影观看| 亚洲精品第二区| 精品一品国产午夜福利视频| 日韩av不卡免费在线播放| 亚洲国产欧美在线一区| 丝袜脚勾引网站| 日本欧美视频一区| 亚洲国产欧美一区二区综合| 久久久国产一区二区| 欧美性长视频在线观看| 波多野结衣av一区二区av| 国产男女超爽视频在线观看| 最新在线观看一区二区三区 | 亚洲国产欧美日韩在线播放| 久久鲁丝午夜福利片| 久久性视频一级片| 亚洲精品久久午夜乱码| 亚洲专区中文字幕在线| 久久国产精品大桥未久av| 日韩伦理黄色片| 久久99热这里只频精品6学生| 一二三四在线观看免费中文在| 欧美97在线视频| 亚洲七黄色美女视频| 少妇的丰满在线观看| 欧美日韩国产mv在线观看视频| 成人国产一区最新在线观看 | 我要看黄色一级片免费的| 成年av动漫网址| 国产欧美亚洲国产| 国产一区二区在线观看av| 在线观看免费高清a一片| 欧美成人精品欧美一级黄| 中文字幕人妻丝袜一区二区| 99热国产这里只有精品6| 啦啦啦中文免费视频观看日本| 老司机靠b影院| 久久天堂一区二区三区四区| 午夜福利乱码中文字幕| 亚洲国产欧美在线一区| 精品久久蜜臀av无| 国产激情久久老熟女| 久久久久精品国产欧美久久久 | 看免费成人av毛片| videosex国产| videosex国产| 女性生殖器流出的白浆| e午夜精品久久久久久久| 国产免费一区二区三区四区乱码| 国产欧美日韩一区二区三区在线| 国产精品久久久久久精品古装| 在线观看人妻少妇| 国产免费福利视频在线观看| 熟女少妇亚洲综合色aaa.| 水蜜桃什么品种好| 精品人妻熟女毛片av久久网站| 日本av免费视频播放| 人人妻人人添人人爽欧美一区卜| 欧美+亚洲+日韩+国产| 波野结衣二区三区在线| 亚洲成国产人片在线观看| 最近手机中文字幕大全| 亚洲国产看品久久| 国产精品成人在线| 亚洲中文日韩欧美视频| 亚洲少妇的诱惑av| 男的添女的下面高潮视频| 国产亚洲午夜精品一区二区久久| 久久久精品区二区三区| 男女床上黄色一级片免费看| 亚洲国产av新网站| 亚洲欧美中文字幕日韩二区| 男女床上黄色一级片免费看| 日本一区二区免费在线视频| 国产1区2区3区精品| 好男人电影高清在线观看| 国产欧美日韩精品亚洲av| 一级,二级,三级黄色视频| 久久久久久亚洲精品国产蜜桃av| 99国产精品一区二区三区| 精品视频人人做人人爽| av网站免费在线观看视频| 国产激情久久老熟女| 亚洲五月色婷婷综合| 免费看不卡的av| 一区二区三区精品91| 亚洲欧洲精品一区二区精品久久久| 亚洲三区欧美一区| 啦啦啦 在线观看视频| 免费高清在线观看视频在线观看| 啦啦啦视频在线资源免费观看| 成年av动漫网址| 精品国产一区二区三区久久久樱花| 各种免费的搞黄视频| 久久久久网色| 久久亚洲国产成人精品v| 日本av免费视频播放| 啦啦啦视频在线资源免费观看| 午夜免费成人在线视频| 日韩一本色道免费dvd| 国产精品一区二区在线不卡| 亚洲av成人不卡在线观看播放网 | 国产精品秋霞免费鲁丝片| 咕卡用的链子| 精品亚洲成国产av| 精品少妇黑人巨大在线播放| 欧美日韩福利视频一区二区| 在现免费观看毛片| 亚洲av成人不卡在线观看播放网 | 纵有疾风起免费观看全集完整版| 亚洲欧洲精品一区二区精品久久久| 黄片小视频在线播放| 久久99一区二区三区| 欧美另类一区| 国产爽快片一区二区三区| 夫妻性生交免费视频一级片| 国产亚洲午夜精品一区二区久久| 亚洲精品国产av蜜桃| 视频区欧美日本亚洲| 亚洲国产av影院在线观看| 免费在线观看视频国产中文字幕亚洲 | 国产在线观看jvid| 国产精品 国内视频| 亚洲av电影在线观看一区二区三区| 欧美亚洲日本最大视频资源| 天堂中文最新版在线下载| 一级毛片电影观看| 精品人妻1区二区| 性色av乱码一区二区三区2| 精品欧美一区二区三区在线| 美女视频免费永久观看网站| 国产成人精品久久久久久| 欧美少妇被猛烈插入视频| 国产精品久久久久久精品古装| 亚洲av日韩精品久久久久久密 | 伊人久久大香线蕉亚洲五| 国产有黄有色有爽视频| 精品久久蜜臀av无| 老司机靠b影院| 欧美黑人精品巨大| 香蕉国产在线看| 色视频在线一区二区三区| 丝袜脚勾引网站| 亚洲,欧美精品.| 亚洲欧洲国产日韩| 精品少妇一区二区三区视频日本电影| 久久女婷五月综合色啪小说| 精品一区在线观看国产| av在线app专区| 国产精品 国内视频| 中国国产av一级| 老司机亚洲免费影院| 十八禁高潮呻吟视频| 一级毛片黄色毛片免费观看视频| 国产成人91sexporn| 亚洲午夜精品一区,二区,三区| 国产又色又爽无遮挡免| 操美女的视频在线观看| 黄网站色视频无遮挡免费观看| 人人妻人人澡人人爽人人夜夜| 亚洲免费av在线视频| 国产成人精品久久二区二区免费| 波多野结衣av一区二区av| 这个男人来自地球电影免费观看| 亚洲欧美一区二区三区久久| 国产91精品成人一区二区三区 | 亚洲av欧美aⅴ国产| 亚洲精品国产一区二区精华液| 色婷婷久久久亚洲欧美| 在线观看一区二区三区激情| 亚洲av欧美aⅴ国产| 日韩av免费高清视频| a级毛片黄视频| 99re6热这里在线精品视频| 女警被强在线播放| 看免费av毛片| 亚洲成人免费av在线播放| 亚洲欧美一区二区三区黑人| 99久久精品国产亚洲精品| 国产日韩一区二区三区精品不卡| 一二三四在线观看免费中文在| 精品人妻在线不人妻| 久久中文字幕一级| 精品国产一区二区久久| 天天躁日日躁夜夜躁夜夜| 在线观看免费视频网站a站| 男人操女人黄网站| 国产精品一区二区精品视频观看| 色网站视频免费| 国产精品欧美亚洲77777| 老汉色∧v一级毛片| 国产成人精品在线电影| 女警被强在线播放| 中国国产av一级| 久久久久国产精品人妻一区二区| 久热这里只有精品99| a级毛片在线看网站| 国产男女内射视频| 9热在线视频观看99| 亚洲国产看品久久| 亚洲av欧美aⅴ国产| 国产精品 欧美亚洲| 久热爱精品视频在线9| 一区福利在线观看| 欧美激情高清一区二区三区| 性少妇av在线| 精品卡一卡二卡四卡免费| av在线app专区| 肉色欧美久久久久久久蜜桃| 色综合欧美亚洲国产小说| 男人爽女人下面视频在线观看| av在线app专区| 51午夜福利影视在线观看| 黑人欧美特级aaaaaa片| 国产亚洲精品第一综合不卡| 在线观看免费午夜福利视频| 日韩一区二区三区影片| 纵有疾风起免费观看全集完整版| 黄色怎么调成土黄色| 日本欧美国产在线视频| 青青草视频在线视频观看| 9热在线视频观看99| 日本欧美视频一区| 欧美xxⅹ黑人| 各种免费的搞黄视频| 国产片特级美女逼逼视频| 久久精品熟女亚洲av麻豆精品| 国产免费福利视频在线观看| 国产精品免费大片| 纯流量卡能插随身wifi吗| 国产精品久久久久久人妻精品电影 | 在线 av 中文字幕| 国产成人av激情在线播放| 国产精品99久久99久久久不卡| av在线app专区| 女性生殖器流出的白浆| 日韩伦理黄色片| 婷婷色综合www| 欧美日本中文国产一区发布| 多毛熟女@视频| 国产深夜福利视频在线观看| 免费人妻精品一区二区三区视频| 亚洲一区中文字幕在线| 狠狠婷婷综合久久久久久88av| 免费在线观看日本一区| 午夜福利,免费看| 一级片'在线观看视频| 嫩草影视91久久| 日韩大码丰满熟妇| 国产免费一区二区三区四区乱码| 亚洲中文av在线| 久久影院123| 国产成人系列免费观看| 又大又黄又爽视频免费| 黄色 视频免费看| 一级毛片黄色毛片免费观看视频| 99久久综合免费| 午夜免费男女啪啪视频观看| 男女边吃奶边做爰视频| 久久国产精品男人的天堂亚洲| 日本午夜av视频| 亚洲精品第二区| 久久精品国产亚洲av高清一级| 国产成人免费无遮挡视频| 久久久欧美国产精品| 国产男人的电影天堂91| 国产成人系列免费观看| 国产精品亚洲av一区麻豆| 国产精品国产三级国产专区5o| 最近最新中文字幕大全免费视频 | 欧美老熟妇乱子伦牲交| av网站在线播放免费| 亚洲图色成人| 操出白浆在线播放| 欧美成人午夜精品| 日韩一本色道免费dvd| 国产精品久久久久成人av| 岛国毛片在线播放| 国产99久久九九免费精品| 久久天堂一区二区三区四区| 丰满人妻熟妇乱又伦精品不卡| 晚上一个人看的免费电影| www.av在线官网国产| 91麻豆av在线| 少妇精品久久久久久久| av片东京热男人的天堂| 亚洲图色成人| 国产一区二区在线观看av| 悠悠久久av| 国产成人影院久久av| 亚洲精品日本国产第一区| 久久女婷五月综合色啪小说| 久久久国产一区二区| 国产精品国产三级国产专区5o| 黑丝袜美女国产一区| 丰满人妻熟妇乱又伦精品不卡| 亚洲精品国产区一区二| 国产精品久久久人人做人人爽| 丝袜喷水一区| 黄网站色视频无遮挡免费观看| 嫩草影视91久久| 亚洲中文av在线| 亚洲成国产人片在线观看| 亚洲一区中文字幕在线| 国产又爽黄色视频| 欧美日韩亚洲高清精品| 夫妻性生交免费视频一级片| 99久久精品国产亚洲精品| 亚洲欧美日韩另类电影网站| 女人久久www免费人成看片| 黄色片一级片一级黄色片| 女人爽到高潮嗷嗷叫在线视频| 精品一品国产午夜福利视频| 日韩人妻精品一区2区三区| 中文精品一卡2卡3卡4更新| 国产高清视频在线播放一区 | 亚洲av成人不卡在线观看播放网 | 成人手机av| av国产精品久久久久影院| 亚洲国产看品久久| 大香蕉久久成人网| 欧美另类一区| 国产野战对白在线观看| 这个男人来自地球电影免费观看| av在线播放精品| 啦啦啦啦在线视频资源| 精品免费久久久久久久清纯 | 丰满少妇做爰视频| 极品少妇高潮喷水抽搐| 久久久久久久久久久久大奶| 黄色怎么调成土黄色| 国产精品麻豆人妻色哟哟久久| 在线观看免费日韩欧美大片| 亚洲自偷自拍图片 自拍| 亚洲视频免费观看视频| 制服诱惑二区| 王馨瑶露胸无遮挡在线观看| 日韩精品免费视频一区二区三区| 免费观看a级毛片全部| 我要看黄色一级片免费的| 亚洲成av片中文字幕在线观看| 亚洲av男天堂| 亚洲熟女毛片儿| 成人亚洲欧美一区二区av| 国产视频首页在线观看| 亚洲伊人色综图| 国产精品 国内视频| 大片免费播放器 马上看| 免费看不卡的av| 99热网站在线观看| 麻豆乱淫一区二区| 国产有黄有色有爽视频| 看免费av毛片| 亚洲人成网站在线观看播放| 精品久久久久久电影网| 国产精品国产三级国产专区5o| 香蕉丝袜av| 热re99久久国产66热| 亚洲中文av在线| 91精品伊人久久大香线蕉| av有码第一页| 亚洲国产欧美网| 久久国产精品大桥未久av| netflix在线观看网站| 午夜福利免费观看在线| 99九九在线精品视频| 国产男女超爽视频在线观看| 我要看黄色一级片免费的| 免费观看av网站的网址| 下体分泌物呈黄色| 最新的欧美精品一区二区| 久久人人爽人人片av| 18在线观看网站| 亚洲欧美激情在线| 亚洲色图 男人天堂 中文字幕| 美女视频免费永久观看网站| 午夜老司机福利片| 新久久久久国产一级毛片| 成人国产av品久久久| 老司机深夜福利视频在线观看 | 日韩av免费高清视频| 精品视频人人做人人爽| av天堂久久9| 国产成人一区二区在线| 日日爽夜夜爽网站| 国产男女超爽视频在线观看| 免费日韩欧美在线观看| 亚洲一区二区三区欧美精品| 欧美亚洲日本最大视频资源| 别揉我奶头~嗯~啊~动态视频 | 国产免费现黄频在线看| 9191精品国产免费久久| 亚洲国产精品一区二区三区在线| 少妇 在线观看| 免费人妻精品一区二区三区视频| 久久久久久久大尺度免费视频| 欧美成狂野欧美在线观看| 女人被躁到高潮嗷嗷叫费观| 99热网站在线观看| 精品视频人人做人人爽| 久久影院123| 在线精品无人区一区二区三| 精品高清国产在线一区| 精品免费久久久久久久清纯 | 夜夜骑夜夜射夜夜干| 久久中文字幕一级| 下体分泌物呈黄色| 成人手机av| 亚洲精品国产av蜜桃| 亚洲伊人久久精品综合| 男人添女人高潮全过程视频| 欧美精品av麻豆av| 岛国毛片在线播放| 夜夜骑夜夜射夜夜干| 纵有疾风起免费观看全集完整版| 亚洲三区欧美一区| 女警被强在线播放| 丝袜在线中文字幕| 久久99精品国语久久久| cao死你这个sao货| 伦理电影免费视频| 午夜影院在线不卡| 久久久久网色| 老司机影院毛片| 2021少妇久久久久久久久久久| 亚洲中文av在线| 久久久久久久久免费视频了| 老司机深夜福利视频在线观看 | 国产精品免费视频内射| 免费观看人在逋| 国精品久久久久久国模美| 久久av网站| 2018国产大陆天天弄谢| 97在线人人人人妻| 亚洲美女黄色视频免费看| 欧美精品啪啪一区二区三区 | 久热这里只有精品99| 亚洲精品乱久久久久久| 亚洲av在线观看美女高潮| 99精品久久久久人妻精品| 日韩中文字幕欧美一区二区 | 一二三四在线观看免费中文在| 51午夜福利影视在线观看| 99久久99久久久精品蜜桃| 日本黄色日本黄色录像| 欧美精品av麻豆av| 考比视频在线观看| 国产亚洲欧美精品永久| 日本91视频免费播放| 亚洲人成电影免费在线| 每晚都被弄得嗷嗷叫到高潮| 日本av免费视频播放| 性色av一级| 麻豆av在线久日| 亚洲欧美中文字幕日韩二区| 只有这里有精品99| av线在线观看网站| 亚洲欧洲日产国产| 黄色视频不卡| 色婷婷久久久亚洲欧美| 成年人黄色毛片网站| 精品人妻1区二区| 国产精品免费大片| 亚洲国产日韩一区二区| 亚洲精品国产av成人精品| 日韩av在线免费看完整版不卡| 悠悠久久av| 欧美黄色淫秽网站| 1024香蕉在线观看| netflix在线观看网站| 欧美精品人与动牲交sv欧美| 一本大道久久a久久精品| 久久人妻福利社区极品人妻图片 | 中国国产av一级| 男女无遮挡免费网站观看| 两人在一起打扑克的视频| 999久久久国产精品视频| 欧美人与性动交α欧美精品济南到| 日韩一区二区三区影片| 久久免费观看电影| 国产精品免费视频内射| 久久久亚洲精品成人影院| 女性被躁到高潮视频| 国产伦人伦偷精品视频| 午夜福利视频精品| 欧美黑人欧美精品刺激| 亚洲国产精品一区三区| 国产精品国产av在线观看| 欧美中文综合在线视频| 午夜福利乱码中文字幕| 夫妻午夜视频| 一区福利在线观看| 亚洲欧洲日产国产| 国产av一区二区精品久久| 欧美国产精品一级二级三级| 久久亚洲精品不卡| 高清av免费在线| 日韩精品免费视频一区二区三区| 大片电影免费在线观看免费| 精品国产一区二区三区四区第35| 91麻豆av在线| 久久狼人影院| 国产亚洲午夜精品一区二区久久| 人妻 亚洲 视频| 国产激情久久老熟女| 国产av一区二区精品久久| 国产高清videossex| 黄片小视频在线播放| av国产久精品久网站免费入址| 交换朋友夫妻互换小说| 在线亚洲精品国产二区图片欧美| 熟女少妇亚洲综合色aaa.| 成年人免费黄色播放视频| 欧美精品啪啪一区二区三区 | 国产麻豆69| 精品一品国产午夜福利视频| 91精品国产国语对白视频| 欧美精品人与动牲交sv欧美| 男人舔女人的私密视频| 黑人猛操日本美女一级片| 五月开心婷婷网| 欧美精品亚洲一区二区| 视频区图区小说| 久久精品熟女亚洲av麻豆精品| 日日夜夜操网爽| 国产成人精品久久二区二区91| 飞空精品影院首页| 亚洲综合色网址| 看免费成人av毛片| 午夜激情av网站| 午夜老司机福利片| 蜜桃在线观看..| 精品久久久精品久久久| 两性夫妻黄色片| 国产日韩欧美在线精品| 亚洲色图综合在线观看| 亚洲av欧美aⅴ国产| 好男人电影高清在线观看| 欧美少妇被猛烈插入视频| 国产精品一区二区在线观看99| 亚洲精品成人av观看孕妇| av片东京热男人的天堂| 人人妻人人爽人人添夜夜欢视频| 2021少妇久久久久久久久久久| 国产熟女午夜一区二区三区| 精品一品国产午夜福利视频| 亚洲av片天天在线观看| 在线观看免费日韩欧美大片| 天天影视国产精品| 中文字幕av电影在线播放| 日韩一本色道免费dvd| 亚洲国产精品国产精品| 精品第一国产精品| 黄频高清免费视频| 亚洲国产成人一精品久久久| 一级毛片电影观看| 精品国产乱码久久久久久男人| 亚洲av综合色区一区| 大片电影免费在线观看免费| 久久久国产精品麻豆| 又紧又爽又黄一区二区| 首页视频小说图片口味搜索 | 亚洲,一卡二卡三卡| 99精国产麻豆久久婷婷| 国产精品99久久99久久久不卡| 菩萨蛮人人尽说江南好唐韦庄| 欧美变态另类bdsm刘玥| 脱女人内裤的视频| 中文字幕人妻丝袜制服| 欧美精品啪啪一区二区三区 | 色94色欧美一区二区| 国产精品熟女久久久久浪| 男女边摸边吃奶| 悠悠久久av| a级片在线免费高清观看视频| 99久久精品国产亚洲精品| videos熟女内射| 国产亚洲欧美精品永久| 国产精品国产av在线观看| 青青草视频在线视频观看| 黄色视频不卡| 亚洲自偷自拍图片 自拍| 日韩一本色道免费dvd| 飞空精品影院首页| 亚洲成国产人片在线观看| 考比视频在线观看| 黄色a级毛片大全视频| 国产高清不卡午夜福利| 一级毛片我不卡| 国产成人精品久久二区二区91| 久久久精品区二区三区| 18禁黄网站禁片午夜丰满| 精品亚洲成国产av| 高清av免费在线| 一本一本久久a久久精品综合妖精| 亚洲欧美日韩高清在线视频 | 免费女性裸体啪啪无遮挡网站| 老汉色∧v一级毛片| 免费av中文字幕在线| 免费女性裸体啪啪无遮挡网站| 亚洲精品国产av蜜桃| 国产日韩一区二区三区精品不卡|