• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于DiffNodeset結(jié)構(gòu)的最大頻繁項集挖掘算法

    2019-01-07 12:26:22鄭云俊
    計算機應(yīng)用 2018年12期
    關(guān)鍵詞:剪枝項集復(fù)雜度

    尹 遠,張 昌,文 凱,鄭云俊

    (1.重慶郵電大學(xué) 通信新技術(shù)應(yīng)用研究中心,重慶 400065; 2.中國電信股份有限公司 重慶分公司,重慶 401121; 3.重慶信科設(shè)計有限公司,重慶 401121)(*通信作者電子郵箱wszhangchang@yeah.net)

    0 引言

    數(shù)據(jù)挖掘指的是挖掘大量數(shù)據(jù)之間的隱藏關(guān)系,數(shù)據(jù)挖掘的分析方法包括分類、估計預(yù)測、頻繁項集挖掘和聚類等。其中頻繁模式和關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的主要研究領(lǐng)域,Agrawal等[1]于1994年提出頻繁模式挖掘算法——Apriori算法,Han等[2]于2004年提出了頻繁模式增長(Frequent Pattern growth, FP-growth)算法等。但如果數(shù)據(jù)庫比較龐大并且支持度閾值設(shè)置較低時,頻繁項集的數(shù)量就會非常龐大,這是頻繁項集挖掘所面臨的一個問題。

    在數(shù)據(jù)挖掘中,通過挖掘最大頻繁項集來代替挖掘頻繁項集可以大大地提升系統(tǒng)的運行效率,近年來已經(jīng)有很多專家學(xué)者對最大頻繁項集挖掘算法進行了較為深入的研究。Bayardo[3]最先提出了最大頻繁項集挖掘的概念并提出了一種最大頻繁項集挖掘算法——Max-Miner算法,該算法主要采用了廣度優(yōu)先搜索的思想,然后結(jié)合了前瞻剪枝策略以及動態(tài)排序技術(shù),由于廣度優(yōu)先搜索用于挖掘最大頻繁項集時有缺陷,所以該算法性能不夠好。Agrawal等[4]提出了DepthProject算法,該算法融合了深度優(yōu)先搜索的思想以及動態(tài)記錄的技術(shù),其算法性能較Max-Miner算法提升了一個數(shù)量級。Burdick等[5]提出了一種最大頻繁項集挖掘算法(MAximal Frequent Itemset Algorithm, MAFIA),該算法將項集網(wǎng)格和子集樹作為框架,同時采用縱向位圖來存儲數(shù)據(jù),然后結(jié)合了父等價剪枝、前瞻剪枝等多種剪枝技術(shù),其算法性能較DepthProject算法提升了3~5倍。Zou等[6]提出SmartMiner算法并采用了與MAFIA相似的數(shù)據(jù)存儲結(jié)構(gòu),但該算法采用了動態(tài)記錄啟發(fā)式深度優(yōu)先搜索策略,所以該算法特點在于產(chǎn)生的搜索樹相對MAFIA與GenMax[7]算法更小,算法性能相對更優(yōu)。沈戈暉等[8]提出了基于N-list的MAFIA(N-list based MAFIA, NB-MAFIA),該算法在基于深度優(yōu)先搜索的框架之下,引入了基于項集前綴樹節(jié)點鏈表的項集表示方法N-list[9]來表示項集,最后再結(jié)合相應(yīng)的優(yōu)化剪枝策略和超集檢測策略來提升算法的效率,但還可以針對稀疏數(shù)據(jù)集場景下的NB-MAFIA的性能進行進一步優(yōu)化。

    針對現(xiàn)有的最大頻繁項集挖掘算法挖掘的時間消耗較大的問題,本文提出了一種基于DiffNodeset[10]結(jié)構(gòu)的最大頻繁項集挖掘(DiffNodeset Maximal Frequent Itemset Mining, DNMFIM)算法。該算法采用了一種新的數(shù)據(jù)結(jié)構(gòu)DiffNodeset來實現(xiàn)高效的求交集運算以及支持度的快速計算,并引入一種新的線性復(fù)雜度的連接方法來降低兩個DiffNodeset在連接過程中的復(fù)雜度,避免了多次的無效計算。實驗結(jié)果表明,DNMFIM算法在時間效率方面優(yōu)于MAFIA與NB-MAFIA,該算法在不同類型數(shù)據(jù)集中進行最大頻繁項集挖掘時均有良好的效果。

    1 相關(guān)知識

    1.1 基本概念

    假定I={i1,i2,…,im}是m個不同項組成的集合,包含n(0≤n≤m)個項的集合稱為項集。

    定義1[9]頻繁項集。若項集X的支持度大于或等于用戶規(guī)定的最小支持度閾值,則稱X是頻繁項集。

    定義2[5]最大頻繁項集。若頻繁項集X的任意超集Y均不是頻繁項集,則稱X為最大頻繁項集。

    1.2 前序后序編碼樹

    首先給定一個數(shù)據(jù)庫和設(shè)置一個最小支持度閾值,然后開始構(gòu)建前序后序編碼樹(Pre-order and Post-order Code tree, PPC-tree)[9]。

    PPC-tree由根節(jié)點(root)以及項目的前綴子樹組成。項目前綴子樹的每個節(jié)點由5個部分構(gòu)成(item-name、count、children-list、pre-order、post-order),這5部分分別表示節(jié)點的項目名稱、經(jīng)過該節(jié)點的事務(wù)數(shù)目、子節(jié)點、前序編碼、后序編碼。構(gòu)建PPC-tree的算法[9]如算法1所示(詳細的構(gòu)建過程參考文獻[9])。

    算法1 Construct-PPC-tree(DB,minSup)。

    輸入 事務(wù)數(shù)據(jù)庫DB和minSup;

    輸出 生成所有頻繁1-項集和PPC-tree。

    1)

    [Frequent 1-itemsets generation]

    2)

    According tominSup,scanDBonce to findF1, the set of

    frequent 1-itemsets (frequent items), and their supports.

    3)

    SortF1in support descending order asL1,

    4)

    for each transactionTransinDBdo

    5)

    Select the frequent items inTransand sort out them according

    to the order ofF1. Let the sorted frequent-item list inTrans

    be [p|P], wherepis the first element andPis the remaining list.

    6)

    Call insert tree([p|P],Tr).

    7)

    Scan PPC-tree to generate the pre-order and the post-order of

    each node.

    8)

    ReturnTrandL1.

    根據(jù)算法1來構(gòu)建TB-tree,設(shè)事務(wù)數(shù)據(jù)庫DB如表1所示(minSup=0.4),圖1是針對事務(wù)數(shù)據(jù)庫DB運行算法之后構(gòu)建成的PPC-tree。

    表1 事務(wù)數(shù)據(jù)集DBTab. 1 Transaction data set DB

    圖1 PPC-treeFig. 1 PPC-tree

    根據(jù)圖1的PPC-tree,各節(jié)點的節(jié)點編碼歸納如表2所示,該1-項集的Nodesets表有助于更加清楚地理解DiffNodeset的連接過程。

    表2 1-項集的NodesetsTab.2 Nodesets of 1-itemsets

    給定一個PPC-tree,有以下的性質(zhì)[9]:

    性質(zhì)1 對于PPC樹中的任意兩個節(jié)點N1和N2(N1≠N2),當且僅當N1.pre-orderN2.post-order時,則稱N1是N2的祖先。

    證明 由PPC-tree構(gòu)建算法可知,祖先節(jié)點總是先于子孫節(jié)點構(gòu)建,因此,祖先節(jié)點對應(yīng)的pre-order總是小于子孫節(jié)點的pre-order;又因為祖先節(jié)點總是晚于孩子節(jié)點構(gòu)建完成,因此祖先節(jié)點對應(yīng)的pre-post值總是大于子孫節(jié)點的pre-post。

    性質(zhì)2 對于在PPC-tree中任何兩個具有相同節(jié)點名稱的N1和N2(N1≠N2),如果N1.pre-order

    證明 若N1.pre-order

    1.3 DiffNodeset結(jié)構(gòu)

    近年來,數(shù)據(jù)挖掘領(lǐng)域為了提高頻繁項集的挖掘效率,已經(jīng)有很多種數(shù)據(jù)結(jié)構(gòu)被提出,例如:Node-list[11]、N-list、Nodeset[12]等。它們都是基于前綴編碼樹來存儲頻繁項集的信息,Nodeset相對于N-list、Node-list的區(qū)別在于N-list和Node-list需要前序編碼和后序編碼來表示節(jié)點,而Nodeset只需要前序(或后序)編碼來表示節(jié)點,所以Nodeset結(jié)構(gòu)對內(nèi)存的消耗更小。但在很多數(shù)據(jù)集中采用Nodeset結(jié)構(gòu)時,產(chǎn)生的節(jié)點集基數(shù)會很大。針對這一問題,引入了一種新的項集表示方法DiffNodeset[10],它只表示項集在生成頻繁項集產(chǎn)生的差異節(jié)點集,產(chǎn)生的DiffNodeset基數(shù)相對于Nodeset結(jié)構(gòu)少得多。DiffNodeset是一種高度壓縮且結(jié)構(gòu)簡便的數(shù)據(jù)結(jié)構(gòu),可以高效地挖掘頻繁項集。

    DiffNodeset是一種基于Nodeset的一種數(shù)據(jù)結(jié)構(gòu),這里介紹一下Nodeset結(jié)構(gòu)及定義[10](以下定義及詳細證明過程參考文獻[10])。

    定義3 設(shè)L1是按支持度降序排列的頻繁項集,對于任意兩個項集i1,i2(i1,i2∈L1) ,若存在項集i2在i1之前,則用i1?i2來表示。

    定義4 前序后序編碼(Pre-Post code, PP-code)給定一個PPC-tree,節(jié)點N的PP-code為(N.pre-order,N.post-order,count)。該PP-code包含前序編碼和后序編碼,文獻[12]中的原始定義只包含前序編碼,由于前序和后序都可以唯一標識PPC樹中的節(jié)點,所以差異可以忽略不計。在本文中,采用定義4來定義項目的節(jié)點集是為了設(shè)計出構(gòu)建2-項集DiffNodeset的有效方法。

    定義5 1-項集的Nodesets。假設(shè)一個PPC-tree,每一個i的節(jié)點集都按PP-codes中的pre-order的升序排列(1-項集的Nodesets如表2所示)。

    性質(zhì)3 給定一個項集,假設(shè){(x1,y1,z1), (x2,y2,z2),…, (xl,yl,zl)}是相應(yīng)的Nodeset,在此存在x1

    證明 根據(jù)定義5,有x1

    定義6 2-項集DiffNodesets。假設(shè)兩個項集i1和i2(i1,i2∈L1∩i1?i2),給它們的節(jié)點集分別定義為Nodesesti2和Nodesetsi2。2-項集i1i2的節(jié)點集可以用DiffNodesetsi1i2表示,定義如下:

    DiffNodesetsi1i2= {(x.pre-order,x.count) |x∈Nodesetsi1∩?(?y∈Nodesetsi2,the node corresponding toyis an ancestor of the node corresponding tox)}(DiffNodesetsi1i2中的元素按前序編碼pre-order的升序排序)。

    為了較好地理解該定義,以b和f的Nodeset為例說明,從表2可得b和f的Nodeset分別為(6,11,4)和(3,3,1)(12,10,3)(10,7,1)。bf的DiffNodeset連接過程如下:顯然根據(jù)性質(zhì)1可得(6,11,4)是(12,10,3)(10,7,1)的祖先而不是(3,3,1)的祖先,那么根據(jù)該定義可得bf的DiffNodeset為(3,1),同理可得bc的DiffNodeset為(2,1)。

    假設(shè)兩個項集i1、i2的長度分別為m和n,可以通過檢查i1中每個元素與i2中每個元素之間的祖先-子孫關(guān)系來構(gòu)建DiffNodesetsi1i2。這種遍歷所有元素的方法顯然效率會比較低下,因為它的計算復(fù)雜度是O(m*n)。在此,通過性質(zhì)1和性質(zhì)3來引入一種線性復(fù)雜度的方法來構(gòu)建2-項集DN(),這種方法的復(fù)雜度為O(m+n),大大降低了計算的復(fù)雜度。

    定義7k-項集DiffNodesets。假設(shè)P=i1i2…ik-2ik-1ik是一個項集(滿足ij∈L1且i1?i2?i3?…?ik)。P1=i1i2…ik-2ik-1的Nodeset記為NodesetP1,P2=i1i2…ik-2ik的Nodeset記為NodesetP2。P的DiffNodeset記為DiffNodesetP可以由如下計算得到:

    DiffNodesetP=NodesetP1/NodesetP2

    其中:“/”表示集合差。

    性質(zhì)4 假設(shè)P=i1i2…ik-2ik-1ik,P1=i1i2…ik-2ik-1,那么P的支持度計算方式如下:

    support(P)=support(P1)-∑(E∈DNP)E.count

    其中DNP即為DiffNodesetP。

    證明 假設(shè)X=i1i2…ik-3ik-2,Y=i1i2…ik-3ik-1。X、Y、P1和P2的Nodeset記為NSX、NSY、NS1、NS2。在k-項集的Nodeset中存在NS1=NSX∩NSY,在k-項集的DiffNodeset中存在DN1=NSX/NSY。

    support(P1)=∑(E∈NS1)E.count=

    ∑(E∈NSP∪DNP)E.count=

    ∑(E∈NSP)E.count+∑(E∈DNP)E.count=

    support(P)+∑(E∈DNP)E.count

    性質(zhì)5 假設(shè)P=i1i2…ik-2ik-1ik是一個項集(滿足ij∈L1且i1?i2?i3?…?ik)。P1=i1i2…ik-2ik-1的DiffNodeset記為DN1,P2=i1i2…ik-2ik的DiffNodeset記為DN2。P的DiffNodeset記為DNp,其計算式如下:

    DNP=DN2/DN1

    證明 假設(shè)X=i1i2…ik-3ik-2,Y=i1i2…ik-3ik-1。X、Y、P1和P2的Nodeset記為NSX、NSY、NS1、NS2。在k-項集的Nodeset中存在NS1=NSX∩NSY,在k-項集的DiffNodeset中存在DN1=NSX/NSY。

    根據(jù)上述兩個條件可以得到:

    NSX=(NSX∩NSY)∪(NSX/NSY)=NS1∪DN1

    NS1∩DN1=?

    然后得到NS1=NSX/DN1。

    同理可得:

    NSX=NS2∪DN2

    NS2∩DN2=?

    NS2=NSX/DN2

    最后可得:

    DNP=NS1/NS2=

    (NSX/DN1)/(NSX/DN2)=NSX∩(DN1)T∩DN2=

    DN2∩(DN1)T=DN2/DN1

    DiffNodeset采用性質(zhì)5可以使DiffNodeset直接計算構(gòu)成k-項集的DiffNodeset,不需要再進行Nodeset的計算。

    2 DNMFIM算法

    2.1 基于DiffNodeset的深度優(yōu)先搜索算法

    DNMFIM算法采用了集合枚舉樹作為搜索空間,然后集合深度優(yōu)先搜索的思想進行處理,即對于集合枚舉樹中的每個節(jié)點,都需要與右側(cè)的鄰居節(jié)點進行合并產(chǎn)生子節(jié)點,同時求并集得到子節(jié)點所表示的項集。

    定義8 在集合枚舉樹中的節(jié)點C的項集記為C.head,該節(jié)點的可擴展項的集合記為C.tail,每個擴展項集都是C節(jié)點的可擴展1-項集。

    深度優(yōu)先搜索策略的核心思想是檢測每個節(jié)點的項集C.head與該節(jié)點的可擴展項集C.tail中的每個可擴展項i的并集C.head∪i的支持度,如果每個并集的支持度都小于minSup,那么說明在頻繁模式樹中C就是一個葉節(jié)點。然后再檢測C.head是否是最大頻繁項集MFI中任意集合的子集,若不是,就將C.head加入到MFI。如果C.head∪i支持度均大于minSup,則繼續(xù)向下遞歸。結(jié)合DiffNodeset的深度優(yōu)先搜索算法融合了文獻[10]中基于DiffNodeset交集的思想,算法的流程如算法2所示。集合枚舉樹示例如圖2所示。

    圖2 集合枚舉樹Fig.2 Set-enumeration tree

    算法2 基于DiffNodeset交集求解算法[10]。

    輸入 當前節(jié)點N1與右側(cè)鄰居節(jié)點N2;

    輸出 子節(jié)點DiffNodeset。

    1)

    DNxy←?;

    2)

    k←0 andj←0;

    3)

    lx← the length ofNx(Nodeset ofix) andly←the length of

    Ny(Nodeset ofiy);

    4)

    Whileklydo

    5)

    IfNx[k].post-order>Ny[j].post-orderthen

    6)

    j←j+1;

    7)

    Else

    8)

    IfNx[k].post-order

    Nx[k].pre-order>Ny[j].pre-orderthen

    9)

    k←k+1;

    10)

    Else

    11)

    DNxy←DNxy∪{(Nx[k].post-order,

    Nx[k].count)};

    12)

    k←k+1;

    13)

    Endif

    14)

    Endif

    15)

    Endwhile

    16)

    Ifk

    17)

    Whilek

    18)

    DNxy←DNxy∪{(Nx[k].post-order,Nx[k].count)};

    19)

    k←k+1;

    20)

    Endwhile

    21)

    Endif

    22)

    ReturnDNxy

    實際上,構(gòu)建2-項集DN()采用了雙向比較的策略來構(gòu)建ixiy的DiffNodeset。根據(jù)雙向比較原理,構(gòu)建2-項集DN()的計算復(fù)雜度為O(m+n),其中m和n分別為對應(yīng)節(jié)點集的長度。構(gòu)建過程的偽代碼如算法2所示。

    構(gòu)建2-項集DN()需要比較兩個Nodeset中PP-codes,直到其中一個Nodeset的所有元素都比較完畢。對于這種兩個元素之間的比較,有三條原則來降低比較的復(fù)雜度。

    原則一 如偽代碼的第5)行,若存在Nx[k].post-order>Ny[j].post-order,則表明對應(yīng)于Ny[j]的節(jié)點不是對應(yīng)于Nx[k]的節(jié)點的祖先,由于各項集的Nodeset都是按照post-order的升序(根據(jù)性質(zhì)3),因此就不用再考慮Ny[j],并選擇Ny[j+1]與Nx[k]進行比較,如偽代碼第5)、6)行所示。

    原則二 如偽代碼的第8)行,若存在Nx[k].post-orderNy[j].pre-order,這種情況表示對應(yīng)于Ny[j]的節(jié)點是對應(yīng)于Nx[k]的節(jié)點的祖先(根據(jù)性質(zhì)1)。根據(jù)定義6,Nx[k]是不可取的,所以就選擇Nx[k]的下一個元素Nx[k+1]來進行比較,如偽代碼的第9)行所示。

    原則三 如偽代碼第10)行,若存在Nx[k].post-order

    當所有的比較完成之后,需檢查在ix的Nodeset中是否存在一些未參與比較的元素,根據(jù)定義6,這些元素是可取的。然后生成與這些元素相對應(yīng)的所有結(jié)果,并添加到ixiy的DiffNodeset,如偽代碼第16)行到第21)行所示。最后輸出所有2-項集的DiffNodeset。

    2.2 優(yōu)化策略

    性質(zhì)6[13]設(shè)X∈C.head,y∈C.tail,若存在X的事務(wù)集與X∪{y}完全相同,即t(X)=t(X∪{y}),那么?S∈C.tail,都有X∪S與X∪{y}∪S的支持度相同。

    證明 由于t(X)=t(X∪{y}),則support(X)=support(X∪{y}),所以任意包含X的事務(wù)必然包含y。所以,包含S的任意項集也必然包含y,所以support(X∪S)=support(X∪{y}∪S)。

    DNMFIM算法根據(jù)性質(zhì)6采用了父等價剪枝技術(shù)來縮小搜索空間。當搜索C節(jié)點時,若遇到性質(zhì)6中的情況,就可以將y從C.tail中刪除,并放入C.head,這樣會提高挖掘的效率,并不會影響最大頻繁項集挖掘的準確性。

    性質(zhì)7[14]若當前節(jié)點與右側(cè)所有鄰居節(jié)點的并集是已挖掘的最大頻繁項集的子集,則以當前節(jié)點為根節(jié)點的子樹不可能存在最大頻繁項集。

    證明 反證法。若以當前節(jié)點為根節(jié)點的子樹中存在最大頻繁項集,那么該最大頻繁項集必然不是已挖掘的最大頻繁項集的子集。

    得證

    由于每將一個項集加入MFI時,就必須檢測該項集的超集在MFI中是否存在,這個過程稱之為超集檢測。

    定義9 局部最大頻繁項集。給定一個節(jié)點P,MFI中只有一部分是P.head的超集,則這部分項集稱之為P的局部最大頻繁項集(Local MFI, LMFI)。

    本文引入一種在MAFIA[5]中所采用的超集檢測策略,從而進一步提升算法效率。對于任意的y∈P.tail,將P.head與P的可擴展1-項集y合并得到節(jié)點P1。顯然,P1的LMFI都包含y元素且P1的LMFI是P的LMFI的子集。將P的LMFI進行排序,包含y的項集集合就是P1節(jié)點的LMFI。若將以P節(jié)點為根節(jié)點的子樹搜索完成時,那么在該子樹上所挖掘到的所有MFI都將是P的超集。所以當有新的項集加入P的MFI的項集時,也會將該項集加入到P的LMFI中。故是否要將一個項集加入到MFI,只需要判斷該節(jié)點的LMFI是否為空即可,即實現(xiàn)超集檢測。超集檢測算法的詳細過程如算法3所示。

    算法3 超集檢測算法[5]。

    輸入 進行剪枝后的項集M;

    輸出 超集檢測之后的MFI。

    1)

    MFI←?

    2)

    root.head←?

    3)

    root.tail←DB

    4)

    HUT=C.head∪C.tail

    5)

    If(HUTis inMFI)

    6)

    Stop searching and return

    7)

    Endif

    8)

    Count all children,usePEPto trim the tail,and reorder by

    increasing support

    9)

    For each itemiinC.tail

    10)

    C.extension=C.head∪{i}

    11)

    If(all extensions are frequent)

    12)

    SortMFIby new itemiand update left and rightLMFI

    pointers forCn(itemsets put inLMFIleftwhich include

    i,else put inLMFIright)

    13)

    Adjust rightLMFIpointer ofCfor any new itemsets added

    toMFI

    14)

    Endif

    15)

    Endfor

    16)

    If(C.LMFIis empty) do

    17)

    addC.headtoMFI

    18)

    Endif

    NB-MAFIA采用的是基于N-list的的最大頻繁項集挖掘方法,N-list的高壓縮率和高效的求交集方法可以實現(xiàn)項集支持度的快速計算,該算法采用了MAFIA的優(yōu)化剪枝與超集檢測策略,所以NB-MAFIA性能相對于MAFIA提升很多。但NB-MAFIA在稀疏數(shù)據(jù)集中運行時效果還需進一步改善,本文中提出的DNMFIM算法針對這一點進行了改進,DNMFIM算法的優(yōu)勢在于引入一種新的線性復(fù)雜度的連接方法來降低連接兩個DiffNodeset在連接過程中的復(fù)雜度,從而避免了多次無效的計算,由于這一特性,DNMFIM算法能夠快速挖掘稠密數(shù)據(jù)集中的最大頻繁項集,再結(jié)合相應(yīng)的優(yōu)化剪枝策略與超集檢測策略使DNMFIM算法在稀疏數(shù)據(jù)集中依然有良好的效果。

    3 實驗結(jié)果及分析

    將DNMFIM算法與經(jīng)典的最大頻繁項集挖掘算法MAFIA及其改進算法NB-MAFIA進行比較。在不同類型的數(shù)據(jù)集中運行這三種算法來對比這三種算法的時間效率。用C++語言在實驗環(huán)境為Inter Core i5 3317U@1.7 GHz CPU,內(nèi)存4 GB,64位操作系統(tǒng)的設(shè)備上實現(xiàn)了DNMFIM算法 MAFIA和NB-MAFIA。在每組實驗中,這三種算法所挖掘到的最大頻繁項集都是相同的,從而驗證了BNMFI算法的正確性。在本次實驗中選取了稠密型數(shù)據(jù)集Connect、稀疏型數(shù)據(jù)集Retail以及由IBM Almaden生成的人工數(shù)據(jù)集T10I4D100K來作為本實驗的測試數(shù)據(jù)集,數(shù)據(jù)集參數(shù)如表3所示。然后,通過改變最小支持度閾值來進行最大頻繁項集的挖掘。最后,通過對比分析了這三種算法在不同數(shù)據(jù)集中的時間消耗情況,結(jié)果如圖3所示。為了保證實驗結(jié)果的準確性,本人在同一臺設(shè)備上進行了實驗。

    由圖3可以看出,DNMFIM算法在時間效率方面效果優(yōu)于MAFIA與NB-MAFIA,該算法在不同類型數(shù)據(jù)集中進行最大頻繁項集挖掘時均有良好的效果。當這三種算法在稠密數(shù)據(jù)集Connect中運行時,DNMFIM算法性能優(yōu)于其他兩種算法,在最小支持度閾值設(shè)置得較小時優(yōu)勢更加明顯,隨著最小支持度閾值的逐漸增加算法的運行時間越來越短,DNMFIM算法的優(yōu)勢也越來越不明顯。當這三種算法在稀疏數(shù)據(jù)集Retail中運行時,其運行時間相比在稠密數(shù)據(jù)集中較長一些。當最小支持度閾值為0.05%時,DNMFIM算法的運行時間較少,約為MAFIA運行時間的1/5;隨著最小支持度閾值的升高,DNMFIM算法的優(yōu)勢越來越不明顯,當最小支持度閾值大于0.2%時,三種算法的運行時間基本一致。當這三種算法在人工數(shù)據(jù)集T10I4D100K中運行時,由于在存儲數(shù)據(jù)和處理數(shù)據(jù)方面的結(jié)構(gòu)性優(yōu)勢,DNMFIM算法和NB-MAFIA的運行時間明顯優(yōu)于MAFIA,在該數(shù)據(jù)集中DNMFIM算法仍保持著最優(yōu)的性能。

    表2 數(shù)據(jù)集參數(shù)Tab. 2 Dataset parameters

    圖3 不同算法運行時間對比Fig. 3 Runtime comparison of different algorithms

    4 結(jié)語

    本文提出了一種新的最大頻繁項集挖掘整合算法——DNMFIM算法。該算法采用了一種新的數(shù)據(jù)結(jié)構(gòu)DiffNodeset來實現(xiàn)高效的求交集以及支持度的快速計算,并引入一種新的線性復(fù)雜度的連接方法來降低連接兩個DiffNodeset在連接過程中的復(fù)雜度,從而避免了多次無效的計算。實驗結(jié)果表明,DNMFIM算法在不同類型的數(shù)據(jù)集中挖掘最大頻繁項集的性能優(yōu)于MAFIA與NB-MAFIA。隨著互聯(lián)網(wǎng)數(shù)據(jù)的飛速發(fā)展,將DNMFIM算法與Spark平臺相結(jié)合,從而研究出并行化處理大數(shù)據(jù)的最大頻繁項集挖掘算法,將是下一步需要研究的方向。

    猜你喜歡
    剪枝項集復(fù)雜度
    人到晚年宜“剪枝”
    基于YOLOv4-Tiny模型剪枝算法
    一種低復(fù)雜度的慣性/GNSS矢量深組合方法
    求圖上廣探樹的時間復(fù)雜度
    剪枝
    天津詩人(2017年2期)2017-03-16 03:09:39
    某雷達導(dǎo)51 頭中心控制軟件圈復(fù)雜度分析與改進
    出口技術(shù)復(fù)雜度研究回顧與評述
    關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
    卷宗(2014年5期)2014-07-15 07:47:08
    一種面向不平衡數(shù)據(jù)分類的組合剪枝方法
    計算機工程(2014年6期)2014-02-28 01:26:33
    一種頻繁核心項集的快速挖掘算法
    計算機工程(2014年6期)2014-02-28 01:26:12
    高清欧美精品videossex| 亚洲精品久久成人aⅴ小说| 999久久久国产精品视频| 三上悠亚av全集在线观看| 18禁观看日本| 九九爱精品视频在线观看| 黑人巨大精品欧美一区二区蜜桃| 欧美亚洲日本最大视频资源| 亚洲精品国产区一区二| 亚洲精品中文字幕在线视频| 亚洲国产成人一精品久久久| 国产精品蜜桃在线观看| 18禁观看日本| 极品少妇高潮喷水抽搐| 男女午夜视频在线观看| 无遮挡黄片免费观看| 国产xxxxx性猛交| 久久婷婷青草| 亚洲欧美成人精品一区二区| 欧美黑人欧美精品刺激| 五月开心婷婷网| 人体艺术视频欧美日本| 免费女性裸体啪啪无遮挡网站| 51午夜福利影视在线观看| 香蕉丝袜av| 在线看a的网站| 日韩一本色道免费dvd| 国产极品天堂在线| 欧美日韩视频精品一区| 免费在线观看黄色视频的| 亚洲国产av影院在线观看| 日韩中文字幕视频在线看片| 成人三级做爰电影| 国产精品一区二区在线不卡| 日韩成人av中文字幕在线观看| 日日爽夜夜爽网站| 人妻人人澡人人爽人人| av不卡在线播放| a 毛片基地| 亚洲欧美激情在线| 99精国产麻豆久久婷婷| avwww免费| 国产伦理片在线播放av一区| 成年人免费黄色播放视频| 久久精品人人爽人人爽视色| 精品国产乱码久久久久久男人| 老鸭窝网址在线观看| 天天操日日干夜夜撸| 亚洲av中文av极速乱| 欧美精品一区二区免费开放| 波多野结衣一区麻豆| 日本wwww免费看| 中国三级夫妇交换| 亚洲欧洲日产国产| 成人影院久久| 免费观看性生交大片5| 男男h啪啪无遮挡| 免费日韩欧美在线观看| 亚洲欧美日韩另类电影网站| 飞空精品影院首页| 久久久国产欧美日韩av| 亚洲伊人色综图| avwww免费| 国产一区二区三区综合在线观看| 国产熟女欧美一区二区| 亚洲第一区二区三区不卡| 黄片无遮挡物在线观看| 午夜福利,免费看| 看免费成人av毛片| 国产成人系列免费观看| 午夜福利,免费看| 免费女性裸体啪啪无遮挡网站| 久久性视频一级片| 菩萨蛮人人尽说江南好唐韦庄| 自拍欧美九色日韩亚洲蝌蚪91| 欧美精品av麻豆av| 久久97久久精品| 99久国产av精品国产电影| 韩国高清视频一区二区三区| 9热在线视频观看99| 少妇人妻精品综合一区二区| 亚洲国产成人一精品久久久| 久久狼人影院| 久久av网站| 国产成人精品在线电影| 日韩人妻精品一区2区三区| 日本av免费视频播放| 成人国语在线视频| 国产高清国产精品国产三级| 色播在线永久视频| a级毛片黄视频| 欧美 日韩 精品 国产| 免费少妇av软件| 国产成人一区二区在线| av有码第一页| 欧美精品一区二区大全| 黄片无遮挡物在线观看| 大片电影免费在线观看免费| 久久久久久久精品精品| 国产成人a∨麻豆精品| 国产 精品1| 老熟女久久久| avwww免费| 日韩熟女老妇一区二区性免费视频| a级毛片在线看网站| 日本wwww免费看| 精品第一国产精品| 99九九在线精品视频| 亚洲欧美一区二区三区国产| 韩国精品一区二区三区| 成年动漫av网址| 午夜福利在线免费观看网站| 免费高清在线观看视频在线观看| av片东京热男人的天堂| 青春草亚洲视频在线观看| 精品少妇内射三级| 一级a爱视频在线免费观看| 久久精品国产a三级三级三级| 午夜福利一区二区在线看| 久久久国产精品麻豆| 美女大奶头黄色视频| 成人国语在线视频| 啦啦啦在线免费观看视频4| 婷婷色综合www| 亚洲三区欧美一区| 国产亚洲精品第一综合不卡| 国产毛片在线视频| 成年美女黄网站色视频大全免费| 别揉我奶头~嗯~啊~动态视频 | 国产精品一二三区在线看| 亚洲精品国产av蜜桃| 巨乳人妻的诱惑在线观看| 国产一区二区激情短视频 | 嫩草影视91久久| 欧美黄色片欧美黄色片| 男女之事视频高清在线观看 | 国产av精品麻豆| 18在线观看网站| 亚洲精品乱久久久久久| 亚洲情色 制服丝袜| 黄色怎么调成土黄色| 超碰成人久久| 免费黄色在线免费观看| 亚洲成人免费av在线播放| 久久毛片免费看一区二区三区| 色网站视频免费| 午夜精品国产一区二区电影| 国产精品麻豆人妻色哟哟久久| 国产探花极品一区二区| 免费高清在线观看日韩| 亚洲精品自拍成人| 成人国产av品久久久| 久久这里只有精品19| 激情五月婷婷亚洲| 丝袜美足系列| 婷婷色av中文字幕| 国产成人午夜福利电影在线观看| 叶爱在线成人免费视频播放| 国产黄色免费在线视频| 成人国产麻豆网| 丰满乱子伦码专区| av电影中文网址| 国产精品久久久久久久久免| 日韩 欧美 亚洲 中文字幕| 伦理电影大哥的女人| 欧美亚洲 丝袜 人妻 在线| 中文字幕色久视频| 啦啦啦视频在线资源免费观看| 最近的中文字幕免费完整| 亚洲国产成人一精品久久久| 男女无遮挡免费网站观看| 成人免费观看视频高清| 精品福利永久在线观看| 一区二区三区精品91| 欧美激情高清一区二区三区 | 欧美精品av麻豆av| 成人18禁高潮啪啪吃奶动态图| av不卡在线播放| 久久久久久人妻| 国产毛片在线视频| 天天操日日干夜夜撸| 18禁裸乳无遮挡动漫免费视频| 久久综合国产亚洲精品| 中文字幕精品免费在线观看视频| 久久久久久久国产电影| 91精品三级在线观看| 母亲3免费完整高清在线观看| 香蕉国产在线看| 高清av免费在线| 一区二区三区乱码不卡18| 热re99久久精品国产66热6| 精品视频人人做人人爽| 黑丝袜美女国产一区| 日韩人妻精品一区2区三区| 亚洲精品乱久久久久久| 王馨瑶露胸无遮挡在线观看| 久久人人爽人人片av| 美女午夜性视频免费| 一级毛片黄色毛片免费观看视频| 午夜老司机福利片| 国产精品女同一区二区软件| 国产片特级美女逼逼视频| 久久精品国产a三级三级三级| 国产欧美亚洲国产| 男的添女的下面高潮视频| 精品一区二区三区四区五区乱码 | 操出白浆在线播放| 校园人妻丝袜中文字幕| 国产 精品1| 巨乳人妻的诱惑在线观看| 国产有黄有色有爽视频| 免费不卡黄色视频| 一二三四中文在线观看免费高清| 国产日韩欧美视频二区| av在线app专区| 亚洲在久久综合| 国产极品天堂在线| 夫妻午夜视频| 9191精品国产免费久久| 性色av一级| 久久久欧美国产精品| 亚洲一码二码三码区别大吗| 久久久久精品久久久久真实原创| 久久久久久久精品精品| 麻豆乱淫一区二区| avwww免费| 纵有疾风起免费观看全集完整版| 色吧在线观看| 美女福利国产在线| 中文字幕亚洲精品专区| 老汉色av国产亚洲站长工具| 亚洲天堂av无毛| 成人18禁高潮啪啪吃奶动态图| 亚洲欧美激情在线| 久久毛片免费看一区二区三区| 纵有疾风起免费观看全集完整版| 国产男人的电影天堂91| 热99国产精品久久久久久7| 国产亚洲精品第一综合不卡| 老司机影院毛片| 亚洲伊人久久精品综合| 高清不卡的av网站| 黄色 视频免费看| 国产探花极品一区二区| 国产麻豆69| 久久韩国三级中文字幕| 国产野战对白在线观看| 男女之事视频高清在线观看 | a级毛片在线看网站| 黑人猛操日本美女一级片| 曰老女人黄片| 午夜免费观看性视频| 国产女主播在线喷水免费视频网站| 亚洲av福利一区| 老司机深夜福利视频在线观看 | 国产人伦9x9x在线观看| 国产精品国产三级国产专区5o| 亚洲第一青青草原| 国产精品成人在线| 人人妻人人添人人爽欧美一区卜| 我要看黄色一级片免费的| 亚洲伊人色综图| 一级毛片黄色毛片免费观看视频| 亚洲精品乱久久久久久| 久久久久网色| 午夜影院在线不卡| 午夜福利网站1000一区二区三区| 精品久久蜜臀av无| 免费日韩欧美在线观看| 新久久久久国产一级毛片| 亚洲欧美精品自产自拍| 亚洲精品乱久久久久久| 高清欧美精品videossex| 日本欧美视频一区| 国产女主播在线喷水免费视频网站| 男女边吃奶边做爰视频| 亚洲欧美精品综合一区二区三区| 国产成人午夜福利电影在线观看| 国产精品成人在线| 国产1区2区3区精品| 黑人巨大精品欧美一区二区蜜桃| 久久人妻熟女aⅴ| 欧美日韩亚洲国产一区二区在线观看 | 国产免费视频播放在线视频| 丝瓜视频免费看黄片| 女性生殖器流出的白浆| 少妇人妻久久综合中文| 国产免费视频播放在线视频| 久久人人97超碰香蕉20202| 黑丝袜美女国产一区| 日韩中文字幕视频在线看片| av不卡在线播放| 欧美黑人精品巨大| 视频在线观看一区二区三区| 久久人人爽av亚洲精品天堂| 老司机靠b影院| 人体艺术视频欧美日本| 国产成人啪精品午夜网站| 一边摸一边做爽爽视频免费| 精品人妻熟女毛片av久久网站| bbb黄色大片| av电影中文网址| 国产精品麻豆人妻色哟哟久久| 亚洲国产欧美一区二区综合| 丰满迷人的少妇在线观看| 美女视频免费永久观看网站| 伦理电影大哥的女人| 精品久久久久久电影网| 欧美人与性动交α欧美软件| 两个人免费观看高清视频| 午夜av观看不卡| 欧美久久黑人一区二区| 午夜精品国产一区二区电影| 一级毛片黄色毛片免费观看视频| 久久久久国产一级毛片高清牌| 久热爱精品视频在线9| 精品少妇黑人巨大在线播放| 精品一区二区免费观看| 亚洲一区中文字幕在线| 另类亚洲欧美激情| 日韩av在线免费看完整版不卡| 精品一区二区三区av网在线观看 | 曰老女人黄片| 国产精品麻豆人妻色哟哟久久| 不卡视频在线观看欧美| 久久久国产精品麻豆| 丁香六月天网| 一本色道久久久久久精品综合| 亚洲七黄色美女视频| 日本黄色日本黄色录像| 自线自在国产av| 久久国产精品男人的天堂亚洲| 婷婷色麻豆天堂久久| 亚洲欧洲精品一区二区精品久久久 | 亚洲自偷自拍图片 自拍| 在线观看免费视频网站a站| 久久精品亚洲av国产电影网| 久久99热这里只频精品6学生| 亚洲av成人不卡在线观看播放网 | 一边摸一边做爽爽视频免费| 亚洲,欧美,日韩| 色婷婷av一区二区三区视频| 最近的中文字幕免费完整| 91精品三级在线观看| 极品人妻少妇av视频| 我要看黄色一级片免费的| 国产午夜精品一二区理论片| 最黄视频免费看| 欧美人与性动交α欧美软件| 秋霞伦理黄片| 在线观看免费日韩欧美大片| 嫩草影院入口| 成年动漫av网址| 午夜av观看不卡| 国产在视频线精品| 秋霞伦理黄片| 69精品国产乱码久久久| 国产免费一区二区三区四区乱码| 日韩视频在线欧美| 只有这里有精品99| 好男人视频免费观看在线| 国产成人系列免费观看| 男女边摸边吃奶| 亚洲情色 制服丝袜| 国产亚洲精品第一综合不卡| 欧美精品人与动牲交sv欧美| 久久久精品94久久精品| 亚洲精品国产区一区二| 免费女性裸体啪啪无遮挡网站| 两个人看的免费小视频| 精品亚洲乱码少妇综合久久| 视频在线观看一区二区三区| 毛片一级片免费看久久久久| 欧美变态另类bdsm刘玥| 欧美日韩福利视频一区二区| 五月天丁香电影| 中文字幕人妻丝袜一区二区 | 日日啪夜夜爽| 久久免费观看电影| 91精品伊人久久大香线蕉| 两个人免费观看高清视频| 一区二区av电影网| 一边摸一边做爽爽视频免费| 99精国产麻豆久久婷婷| 天堂8中文在线网| 精品国产一区二区三区四区第35| 香蕉国产在线看| 国产精品熟女久久久久浪| av天堂久久9| 女人高潮潮喷娇喘18禁视频| 亚洲精品自拍成人| 美女福利国产在线| 亚洲国产看品久久| 少妇被粗大猛烈的视频| 丝袜脚勾引网站| 大香蕉久久网| 男女国产视频网站| 自线自在国产av| 老鸭窝网址在线观看| 啦啦啦在线免费观看视频4| 国产xxxxx性猛交| 别揉我奶头~嗯~啊~动态视频 | 国产成人精品久久二区二区91 | 啦啦啦啦在线视频资源| 大陆偷拍与自拍| 久久影院123| 99久久人妻综合| 十八禁人妻一区二区| 精品久久久精品久久久| 国产伦理片在线播放av一区| 日韩大片免费观看网站| 国产无遮挡羞羞视频在线观看| 制服丝袜香蕉在线| 黄片播放在线免费| 搡老岳熟女国产| 视频区图区小说| 国产亚洲av高清不卡| 人体艺术视频欧美日本| av天堂久久9| 波多野结衣av一区二区av| 成人黄色视频免费在线看| 2021少妇久久久久久久久久久| 亚洲成av片中文字幕在线观看| av又黄又爽大尺度在线免费看| 免费黄网站久久成人精品| 亚洲激情五月婷婷啪啪| 精品久久久精品久久久| 99re6热这里在线精品视频| 精品午夜福利在线看| 熟妇人妻不卡中文字幕| 亚洲精品久久久久久婷婷小说| 欧美人与性动交α欧美软件| 亚洲在久久综合| 欧美另类一区| 午夜福利视频在线观看免费| 一区在线观看完整版| 国产精品国产三级国产专区5o| 国产伦人伦偷精品视频| 国产av国产精品国产| 宅男免费午夜| 高清av免费在线| 在线观看人妻少妇| 视频区图区小说| 国产成人欧美| 午夜日本视频在线| 亚洲国产精品一区三区| 美女中出高潮动态图| 街头女战士在线观看网站| 亚洲欧美一区二区三区国产| 精品国产露脸久久av麻豆| 久久97久久精品| 亚洲,欧美,日韩| 欧美国产精品一级二级三级| 高清在线视频一区二区三区| 日本色播在线视频| 国产精品一区二区精品视频观看| 国产有黄有色有爽视频| 久久精品久久精品一区二区三区| 久久天堂一区二区三区四区| 国产一区亚洲一区在线观看| 麻豆av在线久日| 国产精品秋霞免费鲁丝片| 韩国高清视频一区二区三区| 大话2 男鬼变身卡| 啦啦啦在线免费观看视频4| 亚洲男人天堂网一区| 黑人猛操日本美女一级片| 美女午夜性视频免费| 狂野欧美激情性xxxx| 中文字幕亚洲精品专区| 免费人妻精品一区二区三区视频| 欧美 亚洲 国产 日韩一| 欧美日本中文国产一区发布| 欧美另类一区| avwww免费| 又粗又硬又长又爽又黄的视频| 极品少妇高潮喷水抽搐| 看非洲黑人一级黄片| 亚洲精品成人av观看孕妇| 成年美女黄网站色视频大全免费| 国产免费视频播放在线视频| 在线精品无人区一区二区三| 国产精品三级大全| 日本欧美视频一区| 99热网站在线观看| 久久久久久人妻| 欧美人与性动交α欧美精品济南到| 国产乱来视频区| 久久免费观看电影| 2021少妇久久久久久久久久久| 色网站视频免费| 啦啦啦在线免费观看视频4| 国产精品二区激情视频| 精品一区在线观看国产| 国产又爽黄色视频| 国产精品秋霞免费鲁丝片| 久久久久久人人人人人| av在线观看视频网站免费| 一级黄片播放器| 麻豆av在线久日| 亚洲欧美中文字幕日韩二区| 满18在线观看网站| 99久国产av精品国产电影| 香蕉丝袜av| 国语对白做爰xxxⅹ性视频网站| 成人亚洲欧美一区二区av| av国产精品久久久久影院| 亚洲欧美成人精品一区二区| 国产亚洲欧美精品永久| 在线观看一区二区三区激情| 桃花免费在线播放| 国产亚洲精品第一综合不卡| 国产成人91sexporn| 亚洲精品一区蜜桃| 国产熟女午夜一区二区三区| 亚洲三区欧美一区| 免费人妻精品一区二区三区视频| 最近的中文字幕免费完整| 亚洲国产欧美一区二区综合| 777久久人妻少妇嫩草av网站| 人成视频在线观看免费观看| 国产精品嫩草影院av在线观看| 男女免费视频国产| 日本欧美国产在线视频| 久久人妻熟女aⅴ| 午夜福利影视在线免费观看| 精品国产乱码久久久久久男人| 老司机深夜福利视频在线观看 | 欧美精品亚洲一区二区| 最近最新中文字幕大全免费视频 | 我要看黄色一级片免费的| 久久久国产一区二区| 精品亚洲成a人片在线观看| 国产极品粉嫩免费观看在线| 纯流量卡能插随身wifi吗| 欧美日韩福利视频一区二区| 久久久久久人人人人人| 91aial.com中文字幕在线观看| 国产精品久久久久久精品古装| 黄片无遮挡物在线观看| 丝袜在线中文字幕| 国产欧美日韩综合在线一区二区| 国产深夜福利视频在线观看| 亚洲国产av影院在线观看| 精品亚洲乱码少妇综合久久| 午夜老司机福利片| 自线自在国产av| 日韩一卡2卡3卡4卡2021年| 97在线人人人人妻| 国产97色在线日韩免费| 日日啪夜夜爽| 国产精品亚洲av一区麻豆 | 亚洲天堂av无毛| 国产乱来视频区| 街头女战士在线观看网站| 在线观看www视频免费| 男人操女人黄网站| 久久久久久久国产电影| 精品一区二区免费观看| 国产精品久久久av美女十八| 精品久久久久久电影网| 极品少妇高潮喷水抽搐| 日韩大片免费观看网站| 天天影视国产精品| 一本色道久久久久久精品综合| 精品一区二区三卡| 国产男女内射视频| 久久天堂一区二区三区四区| 9色porny在线观看| 岛国毛片在线播放| 亚洲成人手机| 香蕉丝袜av| 老司机亚洲免费影院| 亚洲七黄色美女视频| 国产 精品1| 久久精品亚洲av国产电影网| 亚洲精品国产区一区二| 99精品久久久久人妻精品| 韩国精品一区二区三区| 国产成人欧美在线观看 | 亚洲精品国产色婷婷电影| 国产xxxxx性猛交| 男女边吃奶边做爰视频| 国产免费又黄又爽又色| 极品人妻少妇av视频| 日韩制服丝袜自拍偷拍| 精品一区二区免费观看| 男人添女人高潮全过程视频| 亚洲国产精品一区三区| 亚洲,欧美,日韩| 在线观看免费高清a一片| 中文字幕人妻丝袜制服| 老司机亚洲免费影院| 18在线观看网站| 国产无遮挡羞羞视频在线观看| 国产欧美日韩综合在线一区二区| 人人妻,人人澡人人爽秒播 | 男女免费视频国产| 国产精品久久久久成人av| 国产福利在线免费观看视频| 最近的中文字幕免费完整| 街头女战士在线观看网站| 久久人人97超碰香蕉20202| 精品久久蜜臀av无| av视频免费观看在线观看| 日本av手机在线免费观看| 亚洲av电影在线进入| 男人爽女人下面视频在线观看| 1024视频免费在线观看| 欧美成人精品欧美一级黄| 日本vs欧美在线观看视频| 一级爰片在线观看| 亚洲欧洲精品一区二区精品久久久 | 男人添女人高潮全过程视频| 久久热在线av|