• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于語義的文本數(shù)據(jù)流概念漂移檢測算法

    2018-03-02 09:21:59胡學鋼張玉紅
    計算機工程 2018年2期
    關鍵詞:數(shù)據(jù)流語義概念

    儲 光,胡學鋼,張玉紅

    (合肥工業(yè)大學 計算機與信息學院,合肥 230009)

    0 概述

    網(wǎng)絡社交媒體在現(xiàn)實生活中被廣泛應用,例如網(wǎng)絡聊天、購物評論和在線新聞等,由此產(chǎn)生了大量的文本數(shù)據(jù)流。這些數(shù)據(jù)流的主題會隨著時間隨機變化,這種變化被稱為概念漂移[1-2]。概念漂移檢測是數(shù)據(jù)流分類中的重要問題。

    根據(jù)數(shù)據(jù)流是否含有標記信息,可將現(xiàn)有的概念漂移檢測算法分為監(jiān)督、無監(jiān)督和半監(jiān)督3類。監(jiān)督方法適用于有標記數(shù)據(jù),依據(jù)衡量數(shù)據(jù)流分類過程中的錯誤率變化程度進行概念漂移檢測,衡量模型包括伯努利分布[3-5]、決策樹[6-8]和Bayes模型[9]等。無監(jiān)督方法適用于無標記數(shù)據(jù),主要分為2種:一種是借助聚類等方法,通過比較聚類簇的變化程度進行概念漂移檢測[10];另一種是借助特征向量化和特征提取的方法,通過比較提取出的特征集合或是依據(jù)特征計算出的信息熵的變化程度進行概念漂移檢測[11]。半監(jiān)督方法適用于部分標記數(shù)據(jù),概念漂移檢測方法大多與無監(jiān)督方法一致[12]。上述方法都基于某種信息量的變化程度進行概念漂移檢測,其中監(jiān)督方法效果直接取決于基分類器的性能,無監(jiān)督或半監(jiān)督方法效果直接取決于聚類或者特征提取效果,在一定條件下可以有效地實現(xiàn)概念漂移檢測。

    然而在實際應用中,由于信息的傳播速度快、交流范圍廣,導致文本數(shù)據(jù)流中的概念通常會隨著時間頻繁變化。例如在奧運會期間,體育新聞的內容會隨著項目不同而不停更新,從球類到游泳,從田徑到射擊,項目最密集時這種更新甚至會以分鐘為單位。這種頻繁的概念漂移一方面降低了分類器的適用性,另一方面使得用于區(qū)分不同數(shù)據(jù)分布的樣本數(shù)量不足,難以累積充分的樣本來評估數(shù)據(jù)塊之間的變化程度。

    針對上述問題,本文考慮文本數(shù)據(jù)流隱含的語義信息,提出一種新的概念漂移檢測算法。通過引入潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)模型[13]計算語義相似度,并基于相鄰數(shù)據(jù)塊共有詞比例和相似主題比例,在頻繁漂移情況下實現(xiàn)有效的概念漂移檢測。

    1 相關研究

    本節(jié)主要介紹已有關于概念漂移檢測的研究,分監(jiān)督概念漂移檢測算法和無監(jiān)督或半監(jiān)督概念漂移檢測算法2類進行介紹。

    1)監(jiān)督概念漂移檢測算法

    文獻[1]對監(jiān)督類的概念漂移檢測方法進行了全面綜述;文獻[2]提出一種基于分類器與數(shù)據(jù)集中概念相似度錯誤方差的方法來判斷概念是否發(fā)生漂移;文獻[3-4]提出基于伯努利數(shù)據(jù)分布設置閾值以區(qū)分概念漂移與噪音的方法DDM;文獻[5]采用分類錯誤率替換錯誤分類實例的機制改進了DDM方法,提出了一種更適用于檢測突變式概念漂移的方法EDDM;文獻[6]提出一種使用隨機決策樹構建集成分類器,并采用雙層閾值來區(qū)分噪音和漂移的方法CDRDT;文獻[7-8]提出一種依據(jù)窗口中原始數(shù)據(jù)分布變化來檢測概念漂移的方法SWCDS,以及利用雙層窗口機制跟蹤概念漂移以提高適應性的方法DWCDS;文獻[9]提出基于決策樹和Bayes混合模型的集成分類方法 WE-DTB,利用Hoeffding邊界和μ檢驗實現(xiàn)了數(shù)據(jù)流環(huán)境下概念漂移的檢測和分類。

    在實際應用中,多數(shù)算法采用不同的錯誤率評估方法來降低概念漂移檢測過程中噪音的干擾,例如Hoeffding邊界[10,14-16]、μ檢驗[8]等。這些算法對含噪音數(shù)據(jù)流效果顯著,但本質上是通過分類錯誤率進行概念漂移檢測,性能主要受限于標簽信息和分類器性能。

    2)無監(jiān)督或半監(jiān)督概念漂移檢測算法

    為處理不完全標記數(shù)據(jù)流中重現(xiàn)概念漂移問題,針對連續(xù)屬性數(shù)據(jù)流,文獻[10]采用K-Means算法在增量式構建決策樹的葉子節(jié)點標記無標簽示例,提出基于聚類簇差異度量的概念漂移檢測方法,即采用存儲歷史概念簇的機制,同時更新概念漂移檢測條件的算法REDLLA;針對多數(shù)算法忽略特征空間和樣本空間分布特點的現(xiàn)狀,文獻[11]利用特征選擇和加權,構建基于特征項分布的信息熵及特征動態(tài)加權概念漂移檢測模型。該模型根據(jù)特種特征和樣本空間的擬合性,使用特征信息熵捕捉概念漂移,同時利用改進的LDA模型特征動態(tài)加權算法解決了特征權重的取值問題;文獻[12]提出一種基于KNN模型和增量Bayes的概念漂移檢測算法KnnM-IB,使用增量Bayes算法分類難處理的樣本,同時利用可變的滑動窗口對少量標記信息進行主動學習,以此進行概念漂移檢測。

    無監(jiān)督或半監(jiān)督概念漂移檢測算法通過聚類或特征提取等方法,利用聚類簇或特征集合的分布變化衡量原始數(shù)據(jù)分布變化進行概念漂移檢測。這些算法適用于半標記或未標記數(shù)據(jù),但本質上是通過數(shù)據(jù)分布變化進行概念漂移檢測,性能直接取決于能否擁有足夠的訓練樣本用于區(qū)分數(shù)據(jù)分布的差異。

    2 基于語義的概念漂移檢測方法

    本文針對頻繁漂移數(shù)據(jù)流提出一種無監(jiān)督基于語義的概念漂移檢測算法,首先給出算法框架,如圖1所示,本文算法框架綜合考慮了單詞和主題2個層面的語義相似度檢測概念漂移。

    圖1 本文算法框架

    1)共有詞比例計算

    文本數(shù)據(jù)流中語義的直接表現(xiàn)形式是單詞,因此,共有詞比例一定程度上可以體現(xiàn)2個數(shù)據(jù)塊的語義相似度,且計算方法簡單、效率高。例如在線購物評論數(shù)據(jù)中消費者關注的商品從書籍變化為電器時,雖然2個類別會有一些共有詞,例如“price”“quality”等,但2個數(shù)據(jù)塊中主要用于描述商品名稱的單詞會發(fā)生較大的變化,例如從“book,comic,novel,…”變化到“dvd,television,fridge,…”。

    當共有詞比例較大時,一般認為對應的相鄰數(shù)據(jù)塊語義相似度較高,因此,本文認為共有詞比例較大時無概念漂移。當共有詞比例較小時,可能存在概念漂移,有待于進一步檢測。

    2)相似主題比例計算

    基于共有詞比例的檢測方法沒有考慮單詞的語義權重,當比例較小的共有詞擁有較大的語義權重時,僅使用該方法會造成誤檢。例如20-Newsgroups數(shù)據(jù)中屬于“hockey”概念的2個數(shù)據(jù)塊,由于“match”“hockey”“League”等高頻詞語的數(shù)量較少,而“Canada”“CBC”“NHL”等低頻詞語的數(shù)量較低,因此此時基于共有詞比例的檢測方法反而會誤判發(fā)生概念漂移。為防止此類誤檢發(fā)生,本文引入LDA模型中的主題概念進行檢測。若相鄰兩數(shù)據(jù)塊主題較為相似,則認為未發(fā)生概念漂移,否則認為發(fā)生概念漂移。

    下面簡要介紹LDA模型。LDA是一種基于語義的文檔主題生成模型,能提取出文檔-主題-詞概率矩陣,其中主題-詞的概率矩陣可用于表示主題空間。在本文中視每個數(shù)據(jù)塊為一個文檔并為其建立LDA模型,并由此得到相鄰數(shù)據(jù)塊的主題空間。對于數(shù)據(jù)塊Di,可以得到其主題集合Zi={z1,z2,…,zh}以及文檔-主題的概率分布θDi={P(z1|Di),P(z2|Di),…,P(zh|Di)};而對于主題zi∈Zi,可以得到其主題-單詞的概率分布φzi={P(w1|zi),P(w2|zi),…,P(wm|zi)},其中P(wl|zi)表示單詞wl屬于主題zi的概率,即wl在zi中的語義權重。本文通過比較單詞在不同主題中的語義權重來衡量主題相似度,并根據(jù)數(shù)據(jù)塊之間的相似主題比例來衡量數(shù)據(jù)塊的語義相似度,從而實現(xiàn)概念漂移的檢測,彌補了共有詞比例難以體現(xiàn)語義權重的不足。

    為保證表述的準確性,本文定義了相關變量,如表1所示。

    表1 變量定義

    本文算法詳細步驟如下:

    步驟1計算共有詞比例rw

    通過計算共有詞比例rw來進行概念漂移檢測,如圖2所示,求得Di和Di+1中單詞集合交集即可計算量數(shù)據(jù)塊共有詞所占比例。

    圖2 共有詞比例計算示意圖

    對于文本數(shù)據(jù)流D={D1,D2,…},使用|WDi|表示數(shù)據(jù)塊Di的單詞個數(shù)。利用相鄰數(shù)據(jù)塊共有詞比例衡量其語義相似度,計算公式如式(1)所示。

    (1)

    由于此步驟用于快速排除相鄰數(shù)據(jù)塊語義相似度較高的情況,其余情況可以由后續(xù)步驟進行檢測,因此當rw大于閾值α時,判定未發(fā)生概念漂移,否則需要執(zhí)行步驟2。

    步驟2計算相似主題比例rz

    引入LDA模型,通過計算相似主題比例rz進行概念漂移檢測,如圖3所示。

    圖3 相似主題比例計算示意圖

    LDA模型可以計算出文檔-主題-單詞的三層概率分布,本文算法引入LDA模型,主要利用主題-單詞的概率P(wl|zi)計算相似主題比例,實現(xiàn)概念漂移檢測。

    (2)

    (3)

    將相似主題比例視為相鄰數(shù)據(jù)塊的語義相似度,上述計算可用于概念漂移的檢測。計算過程如式(4)所示。

    (4)

    其中,h為LDA模型在數(shù)據(jù)流D上劃分的主題個數(shù)。

    與共有詞比例類似,當rz大于閾值α時,可以判定這2個數(shù)據(jù)塊語義相似度較高,未發(fā)生概念漂移,否則發(fā)生概念漂移。

    經(jīng)過以上各步驟,本文算法利用隱含的語義彌補頻繁漂移情況下訓練數(shù)據(jù)的有限性,通過計算共有詞比例和相似主題比例,實現(xiàn)了概念漂移檢測。

    本文算法由共有詞比例計算和深入語義權重的相似主題比例計算2個步驟組成,挖掘了數(shù)據(jù)隱含的語義信息,彌補了頻繁漂移情況下單個概念數(shù)據(jù)量不足的缺陷,減少了概念漂移檢測的漏檢。算法具體如下:

    算法基于語義的無監(jiān)督文本數(shù)據(jù)流概念漂移檢測算法

    輸入數(shù)據(jù)流D,數(shù)據(jù)塊中的主題個數(shù)h,閾值α、β

    輸出發(fā)生的概念漂移次數(shù)n

    1.While D not end,read chunks Di,Di+1from the stream D;

    2. Count|WDi|,|WDi+1| and |WDi∩WDi+1| to calculate rw;

    3. If(rw>α)

    4. Then no drift and break;

    5. Use LDA to get Zi,Zi+1and each j for topics by h;

    7. For zi∈Zi,i=1 to h

    9. Then lz′j=1 and break;

    10. Sum lz′jto calculate rz;

    11. If(rz>α)

    12. Then no drift and break;

    13. Else drift and n++;

    14.Return n;

    3 實驗與結果分析

    本節(jié)探討了算法的閾值選取,并通過同基準算法的對比,從算法在多種頻繁漂移文本數(shù)據(jù)流上的普適性和不同漂移頻繁程度對算法的影響2個方面評估本文算法。

    3.1 基準數(shù)據(jù)集、基準算法及評價指標

    由于網(wǎng)絡中存在的真實文本數(shù)據(jù)流分布較為隨機,不能保證包含所有種類的概念漂移,用于評估概念漂移檢測算法性能時不夠嚴謹,缺乏說服力,而且包含大量的噪音,需要經(jīng)過復雜的預處理,因此實驗選取常用于評估算法性能的3個基準文本數(shù)據(jù)集,通過不同的組合方式模擬真實情況下的文本數(shù)據(jù)流,3個數(shù)據(jù)集分別是亞馬遜網(wǎng)站購物數(shù)據(jù)(Amazon)、路透社新聞數(shù)據(jù)(Reuters)以及20新聞組數(shù)據(jù)(20-Newsgroups),具體信息如表2所示,其中亞馬遜網(wǎng)站購物數(shù)據(jù)是由多種商品的購物評論組成,而路透社新聞數(shù)據(jù)和20新聞組數(shù)據(jù)則是由多個領域中的多篇新聞報道組成。

    表2 數(shù)據(jù)集信息

    本文從對于多種頻繁漂移文本數(shù)據(jù)流的普適性和漂移頻繁程度不同對算法性能的影響2個方面考察算法,設置了2個系列的實驗數(shù)據(jù),其中本文算法使用單詞形式的文本數(shù)據(jù)流,而對比算法使用經(jīng)過特征向量化、詞頻篩選處理后的文本數(shù)據(jù)流。

    由于基準數(shù)據(jù)中包含多個不同的領域,來自不同領域的數(shù)據(jù)之間概念不同,通過從不同的領域中選取數(shù)據(jù)組成數(shù)據(jù)塊并拼接構成實驗數(shù)據(jù)流的方式,可以模擬真實數(shù)據(jù)流中的概念漂移情況,具體構造方法如下:

    1)多種頻繁漂移文本數(shù)據(jù)流

    為考察算法的普適性,本文選取3個來自不同基準數(shù)據(jù)集的實驗數(shù)據(jù)與基準算法進行對比實驗。

    (1)Amazon數(shù)據(jù)集:數(shù)據(jù)共有4個概念,對每個概念重復取樣獲得8個數(shù)據(jù)塊,并將其組成共32個數(shù)據(jù)塊的實驗數(shù)據(jù),其中每個數(shù)據(jù)塊由200條數(shù)據(jù)構成。數(shù)據(jù)經(jīng)過特征向量化、詞頻篩選后維度為256,其中設定3次概念漂移,多次重復實驗取平均值作為最終實驗結果。

    (2)Reuters數(shù)據(jù)集:數(shù)據(jù)共有5個概念,對每個概念重復取樣獲得2個數(shù)據(jù)塊,并將其組成共10個數(shù)據(jù)塊的實驗數(shù)據(jù),其中每個數(shù)據(jù)塊由200條數(shù)據(jù)構成。數(shù)據(jù)經(jīng)過特征向量化、詞頻篩選后維度為224,其中設定4次概念漂移,多次重復實驗取平均值作為最終實驗結果。

    (3)20-Newsgroups數(shù)據(jù)集:數(shù)據(jù)共有4個領域,每個大類包含3個~5個概念,從每個領域中隨機選取一個概念,對每個概念重復取樣獲得3個數(shù)據(jù)塊,并將其組成12個數(shù)據(jù)塊的實驗數(shù)據(jù),其中每個數(shù)據(jù)塊由200條數(shù)據(jù)構成。數(shù)據(jù)經(jīng)過特征向量化、詞頻篩選后維度為201,其中設定3次概念漂移,多次重復實驗取平均值作為最終實驗結果。

    2)Amazon實驗數(shù)據(jù)序列

    為考察漂移頻繁程度不同對算法性能影響,本文從亞馬遜網(wǎng)站購物數(shù)據(jù)中抽取數(shù)據(jù),構建了漂移頻繁程度不同的多組實驗數(shù)據(jù)。對Amazon原始數(shù)據(jù)的4個概念分別重復取樣各獲得8個數(shù)據(jù)塊,共32個數(shù)據(jù)塊、6 400條數(shù)據(jù),再將獲得的數(shù)據(jù)塊按照8種不同的順序進行排列以獲得8組漂移頻繁程度不同的實驗數(shù)據(jù),其中漂移次數(shù)最多的有31次,最少的有3次。

    本文選取5種概念漂移檢測算法作為基準算法,其中監(jiān)督概念漂移檢測的算法有DDM[3-4]、CDRDT[6]、DWCDS[7-8]和HDDM-W-Test[16]算法,而無監(jiān)督或半監(jiān)督概念漂移檢測的算法則為REDLLA[10]算法。由于基于監(jiān)督概念漂移檢測的算法受分類器性能影響,選擇決

    策樹(DT)和樸素Bayes(NB)分類器作為對比,并在此基礎上進行分類性能的對比,分類過程運用集成分類的方法,窗口大小為4個數(shù)據(jù)塊。

    評價指標:概念漂移檢測的結果需要提供有意義的、可以量化描述的結論,根據(jù)概念漂移檢測的特點,通常采用誤檢數(shù)和漏檢數(shù)作為評價指標[17]。

    為了在保證精度的同時提高時間效率,設定LDA模型內部迭代次數(shù)為1 000,數(shù)據(jù)流劃分的主題數(shù)目為10,主題的關鍵詞集合大小為20。

    3.2 閾值選取

    本節(jié)主要說明閾值a和b的取值。由于a用于快速剔除語義相似度高的相鄰數(shù)據(jù)塊,因此本文根據(jù)經(jīng)驗值設置其值為0.5;b用于衡量主題的語義相似度,需要根據(jù)實驗決定,具體實驗結果如圖4所示。

    圖4 閾值b取值實驗結果

    根據(jù)閾值不同取值的實驗結果,可以看出閾值越小漏檢次數(shù)越多,閾值越大誤檢次數(shù)越多。經(jīng)過多次重復試驗,本文選取0.2作為主題相似度閾值b的取值。

    3.3 算法普適性分析

    使用多種頻繁漂移文本數(shù)據(jù)流進行實驗,具體結果如表3所示,該表顯示了本文算法與對比算法在誤報次數(shù)、漏報次數(shù)方面的概念漂移檢測性能。

    表3 概念漂移檢測結果

    首先,實驗結果表明在頻繁漂移情況下,監(jiān)督概念漂移檢測方法普遍漏檢嚴重,尤其是對于Reuters數(shù)據(jù),對比算法的正確檢測數(shù)量都為0,這是由于頻繁漂移情況下訓練樣本的缺少導致分類器性能低下,漂移發(fā)生時分類錯誤率的變化不夠明顯。同時選取的2種基分類器實驗結果類似,證明了這種情況的普遍性。

    其次,無監(jiān)督或半監(jiān)督概念漂移檢測方法的效果也較差,尤其是REDLLA算法,在3組實驗數(shù)據(jù)集上均有較多漏檢和誤檢。漏檢較多是由于頻繁漂移情況下,算法獲取的樣本數(shù)量不足以區(qū)分不同概念的數(shù)據(jù)分布;誤檢較多則是由于文本數(shù)據(jù)流本身數(shù)據(jù)塊之間分布差異較大,且無監(jiān)督或半監(jiān)督算法不使用標記信息。

    在3個基準數(shù)據(jù)集上的實驗結果表明,與對比算法相比,本文算法的概念漂移檢測結果均優(yōu)于對比算法,尤其在漏檢指標上大幅度優(yōu)于對比算法。這是由于本文算法考慮了文本數(shù)據(jù)隱含的語義信息,使用相鄰數(shù)據(jù)塊的語義信息增強了概念的區(qū)分度,彌補了頻繁漂移情況下數(shù)據(jù)量有限的不足,能夠進行有效的概念漂移檢測。

    表4考察了本文算法與對比算法在分類錯誤率上的差異,表中數(shù)據(jù)為所有數(shù)據(jù)塊的平均分類錯誤率。由于本文算法僅進行概念漂移檢測,因此在考察分類精度時計算了2種分類方法的結果。由表4可見,實驗結果平均分類錯誤率較大,原因在于采取了未進行降噪等預處理的原始數(shù)據(jù),而且設定的漂移較為頻繁,概念變化速度較快。此外,該算法在Amazon和 20-Newsgroups數(shù)據(jù)集上的分類錯誤率高于基準算法,這是由于基準算法頻繁漂移情況下漏檢較多,漏檢時訓練集不會更新導致其中出現(xiàn)概念重現(xiàn)問題,概念的重現(xiàn)使得基準算法在漏檢較多時反而具有較低的分類錯誤率。由于本文算法僅考慮概念漂移檢測,因此集成分類器機制帶來的概念重現(xiàn)問題不做進一步討論。

    表4 分類錯誤率 %

    綜合所有分類錯誤率結果則可以證明,在大部分情況下,本文概念漂移檢測算法得到的檢測結果在相同的分類機制下能獲得相當?shù)姆诸惥取?/p>

    3.4 不同漂移頻繁程度下的算法性能分析

    本節(jié)對比本文算法與3種基準算法在不同頻繁程度下在Amazon實驗數(shù)據(jù)序列上的實驗結果,基分類器選取NB方法,結果如表5所示,其中,N表示漂移次數(shù)。可以看出,隨著漂移頻繁程度的增加,漏檢數(shù)也會上升,而本文算法漏檢數(shù)上升幅度明顯小于對比算法。DDM算法在頻繁程度較高時漏檢次數(shù)較高,這是由于頻繁發(fā)生概念漂移時,分類精度一直較低,變化程度不明顯。REDLLA算法在頻繁程度低時誤檢較多,在頻繁程度較高時漏檢較多,前者是由于文本數(shù)據(jù)塊本身數(shù)據(jù)分布差異程度較大,不使用標簽信息時會造成較多的誤檢,后者則是由于頻繁漂移時同一概念的數(shù)據(jù)樣本過少,難以區(qū)分不同概念的數(shù)據(jù)分布。而本文算法利用語義信息彌補樣本數(shù)量有限的不足,在漂移頻繁程度較低時效果與對比算法相當,而在頻繁漂移程度較大時大幅度減少了漏檢數(shù)量。

    表5 漂移頻繁程度對算法性能的影響

    4 結束語

    概念漂移檢測是數(shù)據(jù)流分類研究的難點,尤其對于頻繁漂移數(shù)據(jù)流。監(jiān)督概念漂移檢測方法通?;诜诸愬e誤率,過度依賴于分類器的性能,且需要在分類結束后才能進行概念漂移檢測;無監(jiān)督或半監(jiān)督的分類算法利用聚類或者特征提取的方法計算相鄰數(shù)據(jù)塊的差異程度以檢測漂移,在樣本數(shù)量不足時效果不理想。而本文算法利用了數(shù)據(jù)隱含的語義信息,基于語義相似度進行概念漂移檢測,效果不受基分類器性能影響,且受樣本數(shù)量影響度較小。然而該算法性能對相似閾值敏感,因此,發(fā)現(xiàn)閾值與數(shù)據(jù)分布間的內在關系以提升算法普適性將是未來工作重點。此外,本文僅關注了文本數(shù)據(jù)流的概念漂移問題,如何面向其他實際應用領域包括煤礦典型動力災害數(shù)據(jù)流、電信通話數(shù)據(jù)流、天氣預報數(shù)據(jù)流等實現(xiàn)概念漂移的檢測,也將是下一步的研究方向。

    [1] WIDMER G,KUBAT M.Learning in the Presence of Concept Drift and Hidden Contexts[J].Machine Learning,1996,23(1):69-101.

    [2] WANG Haixun,FAN Wei,YU P S,et al.Mining Concept-drifting Data Streams Using Ensemble Classifiers[C]//Proceedings of the 9th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York,USA:ACM Press,2003:789-802.

    [3] GAMA J,MEDAS P,CASTILLO G,et al.Learning with Drift Detection[M]//BAZZAN A L C,LABIDI S.Advances in Artificial Intelligence.Berlin,Germany:Springer-Verlag,2004:286-295.

    [4] GAMA J,CASTILLO G.Learning with Local Drift Detection[M]//LI Xue,ZA?ANE O R,LI Zhanhuai.Advanced Data Mining and Applications.Berlin,Germany:Springer-Verlag,2006:42-55.

    [5] BAENA-GARC M,CAMPO-VILA J D,FIDALGO R,et al.Early Drift Detection Method[C]//Proceedings of the 4th International Workshop on Knowledge Discovery from Data Streams.Pittsburgh,USA:[s.n.],2006:1-10.

    [6] LI Peipei,WU Xindong,HU Xuegang,et al.A Random Decision Tree Ensemble for Mining Concept Drifts from Noisy Data Streams[J].Applied Artificial Intelligence,2010,24(7):680-710.

    [7] 朱 群,張玉紅,胡學鋼,等.一種基于雙層窗口的概念漂移數(shù)據(jù)流分類算法[J].自動化學報,2011,37(9):1077-1084.

    [8] ZHU Qun,HU Xuegang,ZHANG Yuhong,et al.A Double-window-based Classification Algorithm for Concept Drifting Data Streams[C]//Proceedings of IEEE International Conference on Granular Computing.Washington D.C.,USA:IEEE Press,2010:639-644.

    [9] 桂 林,張玉紅,胡學鋼.一種基于混合集成方法的數(shù)據(jù)流概念漂移檢測方法[J].計算機科學,2012,39(1):152-155.

    [10] LI Peipei,WU Xindong,HU Xuegang.Mining Recurring Concept Drifts with Limited Labeled Streaming Data[J].ACM Transactions on Intelligent Systems and Technology,2012,3(2):241-252.

    [11] 孫 雪,李昆侖,韓 蕾,等.基于特征項分布的信息熵及特征動態(tài)加權概念漂移檢測模型[J].電子學報,2015,43(7):1356-1361.

    [12] 郭躬德,李 南,陳黎飛.一種基于混合模型的數(shù)據(jù)流概念漂移檢測算法[J].計算機研究與發(fā)展,2014,51(4):731-742.

    [13] BLEI D M,NG A Y,JORDAN M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003,3:993-1022.

    [14] HOFFMAN M D,BLEI D M,BACH F R.Online Learning for Latent Dirichlet Allocation[M]//LAFFERTY J D,WILLIAMS C K I,SHAWE-TAYLOR J.Advances in Neural Information Processing Systems.[S.l.]:Neural Information Processing Systems Foundation,Inc.,2010:856-864.

    [15] LI Peipei,WU Xindong,HU Xuegang,et al.Learning Concept-drifting Data Streams with Random Ensemble Decision Trees[J].Neurocomputing,2015,166(C):68-83.

    [16] FRIASBLANCO I,CAMPOAVILA J D,RAMOSJIMENEZ G,et al.Online and Non-parametric Drift Detection Methods Based on Hoeffding’s Bounds[J].IEEE Transactions on Knowledge and Data Engineering,2015,27(3):810-823.

    [17] HABABOU M,CHENG A Y,FALK R.Variable Selection in the Credit Card Industry[C]//Proceedings of NESUG’06.Philadelphia,USA:SAS Institute Inc.,2006:1-5.

    猜你喜歡
    數(shù)據(jù)流語義概念
    Birdie Cup Coffee豐盛里概念店
    汽車維修數(shù)據(jù)流基礎(下)
    語言與語義
    幾樣概念店
    學習集合概念『四步走』
    一種提高TCP與UDP數(shù)據(jù)流公平性的擁塞控制機制
    聚焦集合的概念及應用
    “上”與“下”語義的不對稱性及其認知闡釋
    基于數(shù)據(jù)流聚類的多目標跟蹤算法
    認知范疇模糊與語義模糊
    亚洲精品中文字幕一二三四区| 亚洲中文字幕一区二区三区有码在线看 | 一进一出抽搐动态| 天天躁日日操中文字幕| av欧美777| 精品国产三级普通话版| 国内精品美女久久久久久| 久久久久久九九精品二区国产| 亚洲熟女毛片儿| 成人亚洲精品av一区二区| 蜜桃久久精品国产亚洲av| 桃色一区二区三区在线观看| 桃色一区二区三区在线观看| 精品国产乱码久久久久久男人| 嫩草影院精品99| 国产毛片a区久久久久| 国产精品国产高清国产av| 在线国产一区二区在线| 可以在线观看毛片的网站| 怎么达到女性高潮| 日日夜夜操网爽| 国产精品久久久久久人妻精品电影| 免费搜索国产男女视频| 亚洲欧美一区二区三区黑人| 观看美女的网站| 国产高清视频在线观看网站| 十八禁网站免费在线| 9191精品国产免费久久| 亚洲自偷自拍图片 自拍| 亚洲av中文字字幕乱码综合| 夜夜夜夜夜久久久久| 久久精品国产清高在天天线| 亚洲av成人av| 中文字幕人成人乱码亚洲影| 久久精品国产清高在天天线| 99热只有精品国产| 日韩精品青青久久久久久| 又黄又爽又免费观看的视频| 欧美高清成人免费视频www| 黑人操中国人逼视频| 最新在线观看一区二区三区| 日韩欧美国产一区二区入口| 网址你懂的国产日韩在线| 免费在线观看影片大全网站| 婷婷精品国产亚洲av在线| 国产亚洲精品一区二区www| 9191精品国产免费久久| 啦啦啦观看免费观看视频高清| 免费在线观看日本一区| 日日夜夜操网爽| 成人欧美大片| 国产精品亚洲av一区麻豆| 九色国产91popny在线| 天堂影院成人在线观看| 欧美国产日韩亚洲一区| 中文在线观看免费www的网站| 淫妇啪啪啪对白视频| 亚洲中文日韩欧美视频| 欧洲精品卡2卡3卡4卡5卡区| 成年女人毛片免费观看观看9| 麻豆成人午夜福利视频| 老司机福利观看| 国产人伦9x9x在线观看| 欧美乱妇无乱码| 无人区码免费观看不卡| 桃红色精品国产亚洲av| 亚洲精品456在线播放app | 国产淫片久久久久久久久 | 男女那种视频在线观看| 亚洲精品乱码久久久v下载方式 | 天堂网av新在线| 禁无遮挡网站| 99riav亚洲国产免费| 精品免费久久久久久久清纯| 免费观看的影片在线观看| 久久中文字幕人妻熟女| 国产淫片久久久久久久久 | 啦啦啦免费观看视频1| 日韩 欧美 亚洲 中文字幕| 99在线人妻在线中文字幕| 国产精品香港三级国产av潘金莲| 草草在线视频免费看| 精品国产亚洲在线| 久久国产乱子伦精品免费另类| 精华霜和精华液先用哪个| 久久久成人免费电影| 国产成人系列免费观看| 亚洲av美国av| 在线观看美女被高潮喷水网站 | 欧美大码av| 国产亚洲av嫩草精品影院| 久久久色成人| 香蕉丝袜av| 国产亚洲精品久久久com| 特大巨黑吊av在线直播| a在线观看视频网站| 亚洲人成电影免费在线| 国产视频内射| xxx96com| 人妻久久中文字幕网| 91麻豆av在线| 我要搜黄色片| 又大又爽又粗| 午夜激情福利司机影院| 99久国产av精品| 国产欧美日韩一区二区精品| 国产亚洲欧美98| 精品99又大又爽又粗少妇毛片 | 亚洲自偷自拍图片 自拍| 国产毛片a区久久久久| 亚洲专区中文字幕在线| 99re在线观看精品视频| 亚洲色图av天堂| 又紧又爽又黄一区二区| av福利片在线观看| 成人三级黄色视频| 好男人电影高清在线观看| 国产男靠女视频免费网站| 国产视频一区二区在线看| 91av网一区二区| 中文字幕人成人乱码亚洲影| 999精品在线视频| 一卡2卡三卡四卡精品乱码亚洲| 午夜久久久久精精品| 啦啦啦韩国在线观看视频| 国产淫片久久久久久久久 | 国产探花在线观看一区二区| 久久久久久久久中文| 国产精品1区2区在线观看.| 午夜福利欧美成人| 床上黄色一级片| 成人午夜高清在线视频| 国产成人精品无人区| 亚洲欧美日韩卡通动漫| 夜夜夜夜夜久久久久| 首页视频小说图片口味搜索| 最近最新中文字幕大全电影3| 少妇熟女aⅴ在线视频| 两性午夜刺激爽爽歪歪视频在线观看| av天堂中文字幕网| 亚洲国产精品sss在线观看| 午夜免费观看网址| 99久久精品一区二区三区| 老司机午夜福利在线观看视频| 夜夜躁狠狠躁天天躁| 久久久久久久久中文| 精品福利观看| 色哟哟哟哟哟哟| 最好的美女福利视频网| АⅤ资源中文在线天堂| 免费人成视频x8x8入口观看| aaaaa片日本免费| 亚洲欧美精品综合久久99| 9191精品国产免费久久| 久久久久免费精品人妻一区二区| 麻豆成人av在线观看| 人人妻人人看人人澡| 色哟哟哟哟哟哟| av中文乱码字幕在线| 成人特级av手机在线观看| 麻豆av在线久日| 一个人观看的视频www高清免费观看 | 国产成人精品久久二区二区91| 操出白浆在线播放| 午夜免费激情av| 国产成人av教育| 国产精品永久免费网站| 香蕉久久夜色| 老汉色∧v一级毛片| 日韩精品青青久久久久久| 国产午夜精品久久久久久| 母亲3免费完整高清在线观看| 很黄的视频免费| 久99久视频精品免费| 国产亚洲av嫩草精品影院| 国产精品久久电影中文字幕| 国产 一区 欧美 日韩| 国产亚洲av高清不卡| 不卡一级毛片| 久久精品国产清高在天天线| 搡老妇女老女人老熟妇| 欧美成人性av电影在线观看| 午夜激情福利司机影院| 制服人妻中文乱码| 国产人伦9x9x在线观看| 一二三四在线观看免费中文在| 日韩免费av在线播放| 男女下面进入的视频免费午夜| 观看美女的网站| 91久久精品国产一区二区成人 | 男人舔女人的私密视频| 国产欧美日韩精品亚洲av| cao死你这个sao货| 国产亚洲欧美98| 观看免费一级毛片| 国产aⅴ精品一区二区三区波| h日本视频在线播放| 日韩欧美 国产精品| 亚洲专区中文字幕在线| 久久香蕉国产精品| 亚洲美女视频黄频| 久久亚洲真实| 色av中文字幕| 两性夫妻黄色片| 嫩草影院入口| 三级毛片av免费| 日韩高清综合在线| 制服人妻中文乱码| 91在线观看av| 999久久久国产精品视频| 日本五十路高清| 国产精品久久久人人做人人爽| 国产午夜精品久久久久久| 听说在线观看完整版免费高清| 精品一区二区三区视频在线 | 久久久色成人| 久久久久久久久免费视频了| 99久国产av精品| 好看av亚洲va欧美ⅴa在| 午夜视频精品福利| 婷婷精品国产亚洲av在线| 琪琪午夜伦伦电影理论片6080| 中亚洲国语对白在线视频| 老司机福利观看| 免费看光身美女| 日韩欧美 国产精品| 国产蜜桃级精品一区二区三区| 久久久水蜜桃国产精品网| 黄片小视频在线播放| 免费观看的影片在线观看| 久久久精品大字幕| 亚洲国产高清在线一区二区三| 999精品在线视频| 成年女人永久免费观看视频| 精品久久久久久久末码| 午夜激情欧美在线| 国产熟女xx| h日本视频在线播放| 久久国产精品人妻蜜桃| h日本视频在线播放| 欧美不卡视频在线免费观看| 久久久久久人人人人人| 欧美激情久久久久久爽电影| 国产主播在线观看一区二区| 色播亚洲综合网| 91av网站免费观看| 老司机午夜十八禁免费视频| 欧美日本视频| 一个人看视频在线观看www免费 | 99精品欧美一区二区三区四区| 九色成人免费人妻av| 精品熟女少妇八av免费久了| 亚洲成a人片在线一区二区| 欧美乱码精品一区二区三区| 国产成人系列免费观看| 午夜福利免费观看在线| 国产97色在线日韩免费| 好男人在线观看高清免费视频| 国产伦精品一区二区三区四那| 一本精品99久久精品77| 亚洲精品在线美女| 免费看a级黄色片| 欧美zozozo另类| 欧洲精品卡2卡3卡4卡5卡区| 国产激情久久老熟女| 婷婷精品国产亚洲av| 美女免费视频网站| 国产欧美日韩一区二区三| 免费观看的影片在线观看| 免费在线观看日本一区| 亚洲精品在线美女| 国产免费av片在线观看野外av| 午夜福利视频1000在线观看| 一进一出抽搐动态| 韩国av一区二区三区四区| 国产av麻豆久久久久久久| 手机成人av网站| 国产精品免费一区二区三区在线| av视频在线观看入口| 国产激情久久老熟女| 国产精品98久久久久久宅男小说| 亚洲片人在线观看| 18禁美女被吸乳视频| 高清毛片免费观看视频网站| 国产av麻豆久久久久久久| 在线国产一区二区在线| 国产男靠女视频免费网站| 搡老妇女老女人老熟妇| 天天躁日日操中文字幕| 欧美大码av| 成人特级黄色片久久久久久久| 久久久久亚洲av毛片大全| 我要搜黄色片| 老司机福利观看| 色综合婷婷激情| 人人妻人人澡欧美一区二区| 51午夜福利影视在线观看| 国产久久久一区二区三区| 久久久久久久久免费视频了| 亚洲欧美日韩东京热| 丰满的人妻完整版| 亚洲色图 男人天堂 中文字幕| 亚洲国产欧美网| 久久精品人妻少妇| 久久精品夜夜夜夜夜久久蜜豆| 嫁个100分男人电影在线观看| 天天添夜夜摸| 午夜成年电影在线免费观看| 欧美绝顶高潮抽搐喷水| 草草在线视频免费看| 叶爱在线成人免费视频播放| 亚洲精品456在线播放app | 99国产精品99久久久久| 日韩欧美 国产精品| 国产主播在线观看一区二区| 久99久视频精品免费| 校园春色视频在线观看| 亚洲电影在线观看av| ponron亚洲| 色播亚洲综合网| 精品99又大又爽又粗少妇毛片 | 国内揄拍国产精品人妻在线| 性色avwww在线观看| 国产97色在线日韩免费| 日本成人三级电影网站| 国产精品一区二区三区四区久久| 青草久久国产| 国产午夜精品论理片| 在线视频色国产色| 亚洲18禁久久av| 狂野欧美激情性xxxx| 99国产精品一区二区三区| 亚洲国产看品久久| cao死你这个sao货| 99国产综合亚洲精品| 日本三级黄在线观看| 老熟妇乱子伦视频在线观看| 午夜影院日韩av| 久久天躁狠狠躁夜夜2o2o| 日日夜夜操网爽| 一a级毛片在线观看| 最近最新免费中文字幕在线| 国产av麻豆久久久久久久| 久久欧美精品欧美久久欧美| 亚洲熟妇熟女久久| 精品午夜福利视频在线观看一区| 老汉色∧v一级毛片| 久久这里只有精品中国| 在线免费观看不下载黄p国产 | 亚洲欧美日韩无卡精品| 国产高清激情床上av| 在线观看免费午夜福利视频| 无限看片的www在线观看| 身体一侧抽搐| 搡老妇女老女人老熟妇| 久久久久精品国产欧美久久久| 老熟妇仑乱视频hdxx| 观看美女的网站| 在线看三级毛片| 观看免费一级毛片| 国产精品久久久久久亚洲av鲁大| 亚洲精品美女久久av网站| 国产欧美日韩一区二区精品| 真人做人爱边吃奶动态| 日本 av在线| 成在线人永久免费视频| 观看免费一级毛片| 亚洲中文字幕日韩| 日本精品一区二区三区蜜桃| 可以在线观看的亚洲视频| 一区二区三区国产精品乱码| 国产蜜桃级精品一区二区三区| 成人特级av手机在线观看| 99热这里只有精品一区 | 婷婷精品国产亚洲av| 叶爱在线成人免费视频播放| 黄色丝袜av网址大全| 国产一区二区三区视频了| 日日干狠狠操夜夜爽| 日本黄色片子视频| 欧美日韩综合久久久久久 | 在线免费观看的www视频| 国产欧美日韩一区二区精品| 亚洲午夜精品一区,二区,三区| 老汉色∧v一级毛片| 18禁美女被吸乳视频| 成人一区二区视频在线观看| 91av网一区二区| 国产成人aa在线观看| 91老司机精品| 日韩欧美一区二区三区在线观看| 很黄的视频免费| 最近最新中文字幕大全电影3| 无遮挡黄片免费观看| 51午夜福利影视在线观看| 久久久久精品国产欧美久久久| 色哟哟哟哟哟哟| 一夜夜www| 可以在线观看毛片的网站| 午夜福利在线观看免费完整高清在 | 又黄又爽又免费观看的视频| 欧美黑人欧美精品刺激| 这个男人来自地球电影免费观看| 精品久久久久久久人妻蜜臀av| 亚洲自拍偷在线| 热99re8久久精品国产| 亚洲中文字幕日韩| 69av精品久久久久久| 国产综合懂色| 九九久久精品国产亚洲av麻豆 | 99久久成人亚洲精品观看| 国产成人系列免费观看| 国产高清有码在线观看视频| 国产精品野战在线观看| 国产高清激情床上av| 97超级碰碰碰精品色视频在线观看| 少妇熟女aⅴ在线视频| 综合色av麻豆| svipshipincom国产片| 成人av一区二区三区在线看| 午夜福利在线观看吧| 成年版毛片免费区| 亚洲精品一区av在线观看| 欧美日韩福利视频一区二区| 一个人看视频在线观看www免费 | 久久精品影院6| 日本撒尿小便嘘嘘汇集6| 老司机深夜福利视频在线观看| 综合色av麻豆| 可以在线观看毛片的网站| 丰满人妻一区二区三区视频av | 亚洲无线在线观看| 在线观看日韩欧美| 久久精品91蜜桃| 亚洲18禁久久av| 级片在线观看| 国产男靠女视频免费网站| 长腿黑丝高跟| 久久午夜亚洲精品久久| 国产毛片a区久久久久| av在线天堂中文字幕| 精品欧美国产一区二区三| 精品不卡国产一区二区三区| 一个人观看的视频www高清免费观看 | 亚洲人成网站高清观看| 在线永久观看黄色视频| 狠狠狠狠99中文字幕| 制服人妻中文乱码| 男女做爰动态图高潮gif福利片| 久久久国产成人免费| 9191精品国产免费久久| 99久久久亚洲精品蜜臀av| 香蕉国产在线看| 小蜜桃在线观看免费完整版高清| 国产欧美日韩精品亚洲av| 久久草成人影院| 色在线成人网| 精品一区二区三区视频在线观看免费| 欧美成人性av电影在线观看| 在线视频色国产色| 母亲3免费完整高清在线观看| 在线播放国产精品三级| 国产午夜福利久久久久久| 一进一出好大好爽视频| 男插女下体视频免费在线播放| 国语自产精品视频在线第100页| 一夜夜www| 国产亚洲精品av在线| 床上黄色一级片| 日本在线视频免费播放| 悠悠久久av| 成年人黄色毛片网站| 日本黄色视频三级网站网址| 性色avwww在线观看| 熟女电影av网| 丝袜人妻中文字幕| 国产亚洲精品综合一区在线观看| 成人特级av手机在线观看| 毛片女人毛片| 亚洲精品在线美女| 丝袜人妻中文字幕| 精品日产1卡2卡| 色在线成人网| 国产三级黄色录像| 99精品在免费线老司机午夜| 丰满的人妻完整版| 欧美激情在线99| 99国产精品一区二区三区| 观看美女的网站| 国产av一区在线观看免费| 久久精品夜夜夜夜夜久久蜜豆| 熟女少妇亚洲综合色aaa.| 亚洲精品一区av在线观看| 午夜福利在线观看吧| 在线a可以看的网站| 免费观看人在逋| 天堂网av新在线| 免费高清视频大片| 久久人妻av系列| 午夜福利在线在线| 桃色一区二区三区在线观看| 婷婷精品国产亚洲av在线| 操出白浆在线播放| 欧美激情久久久久久爽电影| cao死你这个sao货| 亚洲精品一卡2卡三卡4卡5卡| 嫩草影院入口| 老司机福利观看| 久久亚洲精品不卡| 特大巨黑吊av在线直播| 午夜福利欧美成人| 国产激情久久老熟女| 国产伦精品一区二区三区视频9 | АⅤ资源中文在线天堂| 夜夜躁狠狠躁天天躁| 中文字幕人妻丝袜一区二区| 真实男女啪啪啪动态图| 国产精品久久久久久精品电影| 天堂影院成人在线观看| 国产精品av视频在线免费观看| 狂野欧美激情性xxxx| av欧美777| 黄色丝袜av网址大全| 天天躁狠狠躁夜夜躁狠狠躁| 久久久久国产一级毛片高清牌| 男女下面进入的视频免费午夜| 中国美女看黄片| 午夜两性在线视频| 美女cb高潮喷水在线观看 | 亚洲欧美日韩卡通动漫| 国产乱人伦免费视频| 国产成人影院久久av| 又黄又粗又硬又大视频| 久久中文字幕一级| www日本在线高清视频| 99久久无色码亚洲精品果冻| 日本成人三级电影网站| 国产精品自产拍在线观看55亚洲| 久久久久免费精品人妻一区二区| 免费大片18禁| 国产成+人综合+亚洲专区| 18禁美女被吸乳视频| 黄色成人免费大全| 禁无遮挡网站| 1000部很黄的大片| 国产亚洲欧美在线一区二区| 天堂av国产一区二区熟女人妻| 视频区欧美日本亚洲| 国产精品亚洲美女久久久| 日韩欧美一区二区三区在线观看| 精品一区二区三区av网在线观看| 19禁男女啪啪无遮挡网站| 99久国产av精品| 国产伦精品一区二区三区视频9 | 国产精品 国内视频| 亚洲中文字幕日韩| 男女床上黄色一级片免费看| 丁香六月欧美| 国产精品女同一区二区软件 | 嫩草影视91久久| 国产精华一区二区三区| 999久久久精品免费观看国产| 成人午夜高清在线视频| 岛国在线观看网站| 18禁裸乳无遮挡免费网站照片| 欧美日韩综合久久久久久 | 亚洲,欧美精品.| 日韩av在线大香蕉| 成人特级黄色片久久久久久久| 精品熟女少妇八av免费久了| 欧美不卡视频在线免费观看| 久久久久九九精品影院| 日本黄大片高清| 久久久久亚洲av毛片大全| 日本黄色片子视频| 草草在线视频免费看| 精品一区二区三区av网在线观看| 国产不卡一卡二| 日韩欧美国产在线观看| 他把我摸到了高潮在线观看| 一本精品99久久精品77| 国产三级黄色录像| 脱女人内裤的视频| 国产一区在线观看成人免费| 欧美中文综合在线视频| 日韩欧美 国产精品| 成人鲁丝片一二三区免费| 国产精品久久久久久精品电影| 脱女人内裤的视频| 亚洲美女视频黄频| 窝窝影院91人妻| 18禁美女被吸乳视频| 国产伦一二天堂av在线观看| 亚洲五月天丁香| 变态另类成人亚洲欧美熟女| 1024手机看黄色片| 三级国产精品欧美在线观看 | 国产伦一二天堂av在线观看| 免费搜索国产男女视频| 身体一侧抽搐| 18禁黄网站禁片午夜丰满| 国产又色又爽无遮挡免费看| 国产精品一区二区免费欧美| 精品久久久久久久毛片微露脸| 国产精品一区二区三区四区免费观看 | 久99久视频精品免费| 一级a爱片免费观看的视频| 中文在线观看免费www的网站| 亚洲精品在线观看二区| 亚洲国产精品久久男人天堂| 亚洲熟妇中文字幕五十中出| 中文资源天堂在线| 天天躁日日操中文字幕| 999久久久国产精品视频| 欧美日韩亚洲国产一区二区在线观看|