• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    大數(shù)據(jù)

    2013-04-29 00:00:00于艷華宋美娜
    中興通訊技術(shù) 2013年3期

    數(shù)據(jù)是與自然資源一樣重要的戰(zhàn)略資源,大數(shù)據(jù)技術(shù)就是從數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多的數(shù)據(jù)中,快速獲得有價(jià)值信息的能力,它已成為學(xué)術(shù)界、企業(yè)界甚至各國(guó)政府關(guān)注的熱點(diǎn)。本講座將分3期對(duì)大數(shù)據(jù)進(jìn)行討論:第1期介紹了大數(shù)據(jù)的提出、含義、特點(diǎn),大數(shù)據(jù)和云計(jì)算的關(guān)系以及大數(shù)據(jù)典型應(yīng)用;第2期介紹大數(shù)據(jù)獲取、存貯、搜索、分享、分析、可視化等方面的關(guān)鍵技術(shù),并對(duì)當(dāng)前熱點(diǎn)技術(shù)—可視化進(jìn)行重點(diǎn)分析;第3期探討數(shù)據(jù)流挖掘等實(shí)時(shí)數(shù)據(jù)分析技術(shù),介紹大數(shù)據(jù)中非結(jié)構(gòu)化數(shù)據(jù)處理和挖掘技術(shù),并給出大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)與應(yīng)用前景。

    7 數(shù)據(jù)挖掘和數(shù)據(jù)流挖掘

    7.1 大數(shù)據(jù)挖掘技術(shù)的簡(jiǎn)介和分類

    大數(shù)據(jù)技術(shù)廣義上包括大數(shù)據(jù)相關(guān)的獲取、存儲(chǔ)、處理、挖掘等技術(shù),但就美國(guó)政府2012年提出的“大數(shù)據(jù)研究與發(fā)展計(jì)劃”而言,它主要指的是面向大數(shù)據(jù)的數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)技術(shù)。此期重點(diǎn)介紹大數(shù)據(jù)中的數(shù)據(jù)挖掘技術(shù),重點(diǎn)是數(shù)據(jù)流挖掘技術(shù)。

    數(shù)據(jù)挖掘技術(shù)是一個(gè)涉及數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、神經(jīng)網(wǎng)絡(luò)、高性能計(jì)算和數(shù)據(jù)可視化的多學(xué)科領(lǐng)域,是計(jì)算機(jī)模仿人類學(xué)習(xí)機(jī)理和方法,利用數(shù)據(jù)自動(dòng)獲取知識(shí)的一種技術(shù)。數(shù)據(jù)挖掘出現(xiàn)于20世紀(jì)80年代末,在過(guò)去的20年中得到了廣泛的研究和快速的發(fā)展,表現(xiàn)在出現(xiàn)了大量的算法,并可以處理各種類型數(shù)據(jù)。然而隨著大數(shù)據(jù)時(shí)代的來(lái)臨,數(shù)據(jù)挖掘技術(shù)迎來(lái)了空前廣泛的應(yīng)用機(jī)會(huì),也面臨新的挑戰(zhàn)。大數(shù)據(jù)是伴隨智能終端的普及和互聯(lián)網(wǎng)上微博、社交網(wǎng)絡(luò)等業(yè)務(wù)的廣泛應(yīng)用而出現(xiàn)的,因此面向大數(shù)據(jù)的數(shù)據(jù)挖掘的應(yīng)用首推Google、Amazon、Yahoo、阿里巴巴等互聯(lián)網(wǎng)公司,比如2009年甲型H1N1流感爆發(fā)時(shí),Google利用海量的用戶搜索詞及其組合,比美國(guó)國(guó)家疾控中心更及時(shí)更準(zhǔn)確地報(bào)告了疫情;Amazon公司首先提出并應(yīng)用協(xié)同過(guò)濾技術(shù)進(jìn)行書(shū)籍推薦,其應(yīng)用效果超過(guò)了之前被譽(yù)為“公司皇冠之上寶石“的書(shū)評(píng)團(tuán)隊(duì),開(kāi)啟了電子商務(wù)應(yīng)用中商品推薦的先河?;诨ヂ?lián)網(wǎng)上海量語(yǔ)言材料應(yīng)用機(jī)器學(xué)習(xí)技術(shù)的Google語(yǔ)言翻譯系統(tǒng),則是目前為止最為成功的計(jì)算機(jī)自動(dòng)翻譯系統(tǒng)。面向大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)的一個(gè)挑戰(zhàn)是:大數(shù)據(jù)時(shí)代我們能得到現(xiàn)象相關(guān)的所有數(shù)據(jù),即統(tǒng)計(jì)學(xué)上所說(shuō)的總體,而不再是傳統(tǒng)的統(tǒng)計(jì)學(xué)和數(shù)據(jù)挖掘中一個(gè)容量有限的樣本或容量有限的訓(xùn)練集。另外一個(gè)挑戰(zhàn)是所得到的數(shù)據(jù)不是絕對(duì)精確的,只要在保證速度的前提下近似地反映宏觀和整體情況[12],這一挑戰(zhàn)要求數(shù)據(jù)挖掘要能處理非結(jié)構(gòu)化數(shù)據(jù)和含噪音的數(shù)據(jù),而挖掘結(jié)果的正確性則只要保證在期望的區(qū)間內(nèi)。目前來(lái)看,應(yīng)對(duì)這兩個(gè)挑戰(zhàn)的主要技術(shù)之一就是數(shù)據(jù)流的挖掘。

    數(shù)據(jù)挖掘技術(shù)主要分為如下幾個(gè)分支:分類、聚類、關(guān)聯(lián)規(guī)則挖掘、序列模式挖掘、異常點(diǎn)挖掘、時(shí)間序列分析預(yù)測(cè)等。在大數(shù)據(jù)的相關(guān)挖掘應(yīng)用中,雖然處理的數(shù)據(jù)形式更豐富,但就學(xué)習(xí)方法來(lái)看并沒(méi)有根本差別,因?yàn)槿渴腔跀?shù)字化后信息的學(xué)習(xí)。

    7.2概念漂移

    “概念漂移”是Schlimmer等人于1986年首次提出的[13]。大部分的數(shù)據(jù)挖掘技術(shù)都有一個(gè)假設(shè)前提:樣本是隨機(jī)獲取的,并且服從同一穩(wěn)定的分布。然而在大數(shù)據(jù)場(chǎng)景下,數(shù)據(jù)源源不斷地到來(lái),樣本具有不穩(wěn)定和不確定性。例如,顧客的購(gòu)買興趣隨著時(shí)間很有可能發(fā)生變化;用戶上網(wǎng)的瀏覽習(xí)慣也會(huì)隨著時(shí)間的推移而發(fā)生明顯地改變。因此大數(shù)據(jù)場(chǎng)景中不可避免的,一定要考慮概念漂移問(wèn)題。如圖8,樣本的統(tǒng)計(jì)特性在某一時(shí)刻開(kāi)始發(fā)生變化,我們認(rèn)為此時(shí)發(fā)生了“概念漂移”。

    從樣本是否服從相同分布的維度,可以將數(shù)據(jù)流劃分為2類:穩(wěn)定數(shù)據(jù)流,樣本服從同一分布;動(dòng)態(tài)數(shù)據(jù)流,隨著時(shí)間推移,樣本服從不同分布,只有動(dòng)態(tài)數(shù)據(jù)流中才存在“概念漂移”現(xiàn)象。概念漂移又可以分為:突變式和漸變式,對(duì)這兩種漂移的處理方式和難度通常并不相同,在設(shè)計(jì)漂移算法時(shí),應(yīng)該分別進(jìn)行考慮。如圖9所示,在t 0 時(shí)刻之前,數(shù)據(jù)樣本服從同一分布A,而在t 0和t 1之間,數(shù)據(jù)流發(fā)生概念漂移,在t 1時(shí)刻之后,數(shù)據(jù)重新趨于穩(wěn)定,并服從同一分布B。

    當(dāng)概念漂移發(fā)生之后,最直接的結(jié)果就是從之前樣本中學(xué)習(xí)獲得的概念模型,已經(jīng)不再適用,必須盡快更新?,F(xiàn)有概念漂移檢測(cè)的方法,可以分為3類:模型性能監(jiān)測(cè)法、概念聚類法、樣本分布監(jiān)測(cè)法。

    (1)模型性能監(jiān)測(cè)法。以分類挖掘?yàn)槔紫刃枰獙?duì)分類器的性能進(jìn)行跟蹤監(jiān)測(cè),當(dāng)使用新采集的訓(xùn)練集,對(duì)現(xiàn)有分類器進(jìn)行更新之后,如果分類器在測(cè)試集上表現(xiàn)出的性能明顯下降,我們則認(rèn)為發(fā)生了概念漂移。Windmer和Kubat提出的FLORA系列算法[14]、Last提出的OLIN算法[15]等都是屬于這一類。模型性能監(jiān)測(cè)是十分常用的方法,但當(dāng)數(shù)據(jù)流中存在類別不平衡或者進(jìn)行半監(jiān)督學(xué)習(xí)時(shí),此方法將不再適用。

    (2)概念聚類法。Katakis在2010年首次提出這一方法[15],基本思路是將數(shù)據(jù)流劃分為數(shù)據(jù)塊,并且再將其映射為“概念向量”,對(duì)多個(gè)概念向量進(jìn)行聚類,每一個(gè)聚類代表一個(gè)概念。當(dāng)一個(gè)新的數(shù)據(jù)塊到來(lái)時(shí),計(jì)算其對(duì)應(yīng)的概念向量與各個(gè)聚類中心之間的距離,并以此判斷是否發(fā)生了漂移。這一方法可以解決概念漂移領(lǐng)域的一個(gè)重要問(wèn)題:重復(fù)概念的檢測(cè)。概念聚類法局限的地方在于:假設(shè)每次劃分的數(shù)據(jù)塊內(nèi)所有數(shù)據(jù)都屬于同一概念。

    (3)樣本分布監(jiān)測(cè)法。針對(duì)樣本集,提取其中的統(tǒng)計(jì)特性:特征值分布等,以這些參數(shù)的變化來(lái)判斷是否發(fā)生概念漂移。2006-2011年間,Alippi[17-18]、Peter[19]、Kuncheva[20]等人都是基于此原理提出了檢測(cè)概念漂移的具體策略。

    7.3 聚類

    Han Jiawei教授在《Data Mining: Concept and Techniques》中,對(duì)聚類有一個(gè)簡(jiǎn)短的定義:將物理或抽象對(duì)象的集合分成相似的對(duì)象類的過(guò)程稱為聚類。更形式化的一個(gè)描述方法是:聚類分析就是按照某種相似性度量方法對(duì)對(duì)象進(jìn)行分組,使得各組內(nèi)的相似度高,而組間的相似度低。俗語(yǔ)“物以類聚,人以群分”可以說(shuō)是聚類作用的一個(gè)生動(dòng)說(shuō)明。

    聚類挖掘已廣泛用于各種應(yīng)用領(lǐng)域的模式識(shí)別以及離群點(diǎn)檢測(cè)中。市場(chǎng)分析人員可以在沒(méi)有任何先驗(yàn)知識(shí)的情況下,應(yīng)用聚類方法基于購(gòu)買模式數(shù)據(jù)庫(kù)發(fā)現(xiàn)不同的顧客群;網(wǎng)絡(luò)數(shù)據(jù)分析人員針對(duì)web文檔數(shù)據(jù)或網(wǎng)絡(luò)訪問(wèn)日志數(shù)據(jù)對(duì)訪問(wèn)的網(wǎng)頁(yè)進(jìn)行聚類,以發(fā)現(xiàn)對(duì)不同網(wǎng)頁(yè)信息感興趣的人群,來(lái)支持精準(zhǔn)營(yíng)銷或分析社會(huì)學(xué)上原因。應(yīng)用聚類還可以發(fā)現(xiàn)異常點(diǎn),即那些無(wú)法歸入任何簇的點(diǎn),離群點(diǎn)檢測(cè)廣泛應(yīng)用于信用卡欺詐檢測(cè)和監(jiān)控電子商務(wù)中的犯罪活動(dòng)。聚類分析還可以作為研究數(shù)據(jù)分布的功能以及作為其他算法的預(yù)處理步驟。

    從1967年研究人員提出第一種聚類算法開(kāi)始,目前為止已經(jīng)有多種可用的聚類算法。但是沒(méi)有任何一種是普遍適用的,因?yàn)椴煌瑔?wèn)題中數(shù)據(jù)的維度高低不同、各維數(shù)據(jù)特性不同、數(shù)據(jù)分布情況不同、數(shù)據(jù)規(guī)模不同,而隨著大數(shù)據(jù)時(shí)代數(shù)據(jù)流的出現(xiàn),對(duì)聚類算法更提出了內(nèi)存限制、處理時(shí)間限制等挑戰(zhàn)。但這些算法可以按照聚類依據(jù)不同進(jìn)行分類,首先總體分為2大類:基于樣本的聚類、基于變量的聚類。其中,基于樣本的聚類人們研究的比較多,前面的聚類舉例也全部是針對(duì)基于樣本的;基于變量的聚類顧名思義就是對(duì)變量(即維度或?qū)傩裕┻M(jìn)行分組,它和數(shù)據(jù)分析中的因子分析及主成分分析(PCA)比較像;但聚類分析并不會(huì)對(duì)變量進(jìn)行合并,只是用層次式等方法對(duì)變量的遠(yuǎn)近親疏程度進(jìn)行判別。在某些領(lǐng)域,基于變量聚類非常有用,比如傳感器網(wǎng)絡(luò)、社會(huì)網(wǎng)絡(luò)、電力供應(yīng)、股票市場(chǎng)上,比如通過(guò)聚類分析我們可以發(fā)現(xiàn)各支股票之間的關(guān)系,而通過(guò)流數(shù)據(jù)聚類則可以發(fā)現(xiàn)這種關(guān)系的變化的情況。

    基于樣本的聚類是目前為止研究的最多,這些算法又可以分為:基于劃分的聚類、基于層次的聚類、基于網(wǎng)格的聚類、基于密度的聚類、基于模型的聚類。對(duì)流數(shù)據(jù)的聚類也是在這些聚類算法的基礎(chǔ)上發(fā)展而來(lái)的,因此,接下來(lái)簡(jiǎn)要介紹下這幾種聚類算法及其特點(diǎn)。

    7.3.1 基于劃分的聚類

    經(jīng)典的聚類算法k-means就是基于劃分的,這種算法之所以應(yīng)用廣泛是因?yàn)槠浜?jiǎn)單快速。但該算法需要人為設(shè)定一個(gè)代表聚類個(gè)數(shù)的參變量k,如何正確設(shè)置這個(gè)值是個(gè)難題。另外,k-means算法的理論基礎(chǔ)是找到k個(gè)點(diǎn)(所謂中心點(diǎn)centroid)使得相應(yīng)簇中的點(diǎn)到這k個(gè)點(diǎn)的距離平方和最小。由此可見(jiàn),采用這種理論所找到的簇是球形的,而且這種方法對(duì)噪聲和孤立點(diǎn)敏感。而k-中心點(diǎn)法則是克服了這個(gè)問(wèn)題的另一種基于劃分的聚類算法。為了處理大規(guī)模數(shù)據(jù)集,人們?cè)谶@些算法基礎(chǔ)上進(jìn)行了改進(jìn),提出一些新的算法如最大期望算法(EM)、基于隨機(jī)選擇的聚類算法(CLARANS)等。

    對(duì)數(shù)據(jù)流聚類時(shí),因?yàn)榱鲾?shù)據(jù)不斷到達(dá),所以無(wú)法在數(shù)據(jù)完全到達(dá)后進(jìn)行聚類,部分?jǐn)?shù)據(jù)上的聚類結(jié)果也很可能不再適用后面到達(dá)的數(shù)據(jù),因此必須進(jìn)行增量式聚類。而且,為了及時(shí)對(duì)后面很快到達(dá)的數(shù)據(jù)進(jìn)行處理,每次的聚類操作必須在指定時(shí)間內(nèi)完成,同時(shí)內(nèi)存也要不斷騰出來(lái)配合下一次聚類操作。當(dāng)然,聚類結(jié)果可能達(dá)不到理論上的完美效果,但是要有盡可能好的效果,最好這個(gè)結(jié)果和理想結(jié)果差多少有一個(gè)理論上的范圍。這些問(wèn)題其實(shí)是所有流數(shù)據(jù)挖掘和靜態(tài)數(shù)據(jù)的區(qū)別所在:要在有限內(nèi)存有限時(shí)間內(nèi)給出一個(gè)準(zhǔn)確性有一定保證的挖掘結(jié)果,

    Farnstrom等人提出的一趟k-mean算法是適應(yīng)流數(shù)據(jù)挖掘的k-means算法,它只對(duì)數(shù)據(jù)進(jìn)行一趟掃描,當(dāng)然歷史結(jié)果的保存需要采用一種叫做聚類特征的概要數(shù)據(jù)。Domingos和Hulten在此基礎(chǔ)上提出的快速K均值算法(VFKM)則對(duì)每次增量聚類時(shí)需要的樣本個(gè)數(shù)給出了理論上計(jì)算方法,其采用的理論基礎(chǔ)是Hoeffding不等式,這個(gè)不等式和契比雪夫不等式性質(zhì)類似,都是對(duì)于一個(gè)分布特性未知的隨機(jī)變量,已知很少量的統(tǒng)計(jì)參數(shù),可以在任意置信度之下計(jì)算出相應(yīng)的置信區(qū)間。而Guha等人則提出了數(shù)據(jù)流聚類的k-中心點(diǎn)算法,并給出所需的樣本個(gè)數(shù)及所需時(shí)間和空間的理論計(jì)算結(jié)果。

    7.3.2 基于層次的聚類

    層次聚類也是一種常用聚類方法。它不再是只給出k個(gè)聚類而成的簇,而是給出多層的樹(shù)狀聚類結(jié)果。層次聚類又可分為凝聚和分裂兩類,分別采用自底向上和自頂向下兩種方法。BIRCH算法則綜合了這兩種方法。

    Aggarwal、J. Han等人提出的CluStream算法則是BIRCH算法在數(shù)據(jù)流挖掘上的擴(kuò)展。該算法的特征之一是:提出了傾斜時(shí)間窗口的概念,依據(jù)較近的數(shù)據(jù)比歷史數(shù)據(jù)更重要的理念,最近的時(shí)間變化以較細(xì)的時(shí)間粒度刻畫(huà),而離現(xiàn)在較遠(yuǎn)的數(shù)據(jù)則采用較粗的時(shí)間粒度。該算法的另一個(gè)重要特點(diǎn)是,整個(gè)流聚類分為在線和離線兩部分。在線部分增量式進(jìn)行數(shù)據(jù)處理,獲得摘要信息微簇(micro-cluster),離線部分宏簇(macro-cluster)通過(guò)對(duì)在線部分的結(jié)果進(jìn)行再處理獲得層次的聚類結(jié)果。

    7.3.3 基于網(wǎng)格和密度的聚類

    基于密度的聚類不再按之前兩種聚類采用的距離的遠(yuǎn)近作為分劃的依據(jù),而是按照單位空間范圍內(nèi)點(diǎn)的個(gè)數(shù)即密度來(lái)劃分空間,只要某一范圍內(nèi)密度大于某一指定參變量,則認(rèn)為是同一簇?;诿芏鹊木垲愃惴ǎ―BSCAN)、通過(guò)對(duì)象排序識(shí)別聚類結(jié)構(gòu)算法(OPTICS)等是經(jīng)典基于密度聚類算法。

    基于網(wǎng)格的聚類是面向時(shí)空相關(guān)問(wèn)題。它采用一個(gè)多分辨率的網(wǎng)格數(shù)據(jù)結(jié)構(gòu),這些網(wǎng)格把空間量化為有限數(shù)目的單元,所有聚類操作都在這些網(wǎng)格上進(jìn)行。這些方法的主要優(yōu)點(diǎn)是處理速度快,挈獨(dú)立于數(shù)據(jù)對(duì)象數(shù)目,只與每一維上的單元數(shù)目相關(guān)。經(jīng)典算法是信息網(wǎng)格算法(STING)、WaveCluster,而Quest上聚類(CLIQUE)則綜合了密度和網(wǎng)格兩種方法。

    在流數(shù)據(jù)聚類中,分形聚類則是一種基于網(wǎng)格的聚類,它將具有相同分形維的具有高自相似性的點(diǎn)分為一類。

    7.3.4 基于模型的聚類

    基于模型的聚類其實(shí)是把回歸擬合應(yīng)用在聚類中,它為每一簇?cái)M合一個(gè)模型,根據(jù)擬合模型的方法不同又分為統(tǒng)計(jì)學(xué)方法和神經(jīng)網(wǎng)絡(luò)方法,屬于前者的有簡(jiǎn)單增量概念聚類算法(COBWEB)方法,屬于后者的有學(xué)習(xí)矢量量化網(wǎng)絡(luò)(LVQM)、自組織映射(SOM)等方法。

    7.4 數(shù)據(jù)挖掘中的分類

    數(shù)據(jù)挖掘中的分類指的是:首先根據(jù)已知類別的一些樣本進(jìn)行學(xué)習(xí),得到一個(gè)分類的規(guī)則或者說(shuō)是模型,然后利用學(xué)習(xí)得到的模型對(duì)另外一些類別未知其他屬性值已知的樣本進(jìn)行類別的判斷或者預(yù)測(cè)??梢钥闯觯诸惡途垲惖牟煌幵谟冢悍诸悓W(xué)習(xí)時(shí),樣本類別時(shí)已知的;而聚類學(xué)習(xí)時(shí),樣本類別甚至類別數(shù)目是未知的。因此前者是有監(jiān)督的學(xué)習(xí),后者則是一種無(wú)監(jiān)督的學(xué)習(xí)。分類學(xué)習(xí)的一個(gè)經(jīng)典的例子是對(duì)銀行現(xiàn)有的顧客信用信息進(jìn)行學(xué)習(xí),建立信用良好或欺詐客戶的判斷模型,當(dāng)一個(gè)新的顧客申請(qǐng)銀行借貸時(shí),利用學(xué)習(xí)模型進(jìn)行判斷,給出新客戶良好或是欺詐客戶的可能性,從而提高銀行業(yè)務(wù)決策的科學(xué)性。

    典型的分類方法有很多,主要包括基于決策樹(shù)(DT)的分類、基于貝頁(yè)斯(Beyesian)分類、基于神經(jīng)網(wǎng)絡(luò)的分類等。決策樹(shù)分類是基于信息論中的信息熵的概念,學(xué)習(xí)結(jié)果是一個(gè)由各個(gè)屬性及其取值形成的代表判斷流程的樹(shù)狀結(jié)構(gòu),稱為決策樹(shù)。典型的算法包括ID3、C4.5等。適用于大規(guī)模數(shù)據(jù)集決策樹(shù)構(gòu)造的算法則有Quest上的有監(jiān)督學(xué)習(xí)(SLIQ)和可伸縮并行決策樹(shù)(SPRINT)等。貝葉斯分類算法基于統(tǒng)計(jì)學(xué)中的貝頁(yè)斯后驗(yàn)概率定理,并應(yīng)用各屬性間類條件獨(dú)立的樸素假定,方法簡(jiǎn)單,可伸縮性好,很多實(shí)驗(yàn)表明其分類效果與復(fù)雜的決策樹(shù)和神經(jīng)網(wǎng)絡(luò)相媲美。

    傳統(tǒng)的分類方法多是非增量式的,即當(dāng)全部訓(xùn)練樣本準(zhǔn)備好之后,對(duì)樣本集進(jìn)行多次掃描,獲得一個(gè)分類器,例如工業(yè)界廣泛應(yīng)用的分類算法C4.5和CART;而數(shù)據(jù)流場(chǎng)景下,由于數(shù)據(jù)源源不斷地到來(lái)并且數(shù)據(jù)量巨大,完全將數(shù)據(jù)存儲(chǔ)下來(lái)再進(jìn)行處理,是無(wú)法實(shí)現(xiàn)的,這就要求分類算法必須是增量式的,即訓(xùn)練樣本集不能一次性全部獲取的情況下,先利用已經(jīng)獲得的樣本集來(lái)建立分類器,再用新到達(dá)的樣本來(lái)修正分類器。

    快速?zèng)Q策樹(shù)算法(VFDT)是由Domingos、Hulten等人在2000年提出的[21],主要用于解決穩(wěn)定數(shù)據(jù)流的分類問(wèn)題,性能漸進(jìn)逼近傳統(tǒng)的C4.5算法,其基本思路為:利用Hoeffding不等式來(lái)保證選取的分裂屬性的可信程度,并且不斷地將葉子節(jié)點(diǎn)替換為中間節(jié)點(diǎn)(決策節(jié)點(diǎn)),最終生成一棵決策樹(shù)。其中每個(gè)葉節(jié)點(diǎn)都保存著樣本屬性值的統(tǒng)計(jì)信息,這些信息將用于選取分裂屬性。當(dāng)一個(gè)新樣本到來(lái)后,它將沿著決策樹(shù)從根節(jié)點(diǎn)向葉節(jié)點(diǎn)去遍歷,它在樹(shù)的每個(gè)中間節(jié)點(diǎn)都進(jìn)行屬性值判斷,并進(jìn)入不同的分支,最終到達(dá)葉節(jié)點(diǎn),并更新葉節(jié)點(diǎn)上的統(tǒng)計(jì)信息。每隔一段時(shí)間重新評(píng)估每個(gè)葉節(jié)點(diǎn),選取滿足Hoeffding不等式的屬性,進(jìn)行分裂。

    現(xiàn)在通過(guò)一個(gè)簡(jiǎn)單的實(shí)例,來(lái)說(shuō)明VFDT算法的基本過(guò)程。如圖10所示,假設(shè)從t 0時(shí)刻開(kāi)始進(jìn)行挖掘,樣本源源不斷地到來(lái),此時(shí)節(jié)點(diǎn)1是葉節(jié)點(diǎn)(根節(jié)點(diǎn)),樣本到達(dá)節(jié)點(diǎn)1之后,更新其中的屬性值統(tǒng)計(jì)信息,并判斷是否有屬性滿足Hoeffding不等式;假設(shè)在t 1時(shí)刻,一個(gè)樣本到達(dá)后,節(jié)點(diǎn)1內(nèi)某一屬性滿足Hoeffding不等式,則按照此屬性進(jìn)行分裂,產(chǎn)生節(jié)點(diǎn)2和節(jié)點(diǎn)3,節(jié)點(diǎn)1由葉節(jié)點(diǎn)變?yōu)橹虚g節(jié)點(diǎn);此時(shí),t 0到t 1之間所有到達(dá)樣本的統(tǒng)計(jì)信息,都被舍棄;從t 1時(shí)刻起,所有新到達(dá)的樣本數(shù)據(jù),根據(jù)節(jié)點(diǎn)1中的屬性分裂條件,到葉節(jié)點(diǎn)(達(dá)節(jié)點(diǎn)2或者節(jié)點(diǎn)3),并更新葉節(jié)點(diǎn)中的統(tǒng)計(jì)數(shù)據(jù),同時(shí)判斷是否有屬性滿足Hoeffding不等式,若有則繼續(xù)進(jìn)行分裂生長(zhǎng)。從上述過(guò)程可以看出,決策樹(shù)每次進(jìn)行生長(zhǎng)時(shí),都會(huì)單獨(dú)占用并消耗一部分?jǐn)?shù)據(jù):節(jié)點(diǎn)1分裂時(shí),消耗了t 0到t 1之間所有到達(dá)節(jié)點(diǎn)1的樣本,這些樣本將不再對(duì)此后決策樹(shù)的生長(zhǎng)產(chǎn)生任何影響;當(dāng)節(jié)點(diǎn)2分裂時(shí),消耗了t 1到t 2之間所有到達(dá)節(jié)點(diǎn)2的樣本,這些樣本將不再對(duì)此后決策樹(shù)的生長(zhǎng)產(chǎn)生任何影響。

    基于VFDT算法,Hulten、Domingos等人于2001年提出可以解決概念漂移問(wèn)題的概念自適應(yīng)快速?zèng)Q策樹(shù)算法(CVFDT)。此后近十多年時(shí)間里,針對(duì)VFDT算法拓展和應(yīng)用的層出不窮,CVFDT算法都取得了不錯(cuò)的性能測(cè)試效果。然而在2012年Rutkowsk等人在TKDE上發(fā)表一篇文章指出,VFDT算法中使用的Hoeffding界不符合數(shù)據(jù)流的應(yīng)用場(chǎng)景,應(yīng)該改為McDiarmid’s界[22]。這一點(diǎn)感興趣的讀者可以自己查閱,但不可否認(rèn)的是在各式各樣的測(cè)試數(shù)據(jù)集上,VFDT確實(shí)顯示出令人滿意的測(cè)試性能。

    此外,數(shù)據(jù)流中經(jīng)典的分類算法還有:基于模糊信息網(wǎng)絡(luò)的2002年Last提出的OLIN算法等。特別要說(shuō)明的是,近幾年在數(shù)據(jù)流分類挖掘中,基于單分類器的集合分類器方法得到了較廣泛的研究和應(yīng)用。

    7.5 頻繁模式挖掘

    7.5.1 關(guān)聯(lián)規(guī)則挖掘算法

    關(guān)聯(lián)規(guī)則挖掘算法的基本概念包括兩個(gè)方面的內(nèi)容:項(xiàng)以及項(xiàng)集,其中項(xiàng)是基本單元,用來(lái)表示實(shí)際環(huán)境中的單個(gè)具體事物,例如在超市購(gòu)買的物品;項(xiàng)集是由一個(gè)或者多個(gè)項(xiàng)組成的集合,表示的是具體的一次事務(wù),例如顧客的一次購(gòu)買行為,在項(xiàng)集內(nèi)部,項(xiàng)與項(xiàng)之間不存在次序關(guān)系。而所謂的關(guān)聯(lián)規(guī)則是形如X ->Y的蘊(yùn)涵表達(dá)式,其中X和Y是不相交的項(xiàng)集,即X∩Y = ?。通常的關(guān)聯(lián)規(guī)則算法主要分為兩個(gè)步驟:

    (1)產(chǎn)生頻繁項(xiàng)集。其目標(biāo)是發(fā)現(xiàn)滿足最小支持度閾值的所有項(xiàng)集,并將這些項(xiàng)集稱為頻繁項(xiàng)集。

    (2)產(chǎn)生關(guān)聯(lián)規(guī)則。分解頻繁項(xiàng)集,獲取滿足最小置信度的規(guī)則集,并將這些規(guī)則稱為關(guān)聯(lián)規(guī)則。

    其中,支持度表示給定數(shù)據(jù)集的頻繁程度,而置信度是指在包含的事務(wù)中出現(xiàn)的頻繁程度。

    關(guān)聯(lián)規(guī)則算法是由R.Agrawal首次提出的,稱為Apriori算法。它采用“支持度—置信度”的框架產(chǎn)生關(guān)聯(lián)規(guī)則集,其影響深遠(yuǎn),后續(xù)許多算法都是基于其思想提出的,并統(tǒng)稱為類Apriori算法。該類算法首先是利用k—頻繁項(xiàng)集,計(jì)算得到對(duì)應(yīng)的(k +1)-候選項(xiàng)集;其次利用先驗(yàn)定理(頻繁項(xiàng)集的子集一定是頻繁項(xiàng)集)裁剪非頻繁項(xiàng)集;最后使用支持度裁剪機(jī)制獲?。╧ +1)-頻繁項(xiàng)集。之后重復(fù)上述迭代過(guò)程,直到無(wú)法產(chǎn)生新的頻繁候選項(xiàng)集為止。其算法的缺點(diǎn)是產(chǎn)生過(guò)多的候選項(xiàng)集,并且多次掃描數(shù)據(jù)庫(kù)。

    另一個(gè)有影響深遠(yuǎn)的算法是FP-growth算法,針對(duì)Apriori算法多次掃描數(shù)據(jù)庫(kù)的缺點(diǎn),F(xiàn)P-growth算法設(shè)計(jì)了一種FP-Tree的數(shù)據(jù)結(jié)構(gòu)體,通過(guò)讀取一次數(shù)據(jù)庫(kù)將其所有的數(shù)據(jù)壓縮到一棵FP-Tree上,并通過(guò)循環(huán)產(chǎn)生前綴序列的FP-Tree,獲取對(duì)應(yīng)的頻繁項(xiàng)集。該算法的優(yōu)點(diǎn)在于利用FP-Tree結(jié)構(gòu)壓縮原始數(shù)據(jù)集,縮小搜索范圍,快速產(chǎn)生頻繁項(xiàng)集。

    通過(guò)多年的發(fā)展,目前關(guān)聯(lián)規(guī)則算法已經(jīng)定義了許多新類型的模式,如模糊關(guān)聯(lián)規(guī)則、稀有關(guān)聯(lián)規(guī)則、基于權(quán)重的關(guān)聯(lián)規(guī)則等。由于關(guān)聯(lián)規(guī)則算法的日趨成熟,其相應(yīng)的研究熱點(diǎn)已經(jīng)從如何產(chǎn)生關(guān)聯(lián)規(guī)則逐漸轉(zhuǎn)變?yōu)槿绾萎a(chǎn)生有效的關(guān)聯(lián)規(guī)則,例如目前有效規(guī)則的一個(gè)研究熱點(diǎn)是如何挖掘高“效用”的關(guān)聯(lián)規(guī)則[23]。

    7.5.2 頻繁序列模式挖掘算法

    頻繁序列模式挖掘算法是由Agrawal和Srikant首次提出的,并且隨著其被廣泛應(yīng)用在分析用戶的購(gòu)物習(xí)慣、異常行為檢測(cè)以及網(wǎng)絡(luò)入侵檢測(cè)等應(yīng)用場(chǎng)景中,序列模式挖掘算法的研究取得了迅猛發(fā)展。從宏觀上講,序列模式的組成包括3方面的內(nèi)容:序列、事件(事務(wù)或者項(xiàng)集)以及項(xiàng),它們?nèi)咧g的關(guān)系是序列是由一個(gè)或者多個(gè)事件組成的,而事件是由一個(gè)或者多個(gè)項(xiàng)組成的;在組成序列的事件中,事件與事件之間存在著先后時(shí)間關(guān)系,而在組成事件的項(xiàng)中,項(xiàng)與項(xiàng)之間不存在先后時(shí)間關(guān)系。

    頻繁序列模式依據(jù)產(chǎn)生序列模式的方法不同可以分為兩種:一種可以被稱為類Apriori算法,其基于“候選-測(cè)試”的思想,利用前一步產(chǎn)生的k -頻繁序列模式,產(chǎn)生(k +1)-頻繁序列模式候選集,并利用支持度測(cè)試的裁剪機(jī)制,從而獲取最終的(k +1)-頻繁序列模式集。其具有代表性的算法包括:AprioriAll以及SPADE[24]算法,其中圖11展現(xiàn)了使用SPADE算法產(chǎn)生新的候選序列的過(guò)程。

    如圖11所示,SPADE算法使用樹(shù)形結(jié)構(gòu),利用上層的2-頻繁序列模式a1-b1以及a1-d1產(chǎn)生3-頻繁序列模式a1-b1-d1。類Apriori算法的優(yōu)點(diǎn)是可以挖掘出在限制條件下所有的頻繁序列模式集,其缺點(diǎn)是有些類Apriori算法會(huì)在產(chǎn)生頻繁序列模式集的時(shí)候,多次掃描數(shù)據(jù)庫(kù),增加算法的I/O操作;其次在產(chǎn)生頻繁序列模式的時(shí)候,會(huì)產(chǎn)生大量的無(wú)用候選序列,增加算法的計(jì)算時(shí)間,降低算法的挖掘效率。

    另一類算法是采用“投影”技術(shù),依據(jù)不同的前綴序列對(duì)原始數(shù)據(jù)集進(jìn)行劃分,并通過(guò)不斷更新前綴序列以及劃分?jǐn)?shù)據(jù)集的操作,最終獲取完整的頻繁序列模式集,其具有代表性的算法是PrefixSpan[25]。圖12顯示了利用“投影”技術(shù),獲取的原始數(shù)據(jù)集中所有1-前綴序列所對(duì)應(yīng)的投影數(shù)據(jù)庫(kù):

    在圖12中顯示了利用“投影”技術(shù),獲取原始數(shù)據(jù)集對(duì)應(yīng)的所有1-前綴序列的投影數(shù)據(jù)庫(kù)。其算法的優(yōu)點(diǎn)在于利用“投影”技術(shù)可以將原始數(shù)據(jù)集的規(guī)模不斷縮小,以縮小算法的搜索范圍,同時(shí)由于各個(gè)前綴的投影數(shù)據(jù)庫(kù)是相互獨(dú)立的,所以可以并行地挖掘?qū)?yīng)的各個(gè)投影數(shù)據(jù)庫(kù),提高算法的挖掘效率;該算法的缺點(diǎn)是如果前綴序列在原始序列集中分布均勻,即對(duì)應(yīng)的投影數(shù)據(jù)庫(kù)變小趨勢(shì)緩慢,則無(wú)法縮小算法的搜索空間。根據(jù)算法挖掘結(jié)果的不同,可以將序列模式算法分為:全集頻繁序列模式挖掘算法、閉合頻繁序列模式挖掘算法以及最長(zhǎng)頻繁序列模式挖掘算法等。

    7.5.3 基于數(shù)據(jù)流的頻繁序列模式

    挖掘算法

    由于數(shù)據(jù)流具有無(wú)限性以及動(dòng)態(tài)性的特點(diǎn),因此傳統(tǒng)的頻繁序列模式挖掘算法已經(jīng)無(wú)法適用于數(shù)據(jù)流對(duì)象,如何在數(shù)據(jù)流中獲取頻繁序列模式已經(jīng)成為了序列模式挖掘算法中的一個(gè)研究熱點(diǎn),由于其尚處在一個(gè)發(fā)展階段,大部分的算法還是在原有的數(shù)據(jù)流基本算法的基礎(chǔ)上,結(jié)合序列模式挖掘算法設(shè)計(jì)完成的。根據(jù)使用不同基本算法,數(shù)據(jù)流挖掘算法大致可以分為3類,第1類是利用給定的界限值,挖掘近似的頻繁序列模式集;第2類是設(shè)計(jì)一種新的滑動(dòng)時(shí)間窗口,基于批處理的思想,挖掘頻繁序列模式集;第3類是設(shè)計(jì)一種新的數(shù)據(jù)結(jié)構(gòu),例如FP-Growth中的FP-Tree結(jié)構(gòu)體,保存對(duì)應(yīng)的壓縮信息,結(jié)合滑動(dòng)時(shí)間窗口,挖掘頻繁序列模式集。根據(jù)數(shù)據(jù)流動(dòng)態(tài)變化的性質(zhì),又可以將數(shù)據(jù)流挖掘算法分為兩類,一類是針對(duì)分布固定不變的數(shù)據(jù)流對(duì)象,挖掘近似完備的頻繁序列模式集,另一類是針對(duì)動(dòng)態(tài)分布變化的數(shù)據(jù)流對(duì)象,檢測(cè)數(shù)據(jù)流中出現(xiàn)的“概念漂移”的現(xiàn)象,解決模型失效的問(wèn)題。

    8 結(jié)束語(yǔ)

    物聯(lián)網(wǎng)興起,互聯(lián)網(wǎng)高速發(fā)展,各種信息普遍數(shù)字化,PB級(jí)數(shù)據(jù)廣泛出現(xiàn),云計(jì)算和云存儲(chǔ)技術(shù)都正在改變?nèi)藗兪褂糜?jì)算機(jī)使用信息服務(wù)的方式,企業(yè)依托海量數(shù)據(jù)學(xué)習(xí)來(lái)解決以往無(wú)法解決問(wèn)題,互聯(lián)網(wǎng)企業(yè)則利用數(shù)據(jù)挖掘技術(shù)獲得高額利潤(rùn)和社會(huì)影響力,這些都意味著大數(shù)據(jù)時(shí)代的來(lái)臨。大數(shù)據(jù)的獲取和應(yīng)用對(duì)企業(yè)來(lái)講,意味著經(jīng)濟(jì)效益,Google、Yahoo、阿里巴巴等是大數(shù)據(jù)應(yīng)用獲益的典型代表;對(duì)科技界來(lái)講,意味著新的科學(xué)研究方法甚至是新的科研范式;而大數(shù)據(jù)對(duì)政府而言則是與人力資源、自然資源一樣重要的國(guó)家戰(zhàn)略資源。但是,在大數(shù)據(jù)的研究和應(yīng)用中,存在著很多問(wèn)題和挑戰(zhàn),包括:(1)傳統(tǒng)關(guān)系數(shù)據(jù)模型無(wú)法高效處理非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),以MapReduce和Hadoop為代表的非關(guān)系數(shù)據(jù)分析技術(shù)在應(yīng)用性能等方面仍存在很多問(wèn)題,尚沒(méi)有一個(gè)像當(dāng)年Codd所提出的關(guān)系數(shù)據(jù)庫(kù)那樣的理論來(lái)統(tǒng)一解決非結(jié)構(gòu)化處理問(wèn)題。(2)適合不同行業(yè)的大數(shù)據(jù)挖掘分析工具和開(kāi)發(fā)環(huán)境。不同行業(yè)需要不同的大數(shù)據(jù)分析工具,當(dāng)前跨領(lǐng)域跨行業(yè)數(shù)據(jù)共享仍存在很多壁壘。(3)數(shù)據(jù)隱私保護(hù)。大數(shù)據(jù)以數(shù)據(jù)的共享為基礎(chǔ),但如何同時(shí)保護(hù)用戶的隱私則是需要解決的問(wèn)題。相信隨著大數(shù)據(jù)技術(shù)問(wèn)題逐步解決,大數(shù)據(jù)應(yīng)用必將給我們社會(huì)和生活帶來(lái)更多的正能量。

    參考文獻(xiàn)

    [12] MAYER-SCHONBERGER V, CUKIER K.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].盛楊燕,周濤, 譯. 杭州:浙江人民出版社, 2012.

    [13] Schlimmer J C,Granger R H Jr. Incremental Learning from Noisy Data[J].Machine Learning,1986,1(3):317-354.

    [14] Gerhard W,Kubat M. Effective Learning in Dynamic Environments by Explicit Context Tracking[C]//Proceedings of the European Conference on Machine Learning (ECM’93),Apr 5-7,1993,Vienna, Austria. Berlin,Germany: Springer, 1993.

    [15] Last M. Online Classification of Nonstationary Data Streams[J].Intelligent Data Analysis, 2002,6(2):129-147.

    [16] Katakis I, Tsoumakas G, VLAHAVAS L. Tracking Recurring Contexts Using Ensemble Classifiers: An Application to Email Filtering[J].Knowledge and Information Systems,2010, 22(3): 371-391.

    [17] Alippi C, Roveri M. Just-in-time Adaptive Classifiers—Part II: Designing the Classifier[J]. IEEE Transactions on Neural Networks,2008,19(12):2053-2064.

    [18] Alippi C, Boracchi G, Roveri M. An Effective Just-in-Time Adaptive Classifier for Gradual Concept Drifts[C]// Proceedings of the IEEE International Joint Conference on Neural Networks (IJCNN’11),Jun 31-Aug 5, 2011, San Jose,CA,USA . Piscataway, NJ, USA: IEEE, 2011:1675 - 1682 .

    [19] Vorburger P, Bernstein A. Entropy-Based Concept Shift Detection[C]// Proceedings of the 6th IEEE International Conference on Data Mining (ICDM’06), Dec 18-22,2007, Hong Kong,China . Los Alamitos, CA, USA: IEEE Computer Society,2006:1113 - 1118.

    [20] Kuncheva L I. Change Detection in Streaming Multivariate Data Using Likelihood Detectors[J]. IEEE Transactions on Knowledge and Data Engineering, 2013,25(5):1175 - 1180 .

    [21] Domingos P, Hulten G. Mining High-Speed Data Streams[C]//Proceedings of the 6th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD’00), Aug 20-23, 2000, Boston, MA, USA . New York, NY, USA: ACM, 2000:71-80.

    [22] Rutkowski L, Pietruczuk L,DUDA P. et al. Decision Trees for Mining Data Streams Based on the McDiarmid's Bound[J].IEEE Transactions on Kowledge and Data Engineering, To be published.

    [23] Tseng V S, WU C W, Shie B E,et al. UPGrowth: An Efficient Algorithm for High Utility Itemset Mining[C]//Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD’10), Jul 25-28, 2010, Washington, DC, USA. New York, NY, USA: ACM, 2010:253-262.

    [24] Zaki M J. SPADE: An Efficient Algorithm for Mining Frequent Sequences[J].Machine Learning,2001,42(1/2):31-60.

    [25] Pei J, Han J W, MORTAZAVI-ASL B, et al. PrefixSpan: Mining Sequential Patterns Efficiently by Prefix-Projected Pattern Growth[C]//Proceedings of the 17th International Conference on Data Engineering (ICDE’01), Apr 2-6,2001,Heidelberg, Germany. Piscataway, NJ, USA: IEEE, 2001:215-224.

    美女高潮到喷水免费观看| 精品熟女少妇八av免费久了| 日本a在线网址| 亚洲一卡2卡3卡4卡5卡精品中文| 脱女人内裤的视频| 中文字幕制服av| 国产精品免费一区二区三区在线 | 老汉色av国产亚洲站长工具| 99riav亚洲国产免费| 午夜激情久久久久久久| 色老头精品视频在线观看| 男人舔女人的私密视频| 久久精品人人爽人人爽视色| 免费观看a级毛片全部| 两个人看的免费小视频| 亚洲熟女毛片儿| 人妻 亚洲 视频| 国产有黄有色有爽视频| 一本色道久久久久久精品综合| 午夜福利视频精品| 国产欧美日韩一区二区三区在线| 高清视频免费观看一区二区| 免费人妻精品一区二区三区视频| 精品一区二区三区av网在线观看 | 免费女性裸体啪啪无遮挡网站| 亚洲国产av新网站| 久久精品亚洲精品国产色婷小说| 搡老岳熟女国产| 少妇裸体淫交视频免费看高清 | 国产有黄有色有爽视频| 大片电影免费在线观看免费| 久久国产精品影院| 另类亚洲欧美激情| 69av精品久久久久久 | 蜜桃在线观看..| 亚洲国产欧美一区二区综合| svipshipincom国产片| 亚洲va日本ⅴa欧美va伊人久久| 国产精品影院久久| 少妇裸体淫交视频免费看高清 | 欧美精品人与动牲交sv欧美| 美女扒开内裤让男人捅视频| 日韩一区二区三区影片| 一个人免费看片子| 欧美在线一区亚洲| 搡老乐熟女国产| 午夜日韩欧美国产| 日本欧美视频一区| 国产黄色免费在线视频| 国产高清videossex| a级毛片黄视频| 久久狼人影院| 汤姆久久久久久久影院中文字幕| 日本av手机在线免费观看| 日韩中文字幕欧美一区二区| 捣出白浆h1v1| 亚洲成a人片在线一区二区| 咕卡用的链子| 日韩视频在线欧美| 国产黄色免费在线视频| 久久人妻av系列| 岛国在线观看网站| 中文字幕制服av| 99re在线观看精品视频| 成人免费观看视频高清| 免费在线观看黄色视频的| 啦啦啦中文免费视频观看日本| 久久婷婷成人综合色麻豆| 国产精品二区激情视频| 一区在线观看完整版| 久久99热这里只频精品6学生| 国产一区二区三区视频了| 免费在线观看完整版高清| 在线观看免费日韩欧美大片| 国产精品电影一区二区三区 | 国产三级黄色录像| 日韩一卡2卡3卡4卡2021年| 亚洲成人手机| 亚洲成人免费av在线播放| 中文字幕人妻丝袜制服| 老司机福利观看| 国产精品国产高清国产av | 亚洲精华国产精华精| www.熟女人妻精品国产| 丝袜美足系列| 亚洲专区字幕在线| 色尼玛亚洲综合影院| 国产成人av教育| 美女主播在线视频| 日本vs欧美在线观看视频| 午夜老司机福利片| 色综合欧美亚洲国产小说| 成人18禁高潮啪啪吃奶动态图| 夜夜骑夜夜射夜夜干| 日本黄色视频三级网站网址 | 国产主播在线观看一区二区| 亚洲人成77777在线视频| 俄罗斯特黄特色一大片| 日本a在线网址| 日韩有码中文字幕| 99精品在免费线老司机午夜| 黑人巨大精品欧美一区二区mp4| 在线观看人妻少妇| 女性生殖器流出的白浆| 十八禁网站网址无遮挡| 国产精品自产拍在线观看55亚洲 | 日本wwww免费看| 日本av手机在线免费观看| 香蕉久久夜色| 老司机靠b影院| tube8黄色片| 久久国产精品大桥未久av| 亚洲av日韩精品久久久久久密| 女警被强在线播放| av一本久久久久| 黄色视频在线播放观看不卡| 少妇精品久久久久久久| 高清视频免费观看一区二区| 亚洲五月婷婷丁香| 亚洲国产中文字幕在线视频| www.精华液| 国产1区2区3区精品| 九色亚洲精品在线播放| 乱人伦中国视频| 一区二区日韩欧美中文字幕| 亚洲视频免费观看视频| 91成年电影在线观看| 日韩三级视频一区二区三区| 日本a在线网址| 亚洲免费av在线视频| 精品国内亚洲2022精品成人 | 久久午夜综合久久蜜桃| 在线观看免费视频日本深夜| 亚洲精品在线观看二区| 考比视频在线观看| 国产成人影院久久av| 免费av中文字幕在线| 国产老妇伦熟女老妇高清| 国产一区有黄有色的免费视频| 美女午夜性视频免费| 国产有黄有色有爽视频| 欧美一级毛片孕妇| 精品少妇内射三级| 日韩中文字幕欧美一区二区| 宅男免费午夜| 国产精品 国内视频| tocl精华| 一本—道久久a久久精品蜜桃钙片| 窝窝影院91人妻| 啦啦啦视频在线资源免费观看| 90打野战视频偷拍视频| 老鸭窝网址在线观看| 中文字幕人妻熟女乱码| 黄色a级毛片大全视频| 精品一区二区三区视频在线观看免费 | 久久精品亚洲精品国产色婷小说| 日韩免费av在线播放| 日韩熟女老妇一区二区性免费视频| 黄色片一级片一级黄色片| 国产高清videossex| 中文亚洲av片在线观看爽 | 99re6热这里在线精品视频| 久久国产精品大桥未久av| 一进一出抽搐动态| 午夜免费鲁丝| 亚洲中文字幕日韩| 国产高清激情床上av| 国内毛片毛片毛片毛片毛片| 亚洲五月婷婷丁香| 久久人人爽av亚洲精品天堂| 成人特级黄色片久久久久久久 | 交换朋友夫妻互换小说| 在线av久久热| 热re99久久国产66热| 国产一区二区三区视频了| 久久久欧美国产精品| 国产有黄有色有爽视频| 日韩一卡2卡3卡4卡2021年| 久久青草综合色| 亚洲精品中文字幕在线视频| 深夜精品福利| 国产精品 国内视频| 久久久久国产一级毛片高清牌| 我的亚洲天堂| 黑人欧美特级aaaaaa片| 精品第一国产精品| 日日摸夜夜添夜夜添小说| 免费日韩欧美在线观看| av线在线观看网站| 国产午夜精品久久久久久| 免费观看av网站的网址| 99国产精品一区二区蜜桃av | 国产欧美日韩综合在线一区二区| av网站在线播放免费| 久久精品国产综合久久久| 成人av一区二区三区在线看| 免费看a级黄色片| 亚洲视频免费观看视频| 午夜福利在线免费观看网站| 欧美亚洲 丝袜 人妻 在线| 午夜激情久久久久久久| 女人爽到高潮嗷嗷叫在线视频| 国产精品免费视频内射| av天堂在线播放| 国产一区二区三区综合在线观看| 亚洲国产欧美一区二区综合| 精品国产一区二区久久| 久久久精品94久久精品| 夜夜骑夜夜射夜夜干| 亚洲国产毛片av蜜桃av| 亚洲国产毛片av蜜桃av| 国产黄频视频在线观看| 777久久人妻少妇嫩草av网站| 国产欧美亚洲国产| 欧美精品av麻豆av| 精品人妻1区二区| 国产成人精品久久二区二区91| 国产区一区二久久| 亚洲精华国产精华精| 久久中文看片网| 一进一出抽搐动态| av网站在线播放免费| 老司机在亚洲福利影院| 精品乱码久久久久久99久播| 欧美人与性动交α欧美精品济南到| 色综合婷婷激情| 久久狼人影院| 丝袜人妻中文字幕| 少妇的丰满在线观看| 欧美国产精品va在线观看不卡| 欧美在线黄色| 久久性视频一级片| 国产成人av激情在线播放| 日本五十路高清| 亚洲一码二码三码区别大吗| 国产精品免费大片| 999久久久精品免费观看国产| 国产亚洲欧美在线一区二区| 少妇的丰满在线观看| 女人爽到高潮嗷嗷叫在线视频| 午夜福利视频在线观看免费| 亚洲av日韩精品久久久久久密| 久久精品亚洲av国产电影网| 男女高潮啪啪啪动态图| 亚洲熟女毛片儿| 人妻一区二区av| 男人操女人黄网站| 亚洲 欧美一区二区三区| 侵犯人妻中文字幕一二三四区| 美女午夜性视频免费| 中国美女看黄片| 久久久久国产一级毛片高清牌| a级毛片在线看网站| 丝袜人妻中文字幕| 国产aⅴ精品一区二区三区波| 侵犯人妻中文字幕一二三四区| 久久精品国产亚洲av香蕉五月 | 久久天堂一区二区三区四区| a在线观看视频网站| 正在播放国产对白刺激| 亚洲精品成人av观看孕妇| 一本一本久久a久久精品综合妖精| 亚洲成国产人片在线观看| 久久婷婷成人综合色麻豆| 中文字幕另类日韩欧美亚洲嫩草| 成人精品一区二区免费| 99在线人妻在线中文字幕 | 国产精品一区二区精品视频观看| 狠狠狠狠99中文字幕| 高潮久久久久久久久久久不卡| 天天躁夜夜躁狠狠躁躁| 国产精品.久久久| 精品午夜福利视频在线观看一区 | 丁香欧美五月| 国产成人精品无人区| 2018国产大陆天天弄谢| 成年版毛片免费区| 99re在线观看精品视频| 欧美精品一区二区大全| 777米奇影视久久| a级毛片黄视频| 男女午夜视频在线观看| 性高湖久久久久久久久免费观看| 欧美日韩福利视频一区二区| 国产精品电影一区二区三区 | 12—13女人毛片做爰片一| 国产精品二区激情视频| 亚洲色图 男人天堂 中文字幕| 精品第一国产精品| 蜜桃国产av成人99| 午夜福利免费观看在线| 在线观看免费午夜福利视频| www.精华液| 欧美日韩黄片免| 大陆偷拍与自拍| 操美女的视频在线观看| 亚洲国产欧美在线一区| 又紧又爽又黄一区二区| a级片在线免费高清观看视频| 人成视频在线观看免费观看| 十分钟在线观看高清视频www| 女人爽到高潮嗷嗷叫在线视频| 一区福利在线观看| 男人操女人黄网站| 久久精品亚洲精品国产色婷小说| 亚洲精品成人av观看孕妇| 久久精品国产亚洲av香蕉五月 | 亚洲,欧美精品.| 丝袜人妻中文字幕| 日日夜夜操网爽| 伊人久久大香线蕉亚洲五| 男女免费视频国产| 色综合欧美亚洲国产小说| 久久精品亚洲精品国产色婷小说| a在线观看视频网站| 高清在线国产一区| 国产亚洲av高清不卡| 男女床上黄色一级片免费看| 欧美人与性动交α欧美精品济南到| 美国免费a级毛片| 欧美午夜高清在线| 精品国产一区二区久久| 九色亚洲精品在线播放| 亚洲精品粉嫩美女一区| 中文字幕色久视频| 国产精品免费视频内射| 国产一卡二卡三卡精品| 精品乱码久久久久久99久播| 久久亚洲真实| 久久久久国内视频| 18禁裸乳无遮挡动漫免费视频| 欧美人与性动交α欧美软件| 国产精品麻豆人妻色哟哟久久| 国产一区二区三区在线臀色熟女 | 国产无遮挡羞羞视频在线观看| 欧美老熟妇乱子伦牲交| 久久精品成人免费网站| 国产片内射在线| 亚洲三区欧美一区| 宅男免费午夜| 香蕉国产在线看| av国产精品久久久久影院| 好男人电影高清在线观看| 美女高潮到喷水免费观看| tocl精华| 免费一级毛片在线播放高清视频 | 丝袜喷水一区| 俄罗斯特黄特色一大片| 成人国产av品久久久| 狠狠精品人妻久久久久久综合| 高清视频免费观看一区二区| 两性夫妻黄色片| 久久久久久久久免费视频了| 欧美日韩黄片免| 日韩三级视频一区二区三区| 别揉我奶头~嗯~啊~动态视频| av国产精品久久久久影院| 黑人巨大精品欧美一区二区蜜桃| 免费高清在线观看日韩| 国产精品秋霞免费鲁丝片| 亚洲成人手机| 女人被躁到高潮嗷嗷叫费观| 久久久国产精品麻豆| 女人精品久久久久毛片| 一区二区三区乱码不卡18| 午夜福利视频在线观看免费| 国产成人精品无人区| 色尼玛亚洲综合影院| 亚洲三区欧美一区| 一夜夜www| 精品午夜福利视频在线观看一区 | 午夜视频精品福利| 午夜福利免费观看在线| 极品人妻少妇av视频| 午夜福利影视在线免费观看| 欧美在线黄色| 中亚洲国语对白在线视频| 制服人妻中文乱码| 亚洲精品在线美女| 国产精品.久久久| 国产97色在线日韩免费| 老熟妇乱子伦视频在线观看| 一进一出好大好爽视频| 如日韩欧美国产精品一区二区三区| 亚洲色图综合在线观看| 精品亚洲成国产av| 亚洲av第一区精品v没综合| 亚洲精品国产一区二区精华液| av免费在线观看网站| 国产精品二区激情视频| 女警被强在线播放| 丰满少妇做爰视频| 99re在线观看精品视频| 久久久久国内视频| 久久青草综合色| 精品人妻1区二区| 纵有疾风起免费观看全集完整版| 国产男女内射视频| 麻豆乱淫一区二区| 捣出白浆h1v1| 国产区一区二久久| 午夜激情av网站| 国产精品二区激情视频| 日本wwww免费看| 色婷婷久久久亚洲欧美| 久久久欧美国产精品| 别揉我奶头~嗯~啊~动态视频| 亚洲专区字幕在线| 考比视频在线观看| 操出白浆在线播放| 欧美人与性动交α欧美软件| 国产免费av片在线观看野外av| 亚洲天堂av无毛| 无限看片的www在线观看| 考比视频在线观看| 99香蕉大伊视频| 国产在视频线精品| av欧美777| 久久久国产成人免费| av电影中文网址| 久久毛片免费看一区二区三区| 99热国产这里只有精品6| 久久精品亚洲熟妇少妇任你| 18禁国产床啪视频网站| 18禁黄网站禁片午夜丰满| 欧美激情久久久久久爽电影 | 国产91精品成人一区二区三区 | 午夜两性在线视频| 国产成人精品在线电影| 国产亚洲午夜精品一区二区久久| 久久婷婷成人综合色麻豆| 免费观看av网站的网址| 亚洲情色 制服丝袜| 亚洲欧美色中文字幕在线| 免费人妻精品一区二区三区视频| 9191精品国产免费久久| 国产av一区二区精品久久| 国产精品美女特级片免费视频播放器 | 成年动漫av网址| 成人黄色视频免费在线看| 在线天堂中文资源库| 男女边摸边吃奶| 色播在线永久视频| 午夜福利一区二区在线看| av福利片在线| 成年版毛片免费区| 国产在线免费精品| 国产成人啪精品午夜网站| 久久久久久久大尺度免费视频| 狠狠狠狠99中文字幕| 久久热在线av| 精品人妻1区二区| 黄片大片在线免费观看| 制服人妻中文乱码| 热re99久久精品国产66热6| 欧美日韩成人在线一区二区| av国产精品久久久久影院| 国产又爽黄色视频| 国产熟女午夜一区二区三区| 国产精品熟女久久久久浪| 日本精品一区二区三区蜜桃| 中文字幕色久视频| 美女视频免费永久观看网站| 亚洲国产精品一区二区三区在线| 最近最新中文字幕大全电影3 | 免费女性裸体啪啪无遮挡网站| 欧美大码av| 欧美av亚洲av综合av国产av| 日本av免费视频播放| 成年人午夜在线观看视频| 美女高潮到喷水免费观看| 亚洲欧洲日产国产| 日韩制服丝袜自拍偷拍| 99riav亚洲国产免费| 天天躁日日躁夜夜躁夜夜| 91精品三级在线观看| 一级片'在线观看视频| 欧美+亚洲+日韩+国产| 亚洲精品自拍成人| 一本久久精品| 日本黄色日本黄色录像| 亚洲avbb在线观看| 老熟女久久久| 国产色视频综合| 国产精品久久久久久精品电影小说| 性高湖久久久久久久久免费观看| 国产片内射在线| 国产成人系列免费观看| 欧美日韩一级在线毛片| 国产精品98久久久久久宅男小说| 亚洲九九香蕉| 国产av国产精品国产| 人妻 亚洲 视频| 大码成人一级视频| 国产又色又爽无遮挡免费看| 久久久国产一区二区| 日韩制服丝袜自拍偷拍| 69精品国产乱码久久久| 亚洲全国av大片| 18禁黄网站禁片午夜丰满| 亚洲精品国产区一区二| 最近最新中文字幕大全免费视频| 午夜福利视频精品| 日韩欧美三级三区| 国产精品久久电影中文字幕 | 男男h啪啪无遮挡| 亚洲成av片中文字幕在线观看| 国产亚洲午夜精品一区二区久久| 亚洲美女黄片视频| 精品国产乱码久久久久久小说| 午夜两性在线视频| 1024视频免费在线观看| 欧美激情久久久久久爽电影 | 天堂中文最新版在线下载| 真人做人爱边吃奶动态| 99国产精品免费福利视频| 伦理电影免费视频| 亚洲精品久久成人aⅴ小说| 国产单亲对白刺激| 97在线人人人人妻| 热99re8久久精品国产| 亚洲国产欧美日韩在线播放| 嫁个100分男人电影在线观看| 国产精品99久久99久久久不卡| 久久人妻熟女aⅴ| 大片免费播放器 马上看| 国产欧美亚洲国产| 国产精品一区二区免费欧美| 久久精品aⅴ一区二区三区四区| 少妇的丰满在线观看| 丝瓜视频免费看黄片| 国产国语露脸激情在线看| 老汉色∧v一级毛片| 国产黄频视频在线观看| 9热在线视频观看99| 肉色欧美久久久久久久蜜桃| 亚洲成人手机| 啦啦啦 在线观看视频| 人人澡人人妻人| 午夜福利一区二区在线看| av又黄又爽大尺度在线免费看| 亚洲伊人色综图| 国产精品美女特级片免费视频播放器 | 一区二区日韩欧美中文字幕| 精品久久蜜臀av无| 亚洲av成人不卡在线观看播放网| 久久午夜亚洲精品久久| 黑人巨大精品欧美一区二区mp4| 欧美在线一区亚洲| 国产精品熟女久久久久浪| 亚洲九九香蕉| 亚洲av成人一区二区三| 亚洲精品国产精品久久久不卡| 久久久久久久久免费视频了| 久久天堂一区二区三区四区| 欧美中文综合在线视频| 久久精品熟女亚洲av麻豆精品| 精品久久蜜臀av无| 色在线成人网| 99久久精品国产亚洲精品| 18禁观看日本| 午夜精品久久久久久毛片777| 建设人人有责人人尽责人人享有的| 一级,二级,三级黄色视频| 成年版毛片免费区| 大型av网站在线播放| 欧美国产精品va在线观看不卡| 中文字幕另类日韩欧美亚洲嫩草| 久久精品国产综合久久久| 午夜福利免费观看在线| 色综合婷婷激情| 国产精品.久久久| 日日夜夜操网爽| 亚洲精品国产精品久久久不卡| 日本av手机在线免费观看| 亚洲成av片中文字幕在线观看| 国产高清国产精品国产三级| 国产精品国产av在线观看| 夫妻午夜视频| 久热这里只有精品99| 国产亚洲午夜精品一区二区久久| 久久精品熟女亚洲av麻豆精品| 成人三级做爰电影| 久久精品熟女亚洲av麻豆精品| av线在线观看网站| 国产麻豆69| 国产精品麻豆人妻色哟哟久久| 久久精品国产99精品国产亚洲性色 | 亚洲色图 男人天堂 中文字幕| 久久久精品区二区三区| 久久精品亚洲av国产电影网| 亚洲三区欧美一区| 久久九九热精品免费| 国产精品亚洲一级av第二区| 十八禁人妻一区二区| 亚洲五月色婷婷综合| 18在线观看网站| 亚洲欧美激情在线| 两性夫妻黄色片| 欧美 日韩 精品 国产| 一本色道久久久久久精品综合| 精品一品国产午夜福利视频| 国产精品一区二区在线不卡| 亚洲精品美女久久久久99蜜臀| 天天躁日日躁夜夜躁夜夜| 欧美在线一区亚洲| 精品少妇一区二区三区视频日本电影| 久久精品亚洲av国产电影网| 999久久久国产精品视频| 日本vs欧美在线观看视频| 久久国产精品男人的天堂亚洲| 久久ye,这里只有精品| 另类亚洲欧美激情| 一级毛片精品| 久久精品国产亚洲av高清一级|