• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    大數(shù)據(jù)分類挖掘算法及其概念漂移應(yīng)用研究*

    2016-12-19 01:12:23陸莉莉張永潘談海宇季一木
    計算機與生活 2016年12期
    關(guān)鍵詞:數(shù)據(jù)流決策樹分類器

    陸莉莉,張永潘,談海宇,季一木

    1.南京信息職業(yè)技術(shù)學(xué)院 計算機與軟件學(xué)院,南京 210023

    2.南京郵電大學(xué) 計算機學(xué)院,南京 210023

    大數(shù)據(jù)分類挖掘算法及其概念漂移應(yīng)用研究*

    陸莉莉1+,張永潘2,談海宇2,季一木2

    1.南京信息職業(yè)技術(shù)學(xué)院 計算機與軟件學(xué)院,南京 210023

    2.南京郵電大學(xué) 計算機學(xué)院,南京 210023

    LU Lili,ZHANG Yongpan,TAN Haiyu,et al.Research on classification algorithm and concept drift based on big data.Journal of Frontiers of Computer Science and Technology,2016,10(12):1683-1692.

    隨著大數(shù)據(jù)應(yīng)用研究的不斷深入和分布式機器學(xué)習(xí)中流計算框架的涌現(xiàn),針對數(shù)據(jù)流中概念漂移問題的研究是面向大數(shù)據(jù)挖掘領(lǐng)域的研究熱點之一。現(xiàn)有的針對概念漂移的研究成果主要還是依賴于數(shù)據(jù)結(jié)構(gòu)和算法優(yōu)化,通過計算資源有限的獨立計算機完成概念漂移的檢測。為此,提出一種面向大數(shù)據(jù)的基于Storm的抵抗概念漂移的分類挖掘算法S-CVFDT(Storm-concept very fast decision tree)及系統(tǒng)。該系統(tǒng)采用并行化窗口和S-CVFDT算法,利用并行化窗口機制檢測數(shù)據(jù)流中的突變型概念漂移,從而自適應(yīng)地改變并行窗口大小,并通過S-CVFDT算法不斷更新漸進性概念漂移時的模型。分析與實驗結(jié)果表明,該算法可以快速有效地檢測到突變型概念漂移,降低系統(tǒng)因為突變型概念漂移造成的資源浪費,且模型建立效率、分類精度得到提高。

    大數(shù)據(jù);數(shù)據(jù)挖掘;分類算法;概念漂移

    1 引言

    隨著物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、云計算等技術(shù)不斷融入人們的生活,以及現(xiàn)有的計算能力、存儲空間、網(wǎng)絡(luò)帶寬的高速發(fā)展,人類積累的數(shù)據(jù)在互聯(lián)網(wǎng)、通信、金融、商業(yè)、醫(yī)療等諸多領(lǐng)域不斷地增長和累積[1]?;ヂ?lián)網(wǎng)搜索引擎支持的數(shù)十億次Web搜索每天處理數(shù)萬TB數(shù)據(jù)。全球主干通信網(wǎng)每天傳輸數(shù)萬TB數(shù)據(jù)。大型商場遍及世界各地的數(shù)以千計的門店每周都要處理數(shù)億交易。醫(yī)療行業(yè)每天的醫(yī)療記錄、病人資料和醫(yī)療圖像每天也都產(chǎn)生大量的數(shù)據(jù)。數(shù)據(jù)的爆炸式增長、廣泛可用和巨大數(shù)量使得真正的大數(shù)據(jù)時代到來。對于這些數(shù)據(jù),人們不僅希望能夠從中提取出有價值的信息,更需要發(fā)現(xiàn)對決策提供有效支持的更深層次的規(guī)律。

    大數(shù)據(jù)挖掘的目的就是為了從海量的實時數(shù)據(jù)中挖掘出隱含在其中的用戶感興趣的有價值信息,再將挖掘所得到的信息轉(zhuǎn)化成有組織的知識以模型等方式表示出來,最后將分析模型應(yīng)用到現(xiàn)實生活中,從而提高效率,優(yōu)化方案。大數(shù)據(jù)具有規(guī)模性(volume)、多樣性(variety)、高速性(velocity)和準(zhǔn)確性(veracity)4個特點[2],其前期研究工作主要集中在規(guī)模性和多樣性上展開。目前廣泛存在并應(yīng)用的數(shù)據(jù)是像金融、交通等場景下產(chǎn)生的流式數(shù)據(jù),流式數(shù)據(jù)不同于傳統(tǒng)的靜態(tài)數(shù)據(jù)形態(tài),作為一種新型大數(shù)據(jù)的數(shù)據(jù)形態(tài),更多地體現(xiàn)了大數(shù)據(jù)要求的高速和準(zhǔn)確的特點。流式數(shù)據(jù)需要人們從海量信息中更快地提取有用的信息。因此,基于大數(shù)據(jù)的實時數(shù)據(jù)挖掘研究顯得尤為重要。流式數(shù)據(jù)分為穩(wěn)定數(shù)據(jù)流和動態(tài)數(shù)據(jù)流,穩(wěn)定數(shù)據(jù)流[3]中的數(shù)據(jù)具有穩(wěn)定獨立同分布的特點,而動態(tài)數(shù)據(jù)流是不獨立同分布的,因此會產(chǎn)生概念漂移。

    分類是一種通過提取重要數(shù)據(jù)類模型從而進行數(shù)據(jù)分析的形式。分類挖掘算法作為一種有監(jiān)督學(xué)習(xí)的算法,通過對已知類別的訓(xùn)練集建立模型,從而預(yù)測新的數(shù)據(jù)集的類別,分類方法包括貝葉斯網(wǎng)絡(luò)、決策樹歸納、神經(jīng)網(wǎng)絡(luò)等。分類挖掘算法廣泛應(yīng)用在傳感器網(wǎng)絡(luò)、網(wǎng)絡(luò)入侵檢測、電話呼叫日志、銀行風(fēng)險評估等場景中。這些場景下的數(shù)據(jù)往往隨著時間不斷產(chǎn)生,而且數(shù)據(jù)量大,數(shù)據(jù)模型可能發(fā)生變化[2]。如大型商場中顧客的購物傾向會隨著時間發(fā)生變化,網(wǎng)絡(luò)安全中對入侵檢測也隨著用戶不同而變化,工業(yè)生產(chǎn)中有問題的產(chǎn)品往往是相近的問題,然而共性的問題特征也是不斷變化的。社交網(wǎng)絡(luò)中用戶行為將隨著位置信息發(fā)生改變。

    流式數(shù)據(jù)有數(shù)據(jù)量大,數(shù)據(jù)不斷產(chǎn)生,并且可能發(fā)生概念漂移3個特點。因此基于大數(shù)據(jù)的分類挖掘算法不僅需要對發(fā)生概念漂移的數(shù)據(jù)具有很高的靈敏度,并且需要對最新的數(shù)據(jù)盡早做出判斷,從而對模型進行自適應(yīng)的調(diào)整。概念漂移是數(shù)據(jù)挖掘中一個需要重點研究的問題。目前的數(shù)據(jù)挖掘算法大多數(shù)都是針對靜態(tài)數(shù)據(jù)的,因此本質(zhì)上都不具有抵抗流式數(shù)據(jù)概念漂移的能力。現(xiàn)有的數(shù)據(jù)挖掘系統(tǒng)不能實時更新數(shù)據(jù),并且不能自適應(yīng)計算模型,或者不能保持原本建立的模型[4]。

    文獻(xiàn)[3]首次提出“概念漂移”的概念后,國內(nèi)外的數(shù)據(jù)挖掘研究人員對概念漂移分別展開了深入研究。其中,文獻(xiàn)[5]通過時間序列分析方法,根據(jù)概念漂移發(fā)生的時間序列分為突變型概念漂移、漸變型概念漂移、重復(fù)型概念漂移、增量型概念漂移,并建立了滑動窗口和分類錯誤率的理論模型。文獻(xiàn)[6]提出了數(shù)據(jù)流分類挖掘算法,對數(shù)據(jù)的處理需要考慮有限內(nèi)存、時間序列和單次處理的特點。文獻(xiàn)[7]根據(jù)環(huán)境變化引起的概念漂移將漂移分為虛漂移和實漂移。學(xué)術(shù)界在數(shù)據(jù)挖掘的抵抗概念漂移研究中,一方面通過改進單個分類器來解決數(shù)據(jù)概念漂移的問題,如文獻(xiàn)[8]的COBBIT、文獻(xiàn)[9]的CD3(concept drift)、文獻(xiàn)[10]的CVFDT;另一方面,研究人員通過集成分類器更新分類模型來提高分類精度和泛化能力。如文獻(xiàn)[11]提出的通過評估分類器精確度的閾值來不斷更新基分類器,從而不斷提高整體抵抗概念漂移的SEA(streaming ensemble algorithm)算法,缺點是該系統(tǒng)因為基分類器更新速度較慢,所以不適合突變性概念漂移。文獻(xiàn)[12]提出了對SEA改進的對基分類器設(shè)置權(quán)值的AWE算法。文獻(xiàn)[13]提出了一個能提高分類器反應(yīng)速度的在線學(xué)習(xí)分類器ACE(adaptive classifiers-ensemble)算法。文獻(xiàn)[14-15]提出通過動態(tài)調(diào)整各基分類器的權(quán)值來提高分類性能。文獻(xiàn)[16-17]提出根據(jù)boosting算法思想,通過帶有權(quán)值的基分類器多數(shù)投票的機制,并動態(tài)增加投票精確度高的分類器,刪除投票精確度低的分類器來提高分類效果。文獻(xiàn)[18]研究了數(shù)據(jù)流中的樣本之間發(fā)生概念漂移的最大差值。文獻(xiàn)[19]通過利用Peano數(shù)據(jù)結(jié)構(gòu)模型證明了決策樹分類方法適用于動態(tài)數(shù)據(jù)流。文獻(xiàn)[20]通過決策樹模型檢測數(shù)據(jù)子集,從而實現(xiàn)數(shù)據(jù)塊操作的模型。文獻(xiàn)[3]提出基于hoeffding樹的決策樹分類算法VFDT(very fast decision tree),該算法通過統(tǒng)計每個節(jié)點中樣本屬性的信息增益來選擇最佳分裂節(jié)點。對于數(shù)據(jù)流挖掘中概念漂移的研究,主要提出了評估數(shù)據(jù)集實時性權(quán)重和滑動窗口兩種策略。如文獻(xiàn)[21]提出根據(jù)樣本的生存時間,利用衰減函數(shù)來評估樣本的實時性的抵抗概念漂移策略,建模數(shù)據(jù)項的實時性要求根據(jù)其衰減函數(shù)來決定。文獻(xiàn)[22-24]提出利用可變的窗口盡可能地維持樣本,但是需要使用者提供未知的先驗參數(shù),如概念漂移的時間尺度。在抵抗概念漂移的系統(tǒng)設(shè)計中,廣泛得到認(rèn)可的系統(tǒng)有Last提出的OLIN(on line information network)[25]、Gama等人提出的UFFT(ultra fast forest of trees)[26]、Domingos等人提出的CVFDT[10]。

    2 相關(guān)研究

    2.1 OLIN

    文獻(xiàn)[25]中Last提出了一種使用IFN(info-fuzzy network)網(wǎng)絡(luò)的在線分類系統(tǒng),該系統(tǒng)又稱為OLIN,其根據(jù)動態(tài)數(shù)據(jù)流上的最新樣本建立滑動窗口。系統(tǒng)動態(tài)調(diào)整訓(xùn)練樣本窗口的大小,并且根據(jù)概念漂移發(fā)生的頻率動態(tài)更新模型。OLIN系統(tǒng)將訓(xùn)練樣本之間的概念漂移統(tǒng)計顯著性差異以及最新模型的預(yù)測準(zhǔn)確率作為動態(tài)數(shù)據(jù)流是否發(fā)生概念漂移的標(biāo)志。OLIN在重構(gòu)模型過程中啟發(fā)式動態(tài)調(diào)整樣本數(shù),如果概念未發(fā)生漂移,則增加當(dāng)前模型建立所需的樣本。如果檢測到發(fā)生概念漂移,則減小窗口的大小,從而減少樣本。OLIN為每個新的滑動窗口建立一個新的模型。這個方法保證了隨著時間的推移,分類精度也能提高。但是OLIN算法有一個主要的缺點:生成新的模型時將產(chǎn)生很高的內(nèi)存開銷,OLIN不考慮新的模型替代原有模型的開銷。

    2.2 UFFT

    Gama等人提出極速算法UFFT[26]。UFFT是基于二叉樹森林的有監(jiān)督的分類學(xué)習(xí)算法。UFFT是增量式且在恒定時間內(nèi)處理每個樣本,利用分析技術(shù)來選擇分裂標(biāo)準(zhǔn)處理連續(xù)數(shù)據(jù)流,通過信息增益評估每個可能分裂測試節(jié)點的好壞。對于多類的問題,算法為每一對可能相近的類建立一個二叉樹,從而構(gòu)造一個樹的森林。UFFT算法在樣本訓(xùn)練期間保持一個暫時的內(nèi)存,保證給定數(shù)據(jù)流中有限的最新樣本固定時間內(nèi)保存在數(shù)據(jù)結(jié)構(gòu)中來支持插入和刪除。當(dāng)測試節(jié)點一旦建立,葉子節(jié)點就變成帶有兩個子葉子節(jié)點的決策節(jié)點。通過短期內(nèi)存中的樣本量初始化每個葉子節(jié)點的統(tǒng)計信息。UFFT算法在決策樹的每個節(jié)點上保持一個樸素貝葉斯分類器。通過樣本統(tǒng)計值建立的分類器在變成葉子節(jié)點時需要根據(jù)分裂準(zhǔn)則評估其是否符合分裂要求。葉節(jié)點變成決策節(jié)點后遍歷節(jié)點的所有樣本,將通過樸素貝葉斯分類器進行分類。概念漂移探測方法最基本的思想是控制錯誤率。如果未發(fā)生概念漂移,樸素貝葉斯分類器的錯誤率會降低。發(fā)生概念漂移后,樸素貝葉斯的錯誤率將上升。當(dāng)探測到給定節(jié)點的分類錯誤顯著上升時,表明現(xiàn)有的分裂節(jié)點不再合適。原來節(jié)點下的子樹將被修剪并重新變?yōu)槿~子節(jié)點并重新初始化。

    Table 1 Difference of VFDT and CVFDT表1 VFDT和CVFDT的異同點

    2.3CVFDT

    Hulten等人提出擴展VFDT的概念漂移自適應(yīng)快速決策樹算法CVFDT[10],VFDT算法和CVFDT算法的異同點如表1所示。

    表1中,m為VFDT中決策樹的節(jié)點個數(shù);N為CVFDT中決策樹和替代子樹的節(jié)點個數(shù);d為屬性個數(shù);V為每個屬性值的最大值;C為類的個數(shù)。

    CVFDT根據(jù)滑動窗口中的數(shù)據(jù)流樣本來持續(xù)檢測舊的決策樹的有效性,從而保證建立模型與概念漂移同步。當(dāng)發(fā)現(xiàn)數(shù)據(jù)流發(fā)生概念漂移時,將以細(xì)粒度的方式更新它們。特別是每次選擇最佳屬性時都為每個候選屬性保留足夠的統(tǒng)計樣本時間。當(dāng)新的樣本加入到窗口時,從屬性統(tǒng)計值中減去舊的樣本數(shù)的統(tǒng)計值。每當(dāng)有Δn個新的樣本進入時,CVFDT在原先每個決策點重新決定最佳候選屬性。如果候選屬性中有一個比原先的決策屬性要好,則表明原先的決策不正確或者概念發(fā)生漂移。不管是原先的分裂屬性不正確,還是概念發(fā)生漂移,都會在繼續(xù)原先屬性分裂的同時,新的屬性開始尋找分裂屬性。在不斷的樹增長過程中,新的決策屬性產(chǎn)生時就相應(yīng)地產(chǎn)生其替代子樹。通過周期性地使用新的樣本作為驗證集來比較新的決策樹和舊的決策樹的分類效果。如果新的決策樹模型比舊的模型更準(zhǔn)確,CVFDT修剪舊樹(用新的替代子樹替換)。當(dāng)新的決策樹模型在最大數(shù)量的檢驗樣本集檢驗下分類效果仍不如舊的決策樹模型,那么建立的新的決策樹模型也會被修剪。如果不只一個新的決策樹模型,那么將會修剪分類效果最差的那個。CVFDT算法過程包括CVFDTGrow過程、ForgetExample過程、Remove Example過程和CheckSplitValidity過程。

    3 基于Storm的S-CVFDT抵抗概念漂移算法

    基于Storm的S-CVFDT抵抗概念漂移算法如圖1所示,并行化窗口bwin根據(jù)數(shù)據(jù)流中的概念漂移自適應(yīng)調(diào)整窗口大小。當(dāng)并行化窗口檢測數(shù)據(jù)流未發(fā)生概念漂移時,則增大窗口中的樣本量,有利于快速建立分類模型。當(dāng)并行化窗口檢測數(shù)據(jù)流發(fā)生概念漂移時,則減小并行化窗口的大小,有利于較快地適應(yīng)概念漂移。基于Storm的S-CVFDT算法的建樹過程在每個決策節(jié)點建立替代子樹,通過CheckSplit-Validity檢測替代子樹的準(zhǔn)確率,當(dāng)替代子樹的準(zhǔn)確率高于舊的子樹,則替換之。通過維持一個滑動窗口,不斷拋棄舊的樣本,添加新的樣本,不斷更新分類樹模型。基于大數(shù)據(jù)的流數(shù)據(jù)中主要包含突變式概念漂移和漸變式概念漂移,當(dāng)數(shù)據(jù)流具有突變式概念漂移特點時,將需要頻繁調(diào)用CVFDT算法中的檢測替代子樹準(zhǔn)確率模塊,從而增加了內(nèi)存消耗,降低了分類決策樹的建立模型效率。而S-CVFDT算法通過并行化窗口bwin,將能夠自適應(yīng)地根據(jù)數(shù)據(jù)流中的概念漂移,特別是突變型概念漂移來調(diào)整窗口的大小,從而有效解決系統(tǒng)針對突變型數(shù)據(jù)流時頻繁更新建樹模型,調(diào)用決策節(jié)點測試模塊和資源利用率等問題。

    4 基于Storm的抵抗概念漂移系統(tǒng)S-CVFDT

    4.1 抵抗數(shù)據(jù)流概念漂移系統(tǒng)模塊設(shè)計

    面向大數(shù)據(jù)的數(shù)據(jù)挖掘算法中,為了使得模型能夠抵抗數(shù)據(jù)流發(fā)生的概念漂移,通常需要3個特點:(1)添加新的樣本、釋放舊的樣本的窗口;(2)探測數(shù)據(jù)流輸入端發(fā)生概念漂移的方法;(3)對輸入的最新樣本能夠不斷更新模型。抵抗數(shù)據(jù)流概念漂移系統(tǒng)通常包括3個模塊:樣本窗口模塊、探測概念漂移模塊和概念漂移評價模塊,如圖2所示。

    ①數(shù)據(jù)流分為子數(shù)據(jù)流stream1和子數(shù)據(jù)流stream2,分別添加到并行化窗口bwin1和bwin2中。

    ②概念漂移探測模塊根據(jù)概念漂移閾值判斷數(shù)據(jù)流是否發(fā)生概念漂移。

    ③如果發(fā)生概念漂移,則建模窗口控制模塊減小窗口的大小以抵抗概念漂移。如果未發(fā)生概念漂移,則增大窗口大小,提高建模效率。

    ④根據(jù)建模窗口中的樣本數(shù)據(jù)流建立決策樹模型。

    ⑤周期性地比較決策樹模型中替代子樹和原有屬性節(jié)點的分類精度,如果替代子樹的精度高于原有子樹,則替換之。

    Fig.1 Parallel window S-CVFDT algorithm to resist concept drift圖1 基于Storm的并行化窗口S-CVFDT抵抗概念漂移算法

    Fig.2 Frame of data mining for concept drift data stream圖2 流數(shù)據(jù)挖掘抵抗概念漂移框架圖

    4.2 基于Storm的抵抗概念漂移并行化窗口bwin(bolt-window)

    Storm是利用類MapReduce編程模型來處理流數(shù)據(jù)的分布式流計算框架。Storm主要用來對流數(shù)據(jù)進行實時分析。比如Twitter使用Storm來查找最新流行的話題和故事,利用對tweet博客查找結(jié)果的排序?qū)崿F(xiàn)在線學(xué)習(xí)或者對廣告實時分析并生成內(nèi)部日志。Storm相對于HadoopMapReduce的優(yōu)點是其處理流數(shù)據(jù)的靈活性。實際上HadoopMapReduce在處理數(shù)據(jù)流時很復(fù)雜而且易錯。Storm提供了“至少一次”消息處理機制,且支持水平擴展。Storm因為沒有中間隊列,所以意味著操作開銷更少,更重要的是,Storm平臺的“justworks”機制保證了處理數(shù)據(jù)的容錯。Storm最基本的元素包括streams、spout、bolts和拓?fù)洹torm中的流實際上是元組的無限序列。元組是值的列表,每個值只要可以序列化,就可以賦值為任何類型。Storm是動態(tài)匹配類型,也就是說值的類型不需要聲明。spout是Storm的數(shù)據(jù)源,通常從如kestrel/kafka、http服務(wù)器日志或者Twitter流APIs這樣的外部數(shù)據(jù)源讀取數(shù)據(jù)。Storm中的bolt是一個或者多個輸入流的具體執(zhí)行者。bolt能執(zhí)行多個功能,如過濾元組、聚合元組、join多個數(shù)據(jù)流以及和外部件通信(如緩存或數(shù)據(jù)庫)。Storm在spout和bolt之間利用拉取方式傳遞元組,bolt從源件(bolt或者spout)拉取元組進行處理。這個特性可以保證當(dāng)拓?fù)湎到y(tǒng)不能實時處理外部事件時,元組的丟失只會發(fā)生在spout。Storm中spout、bolt和流組成拓?fù)涞氖且粋€有向無環(huán)圖。

    基于Storm的并行化窗口探測概念漂移模塊如圖3所示,將數(shù)據(jù)流分為子數(shù)據(jù)流stream1和子數(shù)據(jù)流stream2,分別添加到并行化窗口bwin1和bwin2中。通過檢測概念漂移窗口算法的bolt,來檢測數(shù)據(jù)流是否發(fā)生概念漂移,并將結(jié)果傳遞到結(jié)果bolt中。

    4.3 基于Storm的并行化系統(tǒng)S-CVFDT

    基于Storm的并行化系統(tǒng)S-CVFDT由并行窗口模塊、概念漂移探測模塊、S-CVFDT建樹模塊以及模型評價模塊組成,如圖4所示。數(shù)據(jù)流通過spout從外部數(shù)據(jù)源讀入。概念漂移探測模塊由并行窗口bolt和漂移探測bolt組成,其中根據(jù)并行化窗口算法通過探測bolt將控制信息返回到并行窗口模塊中,從而自適應(yīng)調(diào)整并行化窗口的大小。S-CVFDT采用垂直并行設(shè)計。垂直并行更適合于具有很多屬性的實例,因為它把大部分的時間開銷用在每個屬性的信息增益的計算上。相比于水平并行,它占用更少的內(nèi)存,因為它不需要在每一個bolt復(fù)制模型。建樹模塊的第一個bolt負(fù)責(zé)接收并行化窗口的數(shù)據(jù),并將數(shù)據(jù)流傳遞到分發(fā)bolt;分發(fā)bolt將統(tǒng)計信息分發(fā)到每一個獨立計算bolt,并且計算信息增益;最后將聚集獨立bolt的統(tǒng)計信息得到最終的決策樹。由于原有的CVFDT算法在樣本具有大量屬性的情況下,在屬性增益的計算中耗費大量計算資源,從而降低建樹效率,S-CVFDT算法建樹模塊部分主要將Storm的分布式和并行化的流數(shù)據(jù)處理方式應(yīng)用于系統(tǒng)中,用戶通過設(shè)置獨立bolt的個數(shù)處理樣本屬性,從而調(diào)整系統(tǒng)并行度,提高建樹效率。

    Fig.3 Detection module for concept drift based on Storm by parallel window圖3 基于Storm的并行化窗口探測概念漂移模塊

    Fig.4 Parallel system S-CVFDT for concept drift based on Storm圖4 基于Storm的并行化系統(tǒng)S-CVFDT

    5 實驗仿真與驗證

    5.1 基于Storm的S-CVFDT分類挖掘系統(tǒng)

    基于Storm的流分類挖掘系統(tǒng),既解決了由于傳統(tǒng)的流數(shù)據(jù)挖掘單機系統(tǒng)不能實現(xiàn)分布式計算信息熵從而提高效率的問題,同時通過并行化窗口的方案有效地抵抗了由于數(shù)據(jù)流概念漂移導(dǎo)致的模型準(zhǔn)確率下降,系統(tǒng)資源消耗過高等問題。

    基于Storm的S-CVFDT整體系統(tǒng)框架如圖5所示。

    Fig.5 S-CVFDT system frame based on Storm圖5 基于Storm的S-CVFDT整體系統(tǒng)框架圖

    (1)對帶有標(biāo)簽屬性的流式數(shù)據(jù)樣本集進行有監(jiān)督的學(xué)習(xí),實現(xiàn)增量建樹,并實時監(jiān)控概念漂移,形成不斷更新的分類決策樹模型,以內(nèi)存數(shù)據(jù)庫Redis作為消息中間件保存不斷更新的決策樹模型。

    (2)從Redis中取出實時決策樹模型,并利用數(shù)據(jù)流中的測試樣本集來測試決策樹模型的準(zhǔn)確率。

    (3)從Redis中取出符合準(zhǔn)確率要求的決策樹模型對未知標(biāo)簽的樣本數(shù)據(jù)流進行預(yù)測分析,并輸出分類結(jié)果。

    5.2 S-CVFDT算法系統(tǒng)拓?fù)湓O(shè)計

    基于Storm的抵抗概念漂移流分類挖掘算法并行化拓?fù)涞臉?gòu)建過程如下:

    (1)創(chuàng)建基于Storm的由spout和bolt組成的流分類分布式計算拓?fù)?,設(shè)置噴發(fā)節(jié)點spout和計算節(jié)點bolt的邏輯關(guān)系。

    (2)配置拓?fù)鋽?shù)據(jù)源和數(shù)據(jù)處理節(jié)點,設(shè)置數(shù)據(jù)計算節(jié)點并發(fā)數(shù)以及隨機的數(shù)據(jù)分發(fā)處理方式。

    (3)設(shè)置DSourceSpout讀取數(shù)據(jù)源數(shù)據(jù),并將數(shù)據(jù)源的屬性信息發(fā)送給ReadAttBolt,數(shù)據(jù)源屬性管理模塊ReadAttBolt提取數(shù)據(jù)源中的屬性,數(shù)據(jù)源的屬性值信息發(fā)送給概念漂移探測模塊BwinDetector-Bolt。

    (4)BwinDetectorBolt接受DSourceSpout的數(shù)據(jù)源信息,探測是否發(fā)生概念漂移,從而控制窗口window Size,當(dāng)數(shù)據(jù)流速率過高時,可以增加并發(fā)數(shù)來提高探測效率。

    (5)S-CVFDTBolt初始化窗口W、各項參數(shù)和初始的決策樹模型,并將模型及各項參數(shù)發(fā)送給CheckingSplitNodeBolt。

    (6)Att_midBolt接受ReadAttBolt提取數(shù)據(jù)源中的屬性,計算數(shù)據(jù)流樣本中所有屬性的個數(shù),并將每個屬性打上標(biāo)簽,分發(fā)給CheckingSplitNodeBolt。

    (7)因為基于數(shù)據(jù)流的流分類挖掘算法中樣本的屬性增益將是系統(tǒng)資源消耗的絕大部分,所以通過垂直并行化來計算屬性熵增益。CheckingSplitNode-Bolt根據(jù)數(shù)據(jù)源樣本的屬性個數(shù)設(shè)置并發(fā)數(shù),計算結(jié)果保存在Map<key,value>中,其中key代表是哪個屬性,value代表該屬性的信息增益值,將計算結(jié)果發(fā)送給ChooseMaxBolt。

    (8)ChooseMaxBolt對Map中的所有屬性對應(yīng)的value值進行排序,找出最大和次大的<key,value>即可確定決策節(jié)點進行分裂。

    (9)更新決策樹,并將最新的決策樹模型寫入到Redis中。

    (10)同時建立測試和分類拓?fù)?,并通過拓?fù)渲械腅vaSpout分發(fā)測試數(shù)據(jù)源,DataSpout分發(fā)分類數(shù)據(jù)源,并分別從Redis中取出最新決策樹分類模型到classifyBolt中進行評估和分類。

    5.3 系統(tǒng)的實現(xiàn)與分析

    假設(shè)n為決策樹和替代子樹節(jié)點的個數(shù),d為樣本屬性的個數(shù),v為屬性值的最大個數(shù),c為類的個數(shù),則CVFDT算法的復(fù)雜度為O(ndvc)。因為CVFDT算法系統(tǒng)除了要存儲決策樹的數(shù)據(jù)結(jié)構(gòu)以外,還包括處理樣本的存儲空間,假設(shè)樣本的大小為e,窗口的大小為w,所以CVFDT系統(tǒng)實際的空間復(fù)雜度為O(ndvc+we)。而因為S-CVFDT算法的窗口是自適應(yīng)指數(shù)調(diào)整的,所以其空間復(fù)雜度是O(ndvc+elogw)。當(dāng)數(shù)據(jù)流數(shù)據(jù)量很大時,空間復(fù)雜度呈指數(shù)減小。

    概念漂移廣泛存在現(xiàn)實數(shù)據(jù)流中,數(shù)據(jù)流決策樹分類算法CVFDT能夠很好地解決概念漂移問題,但是因為其設(shè)計處理概念漂移機制時并不考慮概念漂移的類型,只是采用普適的方法,從而效率較低。本文提出的基于分布式計算平臺Storm的并行窗口算法設(shè)計不僅能夠有效檢測數(shù)據(jù)流中的概念漂移,從而自適應(yīng)改變窗口提高其建立模型的準(zhǔn)確率,也通過分布式計算平臺強大的計算能力,從而減小屬性信息熵的計算時間,提高效率。

    在分類算法研究中,分類器的性能評估是重要的一部分。在訓(xùn)練樣本上有很高性能的分類器在測試樣本中未必能收到同樣的結(jié)果。本文采用的是在大部分?jǐn)?shù)據(jù)挖掘評估中廣泛使用的十字交叉驗證法。誤差率在分類算法的分類器設(shè)計中是一個重要的評估指標(biāo)。分類器對測試樣本進行預(yù)測,如果正確,則分類成功,否則分類錯誤。通過建立決策樹評價拓?fù)鋵y試樣本通過evalspout發(fā)送數(shù)據(jù)流到evalbolt進行評估,并輸出分類器的誤差率。以下選取在流分類挖掘?qū)嶒炛惺褂幂^廣泛的概念漂移數(shù)據(jù)流Hyperplane[27]作為算法性能實驗的數(shù)據(jù)源,其通過逐漸改變連續(xù)樣本的決定邊界來實現(xiàn)增量的概念漂移數(shù)據(jù)流。Hyperplane通過改變每個樣本0.01的修正權(quán)重值來實現(xiàn)漂移。另外數(shù)據(jù)集包含5%的噪聲,噪聲通過人為對樣本加上錯誤的類標(biāo)簽實現(xiàn)。Hyperplane包含10 000個樣本和10個維度。如圖6所示,當(dāng)樣本數(shù)較少時,S-CVFDT算法決策樹模型的準(zhǔn)確率和CVFDT算法準(zhǔn)確率相差不大,但是S-CVFDT算法隨著樣本的增加,模型建立的準(zhǔn)確率不斷提高。

    Fig.6 Comparison of accuracy between CVFDT algorithm and S-CVFDT algorithm圖6 S-CVFDT算法與CVFDT算法準(zhǔn)確率比較

    由于S-CVFDT具有并行窗口抵抗?jié)u進型概念漂移的機制,當(dāng)數(shù)據(jù)流概念發(fā)生漂移時,可以發(fā)現(xiàn)SCVFDT算法的準(zhǔn)確率雖然有所下降,但是能夠很快恢復(fù),并且當(dāng)樣本數(shù)越大時能保持比CVFDT較高的準(zhǔn)確率,如圖7所示。

    Fig.7 Comparison of accuracy between CVFDT algorithm and S-CVFDT algorithm based on concept drift圖7 S-CVFDT算法與CVFDT算法發(fā)生概念漂移時準(zhǔn)確率比較

    CVFDT算法單機情況下:每秒處理的待分類樣本數(shù)目在10 000~15 000條,而S-CVFDT算法基于分布式平臺Storm下每個分類拓?fù)涿棵肟商幚淼拇诸悩颖緮?shù)目在20 000~30 000條,當(dāng)分類樣本數(shù)量倍增時,可以增加分類處理bolt,從而提高分類效率。并且決策樹模型不斷從Redis中讀取更新最具實時性的分類模型,從而保證模型的準(zhǔn)確率。

    6 結(jié)束語

    本文基于分布式計算平臺Storm提出了一種新的并行化窗口檢測和抵抗概念漂移的面向大數(shù)據(jù)的分類算法S-CVFDT,該算法利用并行化窗口中數(shù)據(jù)流分布的變化檢測突變型概念漂移,并通過垂直并行化改進CVFDT算法,從而實現(xiàn)模型的不斷更新和效率優(yōu)化。實驗分析表明,與傳統(tǒng)單機檢測概念漂移和建立模型相比,S-CVFDT算法具有較優(yōu)的概念漂移檢測能力和分類準(zhǔn)確率。而與已有的概念漂移分類算法相比,S-CVFDT算法在分類正確率、抗噪性等方面表現(xiàn)優(yōu)越。然而,該系統(tǒng)如何引入隨機森林決策投票機制,以及如何檢測數(shù)據(jù)流中的噪聲和誤報,以及分類拓?fù)洳⑿谢窍乱徊降难芯磕繕?biāo)和方向。

    [1]Bryant R E,Katz R H,Lazowska E D.Big-data computing:creating revolutionary breakthroughs in commerce,science, and society[R/OL].AWhite Paper Prepared for the Computing Community Consortium Committee of the Computing Research Association(2008)[2016-06-17].http://cra.org/ccc/ resources/ccc-led-whitepapers/.

    [2]Mitchell T M.Machine learning[M].New York:McGraw-Hill,1997.

    [3]Domingos P,Hulten G.Mining high-speed data stream[C]// Proceedings of the 6th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,Boston, USA,Aug 20-23,2000.New York:ACM,2000:71-80.

    [4]Grossberg S.Nonlinear neural networks:principles,mechanisms and architecture[J].Neural Network,1988,1(1):17-61.

    [5]Kuncheva L I.Classifier ensembles for changing environments[C]//LNCS 3077:Proceedings of the 5th Workshop on Multiple Classifier Systems,Cagliari,Italy,Jun 9-11,2004. Berlin,Heidelberg:Springer,2004:1-15.

    [6]Gama J.A survey on learning from data streams:current and future trends[J].Progress in Artificial Intelligence,2012,1 (1):45-55.

    [7]Widmer G,Kubat M.Effective learning in dynamic environments by explicit context tracking[C]//LNCS 667:Proceedings of the 6th European Conference on Machine Learning, Vienna,Austria,Apr 5-7,1993.Berlin,Heidelberg:Springer,1993:227-243.

    [8]Kilander F,Jansson C.COBBIT—a control procedure for COBWEB in the presence of concept drift[C]//Proceedings of the 6th European Conference on Machine Learning,Helsinki,Finland,1993.Berlin,Heidelberg:Springer,1993: 244-261.

    [9]Black M,Hickey R J.Maintaining the performance of a learned classifier under concept drift[J].Intelligent Data Analysis,1999,3(6):453-474.

    [10]Hulten G,Spencer L,Domingos P.Mining time-changing data streams[C]//Proceedings of the 7th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,San Francisco,USA,Aug 26-29,2001.New York: ACM,2001:97-106.

    [11]Street W N,Kim Y S.A streaming ensemble algorithm (SEA)for large-scale classification[C]//Proceedings of the 7th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,San Francisco,USA, Aug 26-29,2001.New York:ACM,2001:377-382.

    [12]Wang Haixun,Fan Wei,Yu P S,etal.Mining concept-drifting data streams using ensemble classifiers[C]//Proceedings of the 9th International Conference on Knowledge Discovery and Data Mining,Washington,Aug 24-27,2003.New York: ACM,2003:226-235.

    [13]Kyosuke N,Koichiro Y,Takashi O.ACE:adaptive classifiersensemble system for concept-drifting environments[C]// LNCS 3541:Proceedings of the 6th International Workshop on Multiple Classifier Systems,Seaside,USA,Jun 13-15, 2005.Berlin,Heidelberg:Springer,2005:176-185.

    [14]Elwell R,Polikar R.Incremental learning of concept drift in nonstationary environments[J].IEEE Transactions on Neural Networks,2011,22(10):1517-1531.

    [15]Muhlbaier M D,Polikar R.Multiple classifiers based incremental learning algorithm for learning in nonstationary environments[C]//Proceedings of the 2007 IEEE International Conference on Machine Learning and Cybernetics,Hong Kong,China,Aug 19-22,2007.Piscataway,USA:IEEE, 2007:3618-3623.

    [16]Kolter J Z,Maloof M A.Dynamic weighted majority:a new ensemble method for tracking concept drift[C]//Proceedings of the 3rd IEEE International Conference on Data Mining,Melbourne,USA,Dec 19-22,2003.Washington: IEEE Computer Society,2003:123-130.

    [17]Kolter J Z,Maloof M A.Using additive expert ensembles to cope with concept drift[C]//Proceedings of the 22nd International Conference on Machine Learning,Bonn,Germany, Aug 7-11,2005.New York:ACM,2005:449-456.

    [18]Barve R D,Long P M.On the complexity of learning from drifting distributions[J].Information and Computation,1997, 138(2):170-193.

    [19]Ding Qiang,Ding Qin,Perrizo W.Decision tree classification of spatial data streams using peano count trees[C]//Proceedings of the 2002 ACM Symposium on Applied Computing,Madrid,Spain,Mar 2002.New York:ACM,2002: 413-417.

    [20]Ganti V,Gehrke J,Ramakrishnan R.Mining data streams under block evolution[J].ACM SIGKDD Explorations Newsletter,2002,3(2):1-10.

    [21]Cohen E,Strauss M.Maintaining time-decaying stream aggregates[C]//Proceedings of the 22nd ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems, San Diego,USA,Jun 9-12,2003.New York:ACM,2003: 223-233.

    [22]Gama J,Medas P,Castillo G,et al.Learning with drift detection[C]//LNCS 3171:Advances in Artificial Intelligence, Proceedings of the 17th Brazilian Symposium on Artificial Intelligence,Sao Luis,Brazil,Sep 29-Oct 1,2004.Berlin, Heidelberg:Springer,2004:286-295.

    [23]Klinkenberg R,Joachims T.Detecting concept drift with supportvector machines[C]//Proceedings of the 17th International Conference on Machine Learning,Stanford,USA, Jun 29-Jul 2,2000.San Francisco,USA:Morgan Kaufmann Publishers Inc,2000:487-494.

    [24]Widmer G,Kubat M.Learning in the presence of concept drift and hidden contexts[J].Machine Learning,1996,23(1): 69-101.

    [25]Last M.Online classification of nonstationary data streams [J].Intelligent DataAnalysis,2002,6(2):129-147.

    [26]Gama J,Medas P,Rocha R.Forest trees for on-line data[C]// Proceedings of the 2004 ACM Symposium on Applied Computing,Nicosia,Cyprus,Mar 14-17,2004.New York: ACM,2004:632-636.

    [27]Lin C H,Chi C Y,Wang Y H,et al.A fast hyperplane-based minimum-volume enclosing simplex algorithm for blind hyperspectral unmixing[J].IEEE Transactions on Signal Processing,2016,64(8):1946-1961.

    LU Lili was born in 1978.She received the M.S.degree in computer software and theory from Nanjing University of Posts and Telecommunications in 2008.Now she is a lecturer at Nanjing College of Information Technology.Her research interests include cloud computing and big data,etc.

    陸莉莉(1978—),女,江蘇南通人,2008年于南京郵電大學(xué)計算機軟件與理論專業(yè)獲得碩士學(xué)位,現(xiàn)為南京信息職業(yè)技術(shù)學(xué)院講師,主要研究領(lǐng)域為云計算,大數(shù)據(jù)等。

    ZHANG Yongpan was born in 1994.He is an M.S.candidate at Nanjing University of Posts and Telecommunications.His research interest is data mining in big data.

    張永潘(1994—),男,安徽宣城人,南京郵電大學(xué)碩士研究生,主要研究領(lǐng)域為大數(shù)據(jù)挖掘。

    TAN Haiyu was born in 1987.He is an M.S.candidate at Nanjing University of Posts and Telecommunications.His research interest is data mining in big data.

    談海宇(1987—),男,江蘇鹽城人,南京郵電大學(xué)碩士研究生,主要研究領(lǐng)域為大數(shù)據(jù)挖掘。

    JI Yimu was born in 1978.He received the Ph.D.degree from Nanjing University of Posts and Telecommunications in 2008.Now he is a professor at Nanjing University of Posts and Telecommunications.His research interests include P2P network optimization,cloud computing security and stream data query in big data,etc.

    季一木(1978—),男,安徽無為人,2008年于南京郵電大學(xué)通信與信息系統(tǒng)專業(yè)獲得博士學(xué)位,現(xiàn)為南京郵電大學(xué)教授,主要研究領(lǐng)域為P2P網(wǎng)絡(luò)優(yōu)化,云計算安全,大數(shù)據(jù)流查詢挖掘等。

    Research on ClassificationAlgorithm and Concept Drift Based on Big Data*

    LU Lili1+,ZHANG Yongpan2,TAN Haiyu2,JI Yimu2
    1.Institute of Computer&Software,Nanjing College of Information Technology,Nanjing 210023,China
    2.School of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210023,China
    +Corresponding author:E-mail:lull@njcit.cn

    With the deepening research of the application on big data and the emergence of more and more distributed computing framework,the research on concept drift in data stream becomes one of the research highlights in data mining for big data.The existing research on concept drift mainly depends on the data structure and algorithm optimization, the calculation mainly depends on the sole computer and limited resources to complete concept drift detection.Thus, this paper proposes a classification mining algorithm and system for big data based on Storm to resist concept drift. The S-CVFDT(Storm-concept very fast decision tree)algorithm system uses the parallel window mechanism to detect mutant concept drift in data stream and adaptively changes the parallel window size so as to update S-CVFDT algorithm model.The experimental analysis and results show that the algorithm can effectively detect mutant concept drift and lower the system resources waste.Not only the modeling is more efficient,but also the classification accuracy is improved.

    big data;data mining;classification algorithm;concept drift

    10.3778/j.issn.1673-9418.1608039

    A

    TP393

    *The Youth Fund of Natural Science Foundation of Jiangsu Province under Grant No.BK20130876(江蘇省自然科學(xué)基金青年基金);the Research Foundation of Nanjing College of Information Technology under Grant No.YK20140402(南京信息職業(yè)技術(shù)學(xué)院科研基金).

    Received 2016-08,Accepted 2016-10.

    CNKI網(wǎng)絡(luò)優(yōu)先出版:2016-10-19,http://www.cnki.net/kcms/detail/11.5602.TP.20161019.1458.006.html

    猜你喜歡
    數(shù)據(jù)流決策樹分類器
    汽車維修數(shù)據(jù)流基礎(chǔ)(下)
    一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
    決策樹和隨機森林方法在管理決策中的應(yīng)用
    電子制作(2018年16期)2018-09-26 03:27:06
    BP-GA光照分類器在車道線識別中的應(yīng)用
    電子測試(2018年1期)2018-04-18 11:52:35
    一種提高TCP與UDP數(shù)據(jù)流公平性的擁塞控制機制
    加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
    結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
    基于決策樹的出租車乘客出行目的識別
    基于數(shù)據(jù)流聚類的多目標(biāo)跟蹤算法
    基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
    激情视频va一区二区三区| 美女大奶头黄色视频| 视频区图区小说| 欧美精品av麻豆av| 久久人人爽人人片av| 免费人成在线观看视频色| 精品酒店卫生间| 91国产中文字幕| 国产一区亚洲一区在线观看| 国产无遮挡羞羞视频在线观看| 欧美成人精品欧美一级黄| 18+在线观看网站| 大话2 男鬼变身卡| 亚洲精品色激情综合| 亚洲国产最新在线播放| 欧美亚洲日本最大视频资源| 国产精品一二三区在线看| 免费高清在线观看日韩| 丝袜喷水一区| 熟妇人妻不卡中文字幕| 欧美 日韩 精品 国产| 麻豆乱淫一区二区| 99久久精品国产国产毛片| 下体分泌物呈黄色| 日本欧美国产在线视频| 97精品久久久久久久久久精品| 超碰97精品在线观看| 亚洲国产成人一精品久久久| 极品少妇高潮喷水抽搐| kizo精华| 国产成人一区二区在线| 亚洲精品自拍成人| 黄片播放在线免费| 中文字幕制服av| 亚洲久久久国产精品| 最新的欧美精品一区二区| 精品久久国产蜜桃| 国产精品久久久久久精品电影小说| 老女人水多毛片| 久久久国产精品麻豆| 久久久久久久久久久久大奶| 精品一区在线观看国产| 熟女人妻精品中文字幕| 欧美激情 高清一区二区三区| 日韩av在线免费看完整版不卡| 午夜久久久在线观看| 在线 av 中文字幕| 久久毛片免费看一区二区三区| 成人毛片a级毛片在线播放| 精品久久蜜臀av无| 人妻少妇偷人精品九色| 亚洲精品一二三| 亚洲精品视频女| 有码 亚洲区| 国产精品嫩草影院av在线观看| 国产色爽女视频免费观看| 国产av精品麻豆| 亚洲综合色惰| 色婷婷久久久亚洲欧美| 亚洲人成网站在线观看播放| 欧美亚洲 丝袜 人妻 在线| 中文字幕最新亚洲高清| 少妇熟女欧美另类| 亚洲欧美成人精品一区二区| 欧美日韩成人在线一区二区| 校园人妻丝袜中文字幕| 狠狠精品人妻久久久久久综合| 国产欧美亚洲国产| 亚洲欧美成人综合另类久久久| 欧美日韩视频高清一区二区三区二| 久久久精品区二区三区| 伦精品一区二区三区| 汤姆久久久久久久影院中文字幕| 一级a做视频免费观看| 亚洲国产精品成人久久小说| 国产av一区二区精品久久| 国产精品 国内视频| 多毛熟女@视频| 熟女人妻精品中文字幕| kizo精华| 制服诱惑二区| 大片免费播放器 马上看| 99久久人妻综合| 久久久久久久久久人人人人人人| 国产精品国产三级国产av玫瑰| 一本久久精品| 国产午夜精品一二区理论片| 国产精品一国产av| 成人无遮挡网站| 乱码一卡2卡4卡精品| 亚洲第一区二区三区不卡| 日韩中文字幕视频在线看片| 国产精品熟女久久久久浪| 亚洲丝袜综合中文字幕| 亚洲美女黄色视频免费看| xxxhd国产人妻xxx| 精品亚洲成a人片在线观看| 亚洲av电影在线进入| 亚洲综合色惰| 侵犯人妻中文字幕一二三四区| kizo精华| 国产国语露脸激情在线看| 亚洲高清免费不卡视频| 亚洲少妇的诱惑av| 精品人妻偷拍中文字幕| 国产日韩一区二区三区精品不卡| 亚洲精品一区蜜桃| 精品熟女少妇av免费看| 搡老乐熟女国产| 国产一级毛片在线| 国产成人精品福利久久| 精品一区二区免费观看| 人妻少妇偷人精品九色| 国产欧美亚洲国产| 久久人人爽人人爽人人片va| 侵犯人妻中文字幕一二三四区| 伦精品一区二区三区| 久久精品久久久久久噜噜老黄| 午夜老司机福利剧场| 国产高清三级在线| 国产精品成人在线| 精品久久久精品久久久| 欧美激情 高清一区二区三区| av免费观看日本| 精品少妇内射三级| 赤兔流量卡办理| 大香蕉久久成人网| 精品久久久精品久久久| 久久亚洲国产成人精品v| 波多野结衣一区麻豆| 好男人视频免费观看在线| 少妇精品久久久久久久| 2022亚洲国产成人精品| 亚洲高清免费不卡视频| 国产精品人妻久久久久久| 波多野结衣一区麻豆| 美女内射精品一级片tv| 久久99精品国语久久久| 日韩欧美精品免费久久| 18+在线观看网站| 日韩中字成人| a级毛片黄视频| a级片在线免费高清观看视频| 亚洲精品,欧美精品| 在线观看免费高清a一片| 国产一区有黄有色的免费视频| 精品福利永久在线观看| 中文字幕最新亚洲高清| 午夜福利视频在线观看免费| 日韩一本色道免费dvd| 校园人妻丝袜中文字幕| 丁香六月天网| 91午夜精品亚洲一区二区三区| 日韩成人av中文字幕在线观看| 免费黄网站久久成人精品| 亚洲欧美精品自产自拍| 日本爱情动作片www.在线观看| 老熟女久久久| 视频在线观看一区二区三区| 国产免费一区二区三区四区乱码| 亚洲,欧美精品.| 精品国产一区二区久久| 侵犯人妻中文字幕一二三四区| 在线天堂中文资源库| 七月丁香在线播放| 三级国产精品片| 女人久久www免费人成看片| 亚洲精品乱久久久久久| 亚洲五月色婷婷综合| 日本黄色日本黄色录像| 黑人高潮一二区| 天堂俺去俺来也www色官网| 看十八女毛片水多多多| 久久久精品94久久精品| 日本91视频免费播放| 国产精品 国内视频| av在线播放精品| 精品一区二区三卡| 日韩精品有码人妻一区| 亚洲精品第二区| 黄色一级大片看看| 亚洲美女视频黄频| 美女主播在线视频| 午夜影院在线不卡| 女的被弄到高潮叫床怎么办| 国产黄色视频一区二区在线观看| 男男h啪啪无遮挡| 多毛熟女@视频| 有码 亚洲区| 啦啦啦在线观看免费高清www| 男人操女人黄网站| av网站免费在线观看视频| 天堂中文最新版在线下载| 91精品三级在线观看| 久久久久久久久久成人| 国产成人午夜福利电影在线观看| 交换朋友夫妻互换小说| 搡老乐熟女国产| 亚洲av综合色区一区| 亚洲,欧美,日韩| 日韩av在线免费看完整版不卡| 国产精品人妻久久久影院| 亚洲 欧美一区二区三区| a 毛片基地| 亚洲欧美日韩另类电影网站| 欧美日韩亚洲高清精品| 婷婷色综合www| 国产免费一区二区三区四区乱码| 日本爱情动作片www.在线观看| 国产精品女同一区二区软件| 在线观看免费高清a一片| 99久久精品国产国产毛片| 免费观看性生交大片5| 久久久久精品性色| 一本大道久久a久久精品| 2021少妇久久久久久久久久久| 丝袜喷水一区| 边亲边吃奶的免费视频| 男女边吃奶边做爰视频| 麻豆乱淫一区二区| 国产一级毛片在线| 国产精品99久久99久久久不卡 | 国产色爽女视频免费观看| 美女视频免费永久观看网站| 久久人人爽人人片av| 麻豆精品久久久久久蜜桃| 美女福利国产在线| 欧美成人午夜精品| 亚洲,欧美,日韩| 久久精品久久久久久噜噜老黄| av国产久精品久网站免费入址| 国产色爽女视频免费观看| 成人亚洲精品一区在线观看| 国产黄频视频在线观看| 多毛熟女@视频| 制服人妻中文乱码| 国产1区2区3区精品| 青春草亚洲视频在线观看| av天堂久久9| 91在线精品国自产拍蜜月| 亚洲精品国产色婷婷电影| 性色avwww在线观看| 成人二区视频| 国产精品久久久久久久久免| 少妇高潮的动态图| 菩萨蛮人人尽说江南好唐韦庄| 一区二区三区乱码不卡18| 久久久久久久亚洲中文字幕| 国产精品 国内视频| 国产综合精华液| 中文字幕免费在线视频6| 国产熟女欧美一区二区| 午夜激情久久久久久久| 嫩草影院入口| 亚洲欧美色中文字幕在线| 天天影视国产精品| 免费在线观看完整版高清| 成人手机av| 久久ye,这里只有精品| 国产乱人偷精品视频| 日本黄大片高清| 卡戴珊不雅视频在线播放| 考比视频在线观看| 国产国拍精品亚洲av在线观看| 国产爽快片一区二区三区| 日产精品乱码卡一卡2卡三| av不卡在线播放| 伦理电影大哥的女人| 欧美少妇被猛烈插入视频| 久久久国产欧美日韩av| 亚洲综合色惰| 99久久人妻综合| 欧美日韩视频精品一区| 亚洲欧美日韩另类电影网站| 精品人妻偷拍中文字幕| 曰老女人黄片| 国产熟女欧美一区二区| 亚洲国产最新在线播放| 夫妻性生交免费视频一级片| 91在线精品国自产拍蜜月| 国产精品国产av在线观看| 国产精品人妻久久久影院| 黑人巨大精品欧美一区二区蜜桃 | 精品视频人人做人人爽| 亚洲一区二区三区欧美精品| 99久久精品国产国产毛片| 人妻 亚洲 视频| 人妻系列 视频| 熟妇人妻不卡中文字幕| 大香蕉久久网| 美女主播在线视频| 日韩欧美精品免费久久| 男女无遮挡免费网站观看| 亚洲精品日韩在线中文字幕| 成人黄色视频免费在线看| 免费av中文字幕在线| 久久精品久久久久久久性| 亚洲av电影在线进入| 午夜激情久久久久久久| 丰满饥渴人妻一区二区三| 久久久久久久久久久免费av| 我的女老师完整版在线观看| 国产黄色视频一区二区在线观看| 国产在线免费精品| xxx大片免费视频| 妹子高潮喷水视频| 成年人免费黄色播放视频| 男女高潮啪啪啪动态图| 日韩精品免费视频一区二区三区 | 国产精品一二三区在线看| 天天躁夜夜躁狠狠久久av| 婷婷色综合www| 国产成人精品在线电影| av卡一久久| 91精品三级在线观看| 中文字幕最新亚洲高清| 国产精品不卡视频一区二区| 国产片内射在线| 日韩电影二区| 色哟哟·www| 免费少妇av软件| 七月丁香在线播放| tube8黄色片| 一区二区av电影网| 亚洲国产精品国产精品| 桃花免费在线播放| 免费黄频网站在线观看国产| 爱豆传媒免费全集在线观看| 国产精品麻豆人妻色哟哟久久| 色婷婷av一区二区三区视频| 国产亚洲精品第一综合不卡 | 亚洲国产看品久久| 精品久久国产蜜桃| 少妇的逼水好多| 国产激情久久老熟女| 国产xxxxx性猛交| 日韩中文字幕视频在线看片| 免费少妇av软件| 亚洲成国产人片在线观看| 高清在线视频一区二区三区| 日日撸夜夜添| 在线观看人妻少妇| 大码成人一级视频| 国产色婷婷99| 多毛熟女@视频| 成年动漫av网址| 国产男人的电影天堂91| 久久国产精品男人的天堂亚洲 | 午夜免费男女啪啪视频观看| 伦理电影免费视频| 午夜福利,免费看| 精品第一国产精品| 人人妻人人爽人人添夜夜欢视频| 久久久久久久精品精品| 久久鲁丝午夜福利片| 最近中文字幕高清免费大全6| 亚洲国产精品999| 欧美精品av麻豆av| 伦精品一区二区三区| 9色porny在线观看| 日本黄色日本黄色录像| 91精品伊人久久大香线蕉| av有码第一页| 日韩欧美精品免费久久| 制服丝袜香蕉在线| 国产精品99久久99久久久不卡 | 九九在线视频观看精品| 一本大道久久a久久精品| 国产精品久久久久久久电影| 女性被躁到高潮视频| 寂寞人妻少妇视频99o| 一本久久精品| 男女下面插进去视频免费观看 | 制服诱惑二区| 中文字幕免费在线视频6| 免费播放大片免费观看视频在线观看| 精品亚洲乱码少妇综合久久| 最近最新中文字幕免费大全7| 十八禁高潮呻吟视频| 亚洲av男天堂| 亚洲第一av免费看| 国国产精品蜜臀av免费| 免费看不卡的av| 久久热在线av| 欧美激情极品国产一区二区三区 | 纵有疾风起免费观看全集完整版| 国产精品一区www在线观看| 天天操日日干夜夜撸| 亚洲国产色片| 欧美亚洲 丝袜 人妻 在线| 久久久精品区二区三区| 日韩伦理黄色片| 三上悠亚av全集在线观看| 亚洲欧洲国产日韩| 精品人妻一区二区三区麻豆| 国产男人的电影天堂91| 热99久久久久精品小说推荐| 天美传媒精品一区二区| 日韩熟女老妇一区二区性免费视频| 亚洲成人手机| 午夜福利在线观看免费完整高清在| 99久久精品国产国产毛片| 大话2 男鬼变身卡| 秋霞在线观看毛片| 美女主播在线视频| 极品少妇高潮喷水抽搐| 自拍欧美九色日韩亚洲蝌蚪91| 一级爰片在线观看| 激情五月婷婷亚洲| 亚洲精品美女久久av网站| 美女福利国产在线| 精品熟女少妇av免费看| 亚洲欧美一区二区三区国产| 亚洲美女黄色视频免费看| 女人被躁到高潮嗷嗷叫费观| 久久久久久伊人网av| 在线观看一区二区三区激情| √禁漫天堂资源中文www| 一区二区日韩欧美中文字幕 | 在线观看www视频免费| 精品人妻在线不人妻| 亚洲av成人精品一二三区| 人妻少妇偷人精品九色| 女人久久www免费人成看片| √禁漫天堂资源中文www| 十八禁高潮呻吟视频| 91国产中文字幕| 丁香六月天网| 免费在线观看黄色视频的| 韩国高清视频一区二区三区| 天天操日日干夜夜撸| 一本大道久久a久久精品| 女性生殖器流出的白浆| 人人澡人人妻人| 美女中出高潮动态图| 日韩制服骚丝袜av| 欧美成人精品欧美一级黄| 18在线观看网站| 老司机亚洲免费影院| 人人妻人人澡人人爽人人夜夜| 日韩成人av中文字幕在线观看| 免费人成在线观看视频色| 国产精品免费大片| 国产成人午夜福利电影在线观看| 亚洲,一卡二卡三卡| 最近中文字幕2019免费版| a级毛片黄视频| 欧美亚洲 丝袜 人妻 在线| 女人被躁到高潮嗷嗷叫费观| 一本色道久久久久久精品综合| 亚洲第一av免费看| 欧美性感艳星| 五月开心婷婷网| 性色avwww在线观看| 国产成人精品久久久久久| 欧美日韩国产mv在线观看视频| 国产精品.久久久| 99热国产这里只有精品6| 晚上一个人看的免费电影| 国产女主播在线喷水免费视频网站| 两个人看的免费小视频| 秋霞伦理黄片| 亚洲成国产人片在线观看| 久久精品国产a三级三级三级| 大香蕉久久成人网| 日韩一区二区三区影片| 男的添女的下面高潮视频| 国产精品嫩草影院av在线观看| 一本—道久久a久久精品蜜桃钙片| 色94色欧美一区二区| 桃花免费在线播放| 国产无遮挡羞羞视频在线观看| a级毛片在线看网站| 一二三四中文在线观看免费高清| 一区二区日韩欧美中文字幕 | 大片电影免费在线观看免费| 乱人伦中国视频| 国产麻豆69| 在线观看一区二区三区激情| 国产高清国产精品国产三级| 伦理电影大哥的女人| 日韩免费高清中文字幕av| 日韩av不卡免费在线播放| 欧美 日韩 精品 国产| 成人国语在线视频| 国产不卡av网站在线观看| 久久 成人 亚洲| 男女免费视频国产| 热re99久久精品国产66热6| 日本vs欧美在线观看视频| 精品一区二区三卡| 天堂8中文在线网| 精品国产一区二区三区久久久樱花| 水蜜桃什么品种好| 国产欧美日韩综合在线一区二区| 成人综合一区亚洲| 最近中文字幕高清免费大全6| 国产精品久久久久久久电影| 人妻系列 视频| 亚洲国产av影院在线观看| 久久婷婷青草| 国产1区2区3区精品| 中文字幕另类日韩欧美亚洲嫩草| 99热全是精品| 国产成人91sexporn| 亚洲精品久久成人aⅴ小说| 亚洲色图综合在线观看| 亚洲av日韩在线播放| 欧美3d第一页| 国产欧美另类精品又又久久亚洲欧美| 伦精品一区二区三区| 春色校园在线视频观看| 中文欧美无线码| 黑人巨大精品欧美一区二区蜜桃 | 亚洲精品美女久久av网站| 欧美 亚洲 国产 日韩一| 街头女战士在线观看网站| 老女人水多毛片| 成人漫画全彩无遮挡| 人体艺术视频欧美日本| 国产精品一二三区在线看| 七月丁香在线播放| 国产伦理片在线播放av一区| 丰满少妇做爰视频| 这个男人来自地球电影免费观看 | 久久鲁丝午夜福利片| 免费观看无遮挡的男女| 亚洲精品美女久久av网站| 久久青草综合色| 五月开心婷婷网| 丰满少妇做爰视频| 插逼视频在线观看| 欧美 亚洲 国产 日韩一| 成人毛片60女人毛片免费| 中文乱码字字幕精品一区二区三区| 国产免费一级a男人的天堂| 国产亚洲精品久久久com| 夫妻性生交免费视频一级片| 久久精品国产综合久久久 | 校园人妻丝袜中文字幕| 久久久久国产网址| 亚洲成人手机| 精品国产露脸久久av麻豆| 国内精品宾馆在线| av网站免费在线观看视频| 久久久久国产精品人妻一区二区| freevideosex欧美| 久久99热6这里只有精品| 成人黄色视频免费在线看| 男人舔女人的私密视频| 国产精品秋霞免费鲁丝片| 狠狠精品人妻久久久久久综合| 亚洲av成人精品一二三区| 91成人精品电影| 国产男女内射视频| 国产不卡av网站在线观看| 亚洲精品久久午夜乱码| 久久精品人人爽人人爽视色| 99九九在线精品视频| 成年美女黄网站色视频大全免费| 午夜激情av网站| 超色免费av| 亚洲伊人色综图| 中文字幕最新亚洲高清| 中文字幕人妻丝袜制服| 久热久热在线精品观看| 国产国拍精品亚洲av在线观看| 久久鲁丝午夜福利片| 国产精品99久久99久久久不卡 | 日本-黄色视频高清免费观看| 9热在线视频观看99| 亚洲久久久国产精品| 亚洲色图 男人天堂 中文字幕 | 欧美精品高潮呻吟av久久| 国产国拍精品亚洲av在线观看| 另类亚洲欧美激情| 青青草视频在线视频观看| 国产一区二区激情短视频 | 尾随美女入室| 亚洲 欧美一区二区三区| 色94色欧美一区二区| 国产亚洲精品久久久com| 日韩人妻精品一区2区三区| 热re99久久精品国产66热6| 视频区图区小说| 亚洲欧美色中文字幕在线| 精品一区在线观看国产| 欧美日本中文国产一区发布| 美女内射精品一级片tv| 欧美xxⅹ黑人| 少妇熟女欧美另类| 少妇被粗大猛烈的视频| 亚洲国产精品国产精品| 日韩av免费高清视频| 欧美+日韩+精品| 精品国产国语对白av| 最近最新中文字幕大全免费视频 | 久久久精品免费免费高清| 久久综合国产亚洲精品| 久久国产精品大桥未久av| 国产亚洲一区二区精品| 一边亲一边摸免费视频| 亚洲成人av在线免费| 久久久精品区二区三区| 国产精品免费大片| 最近中文字幕2019免费版| 欧美成人精品欧美一级黄| 亚洲欧洲精品一区二区精品久久久 | 国产成人免费观看mmmm| 久热这里只有精品99| 综合色丁香网| 亚洲成色77777| 99久国产av精品国产电影| 久久久亚洲精品成人影院| 久久久精品区二区三区|