• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于MapReduce的數(shù)據(jù)立方體分區(qū)優(yōu)化算法研究

    2014-04-29 09:33張子浪葛昂鄭家民
    網(wǎng)絡(luò)空間安全 2014年4期
    關(guān)鍵詞:數(shù)據(jù)分析

    張子浪+++葛昂+++鄭家民

    【 摘 要 】 文章利用并行計算框架MapReduce,探索數(shù)據(jù)立方體的計算問題。數(shù)據(jù)立方體的計算存在兩個關(guān)鍵問題,一個是計算時間的問題,另一個是立方體的體積問題。隨著維度的增加,計算時間將呈現(xiàn)指數(shù)級的增長,立方體的體積也是如此。盡管MapReduce是一個優(yōu)秀的并行計算框架,但在處理數(shù)據(jù)傾斜時,分區(qū)算法不夠完善,導(dǎo)致一些計算任務(wù)時間過長,影響整個作業(yè)的完成時間。本文通過數(shù)據(jù)采樣的方式,優(yōu)化數(shù)據(jù)分區(qū),實驗結(jié)果表明,數(shù)據(jù)立方體的計算的性能明顯提升。為解決數(shù)據(jù)立方體體積過大的問題,在Reduce階段將最終的結(jié)果輸出到基于NoSQL的HBase數(shù)據(jù)庫進(jìn)行存儲,HBase方便水平擴(kuò)展,同時也便于日后對數(shù)據(jù)立方體的查詢。

    【 關(guān)鍵詞 】 數(shù)據(jù)立方體;數(shù)據(jù)分區(qū);數(shù)據(jù)分析

    【 文獻(xiàn)標(biāo)識碼 】 A

    1 引言

    在互聯(lián)網(wǎng)和電子商務(wù)領(lǐng)域,一些運(yùn)營商以及電子商務(wù)平臺提供商擁有大量的用戶,并以云計算的方式向用戶提供服務(wù),這些服務(wù)響應(yīng)用戶的請求,在后端產(chǎn)生相應(yīng)的數(shù)據(jù),由于數(shù)據(jù)的集中儲存以及用戶的頻繁請求,使得數(shù)據(jù)量呈現(xiàn)快速增長。在電子政務(wù)領(lǐng)域,一些政府部門根據(jù)自身信息化的發(fā)展水平及業(yè)務(wù)發(fā)展的需要,將信息化系統(tǒng)集中部署到省級機(jī)構(gòu),各地、市通過專網(wǎng)訪問。這其中信息化化建設(shè)步伐更快的政府部門,在省級集中的基礎(chǔ)上,實行全國數(shù)據(jù)的集中。在科學(xué)試驗領(lǐng)域,科學(xué)家所觀測的對象也產(chǎn)生了大量的數(shù)據(jù),比如天文學(xué)當(dāng)中利用天文望遠(yuǎn)鏡,只需幾天的時間,并能掃描半個天空。

    就這些領(lǐng)域的數(shù)據(jù)產(chǎn)生速度而言,一些IT系統(tǒng)每天產(chǎn)生TB級的數(shù)據(jù)量,有的則多達(dá)PB級。有了大量的數(shù)據(jù),就會產(chǎn)生數(shù)據(jù)挖掘的需求,包括對數(shù)據(jù)進(jìn)行匯總分析。數(shù)據(jù)立方體能夠很好地表達(dá)多維的結(jié)構(gòu)化數(shù)據(jù)的匯總分析,傳統(tǒng)的聯(lián)機(jī)分析(OLAP)技術(shù)對于立方體的計算方法也相對較為成熟。傳統(tǒng)的OLAP根據(jù)數(shù)據(jù)儲存方式的不同,可分為兩類:一類是ROLAP,以關(guān)系表進(jìn)行多維數(shù)據(jù)的表示和存儲;另一類是MOLAP,以多維數(shù)組進(jìn)行多維數(shù)據(jù)的表示和存儲。ROLAP計算數(shù)據(jù)立方體就是利用SQL中的group by語句對特定維度屬性集合的所有子集分別集合,后來引入了Cube操作,一個Cube等價于多個Group by。MOLAP計算數(shù)據(jù)立方體時基于數(shù)組對數(shù)據(jù)進(jìn)行集合,一種比較成熟的算法是多路數(shù)據(jù)聚集算法。

    盡管基于傳統(tǒng)的數(shù)據(jù)立方體的并行計算的算法比較成熟,但其不能直接應(yīng)用于大數(shù)據(jù)的計算,因為由于這些大數(shù)據(jù)基于文件系統(tǒng)存儲,而不是基于關(guān)系型數(shù)據(jù)庫存儲或者數(shù)組,而且,其數(shù)據(jù)量也大得多。

    針對大數(shù)據(jù)的分析,Google提出了map-reduce的并行計算框架,結(jié)合上千臺的廉價PC服務(wù)器,使得大數(shù)據(jù)的分析能夠在很短時間之內(nèi)完成,Hadoop是基于該編程模型的開源實現(xiàn)。 利用Hadoop進(jìn)行數(shù)據(jù)立方體進(jìn)行計算的研究相對較少,有的利用Hadoop計算數(shù)據(jù)立方體,但沒有考慮數(shù)據(jù)的優(yōu)化分區(qū),直接采用Hadoop缺省的分區(qū)方式,這種方式存在缺陷,不能讓高度傾斜的數(shù)據(jù)(少數(shù)幾個鍵值出現(xiàn)的次數(shù)占據(jù)了非常大的比例)均勻分配給各個并行的計算任務(wù),導(dǎo)致某些計算任務(wù)的輸入數(shù)據(jù)過多,從而導(dǎo)致其完成時間滯后于其它計算任務(wù),影響整個作業(yè)的完成時間。

    本文給出了基于Map-Reduce計算數(shù)據(jù)立方體的算法以及分區(qū)優(yōu)化算法,為讓數(shù)據(jù)均勻分布到各個Reduce任務(wù),采用數(shù)據(jù)抽樣的方式?jīng)Q定采用何種分區(qū)方式,為并行計算立方體提供了一種新方式。

    數(shù)據(jù)立方體有多種,完整數(shù)據(jù)立方體,冰山立方體,封閉立方體。冰山立方體和封閉立方體考慮了數(shù)據(jù)立方體的體積,減少不必要的存儲。由于封閉立方體或者冰山立方體中的某一個子立方體很可能就是一個完整的立方體,因此,計算完整立方體的過程不可避免,而且,完整立方體也是其它立方體的基礎(chǔ)。所以本文研究完整立方體的計算。

    在此先介紹并行計算、數(shù)據(jù)立方體、Hadoop的相關(guān)概念,給出通用的計算數(shù)據(jù)立方體的Hadoop實現(xiàn),在分析可能由于數(shù)據(jù)分布不平衡而導(dǎo)致的計算不平衡的基礎(chǔ)上,設(shè)計基于抽樣的分區(qū)算法。然后結(jié)合實驗對算法進(jìn)行分析。最后對當(dāng)前工作進(jìn)行總結(jié),并提出未來的可能研究方向。

    2 概念

    2.1 數(shù)據(jù)立方體

    實體關(guān)系模型主要應(yīng)用于在關(guān)系型數(shù)據(jù)庫中,這樣的二維數(shù)據(jù)模型比較適合事務(wù)處理,但是不適合數(shù)據(jù)的在線分析。在數(shù)據(jù)倉庫當(dāng)中,往往需要從多個角度對數(shù)據(jù)進(jìn)行分析,因此需要多維的數(shù)據(jù)模型,數(shù)據(jù)立方體就是用來描述多維數(shù)據(jù)模型的。

    給定基本關(guān)系R(A1,A2,A3,…,An,M),由R產(chǎn)生的數(shù)據(jù)立方體是R的屬性的所有的可能組合,n個屬性產(chǎn)生2n個組合。A1,A2,A3,…,An為立方體的屬性維,M為度量維,M是一個數(shù)字函數(shù),描述數(shù)據(jù)以何種方式進(jìn)行聚合或者計算。

    取n=3,即基本關(guān)系R(A1,A2,A3,M)產(chǎn)生的立方體由以下分組構(gòu)成:

    {(A1,A2,A3),(A1,A2),(A1,A3),(A2,A3),(A1),(A2),(A3),()}。

    度量維常見的聚合函數(shù)有SUM,MAX,MIN,AVG等。聚合函數(shù)可分為三類,分別是分布式,代數(shù)式,綜合式的??紤]對分組P中的元素進(jìn)行聚合。

    分布式的聚合函數(shù):,Pi(i=1,2,3,…n)為P的兩兩不相交的子集,即∪Pni=1=P并且□ij,i≠j,Pi∩Pj=?,如果存在函數(shù)G,使得F(P)=G(F(P1), F(P2), …,F(xiàn)(Pn)),那么稱聚合函數(shù)F為分布式式函數(shù)。COUNT(), MIN(), MAX(),SUM()都是分布式函數(shù)。除了COUNT函數(shù)外,其余三個幾個函數(shù)F=G。對于COUNT函數(shù)而言,G=SUM,即COUNT(P)=SUM(COUNT(P1), COUNT(P2), COUNT(P3),…, COUNT(Pn))。endprint

    代數(shù)式聚合函數(shù):Pi(i=1,2,3,…n)為P的兩兩不相交的子集,∪Pni=1=P并且□ij,i≠j,Pi∩Pj=?,如果存在函數(shù)G和函數(shù)H(對于所有的Pi,H函數(shù)返回一個k元組),使得F(P)=G(H (P1), H(P2), …,H (Pn)),那么稱聚合函數(shù)F為分布式式函數(shù)。AVG函數(shù)就是代數(shù)式函數(shù),對每個每個Pi,H函數(shù)返回一個二元組(sumi,counti),G函數(shù)對所有的sumi及counti分別相加,然后相除產(chǎn)生整體的平均值,即 。

    整體式聚合函數(shù):既不是分布式的函數(shù)以及代數(shù)式的函數(shù)稱之為整體式聚合函數(shù)。

    在對一個大的數(shù)據(jù)集進(jìn)行聚合時,如果聚合函數(shù)是分布式函數(shù)或者代數(shù)式函數(shù),那么可以采用分而治之的思想,可以將大的數(shù)據(jù)集為眾多小的數(shù)據(jù)集,然后對每個小的數(shù)據(jù)集進(jìn)行計算,最后對中間的計算結(jié)果進(jìn)行匯總,從而得到整體的計算結(jié)果。

    2.2 MapReduce

    MapReduce是基于非共享的并行計算模型,該模型能夠充分利用由多臺機(jī)器組成的計算、存儲、網(wǎng)絡(luò)資源并行地處理計算任務(wù), 適合處理與大數(shù)據(jù)相關(guān)的統(tǒng)計分析。

    MapReduce并行計算模型與其它并行計算相比,主要有兩個特點:一是其對串行任務(wù)與并行任務(wù)的隔離,以及計算任務(wù)能夠在各個計算節(jié)點上獨立地進(jìn)行;二是編程模型簡潔,學(xué)習(xí)成本低。MapReduce將計算分為兩個階段:Map階段和Reduce階段。首先,一個大的輸入文件被分割成M塊,分別由m個并行運(yùn)行的Map任務(wù)進(jìn)行處理,每個map任務(wù)以鍵值對的形式接收輸入,對于每一個記錄,將其轉(zhuǎn)為的形式,然后由reduce任務(wù)進(jìn)行處理,輸出鍵值對。

    2.3 NoSQL

    關(guān)系型數(shù)據(jù)庫自20世紀(jì)70年代誕生以來,在企業(yè)和政府的信息化建設(shè)中得到了廣泛的應(yīng)用,今天關(guān)系型數(shù)據(jù)依然發(fā)揮著重要的作用。然而,對于以PB衡量的大數(shù)據(jù),關(guān)系型數(shù)據(jù)庫不能很好地應(yīng)對。這些數(shù)據(jù)的特點的是數(shù)據(jù)類型多樣,包括結(jié)構(gòu)化、半結(jié)構(gòu)化,非結(jié)構(gòu)化的數(shù)據(jù),另一個特點是數(shù)據(jù)量大。非關(guān)系型的NoSQL數(shù)據(jù)庫適合這類數(shù)據(jù)的存儲。NoSQL具有三個特點:一是以Key-Value作為存儲模型;二是保證數(shù)據(jù)的最終一致性;三是在保證應(yīng)用不間斷的情況下方便實現(xiàn)水平擴(kuò)展。NoSQL數(shù)據(jù)庫主要包括Cassandra、HBase、mongoDB等。這三種作為NoSQL數(shù)據(jù)庫中的主流代表,在很多生產(chǎn)系統(tǒng)中得到了應(yīng)用,在處理大數(shù)據(jù)時,能保持很好的性能,都是較為成熟的產(chǎn)品。當(dāng)然,這幾種NoSQL數(shù)據(jù)庫的系統(tǒng)架構(gòu)不一樣,側(cè)重點也不一樣。HBase的文件系統(tǒng)基于HDFS,能與Hadoop的MapReduce并行計算框架無縫集成。由于本文選用的是Hadoop的MapReduce并行計算框架,因此NoSQL數(shù)據(jù)庫采用HBase。

    3 算法

    算法除了實現(xiàn)MapReduce中的map接口和reduce接口之外,還實現(xiàn)了getPartition分區(qū)接口。Map函數(shù)根據(jù)關(guān)系模式R的n個屬性(A1,A1,A3,...,An),形成2n個所有屬性的可能組合,再取得相應(yīng)屬性的值作為鍵值,這樣,在map階段,每條輸入記錄將產(chǎn)生2n個中間的鍵值對。為保證每個Reduce任務(wù)的負(fù)載大致相同,分區(qū)算法通過抽樣的方式,統(tǒng)計每個鍵出現(xiàn)的頻率,以每個鍵的頻率之和度量分區(qū)的負(fù)載,盡可能讓每個分區(qū)的負(fù)載大致相等。Combine函數(shù)根據(jù)具有分布式或者代數(shù)式性質(zhì)的函數(shù)M對數(shù)據(jù)進(jìn)行聚合,把中間結(jié)果中具有相同key進(jìn)行合并,形成一個鍵值對。Reduce的實現(xiàn)相與Combine相似,只是在輸出的時候有差異,Reduce將最終結(jié)果保存至HBase數(shù)據(jù)庫。

    3.1 Map/Reduce實現(xiàn)

    算法形式化描述:

    //R由n個屬性組成的關(guān)系模式

    R={A1,A2,A3…,An}

    //e為輸入文件中一條記錄

    Map(e)

    {

    //根據(jù)關(guān)系模式R和e產(chǎn)生中間的key

    //每個輸入元素e產(chǎn)生2n-1個key

    emitKeyBySubSetOfR(0,n,R,e)

    }

    emitKeyBySubSetOfR(begin,end,R)

    {

    //計算包含R[i]的子集

    for(i=begin;i

    {

    stack.push(R[i]);

    }

    //i自增,計算不包含R[i]的子集

    emitKeyBySubSetOfR(i+1,end);

    //I為R的一個子集

    I={}

    for(each o in stack)

    {

    I=I∪o

    }

    //元素e取I中的屬性形成鍵值k

    k=I(e)

    emit(k,e)

    stack.pop();

    }

    //中間結(jié)果保存到文件

    Combine(k, iterator values))

    {

    total=0;

    while(e=(values.nextvalue())

    {

    total=M(total,M(e))

    }

    emit2file(k,total);

    }

    計算最終結(jié)果并保存至hbase數(shù)據(jù)庫

    Reduce (k, iterator values))

    {

    total=0;

    while(e=(values.nextvalue())

    {

    total=M(total,M(e))

    }

    emit2hbase(k,total);

    }

    3.2 Partition實現(xiàn)

    每個Map任務(wù)會輸出一系列的以鍵值對()形式的記錄,然后由Reduce任務(wù)進(jìn)行處理。由于存在多個Reduce任務(wù),具體的一條記錄由哪個Reduce任務(wù)處理,是由分區(qū)函數(shù)決定的。Hadoop中缺省采用hash函數(shù)對Map任務(wù)輸出記錄的鍵值進(jìn)行分區(qū),由于每個分區(qū)只由一個Reduce任務(wù)處理,因此分區(qū)的數(shù)量等于Reduce任務(wù)的數(shù)量,每個Reduce任務(wù)處理一個分區(qū)。分區(qū)函數(shù)的形式描述為:

    hash (Hash code (Intermediate-key) % numReduceTasks)

    Hadoop中的Java實現(xiàn)如下:

    public class HashPartitioner extends Partitioner {

    public int getPartition(K key, V value,

    int numReduceTasks) {

    return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks;

    }

    Hash函數(shù)能夠保證每個分區(qū)中鍵(Key)的數(shù)量大致相同。假設(shè)有k個不同的鍵,由r個reduce任務(wù)處理,分區(qū)函數(shù)能夠保證每個reduce任務(wù)處理鍵的數(shù)量為k/r。然而由于有的鍵(Key)頻繁出現(xiàn),即很多記錄具有相同的鍵值,顯然,分區(qū)中包含這樣的鍵其數(shù)據(jù)量要大的多,所需的計算時間也更長。

    建設(shè)有6個鍵,分別是K1,K2,K3,K4,K5,K6,每個鍵包含的記錄數(shù)分別為1,2,3,4,5,6,這6個鍵由3個Reduce任務(wù)處理。采用hash分區(qū)策略,會形成3個分區(qū),Partition1包含K1和K4,Partition2包含K2和K5,Partiton3包含K3和K6。盡管每個分區(qū)包含鍵的數(shù)量都為2,但是每個分區(qū)的數(shù)據(jù)量不一致。Partition1包含5條記錄,Partition2包含7條記錄,Partiton3包含9條記錄。理想的情況應(yīng)該是每個分區(qū)包含7條記錄。

    為了達(dá)到圖2中均勻分區(qū)的效果,需要自定義分區(qū)函數(shù)。分區(qū)函數(shù)需要事先知道鍵的分布頻率,如果數(shù)據(jù)集比較大,掃描整個數(shù)據(jù)集并求出各個鍵的分布頻率,所需的時間比較長。可對數(shù)據(jù)集進(jìn)行抽樣,只針對一小部分?jǐn)?shù)據(jù)進(jìn)行統(tǒng)計,數(shù)據(jù)抽樣的時間與整個計算任務(wù)的時間相比,可忽略不計。

    假設(shè)一個數(shù)據(jù)集中包含k個不同Key,鍵值分別為K1,K2,K3,…,Kk,其出現(xiàn)的頻率為f(ki),共有r個Reduce任務(wù)。每個Reduce任務(wù)的負(fù)載定義為其相應(yīng)的分區(qū)的大小,分區(qū)大小可用該分區(qū)內(nèi)記錄數(shù)量大數(shù)目衡量,即分區(qū)內(nèi)各個Key的頻率之和。

    分區(qū)算法的目標(biāo)是讓各個LRi的值盡可能接近。

    R=new ArrayList();//初始時,每個Reduce的負(fù)載為0

    K = {K1, . . . , Kk};//K為待分區(qū)的key的集合

    While(K.length>0)//如果還有Key沒有分配到某個Reduce中

    { //選取頻率數(shù)最大的分配給某個Ri

    kmax = argmaxk∈Kf(k)

    //從待分區(qū)的key集合中移除

    K.remove(kmax)

    //如果存在某個Ri沒有負(fù)載

    if(R.length < r)

    { keylistofRi={};

    keylistofRi.add(kmax);

    //直接將該key分配給Ri

    R.add(keylistofRi);

    }

    //如果所有的Ri都有負(fù)載,那么將該key分配給目//前負(fù)載最小的Ri

    else

    {

    keyListOfminLRi = argminiRi∈RLRi

    R.remove(keyListOfminLRi)

    keyListOfminLRi.add(kmax)

    R.add(keyListOfminLRi)

    }

    }

    return R;

    這樣,分區(qū)函數(shù)P能夠?qū)i分配給Rj處理,記為P(Ki, Rj)。通過抽樣形成的分區(qū)方案存入分布式緩存當(dāng)中,每個map任務(wù)按照分布時緩存中的分區(qū)方案P(Ki, Rj)對數(shù)據(jù)進(jìn)行分區(qū)。

    4 實驗

    為測試數(shù)據(jù)立方體計算的空間需求和性能,采用8個節(jié)點組成的Hadoop集群,每個節(jié)點的CPU為4核3.1GZ,內(nèi)存為4GB,本地存儲為500G,操作系統(tǒng)環(huán)境為Windows Server 2003。每個節(jié)點分別運(yùn)行一個Map任務(wù)和Reduce任務(wù),輸入數(shù)據(jù)為根據(jù)Zipf分布人工合成,數(shù)據(jù)的傾斜程度通過參數(shù)z值控制,z的取值范圍是[0,1],較大的z值表明更高的傾斜程度。

    每個輸入Map接收500萬條記錄,輸入數(shù)據(jù)共4000萬條記錄。每個記錄包含4個屬性,其中一個屬性的類型為數(shù)字,作為度量維度,另三個為字符類型,作為屬性維。聚合函數(shù)采用具有分布式函數(shù)特性的sum函數(shù)。

    為在數(shù)據(jù)抽樣的比例和精確性之間進(jìn)行平衡,通過多次試驗,發(fā)現(xiàn)以5%的比例進(jìn)行抽樣時,誤差較小。按這個比例進(jìn)行數(shù)據(jù)抽樣時,數(shù)據(jù)抽樣的完成時間為[5-8]s,這個時間與幾百秒的計算任務(wù)而言,可忽略不計,以下有關(guān)完成時間的描述,均未將抽樣時間計算在內(nèi)。

    當(dāng)取z=0,即數(shù)據(jù)均勻分布,分區(qū)算法采用Hadoop中的缺省分區(qū)函數(shù)時,最快的Reduce任務(wù)用時130s,最慢的用時131s;當(dāng)采用自定義分區(qū)函數(shù)時,最快的用時132s,最慢的用時132.5s。

    當(dāng)取z=0.6,即數(shù)據(jù)出現(xiàn)較高程度的傾斜,分區(qū)算法采用Hadoop中缺省分區(qū)函數(shù)時,最快的Reduce任務(wù)用時90s,最慢的用時331s;當(dāng)采用自定義分區(qū)算法時,最快133s,最慢的用時138s。

    隨著z取更高的值,兩個分區(qū)算法性能差異明顯,一度出現(xiàn)缺省分區(qū)函數(shù)比自定義分區(qū)函數(shù)慢6倍的情況。

    顯然,自定義分區(qū)算法在輸入數(shù)據(jù)無重復(fù)的情況下,性能與默認(rèn)的分區(qū)函數(shù)相當(dāng),然而當(dāng)輸入大量重復(fù),發(fā)生傾斜時,自定義分區(qū)函數(shù)獲得的性能提升非常明顯。

    當(dāng)屬性維度分別從3增加為6和8時,不管采用何種分區(qū)算法,計算時間呈現(xiàn)指數(shù)級增長的趨勢,這主要和每個輸入記錄產(chǎn)生2n個中間記錄有關(guān)。

    5 結(jié)束語

    本文基于開源的Hadoop框架對完整數(shù)據(jù)立方體的計算進(jìn)行了初步探索。Hadoop并行計算框架非常優(yōu)秀,簡化了并行計算的編程模型,使得并行數(shù)據(jù)立方體的計算很容易實現(xiàn)。然而,數(shù)據(jù)立方體的計算性能非常重要,數(shù)據(jù)分區(qū)是影響性能的一個重要因素,因為并行計算的前提是各個計算任務(wù)的負(fù)載大致相同。Hadoop的缺省分區(qū)機(jī)制在多數(shù)場合能夠讓每個Reduce任務(wù)的負(fù)載大致相同,然而在數(shù)據(jù)高度傾斜的情況容易導(dǎo)致計算偏斜。

    本文從優(yōu)化數(shù)據(jù)分區(qū)著手,采用抽樣方式對分區(qū)算法進(jìn)行了一定優(yōu)化,當(dāng)目標(biāo)問題為分布式或者代數(shù)式的集合函數(shù)時,能夠在一定程度上解決因為數(shù)據(jù)傾斜而導(dǎo)致的數(shù)據(jù)立方體的計算性能問題。

    在系統(tǒng)架構(gòu)方面,選用HBase存儲數(shù)據(jù)立方體,以便水平擴(kuò)展,應(yīng)對數(shù)據(jù)立方體積快速增加的問題。實驗結(jié)果表明,性能提升明顯。此外,影響Hadoop的性能的因素有很多,比如集群的數(shù)量和集群中計算節(jié)點的數(shù)量,每個計算節(jié)點中運(yùn)行的map任務(wù)和reduce任務(wù)的數(shù)量,以及網(wǎng)絡(luò)帶寬的情況,還有數(shù)據(jù)復(fù)制因子的影響,這些在未來的研究中也會涉及到。

    參考文獻(xiàn)

    [1] Lammel, R.: Googles MapReduce Programming Model - Revisited[J]. Science of Computer Programming 70,2008, 1-30.

    [2] Dean, J. and Ghemawat, S. Mapreduce: simplified data processing on large clusters[J]. COMMUNICATIONS OF THE ACM 51,2008.

    [3] B. Gufler, N. Augsten, A. Reiser, and A. Kemper. Handling.

    data skew in mapreduce. In The First International Conference on Cloud Computing and Services Science,2011,574-583.

    [4] J. Gray, S. Chaudhuri, A. Bosworth, A. Layman, D. Reichart, M.Venkatrao,F(xiàn). Pellow, and H. Pirahesh. Data Cube: A Relational Operator Generalizing Group-By, Cross-Tab and Sub-Totals[J].

    Data Mining and Knowledge Discovery, 1996, 29-53.

    [5] S. Ibrahim, H. Jin, L. Lu, S. Wu, B. He, and L. Qi. LEEN:Locality/Fairness-Aware Key Partitioning for MapReduce in the Cloud. In Cloud Computing Technology and Science (CloudCom), 2010 IEEE Second International Conference on,2010,17-24.

    作者簡介:

    張子浪 (1978-),男,中國社會科學(xué)院研究生院,MBA,工程師;主要研究方向和關(guān)注領(lǐng)域:多維數(shù)據(jù)聚合。

    葛昂,男,北京大學(xué),MBA,高級工程師;主要研究方向和關(guān)注領(lǐng)域:數(shù)據(jù)挖掘、企業(yè)架構(gòu)。

    鄭家民,男,北京航空航天大學(xué),軟件工程,高級工程師;主要研究方向和關(guān)注領(lǐng)域:數(shù)據(jù)挖掘、企業(yè)架構(gòu)。endprint

    為在數(shù)據(jù)抽樣的比例和精確性之間進(jìn)行平衡,通過多次試驗,發(fā)現(xiàn)以5%的比例進(jìn)行抽樣時,誤差較小。按這個比例進(jìn)行數(shù)據(jù)抽樣時,數(shù)據(jù)抽樣的完成時間為[5-8]s,這個時間與幾百秒的計算任務(wù)而言,可忽略不計,以下有關(guān)完成時間的描述,均未將抽樣時間計算在內(nèi)。

    當(dāng)取z=0,即數(shù)據(jù)均勻分布,分區(qū)算法采用Hadoop中的缺省分區(qū)函數(shù)時,最快的Reduce任務(wù)用時130s,最慢的用時131s;當(dāng)采用自定義分區(qū)函數(shù)時,最快的用時132s,最慢的用時132.5s。

    當(dāng)取z=0.6,即數(shù)據(jù)出現(xiàn)較高程度的傾斜,分區(qū)算法采用Hadoop中缺省分區(qū)函數(shù)時,最快的Reduce任務(wù)用時90s,最慢的用時331s;當(dāng)采用自定義分區(qū)算法時,最快133s,最慢的用時138s。

    隨著z取更高的值,兩個分區(qū)算法性能差異明顯,一度出現(xiàn)缺省分區(qū)函數(shù)比自定義分區(qū)函數(shù)慢6倍的情況。

    顯然,自定義分區(qū)算法在輸入數(shù)據(jù)無重復(fù)的情況下,性能與默認(rèn)的分區(qū)函數(shù)相當(dāng),然而當(dāng)輸入大量重復(fù),發(fā)生傾斜時,自定義分區(qū)函數(shù)獲得的性能提升非常明顯。

    當(dāng)屬性維度分別從3增加為6和8時,不管采用何種分區(qū)算法,計算時間呈現(xiàn)指數(shù)級增長的趨勢,這主要和每個輸入記錄產(chǎn)生2n個中間記錄有關(guān)。

    5 結(jié)束語

    本文基于開源的Hadoop框架對完整數(shù)據(jù)立方體的計算進(jìn)行了初步探索。Hadoop并行計算框架非常優(yōu)秀,簡化了并行計算的編程模型,使得并行數(shù)據(jù)立方體的計算很容易實現(xiàn)。然而,數(shù)據(jù)立方體的計算性能非常重要,數(shù)據(jù)分區(qū)是影響性能的一個重要因素,因為并行計算的前提是各個計算任務(wù)的負(fù)載大致相同。Hadoop的缺省分區(qū)機(jī)制在多數(shù)場合能夠讓每個Reduce任務(wù)的負(fù)載大致相同,然而在數(shù)據(jù)高度傾斜的情況容易導(dǎo)致計算偏斜。

    本文從優(yōu)化數(shù)據(jù)分區(qū)著手,采用抽樣方式對分區(qū)算法進(jìn)行了一定優(yōu)化,當(dāng)目標(biāo)問題為分布式或者代數(shù)式的集合函數(shù)時,能夠在一定程度上解決因為數(shù)據(jù)傾斜而導(dǎo)致的數(shù)據(jù)立方體的計算性能問題。

    在系統(tǒng)架構(gòu)方面,選用HBase存儲數(shù)據(jù)立方體,以便水平擴(kuò)展,應(yīng)對數(shù)據(jù)立方體積快速增加的問題。實驗結(jié)果表明,性能提升明顯。此外,影響Hadoop的性能的因素有很多,比如集群的數(shù)量和集群中計算節(jié)點的數(shù)量,每個計算節(jié)點中運(yùn)行的map任務(wù)和reduce任務(wù)的數(shù)量,以及網(wǎng)絡(luò)帶寬的情況,還有數(shù)據(jù)復(fù)制因子的影響,這些在未來的研究中也會涉及到。

    參考文獻(xiàn)

    [1] Lammel, R.: Googles MapReduce Programming Model - Revisited[J]. Science of Computer Programming 70,2008, 1-30.

    [2] Dean, J. and Ghemawat, S. Mapreduce: simplified data processing on large clusters[J]. COMMUNICATIONS OF THE ACM 51,2008.

    [3] B. Gufler, N. Augsten, A. Reiser, and A. Kemper. Handling.

    data skew in mapreduce. In The First International Conference on Cloud Computing and Services Science,2011,574-583.

    [4] J. Gray, S. Chaudhuri, A. Bosworth, A. Layman, D. Reichart, M.Venkatrao,F(xiàn). Pellow, and H. Pirahesh. Data Cube: A Relational Operator Generalizing Group-By, Cross-Tab and Sub-Totals[J].

    Data Mining and Knowledge Discovery, 1996, 29-53.

    [5] S. Ibrahim, H. Jin, L. Lu, S. Wu, B. He, and L. Qi. LEEN:Locality/Fairness-Aware Key Partitioning for MapReduce in the Cloud. In Cloud Computing Technology and Science (CloudCom), 2010 IEEE Second International Conference on,2010,17-24.

    作者簡介:

    張子浪 (1978-),男,中國社會科學(xué)院研究生院,MBA,工程師;主要研究方向和關(guān)注領(lǐng)域:多維數(shù)據(jù)聚合。

    葛昂,男,北京大學(xué),MBA,高級工程師;主要研究方向和關(guān)注領(lǐng)域:數(shù)據(jù)挖掘、企業(yè)架構(gòu)。

    鄭家民,男,北京航空航天大學(xué),軟件工程,高級工程師;主要研究方向和關(guān)注領(lǐng)域:數(shù)據(jù)挖掘、企業(yè)架構(gòu)。endprint

    為在數(shù)據(jù)抽樣的比例和精確性之間進(jìn)行平衡,通過多次試驗,發(fā)現(xiàn)以5%的比例進(jìn)行抽樣時,誤差較小。按這個比例進(jìn)行數(shù)據(jù)抽樣時,數(shù)據(jù)抽樣的完成時間為[5-8]s,這個時間與幾百秒的計算任務(wù)而言,可忽略不計,以下有關(guān)完成時間的描述,均未將抽樣時間計算在內(nèi)。

    當(dāng)取z=0,即數(shù)據(jù)均勻分布,分區(qū)算法采用Hadoop中的缺省分區(qū)函數(shù)時,最快的Reduce任務(wù)用時130s,最慢的用時131s;當(dāng)采用自定義分區(qū)函數(shù)時,最快的用時132s,最慢的用時132.5s。

    當(dāng)取z=0.6,即數(shù)據(jù)出現(xiàn)較高程度的傾斜,分區(qū)算法采用Hadoop中缺省分區(qū)函數(shù)時,最快的Reduce任務(wù)用時90s,最慢的用時331s;當(dāng)采用自定義分區(qū)算法時,最快133s,最慢的用時138s。

    隨著z取更高的值,兩個分區(qū)算法性能差異明顯,一度出現(xiàn)缺省分區(qū)函數(shù)比自定義分區(qū)函數(shù)慢6倍的情況。

    顯然,自定義分區(qū)算法在輸入數(shù)據(jù)無重復(fù)的情況下,性能與默認(rèn)的分區(qū)函數(shù)相當(dāng),然而當(dāng)輸入大量重復(fù),發(fā)生傾斜時,自定義分區(qū)函數(shù)獲得的性能提升非常明顯。

    當(dāng)屬性維度分別從3增加為6和8時,不管采用何種分區(qū)算法,計算時間呈現(xiàn)指數(shù)級增長的趨勢,這主要和每個輸入記錄產(chǎn)生2n個中間記錄有關(guān)。

    5 結(jié)束語

    本文基于開源的Hadoop框架對完整數(shù)據(jù)立方體的計算進(jìn)行了初步探索。Hadoop并行計算框架非常優(yōu)秀,簡化了并行計算的編程模型,使得并行數(shù)據(jù)立方體的計算很容易實現(xiàn)。然而,數(shù)據(jù)立方體的計算性能非常重要,數(shù)據(jù)分區(qū)是影響性能的一個重要因素,因為并行計算的前提是各個計算任務(wù)的負(fù)載大致相同。Hadoop的缺省分區(qū)機(jī)制在多數(shù)場合能夠讓每個Reduce任務(wù)的負(fù)載大致相同,然而在數(shù)據(jù)高度傾斜的情況容易導(dǎo)致計算偏斜。

    本文從優(yōu)化數(shù)據(jù)分區(qū)著手,采用抽樣方式對分區(qū)算法進(jìn)行了一定優(yōu)化,當(dāng)目標(biāo)問題為分布式或者代數(shù)式的集合函數(shù)時,能夠在一定程度上解決因為數(shù)據(jù)傾斜而導(dǎo)致的數(shù)據(jù)立方體的計算性能問題。

    在系統(tǒng)架構(gòu)方面,選用HBase存儲數(shù)據(jù)立方體,以便水平擴(kuò)展,應(yīng)對數(shù)據(jù)立方體積快速增加的問題。實驗結(jié)果表明,性能提升明顯。此外,影響Hadoop的性能的因素有很多,比如集群的數(shù)量和集群中計算節(jié)點的數(shù)量,每個計算節(jié)點中運(yùn)行的map任務(wù)和reduce任務(wù)的數(shù)量,以及網(wǎng)絡(luò)帶寬的情況,還有數(shù)據(jù)復(fù)制因子的影響,這些在未來的研究中也會涉及到。

    參考文獻(xiàn)

    [1] Lammel, R.: Googles MapReduce Programming Model - Revisited[J]. Science of Computer Programming 70,2008, 1-30.

    [2] Dean, J. and Ghemawat, S. Mapreduce: simplified data processing on large clusters[J]. COMMUNICATIONS OF THE ACM 51,2008.

    [3] B. Gufler, N. Augsten, A. Reiser, and A. Kemper. Handling.

    data skew in mapreduce. In The First International Conference on Cloud Computing and Services Science,2011,574-583.

    [4] J. Gray, S. Chaudhuri, A. Bosworth, A. Layman, D. Reichart, M.Venkatrao,F(xiàn). Pellow, and H. Pirahesh. Data Cube: A Relational Operator Generalizing Group-By, Cross-Tab and Sub-Totals[J].

    Data Mining and Knowledge Discovery, 1996, 29-53.

    [5] S. Ibrahim, H. Jin, L. Lu, S. Wu, B. He, and L. Qi. LEEN:Locality/Fairness-Aware Key Partitioning for MapReduce in the Cloud. In Cloud Computing Technology and Science (CloudCom), 2010 IEEE Second International Conference on,2010,17-24.

    作者簡介:

    張子浪 (1978-),男,中國社會科學(xué)院研究生院,MBA,工程師;主要研究方向和關(guān)注領(lǐng)域:多維數(shù)據(jù)聚合。

    葛昂,男,北京大學(xué),MBA,高級工程師;主要研究方向和關(guān)注領(lǐng)域:數(shù)據(jù)挖掘、企業(yè)架構(gòu)。

    鄭家民,男,北京航空航天大學(xué),軟件工程,高級工程師;主要研究方向和關(guān)注領(lǐng)域:數(shù)據(jù)挖掘、企業(yè)架構(gòu)。endprint

    猜你喜歡
    數(shù)據(jù)分析
    電子物證檢驗的數(shù)據(jù)分析與信息應(yīng)用研究
    基于matlab曲線擬合的數(shù)據(jù)預(yù)測分析
    分眾媒體趨勢下場景營銷的商業(yè)前景
    佛山某給水管線控制測量探討
    SPSS在環(huán)境地球化學(xué)中的應(yīng)用
    大數(shù)據(jù)時代高校數(shù)據(jù)管理的思考
    新常態(tài)下集團(tuán)公司內(nèi)部審計工作研究
    淺析大數(shù)據(jù)時代對企業(yè)營銷模式的影響
    基于讀者到館行為數(shù)據(jù)分析的高校圖書館服務(wù)優(yōu)化建議
    videossex国产| 国产一区二区三区综合在线观看 | 3wmmmm亚洲av在线观看| 午夜激情久久久久久久| 中文乱码字字幕精品一区二区三区| 亚洲图色成人| 久久久久久久久久久免费av| 精品人妻视频免费看| 国产精品人妻久久久影院| 免费观看性生交大片5| 色哟哟·www| 丰满少妇做爰视频| 高清在线视频一区二区三区| 国产老妇女一区| 在线观看一区二区三区| 亚洲婷婷狠狠爱综合网| 99久久人妻综合| 黄色配什么色好看| 日本wwww免费看| 欧美一区二区亚洲| 特大巨黑吊av在线直播| 成人亚洲精品一区在线观看 | 色吧在线观看| 日韩欧美精品免费久久| 在线观看一区二区三区激情| 永久免费av网站大全| 亚洲怡红院男人天堂| av在线播放精品| 亚洲成人一二三区av| 亚洲精华国产精华液的使用体验| 国产精品成人在线| 久久6这里有精品| 一级av片app| 麻豆成人av视频| 婷婷色麻豆天堂久久| 久久精品综合一区二区三区| 久久99热6这里只有精品| 久久久欧美国产精品| 22中文网久久字幕| 久久综合国产亚洲精品| 久久久久久久国产电影| 人体艺术视频欧美日本| 各种免费的搞黄视频| 天天躁日日操中文字幕| 国产 精品1| 噜噜噜噜噜久久久久久91| 蜜臀久久99精品久久宅男| 精品国产三级普通话版| 日韩三级伦理在线观看| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 亚洲熟女精品中文字幕| 国产精品福利在线免费观看| 婷婷色综合大香蕉| 午夜福利视频精品| 中文字幕人妻熟人妻熟丝袜美| 久久女婷五月综合色啪小说 | 亚洲欧美日韩另类电影网站 | 看十八女毛片水多多多| 日韩伦理黄色片| 亚洲,一卡二卡三卡| 极品教师在线视频| 国产精品一区二区在线观看99| 最新中文字幕久久久久| 精品熟女少妇av免费看| 亚洲精品亚洲一区二区| 国产综合精华液| 又爽又黄无遮挡网站| 国产伦在线观看视频一区| 日本与韩国留学比较| 99九九线精品视频在线观看视频| 国产精品国产三级国产专区5o| 久久亚洲国产成人精品v| 国产黄色免费在线视频| 69av精品久久久久久| 欧美极品一区二区三区四区| 欧美日韩一区二区视频在线观看视频在线 | 亚洲av免费在线观看| 毛片女人毛片| 秋霞伦理黄片| 欧美日韩在线观看h| 亚洲av一区综合| 女的被弄到高潮叫床怎么办| 九九在线视频观看精品| 久久精品综合一区二区三区| 狠狠精品人妻久久久久久综合| 亚洲色图av天堂| 久久久成人免费电影| 国产在视频线精品| 精品久久久噜噜| 人妻夜夜爽99麻豆av| 日韩av免费高清视频| 亚洲人与动物交配视频| 免费看光身美女| 免费观看a级毛片全部| 91久久精品国产一区二区成人| 成年av动漫网址| 国产高清不卡午夜福利| 久久精品久久久久久噜噜老黄| 亚洲高清免费不卡视频| 成人欧美大片| 国产极品天堂在线| 一个人观看的视频www高清免费观看| 欧美极品一区二区三区四区| 日本-黄色视频高清免费观看| 久久人人爽人人爽人人片va| 亚洲精品456在线播放app| 人妻制服诱惑在线中文字幕| 免费不卡的大黄色大毛片视频在线观看| 国产亚洲精品久久久com| 在线观看一区二区三区激情| 一区二区三区精品91| 视频中文字幕在线观看| 精品人妻一区二区三区麻豆| 日本黄大片高清| 久久久精品94久久精品| 国产视频内射| 久久久久久久久久人人人人人人| 有码 亚洲区| 日韩一区二区三区影片| 一个人看的www免费观看视频| av免费在线看不卡| 久久久久国产精品人妻一区二区| www.av在线官网国产| 99热网站在线观看| 国产精品一区www在线观看| 另类亚洲欧美激情| 亚洲熟女精品中文字幕| 国内精品宾馆在线| 久久这里有精品视频免费| 蜜臀久久99精品久久宅男| 日本爱情动作片www.在线观看| 高清毛片免费看| 国产午夜福利久久久久久| 国产亚洲午夜精品一区二区久久 | 日韩制服骚丝袜av| 国产精品一区www在线观看| 91精品一卡2卡3卡4卡| 国产一区二区三区av在线| 亚洲aⅴ乱码一区二区在线播放| 99久久人妻综合| 亚洲av日韩在线播放| 国产视频首页在线观看| 如何舔出高潮| 色网站视频免费| 国产黄a三级三级三级人| 国产精品国产三级国产专区5o| 久久久久国产网址| 午夜激情久久久久久久| 在线亚洲精品国产二区图片欧美 | 亚洲欧美日韩另类电影网站 | 我的老师免费观看完整版| 久久久精品94久久精品| 国产在线一区二区三区精| 国产精品一区二区性色av| 久久影院123| 久久久久久久国产电影| 人妻夜夜爽99麻豆av| 欧美性感艳星| 真实男女啪啪啪动态图| 亚洲精品日韩av片在线观看| 国产亚洲精品久久久com| 亚洲人成网站在线观看播放| 精品一区二区免费观看| 天堂俺去俺来也www色官网| 成人免费观看视频高清| 国产成人福利小说| 久久精品国产a三级三级三级| 在线看a的网站| 国产精品精品国产色婷婷| 久久久久久久大尺度免费视频| 高清午夜精品一区二区三区| 色视频在线一区二区三区| 亚洲天堂国产精品一区在线| 自拍偷自拍亚洲精品老妇| av卡一久久| 男人添女人高潮全过程视频| 欧美日韩精品成人综合77777| 性色avwww在线观看| 天堂网av新在线| 黄色日韩在线| 中文天堂在线官网| 国产成人午夜福利电影在线观看| 欧美日韩一区二区视频在线观看视频在线 | 精品人妻熟女av久视频| 亚洲国产精品国产精品| 精品酒店卫生间| 国产精品偷伦视频观看了| 久久久久久久精品精品| 啦啦啦啦在线视频资源| 久久久久国产网址| 视频区图区小说| 久久97久久精品| 女人被狂操c到高潮| 午夜视频国产福利| 两个人的视频大全免费| 少妇丰满av| 久久人人爽av亚洲精品天堂 | 特级一级黄色大片| 亚洲国产高清在线一区二区三| av国产免费在线观看| 久久久国产一区二区| av国产久精品久网站免费入址| 亚洲精品国产av蜜桃| 午夜免费观看性视频| av天堂中文字幕网| 久久国产乱子免费精品| av免费在线看不卡| 久久午夜福利片| 99热这里只有是精品在线观看| 可以在线观看毛片的网站| 99精国产麻豆久久婷婷| 99热国产这里只有精品6| 听说在线观看完整版免费高清| 日韩 亚洲 欧美在线| 日韩电影二区| 亚洲精品乱码久久久久久按摩| 亚洲aⅴ乱码一区二区在线播放| 国产淫语在线视频| 国产精品秋霞免费鲁丝片| 97精品久久久久久久久久精品| 白带黄色成豆腐渣| 成人漫画全彩无遮挡| 亚洲不卡免费看| 亚洲一区二区三区欧美精品 | 免费av不卡在线播放| 久久久精品94久久精品| 久久精品国产鲁丝片午夜精品| 精品人妻偷拍中文字幕| 亚洲综合精品二区| 欧美人与善性xxx| 一本色道久久久久久精品综合| 99热6这里只有精品| 大陆偷拍与自拍| 欧美性感艳星| 欧美变态另类bdsm刘玥| 大码成人一级视频| 91精品国产九色| 男的添女的下面高潮视频| 女人十人毛片免费观看3o分钟| 精品视频人人做人人爽| 国产精品一及| 国产精品伦人一区二区| 午夜福利高清视频| 久久韩国三级中文字幕| 免费看光身美女| 亚洲国产欧美人成| 亚洲三级黄色毛片| 最近最新中文字幕免费大全7| 成人鲁丝片一二三区免费| 人人妻人人澡人人爽人人夜夜| 国产黄频视频在线观看| 午夜福利网站1000一区二区三区| 亚洲欧美日韩无卡精品| 国产黄a三级三级三级人| 国产成人aa在线观看| 人人妻人人澡人人爽人人夜夜| 亚洲最大成人av| 中文在线观看免费www的网站| 免费看a级黄色片| 免费观看的影片在线观看| 一个人看视频在线观看www免费| 有码 亚洲区| 精品人妻一区二区三区麻豆| 少妇人妻一区二区三区视频| 亚洲人与动物交配视频| 你懂的网址亚洲精品在线观看| av国产精品久久久久影院| 波多野结衣巨乳人妻| 最近最新中文字幕免费大全7| 晚上一个人看的免费电影| 22中文网久久字幕| 亚洲国产色片| 欧美三级亚洲精品| 97热精品久久久久久| 欧美人与善性xxx| 亚洲欧洲日产国产| 在线观看人妻少妇| 国产成人免费观看mmmm| 一级av片app| 亚洲激情五月婷婷啪啪| 亚洲成人久久爱视频| av.在线天堂| 六月丁香七月| 亚洲色图av天堂| 欧美日韩视频高清一区二区三区二| 中文字幕久久专区| 国产极品天堂在线| 亚洲精品色激情综合| 亚洲欧美成人综合另类久久久| 国产免费视频播放在线视频| 亚洲精品456在线播放app| 麻豆成人av视频| 少妇丰满av| 亚洲aⅴ乱码一区二区在线播放| 丝瓜视频免费看黄片| av天堂中文字幕网| 一本色道久久久久久精品综合| 日本一二三区视频观看| 国产免费又黄又爽又色| 亚洲精品久久久久久婷婷小说| 丰满乱子伦码专区| 99热6这里只有精品| av在线亚洲专区| 日韩中字成人| 少妇猛男粗大的猛烈进出视频 | 日本免费在线观看一区| 国产精品人妻久久久影院| 欧美xxxx性猛交bbbb| 高清午夜精品一区二区三区| 国语对白做爰xxxⅹ性视频网站| 人人妻人人爽人人添夜夜欢视频 | 久久99精品国语久久久| 午夜激情福利司机影院| 亚洲一区二区三区欧美精品 | 亚洲精品日韩av片在线观看| 国产精品伦人一区二区| 日本色播在线视频| 国产v大片淫在线免费观看| 自拍偷自拍亚洲精品老妇| 最近的中文字幕免费完整| 国产成人精品久久久久久| videossex国产| 成年版毛片免费区| av卡一久久| www.av在线官网国产| 欧美日韩视频高清一区二区三区二| 欧美潮喷喷水| 国产黄频视频在线观看| 国产精品成人在线| 高清日韩中文字幕在线| 欧美成人a在线观看| 在线观看人妻少妇| 草草在线视频免费看| 欧美 日韩 精品 国产| freevideosex欧美| 精品人妻熟女av久视频| 亚洲激情五月婷婷啪啪| 日韩一区二区三区影片| 婷婷色麻豆天堂久久| 最近2019中文字幕mv第一页| 亚洲精品日韩在线中文字幕| 99热这里只有是精品在线观看| 亚洲av国产av综合av卡| 人妻系列 视频| 日韩av在线免费看完整版不卡| 国产人妻一区二区三区在| 国内精品美女久久久久久| 久久国内精品自在自线图片| 大话2 男鬼变身卡| 国产精品一区www在线观看| 1000部很黄的大片| 国产精品99久久99久久久不卡 | 丝袜脚勾引网站| 日本黄大片高清| 热99国产精品久久久久久7| 国产熟女欧美一区二区| 2021少妇久久久久久久久久久| 夜夜看夜夜爽夜夜摸| 一区二区三区乱码不卡18| 国产老妇女一区| 日韩欧美精品免费久久| 欧美xxⅹ黑人| 乱系列少妇在线播放| 午夜福利高清视频| 日韩一区二区三区影片| 深夜a级毛片| 免费看av在线观看网站| 日本午夜av视频| 欧美成人精品欧美一级黄| 日韩欧美精品v在线| 久久精品久久久久久久性| 亚洲欧美精品专区久久| 国产欧美日韩一区二区三区在线 | 天堂网av新在线| 五月玫瑰六月丁香| 男女无遮挡免费网站观看| 中文精品一卡2卡3卡4更新| 天堂网av新在线| 久久人人爽人人爽人人片va| 看黄色毛片网站| 激情 狠狠 欧美| 免费av观看视频| 激情 狠狠 欧美| 91狼人影院| 国产黄片视频在线免费观看| 一个人看的www免费观看视频| 亚洲婷婷狠狠爱综合网| 免费观看在线日韩| 熟女人妻精品中文字幕| 国产精品偷伦视频观看了| 又爽又黄无遮挡网站| 五月伊人婷婷丁香| 日本三级黄在线观看| www.色视频.com| 观看免费一级毛片| 大片电影免费在线观看免费| 赤兔流量卡办理| 欧美另类一区| 欧美激情国产日韩精品一区| 毛片一级片免费看久久久久| 插逼视频在线观看| 久久久久精品性色| 日日啪夜夜撸| 亚洲av不卡在线观看| 日韩精品有码人妻一区| 国产色爽女视频免费观看| 国产男人的电影天堂91| 小蜜桃在线观看免费完整版高清| 色视频在线一区二区三区| 国产欧美亚洲国产| 一本久久精品| 天天躁夜夜躁狠狠久久av| 99热6这里只有精品| av播播在线观看一区| 久久久久久久大尺度免费视频| 亚洲美女视频黄频| 最近最新中文字幕大全电影3| 国产精品人妻久久久影院| 成人欧美大片| 欧美日韩视频高清一区二区三区二| 成人高潮视频无遮挡免费网站| 国产精品久久久久久av不卡| 国产成人精品久久久久久| 乱系列少妇在线播放| 日韩一区二区视频免费看| 成人特级av手机在线观看| 97超碰精品成人国产| 久久99热这里只频精品6学生| 黄色一级大片看看| 亚洲精品国产av成人精品| 在线天堂最新版资源| 久久久久网色| 国产精品福利在线免费观看| 亚洲精品乱码久久久v下载方式| 免费电影在线观看免费观看| 成人欧美大片| 天美传媒精品一区二区| .国产精品久久| 美女cb高潮喷水在线观看| 中文天堂在线官网| 婷婷色av中文字幕| 九九久久精品国产亚洲av麻豆| 最近最新中文字幕大全电影3| 一边亲一边摸免费视频| 伦精品一区二区三区| 国精品久久久久久国模美| 精品国产一区二区三区久久久樱花 | 一级毛片 在线播放| 尤物成人国产欧美一区二区三区| 国产国拍精品亚洲av在线观看| 另类亚洲欧美激情| 69av精品久久久久久| 夜夜看夜夜爽夜夜摸| 看黄色毛片网站| 国产精品精品国产色婷婷| www.av在线官网国产| 一级毛片我不卡| 欧美精品人与动牲交sv欧美| 免费看日本二区| 国产伦精品一区二区三区视频9| 国产久久久一区二区三区| 18禁裸乳无遮挡动漫免费视频 | 一二三四中文在线观看免费高清| 国产熟女欧美一区二区| 秋霞在线观看毛片| 日韩伦理黄色片| av在线老鸭窝| 久久影院123| 白带黄色成豆腐渣| 中文乱码字字幕精品一区二区三区| 日产精品乱码卡一卡2卡三| 久久久久久久大尺度免费视频| 七月丁香在线播放| 国产精品人妻久久久久久| av国产精品久久久久影院| 高清午夜精品一区二区三区| 99热6这里只有精品| 26uuu在线亚洲综合色| 又黄又爽又刺激的免费视频.| 国产视频首页在线观看| 国产黄片美女视频| 国产人妻一区二区三区在| 欧美日韩在线观看h| 又爽又黄a免费视频| 一边亲一边摸免费视频| 免费看光身美女| 男插女下体视频免费在线播放| 男人舔奶头视频| 女的被弄到高潮叫床怎么办| 大码成人一级视频| 特级一级黄色大片| 免费观看的影片在线观看| 2022亚洲国产成人精品| 熟妇人妻不卡中文字幕| 麻豆国产97在线/欧美| 日本熟妇午夜| 日韩亚洲欧美综合| 深夜a级毛片| 在线观看人妻少妇| 久久影院123| 国产男女超爽视频在线观看| 97精品久久久久久久久久精品| 精品国产乱码久久久久久小说| 国产 一区 欧美 日韩| 亚洲最大成人av| 波野结衣二区三区在线| 国产精品一区www在线观看| 亚洲精品成人久久久久久| 国产成人精品一,二区| 欧美性猛交╳xxx乱大交人| 国产男女超爽视频在线观看| 一级黄片播放器| 亚洲国产av新网站| 99久久精品一区二区三区| 嫩草影院新地址| 永久网站在线| 美女视频免费永久观看网站| 一本色道久久久久久精品综合| 国产精品不卡视频一区二区| 午夜老司机福利剧场| 午夜日本视频在线| 亚洲国产精品国产精品| 国产高清国产精品国产三级 | 亚洲一级一片aⅴ在线观看| 国产成人午夜福利电影在线观看| 搡老乐熟女国产| 色5月婷婷丁香| 色视频在线一区二区三区| 伦精品一区二区三区| 久久综合国产亚洲精品| kizo精华| 嫩草影院精品99| 亚洲精品一二三| 中国国产av一级| 欧美激情国产日韩精品一区| av国产精品久久久久影院| 看十八女毛片水多多多| 成人无遮挡网站| 高清午夜精品一区二区三区| 亚洲av免费高清在线观看| 亚洲精品aⅴ在线观看| 亚洲欧美中文字幕日韩二区| 亚洲精品自拍成人| 久久99热6这里只有精品| 亚洲精品日韩av片在线观看| 国产91av在线免费观看| 一级毛片 在线播放| 免费少妇av软件| 欧美国产精品一级二级三级 | av女优亚洲男人天堂| 男人舔奶头视频| 国产精品久久久久久精品古装| 精品国产乱码久久久久久小说| 国产日韩欧美亚洲二区| 激情 狠狠 欧美| 你懂的网址亚洲精品在线观看| 啦啦啦啦在线视频资源| 欧美精品国产亚洲| 女人久久www免费人成看片| 最近2019中文字幕mv第一页| 国产成人91sexporn| 色5月婷婷丁香| 亚洲av免费高清在线观看| 3wmmmm亚洲av在线观看| 成人午夜精彩视频在线观看| 丰满少妇做爰视频| 街头女战士在线观看网站| 国产免费又黄又爽又色| 国产免费视频播放在线视频| 神马国产精品三级电影在线观看| 免费黄频网站在线观看国产| 日本av手机在线免费观看| 边亲边吃奶的免费视频| 别揉我奶头 嗯啊视频| 在线观看国产h片| av.在线天堂| 欧美日韩亚洲高清精品| 久久久久久国产a免费观看| 国产高清不卡午夜福利| 免费看av在线观看网站| 国产男女内射视频| 欧美最新免费一区二区三区| 热re99久久精品国产66热6| 在线观看三级黄色| 岛国毛片在线播放| 少妇人妻精品综合一区二区| 最近最新中文字幕免费大全7| 国产成人freesex在线| 亚洲国产色片| 久久久成人免费电影| 国产成人一区二区在线| 亚洲国产精品成人久久小说| 99久久精品热视频| 久久久久久久久久成人| 久久久久网色| 精品一区二区免费观看| 久久精品国产亚洲av涩爱| 国产精品99久久99久久久不卡 | 亚洲精品一二三| 男人和女人高潮做爰伦理| 日本午夜av视频| 国产又色又爽无遮挡免| 美女cb高潮喷水在线观看| 日韩伦理黄色片| 欧美老熟妇乱子伦牲交| 老司机影院成人| 国产精品秋霞免费鲁丝片| 麻豆成人av视频| 亚洲成人久久爱视频| 日韩大片免费观看网站| 国产毛片a区久久久久| 99热全是精品| 午夜激情久久久久久久| av天堂中文字幕网| 91精品国产九色|