• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    樹狀結(jié)構(gòu)大數(shù)據(jù)類型的高效支持

    2018-08-15 05:50:00陳世敏
    大數(shù)據(jù) 2018年4期
    關(guān)鍵詞:數(shù)據(jù)類型樹狀嵌套

    陳世敏

    中國科學(xué)院計算技術(shù)研究所,北京 100190

    1 引言

    大數(shù)據(jù)產(chǎn)業(yè)是全球高科技競爭的前沿領(lǐng)域。大數(shù)據(jù)技術(shù)的推廣應(yīng)用對國家經(jīng)濟、政治、法治、科技、文化、教育、民生、社會、生態(tài)文明、國家安全等方面,都會產(chǎn)生深遠(yuǎn)的影響。傳統(tǒng)的關(guān)系數(shù)據(jù)模型從20世紀(jì)70年代出現(xiàn)至今,在商用數(shù)據(jù)處理方面得到了廣泛的應(yīng)用。但是,關(guān)系模型的簡單、扁平的二維表結(jié)構(gòu)無法滿足各行各業(yè)(如社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)、醫(yī)療生物、金融等)日益豐富的大數(shù)據(jù)表達(dá)和處理的需求。于是,實踐中涌現(xiàn)了多種非傳統(tǒng)的大數(shù)據(jù)類型,出現(xiàn)了一批支持非傳統(tǒng)數(shù)據(jù)類型的大數(shù)據(jù)系統(tǒng),被統(tǒng)稱為NoSQL數(shù)據(jù)庫系統(tǒng)。其中,應(yīng)用最廣泛的是鍵值對(keyvalue)數(shù)據(jù)類型、圖(graph)數(shù)據(jù)類型和以JSON(JavaScript object notation)等為代表的樹狀結(jié)構(gòu)數(shù)據(jù)類型(treestructured data type)。

    樹狀結(jié)構(gòu)數(shù)據(jù)類型可直觀地表達(dá)高級程序設(shè)計語言中類(class)、結(jié)構(gòu)(struct)等豐富的結(jié)構(gòu),能夠簡潔地支持嵌套、多值和缺值,已被廣泛應(yīng)用于社交網(wǎng)絡(luò)數(shù)據(jù)服務(wù)、Web服務(wù)、數(shù)據(jù)交換格式、分布式系統(tǒng)協(xié)議、物聯(lián)網(wǎng)等,是一種重要的大數(shù)據(jù)類型。實踐中常見的樹狀結(jié)構(gòu)數(shù)據(jù)類型有JSON、Protocol Buffers等。JSON是JavaScript語言標(biāo)準(zhǔn)的一個子集,常常作為數(shù)據(jù)輸出和數(shù)據(jù)交換的類型。Protocol Buffers是Google公司推出的一種數(shù)據(jù)類型,是實現(xiàn)分布式系統(tǒng)內(nèi)部通信協(xié)議的數(shù)據(jù)格式,也是Google公司的Dremel[1]和BigQuery[2]等大數(shù)據(jù)系統(tǒng)的數(shù)據(jù)類型。

    本文將對以JSON為代表的樹狀結(jié)構(gòu)大數(shù)據(jù)類型進(jìn)行深入介紹,首先舉例說明樹狀結(jié)構(gòu)大數(shù)據(jù)的含義,然后從多個角度說明樹狀結(jié)構(gòu)大數(shù)據(jù)的價值和意義,最后結(jié)合筆者近期的研究工作,說明樹狀結(jié)構(gòu)大數(shù)據(jù)類型的處理和支持。

    2 樹狀結(jié)構(gòu)大數(shù)據(jù)類型

    樹狀結(jié)構(gòu)大數(shù)據(jù)類型包括多種新型數(shù)據(jù)類型,例如JSON、Protocol Buffers、Apache Avro等。這些數(shù)據(jù)類型的具體表現(xiàn)形式不同,但是它們都可以表達(dá)嵌套、多值、缺值等豐富復(fù)雜的記錄結(jié)構(gòu),具有相似的結(jié)構(gòu)特點,可以互相轉(zhuǎn)化。它們的記錄結(jié)構(gòu)都可以采用語法樹來表達(dá),因此將它們統(tǒng)稱為樹狀結(jié)構(gòu)大數(shù)據(jù)類型。

    以JSON為例,一個JSON類型的數(shù)據(jù)記錄如下:

    JSON用花括號、方括號、引號、冒號、逗號等標(biāo)點符號來表達(dá)記錄的結(jié)構(gòu)。具體而言,花括號表示一個對象,對象的多個屬性以逗號隔開。方括號表示一個數(shù)組,數(shù)組的多個元素以逗號隔開。一個屬性由屬性名和屬性值組成,兩者由冒號隔開,屬性名以引號標(biāo)注,屬性值可以是原子的字符串、數(shù)值、布爾值等類型,也可以是嵌套的對象或數(shù)組。在這個例子中,記錄是一個對象,由3個頂層屬性geo、retweet_count和user組成。geo屬性的屬性值是一個嵌套對象,內(nèi)部只有一個coordinates屬性,其屬性值是一個數(shù)組,數(shù)組的每個元素是一個數(shù)值;retweet_count屬性的屬性值是一個數(shù)值;user屬性的屬性值是一個嵌套對象,包括status、favorite、followers和id 4個屬性,而這4個屬性的屬性值都是數(shù)值。

    將上述記錄的內(nèi)部結(jié)構(gòu)表達(dá)為一棵樹,如圖1所示。

    樹根代表整個記錄。樹中的一個節(jié)點對應(yīng)記錄中的一個屬性,葉子節(jié)點對應(yīng)屬性值為原子類型的屬性,而非葉子節(jié)點則對應(yīng)屬性值是嵌套值的屬性?;疑墓?jié)點代表多值,即數(shù)組的情況。在這個例子中,最高層的3個屬性geo、retweet_count和user對應(yīng)根的3個孩子節(jié)點。其中,retweet_count的屬性值是原子的數(shù)值類型,因此retweet_count節(jié)點沒有孩子節(jié)點,是一個葉子節(jié)點。user的屬性值是一個嵌套對象,由status、favorite、followers和id 4個屬性組成,因此user節(jié)點有4個孩子節(jié)點。而這4個屬性的屬性值都是原子類型,因此它們都是葉子節(jié)點。geo屬性的屬性值是一個嵌套對象,包括一個coordinates屬性,因此geo節(jié)點有一個coordinates孩子節(jié)點。coordinates屬性的屬性值是一個數(shù)組,而數(shù)組的每個元素是原子類型,用灰色的coordinates節(jié)點表達(dá)數(shù)組,該節(jié)點沒有孩子,是葉子節(jié)點。

    JSON、Protocol Buffers、Apache Avro等多種樹狀結(jié)構(gòu)數(shù)據(jù)類型都可以把記錄結(jié)構(gòu)表達(dá)為語法樹的形式??梢酝ㄟ^如下遞歸定義更確切地表達(dá)樹狀數(shù)據(jù)類型Ttree:

    由圖6、圖7和表4知,各目標(biāo)函數(shù)隨著算法迭代次數(shù)的增加不斷減小,EMBBO算法較3種MBBO算法、GA的收斂性和搜索效率更好,輸出的解集質(zhì)量更優(yōu)。

    圖1 對應(yīng)于JSON記錄實例的語法樹

    一個樹狀數(shù)據(jù)記錄可以遞歸地表達(dá)為一棵樹,Ttree是樹根,樹根必須是Tobject,每個Tobject由屬性名key和屬性值value組成。除了Tobject,還定義了數(shù)組Tarray和原子類型Tprimitive。而value類型則可以遞歸地定義為原子類型、對象類型、數(shù)組類型。樹狀結(jié)構(gòu)數(shù)據(jù)類型可以表達(dá)多層復(fù)雜的嵌套,每層嵌套表現(xiàn)為樹的一個內(nèi)部節(jié)點,而樹的葉子節(jié)點是原子類型。

    3 實用價值

    與關(guān)系數(shù)據(jù)模型相比,樹狀結(jié)構(gòu)大數(shù)據(jù)類型的每個記錄具有更加靈活豐富的結(jié)構(gòu),因此在實踐中得到了廣泛的應(yīng)用。例如,社交網(wǎng)絡(luò)數(shù)據(jù)服務(wù)Twitter等輸出的數(shù)據(jù)類型就是JSON,Web 2.0 RESTful架構(gòu)中推薦的數(shù)據(jù)交換格式是JSON,許多提供公共數(shù)據(jù)下載的網(wǎng)站可以使用JSON下載數(shù)據(jù),Apache Hadoop、HBase等開源大數(shù)據(jù)系統(tǒng)中分布式通信協(xié)議采用了Protocol Buffers來實現(xiàn)。此外,許多物聯(lián)網(wǎng)單片機芯片(如Arduino、DragonBoard、BeagleBone等)支持JSON格式的數(shù)據(jù)輸出。大量的原始數(shù)據(jù)是樹狀結(jié)構(gòu)數(shù)據(jù)類型。

    樹狀結(jié)構(gòu)大數(shù)據(jù)類型的3個主要特點使其具有廣泛的實用價值,具體如下。

    (1)豐富的結(jié)構(gòu)

    樹狀結(jié)構(gòu)大數(shù)據(jù)類型支持嵌套、多值、缺值等豐富的結(jié)構(gòu),可以非常方便地表達(dá)程序設(shè)計語言中“對象”等復(fù)雜類型的數(shù)據(jù),例如C語言中的struct、C++/Java等語言中的class、Python語言中的dictionary等類型。因此,可以采用樹狀結(jié)構(gòu)大數(shù)據(jù)類型自然地對應(yīng)用程序的內(nèi)存數(shù)據(jù)結(jié)構(gòu)進(jìn)行序列化,便于寫入外存和進(jìn)行網(wǎng)絡(luò)通信,并保持原始內(nèi)存數(shù)據(jù)結(jié)構(gòu)的特征。與之相比,關(guān)系數(shù)據(jù)模型采用簡單、扁平的記錄結(jié)構(gòu),記錄的每個屬性都是原子類型,因此對于應(yīng)用程序數(shù)據(jù)結(jié)構(gòu)中的嵌套、多值等情況來說,必須采用特殊的編碼,將數(shù)據(jù)轉(zhuǎn)換為關(guān)系數(shù)據(jù)模型允許的記錄格式,才可以完成序列化??梢?,樹狀結(jié)構(gòu)大數(shù)據(jù)類型豐富的結(jié)構(gòu)可以更好地支持大數(shù)據(jù)時代多種多樣的應(yīng)用。

    (2)靈活的類型

    JSON類型不需要事先定義記錄的類型就可以直接使用。關(guān)系數(shù)據(jù)庫中先要采用create table建立數(shù)據(jù)表,才可以加載或插入數(shù)據(jù)記錄。而在JSON中,數(shù)據(jù)記錄的結(jié)構(gòu)是在每條記錄中定義的。如第2節(jié)中的例子,JSON采用標(biāo)點符號定義每條記錄的具體結(jié)構(gòu)。因此,JSON允許靈活地增、刪、改記錄結(jié)構(gòu),允許將多種結(jié)構(gòu)的記錄放入相同的數(shù)據(jù)集,這可以簡化很多大數(shù)據(jù)應(yīng)用領(lǐng)域的數(shù)據(jù)存儲和管理。例如,在數(shù)據(jù)采集中,經(jīng)常遇到同種數(shù)據(jù)可能有很多小的類別的情況,雖然所有數(shù)據(jù)都有一些公共屬性,但是不同類別還包括許多各自特殊的屬性。在這種情況下,如果采用關(guān)系模型,就需要為每個小類別采用create table建立一個新表,數(shù)據(jù)存儲和后續(xù)的數(shù)據(jù)處理就需要面對大量的關(guān)系表,使整個過程十分繁雜。而采用JSON樹狀結(jié)構(gòu)數(shù)據(jù)類型,就可以把所有小類別的數(shù)據(jù)記錄都存儲在一個數(shù)據(jù)集中,每個記錄允許不同的屬性(實際上是允許許多缺值的屬性)在一個數(shù)據(jù)集中對所有數(shù)據(jù)進(jìn)行統(tǒng)一的管理,大大簡化了數(shù)據(jù)管理、編程處理的成本。

    (3)低廉的成本

    XML也可以表達(dá)豐富的嵌套、多值結(jié)構(gòu)。實際上,數(shù)據(jù)庫領(lǐng)域一直希望推動XML成為應(yīng)用數(shù)據(jù)存儲和交換的標(biāo)準(zhǔn)。但是,XML的表達(dá)引入了很高的成本,包括DTD類型的定義和解析、XML標(biāo)簽占用的空間等。與之相比,JSON等樹狀結(jié)構(gòu)數(shù)據(jù)類型更加簡潔輕量。以JSON為例,記錄結(jié)構(gòu)采用簡單的標(biāo)點符號來表達(dá),便于人的理解和程序的解析,而且這種表達(dá)方式引入的空間開銷很小。因此,在實踐中JSON等樹狀結(jié)構(gòu)數(shù)據(jù)類型已經(jīng)逐漸取代了XML,成為事實上數(shù)據(jù)存儲和交換的標(biāo)準(zhǔn)。

    4 理論意義

    樹狀結(jié)構(gòu)大數(shù)據(jù)類型不僅具有很強的實用價值,而且具有重要的理論意義,主要表現(xiàn)為以下兩個方面。

    (1)關(guān)系數(shù)據(jù)模型的第4次變革

    (2)一種通用的大數(shù)據(jù)模型

    樹狀數(shù)據(jù)結(jié)構(gòu)類型可以表達(dá)豐富的結(jié)構(gòu),包括嵌套、多值、缺值等結(jié)構(gòu)。相對于單個鍵值對、單個圖的頂點、單條圖的邊、單個圖的屬性、單條關(guān)系型記錄等,單條樹狀結(jié)構(gòu)的數(shù)據(jù)記錄的結(jié)構(gòu)可以更加豐富復(fù)雜。因此,實際上很容易把鍵值對、圖的頂點、邊、屬性和關(guān)系型記錄寫成樹狀數(shù)據(jù)結(jié)構(gòu)類型的數(shù)據(jù),而且可能有多種不同的寫法,從而可能以樹狀結(jié)構(gòu)大數(shù)據(jù)類型為基礎(chǔ),實現(xiàn)對其他流行的大數(shù)據(jù)類型的支持。因此,樹狀結(jié)構(gòu)大數(shù)據(jù)類型是一種通用的大數(shù)據(jù)模型。

    樹狀結(jié)構(gòu)大數(shù)據(jù)類型具有很強的表達(dá)能力,其難點在于如何高效地支持樹狀大數(shù)據(jù)類型的存儲和運算,以支持其豐富、靈活的結(jié)構(gòu)。

    5 現(xiàn)有的樹狀結(jié)構(gòu)數(shù)據(jù)處理系統(tǒng)

    現(xiàn)有的樹狀結(jié)構(gòu)數(shù)據(jù)處理系統(tǒng)主要有以下3種。

    (1)擴展關(guān)系型數(shù)據(jù)庫系統(tǒng)

    主流的關(guān)系數(shù)據(jù)庫系統(tǒng)Oracle、Microsoft SQL Server、IBM DB2和開源數(shù)據(jù)庫系統(tǒng)PostgreSQL等都擴展了對JSON的支持。基本思路是將整個JSON記錄以文本或者二進(jìn)制格式存放在關(guān)系表的單個屬性中,提供內(nèi)置函數(shù),支持JSON的解析和訪問,從而可以在SQL語句中動態(tài)地解析JSON記錄,提取JSON屬性值,并用于SQL查詢[4],這也是SQL/JSON工作組的基本解決方案。但是,這種解決方案對數(shù)據(jù)分析的支持較差。數(shù)據(jù)分析操作通常只關(guān)心JSON記錄的少量屬性,存儲和讀取整條JSON記錄會導(dǎo)致大量不必要的I/O訪問。而且,每次執(zhí)行SQL查詢語句,都要動態(tài)地解析JSON記錄,引入很大的性能開銷。

    (2)行式樹狀結(jié)構(gòu)數(shù)據(jù)處理系統(tǒng)

    以MongoDB為代表的文檔存儲(document store)系統(tǒng)支持JSON的行式存儲和處理。MongoDB是通過C/C++實現(xiàn)的,采用二進(jìn)制的BSON格式存儲JSON記錄。對于JSON的屬性名,BSON仍然存儲其字符串;而對于JSON的原子屬性值,BSON采用二進(jìn)制存儲。MongoDB提供一組JavaScript編程界面,可以執(zhí)行與SQL查詢功能相當(dāng)?shù)牟僮?。和擴展關(guān)系型數(shù)據(jù)庫系統(tǒng)相似,由于采用行式存儲,數(shù)據(jù)分析操作會導(dǎo)致大量的I/O開銷。此外,在訪問JSON嵌套結(jié)構(gòu)時,MongoDB需要在每個嵌套層次進(jìn)行字符串比較,搜索對應(yīng)的屬性名,性能代價較大。

    (3)列式樹狀結(jié)構(gòu)數(shù)據(jù)處理系統(tǒng)

    Google Dremel提出了Protocol Buffers數(shù)據(jù)的列式存儲編碼方式[1]。Apache Parquet是Dremel的開源實現(xiàn),支持Parquet格式的文件存取和訪問。與Apache Hive結(jié)合,就可以將數(shù)據(jù)存放在Parquet列式文件中,并利用Hive實現(xiàn)基于MapReduce的SQL查詢,對大規(guī)模的樹狀數(shù)據(jù)進(jìn)行分析。由于采用了列式存儲,Parquet可以有效地避免讀取不相關(guān)屬性的I/O操作。但其基于MapReduce和Java的實現(xiàn)影響了查詢的效率。

    上述3種系統(tǒng)都采用完全通用的設(shè)計,為了支持樹狀結(jié)構(gòu)數(shù)據(jù)類型可能出現(xiàn)的豐富、復(fù)雜的嵌套和多值結(jié)構(gòu),引入了復(fù)雜的算法。例如,為了把多個分別存儲的數(shù)據(jù)列組裝還原成原始記錄,Dremel的組裝算法要建立一個有限狀態(tài)自動機,根據(jù)自動機和列式文件中的特殊編碼完成組裝。除了上述討論每種系統(tǒng)各自的性能問題外,這種完全通用的解決方案本身也存在相對高昂的代價。

    6 樹狀大數(shù)據(jù)的高效支持:赤兔

    筆者設(shè)計實現(xiàn)了一個樹狀結(jié)構(gòu)數(shù)據(jù)管理系統(tǒng)——赤兔(system for tree structured data, Steed)[5]。Steed是采用C/C++語言實現(xiàn)的,支持通用的樹狀結(jié)構(gòu)數(shù)據(jù)存儲和類似SQL的查詢處理,包括選擇、投影、連接、分組、聚集、排序等多種運算。Steed同時支持行式和列式的樹狀結(jié)構(gòu)數(shù)據(jù)存儲,以適應(yīng)不同類型應(yīng)用的需要。系統(tǒng)能夠自動提取JSON的語法樹,從而有效地壓縮了對屬性名的存儲。圖2展示了Steed的系統(tǒng)結(jié)構(gòu),主要包括數(shù)據(jù)解析模塊、數(shù)據(jù)存儲模塊和查詢執(zhí)行模塊。數(shù)據(jù)解析模塊讀取并解析文本的JSON或Protocol Buffers數(shù)據(jù),將其轉(zhuǎn)化為行式或者列式的二進(jìn)制格式,存儲在數(shù)據(jù)存儲模塊中。數(shù)據(jù)存儲模塊存儲行式或列式二進(jìn)制數(shù)據(jù),支持兩種格式數(shù)據(jù)的相互轉(zhuǎn)換。查詢執(zhí)行模塊支持類SQL的查詢,支持行式和列式數(shù)據(jù)的查詢處理。整個查詢執(zhí)行采用傳統(tǒng)關(guān)系型數(shù)據(jù)庫中查詢樹的方式實現(xiàn)。

    (1)簡單路徑及其優(yōu)化

    圖2 Steed系統(tǒng)結(jié)構(gòu)

    通過對現(xiàn)實的樹狀結(jié)構(gòu)數(shù)據(jù)進(jìn)行分析,提出了一種頻繁子模式——簡單路徑(simple path)。在樹狀結(jié)構(gòu)數(shù)據(jù)的語法樹中,存在許多從樹根到葉子的路徑。如果在根到葉子的路徑上存在很多的多值(數(shù)組)節(jié)點,那么其存儲和處理就要考慮很多可能出現(xiàn)的情況,相對復(fù)雜。相反,當(dāng)路徑中不存在多值節(jié)點或僅存在一個多值節(jié)點時,就有可能進(jìn)行簡化的處理。這種一條包含最多一個多值節(jié)點的從樹根到葉子的路徑就是簡單路徑。筆者分析了現(xiàn)實的樹狀結(jié)構(gòu)數(shù)據(jù)的結(jié)構(gòu),發(fā)現(xiàn)簡單路徑大量存在。例如,Twitter數(shù)據(jù)的語法樹中包含203個葉子節(jié)點,其中195個葉子節(jié)點對應(yīng)的路徑是簡單的,即96%的路徑是簡單路徑。此外,還分析了Yahoo、IMDB、Sina Weibo等多種表述性狀態(tài)傳遞(representational state transfer,REST)服務(wù)數(shù)據(jù),發(fā)現(xiàn)超過99%的路徑是簡單的。其中,Sina Weibo提供104種不同的調(diào)用服務(wù),這些服務(wù)數(shù)據(jù)對應(yīng)的語法樹中67%的路徑不包含多值節(jié)點,32%的路徑包含一個多值節(jié)點,只有1%的路徑是包含兩個到多個多值節(jié)點的復(fù)雜路徑。筆者分析了Apache Hadoop中所有449種非空的基于Protocol Buffers的通信協(xié)議,發(fā)現(xiàn)97%的路徑是簡單路徑。在其他多類現(xiàn)實數(shù)據(jù)集中,都觀察到相似的現(xiàn)象:絕大多數(shù)路徑是簡單路徑。針對簡單路徑,Steed優(yōu)化了列式存儲、列式組裝和內(nèi)存行式格式。

    (2)MongoDB+Steed

    MongoDB是對JSON文件進(jìn)行存儲和處理的大數(shù)據(jù)系統(tǒng)。MongoDB是采用C/C++語言實現(xiàn)的,包括Mongod和Mongos兩個主要部分。其中,Mongod負(fù)責(zé)單機的數(shù)據(jù)管理和運算,而Mongos在Mongod的基礎(chǔ)上實現(xiàn)了分布式處理,提供了數(shù)據(jù)劃分、備份、分布式執(zhí)行等功能。目前,MongoDB以行式BSON記錄作為數(shù)據(jù)的存儲格式,對大規(guī)模數(shù)據(jù)分析的運算可能引起大量額外的I/O操作。而Steed支持JSON的二進(jìn)制列式存儲,可以很好地支持大規(guī)模的數(shù)據(jù)分析運算。因此,將Steed作為MongoDB的存儲引擎,就有可能使MongoDB對JSON數(shù)據(jù)進(jìn)行列式I/O操作,從而大大提升大數(shù)據(jù)分析的效率。此外,目前Steed的實現(xiàn)是一個單機的數(shù)據(jù)庫系統(tǒng),而MongoDB在分布式處理方面有較強的能力,因此將Steed作為MongoDB的存儲引擎,就可以自然地利用MongoDB的分布式處理能力,形成一個能夠支持多機分布式存儲和運算的樹狀結(jié)構(gòu)大數(shù)據(jù)系統(tǒng)。MongoDB已經(jīng)在實踐中得到了廣泛應(yīng)用,在最流行的數(shù)據(jù)庫引擎排名中名列第5位。若MongoDB+Steed仍然采用MongoDB的前端界面和編程語言,就有可能更容易地被廣大MongoDB用戶接受,因此筆者將MongoDB的后端WiredTiger存儲引擎替換為Steed,使用列式存儲讀取數(shù)據(jù),并轉(zhuǎn)化為BSON,使用MongoDB現(xiàn)有的內(nèi)存處理。在具體實現(xiàn)中,需要把上層查詢運算的相關(guān)信息發(fā)送到下層的Steed存儲引擎。只有這樣,Steed才可能得知有哪些屬性列參與了當(dāng)前的查詢運算,從而可以采用列式的訪問讀取這些列的相關(guān)信息,而不是訪問全部的列,達(dá)到減少I/O開銷、提升效率的目的。

    (3)性能比較

    圖3 Steed和現(xiàn)有樹狀結(jié)構(gòu)數(shù)據(jù)處理系統(tǒng)的性能對比

    Steed和現(xiàn)有的樹狀結(jié)構(gòu)數(shù)據(jù)處理系統(tǒng)PostgresQL、MongoDB、Hive+Parquet的性能對比如圖3所示。Steed Row和Steed Column分別采用行式和列式數(shù)據(jù)存儲。實驗是在單臺聯(lián)想ThinkCentre M8500t工作站上運行的,工作站配有一個3.4 GHz 4核的Intel Core i7-4770處理器、16 GB內(nèi)存和一個7 200 r/min的SATA硬盤。在Twitter數(shù)據(jù)上運行多種查詢操作,圖3中從左到右依次是選擇一個屬性(select)、使用1~3個條件過濾數(shù)據(jù)集(1filter、2filters、3filters)、分組統(tǒng)計(group)、在分組統(tǒng)計的結(jié)果上進(jìn)一步過濾(having)、排序(order)、連接(join)。總體而言,Steed Column性能在所有系統(tǒng)中最優(yōu),比Hive+Parquet提高4.1~17.8倍,比MongoDB提高55.9~105.2倍,比PostgreSQL提高33.8~1 294倍。MongoDB+Steed采用了列式存儲,比采用行式存儲的原始MongoDB性能提升16~51倍。把BSON格式改變?yōu)镾teed的內(nèi)存結(jié)構(gòu),節(jié)省了對字符串屬性名的比較,采用了更高效的查詢處理實現(xiàn),Steed Column比MongoDB+Steed性能提升1.8~5.5倍。

    7 結(jié)束語

    傳統(tǒng)的關(guān)系數(shù)據(jù)模型難以滿足大數(shù)據(jù)應(yīng)用日益豐富的大數(shù)據(jù)表達(dá)和處理需求,因此實踐中涌現(xiàn)了多種非傳統(tǒng)的大數(shù)據(jù)類型。其中,以JSON為代表的樹狀結(jié)構(gòu)大數(shù)據(jù)類型是一種重要的大數(shù)據(jù)類型。本文從數(shù)據(jù)模型、實用價值和理論意義等方面介紹了樹狀結(jié)構(gòu)大數(shù)據(jù)類型,探討了樹狀結(jié)構(gòu)大數(shù)據(jù)類型的高效處理,設(shè)計實現(xiàn)了一個樹狀結(jié)構(gòu)數(shù)據(jù)管理系統(tǒng)——Steed系統(tǒng),支持通用的樹狀結(jié)構(gòu)數(shù)據(jù)存儲和類似SQL的查詢處理。通過分析現(xiàn)實數(shù)據(jù),提出一種頻繁子模式——簡單路徑,簡單路徑在實際數(shù)據(jù)中大量存在。針對簡單路徑,Steed優(yōu)化了外存存儲、列組裝算法和內(nèi)存行式結(jié)構(gòu)。與現(xiàn)有系統(tǒng)PostgreSQL、MongoDB、Hive+Parquet相比,Steed對數(shù)據(jù)分析類的操作普遍有10~1 000倍的性能提升。

    猜你喜歡
    數(shù)據(jù)類型樹狀嵌套
    例析“立幾”與“解幾”的嵌套問題
    基于嵌套Logit模型的競爭性選址問題研究
    詳談Java中的基本數(shù)據(jù)類型與引用數(shù)據(jù)類型
    如何理解數(shù)據(jù)結(jié)構(gòu)中的抽象數(shù)據(jù)類型
    鋼結(jié)構(gòu)樹狀支撐柱施工設(shè)計
    樹狀月季的嫁接技術(shù)及后期管理
    樹狀月季培育關(guān)鍵技術(shù)
    列表畫樹狀圖各有所長
    一種基于區(qū)分服務(wù)的嵌套隊列調(diào)度算法
    計算機工程(2014年6期)2014-02-28 01:25:29
    無背景實驗到有背景實驗的多重嵌套在電氣專業(yè)應(yīng)用研究
    河南科技(2014年23期)2014-02-27 14:19:17
    欧美另类亚洲清纯唯美| 狠狠狠狠99中文字幕| 国产私拍福利视频在线观看| 非洲黑人性xxxx精品又粗又长| 日本爱情动作片www.在线观看 | netflix在线观看网站| 男女那种视频在线观看| 高清在线国产一区| 久99久视频精品免费| 欧美xxxx黑人xx丫x性爽| 国产精品久久久久久av不卡| 给我免费播放毛片高清在线观看| 成年女人永久免费观看视频| 日本 av在线| 日本 av在线| 国产av不卡久久| 精品一区二区免费观看| 亚洲内射少妇av| 午夜福利在线在线| 亚洲精品一区av在线观看| 97碰自拍视频| 国产老妇女一区| 黄色一级大片看看| 亚洲性久久影院| 久久人妻av系列| 亚洲在线自拍视频| 尾随美女入室| 国产乱人伦免费视频| 成人特级黄色片久久久久久久| 老熟妇乱子伦视频在线观看| 不卡视频在线观看欧美| 国产午夜福利久久久久久| 国产精品综合久久久久久久免费| 在线天堂最新版资源| 欧美激情久久久久久爽电影| 波野结衣二区三区在线| 国产精品不卡视频一区二区| 午夜日韩欧美国产| 久久久精品大字幕| 精品久久久久久成人av| 级片在线观看| a级一级毛片免费在线观看| 成人精品一区二区免费| 又紧又爽又黄一区二区| 欧美激情国产日韩精品一区| 国产精品永久免费网站| 久久久国产成人精品二区| 成人av在线播放网站| av视频在线观看入口| 俄罗斯特黄特色一大片| 国产三级中文精品| 久久人人精品亚洲av| 伊人久久精品亚洲午夜| 国产欧美日韩精品一区二区| 在线国产一区二区在线| 国产激情偷乱视频一区二区| 亚洲无线观看免费| 国产av一区在线观看免费| 亚洲精品乱码久久久v下载方式| 99热6这里只有精品| 一卡2卡三卡四卡精品乱码亚洲| 九色国产91popny在线| 中文字幕高清在线视频| 亚洲人成网站高清观看| 赤兔流量卡办理| 欧美不卡视频在线免费观看| 又粗又爽又猛毛片免费看| 亚洲av中文av极速乱 | 最近中文字幕高清免费大全6 | 午夜福利成人在线免费观看| 亚洲三级黄色毛片| 色5月婷婷丁香| 两性午夜刺激爽爽歪歪视频在线观看| 成人永久免费在线观看视频| 欧美日韩瑟瑟在线播放| av福利片在线观看| 1000部很黄的大片| 亚洲精品亚洲一区二区| www日本黄色视频网| 热99在线观看视频| 香蕉av资源在线| 免费高清视频大片| 亚洲av第一区精品v没综合| 亚洲精品久久国产高清桃花| 天天躁日日操中文字幕| 桃红色精品国产亚洲av| 午夜激情福利司机影院| 直男gayav资源| 亚洲国产日韩欧美精品在线观看| 国内精品一区二区在线观看| 不卡视频在线观看欧美| 国产一级毛片七仙女欲春2| 久久国产乱子免费精品| 少妇丰满av| 深夜a级毛片| 国产精品综合久久久久久久免费| 国产av在哪里看| 日韩中字成人| 久久亚洲精品不卡| 别揉我奶头~嗯~啊~动态视频| 亚洲一区高清亚洲精品| 亚洲在线自拍视频| 黄色配什么色好看| 亚洲中文字幕一区二区三区有码在线看| 在线观看66精品国产| 国产精品永久免费网站| 亚洲图色成人| 精品人妻一区二区三区麻豆 | 琪琪午夜伦伦电影理论片6080| 欧美成人性av电影在线观看| а√天堂www在线а√下载| 一区二区三区四区激情视频 | 欧美又色又爽又黄视频| 国产91精品成人一区二区三区| 成年女人永久免费观看视频| 久久久精品欧美日韩精品| 丝袜美腿在线中文| 亚洲最大成人手机在线| 可以在线观看的亚洲视频| 亚洲av免费高清在线观看| 美女cb高潮喷水在线观看| 免费看av在线观看网站| 人妻久久中文字幕网| 蜜桃亚洲精品一区二区三区| 九九爱精品视频在线观看| 九色国产91popny在线| 亚洲性久久影院| 国产精品亚洲一级av第二区| 中文字幕av成人在线电影| 国产一区二区三区视频了| 欧美最新免费一区二区三区| 亚洲成人久久性| www日本黄色视频网| 国产亚洲91精品色在线| 欧美性猛交╳xxx乱大交人| 国产精品自产拍在线观看55亚洲| 91久久精品国产一区二区成人| 丝袜美腿在线中文| xxxwww97欧美| 久久久久久久亚洲中文字幕| 亚洲成av人片在线播放无| av专区在线播放| 精品久久久久久久人妻蜜臀av| 国产黄片美女视频| 婷婷色综合大香蕉| 丰满的人妻完整版| 免费电影在线观看免费观看| 国产av不卡久久| 欧美成人一区二区免费高清观看| 久久草成人影院| 老女人水多毛片| 内射极品少妇av片p| 全区人妻精品视频| avwww免费| 亚洲精品国产成人久久av| 国产伦人伦偷精品视频| 成人av在线播放网站| 色尼玛亚洲综合影院| 联通29元200g的流量卡| 99视频精品全部免费 在线| 亚洲欧美日韩无卡精品| 久久久久久久午夜电影| 成人无遮挡网站| 亚洲成人久久爱视频| 国产69精品久久久久777片| 男女那种视频在线观看| 国产精品98久久久久久宅男小说| 国产女主播在线喷水免费视频网站 | 有码 亚洲区| 久久天躁狠狠躁夜夜2o2o| 亚洲欧美日韩高清专用| aaaaa片日本免费| 国产v大片淫在线免费观看| 可以在线观看毛片的网站| 欧美最新免费一区二区三区| .国产精品久久| 国产一区二区三区av在线 | 黄色欧美视频在线观看| 国产伦精品一区二区三区四那| 三级男女做爰猛烈吃奶摸视频| 五月伊人婷婷丁香| 精品久久久久久久久av| 一区二区三区四区激情视频 | 久久久久久九九精品二区国产| 婷婷六月久久综合丁香| or卡值多少钱| 国模一区二区三区四区视频| 久久精品国产亚洲网站| 真实男女啪啪啪动态图| 看黄色毛片网站| 国产爱豆传媒在线观看| 国产精品,欧美在线| 日日干狠狠操夜夜爽| 久久精品国产亚洲网站| 麻豆av噜噜一区二区三区| 精品久久久久久久久久免费视频| 亚洲精华国产精华液的使用体验 | 欧美xxxx性猛交bbbb| 欧美中文日本在线观看视频| 久久久久久久久久成人| 午夜免费成人在线视频| 国产一区二区在线av高清观看| 午夜精品在线福利| 亚洲国产精品久久男人天堂| 婷婷亚洲欧美| 欧美bdsm另类| 亚洲av熟女| 特大巨黑吊av在线直播| 欧美日韩国产亚洲二区| 成人国产一区最新在线观看| 久久精品夜夜夜夜夜久久蜜豆| 亚洲综合色惰| 精品久久久久久久末码| 欧美中文日本在线观看视频| 精品久久久噜噜| 中文字幕高清在线视频| 国产女主播在线喷水免费视频网站 | 国内精品宾馆在线| 久久人妻av系列| 亚洲中文字幕一区二区三区有码在线看| 国产免费av片在线观看野外av| 岛国在线免费视频观看| 韩国av在线不卡| 日韩欧美在线二视频| 免费无遮挡裸体视频| eeuss影院久久| 91在线精品国自产拍蜜月| 可以在线观看的亚洲视频| 中文在线观看免费www的网站| 国产大屁股一区二区在线视频| 欧美最新免费一区二区三区| 搡老岳熟女国产| or卡值多少钱| 18禁黄网站禁片午夜丰满| 联通29元200g的流量卡| 国产女主播在线喷水免费视频网站 | 欧美中文日本在线观看视频| 日日夜夜操网爽| 久久香蕉精品热| 色噜噜av男人的天堂激情| 有码 亚洲区| 很黄的视频免费| 成人欧美大片| 国产aⅴ精品一区二区三区波| 亚洲人成网站在线播| 亚洲三级黄色毛片| 日韩国内少妇激情av| 中文字幕av成人在线电影| 色综合站精品国产| 国产精品嫩草影院av在线观看 | 婷婷精品国产亚洲av| 久久久久免费精品人妻一区二区| 精品一区二区三区视频在线观看免费| 久久婷婷人人爽人人干人人爱| 国产精品久久久久久精品电影| 久久精品影院6| 男人舔女人下体高潮全视频| 欧美黑人欧美精品刺激| 99久久精品国产国产毛片| 中文字幕免费在线视频6| 真实男女啪啪啪动态图| 成年女人看的毛片在线观看| 欧美精品国产亚洲| 久久久久九九精品影院| 中文在线观看免费www的网站| 亚洲国产高清在线一区二区三| 一进一出好大好爽视频| 男女视频在线观看网站免费| 亚洲在线观看片| 久久精品91蜜桃| 99在线人妻在线中文字幕| 国产真实乱freesex| 欧美最黄视频在线播放免费| 一区二区三区激情视频| 一进一出抽搐gif免费好疼| 久久精品国产清高在天天线| 最后的刺客免费高清国语| 久久国产精品人妻蜜桃| 国产一区二区三区视频了| 亚洲熟妇中文字幕五十中出| 久久久久九九精品影院| 天堂网av新在线| 欧美绝顶高潮抽搐喷水| 日韩一本色道免费dvd| 亚洲av一区综合| 欧美中文日本在线观看视频| 婷婷精品国产亚洲av| 亚洲精品成人久久久久久| 狂野欧美激情性xxxx在线观看| 一进一出抽搐动态| 窝窝影院91人妻| 国产乱人伦免费视频| 在线观看66精品国产| 国产精品免费一区二区三区在线| 久久久久国内视频| 亚洲人成网站在线播| 18+在线观看网站| av天堂在线播放| 哪里可以看免费的av片| 国产成人aa在线观看| 联通29元200g的流量卡| 国产精品综合久久久久久久免费| 男女边吃奶边做爰视频| 真人一进一出gif抽搐免费| 精品一区二区三区av网在线观看| 国产探花在线观看一区二区| 亚洲av五月六月丁香网| 精品国产三级普通话版| 久久天躁狠狠躁夜夜2o2o| 精品久久久噜噜| 亚洲中文字幕日韩| 国产免费av片在线观看野外av| 一区二区三区免费毛片| 免费黄网站久久成人精品| 小说图片视频综合网站| 九九久久精品国产亚洲av麻豆| 久久人人爽人人爽人人片va| 男人和女人高潮做爰伦理| 午夜久久久久精精品| av天堂中文字幕网| 色在线成人网| 少妇裸体淫交视频免费看高清| 99久久精品国产国产毛片| 男女那种视频在线观看| 午夜免费成人在线视频| 国产精品自产拍在线观看55亚洲| 在线看三级毛片| 看片在线看免费视频| 日日啪夜夜撸| 偷拍熟女少妇极品色| 国产精品一区www在线观看 | 国产精品av视频在线免费观看| 亚洲av熟女| 极品教师在线视频| 黄色配什么色好看| 高清日韩中文字幕在线| 国产欧美日韩一区二区精品| 国产精品不卡视频一区二区| 22中文网久久字幕| 男女之事视频高清在线观看| 国产人妻一区二区三区在| 99精品在免费线老司机午夜| 中文字幕av成人在线电影| 舔av片在线| 51国产日韩欧美| 人妻丰满熟妇av一区二区三区| 伊人久久精品亚洲午夜| 亚洲 国产 在线| 波多野结衣高清作品| 夜夜夜夜夜久久久久| 国产毛片a区久久久久| 亚洲国产精品sss在线观看| 一夜夜www| 中文字幕精品亚洲无线码一区| 久久久久久久久久久丰满 | 精品一区二区三区视频在线观看免费| 亚洲欧美日韩无卡精品| 久久久精品欧美日韩精品| 欧美xxxx性猛交bbbb| 99热精品在线国产| 日韩欧美国产一区二区入口| 偷拍熟女少妇极品色| 日本撒尿小便嘘嘘汇集6| 少妇的逼水好多| 亚洲人成网站在线播放欧美日韩| eeuss影院久久| 国产一区二区三区在线臀色熟女| 99热6这里只有精品| 亚洲国产日韩欧美精品在线观看| 自拍偷自拍亚洲精品老妇| 日本三级黄在线观看| 熟妇人妻久久中文字幕3abv| 欧美日本亚洲视频在线播放| 黄色视频,在线免费观看| 最新在线观看一区二区三区| 日韩在线高清观看一区二区三区 | 亚洲av.av天堂| 在线观看午夜福利视频| 99久久成人亚洲精品观看| 亚洲国产高清在线一区二区三| 日韩精品有码人妻一区| 日韩av在线大香蕉| 国产v大片淫在线免费观看| 欧美人与善性xxx| 国产一区二区三区av在线 | 国产精品久久久久久久电影| 岛国在线免费视频观看| 午夜日韩欧美国产| 国产男人的电影天堂91| 天堂影院成人在线观看| 五月伊人婷婷丁香| 精品无人区乱码1区二区| 国产精品综合久久久久久久免费| 亚洲欧美清纯卡通| 亚洲色图av天堂| 欧美日韩中文字幕国产精品一区二区三区| 亚洲av成人精品一区久久| 国产主播在线观看一区二区| 成年女人毛片免费观看观看9| 亚洲精品亚洲一区二区| 毛片女人毛片| 欧美不卡视频在线免费观看| 欧美成人a在线观看| 亚洲va日本ⅴa欧美va伊人久久| 久久久久久久午夜电影| 国内精品久久久久精免费| 丰满的人妻完整版| 中文字幕人妻熟人妻熟丝袜美| 18禁黄网站禁片免费观看直播| 午夜激情欧美在线| 免费看a级黄色片| 午夜激情欧美在线| 成人av一区二区三区在线看| 给我免费播放毛片高清在线观看| 看十八女毛片水多多多| 夜夜爽天天搞| 国产乱人伦免费视频| а√天堂www在线а√下载| 日日摸夜夜添夜夜添小说| 88av欧美| 99热这里只有是精品50| 亚洲精品色激情综合| 亚洲欧美精品综合久久99| 亚洲成人精品中文字幕电影| 热99re8久久精品国产| 国产精品综合久久久久久久免费| 久9热在线精品视频| av.在线天堂| 性插视频无遮挡在线免费观看| 尾随美女入室| 日本爱情动作片www.在线观看 | 身体一侧抽搐| 国产亚洲精品久久久com| 亚洲经典国产精华液单| 嫁个100分男人电影在线观看| 在线观看66精品国产| 色播亚洲综合网| 色综合色国产| 亚洲五月天丁香| 欧美人与善性xxx| 少妇裸体淫交视频免费看高清| 国产午夜精品论理片| 国产精品爽爽va在线观看网站| 国产精品电影一区二区三区| 亚洲av日韩精品久久久久久密| 欧美潮喷喷水| 哪里可以看免费的av片| 天堂网av新在线| 九九热线精品视视频播放| 亚洲久久久久久中文字幕| 婷婷色综合大香蕉| 国产亚洲欧美98| 色在线成人网| 国内精品久久久久久久电影| 午夜福利18| 日本撒尿小便嘘嘘汇集6| av在线观看视频网站免费| xxxwww97欧美| 亚洲成人中文字幕在线播放| 直男gayav资源| 久久精品久久久久久噜噜老黄 | 久久久成人免费电影| 欧美日韩亚洲国产一区二区在线观看| 他把我摸到了高潮在线观看| av在线老鸭窝| 久久精品国产清高在天天线| 国产aⅴ精品一区二区三区波| 香蕉av资源在线| 精品人妻一区二区三区麻豆 | 女生性感内裤真人,穿戴方法视频| 老女人水多毛片| 久久亚洲精品不卡| 亚洲第一电影网av| www.色视频.com| 欧美色欧美亚洲另类二区| 成人av一区二区三区在线看| 精品欧美国产一区二区三| 免费av不卡在线播放| 国产高清有码在线观看视频| 欧美精品啪啪一区二区三区| 日本a在线网址| 日本熟妇午夜| 制服丝袜大香蕉在线| 搡老熟女国产l中国老女人| 最近中文字幕高清免费大全6 | av在线天堂中文字幕| 韩国av一区二区三区四区| 精品午夜福利在线看| 又黄又爽又刺激的免费视频.| 日韩欧美三级三区| 免费在线观看日本一区| 久久久久久国产a免费观看| 国产av麻豆久久久久久久| 久久久久久久午夜电影| 欧美日韩国产亚洲二区| 日本免费a在线| 亚洲最大成人中文| 久久亚洲真实| 又紧又爽又黄一区二区| 久久久久九九精品影院| 欧美区成人在线视频| 少妇猛男粗大的猛烈进出视频 | 男女那种视频在线观看| 99久久中文字幕三级久久日本| 老女人水多毛片| 亚洲自偷自拍三级| 久久久久久久久中文| 我要看日韩黄色一级片| 国产精品99久久久久久久久| 99九九线精品视频在线观看视频| 91在线观看av| 成人午夜高清在线视频| 免费观看在线日韩| 在现免费观看毛片| 不卡一级毛片| 99精品久久久久人妻精品| 人妻夜夜爽99麻豆av| 亚洲天堂国产精品一区在线| 亚洲18禁久久av| 日韩大尺度精品在线看网址| 有码 亚洲区| 欧美高清成人免费视频www| 国产私拍福利视频在线观看| 国产激情偷乱视频一区二区| 综合色av麻豆| 中文字幕av在线有码专区| 成人特级av手机在线观看| 国产亚洲精品av在线| 欧美性猛交╳xxx乱大交人| 91狼人影院| 欧美日韩乱码在线| 国产伦一二天堂av在线观看| 成人午夜高清在线视频| 黄色日韩在线| 午夜老司机福利剧场| 国产一区二区三区视频了| 午夜精品在线福利| 人人妻,人人澡人人爽秒播| 国产69精品久久久久777片| 日本色播在线视频| 国产v大片淫在线免费观看| 精品国产三级普通话版| 蜜桃久久精品国产亚洲av| 成人国产麻豆网| 色av中文字幕| 最新中文字幕久久久久| 国产av一区在线观看免费| 美女高潮喷水抽搐中文字幕| av专区在线播放| 国产伦人伦偷精品视频| 国产高清不卡午夜福利| 乱系列少妇在线播放| 久久国产乱子免费精品| 午夜久久久久精精品| 床上黄色一级片| 久久久久免费精品人妻一区二区| 亚洲七黄色美女视频| 国语自产精品视频在线第100页| 春色校园在线视频观看| 一进一出抽搐gif免费好疼| 国内精品久久久久久久电影| 精品人妻偷拍中文字幕| 欧美丝袜亚洲另类 | 亚洲男人的天堂狠狠| 久久久久久久久久黄片| 国产成人a区在线观看| 国产一区二区激情短视频| 国产精品99久久久久久久久| www.www免费av| 婷婷精品国产亚洲av在线| 干丝袜人妻中文字幕| 丰满人妻一区二区三区视频av| 在线国产一区二区在线| 一区二区三区免费毛片| 日韩人妻高清精品专区| 亚洲av电影不卡..在线观看| 99热只有精品国产| 中文字幕久久专区| 国产精品自产拍在线观看55亚洲| 国产毛片a区久久久久| 午夜老司机福利剧场| 在线观看av片永久免费下载| 国内精品久久久久久久电影| av国产免费在线观看| 国产又黄又爽又无遮挡在线| 国产欧美日韩精品亚洲av| 亚洲精华国产精华液的使用体验 | 最近视频中文字幕2019在线8| 免费看光身美女| 久久午夜亚洲精品久久| av天堂在线播放| 黄色丝袜av网址大全| 日韩强制内射视频| 免费av不卡在线播放| 久久久国产成人免费| 免费看a级黄色片| 男女那种视频在线观看| 九色成人免费人妻av| 成人永久免费在线观看视频| 免费人成视频x8x8入口观看| 午夜福利在线观看免费完整高清在 | 我的女老师完整版在线观看| 少妇的逼水好多| 久久久久久久精品吃奶| 国产爱豆传媒在线观看| 亚洲图色成人| 国产精品自产拍在线观看55亚洲| 国产黄片美女视频| 精品无人区乱码1区二区| 一区福利在线观看| 免费在线观看日本一区| 亚洲av熟女| 久久精品人妻少妇| 精品久久久久久成人av| 露出奶头的视频|