• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    列式數(shù)據(jù)庫的數(shù)據(jù)壓縮技術研究

    2023-09-06 08:08:32丁銳恒梁波
    現(xiàn)代信息科技 2023年14期
    關鍵詞:壓縮算法預處理

    丁銳恒 梁波

    摘 ?要:隨著大數(shù)據(jù)產業(yè)的興起,列式數(shù)據(jù)庫的應用價值得以體現(xiàn)。憑借其靈活高效的查詢性能以及對復雜異構數(shù)據(jù)的兼容支持,列式數(shù)據(jù)庫在海量數(shù)據(jù)的分布式存儲和數(shù)據(jù)查詢分析領域具有廣闊的應用前景。首先從實際應用的角度闡述列式數(shù)據(jù)庫的基本特性和存儲架構;其次分析列式數(shù)據(jù)庫中所應用的數(shù)據(jù)壓縮技術并通過實驗驗證數(shù)據(jù)壓縮對列式數(shù)據(jù)庫存取性能的影響程度。

    關鍵詞:列式數(shù)據(jù)庫;數(shù)據(jù)壓縮;壓縮算法;預處理

    中圖分類號:TP391 ? ? 文獻標識碼:A ? 文章編號:2096-4706(2023)14-0042-06

    Research on Data Compression Technology of Column-oriented Database

    DING Ruiheng1, LIANG Bo2

    (1.Faculty of Information Engineering and Automation, Kunming University of Science and Technology, Kunming ?650504, China; 2.Computer Technology Application Key Laboratory of Yunnan Province, Kunming University of Science and Technology, Kunming ?650500, China)

    Abstract: With the rise of big data industry, the application value of column-oriented database is reflected. With its flexible and efficient query performance and compatible support for complex heterogeneous data, column-oriented database has broad application prospects in the field of distributed storage of massive data and data query analysis. Firstly, the basic characteristics and storage architecture of column-oriented database are expounded from the perspective of practical application; secondly, it analyzes the data compression technology applied in column-oriented database and verifies the impact of data compression on the access performance of column-oriented database through experiments.

    Keywords: column-oriented database; data compression; compression algorithm; pretreatment

    0 ?引 ?言

    如今,數(shù)據(jù)分析已廣泛應用于科學實驗、醫(yī)療衛(wèi)生、商業(yè)決策、社交網絡、生產制造等諸多領域。數(shù)據(jù)存儲作為數(shù)據(jù)分析工作的首要步驟,其重要性不言而喻。在過去的幾十年里,行式數(shù)據(jù)庫(Row-Oriented DBMS)因良好的結構特性和通用的查詢語言,在數(shù)據(jù)的存儲管理中占據(jù)主導地位。數(shù)據(jù)庫應用場景的擴展和交互式設備的普及,使得數(shù)據(jù)體量攀升、數(shù)據(jù)結構多樣化。傳統(tǒng)行式數(shù)據(jù)庫的性能已不能滿足數(shù)億級別數(shù)據(jù)的秒級檢索、實時處理、大規(guī)模存儲等需求。近些年來,在Stonebraker、Daniel、Abadi、Boncz等數(shù)據(jù)庫專家的大力提倡下,列式數(shù)據(jù)庫(Column-Oriented DBMS)技術及相關應用快速發(fā)展[1,2]?;趯β?lián)機分析處理(On-Line Analysis Processing)支持友好、查詢性能強悍、易于搭建分布式集群等優(yōu)勢,列式數(shù)據(jù)庫已逐漸替代行式數(shù)據(jù)庫而成為眾多企業(yè)搭建數(shù)據(jù)倉庫(Data Warehouse)的首選方案[3,4]。然而,無論是行式數(shù)據(jù)庫還是列式數(shù)據(jù)庫,數(shù)據(jù)存儲量增長所導致的存儲成本提高都是數(shù)據(jù)管理不可避免的問題[5,6]。與此同時,隨著分布式、云計算技術在數(shù)據(jù)庫領域的發(fā)展與應用,大規(guī)模數(shù)據(jù)實時傳輸成本控制也是亟待解決的問題??v觀整個數(shù)據(jù)庫領域,幾乎所有的數(shù)據(jù)庫(無論是行式數(shù)據(jù)庫還是列式數(shù)據(jù)庫)都會應用數(shù)據(jù)壓縮技術,數(shù)據(jù)庫的壓縮效率也成為評價數(shù)據(jù)庫性能優(yōu)劣的標準之一。數(shù)據(jù)壓縮是指在不損失信息量的前提下按照一定的編碼規(guī)則對數(shù)據(jù)進行重新組織從而達到減少數(shù)據(jù)長度的目的,而列式數(shù)據(jù)庫的存儲原理決定了其在數(shù)據(jù)壓縮上的優(yōu)勢。美國媒體流量分析公司Nielsen Media Research以列式數(shù)據(jù)庫產品Sybase IQ搭建數(shù)據(jù)倉庫,初始大小為17.969 TB,運行兩年后數(shù)據(jù)倉庫的數(shù)據(jù)量為17.585 TB,相比之下,Yahoo公司基于行式數(shù)據(jù)庫Oracle搭建的數(shù)據(jù)倉庫從最開始的17.014 TB擴大到100 TB[7]。對比行式數(shù)據(jù)庫,在列式數(shù)據(jù)庫中應用數(shù)據(jù)壓縮具有顯著的效果。本文主要圍繞列式數(shù)據(jù)庫中的數(shù)據(jù)壓縮技術進行綜述,首先介紹列式數(shù)據(jù)庫的特性和存儲原理,其次闡述了預處理編碼技術和LZ系列壓縮算法在列式數(shù)據(jù)庫中的應用。

    1 ?列式數(shù)據(jù)庫

    1.1 ?列式數(shù)據(jù)庫特性

    列式數(shù)據(jù)庫的誕生最早可以追溯到20世紀90年代。ExpressWay Technologies公司在當時推出一款有助于傳統(tǒng)數(shù)據(jù)庫提升報表制作速度的工具,其原理就是將數(shù)據(jù)表進行垂直劃分以列的方式進行存儲從而提高查詢的速度。1994年,Sybase公司認準這項技術并收購了ExpressWay Technologies公司,在1996年推出了基于列存儲的數(shù)據(jù)庫產品——Sybase IQ。此后隨著工業(yè)界數(shù)據(jù)體量的增長和數(shù)據(jù)分析的發(fā)展,人們開始注意到列式數(shù)據(jù)庫在存儲管理大規(guī)模數(shù)據(jù)上的優(yōu)勢。在2005年第31屆超大型數(shù)據(jù)庫會議(Very Large Data Bases)上,由Mike Stonebraker等人發(fā)表的論文“C-Store: A Column-Oriented DBMS”中正式提出了列式數(shù)據(jù)庫的概念。所謂列式數(shù)據(jù)庫,就是以數(shù)據(jù)表中的列(屬性)為單位進行數(shù)據(jù)寫入,將數(shù)據(jù)表不同元組中的相同屬性值存儲在一起,將同一元組中不同的屬性值分別存放在不同的存儲單元中[8]。相較于行式數(shù)據(jù)庫,列式數(shù)據(jù)庫的存儲結構具有以下優(yōu)勢:

    1)連續(xù)存儲數(shù)據(jù)的結構類型相同且具有一定的相關性,非常適合進行高效的壓縮操作。

    2)以列為單位進行存儲,在查詢時可以將查詢命令分解成以列為對象的操作,只需讀取所涉及的列即可。

    例如,對一張氣候表Climate Record(Date,

    Temperature, Wind, Rain)執(zhí)行查詢操作SELECT date

    FROM Climate Record WHERE Temperature>35 AND Temperature<40 ORDER BY Date DESC。首先讀取Temperature屬性列,篩選出Temperature值介于35和40之間的記錄并讀取這些記錄的Data屬性列,最后根據(jù)Data值進行排序。整個過程只讀取了Temperature列和Data列,極大地節(jié)省了I/O帶寬也減少了內存和Cache等資源的使用,同時也省去了行式數(shù)據(jù)庫中映射(Projection)運算的開銷[9]。

    1.2 ?列式數(shù)據(jù)庫存儲架構

    列式數(shù)據(jù)庫強調列簇(Column Family)的概念,首先采用鍵空間(Keyspace)作為基礎的數(shù)據(jù)表存儲架構,鍵空間中包含若干個列簇,如圖1所示。

    列簇下包含若干個行,行鍵(Row Key)是每個行的唯一標識,如圖2所示。行中包含不同數(shù)量、不同類型的列關鍵字以及對應的時間戳,列關鍵字表示一種屬性值的數(shù)據(jù)類型同時也是基礎的存儲單元。數(shù)據(jù)表在被存儲之前必須先創(chuàng)建列簇,不同元組中的同一屬性值共同構成一個列簇,在同一列簇下更改(增加或刪除)某一屬性值,只需對包含該屬性值的行進行操作即可。通過列簇的劃分,使得列式數(shù)據(jù)庫在簡單查詢時可以直接在相應的列簇中進行查找,并通過行鍵確定目標值[10-13],極大地縮減了查詢所涉及的范圍,對于海量數(shù)據(jù)表的簡單查詢來說所節(jié)省的查詢時間是非??捎^的。

    2 ?預處理技術

    預處理是指在進行數(shù)據(jù)壓縮之前通過對原始數(shù)據(jù)進行可逆的轉義處理從而加強后續(xù)壓縮效率的一種方法。在列式數(shù)據(jù)庫數(shù)據(jù)寫入階段,針對特定的數(shù)據(jù)類型進行預處理能夠明顯提升數(shù)據(jù)表整體的壓縮效果。下面將對列式數(shù)據(jù)庫中常規(guī)數(shù)據(jù)類型的預處理編碼進行闡述。

    2.1 ?文本(char、string)數(shù)據(jù)編碼

    Char或string類型文本數(shù)據(jù)作為數(shù)據(jù)庫的主要存儲對象,早在20世紀80年代,數(shù)據(jù)壓縮領域的相關學者就提出在采用Burrows-Wheeler(BWCA)、部分匹配預測(PPM)等壓縮算法處理文本數(shù)據(jù)時,利用文本數(shù)據(jù)的現(xiàn)實語義進行文本替換的轉化處理方案[14]。該方案是一種基于MTF(move-to-front)[15]技術的單詞轉化方法,它通過隱式字典來記錄首次出現(xiàn)的單詞并利用隱式索引替換掉后續(xù)出現(xiàn)的同一單詞[16]。在MTF的基礎上,相關學者根據(jù)字母組合在單詞中出現(xiàn)的頻率提出了自適應構建字典的方法。如為“ary”“ion”“ing”等高頻字母組合構建字典,對文本數(shù)據(jù)中出現(xiàn)的這些字母組合進行替換處理從而獲得壓縮增益[17,18],同樣還有大寫字母替換、行尾字符替換等[19-21]。實驗結果表明,基于替換的文本數(shù)據(jù)預處理能夠有效提升文本數(shù)據(jù)的壓縮比率,其增益平均百分比為5%。

    2.2 ?Int、Float型數(shù)據(jù)編碼

    除了上述基于數(shù)據(jù)本身需要替換編碼以外,還有不少針對數(shù)據(jù)類型的存儲格式而設計的編碼算法。這類算法通常不直接壓縮數(shù)據(jù),而是改變數(shù)據(jù)格式的排列組合從而加強通用壓縮算法對某種數(shù)據(jù)類型的壓縮效果,比如T64算法、Delta算法、Gorilla算法等。T64算法的原理是獲取連續(xù)的64個整數(shù)值并生成64×64位矩陣,將矩陣進行轉置并裁剪未使用的位[22](通過計算數(shù)據(jù)的最小值和最大值來檢測未使用的位)。T64算法能夠有效加強Zstd算法處理Int型數(shù)據(jù)的壓縮效果,其增益約為6%。而Delta算法則是常用在列式數(shù)據(jù)庫中針對序列數(shù)據(jù)(主要由Float和Int組成)的編碼算法。其原理是保持序列中第一個值不變,序列中除第一個值以外的值被兩個相鄰值的差值替換。如原始序列為:1(base)、2、3、4、5、6、7、8、9……,經過Delta處理過后序列變?yōu)椋?(base)、1、1、1、1、1、1、1、1……。Gorilla[23]算法是對Delta算法的一種擴展,它通過利用數(shù)據(jù)列當前值與先前值的異或比較(XOR)生成增量編碼來壓縮序列中表示時間戳(timestamp)和值(value)的數(shù)據(jù)塊。整個編碼流程如圖3所示,Gorilla按照時間將數(shù)據(jù)列劃分成若干個數(shù)據(jù)塊,在存儲第一個數(shù)據(jù)塊(Header)后利用Delta算法處理后面的數(shù)據(jù)塊(圖中A部分所示),編碼具體的流程如圖中B部分所示,圖中C部分為面向位的異或比較的流程[24,25]。目前,T64、Delta和Gorila算法在列式數(shù)據(jù)庫中有著廣泛的應用。

    3 ?LZ系列壓縮算法

    數(shù)據(jù)壓縮起源于香濃提出的信息熵理論,其本質是對信源數(shù)據(jù)文件進行再編碼,在不損失信息量的情況下減少數(shù)據(jù)文件的大小[26]。作為計算機領域應用最廣泛的技術之一,數(shù)據(jù)壓縮發(fā)展至今已經誕生了數(shù)百種壓縮算法,目前在列式數(shù)據(jù)庫中所應用的還是以LZ4為代表的LZ系列算法(Lempel-Ziv Series Encoding)為主。列式數(shù)據(jù)庫中連續(xù)存儲的數(shù)據(jù)具有相同的數(shù)據(jù)類型且往往具有一定的關聯(lián)性,非常契合LZ4這類基于上下文滑動窗口的壓縮算法。下面將依次分析LZ系列算法中三種較有代表性的壓縮算法并進行實驗測試。

    3.1 ?LZ4算法

    LZ4[27]是基于LZ77算法思想而設計的一款通用型無損壓縮算法。由Abraham Lempel和Jacob Ziv發(fā)明的LZ77算法[28]奠定了現(xiàn)代壓縮技術的基礎,LZ77算法通過結合自適應字典技術,利用字典的映射關系在編碼時消除重復出現(xiàn)的字符來達到壓縮目的。理論上LZ77算法可以達到信息熵的極限,LZ77壓縮流程如圖4所示。LZ4算法在LZ77算法的基礎上簡化了字符串的匹配機制,取消了緩沖區(qū),其壓縮流程如下:

    1)初始化存放字典的哈希表,哈希值為字符串位置的偏移值。

    2)從待壓縮數(shù)據(jù)中取出4字節(jié),并在哈希表中尋找匹配的字符串,若成功匹配則再次取出4字節(jié)進行后續(xù)匹配,直至匹配失敗進入4)。

    3)輸出所有匹配成功字符串的匹配序列,匹配序列結構如圖5所示(其中令牌前4位保存未匹配字符長度,后4位為匹配成功字符長度)。

    4)將匹配失敗的4個字節(jié)及其位置的偏移值添加到哈希表中并檢查是否有哈希沖突,若發(fā)生沖突則將原來的哈希值更新為當前4個字節(jié)對應的值,最后輸出匹配序列。

    5)檢查當前位置是否超出字典窗口大小,若大于字典窗口的最大值則以當前位置為起點更新哈希表中的值并重復2),直至待壓縮數(shù)據(jù)剩最后12個字符并將這12個字符直接放至輸出文件的最后。

    3.2 ?Snappy算法

    Snappy[29]同樣也是由LZ77算法衍生而來的。它在LZ77匹配機制上做出了調整,優(yōu)化了匹配方式。基于類似于希爾排序控制增量的思想,通過動態(tài)增加匹配偏移字節(jié)數(shù)來提高掃描字符串的效率,其壓縮流程如下:

    1)首先在匹配開始階段初始化用于匹配的字典,字典內保存滑動窗口中每一個字節(jié)開始4個字節(jié)轉換成Uint32的偏移值,字典的下標為偏移值的Hash值。

    2)重復遍歷(默認16次,每次偏移一個字節(jié))滑動窗口,通過匹配字符串的偏移值來尋找相同的字符串,查找成功則進入5)。

    3)繼續(xù)查找剩余字符串。此時偏移字節(jié)逐步累加,匹配方式與上一步相同。

    4)處理未匹配的字符串。生成1個標簽字節(jié)記錄當前偏移位置和未匹配字符串的長度。

    5)處理匹配成功的字符串,更新滑動窗口并重復2)直至找到待壓縮數(shù)據(jù)塊的最后15個字符并將這15個字符直接放至輸出文件的最后。

    3.3 ?Zstd算法

    Zstd[30]的設計原理大體上與Deflate算法[31]相同。Deflate算法在LZ77算法的基礎上結合了Huffman編碼,利用Huffman編碼將LZ77算法的輸出結果再編碼以獲得極高的壓縮比。Zstd在Deflate算法的基礎上做了以下改變:

    1)使用有限狀態(tài)熵編碼(Finite State Entropy)[32]代替Huffman編碼。

    2)在匹配字符串的階段不再限定匹配字符串的大小。

    3)允許偏移量重復出現(xiàn)。Zstd算法提供幾十種壓縮級別,以適應不同的硬件環(huán)境。同時,Zstd還提供一種訓練壓縮字典的模式,通過樣本訓練字典并在適當?shù)膱鼍凹虞d字典。訓練字典模式在壓縮冗余較大數(shù)據(jù)文件時的效果非常明顯,能夠在保證高壓縮比的前提下獲得極高的壓縮速度。

    4 ?算法性能測試

    本文針對上述三種壓縮算法在列式數(shù)據(jù)庫的存儲、查詢性能方面進行了對比實驗。實驗環(huán)境如下:CPU Intel Xeon E7- 4807 (24) @ 1.862 GHz;內存16 GB(DDR3 800);緩存L1 32 Kbytes、L2 256 Kbytes、L3 18 432 Kbytes;硬盤SSD 4 TB、HHD 250 GB×2;軟件操作環(huán)境Ubuntu 20.04.3 LTS;軟件及算法ClickHouse v21.9.2.17-stable、LZ4 v1.9.3、Snappy v1.1.9、Zstd v1.5.2。測試數(shù)據(jù)集統(tǒng)一采用美國1987年至2017年民用航班數(shù)據(jù),共1.75億條數(shù)據(jù),大小為54.20 GB,算法性能對比如表1和圖6所示,其中壓縮比(CR)的計算公式為:

    CR = COMa /COMb ? ? ? ? ? ? ? ? (1)

    其中,COMa表示壓縮后數(shù)據(jù)文件的大小,COMb表示壓縮前數(shù)據(jù)文件的大小,CR值越低壓縮效果越好。

    由表1和圖6可知三種算法性能各有優(yōu)劣,適用于不同的場景。在讀取經過壓縮后的數(shù)據(jù)時需要先將處于壓縮態(tài)的數(shù)據(jù)塊從硬盤讀入內存;接著從內存?zhèn)鬏斨罜ACHE,并在CACHE中解壓;再把解壓后的數(shù)據(jù)傳回內存中;最后才能對數(shù)據(jù)進行查詢操作。Zstd算法在壓縮(解壓)過程中需要再次對輸出結果進行有限狀態(tài)熵編碼(解碼),因此同等條件下Zstd算法的壓縮比最好,適合于對時效性要求較低的海量數(shù)據(jù)存儲場景。三種算法中LZ4算法的綜合性能最好,尤其是I/O速度高出其他兩種算法一個數(shù)量級,是列式數(shù)據(jù)庫中應用面最廣的一款壓縮算法。雖然Snappy算法的壓縮和查詢性能都不如另外兩種算法,但其對硬件的兼容性高且壓縮速度快,非常適合分布式的存儲場景。

    5 ?結 ?論

    大數(shù)據(jù)時代下列式數(shù)據(jù)庫在數(shù)據(jù)分析領域具有廣闊的應用前景,面向列的存儲機制為列式數(shù)據(jù)庫提供了強大的查詢能力和靈活可擴展的數(shù)據(jù)類型支持。本文從數(shù)據(jù)存儲的角度闡述了列式數(shù)據(jù)庫中常用的預處理編碼方式和主流的LZ系列壓縮算法,并將三種LZ系列算法集成到ClickHouse列式數(shù)據(jù)庫中加以實驗測試并總結各自的適用場景。數(shù)據(jù)壓縮不僅有助于列式數(shù)據(jù)庫節(jié)省存儲成本同時還能提高數(shù)據(jù)的傳輸效率,已是列式數(shù)據(jù)庫不可或缺的組成部分。希望通過本文的綜述分析能為數(shù)據(jù)壓縮技術在列式數(shù)據(jù)庫中的研究與應用提供有益參考。

    參考文獻:

    [1] STONEBRAKER M,ABADI D J,BATKIN A,et al. C-Store: A Column-Oriented DBMS [C]//Proceedings of the 31st international conference on Very large data bases. Trondheim:[s.n.],2005:553-564.

    [2] HEINZL L,HURDELHEY B,BOISSIER M,et al. Evaluating Lightweight Integer Compression Algorithms in Column-Oriented In-Memory DBMS [EB/OL].[2023-01-08].https://www.researchgate.net/publication/358862115_Evaluating_Lightweight_Integer_Compression_Algorithms_in_Column-Oriented_In-Memory_DBMS.

    [3] AGEED Z S,ZEEBAREE S R M,SADEEQ M A M,et al. A Comprehensive Survey of Big Data Mining Approaches in Cloud Systems [EB/OL].[2023-01-05].https://www.researchgate.net/publication/351005929_A_Comprehensive_Survey_of_Big_Data_Mining_Approaches_in_Cloud_Systems.

    [4] KHALAF O I,ABDULSAHIB G M. Optimized Dynamic Storage of Data (ODSD) in IoT Based on Blockchain for Wireless Sensor Networks [J].Peer-to-Peer Networking and Applications,2021,14:2858–2873.

    [5] CHANG L,WANG Z W,MA T,et al. HAWQ: A Massively Parallel Processing SQL Engine in Hadoop [EB/OL].[2023-01-04].https://dl.acm.org/doi/10.1145/2588555.2595636.

    [6] Neo4j. Overcoming SQL Strain and SQL Pain (White Paper)[EB/OL].[2022-08-22].http://neo4j.com/resources/wp-overcomingsqlstrain/?utm_source=dbengines&utm_medium=textsqlpain&utm_content=download&utm_campaign=dl.

    [7] CHANG F,Dean J,Ghemawat S,et al. Bigtable: A Distributed Storage System for Structured Data [J].ACM Transactions on Computer Systems,2008,26(2):1-26.

    [8] ALESSANDRO D,IDILIO D,ANDREA M,et al. A Survey on Big Data for Network Traffic Monitoring and Analysis [J].IEEE Transactions on Network and Service Management,2019,16(3):800-813.

    [9] 陳曉寧.海量數(shù)據(jù)下列式數(shù)據(jù)庫研究 [D].廣州:華南理工大學,2012.

    [10] ZHANG J W,SUN D W. Improvement of data compression technology for power dispatching based on run length encoding [J].Procedia Computer Science,2021,183:526-532.

    [11] OSMAN A M S. A novel big data analytics framework for smart cities [J].Future Generation Computer Systems,2019,91:620-633.

    [12] CHAND M. What Is A Column Store Database [EB/OL].[2023-01-10].https://www.c-sharpcorner.com/article/what-is-a-column-store-database.

    [13] 朱凱.ClickHouse原理解析與應用實踐 [M].北京:機械工業(yè)出版社,2020.

    [14] KANAKARAJAN K R,KUNDUMANI B,SANKARASUBBU M. BioELECTRA: Pretrained Biomedical text Encoder using Discriminators [EB/OL].[2022-12-16].https://aclanthology.org/2021.bionlp-1.16/.

    [15] ZHAO R,ZHENG K C,ZHA Z J. Stacked Convolutional Deep Encoding Network For Video-Text Retrieval [J/OL].arXiv:2004.04959 [cs.MM].[2022-12-05].https://arxiv.org/abs/2004.04959v1.

    [16] JAIN A,LAKHTARIA K I. Comparative Study of Dictionary based Compression Algorithmson Text Data [EB/OL].[2022-12-10].http://paper.ijcsns.org/07_book/201602/20160215.pdf.

    [17] KANDA S,MORITA K,F(xiàn)UKETA M. Practical String Dictionary Compression Using String Dictionary Encoding [C]//2017 International Conference on Big Data Innovations and Applications (Innovate-Data).Prague:IEEE,2017:1-8.

    [18] ZUO L Q,SUN H M,MAO Q C,et al. Natural Scene Text Recognition Based on Encoder-Decoder Framework [J].IEEE Access,2019,7:62616-62623.

    [19] HABIB A,ISLAM M J,RAHMAN M S. A dictionary-based text compression technique using quaternary code [EB/OL].[2022-12-29].https://link.springer.com/article/10.1007/s42044-019-00047-w.

    [20] OSWALD C,SIVASELVAN B. An optimal text compression algorithm based on frequent pattern mining [J].Journal of Ambient Intelligence and Humanized Computing,2018,9:803-822.

    [21] OSWALD C,GHOSH A I,SIVASELVAN B. Knowledge engineering perspective of text compression [C]//2015 Annual IEEE India Conference (INDICON). New Delhi:IEEE,2015:1-6.

    [22] WANG S X,CHEN H W,WU L,et al. A novel smart meter data compression method via stacked convolutional sparse auto-encoder [EB/OL].[2022-12-13].https://www.researchgate.net/publication/337768393_A_Novel_Smart_Meter_Data_Compression_Method_via_Stacked_Convolutional_Sparse_Auto-encoder.

    [23] PELKONEN T,F(xiàn)RANKLIN S,TELLER J,et al. Gorilla: A Fast, Scalable, In-Memory Time Series Database [J].Proceedings of the VLDB Endowment,2015,8(12):1816-1827.

    [24] HUANG Y W,HSU C W,CHEN C Y,et al. A VVC Proposal With Quaternary Tree Plus Binary-Ternary Tree Coding Block Structure and Advanced Coding Techniques [J].IEEE Transactions on Circuits and Systems for Video Technology,2020,30(5):1311-1325.

    [25] PATIL M V,PAWAR S,SAQUIB Z. Coding Techniques for 5G Networks: A Review [C]//2020 3rd International Conference on Communication System, Computing and IT Applications (CSCITA).Mumbai:IEEE,2020:208-213.

    [26] Sayood K.數(shù)據(jù)壓縮導論:第3版 [M].賈洪峰,譯.北京:人民郵電出版社,2009.

    [27] YANN C. Lz4 source code [EB/OL].[2022-12-07].https://github.com/lz4/lz4.

    [28] ZIV J,LEMPEL A. A universal algorithm for sequential data compression [J].IEEE Transations on Information Theory,1977,23(3):337-347.

    [29] Google Inc. Snappy source code [EB/OL].[2022-12-25].https://github.com/google/snappy.

    [30] Yann C. Zstd source code [EB/OL].[2022-12-05].https://github.com/facebook/zstd.

    [31] OSWAL S,SINGH A,KUMARI K. Deflate Compression Algorithm [EB/OL].[2023-01-14].https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=e8d7c01594cf4359c3d50aef7db88b0153c7fcbd.

    [32] RATTANAOPAS K,KAEWKEEREE S. Improving Hadoop MapReduce performance with data compression: A study using wordcount job [C]//2017 14th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology (ECTI-CON). Phuket:IEEE,2017:564-567.

    作者簡介:丁銳恒(1997—),男,漢族,四川德陽人,碩士研究生在讀,主要研究方向:數(shù)據(jù)庫技術、數(shù)據(jù)壓縮。

    猜你喜歡
    壓縮算法預處理
    基于人工智能技術的運動教學視頻壓縮算法
    基于參數(shù)識別的軌道電路監(jiān)測數(shù)據(jù)壓縮算法研究
    基于預處理MUSIC算法的分布式陣列DOA估計
    制導與引信(2017年3期)2017-11-02 05:16:56
    更正聲明
    電訊技術(2017年4期)2017-04-16 04:16:03
    基于Hadoop平臺的數(shù)據(jù)壓縮技術研究
    淺談PLC在預處理生產線自動化改造中的應用
    絡合萃取法預處理H酸廢水
    PMU數(shù)據(jù)預處理及壓縮算法
    基于自適應預處理的改進CPF-GMRES算法
    基于HBASE的大數(shù)據(jù)壓縮算法的研究
    小蜜桃在线观看免费完整版高清| 九九热线精品视视频播放| 在线观看免费视频日本深夜| 婷婷亚洲欧美| 日韩中文字幕欧美一区二区| h日本视频在线播放| 永久网站在线| 又粗又爽又猛毛片免费看| 中文亚洲av片在线观看爽| 两个人的视频大全免费| 成人国产一区最新在线观看| 亚洲最大成人中文| 国产一区二区三区视频了| 99国产极品粉嫩在线观看| www日本黄色视频网| 久久婷婷人人爽人人干人人爱| 日韩中字成人| www.色视频.com| www.999成人在线观看| 久久久久久大精品| 国产精品自产拍在线观看55亚洲| 男女之事视频高清在线观看| 免费搜索国产男女视频| a在线观看视频网站| 久久久色成人| 三级毛片av免费| 国产单亲对白刺激| 欧美丝袜亚洲另类 | 午夜福利在线观看吧| 成年女人毛片免费观看观看9| 脱女人内裤的视频| 成人国产一区最新在线观看| 欧美一区二区亚洲| 久久草成人影院| 搡老熟女国产l中国老女人| 日韩精品青青久久久久久| 久久精品影院6| 禁无遮挡网站| 免费人成在线观看视频色| 亚洲一区二区三区色噜噜| 97超视频在线观看视频| 国产欧美日韩一区二区精品| 久久久精品大字幕| 亚洲专区中文字幕在线| 国产一区二区亚洲精品在线观看| 能在线免费观看的黄片| 人人妻人人看人人澡| 欧美+亚洲+日韩+国产| 久久久久久久午夜电影| 亚洲成a人片在线一区二区| 色综合婷婷激情| 欧美+亚洲+日韩+国产| 精品午夜福利在线看| 中文字幕熟女人妻在线| 日韩欧美免费精品| 嫁个100分男人电影在线观看| 在线免费观看不下载黄p国产 | 国产综合懂色| 国产亚洲精品综合一区在线观看| 国产老妇女一区| 99久久久亚洲精品蜜臀av| 亚洲成人免费电影在线观看| 成年女人看的毛片在线观看| 日韩免费av在线播放| 午夜免费成人在线视频| 国产精品av视频在线免费观看| 亚洲18禁久久av| 欧美性感艳星| 性色avwww在线观看| 欧美xxxx性猛交bbbb| 亚洲一区高清亚洲精品| 亚洲男人的天堂狠狠| 久久亚洲真实| www日本黄色视频网| 波多野结衣高清无吗| 少妇人妻一区二区三区视频| 在线观看一区二区三区| 久久人人爽人人爽人人片va | 青草久久国产| 国产精品亚洲av一区麻豆| 国产大屁股一区二区在线视频| 中文字幕av在线有码专区| 欧美日韩瑟瑟在线播放| 亚洲 欧美 日韩 在线 免费| 免费在线观看影片大全网站| 国产精品一及| 好男人在线观看高清免费视频| 欧美最黄视频在线播放免费| 亚洲成人精品中文字幕电影| 亚洲精华国产精华精| 日韩欧美国产在线观看| 欧美一区二区精品小视频在线| 精品久久国产蜜桃| 99久国产av精品| 黄色一级大片看看| 亚洲av成人av| 首页视频小说图片口味搜索| 国产精品亚洲一级av第二区| 麻豆国产97在线/欧美| 51国产日韩欧美| 亚洲成av人片在线播放无| 最好的美女福利视频网| 18美女黄网站色大片免费观看| 日韩欧美国产在线观看| 亚洲av成人不卡在线观看播放网| 亚洲欧美日韩卡通动漫| 日本三级黄在线观看| 一个人看的www免费观看视频| 亚洲av电影不卡..在线观看| 人妻制服诱惑在线中文字幕| 香蕉av资源在线| 亚洲av免费高清在线观看| 欧美最黄视频在线播放免费| 18禁黄网站禁片免费观看直播| 丝袜美腿在线中文| 国产探花在线观看一区二区| 成人三级黄色视频| 禁无遮挡网站| 欧美乱色亚洲激情| 久久中文看片网| 久久久国产成人免费| 99久久99久久久精品蜜桃| 少妇人妻一区二区三区视频| 成年人黄色毛片网站| 欧美潮喷喷水| 国内揄拍国产精品人妻在线| 久久久国产成人免费| 国产亚洲精品综合一区在线观看| 久久久成人免费电影| 国产精华一区二区三区| 国产在线男女| av欧美777| 久久性视频一级片| 日日摸夜夜添夜夜添小说| 自拍偷自拍亚洲精品老妇| 女人十人毛片免费观看3o分钟| 国内久久婷婷六月综合欲色啪| 精品一区二区三区视频在线观看免费| 听说在线观看完整版免费高清| 99久国产av精品| 麻豆成人av在线观看| 亚洲熟妇中文字幕五十中出| 桃色一区二区三区在线观看| 亚洲av五月六月丁香网| 亚洲国产欧洲综合997久久,| 色综合欧美亚洲国产小说| 精品不卡国产一区二区三区| 99国产综合亚洲精品| 色综合欧美亚洲国产小说| 中文亚洲av片在线观看爽| 国产三级黄色录像| 免费看日本二区| 小说图片视频综合网站| 免费大片18禁| 亚洲欧美日韩高清在线视频| 五月伊人婷婷丁香| 麻豆成人午夜福利视频| 中文字幕av在线有码专区| 精品人妻1区二区| 深爱激情五月婷婷| 内地一区二区视频在线| 欧美又色又爽又黄视频| 十八禁人妻一区二区| 天堂影院成人在线观看| 欧美日本亚洲视频在线播放| 好男人在线观看高清免费视频| 91九色精品人成在线观看| 久久亚洲精品不卡| 欧美色欧美亚洲另类二区| 网址你懂的国产日韩在线| 欧美黑人欧美精品刺激| 亚洲成a人片在线一区二区| 黄色日韩在线| 美女xxoo啪啪120秒动态图 | 久久中文看片网| 一级作爱视频免费观看| 国语自产精品视频在线第100页| www.999成人在线观看| 亚洲一区高清亚洲精品| 12—13女人毛片做爰片一| 欧美性猛交╳xxx乱大交人| 亚洲久久久久久中文字幕| .国产精品久久| www日本黄色视频网| 高潮久久久久久久久久久不卡| 高潮久久久久久久久久久不卡| 国产av麻豆久久久久久久| 窝窝影院91人妻| 国内精品美女久久久久久| 一个人免费在线观看的高清视频| 国产aⅴ精品一区二区三区波| 亚洲av成人不卡在线观看播放网| 亚洲五月婷婷丁香| 国产伦一二天堂av在线观看| 变态另类丝袜制服| 亚洲avbb在线观看| 国产野战对白在线观看| 久9热在线精品视频| 熟妇人妻久久中文字幕3abv| 国产黄a三级三级三级人| 亚洲第一欧美日韩一区二区三区| 国产爱豆传媒在线观看| 啪啪无遮挡十八禁网站| 看黄色毛片网站| 国产主播在线观看一区二区| 久久99热6这里只有精品| 婷婷精品国产亚洲av| 国产一区二区激情短视频| 少妇人妻精品综合一区二区 | 色在线成人网| 麻豆国产av国片精品| 亚洲欧美日韩东京热| 亚洲18禁久久av| 国产精品伦人一区二区| 午夜福利在线观看免费完整高清在 | 99久久精品国产国产毛片| 熟女av电影| 精品国产三级普通话版| 日本黄色片子视频| 亚洲av欧美aⅴ国产| 亚洲aⅴ乱码一区二区在线播放| 美女被艹到高潮喷水动态| 亚洲熟女精品中文字幕| 亚洲最大成人手机在线| 女人久久www免费人成看片| 2018国产大陆天天弄谢| av在线app专区| 免费高清在线观看视频在线观看| 久久久久九九精品影院| 岛国毛片在线播放| 久久久精品欧美日韩精品| 尤物成人国产欧美一区二区三区| 国产精品无大码| 日本一二三区视频观看| 黄色一级大片看看| 青青草视频在线视频观看| 国产成人精品一,二区| 日韩av在线免费看完整版不卡| 亚洲国产最新在线播放| 伦理电影大哥的女人| 亚洲国产欧美人成| 又黄又爽又刺激的免费视频.| 国产一区二区三区av在线| 日本欧美国产在线视频| 人体艺术视频欧美日本| 在线观看免费高清a一片| 18+在线观看网站| 色吧在线观看| 内地一区二区视频在线| 婷婷色综合大香蕉| 国产精品久久久久久精品电影小说 | 亚洲成色77777| 在线观看国产h片| 国产日韩欧美在线精品| 视频区图区小说| 在线免费观看不下载黄p国产| 国产熟女欧美一区二区| 精品久久久久久久末码| 色5月婷婷丁香| 大码成人一级视频| 新久久久久国产一级毛片| 精品人妻视频免费看| 国产 精品1| 一个人看的www免费观看视频| 亚洲国产欧美人成| 国产探花在线观看一区二区| 国产一区亚洲一区在线观看| 亚洲精品乱码久久久v下载方式| 2021天堂中文幕一二区在线观| 国产老妇伦熟女老妇高清| 三级经典国产精品| 深爱激情五月婷婷| 在线播放无遮挡| 五月玫瑰六月丁香| av在线老鸭窝| 日韩大片免费观看网站| 中文字幕免费在线视频6| 午夜福利高清视频| 免费观看的影片在线观看| 国产精品.久久久| 深爱激情五月婷婷| 亚洲无线观看免费| 欧美性猛交╳xxx乱大交人| 大又大粗又爽又黄少妇毛片口| 亚洲美女视频黄频| 欧美日韩亚洲高清精品| 国内少妇人妻偷人精品xxx网站| 国产精品久久久久久av不卡| 人妻一区二区av| 亚洲自偷自拍三级| 老女人水多毛片| 在线观看一区二区三区| 成人亚洲精品av一区二区| 1000部很黄的大片| 国产老妇伦熟女老妇高清| 成人亚洲欧美一区二区av| 91在线精品国自产拍蜜月| 国产成人午夜福利电影在线观看| 国国产精品蜜臀av免费| 国产色婷婷99| 国产一区亚洲一区在线观看| 99热这里只有是精品50| 亚洲成人av在线免费| 女人十人毛片免费观看3o分钟| 亚洲无线观看免费| 欧美一区二区亚洲| 国产成人一区二区在线| 一级毛片电影观看| 久久久精品免费免费高清| 亚洲av免费在线观看| 久久精品国产亚洲av天美| 亚洲成人中文字幕在线播放| 天堂俺去俺来也www色官网| 中文字幕av成人在线电影| 一本久久精品| 夫妻性生交免费视频一级片| 亚洲国产最新在线播放| 九九在线视频观看精品| 久久午夜福利片| 九草在线视频观看| 精品少妇久久久久久888优播| 欧美老熟妇乱子伦牲交| 国产精品爽爽va在线观看网站| 欧美97在线视频| 国产精品一及| 男女那种视频在线观看| 亚洲国产av新网站| av在线app专区| 日本wwww免费看| 欧美成人精品欧美一级黄| 一区二区三区精品91| 狂野欧美白嫩少妇大欣赏| 交换朋友夫妻互换小说| 日韩 亚洲 欧美在线| av.在线天堂| 嫩草影院入口| 在线a可以看的网站| 欧美zozozo另类| 天堂网av新在线| 国产 一区精品| 久久精品久久久久久久性| 国产高清不卡午夜福利| 国产精品女同一区二区软件| av在线亚洲专区| 噜噜噜噜噜久久久久久91| 国产色爽女视频免费观看| 国产乱人视频| 亚洲精品国产色婷婷电影| 下体分泌物呈黄色| av福利片在线观看| 97热精品久久久久久| 黄色日韩在线| 插阴视频在线观看视频| 欧美xxⅹ黑人| 久久久久网色| 在线观看av片永久免费下载| 秋霞在线观看毛片| 亚洲成人精品中文字幕电影| 特大巨黑吊av在线直播| 亚洲av成人精品一二三区| 18禁动态无遮挡网站| 日产精品乱码卡一卡2卡三| 麻豆成人午夜福利视频| 日韩一本色道免费dvd| 国产精品99久久99久久久不卡 | 午夜亚洲福利在线播放| 日韩国内少妇激情av| 日本av手机在线免费观看| 伊人久久精品亚洲午夜| 少妇猛男粗大的猛烈进出视频 | 好男人在线观看高清免费视频| 制服丝袜香蕉在线| 在线 av 中文字幕| 天天躁夜夜躁狠狠久久av| 亚洲成人久久爱视频| 久久久亚洲精品成人影院| 亚洲成人久久爱视频| 日韩一本色道免费dvd| 免费黄色在线免费观看| 日韩欧美 国产精品| 人妻少妇偷人精品九色| 日韩av在线免费看完整版不卡| 狂野欧美白嫩少妇大欣赏| 亚洲精品亚洲一区二区| 免费看av在线观看网站| 26uuu在线亚洲综合色| 狠狠精品人妻久久久久久综合| 日韩中字成人| 高清在线视频一区二区三区| 丰满人妻一区二区三区视频av| 又爽又黄a免费视频| 色吧在线观看| 欧美潮喷喷水| 成人漫画全彩无遮挡| 欧美+日韩+精品| 国产黄片视频在线免费观看| 少妇高潮的动态图| videossex国产| 全区人妻精品视频| 国产淫片久久久久久久久| 永久网站在线| 国产成人aa在线观看| 一个人看的www免费观看视频| 久久午夜福利片| 在线天堂最新版资源| 一本一本综合久久| 男人舔奶头视频| 国产亚洲一区二区精品| 看非洲黑人一级黄片| 亚洲精品乱码久久久v下载方式| 国产精品久久久久久精品电影| 国产 一区 欧美 日韩| 亚洲av福利一区| 亚洲三级黄色毛片| 激情 狠狠 欧美| 人妻一区二区av| 日韩成人av中文字幕在线观看| 免费看光身美女| 午夜福利视频精品| 成年女人看的毛片在线观看| 亚洲人与动物交配视频| 国产精品偷伦视频观看了| 成人二区视频| 国产伦精品一区二区三区视频9| 国产大屁股一区二区在线视频| 欧美精品国产亚洲| 国产精品人妻久久久久久| 观看美女的网站| 女人久久www免费人成看片| 成人无遮挡网站| 亚洲欧美一区二区三区黑人 | 婷婷色综合www| 边亲边吃奶的免费视频| 麻豆乱淫一区二区| 最新中文字幕久久久久| 免费黄频网站在线观看国产| 久久久久久久午夜电影| 内射极品少妇av片p| 91精品伊人久久大香线蕉| 亚洲成人av在线免费| 久久久色成人| 自拍偷自拍亚洲精品老妇| 久久久久久久大尺度免费视频| 99久久精品热视频| 男女无遮挡免费网站观看| 在线观看国产h片| 看免费成人av毛片| 国产在视频线精品| 日韩人妻高清精品专区| 免费看日本二区| 99久久精品热视频| 成人欧美大片| 波多野结衣巨乳人妻| 日本色播在线视频| 综合色av麻豆| 成人亚洲精品一区在线观看 | 亚洲欧美精品自产自拍| 国产亚洲av嫩草精品影院| 欧美日韩一区二区视频在线观看视频在线 | 精品一区二区三区视频在线| 制服丝袜香蕉在线| 日韩欧美精品免费久久| 国产白丝娇喘喷水9色精品| 黄色怎么调成土黄色| 色5月婷婷丁香| 深爱激情五月婷婷| av天堂中文字幕网| 国产美女午夜福利| 少妇丰满av| 真实男女啪啪啪动态图| 久久久精品94久久精品| 大香蕉久久网| 国产精品嫩草影院av在线观看| 国产极品天堂在线| 成年av动漫网址| 亚洲精品色激情综合| 国产精品人妻久久久久久| 欧美zozozo另类| 成年女人看的毛片在线观看| 久久99热6这里只有精品| 草草在线视频免费看| 欧美97在线视频| 久久综合国产亚洲精品| 精品国产一区二区三区久久久樱花 | 亚洲精品久久午夜乱码| 肉色欧美久久久久久久蜜桃 | 免费播放大片免费观看视频在线观看| 亚洲av成人精品一区久久| 日韩强制内射视频| 人人妻人人澡人人爽人人夜夜| 精品一区二区三区视频在线| 日本色播在线视频| 免费少妇av软件| 免费大片18禁| 一级毛片黄色毛片免费观看视频| 日韩一区二区三区影片| 少妇人妻 视频| 成年女人在线观看亚洲视频 | 夜夜看夜夜爽夜夜摸| 99热6这里只有精品| 少妇丰满av| 欧美97在线视频| 午夜免费鲁丝| 午夜福利在线观看免费完整高清在| 人妻系列 视频| 日韩不卡一区二区三区视频在线| 国产欧美日韩精品一区二区| 日日摸夜夜添夜夜爱| 麻豆久久精品国产亚洲av| 女人被狂操c到高潮| 丰满人妻一区二区三区视频av| kizo精华| 最后的刺客免费高清国语| 午夜日本视频在线| 日日啪夜夜爽| 狂野欧美激情性xxxx在线观看| 国产黄片美女视频| 水蜜桃什么品种好| 一区二区av电影网| 国产午夜精品一二区理论片| 18禁在线无遮挡免费观看视频| 在线观看av片永久免费下载| 九九爱精品视频在线观看| 亚洲欧洲日产国产| 内射极品少妇av片p| 日本爱情动作片www.在线观看| 日本熟妇午夜| 欧美日韩一区二区视频在线观看视频在线 | 美女主播在线视频| 亚洲美女视频黄频| 国产永久视频网站| 狂野欧美激情性bbbbbb| 久久精品人妻少妇| 国产黄色视频一区二区在线观看| av在线观看视频网站免费| 极品少妇高潮喷水抽搐| 美女xxoo啪啪120秒动态图| 插逼视频在线观看| 日韩一区二区三区影片| 成人国产av品久久久| 亚洲最大成人av| 久久久久久久久久人人人人人人| 日韩一区二区三区影片| 丰满人妻一区二区三区视频av| 色5月婷婷丁香| 午夜福利视频1000在线观看| 亚洲精品,欧美精品| 国产 一区 欧美 日韩| 国产精品女同一区二区软件| 日本-黄色视频高清免费观看| 男人狂女人下面高潮的视频| 亚洲国产欧美在线一区| 国产成人精品福利久久| 狂野欧美激情性bbbbbb| 美女国产视频在线观看| 亚洲国产精品999| 国语对白做爰xxxⅹ性视频网站| 2021天堂中文幕一二区在线观| 日本一本二区三区精品| 91在线精品国自产拍蜜月| 成人毛片a级毛片在线播放| 中文字幕免费在线视频6| 国产黄a三级三级三级人| h日本视频在线播放| 少妇 在线观看| www.色视频.com| 91狼人影院| 在线 av 中文字幕| 亚洲欧美成人综合另类久久久| 国产又色又爽无遮挡免| 男插女下体视频免费在线播放| 亚洲熟女精品中文字幕| 欧美潮喷喷水| 国模一区二区三区四区视频| 亚洲成人精品中文字幕电影| 日韩电影二区| 国产免费一区二区三区四区乱码| 国产黄频视频在线观看| 男人添女人高潮全过程视频| 一个人观看的视频www高清免费观看| 亚洲精品日韩在线中文字幕| 国产高清三级在线| 国精品久久久久久国模美| 亚洲激情五月婷婷啪啪| 真实男女啪啪啪动态图| 亚洲欧美日韩卡通动漫| 亚洲精品日韩在线中文字幕| 又黄又爽又刺激的免费视频.| 亚洲,一卡二卡三卡| 亚洲精品自拍成人| 黄色配什么色好看| 国产亚洲精品久久久com| 欧美bdsm另类| 97超碰精品成人国产| 亚洲四区av| 日韩不卡一区二区三区视频在线| 日韩成人伦理影院| 在现免费观看毛片| 国产伦精品一区二区三区视频9| 亚洲性久久影院| 国产人妻一区二区三区在| 精品久久久久久电影网| 特级一级黄色大片| 在线免费十八禁| 久久久久久久久大av| 天天一区二区日本电影三级| 黄色视频在线播放观看不卡| 久久久久久伊人网av| 亚洲国产日韩一区二区| 亚洲欧美日韩另类电影网站 | 国产一区二区亚洲精品在线观看| 九九在线视频观看精品| 欧美日韩亚洲高清精品| 亚洲最大成人av| 国产精品一区二区性色av|