• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于差分編碼的RDF分組壓縮

    2020-11-14 04:00:28伍偉鑫韓京宇
    計算機(jī)工程 2020年11期
    關(guān)鍵詞:三元組謂語賓語

    伍偉鑫,韓京宇,朱 曼

    (南京郵電大學(xué) 計算機(jī)學(xué)院,南京 210023)

    0 概述

    為使計算機(jī)更好地理解人類創(chuàng)造的網(wǎng)絡(luò)資源,TIM等人于1998年提出了語義網(wǎng)的概念[1]。在語義網(wǎng)中,計算機(jī)可以理解文檔中的詞語和概念,從而使整個互聯(lián)網(wǎng)成為一個通用的信息交換介質(zhì)。W3C聯(lián)盟于1999年發(fā)布了基于XML語法的概念模型資源描述框架(Resource Description Framework,RDF)[2]用于實現(xiàn)語義網(wǎng),其在邏輯上以圖的形式表示,圖中節(jié)點(diǎn)代表資源或資源的屬性值,節(jié)點(diǎn)間連線代表節(jié)點(diǎn)間關(guān)系。RDF圖存儲為文件時以三元組的形式描述每條數(shù)據(jù),每個三元組由被描述的資源(主語)、資源的屬性(謂語)和屬性對應(yīng)的值(賓語)組成[3],形式化為(s,p,o)∈(U∪B)×U×(U∪B∪L),其中,U為統(tǒng)一資源標(biāo)識符,B為空白節(jié)點(diǎn),L為RDF文本內(nèi)容[4]。RDF模型憑借簡單、靈活、易擴(kuò)展等特點(diǎn)迅速成為知識領(lǐng)域主流的半結(jié)構(gòu)數(shù)據(jù)模式,被廣泛應(yīng)用于生命科學(xué)、地理學(xué)和維基百科等綜合知識領(lǐng)域。

    雖然RDF在邏輯層面表現(xiàn)優(yōu)異,但其在物理層面可擴(kuò)展性較差,原因在于RDF為了增強(qiáng)數(shù)據(jù)在邏輯層面的表現(xiàn)力而引入了大量重復(fù)的內(nèi)容,即數(shù)據(jù)實際存儲所占用空間遠(yuǎn)大于數(shù)據(jù)絕對空間[5],使得RDF數(shù)據(jù)集較其他存儲格式需要更多的存儲空間。例如數(shù)據(jù)集DBpedia,其利用靈活的RDF結(jié)構(gòu)有效地整合了維基百科中不同領(lǐng)域的異質(zhì)資源。最新版本的DBpedia中包含130億個三元組,描述了人類、地點(diǎn)、組織、電影、種類、疾病等多種信息,該數(shù)據(jù)集被應(yīng)用于語義搜索、實體消歧和翻譯等多種服務(wù)。盡管DBpeida可以通過調(diào)用不同的API進(jìn)行在線查詢,但一些需要完整數(shù)據(jù)集支持的應(yīng)用和服務(wù)必須在本地存儲和處理這個龐大的數(shù)據(jù)集,在資源受限的場景如輕量級的客戶端或者低性能的網(wǎng)絡(luò)場景中,如此大量的運(yùn)算是一個巨大的挑戰(zhàn),而由此產(chǎn)生的RDF分布式管理技術(shù)[6-8]和壓縮處理技術(shù),則可作為可擴(kuò)展技術(shù)來解決龐大RDF數(shù)據(jù)集的管理難題。

    雖然目前已存在一些有效的RDF壓縮方法,但其中仍存在不足,如包含尚未處理的冗余、壓縮過程中引入了新的冗余等。為此,本文提出一種基于差分編碼的RDF分組壓縮算法。通過構(gòu)建連接賓語的謂語組合,利用賓語和謂語之間相對唯一的映射關(guān)系減少不同謂語組合中的謂語冗余,并根據(jù)謂語組合將RDF數(shù)據(jù)分組存儲,以消除賓語冗余。在此基礎(chǔ)上,對分組后的主語序列進(jìn)行差分編碼,以序列間的偏移量代替數(shù)值本身,在不引入額外輔助索引的前提下優(yōu)化主語序列的存儲空間。

    1 研究背景

    RDF壓縮技術(shù)可分為物理壓縮和邏輯壓縮兩種方法,前者通過減少符號與句法冗余,將原數(shù)據(jù)轉(zhuǎn)化為更簡潔的存儲形式,后者致力于尋找一部分可以推導(dǎo)剩余數(shù)據(jù)的規(guī)則數(shù)據(jù),最終只需要存儲規(guī)則數(shù)據(jù)。

    最簡單的物理壓縮方法是通用壓縮算法,如gzip和bzip2,其優(yōu)點(diǎn)在于簡單且運(yùn)行效率高,可以輕易地集成到其他工作流中協(xié)同完成任務(wù),但此類算法沒有利用RDF數(shù)據(jù)的結(jié)構(gòu)特性,并且在壓縮過程中破壞了原數(shù)據(jù)的結(jié)構(gòu),無法進(jìn)一步在壓縮數(shù)據(jù)上進(jìn)行查詢檢索等復(fù)雜操作。

    HDT[9-10]是一種基于BitmapTriple的RDF專用物理壓縮算法,其將原始RDF數(shù)據(jù)轉(zhuǎn)化為一個包含多個深度為3的樹的森林,每棵樹的根節(jié)點(diǎn)代表主語,第2層是與根節(jié)點(diǎn)每個主語對應(yīng)的謂語列表,第3層是對應(yīng)每個(主語,謂語)組合的賓語列表。整個森林只需要存儲謂語列表、賓語列表和對應(yīng)代表分支信息的比特序列。這個簡單的編碼方法具有比通用壓縮算法更高的壓縮比率,并且可以通過遍歷森林中的根節(jié)點(diǎn)解決壓縮數(shù)據(jù)中基于主語的查詢問題。HDT++算法[11]在HDT的表達(dá)方式上進(jìn)行了改進(jìn),其根據(jù)謂語組合對主語分組,大幅減少了謂語冗余,并且根據(jù)謂語對賓語進(jìn)行二次分組,在分組中使用局部編碼代替全局編碼,以更小的比特數(shù)存儲賓語,獲得了比HDT更好的壓縮效果。k2-triple算法[12]根據(jù)不同謂語將原始數(shù)據(jù)劃分成多個以主語為橫坐標(biāo)、以賓語為縱坐標(biāo)的二維0-1矩陣,對這些稀疏的二維矩陣?yán)胟2-tree算法[13]進(jìn)行矩陣壓縮,同時該算法可實現(xiàn)針對壓縮數(shù)據(jù)常見的查詢操作。

    邏輯壓縮方法的重點(diǎn)在于尋找規(guī)則子圖的方式。文獻(xiàn)[14-15]提出了基于lean subgraph的邏輯壓縮算法。lean subgraph是原始數(shù)據(jù)圖的一個子圖,是原始圖實例的最小子圖,由lean subgraph所移除的三元組數(shù)量強(qiáng)依賴于原始圖的特征,最少可移除數(shù)量約為空白節(jié)點(diǎn)的兩倍。然而,lean graph中的部分三元組仍然可以由其他三元組推導(dǎo)得出,說明lean subgraph并不能完全移除冗余三元組[15]?;谝?guī)則的邏輯壓縮RB算法[16]通過頻繁項集挖掘技術(shù)檢測intra-property和inner-property兩種模式,intra-property在指定謂語的前提下挖掘重復(fù)出現(xiàn)的(主語->賓語)映射,inner-property挖掘重復(fù)出現(xiàn)的(主語->(謂語,賓語))映射,挖掘所得映射將轉(zhuǎn)化為規(guī)則用于移除冗余數(shù)據(jù)。然而這兩種模式并不都有效,只有inner-property可以移除大量冗余三元組。文獻(xiàn)[17]指出頻繁項集不能很好地捕獲數(shù)據(jù)中的語義冗余,并提出一種更具表現(xiàn)力的喇叭規(guī)則,只要三元組能夠匹配喇叭規(guī)則的頭部即可被移除出數(shù)據(jù)集。存儲的喇叭規(guī)則可以再次利用RB算法進(jìn)行壓縮,其壓縮性能較單獨(dú)使用RB算法有所提升,但同時也引入了較高的延遲。PIC算法[18]將原始數(shù)據(jù)轉(zhuǎn)化為以主語為橫軸、以(謂語,賓語)二元組為縱軸的二維0-1矩陣,并將矩陣中的每一行0-1數(shù)組序列轉(zhuǎn)化為一個新的三元組,原數(shù)據(jù)集的三元組可以由新產(chǎn)生的三元組計算得到,通過存儲數(shù)量遠(yuǎn)小于原三元組的新三元組實現(xiàn)數(shù)據(jù)壓縮。

    2 相關(guān)定義

    2.1 RDF數(shù)據(jù)的結(jié)構(gòu)化程度

    結(jié)構(gòu)化數(shù)據(jù)也稱為行數(shù)據(jù),是由二維表結(jié)構(gòu)進(jìn)行邏輯表達(dá)和實現(xiàn)的數(shù)據(jù),行數(shù)據(jù)嚴(yán)格遵循相同的數(shù)據(jù)格式與長度規(guī)范,主要通過關(guān)系型數(shù)據(jù)庫進(jìn)行存儲和管理。RDF數(shù)據(jù)是一種靈活的半結(jié)構(gòu)化數(shù)據(jù),并不強(qiáng)求所有數(shù)據(jù)都具有相同的數(shù)據(jù)格式,因此,不同RDF數(shù)據(jù)集中數(shù)據(jù)的結(jié)構(gòu)完整性也各不相同。

    定義2(RDF數(shù)據(jù)的結(jié)構(gòu)化程度) RDF數(shù)據(jù)的結(jié)構(gòu)化程度定義為謂語數(shù)量與連接主語的謂語組合數(shù)量的比值:|P|/|G|,其中,P為謂語集合,G為RDF數(shù)據(jù)集中謂語組合的集合。

    2.2 基于模式的冗余

    HDT++算法[11]將與主語相關(guān)聯(lián)的謂語歸納為謂語組合,再利用謂語組合對主語進(jìn)行分組,使得每個主語只被存儲一次,謂語通過謂語組合的形式只被存儲較少的次數(shù)。這樣分組的意義在于:對于不同的主語,可能存在多個謂語對其進(jìn)行描述,如“人”這個主語可能存在的謂語包括身高、體重、籍貫、膚色等,在結(jié)構(gòu)化程度高的數(shù)據(jù)集中,同一類型的主語大多具有相同的描述(謂語)。例如,對于A和B都存在身高、體重、膚色、籍貫的謂語描述,因此,將這樣的主語由(身高、體重、膚色、籍貫)的謂語組合進(jìn)行分組保存可以減少謂語的重復(fù)出現(xiàn)。但是在結(jié)構(gòu)化程度低的數(shù)據(jù)集中,對于同一類型的不同主語,對其描述的謂語各不相同。例如,對于A的描述有身高、體重、膚色、籍貫,對于B的描述只有身高、體重、膚色,而沒有籍貫的描述,對于C的描述只有身高、體重,這樣就會產(chǎn)生(身高、體重、膚色、籍貫)、(身高、體重、膚色)和(身高、體重)3種不同的謂語組合。上述3種謂語組合只存在少數(shù)謂語的差異,但因為組合不完全相等,所以相同的謂語就需要被存儲多次,由此產(chǎn)生冗余。

    2.3 差分編碼

    差分編碼[19]又稱增量編碼,其是以數(shù)字序列間差異進(jìn)行存儲,而不存儲數(shù)字本身的一種編方式,表示為:{a1,a2,…,an}→{a1,a2-a1,…,an-an-1}。顯然,差分編碼的優(yōu)點(diǎn)在于:當(dāng)序列中數(shù)字之間的偏移量較小時,差分編碼可以節(jié)省大量空間。此外,差分編碼在減少序列存儲空間的同時無需引入額外的中間變量,通過編碼方法自身即可完成序列的編碼與解碼。

    3 基于差分編碼的RDF分組壓縮算法

    基于上節(jié)所討論的冗余與編碼方式,本文構(gòu)建一種新的RDF數(shù)據(jù)分組表示方法用于減少低結(jié)構(gòu)化程度RDF數(shù)據(jù)中的謂語冗余。首先歸納與賓語相對應(yīng)的謂語組合,然后利用謂語組合對賓語進(jìn)行分組表示,減少謂語冗余并去除賓語冗余,最后對分組后的主語序列應(yīng)用差分編碼,以更小的空間存儲RDF中的全部主語。

    3.1 基于謂語-賓語的分組表示

    將RDF原始數(shù)據(jù)圖轉(zhuǎn)化為字典與ID圖,字典表示為RDF中的URI或字面值與其唯一ID的映射,ID圖為通過ID表示的原始三元組關(guān)系。URI或字面值通常是一串較長的字符串,如果重復(fù)存儲將造成存儲空間浪費(fèi),而通過字典將字符串映射為ID后只需要在字典中存儲一次。本文在此基礎(chǔ)上,將ID圖轉(zhuǎn)化為根據(jù)賓語歸納的謂語組合對賓語分組的形式,如圖1所示。其中,樹形結(jié)構(gòu)的根節(jié)點(diǎn)為賓語,第2層節(jié)點(diǎn)為與根節(jié)點(diǎn)賓語對應(yīng)的謂語組合,第3層節(jié)點(diǎn)為與(賓語,謂語)對應(yīng)的主語列表。不同的賓語如果對應(yīng)相同的謂語組合,則將其合并為一組,如圖2所示。例如,圖1中第1棵樹與第2棵樹的謂語組合相同,則將圖2中第1棵樹和第2棵樹的謂語組合合二為一共同存儲。

    圖1 基于謂語組合的RDF數(shù)據(jù)分組表示

    圖2 分組表示后相同謂語組合的歸納合并

    根據(jù)謂語對賓語分組的意義在于:

    1)存在一部分賓語同時與多個謂語相關(guān)聯(lián),將這些賓語的共同謂語抽取出來作為分組的規(guī)則對賓語進(jìn)行分組,可以減少不同賓語的相同謂語重復(fù)存儲。

    3)由于賓語只與很少數(shù)量的謂語相關(guān)聯(lián),因此由賓語歸納的謂語組合中包含謂語的數(shù)量非常少,即使在不同謂語組合間存在重復(fù)謂詞,重復(fù)謂詞的數(shù)量也會被限制,從而限制了謂語總數(shù)的增長。

    3.2 主語差分編碼

    原始RDF數(shù)據(jù)被轉(zhuǎn)化為分組表示后,主語也被對應(yīng)的謂語組合分到對應(yīng)的分組中,為對主語進(jìn)行差分編碼,需要進(jìn)行以下處理:

    1)對主語序列按照新的順序重新由小到大編碼,使主語序列可以發(fā)揮差分編碼的最大性能。值得注意的是,重新編碼指的是將字典中的唯一ID替換為新的根據(jù)分組位置的新ID,無須額外存儲新編碼的中間映射,而只需要在字典中進(jìn)行ID更新。

    2)將分組后的主語列表根據(jù)組內(nèi)的(賓語,謂語)三元組劃分成為不同的數(shù)字序列,對每個數(shù)字序列進(jìn)行差分編碼。

    在圖3中,主語序列(第1列)到第2列的轉(zhuǎn)化展示了主語序列重新編碼的過程,第2列到第3列的轉(zhuǎn)化展示了根據(jù)(賓語,謂語)二元組劃分的主語序列進(jìn)行差分編碼的過程。在存儲到文件中時,對于每個主語序列,序列中數(shù)值以變長長度存儲,由于差分編碼產(chǎn)生的偏移量之間可能大小差距較大,因此變長長度可以最大化節(jié)省空間。圖3中最后一列比特序列用于區(qū)分不同主語序列,一串連續(xù)的0-bit與一個單獨(dú)的1-bit表示其所對應(yīng)的主語序列歸屬于同一個(謂語,賓語)二元組。例如圖3中比特序列的前4個比特數(shù)為[0,0,0,1],說明其所對應(yīng)的主語序列[1,1,1,1]皆對應(yīng)二元組(1,1),而接下來的比特序列[0,0,1]所對應(yīng)的主語序列[5,1,1]則對應(yīng)二元組(1,3),可以發(fā)現(xiàn)二元組的第2個元素由1變成了3。由于3是該組謂語組合的最后一位,因此下一個比特序列所對應(yīng)的二元組變?yōu)?2,1)。在解壓縮時,依此類推即可逆向還原所有三元組。

    圖3 主語序列重編碼及差分編碼

    算法1描述了本文算法的壓縮過程,具體步驟如下:

    1)聲明object2predicaet、objPred2subject為映射,bitSeq為字符串(第1行)。

    2)遍歷原始數(shù)據(jù)三元組,統(tǒng)計賓語與謂語的映射關(guān)系和(賓語、謂語)二元組與主語的映射關(guān)系(第2行~第5行)。

    3)將賓語、謂語映射關(guān)系中的謂語組合去重歸納得到賓語組合與對應(yīng)的謂語組合(第6行)。

    4)從賓語組合、謂語組合中生成的(賓語、謂語)二元組對主語進(jìn)行歸納,在歸納過程中對每個二元組對應(yīng)的主語序列進(jìn)行差分編碼(第7行和第8行),同時通過比特序列界定不同主語序列的界限(第9行)。

    5)將賓語組合、謂語組合、主語序列和比特序列返回存儲到文件中(第10行)。

    算法1壓縮算法

    輸入原始三元組triples

    輸出謂語組合predicateGroups,賓語根據(jù)謂語組合所分組合 objectGroups,對應(yīng)(賓語,謂語)二元組的主語列表subjectList,主語切換標(biāo)記比特序列bitSeq

    1.object2predict← map,objPred2subject ← map,bitsequence ←string

    2.for subject,predicate,object← triples:

    3.object2predicate[object].add(predicate)

    4.objPred2subject[(object,predicate)].add(subject)

    5.end for

    6.predicateGroups,objectGroups ←reduce(object2predicate)

    7.for (o,p) ←predicateGroup,objectGroups:

    8.subjectList.add(deltaEncoding(objPred2subject[(o,p)]))

    9.bitSeq.add(len(objPred2subject[(o,p)]) * ‘0’+‘1’)

    10.returnobjectGroups,predicateGroups,subjectList,bitSeq

    算法1的空間復(fù)雜度主要源于object2predicate和objPred2subject的臨時存儲。object2predicate存儲內(nèi)容為賓語到謂語組合的映射,其中,key的數(shù)量為賓語數(shù)量|Object|,value的總數(shù)為三元組的數(shù)量n。objPred2subject存儲內(nèi)容為賓語與謂語的二元組到主語的映射,其中,所有元素的總量小于等于3倍的三元組數(shù)量。因此,算法1的空間復(fù)雜度為O(|Object|+n+3n)=O(n)。

    算法2描述了本文算法的解壓縮過程,具體步驟如下:

    1)將分組表示的賓語、謂語和主語從文件中讀出后,迭代每個謂語組合和對應(yīng)的賓語組合生成(賓語,謂語)二元組(第1行和第2行)。

    2)逐個訪問主語列表,在訪問過程中逐步還原差分編碼(第3行~第10行)。

    3)根據(jù)bitSeq中連續(xù)的0-bit和一個單獨(dú)的1-bit界定對應(yīng)當(dāng)前(謂語,賓語)二元組的主語序列的終止位置(第6行和第13行)。

    4)將符合條件的主語與二元組組成三元組添加到originalTriples中并最終返回。

    算法2解壓縮算法

    輸入謂語組合predicateGroups,賓語根據(jù)謂語組合所分組合objectGroups,對應(yīng)(賓語,謂語)二元組的主語列表subjectList,主語切換標(biāo)記比特序列bitSeq

    輸出ID表示的完整三元組originalTriples

    1.for (object,predicate) ← predicateGroups,objectGroups:

    2.//獲取每一對(賓語,謂語)二元組

    3.for subject,bit← subjectList,bitSeq:

    4.//通過bit確定subject的終止位置

    5.if subject.forwardBit=0:

    6.subject=subject+subject.forward

    7.//對差分編碼進(jìn)行解碼

    8.originalTriples←(subject,predicate,object)

    9.end if

    10.end for

    11.//構(gòu)成一條完整三元組

    12.until bit=1

    13.returnoriginalTriples

    算法2的時間復(fù)雜度主要源于迭代賓語、謂語二元組的for循環(huán),該for循環(huán)執(zhí)行次數(shù)與算法1中第2個for循環(huán)執(zhí)行次數(shù)相等。因此,算法的時間復(fù)雜度為O(|Object|×|P|)。由于算法2的計算過程不需要除輸入輸出外的額外空間,因此其空間復(fù)雜度為O(1)。

    4 實驗與結(jié)果分析

    本文實驗基于處理器為Intel Core i5 3.1 GHz,內(nèi)存為16 GB 2 133 MHz LPDDR3的計算機(jī)。分別選擇不同領(lǐng)域、不同大小和不同結(jié)構(gòu)化程度的數(shù)據(jù)集,數(shù)據(jù)集描述如表1所示,其中,Archives Hub是檔案文件描述數(shù)據(jù)集,Linkedmdb是電影領(lǐng)域數(shù)據(jù)集,rdfabout是綜合領(lǐng)域數(shù)據(jù)集,dbtune是音樂領(lǐng)域數(shù)據(jù)集。以上述4個數(shù)據(jù)集分析DGC的實驗結(jié)果,對DGC壓縮與解壓縮時間進(jìn)行對比,與HDT++算法對分組數(shù)量和分組謂語總數(shù)進(jìn)行對比,并與Plain(直接存儲)、HDT、HDT++算法對壓縮后空間容量進(jìn)行對比。

    表1 數(shù)據(jù)集描述

    DGC算法在不同數(shù)據(jù)集上壓縮與解壓縮的時間對比如圖4所示。一般而言,壓縮時間隨著三元組數(shù)量的增長而增長,但同時也受到謂語數(shù)量的影響,從rdfabout到DBpedia的時間陡增論證了這一點(diǎn),DBpedia不僅在三元組數(shù)量上是dbtune的7.3倍,在謂語數(shù)量上更是有146倍的增長,這使得DBpedia存在更多的分組,每個分組中也存在著更多的謂語。因此,需要更多的計算,導(dǎo)致時間的陡增。解壓縮時間雖然也隨著數(shù)據(jù)量的增大而增多,但其增長幅度相對較小,一方面由于解壓縮所需的計算量較少,另一方面可以對不同分組進(jìn)行并行處理以加快速度。

    圖4 壓縮與解壓縮的運(yùn)行時間對比

    在HDT++連接主語的謂語組合(PS分組)和DGC連接賓語的謂語組合(PO分組)兩種分組方式下,不同數(shù)據(jù)集謂語組合數(shù)量和謂語總數(shù)的對比如表2所示。可以看出,除數(shù)據(jù)集dbtune的PO分組數(shù)大于PS分組數(shù)外,其余數(shù)據(jù)集的PO分組數(shù)均小于PS分組組數(shù),這是由于dbtune的結(jié)構(gòu)化程度高于Archives Hub、Linkedmdb、rdfabout和DBpedia,說明dbtune數(shù)據(jù)集中與主語相連的謂語組合較為完整,可以很好地對主語進(jìn)行分組,而對于結(jié)構(gòu)化程度較低的另外4個數(shù)據(jù)集,謂語組合不能對主語進(jìn)行有效分組,但對賓語分組得到了很好的分組效果。

    表2 謂語-賓語分組與謂語-主語分組后謂語組合數(shù)與謂語總數(shù)的比較

    由表2可見,在Archives Hub、Linkedmdb、rdfabout、DBpedia數(shù)據(jù)集中,PO謂語總數(shù)都明顯低于PS謂語總數(shù),其中,在DBpedia數(shù)據(jù)集中將語總數(shù)從PS分組下的千萬量級減少到PO分組下的百萬量級,說明PO分組確實有效減少了大量謂語冗余,只有在dbtune數(shù)據(jù)集中PS分組獲得了更好的分組效果。但從另一個角度來看,dbtune的PO謂語組數(shù)是其PS謂語組數(shù)的2.5倍,而PO的謂語總數(shù)卻只是PS謂語總數(shù)的1.4倍,謂語總數(shù)的比例相對于組數(shù)的比例有所降低。反之,在Archives Hub中,PS的謂語組數(shù)是其PO謂語組數(shù)的2.6倍,與dbtune中PO組數(shù)對PS組數(shù)的比例類似,但PS的謂語總數(shù)是PO謂語總數(shù)15倍,在Linkedmdb和rdfabout數(shù)據(jù)集中也有相同的結(jié)論,這是由于PO分組冗余增長受限的特性限制了謂語冗余的產(chǎn)生,無論在結(jié)構(gòu)化程度高或低的數(shù)據(jù)集中,PO分組限制謂語冗余生成的特性都在發(fā)揮作用。

    不同算法的壓縮結(jié)果比較如表3所示,其中,Plain列表示將原始數(shù)據(jù)的ID圖直接寫入文件所需空間大小。顯然,DGC算法在所有數(shù)據(jù)集上均取得了最優(yōu)結(jié)果。與Plain和HDT相比,其在不同數(shù)據(jù)集上都取得了超過40%的性能優(yōu)化,這是因為DGC處理了Plain和HDT沒有處理的謂語組合冗余,并利用差分編碼減少了主語序列存儲所需的大量空間。

    表3 不同算法的壓縮結(jié)果比較

    由表3可見,DGC在與HDT++的對比中也取得了平均18%的優(yōu)化:在結(jié)構(gòu)化程度低的數(shù)據(jù)集Archives Hub、Linkedmdb、rdfabout和DBpedia中,PO分組獲得了冗余更少的謂語組合,差分編碼進(jìn)一步優(yōu)化了壓縮結(jié)果,最終兩者結(jié)合后獲得了平均17%的性能提升;在結(jié)構(gòu)化程度高的dbtune數(shù)據(jù)集中,PO分組相對于PS分組所帶來更多冗余的負(fù)面影響被差分編碼的優(yōu)異效果所彌補(bǔ),獲得了23%的性能提升。同時,其在結(jié)構(gòu)化程度更低的Archives Hub、Linkedmdb、rdfabout和DBpedia數(shù)據(jù)集的性能提升程度反而不及結(jié)構(gòu)化程度更高的dbtune,主要因為這4個數(shù)據(jù)集本身所包含的冗余較少,分組后謂語組合所需空間只占存儲所需空間的較小部分,導(dǎo)致性能提升程度有限。

    5 結(jié)束語

    本文提出一種基于差分編碼的RDF壓縮算法。根據(jù)謂語對賓語進(jìn)行分組,以減少謂語冗余,同時對分組后的主語序列進(jìn)行差分編碼,從而優(yōu)化主語存儲所需空間。實驗結(jié)果表明,對于結(jié)構(gòu)化程度不同的數(shù)據(jù)集,該算法較Plain、HDT和HDT++算法均能獲得不同程度的性能提升。下一步將設(shè)計更具通用性的壓縮算法以適用于更多具有不同結(jié)構(gòu)化程度的數(shù)據(jù)集,并實現(xiàn)對壓縮數(shù)據(jù)進(jìn)行復(fù)雜查詢的功能。

    猜你喜歡
    三元組謂語賓語
    基于語義增強(qiáng)雙編碼器的方面情感三元組提取
    軟件工程(2024年12期)2024-12-28 00:00:00
    基于帶噪聲數(shù)據(jù)集的強(qiáng)魯棒性隱含三元組質(zhì)檢算法*
    非謂語動詞
    連詞that引導(dǎo)的賓語從句
    非謂語動詞
    賓語從句及練習(xí)
    關(guān)于余撓三元組的periodic-模
    中考試題中的賓語從句
    非謂語動詞題不難答 石娟
    非謂語動詞
    欧美成人午夜精品| 黄色视频在线播放观看不卡| 午夜免费鲁丝| 国产aⅴ精品一区二区三区波| 自拍欧美九色日韩亚洲蝌蚪91| 91国产中文字幕| 一区二区三区精品91| 国产成人影院久久av| 电影成人av| 亚洲一区二区三区欧美精品| 男女边摸边吃奶| 国产精品偷伦视频观看了| 成人手机av| 亚洲五月婷婷丁香| 麻豆国产av国片精品| 在线观看免费午夜福利视频| 欧美人与性动交α欧美精品济南到| 欧美日韩成人在线一区二区| 国产精品久久久久久人妻精品电影 | 久久久精品免费免费高清| 国产xxxxx性猛交| 少妇精品久久久久久久| 啦啦啦免费观看视频1| tube8黄色片| 少妇精品久久久久久久| 久久狼人影院| 欧美激情 高清一区二区三区| 午夜福利欧美成人| 久久天堂一区二区三区四区| 欧美精品高潮呻吟av久久| 男女午夜视频在线观看| 日韩成人在线观看一区二区三区| 久久国产精品男人的天堂亚洲| 国产在线观看jvid| 国产欧美日韩一区二区三| 人妻 亚洲 视频| 国产又色又爽无遮挡免费看| 久久久精品免费免费高清| 另类亚洲欧美激情| 日韩三级视频一区二区三区| 午夜精品久久久久久毛片777| 国产片内射在线| 色老头精品视频在线观看| 精品亚洲成国产av| 香蕉丝袜av| 热99re8久久精品国产| 欧美乱妇无乱码| 久久九九热精品免费| 国产精品欧美亚洲77777| 亚洲专区字幕在线| 亚洲美女黄片视频| 免费观看人在逋| 亚洲人成伊人成综合网2020| netflix在线观看网站| 欧美日韩亚洲高清精品| 久久久久精品人妻al黑| 日本av免费视频播放| 黑人猛操日本美女一级片| 亚洲欧美日韩高清在线视频 | 夫妻午夜视频| 亚洲精品久久午夜乱码| bbb黄色大片| 国产一区二区 视频在线| 两性午夜刺激爽爽歪歪视频在线观看 | 女性被躁到高潮视频| 99久久99久久久精品蜜桃| 亚洲精品在线美女| 少妇被粗大的猛进出69影院| 免费观看av网站的网址| 热99re8久久精品国产| 丰满人妻熟妇乱又伦精品不卡| 伦理电影免费视频| 男男h啪啪无遮挡| 精品高清国产在线一区| 一区二区三区乱码不卡18| 手机成人av网站| 日韩中文字幕欧美一区二区| 黑人巨大精品欧美一区二区蜜桃| 搡老岳熟女国产| 亚洲成人国产一区在线观看| 亚洲精品粉嫩美女一区| 免费观看av网站的网址| 国产成人影院久久av| 亚洲人成伊人成综合网2020| 欧美中文综合在线视频| 日日爽夜夜爽网站| 国产精品影院久久| 免费女性裸体啪啪无遮挡网站| 亚洲精品乱久久久久久| 岛国在线观看网站| 国产又爽黄色视频| 老鸭窝网址在线观看| 国产亚洲欧美精品永久| 日韩一区二区三区影片| 天堂动漫精品| 18禁美女被吸乳视频| 久久精品亚洲av国产电影网| 操美女的视频在线观看| www.熟女人妻精品国产| 亚洲欧美一区二区三区久久| 国产精品国产高清国产av | 国产视频一区二区在线看| 亚洲国产欧美日韩在线播放| 午夜免费成人在线视频| 91麻豆精品激情在线观看国产 | 国产精品熟女久久久久浪| av电影中文网址| 菩萨蛮人人尽说江南好唐韦庄| 99九九在线精品视频| 少妇的丰满在线观看| 一区二区三区精品91| a级毛片在线看网站| 人人妻人人澡人人看| 人妻久久中文字幕网| 午夜激情久久久久久久| 国产成人免费无遮挡视频| 精品福利观看| 久久精品国产a三级三级三级| avwww免费| 国产成人精品在线电影| 久久精品成人免费网站| 亚洲免费av在线视频| 99国产精品一区二区三区| 成年动漫av网址| 又大又爽又粗| 啦啦啦视频在线资源免费观看| 好男人电影高清在线观看| 91av网站免费观看| svipshipincom国产片| 麻豆乱淫一区二区| 久久精品人人爽人人爽视色| 2018国产大陆天天弄谢| 超碰97精品在线观看| 日韩熟女老妇一区二区性免费视频| aaaaa片日本免费| 老司机亚洲免费影院| 一区二区日韩欧美中文字幕| 99精品久久久久人妻精品| 亚洲成人手机| 日韩精品免费视频一区二区三区| 最黄视频免费看| 亚洲欧美一区二区三区久久| 日韩精品免费视频一区二区三区| 国产熟女午夜一区二区三区| 欧美性长视频在线观看| 91精品三级在线观看| 日本一区二区免费在线视频| 色婷婷久久久亚洲欧美| 99re6热这里在线精品视频| 精品国产乱码久久久久久小说| 女人爽到高潮嗷嗷叫在线视频| 啦啦啦免费观看视频1| 这个男人来自地球电影免费观看| 天天躁日日躁夜夜躁夜夜| 亚洲第一av免费看| 99香蕉大伊视频| 一区二区三区乱码不卡18| 午夜福利乱码中文字幕| 男女下面插进去视频免费观看| 69精品国产乱码久久久| 成人影院久久| 日韩欧美国产一区二区入口| 国产成人精品久久二区二区91| 久久ye,这里只有精品| 黄色 视频免费看| 天天添夜夜摸| 法律面前人人平等表现在哪些方面| 激情视频va一区二区三区| 90打野战视频偷拍视频| 午夜成年电影在线免费观看| 女人被躁到高潮嗷嗷叫费观| 狠狠狠狠99中文字幕| 久久国产精品人妻蜜桃| 国产在线观看jvid| 日本av免费视频播放| 欧美日韩国产mv在线观看视频| 男女无遮挡免费网站观看| 欧美日韩成人在线一区二区| 午夜91福利影院| av在线播放免费不卡| 高清毛片免费观看视频网站 | 狠狠狠狠99中文字幕| 成人18禁高潮啪啪吃奶动态图| 久久久久久人人人人人| 久久亚洲真实| 看免费av毛片| 一区福利在线观看| 国产麻豆69| a级毛片黄视频| 99国产精品免费福利视频| 极品人妻少妇av视频| 久久久久网色| 岛国毛片在线播放| 91麻豆av在线| www.自偷自拍.com| a在线观看视频网站| 男男h啪啪无遮挡| 在线观看免费视频网站a站| tocl精华| 亚洲午夜精品一区,二区,三区| 国产伦理片在线播放av一区| 一级片'在线观看视频| 热re99久久精品国产66热6| 黑丝袜美女国产一区| 国产成人啪精品午夜网站| 悠悠久久av| 免费观看av网站的网址| 久久 成人 亚洲| 国产日韩欧美在线精品| 香蕉国产在线看| 一本综合久久免费| 亚洲成av片中文字幕在线观看| 亚洲国产av影院在线观看| 黄色视频在线播放观看不卡| 99国产综合亚洲精品| 成人影院久久| 久久国产精品男人的天堂亚洲| 成人黄色视频免费在线看| 夜夜骑夜夜射夜夜干| 国产欧美日韩一区二区三| 菩萨蛮人人尽说江南好唐韦庄| 麻豆成人av在线观看| 成人免费观看视频高清| 国产一区二区 视频在线| 国产日韩欧美亚洲二区| 午夜精品久久久久久毛片777| 国产老妇伦熟女老妇高清| 久久久水蜜桃国产精品网| 日韩中文字幕视频在线看片| 三上悠亚av全集在线观看| 国产精品久久久久久人妻精品电影 | 国产一区有黄有色的免费视频| 亚洲人成电影观看| 国产精品国产高清国产av | 三级毛片av免费| 成年版毛片免费区| 国产有黄有色有爽视频| 国产老妇伦熟女老妇高清| 十八禁网站网址无遮挡| 自拍欧美九色日韩亚洲蝌蚪91| 国产高清视频在线播放一区| 日韩人妻精品一区2区三区| 国产1区2区3区精品| 考比视频在线观看| av网站在线播放免费| 狠狠精品人妻久久久久久综合| 女性生殖器流出的白浆| 亚洲人成伊人成综合网2020| 成人精品一区二区免费| 又紧又爽又黄一区二区| 一区二区日韩欧美中文字幕| 大型av网站在线播放| 欧美一级毛片孕妇| 成人永久免费在线观看视频 | 亚洲国产av新网站| 亚洲av成人一区二区三| 亚洲精品在线观看二区| 国产精品.久久久| 精品一区二区三区四区五区乱码| 成人精品一区二区免费| 国产在线一区二区三区精| 亚洲人成77777在线视频| 性少妇av在线| 黑人操中国人逼视频| 欧美日韩亚洲高清精品| 99精国产麻豆久久婷婷| 久久青草综合色| 久久精品国产亚洲av香蕉五月 | 欧美乱码精品一区二区三区| 亚洲中文av在线| 国产精品一区二区在线不卡| 国产精品香港三级国产av潘金莲| 十分钟在线观看高清视频www| 亚洲精品在线美女| 日韩大码丰满熟妇| 亚洲欧美精品综合一区二区三区| 肉色欧美久久久久久久蜜桃| 色播在线永久视频| 精品少妇黑人巨大在线播放| 两个人看的免费小视频| av视频免费观看在线观看| 欧美黄色淫秽网站| 新久久久久国产一级毛片| 久久午夜亚洲精品久久| 国产亚洲一区二区精品| 一边摸一边抽搐一进一小说 | 午夜福利欧美成人| 老司机午夜福利在线观看视频 | 欧美亚洲 丝袜 人妻 在线| 不卡av一区二区三区| 人人妻人人澡人人爽人人夜夜| 最新美女视频免费是黄的| 丁香欧美五月| 一本色道久久久久久精品综合| 午夜精品国产一区二区电影| 制服诱惑二区| 岛国在线观看网站| 人妻一区二区av| 一区二区av电影网| 国产精品国产高清国产av | av福利片在线| 丝袜在线中文字幕| 国产色视频综合| 下体分泌物呈黄色| 男女下面插进去视频免费观看| 丰满少妇做爰视频| 精品久久久久久久毛片微露脸| 亚洲精品久久午夜乱码| 十八禁网站网址无遮挡| 黄色怎么调成土黄色| 久热这里只有精品99| 久久久久视频综合| 免费黄频网站在线观看国产| 欧美黄色淫秽网站| 新久久久久国产一级毛片| 在线观看免费午夜福利视频| 激情视频va一区二区三区| 日韩人妻精品一区2区三区| 欧美国产精品va在线观看不卡| 视频区欧美日本亚洲| 久久久久久久久免费视频了| 18禁国产床啪视频网站| 黄色丝袜av网址大全| 国产又色又爽无遮挡免费看| 久久久国产一区二区| 涩涩av久久男人的天堂| 菩萨蛮人人尽说江南好唐韦庄| 成人av一区二区三区在线看| 香蕉国产在线看| 午夜两性在线视频| 最新的欧美精品一区二区| 欧美日韩精品网址| 亚洲黑人精品在线| 777久久人妻少妇嫩草av网站| 国内毛片毛片毛片毛片毛片| 成人永久免费在线观看视频 | 97人妻天天添夜夜摸| 中文字幕另类日韩欧美亚洲嫩草| 又黄又粗又硬又大视频| 51午夜福利影视在线观看| 久久精品国产综合久久久| 黄色视频不卡| 中文字幕av电影在线播放| 亚洲av美国av| 50天的宝宝边吃奶边哭怎么回事| 99精品欧美一区二区三区四区| 丰满人妻熟妇乱又伦精品不卡| 久久精品熟女亚洲av麻豆精品| 国产成人欧美在线观看 | 精品国产一区二区三区久久久樱花| 国精品久久久久久国模美| 高清视频免费观看一区二区| 怎么达到女性高潮| 老汉色av国产亚洲站长工具| 中文字幕av电影在线播放| 亚洲精品美女久久久久99蜜臀| 制服人妻中文乱码| 亚洲视频免费观看视频| 免费av中文字幕在线| 巨乳人妻的诱惑在线观看| 操美女的视频在线观看| 欧美av亚洲av综合av国产av| 狂野欧美激情性xxxx| 亚洲美女黄片视频| 欧美一级毛片孕妇| 在线观看免费视频网站a站| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲美女黄片视频| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲欧美色中文字幕在线| 国产成人欧美在线观看 | 狠狠婷婷综合久久久久久88av| netflix在线观看网站| 成人免费观看视频高清| 精品国产国语对白av| 欧美日韩中文字幕国产精品一区二区三区 | 色尼玛亚洲综合影院| 在线观看舔阴道视频| 久久精品aⅴ一区二区三区四区| 一夜夜www| 国精品久久久久久国模美| 欧美午夜高清在线| 免费不卡黄色视频| 少妇 在线观看| 成人亚洲精品一区在线观看| 狂野欧美激情性xxxx| 中文亚洲av片在线观看爽 | 中文字幕另类日韩欧美亚洲嫩草| 两个人看的免费小视频| 欧美av亚洲av综合av国产av| 亚洲色图 男人天堂 中文字幕| 亚洲自偷自拍图片 自拍| 老汉色av国产亚洲站长工具| 国产精品亚洲一级av第二区| 99在线人妻在线中文字幕 | 成人国产一区最新在线观看| 国产av精品麻豆| 国产一区二区 视频在线| 999久久久国产精品视频| 香蕉丝袜av| 国产成人av教育| 色综合婷婷激情| 人妻 亚洲 视频| e午夜精品久久久久久久| 一级黄色大片毛片| 考比视频在线观看| 中文字幕人妻熟女乱码| 亚洲午夜精品一区,二区,三区| 一个人免费看片子| 亚洲av国产av综合av卡| 无限看片的www在线观看| 老汉色av国产亚洲站长工具| 国产男女内射视频| 乱人伦中国视频| 后天国语完整版免费观看| 在线 av 中文字幕| 成人亚洲精品一区在线观看| 精品第一国产精品| 国产精品香港三级国产av潘金莲| aaaaa片日本免费| 欧美日韩亚洲高清精品| 欧美日韩成人在线一区二区| 在线十欧美十亚洲十日本专区| 免费女性裸体啪啪无遮挡网站| 色婷婷久久久亚洲欧美| 亚洲一区二区三区欧美精品| 欧美亚洲日本最大视频资源| 热99re8久久精品国产| 免费看a级黄色片| 精品久久蜜臀av无| 久久久精品免费免费高清| 黑人猛操日本美女一级片| 另类亚洲欧美激情| 色视频在线一区二区三区| 亚洲熟妇熟女久久| 99九九在线精品视频| 国产有黄有色有爽视频| 久久久久网色| 久久精品成人免费网站| 久久久精品区二区三区| av福利片在线| 亚洲全国av大片| 亚洲人成伊人成综合网2020| 国产精品麻豆人妻色哟哟久久| 欧美成人免费av一区二区三区 | 日韩制服丝袜自拍偷拍| 欧美日韩成人在线一区二区| 黄网站色视频无遮挡免费观看| 日本av免费视频播放| 国产欧美日韩一区二区三区在线| 99热网站在线观看| 国产又色又爽无遮挡免费看| 国产人伦9x9x在线观看| 亚洲精品美女久久av网站| 日本撒尿小便嘘嘘汇集6| 自线自在国产av| 国产成人一区二区三区免费视频网站| av天堂在线播放| 国产成人免费观看mmmm| 天天影视国产精品| 如日韩欧美国产精品一区二区三区| 一本久久精品| 亚洲精品粉嫩美女一区| 91精品国产国语对白视频| 女性生殖器流出的白浆| 天天躁日日躁夜夜躁夜夜| 国产亚洲精品久久久久5区| 不卡av一区二区三区| 99国产精品一区二区蜜桃av | www.自偷自拍.com| 操美女的视频在线观看| 国产日韩欧美在线精品| 正在播放国产对白刺激| 国产在线视频一区二区| 国产1区2区3区精品| 免费高清在线观看日韩| 久久精品亚洲熟妇少妇任你| 午夜福利在线观看吧| 成人特级黄色片久久久久久久 | 一二三四在线观看免费中文在| 香蕉国产在线看| 亚洲精品在线观看二区| 亚洲欧洲日产国产| 黄色视频不卡| 757午夜福利合集在线观看| 亚洲精品自拍成人| 狠狠精品人妻久久久久久综合| 女人精品久久久久毛片| 亚洲精品久久成人aⅴ小说| 成人18禁高潮啪啪吃奶动态图| 亚洲精品美女久久久久99蜜臀| 日日摸夜夜添夜夜添小说| 日韩视频一区二区在线观看| 色婷婷久久久亚洲欧美| 嫁个100分男人电影在线观看| 中文字幕制服av| 在线av久久热| 日韩欧美一区二区三区在线观看 | 色综合婷婷激情| 天堂中文最新版在线下载| 亚洲专区国产一区二区| 亚洲人成电影免费在线| 国产在线观看jvid| 搡老乐熟女国产| 日韩欧美三级三区| 亚洲av片天天在线观看| 最近最新中文字幕大全免费视频| 亚洲三区欧美一区| 精品一区二区三区四区五区乱码| avwww免费| 人人妻人人添人人爽欧美一区卜| 国产一区二区三区在线臀色熟女 | 精品少妇内射三级| 亚洲精品中文字幕一二三四区 | 一区二区av电影网| 国产淫语在线视频| 午夜免费鲁丝| 欧美激情高清一区二区三区| 亚洲精品成人av观看孕妇| 欧美日韩福利视频一区二区| 国产成人系列免费观看| 亚洲国产欧美在线一区| 免费少妇av软件| 欧美日韩亚洲国产一区二区在线观看 | 黑人巨大精品欧美一区二区蜜桃| 十八禁人妻一区二区| 侵犯人妻中文字幕一二三四区| 1024视频免费在线观看| 成人特级黄色片久久久久久久 | 亚洲精品av麻豆狂野| 欧美日本中文国产一区发布| 啦啦啦在线免费观看视频4| 亚洲专区中文字幕在线| 制服诱惑二区| 久久婷婷成人综合色麻豆| 汤姆久久久久久久影院中文字幕| 久久国产精品影院| 桃红色精品国产亚洲av| 午夜两性在线视频| 欧美日韩视频精品一区| 12—13女人毛片做爰片一| 国产熟女午夜一区二区三区| 老熟妇仑乱视频hdxx| 99热国产这里只有精品6| 亚洲av成人不卡在线观看播放网| 日本一区二区免费在线视频| 99国产极品粉嫩在线观看| e午夜精品久久久久久久| 在线观看人妻少妇| 一本色道久久久久久精品综合| 国产真人三级小视频在线观看| 国产成人啪精品午夜网站| 考比视频在线观看| 最新美女视频免费是黄的| 欧美黑人欧美精品刺激| av网站在线播放免费| 男女无遮挡免费网站观看| 男女高潮啪啪啪动态图| 亚洲精品一二三| 精品少妇久久久久久888优播| 欧美日韩中文字幕国产精品一区二区三区 | 一级毛片精品| 亚洲国产成人一精品久久久| 国产精品九九99| 国产成人av激情在线播放| 在线天堂中文资源库| 亚洲精品av麻豆狂野| 亚洲精品粉嫩美女一区| 中文字幕av电影在线播放| 露出奶头的视频| 搡老熟女国产l中国老女人| 香蕉丝袜av| 黄色视频在线播放观看不卡| 99riav亚洲国产免费| 国产精品亚洲一级av第二区| 国产精品偷伦视频观看了| 亚洲精品在线美女| tocl精华| 亚洲全国av大片| 欧美黄色淫秽网站| 亚洲精品久久成人aⅴ小说| 久久午夜综合久久蜜桃| 久久久久精品人妻al黑| 丝袜美足系列| 少妇裸体淫交视频免费看高清 | 高清欧美精品videossex| 男女免费视频国产| 9热在线视频观看99| 18在线观看网站| 女人被躁到高潮嗷嗷叫费观| 老司机午夜十八禁免费视频| 欧美av亚洲av综合av国产av| 在线播放国产精品三级| 99精品欧美一区二区三区四区| 成人精品一区二区免费| 久久人妻熟女aⅴ| 国产精品一区二区精品视频观看| 青草久久国产| 精品亚洲乱码少妇综合久久| 黑人欧美特级aaaaaa片| 大型av网站在线播放| 老熟女久久久| 国产在线精品亚洲第一网站| 亚洲一码二码三码区别大吗| 日韩制服丝袜自拍偷拍| 久久热在线av| 久久99一区二区三区| 亚洲全国av大片| 最新美女视频免费是黄的| 狠狠狠狠99中文字幕| 丝瓜视频免费看黄片| 久久午夜综合久久蜜桃| 在线看a的网站| 日韩欧美国产一区二区入口| 久久久久久久久免费视频了|