• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于差分編碼的RDF分組壓縮

    2020-11-14 04:00:28伍偉鑫韓京宇
    計算機(jī)工程 2020年11期
    關(guān)鍵詞:三元組謂語賓語

    伍偉鑫,韓京宇,朱 曼

    (南京郵電大學(xué) 計算機(jī)學(xué)院,南京 210023)

    0 概述

    為使計算機(jī)更好地理解人類創(chuàng)造的網(wǎng)絡(luò)資源,TIM等人于1998年提出了語義網(wǎng)的概念[1]。在語義網(wǎng)中,計算機(jī)可以理解文檔中的詞語和概念,從而使整個互聯(lián)網(wǎng)成為一個通用的信息交換介質(zhì)。W3C聯(lián)盟于1999年發(fā)布了基于XML語法的概念模型資源描述框架(Resource Description Framework,RDF)[2]用于實現(xiàn)語義網(wǎng),其在邏輯上以圖的形式表示,圖中節(jié)點(diǎn)代表資源或資源的屬性值,節(jié)點(diǎn)間連線代表節(jié)點(diǎn)間關(guān)系。RDF圖存儲為文件時以三元組的形式描述每條數(shù)據(jù),每個三元組由被描述的資源(主語)、資源的屬性(謂語)和屬性對應(yīng)的值(賓語)組成[3],形式化為(s,p,o)∈(U∪B)×U×(U∪B∪L),其中,U為統(tǒng)一資源標(biāo)識符,B為空白節(jié)點(diǎn),L為RDF文本內(nèi)容[4]。RDF模型憑借簡單、靈活、易擴(kuò)展等特點(diǎn)迅速成為知識領(lǐng)域主流的半結(jié)構(gòu)數(shù)據(jù)模式,被廣泛應(yīng)用于生命科學(xué)、地理學(xué)和維基百科等綜合知識領(lǐng)域。

    雖然RDF在邏輯層面表現(xiàn)優(yōu)異,但其在物理層面可擴(kuò)展性較差,原因在于RDF為了增強(qiáng)數(shù)據(jù)在邏輯層面的表現(xiàn)力而引入了大量重復(fù)的內(nèi)容,即數(shù)據(jù)實際存儲所占用空間遠(yuǎn)大于數(shù)據(jù)絕對空間[5],使得RDF數(shù)據(jù)集較其他存儲格式需要更多的存儲空間。例如數(shù)據(jù)集DBpedia,其利用靈活的RDF結(jié)構(gòu)有效地整合了維基百科中不同領(lǐng)域的異質(zhì)資源。最新版本的DBpedia中包含130億個三元組,描述了人類、地點(diǎn)、組織、電影、種類、疾病等多種信息,該數(shù)據(jù)集被應(yīng)用于語義搜索、實體消歧和翻譯等多種服務(wù)。盡管DBpeida可以通過調(diào)用不同的API進(jìn)行在線查詢,但一些需要完整數(shù)據(jù)集支持的應(yīng)用和服務(wù)必須在本地存儲和處理這個龐大的數(shù)據(jù)集,在資源受限的場景如輕量級的客戶端或者低性能的網(wǎng)絡(luò)場景中,如此大量的運(yùn)算是一個巨大的挑戰(zhàn),而由此產(chǎn)生的RDF分布式管理技術(shù)[6-8]和壓縮處理技術(shù),則可作為可擴(kuò)展技術(shù)來解決龐大RDF數(shù)據(jù)集的管理難題。

    雖然目前已存在一些有效的RDF壓縮方法,但其中仍存在不足,如包含尚未處理的冗余、壓縮過程中引入了新的冗余等。為此,本文提出一種基于差分編碼的RDF分組壓縮算法。通過構(gòu)建連接賓語的謂語組合,利用賓語和謂語之間相對唯一的映射關(guān)系減少不同謂語組合中的謂語冗余,并根據(jù)謂語組合將RDF數(shù)據(jù)分組存儲,以消除賓語冗余。在此基礎(chǔ)上,對分組后的主語序列進(jìn)行差分編碼,以序列間的偏移量代替數(shù)值本身,在不引入額外輔助索引的前提下優(yōu)化主語序列的存儲空間。

    1 研究背景

    RDF壓縮技術(shù)可分為物理壓縮和邏輯壓縮兩種方法,前者通過減少符號與句法冗余,將原數(shù)據(jù)轉(zhuǎn)化為更簡潔的存儲形式,后者致力于尋找一部分可以推導(dǎo)剩余數(shù)據(jù)的規(guī)則數(shù)據(jù),最終只需要存儲規(guī)則數(shù)據(jù)。

    最簡單的物理壓縮方法是通用壓縮算法,如gzip和bzip2,其優(yōu)點(diǎn)在于簡單且運(yùn)行效率高,可以輕易地集成到其他工作流中協(xié)同完成任務(wù),但此類算法沒有利用RDF數(shù)據(jù)的結(jié)構(gòu)特性,并且在壓縮過程中破壞了原數(shù)據(jù)的結(jié)構(gòu),無法進(jìn)一步在壓縮數(shù)據(jù)上進(jìn)行查詢檢索等復(fù)雜操作。

    HDT[9-10]是一種基于BitmapTriple的RDF專用物理壓縮算法,其將原始RDF數(shù)據(jù)轉(zhuǎn)化為一個包含多個深度為3的樹的森林,每棵樹的根節(jié)點(diǎn)代表主語,第2層是與根節(jié)點(diǎn)每個主語對應(yīng)的謂語列表,第3層是對應(yīng)每個(主語,謂語)組合的賓語列表。整個森林只需要存儲謂語列表、賓語列表和對應(yīng)代表分支信息的比特序列。這個簡單的編碼方法具有比通用壓縮算法更高的壓縮比率,并且可以通過遍歷森林中的根節(jié)點(diǎn)解決壓縮數(shù)據(jù)中基于主語的查詢問題。HDT++算法[11]在HDT的表達(dá)方式上進(jìn)行了改進(jìn),其根據(jù)謂語組合對主語分組,大幅減少了謂語冗余,并且根據(jù)謂語對賓語進(jìn)行二次分組,在分組中使用局部編碼代替全局編碼,以更小的比特數(shù)存儲賓語,獲得了比HDT更好的壓縮效果。k2-triple算法[12]根據(jù)不同謂語將原始數(shù)據(jù)劃分成多個以主語為橫坐標(biāo)、以賓語為縱坐標(biāo)的二維0-1矩陣,對這些稀疏的二維矩陣?yán)胟2-tree算法[13]進(jìn)行矩陣壓縮,同時該算法可實現(xiàn)針對壓縮數(shù)據(jù)常見的查詢操作。

    邏輯壓縮方法的重點(diǎn)在于尋找規(guī)則子圖的方式。文獻(xiàn)[14-15]提出了基于lean subgraph的邏輯壓縮算法。lean subgraph是原始數(shù)據(jù)圖的一個子圖,是原始圖實例的最小子圖,由lean subgraph所移除的三元組數(shù)量強(qiáng)依賴于原始圖的特征,最少可移除數(shù)量約為空白節(jié)點(diǎn)的兩倍。然而,lean graph中的部分三元組仍然可以由其他三元組推導(dǎo)得出,說明lean subgraph并不能完全移除冗余三元組[15]?;谝?guī)則的邏輯壓縮RB算法[16]通過頻繁項集挖掘技術(shù)檢測intra-property和inner-property兩種模式,intra-property在指定謂語的前提下挖掘重復(fù)出現(xiàn)的(主語->賓語)映射,inner-property挖掘重復(fù)出現(xiàn)的(主語->(謂語,賓語))映射,挖掘所得映射將轉(zhuǎn)化為規(guī)則用于移除冗余數(shù)據(jù)。然而這兩種模式并不都有效,只有inner-property可以移除大量冗余三元組。文獻(xiàn)[17]指出頻繁項集不能很好地捕獲數(shù)據(jù)中的語義冗余,并提出一種更具表現(xiàn)力的喇叭規(guī)則,只要三元組能夠匹配喇叭規(guī)則的頭部即可被移除出數(shù)據(jù)集。存儲的喇叭規(guī)則可以再次利用RB算法進(jìn)行壓縮,其壓縮性能較單獨(dú)使用RB算法有所提升,但同時也引入了較高的延遲。PIC算法[18]將原始數(shù)據(jù)轉(zhuǎn)化為以主語為橫軸、以(謂語,賓語)二元組為縱軸的二維0-1矩陣,并將矩陣中的每一行0-1數(shù)組序列轉(zhuǎn)化為一個新的三元組,原數(shù)據(jù)集的三元組可以由新產(chǎn)生的三元組計算得到,通過存儲數(shù)量遠(yuǎn)小于原三元組的新三元組實現(xiàn)數(shù)據(jù)壓縮。

    2 相關(guān)定義

    2.1 RDF數(shù)據(jù)的結(jié)構(gòu)化程度

    結(jié)構(gòu)化數(shù)據(jù)也稱為行數(shù)據(jù),是由二維表結(jié)構(gòu)進(jìn)行邏輯表達(dá)和實現(xiàn)的數(shù)據(jù),行數(shù)據(jù)嚴(yán)格遵循相同的數(shù)據(jù)格式與長度規(guī)范,主要通過關(guān)系型數(shù)據(jù)庫進(jìn)行存儲和管理。RDF數(shù)據(jù)是一種靈活的半結(jié)構(gòu)化數(shù)據(jù),并不強(qiáng)求所有數(shù)據(jù)都具有相同的數(shù)據(jù)格式,因此,不同RDF數(shù)據(jù)集中數(shù)據(jù)的結(jié)構(gòu)完整性也各不相同。

    定義2(RDF數(shù)據(jù)的結(jié)構(gòu)化程度) RDF數(shù)據(jù)的結(jié)構(gòu)化程度定義為謂語數(shù)量與連接主語的謂語組合數(shù)量的比值:|P|/|G|,其中,P為謂語集合,G為RDF數(shù)據(jù)集中謂語組合的集合。

    2.2 基于模式的冗余

    HDT++算法[11]將與主語相關(guān)聯(lián)的謂語歸納為謂語組合,再利用謂語組合對主語進(jìn)行分組,使得每個主語只被存儲一次,謂語通過謂語組合的形式只被存儲較少的次數(shù)。這樣分組的意義在于:對于不同的主語,可能存在多個謂語對其進(jìn)行描述,如“人”這個主語可能存在的謂語包括身高、體重、籍貫、膚色等,在結(jié)構(gòu)化程度高的數(shù)據(jù)集中,同一類型的主語大多具有相同的描述(謂語)。例如,對于A和B都存在身高、體重、膚色、籍貫的謂語描述,因此,將這樣的主語由(身高、體重、膚色、籍貫)的謂語組合進(jìn)行分組保存可以減少謂語的重復(fù)出現(xiàn)。但是在結(jié)構(gòu)化程度低的數(shù)據(jù)集中,對于同一類型的不同主語,對其描述的謂語各不相同。例如,對于A的描述有身高、體重、膚色、籍貫,對于B的描述只有身高、體重、膚色,而沒有籍貫的描述,對于C的描述只有身高、體重,這樣就會產(chǎn)生(身高、體重、膚色、籍貫)、(身高、體重、膚色)和(身高、體重)3種不同的謂語組合。上述3種謂語組合只存在少數(shù)謂語的差異,但因為組合不完全相等,所以相同的謂語就需要被存儲多次,由此產(chǎn)生冗余。

    2.3 差分編碼

    差分編碼[19]又稱增量編碼,其是以數(shù)字序列間差異進(jìn)行存儲,而不存儲數(shù)字本身的一種編方式,表示為:{a1,a2,…,an}→{a1,a2-a1,…,an-an-1}。顯然,差分編碼的優(yōu)點(diǎn)在于:當(dāng)序列中數(shù)字之間的偏移量較小時,差分編碼可以節(jié)省大量空間。此外,差分編碼在減少序列存儲空間的同時無需引入額外的中間變量,通過編碼方法自身即可完成序列的編碼與解碼。

    3 基于差分編碼的RDF分組壓縮算法

    基于上節(jié)所討論的冗余與編碼方式,本文構(gòu)建一種新的RDF數(shù)據(jù)分組表示方法用于減少低結(jié)構(gòu)化程度RDF數(shù)據(jù)中的謂語冗余。首先歸納與賓語相對應(yīng)的謂語組合,然后利用謂語組合對賓語進(jìn)行分組表示,減少謂語冗余并去除賓語冗余,最后對分組后的主語序列應(yīng)用差分編碼,以更小的空間存儲RDF中的全部主語。

    3.1 基于謂語-賓語的分組表示

    將RDF原始數(shù)據(jù)圖轉(zhuǎn)化為字典與ID圖,字典表示為RDF中的URI或字面值與其唯一ID的映射,ID圖為通過ID表示的原始三元組關(guān)系。URI或字面值通常是一串較長的字符串,如果重復(fù)存儲將造成存儲空間浪費(fèi),而通過字典將字符串映射為ID后只需要在字典中存儲一次。本文在此基礎(chǔ)上,將ID圖轉(zhuǎn)化為根據(jù)賓語歸納的謂語組合對賓語分組的形式,如圖1所示。其中,樹形結(jié)構(gòu)的根節(jié)點(diǎn)為賓語,第2層節(jié)點(diǎn)為與根節(jié)點(diǎn)賓語對應(yīng)的謂語組合,第3層節(jié)點(diǎn)為與(賓語,謂語)對應(yīng)的主語列表。不同的賓語如果對應(yīng)相同的謂語組合,則將其合并為一組,如圖2所示。例如,圖1中第1棵樹與第2棵樹的謂語組合相同,則將圖2中第1棵樹和第2棵樹的謂語組合合二為一共同存儲。

    圖1 基于謂語組合的RDF數(shù)據(jù)分組表示

    圖2 分組表示后相同謂語組合的歸納合并

    根據(jù)謂語對賓語分組的意義在于:

    1)存在一部分賓語同時與多個謂語相關(guān)聯(lián),將這些賓語的共同謂語抽取出來作為分組的規(guī)則對賓語進(jìn)行分組,可以減少不同賓語的相同謂語重復(fù)存儲。

    3)由于賓語只與很少數(shù)量的謂語相關(guān)聯(lián),因此由賓語歸納的謂語組合中包含謂語的數(shù)量非常少,即使在不同謂語組合間存在重復(fù)謂詞,重復(fù)謂詞的數(shù)量也會被限制,從而限制了謂語總數(shù)的增長。

    3.2 主語差分編碼

    原始RDF數(shù)據(jù)被轉(zhuǎn)化為分組表示后,主語也被對應(yīng)的謂語組合分到對應(yīng)的分組中,為對主語進(jìn)行差分編碼,需要進(jìn)行以下處理:

    1)對主語序列按照新的順序重新由小到大編碼,使主語序列可以發(fā)揮差分編碼的最大性能。值得注意的是,重新編碼指的是將字典中的唯一ID替換為新的根據(jù)分組位置的新ID,無須額外存儲新編碼的中間映射,而只需要在字典中進(jìn)行ID更新。

    2)將分組后的主語列表根據(jù)組內(nèi)的(賓語,謂語)三元組劃分成為不同的數(shù)字序列,對每個數(shù)字序列進(jìn)行差分編碼。

    在圖3中,主語序列(第1列)到第2列的轉(zhuǎn)化展示了主語序列重新編碼的過程,第2列到第3列的轉(zhuǎn)化展示了根據(jù)(賓語,謂語)二元組劃分的主語序列進(jìn)行差分編碼的過程。在存儲到文件中時,對于每個主語序列,序列中數(shù)值以變長長度存儲,由于差分編碼產(chǎn)生的偏移量之間可能大小差距較大,因此變長長度可以最大化節(jié)省空間。圖3中最后一列比特序列用于區(qū)分不同主語序列,一串連續(xù)的0-bit與一個單獨(dú)的1-bit表示其所對應(yīng)的主語序列歸屬于同一個(謂語,賓語)二元組。例如圖3中比特序列的前4個比特數(shù)為[0,0,0,1],說明其所對應(yīng)的主語序列[1,1,1,1]皆對應(yīng)二元組(1,1),而接下來的比特序列[0,0,1]所對應(yīng)的主語序列[5,1,1]則對應(yīng)二元組(1,3),可以發(fā)現(xiàn)二元組的第2個元素由1變成了3。由于3是該組謂語組合的最后一位,因此下一個比特序列所對應(yīng)的二元組變?yōu)?2,1)。在解壓縮時,依此類推即可逆向還原所有三元組。

    圖3 主語序列重編碼及差分編碼

    算法1描述了本文算法的壓縮過程,具體步驟如下:

    1)聲明object2predicaet、objPred2subject為映射,bitSeq為字符串(第1行)。

    2)遍歷原始數(shù)據(jù)三元組,統(tǒng)計賓語與謂語的映射關(guān)系和(賓語、謂語)二元組與主語的映射關(guān)系(第2行~第5行)。

    3)將賓語、謂語映射關(guān)系中的謂語組合去重歸納得到賓語組合與對應(yīng)的謂語組合(第6行)。

    4)從賓語組合、謂語組合中生成的(賓語、謂語)二元組對主語進(jìn)行歸納,在歸納過程中對每個二元組對應(yīng)的主語序列進(jìn)行差分編碼(第7行和第8行),同時通過比特序列界定不同主語序列的界限(第9行)。

    5)將賓語組合、謂語組合、主語序列和比特序列返回存儲到文件中(第10行)。

    算法1壓縮算法

    輸入原始三元組triples

    輸出謂語組合predicateGroups,賓語根據(jù)謂語組合所分組合 objectGroups,對應(yīng)(賓語,謂語)二元組的主語列表subjectList,主語切換標(biāo)記比特序列bitSeq

    1.object2predict← map,objPred2subject ← map,bitsequence ←string

    2.for subject,predicate,object← triples:

    3.object2predicate[object].add(predicate)

    4.objPred2subject[(object,predicate)].add(subject)

    5.end for

    6.predicateGroups,objectGroups ←reduce(object2predicate)

    7.for (o,p) ←predicateGroup,objectGroups:

    8.subjectList.add(deltaEncoding(objPred2subject[(o,p)]))

    9.bitSeq.add(len(objPred2subject[(o,p)]) * ‘0’+‘1’)

    10.returnobjectGroups,predicateGroups,subjectList,bitSeq

    算法1的空間復(fù)雜度主要源于object2predicate和objPred2subject的臨時存儲。object2predicate存儲內(nèi)容為賓語到謂語組合的映射,其中,key的數(shù)量為賓語數(shù)量|Object|,value的總數(shù)為三元組的數(shù)量n。objPred2subject存儲內(nèi)容為賓語與謂語的二元組到主語的映射,其中,所有元素的總量小于等于3倍的三元組數(shù)量。因此,算法1的空間復(fù)雜度為O(|Object|+n+3n)=O(n)。

    算法2描述了本文算法的解壓縮過程,具體步驟如下:

    1)將分組表示的賓語、謂語和主語從文件中讀出后,迭代每個謂語組合和對應(yīng)的賓語組合生成(賓語,謂語)二元組(第1行和第2行)。

    2)逐個訪問主語列表,在訪問過程中逐步還原差分編碼(第3行~第10行)。

    3)根據(jù)bitSeq中連續(xù)的0-bit和一個單獨(dú)的1-bit界定對應(yīng)當(dāng)前(謂語,賓語)二元組的主語序列的終止位置(第6行和第13行)。

    4)將符合條件的主語與二元組組成三元組添加到originalTriples中并最終返回。

    算法2解壓縮算法

    輸入謂語組合predicateGroups,賓語根據(jù)謂語組合所分組合objectGroups,對應(yīng)(賓語,謂語)二元組的主語列表subjectList,主語切換標(biāo)記比特序列bitSeq

    輸出ID表示的完整三元組originalTriples

    1.for (object,predicate) ← predicateGroups,objectGroups:

    2.//獲取每一對(賓語,謂語)二元組

    3.for subject,bit← subjectList,bitSeq:

    4.//通過bit確定subject的終止位置

    5.if subject.forwardBit=0:

    6.subject=subject+subject.forward

    7.//對差分編碼進(jìn)行解碼

    8.originalTriples←(subject,predicate,object)

    9.end if

    10.end for

    11.//構(gòu)成一條完整三元組

    12.until bit=1

    13.returnoriginalTriples

    算法2的時間復(fù)雜度主要源于迭代賓語、謂語二元組的for循環(huán),該for循環(huán)執(zhí)行次數(shù)與算法1中第2個for循環(huán)執(zhí)行次數(shù)相等。因此,算法的時間復(fù)雜度為O(|Object|×|P|)。由于算法2的計算過程不需要除輸入輸出外的額外空間,因此其空間復(fù)雜度為O(1)。

    4 實驗與結(jié)果分析

    本文實驗基于處理器為Intel Core i5 3.1 GHz,內(nèi)存為16 GB 2 133 MHz LPDDR3的計算機(jī)。分別選擇不同領(lǐng)域、不同大小和不同結(jié)構(gòu)化程度的數(shù)據(jù)集,數(shù)據(jù)集描述如表1所示,其中,Archives Hub是檔案文件描述數(shù)據(jù)集,Linkedmdb是電影領(lǐng)域數(shù)據(jù)集,rdfabout是綜合領(lǐng)域數(shù)據(jù)集,dbtune是音樂領(lǐng)域數(shù)據(jù)集。以上述4個數(shù)據(jù)集分析DGC的實驗結(jié)果,對DGC壓縮與解壓縮時間進(jìn)行對比,與HDT++算法對分組數(shù)量和分組謂語總數(shù)進(jìn)行對比,并與Plain(直接存儲)、HDT、HDT++算法對壓縮后空間容量進(jìn)行對比。

    表1 數(shù)據(jù)集描述

    DGC算法在不同數(shù)據(jù)集上壓縮與解壓縮的時間對比如圖4所示。一般而言,壓縮時間隨著三元組數(shù)量的增長而增長,但同時也受到謂語數(shù)量的影響,從rdfabout到DBpedia的時間陡增論證了這一點(diǎn),DBpedia不僅在三元組數(shù)量上是dbtune的7.3倍,在謂語數(shù)量上更是有146倍的增長,這使得DBpedia存在更多的分組,每個分組中也存在著更多的謂語。因此,需要更多的計算,導(dǎo)致時間的陡增。解壓縮時間雖然也隨著數(shù)據(jù)量的增大而增多,但其增長幅度相對較小,一方面由于解壓縮所需的計算量較少,另一方面可以對不同分組進(jìn)行并行處理以加快速度。

    圖4 壓縮與解壓縮的運(yùn)行時間對比

    在HDT++連接主語的謂語組合(PS分組)和DGC連接賓語的謂語組合(PO分組)兩種分組方式下,不同數(shù)據(jù)集謂語組合數(shù)量和謂語總數(shù)的對比如表2所示。可以看出,除數(shù)據(jù)集dbtune的PO分組數(shù)大于PS分組數(shù)外,其余數(shù)據(jù)集的PO分組數(shù)均小于PS分組組數(shù),這是由于dbtune的結(jié)構(gòu)化程度高于Archives Hub、Linkedmdb、rdfabout和DBpedia,說明dbtune數(shù)據(jù)集中與主語相連的謂語組合較為完整,可以很好地對主語進(jìn)行分組,而對于結(jié)構(gòu)化程度較低的另外4個數(shù)據(jù)集,謂語組合不能對主語進(jìn)行有效分組,但對賓語分組得到了很好的分組效果。

    表2 謂語-賓語分組與謂語-主語分組后謂語組合數(shù)與謂語總數(shù)的比較

    由表2可見,在Archives Hub、Linkedmdb、rdfabout、DBpedia數(shù)據(jù)集中,PO謂語總數(shù)都明顯低于PS謂語總數(shù),其中,在DBpedia數(shù)據(jù)集中將語總數(shù)從PS分組下的千萬量級減少到PO分組下的百萬量級,說明PO分組確實有效減少了大量謂語冗余,只有在dbtune數(shù)據(jù)集中PS分組獲得了更好的分組效果。但從另一個角度來看,dbtune的PO謂語組數(shù)是其PS謂語組數(shù)的2.5倍,而PO的謂語總數(shù)卻只是PS謂語總數(shù)的1.4倍,謂語總數(shù)的比例相對于組數(shù)的比例有所降低。反之,在Archives Hub中,PS的謂語組數(shù)是其PO謂語組數(shù)的2.6倍,與dbtune中PO組數(shù)對PS組數(shù)的比例類似,但PS的謂語總數(shù)是PO謂語總數(shù)15倍,在Linkedmdb和rdfabout數(shù)據(jù)集中也有相同的結(jié)論,這是由于PO分組冗余增長受限的特性限制了謂語冗余的產(chǎn)生,無論在結(jié)構(gòu)化程度高或低的數(shù)據(jù)集中,PO分組限制謂語冗余生成的特性都在發(fā)揮作用。

    不同算法的壓縮結(jié)果比較如表3所示,其中,Plain列表示將原始數(shù)據(jù)的ID圖直接寫入文件所需空間大小。顯然,DGC算法在所有數(shù)據(jù)集上均取得了最優(yōu)結(jié)果。與Plain和HDT相比,其在不同數(shù)據(jù)集上都取得了超過40%的性能優(yōu)化,這是因為DGC處理了Plain和HDT沒有處理的謂語組合冗余,并利用差分編碼減少了主語序列存儲所需的大量空間。

    表3 不同算法的壓縮結(jié)果比較

    由表3可見,DGC在與HDT++的對比中也取得了平均18%的優(yōu)化:在結(jié)構(gòu)化程度低的數(shù)據(jù)集Archives Hub、Linkedmdb、rdfabout和DBpedia中,PO分組獲得了冗余更少的謂語組合,差分編碼進(jìn)一步優(yōu)化了壓縮結(jié)果,最終兩者結(jié)合后獲得了平均17%的性能提升;在結(jié)構(gòu)化程度高的dbtune數(shù)據(jù)集中,PO分組相對于PS分組所帶來更多冗余的負(fù)面影響被差分編碼的優(yōu)異效果所彌補(bǔ),獲得了23%的性能提升。同時,其在結(jié)構(gòu)化程度更低的Archives Hub、Linkedmdb、rdfabout和DBpedia數(shù)據(jù)集的性能提升程度反而不及結(jié)構(gòu)化程度更高的dbtune,主要因為這4個數(shù)據(jù)集本身所包含的冗余較少,分組后謂語組合所需空間只占存儲所需空間的較小部分,導(dǎo)致性能提升程度有限。

    5 結(jié)束語

    本文提出一種基于差分編碼的RDF壓縮算法。根據(jù)謂語對賓語進(jìn)行分組,以減少謂語冗余,同時對分組后的主語序列進(jìn)行差分編碼,從而優(yōu)化主語存儲所需空間。實驗結(jié)果表明,對于結(jié)構(gòu)化程度不同的數(shù)據(jù)集,該算法較Plain、HDT和HDT++算法均能獲得不同程度的性能提升。下一步將設(shè)計更具通用性的壓縮算法以適用于更多具有不同結(jié)構(gòu)化程度的數(shù)據(jù)集,并實現(xiàn)對壓縮數(shù)據(jù)進(jìn)行復(fù)雜查詢的功能。

    猜你喜歡
    三元組謂語賓語
    基于語義增強(qiáng)雙編碼器的方面情感三元組提取
    軟件工程(2024年12期)2024-12-28 00:00:00
    基于帶噪聲數(shù)據(jù)集的強(qiáng)魯棒性隱含三元組質(zhì)檢算法*
    非謂語動詞
    連詞that引導(dǎo)的賓語從句
    非謂語動詞
    賓語從句及練習(xí)
    關(guān)于余撓三元組的periodic-模
    中考試題中的賓語從句
    非謂語動詞題不難答 石娟
    非謂語動詞
    18禁在线无遮挡免费观看视频| av视频在线观看入口| 国产高潮美女av| 国产伦一二天堂av在线观看| 国产亚洲av片在线观看秒播厂 | 成人特级av手机在线观看| 精品久久久久久久久亚洲| 在线观看66精品国产| 久久久久免费精品人妻一区二区| 欧美一级a爱片免费观看看| 亚洲av电影不卡..在线观看| 国产成人aa在线观看| 春色校园在线视频观看| 性插视频无遮挡在线免费观看| 少妇的逼好多水| 国产欧美另类精品又又久久亚洲欧美| 国产精品久久久久久精品电影| 久久这里只有精品中国| 少妇丰满av| 少妇丰满av| 免费观看a级毛片全部| 蜜臀久久99精品久久宅男| 日本免费一区二区三区高清不卡| 亚洲中文字幕日韩| 岛国毛片在线播放| 看十八女毛片水多多多| 国产成人freesex在线| 亚洲成av人片在线播放无| 国产在线男女| 天堂av国产一区二区熟女人妻| 中文字幕久久专区| 内地一区二区视频在线| 亚洲人成网站在线播| 嘟嘟电影网在线观看| 麻豆av噜噜一区二区三区| 国产精品国产三级国产专区5o | 两个人的视频大全免费| 亚洲中文字幕一区二区三区有码在线看| 你懂的网址亚洲精品在线观看 | 国产精品久久久久久av不卡| 嫩草影院新地址| 欧美激情在线99| 六月丁香七月| 午夜老司机福利剧场| 18禁在线播放成人免费| 亚洲av免费在线观看| 日韩大片免费观看网站 | 亚洲国产最新在线播放| 国产亚洲精品久久久com| 最近手机中文字幕大全| 毛片女人毛片| videossex国产| 国产男人的电影天堂91| 久久久久久伊人网av| 少妇被粗大猛烈的视频| 国产精品1区2区在线观看.| 天堂av国产一区二区熟女人妻| 欧美另类亚洲清纯唯美| 久热久热在线精品观看| 晚上一个人看的免费电影| 国产精品蜜桃在线观看| 午夜久久久久精精品| 国产精品美女特级片免费视频播放器| 亚洲欧美日韩高清专用| 国产在视频线精品| 亚洲最大成人手机在线| 丰满少妇做爰视频| 亚洲av熟女| 午夜福利在线观看吧| 一区二区三区免费毛片| 欧美成人一区二区免费高清观看| 亚洲va在线va天堂va国产| 男人的好看免费观看在线视频| 国产人妻一区二区三区在| 中文乱码字字幕精品一区二区三区 | 夫妻性生交免费视频一级片| 小说图片视频综合网站| .国产精品久久| 亚洲中文字幕一区二区三区有码在线看| 日韩欧美 国产精品| 91午夜精品亚洲一区二区三区| 2022亚洲国产成人精品| 婷婷色综合大香蕉| 中文字幕av成人在线电影| 亚洲真实伦在线观看| 免费观看a级毛片全部| 成人国产麻豆网| 亚州av有码| 亚洲欧洲日产国产| 免费看美女性在线毛片视频| 少妇裸体淫交视频免费看高清| 免费观看性生交大片5| av卡一久久| 精品久久久久久久末码| 亚洲四区av| av女优亚洲男人天堂| 99热全是精品| 国产v大片淫在线免费观看| 国产91av在线免费观看| 国产成人精品一,二区| 中文字幕av在线有码专区| 日本熟妇午夜| 亚洲经典国产精华液单| 成年女人看的毛片在线观看| 男人舔奶头视频| 久久精品国产自在天天线| 国产高清视频在线观看网站| 国产精品三级大全| 久久99热这里只频精品6学生 | 直男gayav资源| 午夜视频国产福利| 免费看光身美女| 国产熟女欧美一区二区| 91久久精品电影网| 亚洲自拍偷在线| 日韩制服骚丝袜av| 国产精品三级大全| 校园人妻丝袜中文字幕| 狂野欧美激情性xxxx在线观看| 嫩草影院精品99| 最近中文字幕高清免费大全6| 亚洲va在线va天堂va国产| 精品一区二区三区视频在线| 在线免费十八禁| 国产美女午夜福利| 韩国高清视频一区二区三区| 亚洲国产精品久久男人天堂| 久久久a久久爽久久v久久| 免费一级毛片在线播放高清视频| 免费av观看视频| 欧美日韩国产亚洲二区| 黄色一级大片看看| 欧美三级亚洲精品| 日日啪夜夜撸| 看非洲黑人一级黄片| 亚洲一级一片aⅴ在线观看| 色综合站精品国产| 亚洲av熟女| 丰满少妇做爰视频| 国产精品国产三级国产专区5o | 国产 一区精品| 亚洲欧洲国产日韩| 国产一区亚洲一区在线观看| 国产精品日韩av在线免费观看| 99久久精品一区二区三区| 又爽又黄无遮挡网站| 国产黄色视频一区二区在线观看 | 国内精品美女久久久久久| 日韩精品青青久久久久久| 国产 一区精品| 久久久久久久久久黄片| 淫秽高清视频在线观看| 免费观看性生交大片5| 亚洲欧美清纯卡通| 亚洲成人久久爱视频| 蜜桃久久精品国产亚洲av| 中文字幕人妻熟人妻熟丝袜美| 日本一本二区三区精品| 久久亚洲国产成人精品v| av天堂中文字幕网| 久久久午夜欧美精品| 男女下面进入的视频免费午夜| 国产高清视频在线观看网站| 一边摸一边抽搐一进一小说| 水蜜桃什么品种好| 干丝袜人妻中文字幕| 久久人妻av系列| 亚洲,欧美,日韩| 欧美最新免费一区二区三区| 天天躁夜夜躁狠狠久久av| 长腿黑丝高跟| 深爱激情五月婷婷| 午夜老司机福利剧场| 国产精品伦人一区二区| 观看免费一级毛片| 一个人看视频在线观看www免费| 中文亚洲av片在线观看爽| 免费看a级黄色片| 国产成人91sexporn| 男女国产视频网站| 亚洲综合精品二区| 秋霞在线观看毛片| 欧美高清性xxxxhd video| 久久这里有精品视频免费| 九草在线视频观看| 我的老师免费观看完整版| 男人舔女人下体高潮全视频| 色哟哟·www| av卡一久久| 中文字幕精品亚洲无线码一区| 中文字幕免费在线视频6| 少妇的逼水好多| 免费av不卡在线播放| 国产午夜精品久久久久久一区二区三区| 少妇被粗大猛烈的视频| 久久久精品94久久精品| 大香蕉97超碰在线| 美女高潮的动态| 国产成人精品一,二区| 国语自产精品视频在线第100页| 久久精品人妻少妇| 国产精品,欧美在线| 免费观看人在逋| 亚洲欧美中文字幕日韩二区| 亚洲国产精品国产精品| 日韩,欧美,国产一区二区三区 | 精品欧美国产一区二区三| 久久久久久久久久久丰满| 日韩成人伦理影院| 日本免费在线观看一区| 日日啪夜夜撸| 免费电影在线观看免费观看| 亚洲精品国产成人久久av| 久久久久九九精品影院| 亚洲成人久久爱视频| 观看免费一级毛片| 一个人看视频在线观看www免费| 欧美区成人在线视频| 午夜日本视频在线| 久久精品影院6| 亚洲aⅴ乱码一区二区在线播放| 午夜精品在线福利| 国产单亲对白刺激| 欧美高清成人免费视频www| 成人毛片a级毛片在线播放| 亚洲怡红院男人天堂| 欧美性猛交╳xxx乱大交人| 99久久精品国产国产毛片| 极品教师在线视频| 欧美一级a爱片免费观看看| 波野结衣二区三区在线| av播播在线观看一区| 欧美一区二区国产精品久久精品| 欧美成人a在线观看| 亚洲成人久久爱视频| 夜夜爽夜夜爽视频| 国产精品一区二区在线观看99 | 夜夜爽夜夜爽视频| 黄色日韩在线| 亚洲精品成人久久久久久| 中文字幕熟女人妻在线| 亚洲国产色片| 亚洲av成人精品一区久久| 亚洲经典国产精华液单| 亚洲激情五月婷婷啪啪| 亚洲国产欧美在线一区| 国语对白做爰xxxⅹ性视频网站| 亚洲欧美精品综合久久99| 欧美人与善性xxx| 人人妻人人澡欧美一区二区| 日日干狠狠操夜夜爽| 人妻系列 视频| 免费人成在线观看视频色| 亚洲国产高清在线一区二区三| 国产 一区精品| 听说在线观看完整版免费高清| 久久人人爽人人片av| 精品国内亚洲2022精品成人| 又粗又硬又长又爽又黄的视频| 日本av手机在线免费观看| 秋霞在线观看毛片| 午夜视频国产福利| 天堂中文最新版在线下载 | 少妇猛男粗大的猛烈进出视频 | av免费观看日本| 一夜夜www| 亚洲一区高清亚洲精品| 国产成人午夜福利电影在线观看| av.在线天堂| 七月丁香在线播放| 99国产精品一区二区蜜桃av| 国产视频内射| 中国美白少妇内射xxxbb| 中文字幕av成人在线电影| 国产精品一区二区三区四区久久| 禁无遮挡网站| 国产精品蜜桃在线观看| 久久鲁丝午夜福利片| 午夜福利高清视频| 亚洲国产欧美在线一区| 男插女下体视频免费在线播放| 级片在线观看| 欧美日韩综合久久久久久| 99久久中文字幕三级久久日本| 亚洲va在线va天堂va国产| 国产av一区在线观看免费| 九九在线视频观看精品| 免费av毛片视频| videossex国产| 国产又黄又爽又无遮挡在线| 最近中文字幕2019免费版| 菩萨蛮人人尽说江南好唐韦庄 | 特大巨黑吊av在线直播| 高清视频免费观看一区二区 | 1000部很黄的大片| 精品久久国产蜜桃| 麻豆成人午夜福利视频| 男女那种视频在线观看| 夜夜看夜夜爽夜夜摸| 亚洲国产欧洲综合997久久,| 禁无遮挡网站| 中文字幕久久专区| 我的老师免费观看完整版| 长腿黑丝高跟| 国产精品美女特级片免费视频播放器| 联通29元200g的流量卡| 成人亚洲欧美一区二区av| 亚洲av成人精品一二三区| 99久久无色码亚洲精品果冻| 国产91av在线免费观看| 婷婷色av中文字幕| 日韩欧美精品免费久久| 最近手机中文字幕大全| av女优亚洲男人天堂| 简卡轻食公司| 嘟嘟电影网在线观看| 久久亚洲国产成人精品v| 欧美区成人在线视频| 日韩av在线免费看完整版不卡| 国产爱豆传媒在线观看| 久久久久久伊人网av| 欧美激情在线99| 国产精品久久久久久久久免| 日韩欧美在线乱码| 黄片无遮挡物在线观看| 综合色丁香网| 男人狂女人下面高潮的视频| 一级毛片aaaaaa免费看小| 欧美区成人在线视频| 99热网站在线观看| 一级二级三级毛片免费看| 99久国产av精品国产电影| 欧美丝袜亚洲另类| 国语对白做爰xxxⅹ性视频网站| 亚洲一区高清亚洲精品| 观看免费一级毛片| 18+在线观看网站| 精品熟女少妇av免费看| 99久久精品热视频| 国产精品日韩av在线免费观看| 三级毛片av免费| 高清毛片免费看| 久久久欧美国产精品| 国产免费一级a男人的天堂| 我的女老师完整版在线观看| 一个人免费在线观看电影| 亚洲人与动物交配视频| 国产免费又黄又爽又色| 国产av码专区亚洲av| 亚洲自拍偷在线| 亚洲精品国产成人久久av| 日本一二三区视频观看| 久久久a久久爽久久v久久| 免费无遮挡裸体视频| 美女大奶头视频| 欧美一区二区亚洲| 色播亚洲综合网| 国产单亲对白刺激| 免费av观看视频| 成人毛片60女人毛片免费| 久久久久久久久大av| 亚洲av一区综合| 乱系列少妇在线播放| 直男gayav资源| 精品酒店卫生间| 男女下面进入的视频免费午夜| 国产精品精品国产色婷婷| 99热这里只有是精品在线观看| 亚洲性久久影院| 中文天堂在线官网| 国产国拍精品亚洲av在线观看| 99久久精品国产国产毛片| 又黄又爽又刺激的免费视频.| 国产毛片a区久久久久| 国产 一区精品| 国产精品国产三级国产av玫瑰| 18禁在线无遮挡免费观看视频| 亚洲久久久久久中文字幕| 日韩成人伦理影院| 亚洲乱码一区二区免费版| 乱人视频在线观看| 成年免费大片在线观看| 国产午夜精品一二区理论片| 国产午夜福利久久久久久| 精品久久久久久久久亚洲| 最近中文字幕高清免费大全6| 亚洲国产成人一精品久久久| 国产在线男女| 国产三级中文精品| 男女国产视频网站| 久久久久网色| 国产综合懂色| 亚洲国产高清在线一区二区三| 高清日韩中文字幕在线| 亚洲综合精品二区| 九九爱精品视频在线观看| 国产黄片美女视频| 色噜噜av男人的天堂激情| 男女视频在线观看网站免费| 欧美成人午夜免费资源| 99久久九九国产精品国产免费| 国产午夜精品久久久久久一区二区三区| 色综合站精品国产| 在现免费观看毛片| 日本三级黄在线观看| 看十八女毛片水多多多| 日日撸夜夜添| 国产老妇伦熟女老妇高清| 日韩在线高清观看一区二区三区| 美女大奶头视频| 美女内射精品一级片tv| 国产大屁股一区二区在线视频| 国产av码专区亚洲av| 亚洲熟妇中文字幕五十中出| 亚洲国产色片| 老师上课跳d突然被开到最大视频| 欧美最新免费一区二区三区| av国产免费在线观看| 成人漫画全彩无遮挡| 毛片女人毛片| 中文字幕久久专区| 日本免费一区二区三区高清不卡| 淫秽高清视频在线观看| 九九爱精品视频在线观看| 中文天堂在线官网| 嫩草影院精品99| 免费看av在线观看网站| 午夜老司机福利剧场| 精品人妻一区二区三区麻豆| 亚洲第一区二区三区不卡| 久久久久久国产a免费观看| 午夜免费激情av| 久久久久久久久久久丰满| 亚洲经典国产精华液单| 久久热精品热| 九色成人免费人妻av| 大香蕉97超碰在线| 国产成人a区在线观看| 自拍偷自拍亚洲精品老妇| 一级毛片我不卡| 亚洲性久久影院| 国产精品国产三级国产av玫瑰| 三级毛片av免费| 人人妻人人看人人澡| 久久精品夜夜夜夜夜久久蜜豆| 99久国产av精品国产电影| 久久亚洲国产成人精品v| 亚洲伊人久久精品综合 | 午夜视频国产福利| 亚洲精品乱码久久久久久按摩| 淫秽高清视频在线观看| 亚洲美女搞黄在线观看| 1000部很黄的大片| 天美传媒精品一区二区| 真实男女啪啪啪动态图| 久久欧美精品欧美久久欧美| 国产高清有码在线观看视频| 国产大屁股一区二区在线视频| 国产亚洲5aaaaa淫片| 久久久久久久久久久免费av| 国产一级毛片七仙女欲春2| 日日干狠狠操夜夜爽| 啦啦啦观看免费观看视频高清| 97人妻精品一区二区三区麻豆| 国产亚洲精品久久久com| 国产伦理片在线播放av一区| 亚洲av成人av| 亚洲国产成人一精品久久久| 国产女主播在线喷水免费视频网站 | 日本黄色片子视频| 亚洲色图av天堂| 我要看日韩黄色一级片| 中文字幕人妻熟人妻熟丝袜美| 欧美又色又爽又黄视频| 好男人在线观看高清免费视频| 国产免费男女视频| 久久久久久大精品| 男女那种视频在线观看| 亚洲国产精品sss在线观看| 麻豆成人午夜福利视频| 国产午夜福利久久久久久| 六月丁香七月| 国产午夜精品论理片| 高清av免费在线| 中文字幕人妻熟人妻熟丝袜美| 国产午夜精品久久久久久一区二区三区| 一区二区三区乱码不卡18| 国产伦一二天堂av在线观看| 国产成年人精品一区二区| 一级av片app| 午夜福利高清视频| 69av精品久久久久久| 蜜桃亚洲精品一区二区三区| 国产精品一区二区三区四区免费观看| 狠狠狠狠99中文字幕| 成人高潮视频无遮挡免费网站| 91久久精品国产一区二区三区| 亚洲丝袜综合中文字幕| 亚洲av成人精品一二三区| 三级国产精品片| 全区人妻精品视频| 久久综合国产亚洲精品| 中文字幕人妻熟人妻熟丝袜美| 国产一区二区三区av在线| 国产精品一区www在线观看| 最近中文字幕2019免费版| 一个人免费在线观看电影| 国产精品野战在线观看| 九九久久精品国产亚洲av麻豆| 少妇人妻精品综合一区二区| 三级国产精品欧美在线观看| 国产亚洲精品久久久com| 99视频精品全部免费 在线| av卡一久久| 国产免费男女视频| 男女国产视频网站| 国产综合懂色| 日韩精品有码人妻一区| 中文字幕制服av| 精品久久久久久久久亚洲| 又爽又黄无遮挡网站| 国产精品综合久久久久久久免费| 亚洲五月天丁香| 黄色一级大片看看| 搡老妇女老女人老熟妇| 91精品一卡2卡3卡4卡| 97超视频在线观看视频| 亚洲av电影不卡..在线观看| 国产亚洲5aaaaa淫片| 免费黄色在线免费观看| 大话2 男鬼变身卡| 2021少妇久久久久久久久久久| 色网站视频免费| 亚洲欧美日韩卡通动漫| a级一级毛片免费在线观看| 黑人高潮一二区| 中文在线观看免费www的网站| 欧美日韩精品成人综合77777| 人妻系列 视频| 永久免费av网站大全| 亚洲va在线va天堂va国产| 白带黄色成豆腐渣| 一个人免费在线观看电影| av在线亚洲专区| 偷拍熟女少妇极品色| 久久久久久久久久成人| 激情 狠狠 欧美| 欧美潮喷喷水| 亚洲自偷自拍三级| 中文在线观看免费www的网站| 国产午夜精品久久久久久一区二区三区| 非洲黑人性xxxx精品又粗又长| 国内少妇人妻偷人精品xxx网站| 校园人妻丝袜中文字幕| 国产免费男女视频| 综合色丁香网| 久久久久久久久久成人| 欧美一区二区亚洲| 日韩在线高清观看一区二区三区| 国国产精品蜜臀av免费| 国产视频内射| 亚洲av中文av极速乱| 午夜福利视频1000在线观看| 在线a可以看的网站| 18禁裸乳无遮挡免费网站照片| 欧美日韩综合久久久久久| 一级毛片我不卡| 精品国产露脸久久av麻豆 | www.av在线官网国产| 欧美性感艳星| 午夜激情欧美在线| 日韩av不卡免费在线播放| 国产中年淑女户外野战色| 日产精品乱码卡一卡2卡三| 成人鲁丝片一二三区免费| 五月伊人婷婷丁香| 99热这里只有精品一区| 男人舔女人下体高潮全视频| 蜜桃亚洲精品一区二区三区| 亚洲精品日韩av片在线观看| 亚洲精品456在线播放app| 免费观看a级毛片全部| 国产v大片淫在线免费观看| www日本黄色视频网| 国产老妇伦熟女老妇高清| 91午夜精品亚洲一区二区三区| 51国产日韩欧美| 永久免费av网站大全| 国产精品一区www在线观看| 国内少妇人妻偷人精品xxx网站| 国产黄色视频一区二区在线观看 | 超碰av人人做人人爽久久| 久久久久久久久久成人| 日本av手机在线免费观看| 国内精品一区二区在线观看| 久久6这里有精品| 国产精品国产高清国产av| 色播亚洲综合网| 熟女电影av网| 99在线视频只有这里精品首页| 久久久亚洲精品成人影院| 51国产日韩欧美| 2021天堂中文幕一二区在线观| 欧美3d第一页| www日本黄色视频网| 免费黄网站久久成人精品| 草草在线视频免费看| 一卡2卡三卡四卡精品乱码亚洲| 婷婷六月久久综合丁香| 干丝袜人妻中文字幕| 最新中文字幕久久久久| 又爽又黄a免费视频| 国产精品一区二区三区四区久久| 国产精品电影一区二区三区| 丰满乱子伦码专区|