• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    關(guān)系型數(shù)據(jù)的知識(shí)抽取和RDF轉(zhuǎn)換框架及實(shí)現(xiàn)

    2022-09-06 11:09:16張永威唐新余
    關(guān)鍵詞:三元組字段主語

    張永威,張 巖,唐新余,王 蒙

    1.中國科學(xué)院 新疆理化技術(shù)研究所,烏魯木齊 830011

    2.中國科學(xué)院大學(xué),北京 100049

    3.中國科學(xué)院 新疆民族語音語言信息處理重點(diǎn)實(shí)驗(yàn)室,烏魯木齊 830011

    4.江蘇中科西北星信息科技有限公司,江蘇 無錫 214135

    近年來,知識(shí)圖譜作為一種高效的數(shù)據(jù)組織方式,在各行各業(yè)的眾多任務(wù)中都得到了廣泛的應(yīng)用。知識(shí)圖譜本質(zhì)上是一種大規(guī)模語義網(wǎng)絡(luò),即一種用互聯(lián)節(jié)點(diǎn)和弧表示知識(shí)的一個(gè)結(jié)構(gòu)[1]。知識(shí)圖譜中的節(jié)點(diǎn)可以代表概念、屬性、事件或者實(shí)體;弧表示節(jié)點(diǎn)之間的關(guān)系[2]。知識(shí)圖譜以結(jié)構(gòu)化三元組的形式存儲(chǔ)現(xiàn)實(shí)世界中的實(shí)體以及實(shí)體之間的關(guān)系,表示為G=(E,R,S),其中E表示實(shí)體集合,R表示關(guān)系集合,S表示知識(shí)圖譜中三元組的集合[3]。RDF(resource description framework)作為一種現(xiàn)實(shí)世界中資源及資源關(guān)系的描述框架和數(shù)據(jù)模型,是知識(shí)圖譜中非常重要的一種知識(shí)表示方式[4],在知識(shí)圖譜的構(gòu)建和應(yīng)用被廣泛使用。

    知識(shí)圖譜按照領(lǐng)域劃分,一般可分為通用知識(shí)圖譜和行業(yè)領(lǐng)域知識(shí)圖譜。通用知識(shí)圖譜包含了大量現(xiàn)實(shí)世界中的常識(shí)性知識(shí),涵蓋范圍廣、規(guī)模巨大,如FreeBase[5]、Yago[6]、DBpedia[7],已經(jīng)被廣泛應(yīng)用于信息搜索、自動(dòng)問答等場景。行業(yè)領(lǐng)域知識(shí)圖譜又稱為垂直知識(shí)圖譜,面向特定的領(lǐng)域,如面向電影領(lǐng)域的IMDB[8]、生物醫(yī)學(xué)領(lǐng)域的DrugBank[9]、學(xué)術(shù)領(lǐng)域的Acemap[10]等、一般由各領(lǐng)域中的企業(yè)進(jìn)行構(gòu)建[11]。在行業(yè)領(lǐng)域中,關(guān)系數(shù)據(jù)庫由于其模型簡單、關(guān)系理論完備、接口易用等特點(diǎn),已經(jīng)成為各行業(yè)中廣泛使用的數(shù)據(jù)存儲(chǔ)和管理方案。因此結(jié)合本體模型從結(jié)構(gòu)化的關(guān)系型數(shù)據(jù)中進(jìn)行知識(shí)抽取并轉(zhuǎn)換成RDF三元組是構(gòu)建行業(yè)知識(shí)圖譜的關(guān)鍵步驟。

    目前把關(guān)系型數(shù)據(jù)轉(zhuǎn)換成RDF數(shù)據(jù)常用的方案是使 用W3C 推出 的DM[12(]direct mapping)和R2RML[13](RDB to RDF mapping language),手工編輯從關(guān)系數(shù)據(jù)到RDF 數(shù)據(jù)的映射,再由轉(zhuǎn)換工具執(zhí)行映射完成數(shù)據(jù)轉(zhuǎn)換[14]。另外也有部分映射工具采用私有的RDB2RDF(relational database to RDF)映射語言實(shí)現(xiàn)關(guān)系數(shù)據(jù)到RDF數(shù)據(jù)的映射和轉(zhuǎn)換。目前的方案不僅需要掌握和使用各種映射語言和映射工具,還要對本體模型定義的知識(shí)體系結(jié)構(gòu)和領(lǐng)域中的業(yè)務(wù)數(shù)據(jù)庫的模式結(jié)構(gòu)非常熟悉。另外領(lǐng)域知識(shí)圖譜雖然沒有通用知識(shí)圖譜的覆蓋范圍廣,但是也具有相當(dāng)規(guī)模的數(shù)據(jù)量。在進(jìn)行知識(shí)抽取和數(shù)據(jù)轉(zhuǎn)換時(shí),需要根據(jù)本體模型和關(guān)系數(shù)據(jù)進(jìn)行大量的查詢語句和映射的編輯和維護(hù)工作,不僅費(fèi)時(shí)費(fèi)力而且還容易出錯(cuò)。本文提出一套直接由關(guān)系數(shù)據(jù)根據(jù)本體模型進(jìn)行抽取轉(zhuǎn)換成RDF 的框架,簡化了映射編輯和維護(hù)等工作,提供了更簡單易用的關(guān)系型數(shù)據(jù)的知識(shí)抽取和數(shù)據(jù)轉(zhuǎn)換的解決方案。

    1 相關(guān)工作

    目前對關(guān)系型數(shù)據(jù)進(jìn)行知識(shí)抽取并轉(zhuǎn)換成RDF數(shù)據(jù)的方案一般是先編寫從關(guān)系型數(shù)據(jù)到RDF數(shù)據(jù)的映射,然后借助的RDB2RDF工具執(zhí)行映射完成數(shù)據(jù)抽取和轉(zhuǎn)換。在關(guān)系數(shù)據(jù)與RDF 數(shù)據(jù)的映射方面,W3C 制定了兩種從關(guān)系數(shù)據(jù)到RDF 數(shù)據(jù)的映射語言,DM 和R2RML。Direct mapping 定義了從關(guān)系數(shù)據(jù)庫到RDF三元組的簡單變換,這種變換把關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)模式和結(jié)構(gòu)直接反映在RDF圖中[12]。Direct mapping將關(guān)系數(shù)據(jù)庫直接映射為RDF 圖,只是對原有關(guān)系數(shù)據(jù)直接轉(zhuǎn)換[15],無法根據(jù)自定義的本體模型對數(shù)據(jù)進(jìn)行抽取和組織后轉(zhuǎn)換成RDF三元組。

    為了支持自定義的本體概念模型和詞匯,W3C 推出了R2RML 映射語言,其映射本身就是Turtle 形式的RDF圖[13]。每一個(gè)R2RML映射都對應(yīng)一個(gè)數(shù)據(jù)庫模式和目標(biāo)詞匯。R2RML映射的輸入是符合該模式的關(guān)系數(shù)據(jù),輸出是使用目標(biāo)詞匯中的謂詞和類型的RDF 數(shù)據(jù)。使用R2RML 可以在關(guān)系數(shù)據(jù)庫上自定義視圖,一個(gè)R2RML 映射文檔里包含多個(gè)R2RML 映射,每個(gè)映射都需要配置數(shù)據(jù)檢索的邏輯表。邏輯表可以是關(guān)系數(shù)據(jù)庫中的一個(gè)基礎(chǔ)表或一個(gè)視圖,也可以是對關(guān)系數(shù)據(jù)庫的一個(gè)有效的SQL 查詢。每個(gè)邏輯表都使用三元組映射表映射到RDF,三元組映射中需要配置將邏輯表中每一行映射到多個(gè)RDF三元組的規(guī)則。該規(guī)則由主語映射和謂詞-賓語映射兩部分組成。通過將主語應(yīng)和謂詞-賓語映射組合,應(yīng)用于每個(gè)邏輯表行實(shí)現(xiàn)關(guān)系數(shù)據(jù)到RDF數(shù)據(jù)的轉(zhuǎn)換。R2RML映射需要根據(jù)自定義的詞匯和關(guān)系數(shù)據(jù)庫手動(dòng)編輯大量的映射規(guī)則,包括本體模型中的類與表或邏輯視圖的對應(yīng)、屬性與字段的對應(yīng)、數(shù)據(jù)類型等。也需要基于本體模型和關(guān)系數(shù)據(jù)庫編寫SQL 語句對數(shù)據(jù)進(jìn)行抽取和組織。因此R2RML 語句編碼的工作量和R2RML 映射的創(chuàng)建和維護(hù)是使用R2RML的主要障礙。

    在映射執(zhí)行工具方面,D2RQ[16]是出現(xiàn)在DM 和R2RML 之前的RDB2RDF 開源工具平臺(tái)。它包括D2R Server 和一種私有的RDB2RDF 映射語言D2Rq。D2RQ 在2012 年發(fā)布的版本開始支持direct mapping,但是不支持R2RML[17]。Virtuoso[18]利用自有的“元數(shù)據(jù)方案映射語言”,來實(shí)現(xiàn)RDB 數(shù)據(jù)與RDF 數(shù)據(jù)的映射,生成關(guān)聯(lián)數(shù)據(jù)視圖(linked data views),得到RDF 數(shù)據(jù),這種功能與R2RML 類似,是R2RML 誕生之前私有映射語言的一種[19]。W3C 推出R2RML 后,Virtuoso 也通過R2RML VAD插件的方式通過將R2RML轉(zhuǎn)化成它自己的關(guān)聯(lián)數(shù)據(jù)視圖的語法來實(shí)現(xiàn)對R2RML 的支持。Ontop[20]依賴于R2RML映射實(shí)現(xiàn),通過將SPARQL查詢轉(zhuǎn)換為有關(guān)系數(shù)據(jù)源執(zhí)行的SQL 查詢。Ontop 可以提供一個(gè)基于關(guān)系數(shù)據(jù)的虛擬知識(shí)圖譜系統(tǒng),以虛擬的RDF 圖的形式訪問關(guān)系數(shù)據(jù)庫中的內(nèi)容。此外Ontop也可以基于R2RML映射把關(guān)系數(shù)據(jù)轉(zhuǎn)換成RDF數(shù)據(jù)。

    現(xiàn)有的工作除了提供不同的映射工具和映射語言外,還有一些工作集中在提高R2RML 映射語言的編輯效率上。文獻(xiàn)[21]提出了一種快速編輯R2RML映射的編輯器,目的在于提高手工編輯映射時(shí)的效率,但是仍然需要專業(yè)人員大量參與。文獻(xiàn)[22]和[23]提出了根據(jù)關(guān)系數(shù)據(jù)生成R2RML 映射的方法,但還是需要后續(xù)對映射進(jìn)行維護(hù),沒有很好地解決從關(guān)系數(shù)據(jù)中進(jìn)行知識(shí)抽取生成RDF數(shù)據(jù)的問題。

    針對這些問題本文提出了一種直接根據(jù)本體模型和關(guān)系數(shù)據(jù)庫進(jìn)行知識(shí)抽取并轉(zhuǎn)換成RDF 數(shù)據(jù)的框架,省去了R2RML映射的編輯、執(zhí)行和維護(hù)等工作。直接以可視化的方式指定關(guān)系數(shù)據(jù)和本體模型的對應(yīng)關(guān)系,根據(jù)選取的字段自動(dòng)生成SQL語句,在數(shù)據(jù)庫中進(jìn)行查詢并取出相應(yīng)的數(shù)據(jù)后,根據(jù)對應(yīng)關(guān)系,把關(guān)系數(shù)據(jù)自動(dòng)轉(zhuǎn)換成RDF 三元組。與之前的方法相比,本文提出的框架不需要大量的映射編輯和維護(hù)工作,可以對本體模型和關(guān)系數(shù)據(jù)庫進(jìn)行解析,并自動(dòng)生成本體模型和數(shù)據(jù)庫之間的候選映射,提供了更加自動(dòng)化的解決方案?;诒疚牡目蚣軐?shí)現(xiàn)的知識(shí)抽取系統(tǒng),能夠方便地根據(jù)本體模型的目標(biāo)詞匯快速地生成RDF 三元組,完成關(guān)系型數(shù)據(jù)的知識(shí)抽取和數(shù)據(jù)轉(zhuǎn)換。

    2 系統(tǒng)框架設(shè)計(jì)及實(shí)現(xiàn)

    本章提出一套根據(jù)自定義本體模型對關(guān)系數(shù)據(jù)進(jìn)行抽取并轉(zhuǎn)換成RDF數(shù)據(jù)的框架。如圖1所示,首先對本體模型進(jìn)行解析,解析出本體知識(shí)體系中的類別屬性等詞匯。接著對關(guān)系數(shù)據(jù)庫的模式結(jié)構(gòu)進(jìn)行解析,獲取其表、字段、主外鍵等信息。解析完成后以可視化的方式把本體模型和數(shù)據(jù)庫的解析結(jié)果展示出來。然后根據(jù)數(shù)據(jù)庫的解析結(jié)果生成中間本體,并且根據(jù)語言學(xué)特征和結(jié)構(gòu)特征計(jì)算中間本體和自定義本體中概念和屬性的相似度,借助中間本體自動(dòng)獲取數(shù)據(jù)庫和自定義本體的映射關(guān)系。最后根據(jù)每個(gè)類的屬性和映射關(guān)系,生成單表或多表查詢的SQL語句,在數(shù)據(jù)庫中進(jìn)行查詢并取出相應(yīng)的數(shù)據(jù)后,根據(jù)對應(yīng)關(guān)系,自動(dòng)轉(zhuǎn)換成RDF三元組。

    圖1 關(guān)系數(shù)據(jù)知識(shí)抽取框架Fig.1 Relational data knowledge extraction framework

    關(guān)系數(shù)據(jù)知識(shí)抽取和數(shù)據(jù)轉(zhuǎn)換框架的具體描述如下:

    (1)設(shè)置數(shù)據(jù)源DS 和本體源文件ontology,并進(jìn)行解析。

    table∈DS,column∈table

    (class,data property,object property)∈ontology

    (2)可視化解析結(jié)果,創(chuàng)建中間本體,自動(dòng)生成關(guān)系數(shù)據(jù)和自定義本體模型之間的候選映射關(guān)系automaps。

    automaps={(c1,c2,max_sim)}

    其中c1 ∈ontology;c2 ∈DS,分別表示本體和數(shù)據(jù)中的概念,max_sim表示兩個(gè)概念之間的最大相似度。

    (3)修正automap,并自動(dòng)生成SQL 語句,并獲取的數(shù)據(jù)data。

    sql=generate_sq(lautomap)

    data=get_data(DS,sql)

    (4)RDF三元組前綴prefix url和主語模板template的設(shè)置。

    template={column1}@{column2}

    (5)主語(subject)構(gòu)建。

    subject=prefix url+value(column1)@value(column2)

    根據(jù)mapping的(logic table:class)構(gòu)建出主語類型的三元組triple=(subject,rdf:type,class)

    (6)謂詞(predicate)構(gòu)建

    數(shù)據(jù)屬性謂詞構(gòu)建:

    predicate=prefix url+data property

    對象屬性謂詞構(gòu)建:

    predicate=prefix url+object property其中data property,object property∈ontology。

    (7)賓語(object)構(gòu)建:

    賓語是數(shù)據(jù)屬性值時(shí):

    get data type ∈{int,string,date,…}

    value(data property)=value(column),其中(column:property)∈mapping

    根據(jù)mapping構(gòu)建三元組:

    triple=(subject,predicate,value(data property))

    賓語是對象屬性值時(shí):

    get data type ∈class

    object property=prefix+template

    由于對象屬性也是實(shí)體所以構(gòu)建對象屬性類型三元組:

    triple=(object property,rdf:type,class)

    構(gòu)建主語的對象屬性三元組:

    triple=(subject,predicate,object property)

    以下是根據(jù)框架描述進(jìn)行的具體實(shí)現(xiàn)。

    2.1 本體模型解析

    本體模型的設(shè)計(jì)定義了知識(shí)的類別體系,每個(gè)類別下所屬的概念和實(shí)體,某類概念和實(shí)體所具有的屬性,以及概念之間,實(shí)體之間的語義關(guān)系。同時(shí)也包含定義在這個(gè)本體上的一些推理規(guī)則。根據(jù)本體模型中的知識(shí)體系把關(guān)系型數(shù)據(jù)轉(zhuǎn)換成RDF 數(shù)據(jù),即使用本體模型中自定義的詞匯和關(guān)系等,把數(shù)據(jù)歸屬到本體模型定義的知識(shí)框架下。因此首先需要對本體模型解析,獲取其類別屬性等詞匯。本文使用Jena[24]對本體模型進(jìn)行解析,Jena 是惠普實(shí)驗(yàn)室語義Web 研究項(xiàng)目的開放資源,是用于創(chuàng)建語義Web 應(yīng)用系統(tǒng)的Java 框架結(jié)構(gòu),它為RDF、RDFS、OWL 提供了一個(gè)程序開發(fā)環(huán)境。另外為了方便建模和展示,使用經(jīng)典建模工具Protégé[25]進(jìn)行本體模型的構(gòu)建。Protégé提供了本體概念類、關(guān)系、屬性和實(shí)例的構(gòu)建,并且屏蔽了具體的本體描述語言,用戶只需在概念層次上進(jìn)行領(lǐng)域本體模型的構(gòu)建。Protégé 可從http://protege.standford.end/下載,具體用法可參考文獻(xiàn)[26]。

    本文主要使用Jena 的Ontology 子系統(tǒng)和RDF 子系統(tǒng)。對于一個(gè)本體模型首先獲取本體模型中所有的類,然后再對每一個(gè)類進(jìn)行解析。解析出當(dāng)前類與其他類的關(guān)系。之后,對每個(gè)類的屬性進(jìn)行解析。對于類的數(shù)據(jù)屬性(data property),獲取到其屬性名及其定義域和值域。對于類的對象屬性(object property),由于其在本體模型中表示概念類之間的關(guān)系,其值域和定義域都是類或資源實(shí)體(resource)。所以在解析到其屬性名后,還要獲取對象屬性與其定義域類和值域類的關(guān)系。

    在完成解析后,把本體模型中的所有的類,對象屬性和數(shù)據(jù)屬性都當(dāng)作節(jié)點(diǎn),按照對象屬性和數(shù)據(jù)屬性的值域和定義域把屬性節(jié)點(diǎn)和類節(jié)點(diǎn)連接起來。如圖2(c)所示,形成一個(gè)可以表示本體模型結(jié)構(gòu)的圖。不同于Protégé[25]建模工具中對本體模型的展示,如圖2(a)和(b)所示Protégé中把概念類作為節(jié)點(diǎn),屬性作為邊把本體模型展示出來。本文對本體模型的可視化展示方式,除了能表示出概念類之間的關(guān)系,還展示了概念類與屬性的所屬關(guān)系。更方便在設(shè)置關(guān)系數(shù)據(jù)和本體模型的對應(yīng)關(guān)系時(shí)對類和屬性等相關(guān)概念進(jìn)行選擇。

    圖2 解析結(jié)果展示圖Fig.2 Parse result display diagram

    2.2 數(shù)據(jù)庫模式結(jié)構(gòu)解析

    關(guān)系型數(shù)據(jù)的知識(shí)抽取需要根據(jù)本體模型定義的知識(shí)框架,在數(shù)據(jù)庫中選取字段數(shù)據(jù)轉(zhuǎn)換成(subject,predicate,object)三元組。因此在對數(shù)據(jù)進(jìn)行知識(shí)抽取并轉(zhuǎn)換成RDF 之前,需要解析出整個(gè)關(guān)系數(shù)據(jù)庫的模式結(jié)構(gòu)。包括數(shù)據(jù)庫中所有的表、每個(gè)表的表結(jié)構(gòu)、表中所含有的字段、字段的數(shù)據(jù)類型、字段之間的關(guān)系、表的主外鍵和引用關(guān)系等。

    本文使用DataBaseMetaData 接口獲取關(guān)系數(shù)據(jù)庫的元數(shù)據(jù),解析出整個(gè)數(shù)據(jù)庫中所有的表、字段、字段的數(shù)據(jù)類型和主外鍵、引用關(guān)系等信息。此外,為了在知識(shí)抽取對整個(gè)數(shù)據(jù)庫的模式結(jié)構(gòu)有更加直觀的認(rèn)識(shí),更方便選擇數(shù)據(jù)字段和本體詞匯的對應(yīng)關(guān)系。對數(shù)據(jù)庫進(jìn)行解析后,以可視化的方式對數(shù)據(jù)庫的模式結(jié)構(gòu)進(jìn)行展示。

    如圖2(d),把數(shù)據(jù)庫中每一個(gè)表和每一個(gè)字段都當(dāng)作節(jié)點(diǎn),連接節(jié)點(diǎn)的邊表示字段節(jié)點(diǎn)和表節(jié)點(diǎn)的所屬關(guān)系。其中外鍵節(jié)點(diǎn),同時(shí)連接引用表和被引用表,表示表之間的引用關(guān)系。

    2.3 關(guān)系數(shù)據(jù)到本體模型的對應(yīng)關(guān)系

    2.3.1 本體模型到關(guān)系數(shù)據(jù)的自動(dòng)映射

    完成本體模型和數(shù)據(jù)庫模式結(jié)構(gòu)的解析之后,接下來要建立從關(guān)系數(shù)據(jù)到本體映射,即關(guān)系數(shù)據(jù)中的表和字段與本體模型中類和屬性之間的對應(yīng)關(guān)系。盡管本文提供了可視化選擇對應(yīng)關(guān)系的方式替換了傳統(tǒng)映射語句的編輯。但是為了進(jìn)一步提高框架的自動(dòng)化程度,設(shè)計(jì)了一種根據(jù)關(guān)系數(shù)據(jù)庫和自定義本體模型自動(dòng)生成候選映射的方法。

    如圖3 所示,首先獲取數(shù)據(jù)庫模式的解析結(jié)果,利用解析后的表和字段自動(dòng)建立一個(gè)和數(shù)據(jù)庫一一對應(yīng)的中間本體模型。然后對中間本體和自定義本體進(jìn)行匹配和對齊,基于語言學(xué)信息和結(jié)構(gòu)信息計(jì)算兩個(gè)本體之間各種概念的相似度,并根據(jù)相似度獲取候選映射關(guān)系。由于中間本體中的概念和數(shù)據(jù)庫模式中的元素是一一對應(yīng)的,所以自定義本體和中間本體的對應(yīng)關(guān)系,也即自定義本體和數(shù)據(jù)庫之間的對應(yīng)關(guān)系。

    圖3 自動(dòng)建立對應(yīng)關(guān)系的流程圖Fig.3 Automatically establishing corresponding relationship

    1)自動(dòng)創(chuàng)建中間本體

    基于數(shù)據(jù)庫模式結(jié)構(gòu)的解析結(jié)果,采用如表1所示規(guī)則建立一個(gè)中間本體。

    表1 數(shù)據(jù)庫與中間本體對應(yīng)規(guī)則Table 1 Correspondence between database and middle ontology

    采用以上方式,保證中間本體的詞匯表和術(shù)語名稱與關(guān)系數(shù)據(jù)庫中的表名和字段名保持一致,這樣就得到了一個(gè)和數(shù)據(jù)庫一一對應(yīng)的中間本體模型。在中間本體中,數(shù)據(jù)庫中的表是本體中的類,表中的字段是類的數(shù)據(jù)屬性和對象屬性,字段所屬的表及字段的數(shù)據(jù)類型是屬性的值域和定義域。

    接下來用中間本體和根據(jù)數(shù)據(jù)庫自定義的本體進(jìn)行匹配,獲取到兩個(gè)本體中概念的映射關(guān)系。由于中間本體和數(shù)據(jù)庫是一一對應(yīng)的,因此自定義本體和中間本體之間的映射,即自定義本體和數(shù)據(jù)庫之間的映射。

    2)本體中類和屬性的相似度計(jì)算

    不同于傳統(tǒng)的本體對齊和本體匹配任務(wù)需要考慮大規(guī)模異構(gòu)之間的匹配和對齊關(guān)系。因?yàn)樽远x本體是由建模人員根據(jù)數(shù)據(jù)庫進(jìn)行重新組織篩選而建立的,而中間本體又是整個(gè)數(shù)據(jù)庫在本體模型中的直接反映,包含了數(shù)據(jù)庫中的所有模式。所以自定義本體和中間本體本身就具有一定程度上的相似,這種相似表現(xiàn)在兩個(gè)方面,一是語言特征上,即兩個(gè)本體中概念標(biāo)簽字符和描述的相似。二是表現(xiàn)在本體的結(jié)構(gòu)特征上,在本體模型所表示的RDF 樹上,自定義本體往往是中間本體的子結(jié)構(gòu)。因此基于這兩個(gè)特性來計(jì)算自定義本體和中間本體里各種概念的相似度,再根據(jù)相似度來確定匹配和映射關(guān)系,最終得到數(shù)據(jù)庫和自定義本體之間的候選映射。

    (1)基于語言學(xué)特征

    基于語言學(xué)特征采用編輯距離計(jì)算兩個(gè)本體中概念的相似度時(shí),首先自定義本體和中間本體進(jìn)行預(yù)處理,去掉類和屬性的命名空間前綴,只保留類名和屬性名。在計(jì)算相似度之前,基于外部詞典WordNet對本體中的類和屬性進(jìn)行同義詞替換。對于類,替換后基于編輯距離計(jì)算相似度,對于屬性,組合替換后的屬性名和定義域計(jì)算相似度。形式化描述如下:

    ①對于?class,property∈customer ontology∪middle ontology,獲取其同義詞集合并按字典序排序。

    synonym set(word)=WordNet.synset(word)其中synonym set(word)[1]表示取同義詞集合中的第一個(gè)元素。

    ②對于類的標(biāo)簽,用其同義詞集合里的第一個(gè)元素進(jìn)行替換。

    ③對于屬性的標(biāo)簽,首先用該屬性的同義詞集合里的第一個(gè)元素對其進(jìn)行替換。然后拼接屬性名,及其值域和定義域得到一個(gè)新的字符串。

    ④最后基于編輯距離計(jì)算自定義本體和中間本體中各種概念屬性的相似度。

    ⑤根據(jù)上述計(jì)算結(jié)果獲得兩個(gè)本體中類的相似度矩陣:class similarity matrix,和屬性的相似度矩陣:property similarity matrix。根據(jù)概念和屬性的最大相似度獲取候選映射集合:map{(c1,c2,max_sim)}。

    (2)基于結(jié)構(gòu)特征

    基于本體的結(jié)構(gòu)特征進(jìn)行概念的相似度計(jì)算時(shí),考慮當(dāng)前概念節(jié)點(diǎn)在本體概念所表示的RDF樹上的父節(jié)點(diǎn),子節(jié)點(diǎn)和兄弟節(jié)點(diǎn)的相似關(guān)系來確定當(dāng)前節(jié)點(diǎn)的相似關(guān)系。另外在中間本體和自定義本體中,具有對應(yīng)關(guān)系的類的子節(jié)點(diǎn)的數(shù)目不一定相同,具有對應(yīng)關(guān)系的屬性的兄弟節(jié)點(diǎn)也不一定相同。因此在中間本體和自定義本體中,取屬性數(shù)目較小的一方作為個(gè)數(shù)依據(jù),同時(shí)從另一個(gè)本體取相同個(gè)數(shù)且相似度高屬性節(jié)點(diǎn)進(jìn)行計(jì)算。

    ①對于類的結(jié)構(gòu)相似:

    其中,c1∈customer ontology,c1.property num表示類c1的屬性節(jié)點(diǎn)個(gè)數(shù),c2∈middle ontology,c2.property num表示類c2的屬性節(jié)點(diǎn)個(gè)數(shù)。

    ②根據(jù)上一步得到屬性相似度矩陣,計(jì)算類節(jié)點(diǎn)的前k個(gè)相似度最高的屬性。

    其中property similarity matrix表示屬性相似度矩陣。

    ③對于屬性的結(jié)構(gòu)相似:

    其中,p1.brother num表示屬性p1 的兄弟節(jié)點(diǎn)個(gè)數(shù),其中p2∈customer ontology,p2.property num表示類c2的屬性節(jié)點(diǎn)個(gè)數(shù),其中p2∈middle ontology。

    ④根據(jù)屬性相似度矩陣,計(jì)算當(dāng)前節(jié)點(diǎn)的前k個(gè)相似度最高的兄弟節(jié)點(diǎn);根據(jù)類相似度矩陣計(jì)算當(dāng)前節(jié)點(diǎn)的父類相似度。

    其中,p1.father表示p1 的父節(jié)點(diǎn),p2.father表示p2的父節(jié)點(diǎn)。

    ⑤結(jié)合父類和子類計(jì)算最終的相似度。

    最后根據(jù)實(shí)驗(yàn)效果,采取如下的方式綜合基于語言特征計(jì)算的相似度sim1和基于結(jié)構(gòu)特征計(jì)算的相似度sim2。

    sim=max(sim1,sim2)

    2.3.2 三元組的創(chuàng)建

    RDF 數(shù)據(jù)表示為(S,P,O)形式的主謂賓三元組,把關(guān)系型數(shù)據(jù)進(jìn)行知識(shí)抽取轉(zhuǎn)換成RDF 數(shù)據(jù)時(shí),要根據(jù)本體模型中定義的詞匯對關(guān)系數(shù)據(jù)中的字段進(jìn)行篩選、抽取、組織成(主語,謂詞,賓語)的形式。

    (1)主語

    RDF三元組的主語是一個(gè)資源實(shí)體,由一個(gè)統(tǒng)一資源標(biāo)識(shí)符URI(uniform resource identifier)表示。在RDF 中表示主語資源的URI 一般是由命名空間和資源實(shí)體的名稱或一些其他標(biāo)識(shí)組成。比如一門課程實(shí)體的可以表示為:

    其中,“http://www.xbstar.com/ontology/pension#”是命名空間,“Java”是課程名,“CS102”是課程代碼,課程名和課程代碼存儲(chǔ)在數(shù)據(jù)庫中。在根據(jù)關(guān)系數(shù)據(jù)創(chuàng)建主語實(shí)體的URI 時(shí),本文采用本體模型中定義的命名空間,命名空間后面的標(biāo)識(shí)符根據(jù)由自定義模板配置進(jìn)行生成,模板是由關(guān)系數(shù)據(jù)庫中的字段和一些字符組成,如表2所示。

    表2 主語資源實(shí)體URI配置Table 2 Subject resource entity URI configuration

    另外,對于知識(shí)圖譜中的每一個(gè)資源實(shí)體,都要?dú)w屬到本體模型所定義的概念類別下。所以在每個(gè)主語資源實(shí)體的URI生成后,還有根據(jù)本體模型中定義的概念指定其所屬的類別。當(dāng)一個(gè)主語映射完成后會(huì)生成如下的三元組:

    S:

    P:

    O:

    (2)謂詞

    在RDF 三元組(S,P,O)中,謂詞P表示主語S和賓語O之間的關(guān)系,或者表示主語S具有屬性P且其取值為O。謂詞在知識(shí)圖譜中表示關(guān)系,關(guān)系可以連接兩個(gè)實(shí)體資源,表示兩個(gè)資源之間的關(guān)系。也可以連接實(shí)體資源和數(shù)據(jù)值,表示實(shí)體資源的屬性值。

    謂詞在本體模型中進(jìn)行定義,表示為本體模型中概念之間的關(guān)系,當(dāng)使用本體模型規(guī)定的知識(shí)體系填充RDF 數(shù)據(jù)時(shí),謂詞就表示為概念下的實(shí)體之間的關(guān)系。完成主語實(shí)體的創(chuàng)建后,要根據(jù)本體模型中定義的謂詞詞匯,為主語連接資源或數(shù)據(jù)。本文是根據(jù)本體模型解析的結(jié)果,獲取連接類與屬性值的屬性名,然后把謂詞屬性名和屬性值在關(guān)系表中對應(yīng)的字段一一映射起來。

    (3)賓語

    三元組的賓語可以看作是主語實(shí)體的屬性值,包括數(shù)據(jù)屬性(data property)和對象屬性(object property)兩種類型。其中數(shù)據(jù)屬性表示賓語是一個(gè)數(shù)據(jù)值,表示實(shí)體和數(shù)據(jù)值之間的關(guān)系,對象屬性表示賓語是一個(gè)資源實(shí)體,描述的是兩個(gè)實(shí)體之間的關(guān)系,在進(jìn)行映射時(shí),對象屬性一般是關(guān)系表中的外鍵。

    對于數(shù)據(jù)屬性,由于其屬性值也就是(S,P,O)中的賓語是一個(gè)數(shù)值,從數(shù)據(jù)庫中取出對應(yīng)的字段和屬性進(jìn)行映射即可,如:

    S:

    P:

    O:“張三”

    對于對象屬性,在(S,P,O)三元組中其主語和賓語都是實(shí)體資源。因此在進(jìn)行對象屬性的映射時(shí),用謂詞把兩個(gè)實(shí)體連接之前,需要先創(chuàng)建賓語實(shí)體,包括生成賓語實(shí)體的URI,并把其歸類的所屬的類別下。

    S:

    P:

    O:.

    S:

    P:

    O:

    為了定義和保存數(shù)據(jù)庫到本體模型的對應(yīng)關(guān)系,定義了如下的數(shù)據(jù)結(jié)構(gòu)對用戶選擇的映射進(jìn)行存儲(chǔ)。其中對于每一個(gè)類,對應(yīng)關(guān)系是一個(gè)集合,集合中包含映射的元素,每個(gè)元素都有類名、表名、字段名稱和對應(yīng)的謂詞名稱和數(shù)據(jù)類型,字段所屬的表。還包括主語的模板,以及當(dāng)前字段是不是外鍵類型,為每個(gè)外鍵類型定義包含主表名稱、主列的名稱、引用表的名稱、引用列的名稱的數(shù)據(jù)結(jié)構(gòu)。

    2.4 SQL語句生成與數(shù)據(jù)查詢

    在確定字段和屬性的對應(yīng)關(guān)系之后,根據(jù)選取的字段和涉及到的表生成SQL語句,并在數(shù)據(jù)庫中獲取相應(yīng)的數(shù)據(jù)。對于同一個(gè)類的屬性,對應(yīng)的字段可能來自同一個(gè)表或來自多個(gè)表。當(dāng)一個(gè)類別的屬性對應(yīng)的字段都屬于同一個(gè)表時(shí),從選擇的對應(yīng)關(guān)系中獲取字段名稱和其所屬的表,組合成SQL語句,在數(shù)據(jù)庫中進(jìn)行查詢獲得相應(yīng)的數(shù)據(jù)即可。

    當(dāng)一個(gè)類的屬性對應(yīng)多個(gè)表的字段時(shí),選擇的字段關(guān)系會(huì)涉及多個(gè)表,一般在數(shù)據(jù)庫中進(jìn)行連接查詢或者需要多個(gè)連接條件才能獲取查詢結(jié)果。這種情況下根據(jù)選取的字段生成的SQL語句,需要獲取連接查詢中所有的連接條件。本文采用的方法是根據(jù)關(guān)系數(shù)據(jù)庫解析的結(jié)果,把表和字段當(dāng)作節(jié)點(diǎn),字段和表的所屬關(guān)系當(dāng)作邊,外鍵字段引用關(guān)系連接兩個(gè)表節(jié)點(diǎn),由此生成一個(gè)無向圖。需要進(jìn)行多表連接查詢時(shí),根據(jù)選擇的字段在這個(gè)無向圖上尋找從起始表節(jié)點(diǎn)到終結(jié)點(diǎn)的一條路徑,然后從這條路徑上的表節(jié)點(diǎn)和字段節(jié)點(diǎn)獲取連接查詢時(shí)的條件信息,并生成SQL語句。

    以學(xué)生表、選課情況表和課程表為例,在以RDF三元組的形式表示學(xué)生選擇的課程時(shí),就要涉及到在學(xué)生表、選課情況表和課程表這三個(gè)表之間進(jìn)行查詢。首先通過學(xué)生表和選課情況表,找到學(xué)生選擇課程的課程ID,然后再通過選課情況表和課程表,找到課程ID對應(yīng)的課程名。這時(shí)就需要在圖中的學(xué)生節(jié)點(diǎn)和課程節(jié)點(diǎn)之間找到一條通路,通路上所經(jīng)過的點(diǎn)就是在進(jìn)行查詢時(shí)所需要的連接條件。首先把數(shù)據(jù)庫模式結(jié)構(gòu)建成一個(gè)無向圖,如圖4所示,然后以學(xué)生節(jié)點(diǎn)作為起點(diǎn),課程節(jié)點(diǎn)作為終點(diǎn)尋找一條通路。尋找路徑的同時(shí),記錄下路徑上經(jīng)過的所有節(jié)點(diǎn)的信息。由于路徑上的節(jié)點(diǎn)除了表節(jié)點(diǎn),所有的字段節(jié)點(diǎn)都是外鍵字段,所以使用外鍵類型的數(shù)據(jù)結(jié)構(gòu),存儲(chǔ)外鍵的主表和引用表等相關(guān)信息。獲取這條路徑上的信息后,根據(jù)路徑信息設(shè)置生成SQL語句,并設(shè)置連接查詢的查詢條件。

    圖4 由關(guān)系數(shù)據(jù)庫生成的無向圖Fig.4 Undirected graph generated by relational database

    2.5 關(guān)系數(shù)據(jù)到RDF數(shù)據(jù)的轉(zhuǎn)換

    首先獲取到2.3節(jié)獲取到的數(shù)據(jù)庫和本體之間的映射關(guān)系,再根據(jù)2.4 節(jié)由字段、表、外鍵引用關(guān)系等信息生成的SQL 語句,在數(shù)據(jù)庫中進(jìn)行查詢獲取相應(yīng)的數(shù)據(jù)。根據(jù)主語模板和模板中對應(yīng)的關(guān)系表中的字段數(shù)據(jù),創(chuàng)建一個(gè)主語資源實(shí)體,并且根據(jù)指定的類別名把主語實(shí)體歸類到對應(yīng)的類別概念下,創(chuàng)建一個(gè)(主語實(shí)體,類型,類別概念)的三元組。

    其次根據(jù)對應(yīng)關(guān)系對屬性進(jìn)行處理,用數(shù)據(jù)屬性連接主語實(shí)體和數(shù)據(jù)值,用對象屬性連接主語實(shí)體和屬性實(shí)體,并創(chuàng)建相應(yīng)的三元組。對于數(shù)據(jù)屬性,直接根據(jù)謂詞對應(yīng)的字段名稱,取出字段數(shù)據(jù)作為數(shù)據(jù)屬性值并設(shè)置其數(shù)據(jù)類型;用謂詞關(guān)系把主語實(shí)體和數(shù)據(jù)屬性值連接起來,創(chuàng)建(主語實(shí)體,謂詞,數(shù)據(jù)屬性值)的三元組。對于對象屬性根據(jù)其URI 模板得到其實(shí)體資源的URI,判斷這個(gè)對象屬性實(shí)體是否已經(jīng)存在。如果對象屬性實(shí)體已經(jīng)存在直接使用謂詞關(guān)系把主語實(shí)體和對象屬性實(shí)體連接起來即可。如果該對象屬性實(shí)體不存在,那么就創(chuàng)建一個(gè)對象屬性實(shí)體,并且根據(jù)類型把其歸屬到對應(yīng)的類別下,然后在用謂詞連接主語實(shí)體和對象屬性實(shí)體創(chuàng)建(主語實(shí)體,謂詞,對象屬性實(shí)體)的三元組。

    最后選擇可以當(dāng)前類,或者批量選擇本體模型中的所有類,按照指定的格式進(jìn)行RDF三元組的轉(zhuǎn)換,系統(tǒng)提供了RDF/XML、N-triples、Turtle三種格式。

    整體框架的實(shí)現(xiàn)算法如算法1 所示,算法2 描述了根據(jù)數(shù)據(jù)的查詢結(jié)果和對應(yīng)關(guān)系生成三元組的過程。

    算法1整體框架實(shí)現(xiàn)算法

    輸入:Database URL,User Name,Password,Ontology URL

    輸出:RDF Triples

    Parsing-Database(Database URL,User Name,Password)

    Parsing-Ontology(Ontology)

    Specify subject entity template

    AutoMaps=generateAutoMapping(Database URL,Ontology URL)

    Revise AutoMaps

    For map in AutoMaps:

    If Fields are from the same table then

    Generate SQL based on field and table information

    Else if Fields come from different tables then

    Creating graph according to database schema

    Find the shortest path

    Record the nodes passed by the path

    Generate SQL based on the path

    RDF Triples=generateRDFTriples(queryResult,mapping-Result)

    Return RDF Triples

    算法2RDF三元組生成算法

    輸入:SQL Query Result,Map

    輸出:RDF Triples

    Generate subject according subject template and field data

    Classify the subject into its category

    Create Property according to predicate

    Generate predicate attributes

    If it is a data attribute then

    Generate triples(subject,predicate,attribute value)

    Else

    If this attribute is already in RDF graph

    Generate triples(subject,predicate,object property)

    Else

    Create object attribute entity

    Categorized into its category,that is generated(object property entity,type,class)

    Generate triples(subject,predicate,object attribute)

    Select RDF data format

    Return RDF Triples

    3 框架應(yīng)用和知識(shí)抽取實(shí)驗(yàn)

    實(shí)驗(yàn)使用本文提出的框架對智慧養(yǎng)老業(yè)務(wù)系統(tǒng)中老年人的信息進(jìn)行知識(shí)抽取并轉(zhuǎn)換成RDF 數(shù)據(jù),完成智慧養(yǎng)老領(lǐng)域老年人基礎(chǔ)信息知識(shí)圖譜的構(gòu)建。

    實(shí)驗(yàn)使用的自定義本體模型如圖5所示,該本體模型中包括17 個(gè)類別概念,25 個(gè)數(shù)據(jù)屬性,22 個(gè)對象屬性。類別概念中主要包括老人、養(yǎng)老機(jī)構(gòu)、證件、護(hù)理類型等,主要用于描述老人的基礎(chǔ)信息,和老年人在養(yǎng)老機(jī)構(gòu)的日常護(hù)理信息。其中數(shù)據(jù)屬性用于描述老人的基礎(chǔ)信息,如hasEmergencyPhone 表示老人的緊急聯(lián)系人電話。對象屬性用于表達(dá)老人概念與其他概念之間的關(guān)系,如belongPensionInstitution 表示老年人與養(yǎng)老機(jī)構(gòu)的關(guān)系。

    圖5 養(yǎng)老領(lǐng)域老人基礎(chǔ)信息本體模型Fig.5 Ontology model of basic information for the elderly

    除了老人的基本信息概念和老年人在養(yǎng)老機(jī)構(gòu)的信息,本體模型中還包括地址信息相關(guān)的概念。地址概念的規(guī)定采用了國家區(qū)域劃分的五級(jí)地址數(shù)據(jù)庫。行政區(qū)域劃分的本體模型中包含5個(gè)概念,用來表示行政區(qū)域劃分的五個(gè)級(jí)別。包括19 個(gè)屬性,其中14 個(gè)數(shù)據(jù)屬性表示行政區(qū)域基本信息,5個(gè)對象屬性連接不同等級(jí)的行政區(qū)域,表示行政區(qū)域的所屬關(guān)系。

    數(shù)據(jù)庫中包括四個(gè)表,其中老人基礎(chǔ)信息表存儲(chǔ)老年人、姓名、性別、出生日期、血型等基礎(chǔ)信息。老人在養(yǎng)老機(jī)構(gòu)登記的信息表存儲(chǔ)了老年人在當(dāng)前機(jī)構(gòu)的信息,如房間號(hào)、護(hù)理級(jí)別等信息。養(yǎng)老機(jī)構(gòu)表存儲(chǔ)機(jī)構(gòu)名、機(jī)構(gòu)代碼、機(jī)構(gòu)法人等養(yǎng)老服務(wù)機(jī)構(gòu)的相關(guān)信息。地址信息表行政區(qū)域的數(shù)據(jù)庫里存儲(chǔ)區(qū)域的相關(guān)信息,包括區(qū)域代碼、區(qū)域名稱、郵政編碼、區(qū)域的經(jīng)緯度,其中區(qū)域的parent_code是一個(gè)引用自身表的外鍵,被引用列是父級(jí)區(qū)域的區(qū)域代碼。

    實(shí)驗(yàn)步驟如下:

    (1)如圖6 所示,首先對數(shù)據(jù)庫和本體模型的相關(guān)信息進(jìn)行配置,包括數(shù)據(jù)庫的地址,數(shù)據(jù)庫的用戶名和密碼,本體模型所在的路徑地址。系統(tǒng)根據(jù)配置連接數(shù)據(jù)庫,加載本體模型,然后自動(dòng)對數(shù)據(jù)庫和本體模型進(jìn)行解析,并以可視化的方式展示出來。

    圖6 本體模型和數(shù)據(jù)信息配置Fig.6 Ontology and database address configuration

    (2)完成數(shù)據(jù)庫和本體模型的配置后,系統(tǒng)會(huì)根據(jù)數(shù)據(jù)庫的解析結(jié)果生成中間本體.并且計(jì)算自定義本體和中間本體各種概念屬性的相似度,基于相似度自動(dòng)生成數(shù)據(jù)庫和自定義本體之間的候選映射。如圖7所示,對于自定義本體中的每一個(gè)類,顯示一個(gè)類標(biāo)簽頁面。如圖7 所示,每個(gè)標(biāo)簽頁面的顯示詳情包括:類和表的對應(yīng)關(guān)系,屬性和字段的對應(yīng)關(guān)系,以及類的主語模板的默認(rèn)設(shè)置。

    圖7 自動(dòng)生成對應(yīng)關(guān)系Fig.7 Automatically generated candidate mapping

    (3)對自動(dòng)生成的候選映射進(jìn)行確認(rèn),確認(rèn)類與表的映射,字段與屬性的映射。對錯(cuò)誤的候選映射進(jìn)行修正。如果不進(jìn)行任何操作,則默認(rèn)自動(dòng)生成的對應(yīng)關(guān)系全部是正確的。實(shí)驗(yàn)中自定義本體模型中的17 個(gè)類,成功匹配到14 個(gè),對象屬性22 個(gè)成功匹配到16 個(gè),數(shù)據(jù)屬性25個(gè)匹配到20個(gè)。

    (4)根據(jù)需要選擇是否對資源實(shí)體的主語模板修改,可選擇數(shù)據(jù)庫中表的字段和字符組合方式,將根據(jù)在主語設(shè)置的字段模板和字符生成主語資源的URI,實(shí)驗(yàn)中使用默認(rèn)的主語生成方式。

    (5)確認(rèn)和修改后,可以直接把當(dāng)前類轉(zhuǎn)成RDF三元組,也可以在確認(rèn)所有類的候選映射關(guān)系之后,一次完成整個(gè)數(shù)據(jù)庫的轉(zhuǎn)換。最終共抽取272 102 條RDF三元組,以N-triples的格式保存三元組到文件中。

    最后使用本文的框架對關(guān)系數(shù)據(jù)進(jìn)行知識(shí)抽取并轉(zhuǎn)換成RDF 數(shù)據(jù),結(jié)合本體模型建立的養(yǎng)老領(lǐng)域老年人基礎(chǔ)信息知識(shí)圖譜如圖8所示。

    圖8 老年人基礎(chǔ)信息知識(shí)圖譜Fig.8 Basic information knowledge graph for the elderly

    如表3 所示,與現(xiàn)有的映射編輯類工具對比,本文提出的框架能夠方便地根據(jù)數(shù)據(jù)源和本體的解析結(jié)果,自動(dòng)生成候選映射,可視化地進(jìn)行修正和調(diào)整。另外能夠根據(jù)選擇的結(jié)果自動(dòng)進(jìn)行SQL 語句的生成和相應(yīng)數(shù)據(jù)的獲取。不需中間映射文件的編輯和維護(hù)映射。并且應(yīng)用框架能直接獲取到RDF 三元組,而不是映射文件,不需要再借助其他工具和插件去執(zhí)行映射文件再得到RDF三元組。因此基于本文的框架實(shí)現(xiàn)的知識(shí)抽取系統(tǒng),能夠方便地根據(jù)本體模型的目標(biāo)詞匯快速的生成RDF三元組,較為高效地完成關(guān)系型數(shù)據(jù)的知識(shí)抽取和數(shù)據(jù)轉(zhuǎn)換。

    表3 框架和工具功能比較情況Table 3 Comparison of framework and tool functions

    4 結(jié)束語

    結(jié)構(gòu)化數(shù)據(jù)的知識(shí)抽取和RDF轉(zhuǎn)換是結(jié)構(gòu)行業(yè)領(lǐng)域知識(shí)圖譜的重要步驟,本文針對當(dāng)前關(guān)系型結(jié)構(gòu)化知識(shí)抽取和數(shù)據(jù)轉(zhuǎn)換方法存在的操作繁瑣、需要用戶大量參與、進(jìn)行大量R2RML 語句編碼工作,以及R2RML 映射維護(hù)等問題,提出一種關(guān)系型結(jié)構(gòu)化知識(shí)抽取的框架方案并予以實(shí)現(xiàn)。直接由指定關(guān)系數(shù)據(jù)和本體模型中類別概念和屬性的對應(yīng)關(guān)系,系統(tǒng)框架根據(jù)用戶指定的對應(yīng)關(guān)系,自動(dòng)生成SQL語句從關(guān)系數(shù)據(jù)庫中進(jìn)行數(shù)據(jù)抽取生成RDF三元組。

    未來的研究工作要對框架的細(xì)節(jié)進(jìn)行進(jìn)一步的完善,如在轉(zhuǎn)成生成三元組時(shí)根據(jù)用戶的需求把三元組劃分到不同的命名圖(named graph)中,提供數(shù)據(jù)類型的轉(zhuǎn)換機(jī)制,提供枚舉類型的處理機(jī)制等。另外還可以從關(guān)系型的結(jié)構(gòu)化數(shù)據(jù)擴(kuò)展到其他類型的結(jié)構(gòu)數(shù)據(jù)的知識(shí)抽取上和數(shù)據(jù)轉(zhuǎn)換上,如Redis、Hbase、MongoDB 等數(shù)據(jù)庫,建立一個(gè)統(tǒng)一的結(jié)構(gòu)化數(shù)據(jù)知識(shí)抽取和數(shù)據(jù)轉(zhuǎn)換的框架。未來的研究可以考慮實(shí)現(xiàn)一個(gè)統(tǒng)一的結(jié)構(gòu)化知識(shí)抽取和數(shù)據(jù)轉(zhuǎn)換框架,并且以插件的方式集成到Protege中。

    猜你喜歡
    三元組字段主語
    基于語義增強(qiáng)雙編碼器的方面情感三元組提取
    軟件工程(2024年12期)2024-12-28 00:00:00
    基于帶噪聲數(shù)據(jù)集的強(qiáng)魯棒性隱含三元組質(zhì)檢算法*
    談?wù)勔龑?dǎo)主語從句的連接詞的用法
    圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
    關(guān)于余撓三元組的periodic-模
    CNMARC304字段和314字段責(zé)任附注方式解析
    無正題名文獻(xiàn)著錄方法評(píng)述
    盤點(diǎn)高考中的特殊句式(二)
    青蘋果(2014年2期)2014-04-29 20:31:27
    英語中的虛主語“it”和漢語中的虛主語“他”異同之比較
    三元組輻射場的建模與仿真
    国产久久久一区二区三区| 欧美乱色亚洲激情| 国产精品1区2区在线观看.| 国产视频一区二区在线看| 国产欧美日韩精品一区二区| 男人的好看免费观看在线视频| 性色avwww在线观看| 怎么达到女性高潮| 日韩三级视频一区二区三区| 久久天堂一区二区三区四区| 国产欧美日韩精品亚洲av| 国产欧美日韩精品亚洲av| 嫩草影院精品99| 欧美黄色片欧美黄色片| 国产亚洲欧美在线一区二区| 亚洲精品中文字幕一二三四区| 亚洲欧美一区二区三区黑人| 一本久久中文字幕| 欧美成狂野欧美在线观看| 高清在线国产一区| 少妇熟女aⅴ在线视频| ponron亚洲| 精品乱码久久久久久99久播| 久久久久九九精品影院| 欧美大码av| 在线a可以看的网站| 一级a爱片免费观看的视频| 国产一区二区在线av高清观看| 99riav亚洲国产免费| 亚洲第一欧美日韩一区二区三区| 在线国产一区二区在线| 大型黄色视频在线免费观看| 国产午夜精品久久久久久| 桃红色精品国产亚洲av| 久久国产精品人妻蜜桃| 夜夜看夜夜爽夜夜摸| 巨乳人妻的诱惑在线观看| 日韩欧美免费精品| 欧美丝袜亚洲另类 | 精品久久久久久,| 精品国产美女av久久久久小说| 我要搜黄色片| 欧美日韩亚洲国产一区二区在线观看| 婷婷亚洲欧美| 国产伦精品一区二区三区视频9 | 久99久视频精品免费| 一卡2卡三卡四卡精品乱码亚洲| 国产精品亚洲美女久久久| 午夜福利在线在线| 亚洲av第一区精品v没综合| 三级毛片av免费| 免费观看精品视频网站| 在线a可以看的网站| 在线永久观看黄色视频| 亚洲黑人精品在线| 最新美女视频免费是黄的| 手机成人av网站| 亚洲片人在线观看| 51午夜福利影视在线观看| 国产精品亚洲av一区麻豆| 成人永久免费在线观看视频| 在线视频色国产色| a级毛片a级免费在线| 操出白浆在线播放| 成人欧美大片| www.自偷自拍.com| 亚洲狠狠婷婷综合久久图片| 欧美3d第一页| 欧美日韩精品网址| 欧美午夜高清在线| 一本一本综合久久| 丁香六月欧美| 国产野战对白在线观看| 我要搜黄色片| 久久久久国产一级毛片高清牌| 天天一区二区日本电影三级| 色综合亚洲欧美另类图片| 中亚洲国语对白在线视频| 精品99又大又爽又粗少妇毛片 | 亚洲成人久久爱视频| 99精品在免费线老司机午夜| 老熟妇仑乱视频hdxx| 亚洲美女视频黄频| 日本一二三区视频观看| 亚洲av中文字字幕乱码综合| 国产精品影院久久| 午夜福利免费观看在线| 99久久综合精品五月天人人| 欧美日韩瑟瑟在线播放| 色综合亚洲欧美另类图片| 黄片大片在线免费观看| 中文字幕久久专区| 国产三级在线视频| 51午夜福利影视在线观看| 国产激情久久老熟女| 变态另类成人亚洲欧美熟女| 九色成人免费人妻av| 无人区码免费观看不卡| 搞女人的毛片| 亚洲,欧美精品.| 久9热在线精品视频| 亚洲av中文字字幕乱码综合| 啦啦啦免费观看视频1| 中文字幕熟女人妻在线| 日韩欧美在线二视频| 国产精品乱码一区二三区的特点| 久久精品夜夜夜夜夜久久蜜豆| 最近最新免费中文字幕在线| 一级毛片女人18水好多| 国产精品久久久久久久电影 | 亚洲成av人片免费观看| 国产精品电影一区二区三区| 欧美+亚洲+日韩+国产| 叶爱在线成人免费视频播放| 黄色丝袜av网址大全| av福利片在线观看| 97超视频在线观看视频| av片东京热男人的天堂| 又紧又爽又黄一区二区| 精品国产三级普通话版| 国产午夜精品久久久久久| 欧美日韩乱码在线| 桃红色精品国产亚洲av| 国产麻豆成人av免费视频| 国产成人一区二区三区免费视频网站| 国产真实乱freesex| 欧美色欧美亚洲另类二区| 真实男女啪啪啪动态图| 国内精品一区二区在线观看| 午夜福利高清视频| 久久久成人免费电影| 亚洲国产欧美人成| 在线观看午夜福利视频| 国产成人一区二区三区免费视频网站| 制服人妻中文乱码| 国内精品一区二区在线观看| 国产三级在线视频| 久久精品影院6| 亚洲五月天丁香| 亚洲天堂国产精品一区在线| 欧美+亚洲+日韩+国产| 搡老妇女老女人老熟妇| 精品久久久久久久久久久久久| 亚洲精品在线美女| 少妇裸体淫交视频免费看高清| 亚洲国产中文字幕在线视频| 12—13女人毛片做爰片一| 琪琪午夜伦伦电影理论片6080| 午夜激情欧美在线| 欧美日韩综合久久久久久 | 国产精品一区二区精品视频观看| 国产午夜福利久久久久久| 好男人电影高清在线观看| 99精品欧美一区二区三区四区| 久久久久久大精品| 麻豆成人午夜福利视频| 国产成人av激情在线播放| 麻豆成人av在线观看| 国产av在哪里看| 大型黄色视频在线免费观看| 中文字幕人成人乱码亚洲影| 欧美性猛交黑人性爽| 狂野欧美白嫩少妇大欣赏| 精品久久蜜臀av无| 美女扒开内裤让男人捅视频| 国产午夜精品论理片| 99久久久亚洲精品蜜臀av| 我的老师免费观看完整版| 99久久精品热视频| 美女高潮喷水抽搐中文字幕| 深夜精品福利| 日本 欧美在线| 欧美成人免费av一区二区三区| 亚洲中文日韩欧美视频| 成人国产综合亚洲| 精品不卡国产一区二区三区| 久久久成人免费电影| av欧美777| 精品国产三级普通话版| 一二三四社区在线视频社区8| 国产成人影院久久av| 国产成人影院久久av| 99在线视频只有这里精品首页| 桃色一区二区三区在线观看| 成人鲁丝片一二三区免费| 国产人伦9x9x在线观看| 亚洲国产精品合色在线| 日本黄色视频三级网站网址| 国产精品久久久久久精品电影| 1024香蕉在线观看| 久久久久久国产a免费观看| 观看美女的网站| 国产成人影院久久av| 热99re8久久精品国产| 午夜精品久久久久久毛片777| 男女那种视频在线观看| 国产精品乱码一区二三区的特点| 在线观看舔阴道视频| 欧美不卡视频在线免费观看| av天堂中文字幕网| 亚洲av成人不卡在线观看播放网| 三级男女做爰猛烈吃奶摸视频| 亚洲国产精品999在线| 中文字幕熟女人妻在线| 啪啪无遮挡十八禁网站| 一个人免费在线观看电影 | 亚洲精品乱码久久久v下载方式 | 中文资源天堂在线| www.自偷自拍.com| 舔av片在线| 午夜福利成人在线免费观看| 久久久久国产精品人妻aⅴ院| 亚洲av成人不卡在线观看播放网| 十八禁网站免费在线| 18禁裸乳无遮挡免费网站照片| 亚洲欧洲精品一区二区精品久久久| 麻豆成人av在线观看| 婷婷六月久久综合丁香| 一个人观看的视频www高清免费观看 | 美女 人体艺术 gogo| 无限看片的www在线观看| 亚洲精品色激情综合| 又爽又黄无遮挡网站| 精品一区二区三区视频在线观看免费| 国产精品精品国产色婷婷| 国产 一区 欧美 日韩| av天堂在线播放| 亚洲精品久久国产高清桃花| 亚洲自偷自拍图片 自拍| 国产成年人精品一区二区| 免费看日本二区| 精品一区二区三区视频在线观看免费| 夜夜爽天天搞| 看免费av毛片| 色综合亚洲欧美另类图片| 很黄的视频免费| 国产精品99久久99久久久不卡| 淫秽高清视频在线观看| 99热这里只有精品一区 | 国产精品免费一区二区三区在线| 成人特级av手机在线观看| 久久久久国内视频| 99热6这里只有精品| 99久久精品一区二区三区| 国产三级中文精品| av在线天堂中文字幕| 老司机午夜福利在线观看视频| 国产亚洲精品av在线| 日韩成人在线观看一区二区三区| 欧美性猛交╳xxx乱大交人| 最新在线观看一区二区三区| 亚洲成av人片在线播放无| 2021天堂中文幕一二区在线观| 18禁美女被吸乳视频| 国产单亲对白刺激| 国产亚洲精品一区二区www| 精品人妻1区二区| 岛国在线免费视频观看| 国产 一区 欧美 日韩| 国产精品综合久久久久久久免费| 国产成人精品无人区| 成人精品一区二区免费| 美女黄网站色视频| 欧洲精品卡2卡3卡4卡5卡区| 2021天堂中文幕一二区在线观| 一本一本综合久久| 亚洲色图av天堂| 国产午夜精品久久久久久| 精品日产1卡2卡| 亚洲精品在线美女| 国产成人影院久久av| 国产精品乱码一区二三区的特点| 国产亚洲欧美在线一区二区| 精品国内亚洲2022精品成人| 午夜免费观看网址| 欧美一级毛片孕妇| 国产精品久久久久久久电影 | 久久久久久大精品| 欧美3d第一页| 在线十欧美十亚洲十日本专区| 国产三级在线视频| 黄频高清免费视频| 国产 一区 欧美 日韩| 1000部很黄的大片| 亚洲专区国产一区二区| 1024香蕉在线观看| 两性夫妻黄色片| 精品国产乱子伦一区二区三区| 日韩中文字幕欧美一区二区| 亚洲av成人av| 操出白浆在线播放| 亚洲国产精品合色在线| 国产精品久久久久久精品电影| 久久久久九九精品影院| www.精华液| 亚洲人成网站在线播放欧美日韩| 亚洲片人在线观看| 这个男人来自地球电影免费观看| 可以在线观看毛片的网站| 动漫黄色视频在线观看| 波多野结衣高清作品| 别揉我奶头~嗯~啊~动态视频| 中文字幕久久专区| 在线视频色国产色| 国产精品久久视频播放| 久久久精品大字幕| 国产三级在线视频| 亚洲国产欧美一区二区综合| 一级毛片高清免费大全| 国产成年人精品一区二区| 亚洲精品乱码久久久v下载方式 | av视频在线观看入口| 在线国产一区二区在线| 88av欧美| 精品久久久久久成人av| 村上凉子中文字幕在线| 熟女人妻精品中文字幕| 每晚都被弄得嗷嗷叫到高潮| 男人和女人高潮做爰伦理| 国产黄片美女视频| 男女视频在线观看网站免费| 免费无遮挡裸体视频| 99国产综合亚洲精品| 天堂av国产一区二区熟女人妻| 五月玫瑰六月丁香| 国产又黄又爽又无遮挡在线| 宅男免费午夜| 日韩欧美国产在线观看| 久久久成人免费电影| 成人亚洲精品av一区二区| 最好的美女福利视频网| 热99re8久久精品国产| 成人特级黄色片久久久久久久| 两个人视频免费观看高清| 黑人操中国人逼视频| 黄色女人牲交| 丝袜人妻中文字幕| 两个人看的免费小视频| 婷婷精品国产亚洲av在线| 毛片女人毛片| 亚洲电影在线观看av| 最近最新免费中文字幕在线| 国产精品国产高清国产av| 噜噜噜噜噜久久久久久91| 99精品在免费线老司机午夜| 久久久久久久久久黄片| 精品一区二区三区av网在线观看| 他把我摸到了高潮在线观看| 欧洲精品卡2卡3卡4卡5卡区| 国产一区在线观看成人免费| 国产97色在线日韩免费| 久久久国产欧美日韩av| 久久久久性生活片| 精品人妻1区二区| 美女 人体艺术 gogo| 999久久久精品免费观看国产| 国产成人精品无人区| 不卡av一区二区三区| 叶爱在线成人免费视频播放| 特级一级黄色大片| а√天堂www在线а√下载| 小蜜桃在线观看免费完整版高清| or卡值多少钱| 黑人操中国人逼视频| 19禁男女啪啪无遮挡网站| 怎么达到女性高潮| 国产成年人精品一区二区| 久久国产精品人妻蜜桃| 亚洲国产欧洲综合997久久,| 啦啦啦韩国在线观看视频| 亚洲精品色激情综合| xxx96com| 亚洲,欧美精品.| 中文在线观看免费www的网站| 精品国产美女av久久久久小说| 亚洲av电影不卡..在线观看| 午夜a级毛片| 亚洲第一欧美日韩一区二区三区| 午夜影院日韩av| 99久久国产精品久久久| 精品电影一区二区在线| 欧美成狂野欧美在线观看| 亚洲精品在线美女| 成人av在线播放网站| 亚洲一区二区三区色噜噜| 亚洲五月婷婷丁香| 每晚都被弄得嗷嗷叫到高潮| 黄色片一级片一级黄色片| 又粗又爽又猛毛片免费看| 国产麻豆成人av免费视频| 久久精品人妻少妇| 亚洲成a人片在线一区二区| 又粗又爽又猛毛片免费看| 三级毛片av免费| 久久久久久九九精品二区国产| 欧美日韩一级在线毛片| www.自偷自拍.com| 美女高潮的动态| 日韩欧美精品v在线| 首页视频小说图片口味搜索| 人人妻人人澡欧美一区二区| 久久精品国产99精品国产亚洲性色| 国产爱豆传媒在线观看| 成人无遮挡网站| 黑人操中国人逼视频| 国产三级中文精品| 变态另类丝袜制服| 一边摸一边抽搐一进一小说| 在线看三级毛片| 国产精品电影一区二区三区| 中文亚洲av片在线观看爽| 国内揄拍国产精品人妻在线| 免费人成视频x8x8入口观看| 日本撒尿小便嘘嘘汇集6| 美女被艹到高潮喷水动态| 999久久久国产精品视频| 午夜福利免费观看在线| av片东京热男人的天堂| 国产午夜精品论理片| 一级a爱片免费观看的视频| 极品教师在线免费播放| 1024手机看黄色片| 一区二区三区国产精品乱码| 国内少妇人妻偷人精品xxx网站 | 人妻久久中文字幕网| 婷婷亚洲欧美| 岛国视频午夜一区免费看| aaaaa片日本免费| 日本成人三级电影网站| 最近最新中文字幕大全免费视频| 国产激情偷乱视频一区二区| 国产精品自产拍在线观看55亚洲| 亚洲无线观看免费| 一个人观看的视频www高清免费观看 | 日本 av在线| 午夜成年电影在线免费观看| 午夜免费观看网址| 高潮久久久久久久久久久不卡| 国产三级黄色录像| 两性午夜刺激爽爽歪歪视频在线观看| 午夜福利在线观看吧| 亚洲人成网站在线播放欧美日韩| 国语自产精品视频在线第100页| 综合色av麻豆| 亚洲成av人片在线播放无| 性色av乱码一区二区三区2| h日本视频在线播放| 国产精华一区二区三区| 日本黄色视频三级网站网址| av女优亚洲男人天堂 | 久久伊人香网站| 九九久久精品国产亚洲av麻豆 | 国产主播在线观看一区二区| 高清在线国产一区| 天堂动漫精品| 精品久久久久久久人妻蜜臀av| 日韩欧美免费精品| 亚洲午夜精品一区,二区,三区| www.www免费av| 日本黄色视频三级网站网址| 日韩有码中文字幕| av天堂在线播放| 欧美日韩亚洲国产一区二区在线观看| 一进一出好大好爽视频| 免费在线观看日本一区| 久久中文字幕一级| 一个人看的www免费观看视频| 两性夫妻黄色片| 久久欧美精品欧美久久欧美| 亚洲一区高清亚洲精品| 国产一区在线观看成人免费| 高清在线国产一区| 一二三四社区在线视频社区8| 亚洲国产欧美网| 久久久久久久精品吃奶| 亚洲熟女毛片儿| 成人av在线播放网站| 久久国产乱子伦精品免费另类| 色av中文字幕| 免费电影在线观看免费观看| 日韩欧美在线乱码| 日本 欧美在线| 亚洲成人久久性| 国内精品久久久久久久电影| 成人三级黄色视频| 欧美中文综合在线视频| 一二三四社区在线视频社区8| 欧美乱码精品一区二区三区| 日本 欧美在线| 久久久久久人人人人人| 精品午夜福利视频在线观看一区| 国产免费av片在线观看野外av| 欧美大码av| 亚洲无线在线观看| 国产精品98久久久久久宅男小说| 一本一本综合久久| 欧美av亚洲av综合av国产av| 一本精品99久久精品77| 久久久久久大精品| 欧美激情久久久久久爽电影| 成年人黄色毛片网站| 成人国产一区最新在线观看| 女人被狂操c到高潮| 亚洲片人在线观看| 制服人妻中文乱码| 90打野战视频偷拍视频| 网址你懂的国产日韩在线| 亚洲欧美日韩高清专用| 亚洲欧美日韩无卡精品| 国产av一区在线观看免费| 亚洲av成人av| 亚洲一区二区三区不卡视频| 色精品久久人妻99蜜桃| 日韩精品青青久久久久久| 免费看日本二区| 97超视频在线观看视频| 国产亚洲精品一区二区www| 夜夜爽天天搞| 黄色 视频免费看| 免费看日本二区| 久久这里只有精品中国| 亚洲avbb在线观看| 亚洲国产精品999在线| 日本撒尿小便嘘嘘汇集6| 一级a爱片免费观看的视频| 中文字幕最新亚洲高清| 精品久久久久久久毛片微露脸| 岛国在线观看网站| 国产亚洲av嫩草精品影院| 99国产极品粉嫩在线观看| 中出人妻视频一区二区| 黄片小视频在线播放| 亚洲无线观看免费| 嫁个100分男人电影在线观看| 久久久久久九九精品二区国产| 欧美极品一区二区三区四区| 亚洲精品国产精品久久久不卡| 国产免费男女视频| 亚洲精品久久国产高清桃花| av中文乱码字幕在线| 欧洲精品卡2卡3卡4卡5卡区| 男女床上黄色一级片免费看| 熟妇人妻久久中文字幕3abv| 两性夫妻黄色片| 91av网一区二区| 亚洲在线自拍视频| 女生性感内裤真人,穿戴方法视频| 欧美绝顶高潮抽搐喷水| 美女cb高潮喷水在线观看 | 国产av一区在线观看免费| 国产精品久久久久久精品电影| 中文字幕av在线有码专区| 啪啪无遮挡十八禁网站| 老熟妇乱子伦视频在线观看| 成人午夜高清在线视频| 成年版毛片免费区| 69av精品久久久久久| 亚洲av五月六月丁香网| 欧美黄色片欧美黄色片| 两人在一起打扑克的视频| av中文乱码字幕在线| 欧美乱妇无乱码| 老司机深夜福利视频在线观看| 亚洲av成人av| 日韩欧美国产在线观看| 亚洲18禁久久av| 欧美最黄视频在线播放免费| 国产亚洲欧美在线一区二区| 久久久久久久久中文| 成年女人永久免费观看视频| 人人妻人人看人人澡| 国内毛片毛片毛片毛片毛片| 黑人操中国人逼视频| 欧美性猛交╳xxx乱大交人| 搞女人的毛片| 色精品久久人妻99蜜桃| 999久久久精品免费观看国产| 亚洲欧美日韩高清专用| 午夜福利在线在线| 成人三级做爰电影| 香蕉av资源在线| 美女被艹到高潮喷水动态| 久久中文字幕一级| 国产黄片美女视频| 午夜精品在线福利| 久久久久久九九精品二区国产| 桃色一区二区三区在线观看| 亚洲国产精品sss在线观看| 欧美国产日韩亚洲一区| 亚洲精品色激情综合| 中文字幕av在线有码专区| 亚洲av第一区精品v没综合| 国产精品国产高清国产av| 欧美黑人巨大hd| 亚洲电影在线观看av| 欧美中文日本在线观看视频| 男女床上黄色一级片免费看| 曰老女人黄片| 国产日本99.免费观看| 国产精品一区二区三区四区久久| 曰老女人黄片| xxxwww97欧美| 一二三四社区在线视频社区8| 国产精品99久久99久久久不卡| 两人在一起打扑克的视频| 免费高清视频大片| 激情在线观看视频在线高清| 一进一出抽搐动态| 国产一区二区在线观看日韩 | 岛国在线观看网站| 成人性生交大片免费视频hd| 精品国产美女av久久久久小说| 小蜜桃在线观看免费完整版高清| 日本一二三区视频观看| 一区福利在线观看|