• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      可移動(dòng)文物的知識(shí)圖譜構(gòu)建及關(guān)聯(lián)數(shù)據(jù)存儲(chǔ)

      2022-03-30 23:23:59高勁松張強(qiáng)李帥珂
      現(xiàn)代情報(bào) 2022年4期
      關(guān)鍵詞:知識(shí)圖譜

      高勁松 張強(qiáng) 李帥珂

      基金項(xiàng)目:中央高校基本科研業(yè)務(wù)費(fèi)自由探索項(xiàng)目“面向用戶的文物信息資源知識(shí)服務(wù)研究”(項(xiàng)目編號(hào):CCNU20A06025);國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目“新時(shí)代我國(guó)文獻(xiàn)信息資源保障體系重構(gòu)研究”(項(xiàng)目編號(hào):19ZDA345)。

      作者簡(jiǎn)介:高勁松(1966-),女,教授,博士生導(dǎo)師,研究方向:情報(bào)學(xué)、圖書館學(xué)。張強(qiáng)(1993-),男,博士研究生,研究方向:數(shù)字人文。李帥珂(1998-),女,碩士研究生,研究方向:數(shù)字人文。

      摘 要:[目的/意義]可移動(dòng)文物對(duì)文化的傳承和發(fā)展具有重要意義,對(duì)可移動(dòng)文物進(jìn)行知識(shí)圖譜可視化及關(guān)聯(lián)數(shù)據(jù)發(fā)布,有助于更好地進(jìn)行可移動(dòng)文物的數(shù)字化保存、知識(shí)共享及智慧服務(wù)。[方法/過程]通過Protégé本體開發(fā)軟件構(gòu)建可移動(dòng)文物的知識(shí)本體,并基于此利用RDF2RDF插件和Neosemantics插件構(gòu)建了可移動(dòng)文物的知識(shí)圖譜,最后借助D2RQ平臺(tái)實(shí)現(xiàn)可移動(dòng)文物的關(guān)聯(lián)數(shù)據(jù)存儲(chǔ)。[結(jié)果/結(jié)論]使可移動(dòng)文物的展示形式從原本的單一形式轉(zhuǎn)化為多元化的數(shù)據(jù)展現(xiàn)形式,提高了用戶瀏覽、查詢可移動(dòng)文物信息資源的效率。

      關(guān)鍵詞:可移動(dòng)文物;知識(shí)本體;知識(shí)圖譜;關(guān)聯(lián)數(shù)據(jù);D2RQ

      DOI:10.3969/j.issn.1008-0821.2022.04.008

      〔中圖分類號(hào)〕G254 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2022)04-0088-11

      Abstract:[Purpose/Significance]Movable cultural relics are of great significance to the inheritance and development of culture.Visualizing knowledge graphs and publishing linked data for movable cultural relics is helpful for better digital preservation,knowledge sharing and intelligent services of movable cultural relics.[Method/Process]The ontology of movable cultural relics is constructed by Protégé ontology development software,and based on this,the knowledge graph of movable cultural relics is constructed using RDF2RDF plug-in and neosemantics plug-in.Finally,the linked data storage of movable cultural relics is realized with the help of D2RQ platform.[Results/Conclusions]The display form of movable cultural relics is transformed from the original single form to a diversified data display form,which improves the efficiency of users browsing and querying information resources of movable cultural relics.

      Key words:movable cultural relics;knowledge ontology;knowledge graph;linked data;D2RQ

      可移動(dòng)文物是人類生活歷史的記錄,更是中華文化的象征和傳承。近年來,科技水平的不斷增長(zhǎng)為文物的數(shù)字化保存和利用提供了新的途徑,為了更好地發(fā)揮文物信息的價(jià)值與作用,國(guó)家文物局自2012—2016年開展了國(guó)有可移動(dòng)文物的普查工作,從而讓藏在博物館中的可移動(dòng)文物活起來服務(wù)群眾。然而單純的文物統(tǒng)計(jì)數(shù)據(jù)在進(jìn)行共享時(shí)利用率較低,不能真正有效的展示出可移動(dòng)文物的信息價(jià)值,因此需要對(duì)可移動(dòng)文物信息采用知識(shí)組織、存儲(chǔ)及發(fā)布展示等手段來更好地為用戶服務(wù)。隨著知識(shí)圖譜技術(shù)的發(fā)展和學(xué)科的交融,將知識(shí)圖譜技術(shù)的抽象可視化與實(shí)體信息相結(jié)合,使文物知識(shí)顯性化,可增強(qiáng)用戶對(duì)知識(shí)的接受程度。單一的知識(shí)可視化呈現(xiàn)在交互過程中具有較大局限性,以關(guān)聯(lián)數(shù)據(jù)形式發(fā)布能夠在語(yǔ)義層面實(shí)現(xiàn)知識(shí)的互聯(lián)互通,使知識(shí)連結(jié)成一張可追溯的知識(shí)網(wǎng)絡(luò),為知識(shí)共享和智慧化服務(wù)提供解決思路。本文以湖北省博物館可移動(dòng)文物為例,通過構(gòu)建可移動(dòng)文物知識(shí)圖譜并以關(guān)聯(lián)數(shù)據(jù)形式發(fā)布,進(jìn)行可移動(dòng)文物知識(shí)的展示和利用研究。

      1 研究現(xiàn)狀

      知識(shí)圖譜在維基百科中定義為“使用語(yǔ)義檢索,從多種來源收集信息,以提高搜索質(zhì)量的知識(shí)庫(kù)”,其在語(yǔ)義層面上能夠?qū)?shí)體、概念以及實(shí)體間的關(guān)聯(lián)關(guān)系進(jìn)行形式化的描述。因此,知識(shí)圖譜技術(shù)的應(yīng)用場(chǎng)景得到了廣泛的關(guān)注。Jin W等[1]利用知識(shí)庫(kù)中的知識(shí)將短文本概念化,進(jìn)行知識(shí)表示從而得到文本分類結(jié)果。Peng C等[2]則提出一種基于知識(shí)圖譜的隱喻嵌入,用于理解文學(xué)中單詞之間的隱喻關(guān)系。知識(shí)圖譜技術(shù)不僅在自然語(yǔ)言理解方面具有優(yōu)勢(shì),同時(shí)促進(jìn)了智能知識(shí)問答系統(tǒng)方面的發(fā)展,如丁雅琴[3]開發(fā)了基于醫(yī)療知識(shí)圖譜的問答系統(tǒng),可以幫助用戶在海量醫(yī)療數(shù)據(jù)中篩選出精準(zhǔn)的答案并返回給用戶。張淼[4]以通用中文知識(shí)圖譜為知識(shí)來源,基于實(shí)體識(shí)別算法和屬性來凝結(jié)算法設(shè)計(jì)并完成了一個(gè)智能問答系統(tǒng)。

      信息時(shí)代的到來使得數(shù)據(jù)量以指數(shù)級(jí)飛速增長(zhǎng),知識(shí)圖譜的規(guī)模隨之越來越大,對(duì)知識(shí)的存儲(chǔ)提出了更高的要求。目前知識(shí)存儲(chǔ)的方式主要有3種,分別是RDF數(shù)據(jù)庫(kù)、關(guān)系型數(shù)據(jù)庫(kù)、圖數(shù)據(jù)庫(kù),其中以圖的數(shù)據(jù)形式進(jìn)行存儲(chǔ)的知識(shí)圖譜占大多數(shù),因而本文采用圖數(shù)據(jù)庫(kù)Neo4j存儲(chǔ)數(shù)據(jù)并基于文物本體構(gòu)建可移動(dòng)文物知識(shí)圖譜,以此呈現(xiàn)可移動(dòng)文物相關(guān)知識(shí)在語(yǔ)義層面的深度關(guān)聯(lián)關(guān)系。

      關(guān)于文物本體研究,吳瓊等[5]提出了基于本體的方法可以為不可移動(dòng)文物添加豐富的語(yǔ)義信息,GIS可以為不可移動(dòng)文物提供地理信息,將兩者結(jié)合可構(gòu)建面向不可移動(dòng)文物的信息參考模型。Yang W等[6]為更好地進(jìn)行創(chuàng)新設(shè)計(jì),提高傳統(tǒng)文物信息檢索能力,探索了基于本體的知識(shí)地圖構(gòu)建方法,開發(fā)了文物知識(shí)地圖集成平臺(tái)。

      知識(shí)圖譜使實(shí)體以及實(shí)體間關(guān)系可視化呈現(xiàn),最終目的是挖掘?qū)嶓w間隱含的關(guān)聯(lián)關(guān)系,從而以圖的方式進(jìn)行知識(shí)表示。借助知識(shí)圖譜的構(gòu)建,將數(shù)據(jù)進(jìn)行存儲(chǔ)并以關(guān)聯(lián)數(shù)據(jù)形式發(fā)布,構(gòu)建領(lǐng)域語(yǔ)義網(wǎng),實(shí)現(xiàn)了實(shí)體在內(nèi)容上的語(yǔ)義互聯(lián)。劉煒[7]對(duì)關(guān)聯(lián)數(shù)據(jù)的概念進(jìn)行了詳細(xì)解釋,他認(rèn)為:關(guān)聯(lián)數(shù)據(jù)是一組最佳實(shí)踐的集合,它采用RDF數(shù)據(jù)模型,利用URI(統(tǒng)一資源標(biāo)識(shí)符)命名數(shù)據(jù)實(shí)體,來發(fā)布和部署實(shí)例數(shù)據(jù)和類數(shù)據(jù),從而可以通過HTTP協(xié)議揭示并獲取這些數(shù)據(jù),同時(shí)它強(qiáng)調(diào)數(shù)據(jù)的相互關(guān)聯(lián)、相互聯(lián)系和有益于人機(jī)理解的語(yǔ)境信息。作為語(yǔ)義萬(wàn)維網(wǎng)的實(shí)現(xiàn)方式,越來越多的領(lǐng)域數(shù)據(jù)要求以關(guān)聯(lián)數(shù)據(jù)的方式進(jìn)行存儲(chǔ)和發(fā)布,以尋求其在語(yǔ)義層面的更多關(guān)聯(lián)以及未發(fā)掘的隱性語(yǔ)義鏈接。林海青等[8]提出在圖書館領(lǐng)域采用關(guān)聯(lián)數(shù)據(jù)技術(shù)使圖書館在未來語(yǔ)義網(wǎng)中發(fā)揮主導(dǎo)作用,使圖書館實(shí)現(xiàn)服務(wù)模式的轉(zhuǎn)型;陳氫等[9]借助關(guān)聯(lián)數(shù)據(jù)技術(shù),實(shí)現(xiàn)企業(yè)數(shù)據(jù)、流程及其他屬性間的可視化并提出了企業(yè)數(shù)據(jù)治理的相關(guān)策略。Mouzakitis S等[10]提出了一個(gè)關(guān)聯(lián)數(shù)據(jù)技術(shù)框架,隱藏鏈接數(shù)據(jù)的基本復(fù)雜性,同時(shí)維護(hù)和促進(jìn)了所實(shí)現(xiàn)的相互鏈接能力。

      本文采用圖數(shù)據(jù)庫(kù)的方式存儲(chǔ)數(shù)據(jù),參考領(lǐng)域本體常用建模方法七步法建立文物本體模型并進(jìn)行本體實(shí)例可視化,之后構(gòu)建基于文物本體的可移動(dòng)文物知識(shí)圖譜,挖掘文物實(shí)體之間的相關(guān)關(guān)系,并以關(guān)聯(lián)數(shù)據(jù)形式存儲(chǔ)和發(fā)布,使其在文物領(lǐng)域組織一張包含實(shí)體屬性特征與相互聯(lián)系的語(yǔ)義網(wǎng)絡(luò),最終為可移動(dòng)文物在知識(shí)層面的交流共享提供新的路徑和方法。

      2 可移動(dòng)文物知識(shí)本體模型構(gòu)建及實(shí)例可視化

      2.1 可移動(dòng)文物知識(shí)本體模型構(gòu)建

      可移動(dòng)文物又稱可收藏文物,2013年全國(guó)第一次可移動(dòng)文物普查是新中國(guó)成立以來首次針對(duì)可移動(dòng)文物開展的普查,突出了文化遺產(chǎn)領(lǐng)域發(fā)展的價(jià)值及國(guó)家的重視程度,對(duì)文物領(lǐng)域知識(shí)全面了解和共享有助于數(shù)字博物館建設(shè),更積極響應(yīng)國(guó)家文物保護(hù)的政策。本文以可移動(dòng)文物實(shí)體為核心,通過分析可移動(dòng)文物的表面屬性和文化含義,區(qū)別不可移動(dòng)文物,構(gòu)建一個(gè)具有地址改變和移動(dòng)路徑特征的可移動(dòng)文物知識(shí)本體,以此加強(qiáng)文物領(lǐng)域知識(shí)的共享和充分利用。

      2.1.1 概念體系構(gòu)建

      可移動(dòng)文物知識(shí)本體是對(duì)可移動(dòng)文物實(shí)體以及與文物實(shí)體相關(guān)關(guān)系的語(yǔ)義描述,通過對(duì)文物領(lǐng)域知識(shí)的分析,首先需要明確可移動(dòng)文物領(lǐng)域概念描述范圍,并考慮是否需要本體復(fù)用,以確定核心概念;之后列舉領(lǐng)域概念知識(shí)的相關(guān)術(shù)語(yǔ),為定義核心類與屬性做鋪墊。根據(jù)第一次全國(guó)可移動(dòng)文物普查登錄的內(nèi)容,除了采用14項(xiàng)基本指標(biāo)項(xiàng)如文物名稱、類別、級(jí)別、質(zhì)地等作為概念描述外,還添加了可移動(dòng)文物的狀態(tài)信息、文化含義以及資源展現(xiàn)方式等內(nèi)容,以此進(jìn)行文物基本信息的描述以及相關(guān)關(guān)系呈現(xiàn),更好地實(shí)現(xiàn)語(yǔ)義消歧和領(lǐng)域知識(shí)共享。

      本文在考察本體復(fù)用環(huán)節(jié)時(shí),參考了國(guó)際博物館理事會(huì)開發(fā)的概念參考模型(CIDOC Conceptual Reference Model,簡(jiǎn)稱CIDOC CRM)。CIDOC CRM概念參考模型是專門用于文化遺產(chǎn)中的信息集成整合工具,它對(duì)世界范圍內(nèi)廣大文化遺產(chǎn)相關(guān)文檔中的顯示和隱式概念關(guān)系給出了清晰的定義[11]。因此,本文采用CIDOC CRM中E1(Entity)、E52(TimeSpan)、E53(PlaceCreation)等類作為可移動(dòng)文物知識(shí)本體的部分核心概念類??梢苿?dòng)文物具有獨(dú)具特色的表現(xiàn)形式與文化內(nèi)涵,除了考慮本體復(fù)用外,還要在考察文物領(lǐng)域特有的概念、知識(shí)后自定義命名空間,以滿足構(gòu)建本體模型的需要。枚舉文物領(lǐng)域重要概念術(shù)語(yǔ)時(shí),結(jié)合可移動(dòng)文物的特點(diǎn)以及類間關(guān)系屬性,暫不考慮術(shù)語(yǔ)的相似和相近,列舉部分可移動(dòng)文物領(lǐng)域重要概念和術(shù)語(yǔ)如表1所示。

      通過對(duì)文物領(lǐng)域概念的分析,并自定義Mcr為命名空間,構(gòu)建可移動(dòng)文物知識(shí)概念體系,其包括實(shí)體、時(shí)間、地點(diǎn)、文化、資源5個(gè)大類,組成可移動(dòng)文物知識(shí)概念體系的整體框架,其中時(shí)間類包含兩個(gè)子類,分別是抽象時(shí)間類和具體時(shí)間類,抽象時(shí)間表示可移動(dòng)文物的年代如唐代、宋代、元代、明代、清代等,具體時(shí)間表示可移動(dòng)文物的館藏時(shí)間;由于可移動(dòng)文物的移動(dòng)特性,使其發(fā)生了位置上的改變,因此地點(diǎn)類同樣具有兩個(gè)子類,即表示文物現(xiàn)存位置的收藏機(jī)構(gòu)類和文物被發(fā)現(xiàn)位置的出土位置類;其余3個(gè)類是可移動(dòng)文物實(shí)體的表面特征和內(nèi)容特征的展現(xiàn),其概念知識(shí)由數(shù)據(jù)屬性所描述,類層次結(jié)構(gòu)如表2所示。

      2.1.2 本體模型實(shí)現(xiàn)

      確定了可移動(dòng)文物知識(shí)本體概念體系后,需要進(jìn)一步確定概念屬性的核心元素,核心元素的確立有利于更好的描述和揭示概念間相互的聯(lián)系以及諸多可移動(dòng)文物知識(shí)間的關(guān)聯(lián)[12]。可移動(dòng)文物屬性按照特征可分為內(nèi)在屬性如文物的質(zhì)地、重量等;外在屬性如文物的名稱、年代、研究?jī)r(jià)值等以及文物與其他對(duì)象之間的關(guān)系屬性等。在本體中通常用兩種屬性來表示,即數(shù)據(jù)屬性和對(duì)象屬性,數(shù)據(jù)屬性用來定義客觀事物的內(nèi)在屬性和外在屬性;對(duì)象屬性是復(fù)雜的屬性,常用來表示實(shí)體與其他對(duì)象和類之間的關(guān)系。可移動(dòng)文物知識(shí)概念體系中構(gòu)建了5個(gè)核心概念類,其中地點(diǎn)和時(shí)間分別具有兩個(gè)子類,在以上大類和子類中建立對(duì)象屬性關(guān)系,包含實(shí)體與地點(diǎn)的關(guān)系、實(shí)體與時(shí)間、實(shí)體和資源、實(shí)體和文化、地點(diǎn)和文化、文化和資源、地理位置之間行政區(qū)的隸屬關(guān)系、同一文物實(shí)體在不同機(jī)構(gòu)展出的相關(guān)關(guān)系等,如表3所示。

      1)實(shí)體類

      實(shí)體類(Entity)是指可移動(dòng)文物實(shí)體,根據(jù)全國(guó)第一次可移動(dòng)文物普查基本指標(biāo)項(xiàng)內(nèi)容,其數(shù)據(jù)屬性由質(zhì)地、類別、級(jí)別、造型、用途、文物來源、完殘程度、編號(hào)、尺寸、質(zhì)量組成。其中編號(hào)指文物普查所給予的“文物身份證”,登錄在文物普查系統(tǒng)的每件文物都被賦予全國(guó)永久唯一的22位數(shù)字編碼,作為文物屬性驗(yàn)證的標(biāo)識(shí);類別同樣參照文物普查的分類原則,將可移動(dòng)文物共分為32個(gè)類別如金銀器、銅器、瓷器等;其余各核心要素相關(guān)術(shù)語(yǔ)參照表1所示。本文針對(duì)研究目的需要,將年代、出土位置等要素歸入其他核心類中。實(shí)體類是可移動(dòng)文物知識(shí)本體的實(shí)際物體代表類,作為本體構(gòu)建的核心,實(shí)體類與其余4個(gè)大類即時(shí)間類、地點(diǎn)類、文化類、資源類相互關(guān)聯(lián),共同構(gòu)成可移動(dòng)文物領(lǐng)域內(nèi)語(yǔ)義層面的知識(shí)網(wǎng)。

      2)地點(diǎn)類

      地點(diǎn)類(Location)包括兩個(gè)子類,分別是出土位置類(PlaceCreation)和收藏機(jī)構(gòu)類(Organization)??梢苿?dòng)文物的出土位置與現(xiàn)存地址因移動(dòng)的特性有所不同,同時(shí)由于可移動(dòng)文物的展覽、館際交流活動(dòng)等,造成同一文物在多個(gè)收藏機(jī)構(gòu)出現(xiàn)過的情況,因而,與地點(diǎn)相關(guān)的關(guān)聯(lián)關(guān)系包含同一文物在多個(gè)機(jī)構(gòu)出現(xiàn)的相關(guān)關(guān)系;此外,文物的出土位置和收藏機(jī)構(gòu)可能蘊(yùn)含文物相關(guān)的歷史故事等文化信息,具有更大的研究?jī)r(jià)值,所以對(duì)象屬性中包括地點(diǎn)與文化的關(guān)系。同時(shí),考慮到可移動(dòng)文物移動(dòng)時(shí)會(huì)跨越多個(gè)地區(qū),本文將不同行政區(qū)之間的隸屬關(guān)系設(shè)置為5類對(duì)象屬性進(jìn)行標(biāo)注。關(guān)于地點(diǎn)的數(shù)據(jù)屬性主要指收藏機(jī)構(gòu)的全稱、地址和性質(zhì)等。

      3)時(shí)間類

      時(shí)間類(TimeSpan)指關(guān)于可移動(dòng)文物的抽象年代時(shí)間以及目前具體時(shí)間,其包括兩個(gè)子類,分別是代表文物年代的抽象時(shí)間類(TimeAbstract)和代表現(xiàn)在時(shí)間的具體時(shí)間類(TimeSpecific)。

      4)文化類

      文化類(Culture)是可移動(dòng)文物抽象文化涵義的展示,其內(nèi)容以數(shù)據(jù)屬性來表示,包含歷史文化故事、文物表面特征信息以及文物象征意義等。實(shí)體是可移動(dòng)文物文化涵義的創(chuàng)造者;資源是可移動(dòng)文物文化涵義的承載者;地點(diǎn)是可移動(dòng)文物文化涵義的產(chǎn)生者,因此文化與實(shí)體、資源和地點(diǎn)都具有對(duì)象屬性關(guān)聯(lián)關(guān)系。

      5)資源類

      資源類(Resource)是指可移動(dòng)文物相關(guān)知識(shí)的展示資源類型,多源數(shù)據(jù)融合的可移動(dòng)文物本體構(gòu)建除了有文物本身攜帶的物理信息外,還有文物知識(shí)呈現(xiàn)的形式化信息,多載體的資源內(nèi)容被歸于數(shù)據(jù)屬性中,包括視頻、圖片、文本類和專家述評(píng)等。可移動(dòng)文物所蘊(yùn)含的抽象文化含義展出類型同樣以文本和多媒體資源類型展出,因此資源和文化也具有對(duì)象屬性關(guān)系。類間的對(duì)象屬性與類的數(shù)據(jù)屬性在可移動(dòng)文物領(lǐng)域概念知識(shí)范圍中豐富了其在關(guān)系和特征方面的具體描述,具體的數(shù)據(jù)屬性含義和值域如表4所示。

      最終,本文構(gòu)建的可移動(dòng)文物知識(shí)本體模型共包含了5個(gè)核心類、4個(gè)子類、18個(gè)對(duì)象屬性和22個(gè)數(shù)據(jù)屬性,利用本體開發(fā)工具Protégé對(duì)本體模型進(jìn)行繪制如圖1所示,其中,實(shí)線代表子類,虛線代表對(duì)象屬性,數(shù)據(jù)屬性省略未列出。

      2.2 可移動(dòng)文物知識(shí)本體模型實(shí)例可視化

      基于已構(gòu)建的可移動(dòng)文物知識(shí)本體模型,將相關(guān)文物知識(shí)信息導(dǎo)入本體開發(fā)工具Protégé中,實(shí)現(xiàn)可移動(dòng)文物知識(shí)本體模型實(shí)例化展示,驗(yàn)證該模型的可行性和可用性。本文以湖北省博物館四大鎮(zhèn)館之寶——“越王勾踐劍”“鄖縣人頭骨化石”“元青花四愛圖梅瓶”和“曾侯乙編鐘”為例,創(chuàng)建可移動(dòng)文物實(shí)例庫(kù),具體實(shí)例內(nèi)容包括文物實(shí)體信息、地理位置信息、時(shí)間信息、文化信息以及資源信息等,相關(guān)屬性信息描述參照表1文物領(lǐng)域重要概念術(shù)語(yǔ)表。

      首先將文物實(shí)體信息以Excel形式存儲(chǔ),其次將信息導(dǎo)入Protégé中,并轉(zhuǎn)換數(shù)據(jù)形式為Owl形式,最終呈現(xiàn)以湖北省博物館四大鎮(zhèn)館之寶為核心的文物實(shí)體復(fù)雜語(yǔ)義網(wǎng)絡(luò),實(shí)例圖如圖2所示。其中,圓形代表本體模型中的核心概念類,菱形代表實(shí)例信息,實(shí)線代表子類與父類的類間關(guān)系,虛線代表子類或父類與其他類間的對(duì)象屬性信息。點(diǎn)擊某個(gè)實(shí)例,則會(huì)顯示與其相關(guān)聯(lián)的數(shù)據(jù)以及對(duì)象屬性。

      3 可移動(dòng)文物的知識(shí)圖譜構(gòu)建

      本文將上一節(jié)中已構(gòu)建好的本體模型與Neo4j圖數(shù)據(jù)庫(kù)相融合,面向可移動(dòng)文物實(shí)體,構(gòu)建領(lǐng)域知識(shí)圖譜。Neo4j圖數(shù)據(jù)庫(kù)是基于Java語(yǔ)言編寫的高性能NOSQL圖形數(shù)據(jù)庫(kù),它將數(shù)據(jù)存儲(chǔ)在圖網(wǎng)絡(luò)中而不是表中。因其數(shù)據(jù)結(jié)構(gòu)的靈活性,可以應(yīng)用更加敏捷的開發(fā)模式,在數(shù)據(jù)查詢效率上明顯優(yōu)于傳統(tǒng)的關(guān)聯(lián)數(shù)據(jù)庫(kù)。本文使用的Neo4j版本為Neo4j社區(qū)版(4.1.1),依賴環(huán)境為jdk1.8.241,采用Neo4j圖數(shù)據(jù)庫(kù)來對(duì)RDF數(shù)據(jù)進(jìn)行存儲(chǔ),從而構(gòu)建可移動(dòng)文物的知識(shí)圖譜。

      3.1 數(shù)據(jù)映射與知識(shí)存儲(chǔ)

      由于構(gòu)建規(guī)則和實(shí)用工具的不同,本體模型中的知識(shí)表現(xiàn)形式與知識(shí)圖譜中的知識(shí)表現(xiàn)形式具有一定的差異性,因此,需要把已構(gòu)建好的本體模型中所蘊(yùn)涵的類、類間關(guān)系以及數(shù)據(jù)實(shí)例映射到圖數(shù)據(jù)庫(kù)中,實(shí)現(xiàn)知識(shí)圖譜中的知識(shí)存儲(chǔ)。Neo4j圖數(shù)據(jù)庫(kù)主要有標(biāo)簽(Label)、節(jié)點(diǎn)(Node)、關(guān)系(Relationship)、屬性(Property)4種元素,節(jié)點(diǎn)和關(guān)系均可以再創(chuàng)造屬性特征來描述他們本身,屬性通過鍵值對(duì)的方式而獨(dú)立存在。本文中的RDF數(shù)據(jù)主要與Neo4j中的節(jié)點(diǎn)、關(guān)系和屬性進(jìn)行一一對(duì)應(yīng)。面向文物實(shí)體,Neo4j圖數(shù)據(jù)庫(kù)中的數(shù)據(jù)映射過程主要包括以下3種類型:①節(jié)點(diǎn)映射。指本體中的實(shí)例和類相對(duì)應(yīng),如在本體模型中的文物實(shí)體、時(shí)間、地點(diǎn)等核心類在Neo4j中是實(shí)例,而這些具體的實(shí)例即可作為Neo4j中的節(jié)點(diǎn);②關(guān)系映射。指關(guān)系與本體中的對(duì)象屬性相對(duì)應(yīng),對(duì)象屬性的本質(zhì)是將類與類或子類之間的關(guān)系抽象表示為屬性,其作為關(guān)系的表示形式與Neo4j中的關(guān)系相互映射,如本文中實(shí)體與時(shí)間、實(shí)體與地點(diǎn)等類間關(guān)系映射入圖數(shù)據(jù)庫(kù)中體現(xiàn)為節(jié)點(diǎn)與節(jié)點(diǎn)之間的關(guān)系;③屬性映射。指節(jié)點(diǎn)的屬性與本體中的數(shù)據(jù)屬性相對(duì)應(yīng),將用于數(shù)據(jù)特征描述的數(shù)據(jù)屬性映射為Neo4j的節(jié)點(diǎn)屬性,一方面,實(shí)現(xiàn)了RDF三元組向知識(shí)圖譜轉(zhuǎn)化的知識(shí)可視化;另一方面,避免了圖數(shù)據(jù)庫(kù)中知識(shí)存儲(chǔ)冗余問題的出現(xiàn)。

      前文通過Protégé本體工具構(gòu)建了可移動(dòng)文物的本體模型,并輸出為OWL類型文件。OWL是用來描述由三元組組成的RDF數(shù)據(jù)即〈主語(yǔ),謂語(yǔ),賓語(yǔ)〉結(jié)構(gòu)的網(wǎng)絡(luò)本體語(yǔ)言,而RDF本身就包含了基本的語(yǔ)義網(wǎng)結(jié)構(gòu),其為知識(shí)圖譜的構(gòu)建提供了良好的數(shù)據(jù)結(jié)構(gòu),因此可以通過Neo4j對(duì)可移動(dòng)文物的本體模型進(jìn)行知識(shí)存儲(chǔ)。Neo4j本身不支持直接導(dǎo)入OWL類型的數(shù)據(jù),需要通過RDF2RDF插件[13]先將OWL類型的文件轉(zhuǎn)換為RDF類型的文件,再使用Neosemantics插件[14]即可實(shí)現(xiàn)RDF數(shù)據(jù)向Neo4j圖數(shù)據(jù)庫(kù)的導(dǎo)入。導(dǎo)入之后可以對(duì)標(biāo)簽下各個(gè)節(jié)點(diǎn)的顏色和大小進(jìn)行進(jìn)一步的調(diào)整,進(jìn)而完成對(duì)可移動(dòng)文物的知識(shí)圖譜構(gòu)建。Neo4j對(duì)實(shí)體節(jié)點(diǎn)及其相互之間的關(guān)系進(jìn)行可視化展示的同時(shí),也可以在表面未知節(jié)點(diǎn)間通過查詢最短路徑的方式來對(duì)節(jié)點(diǎn)間的隱藏關(guān)系進(jìn)行挖掘,從而為節(jié)點(diǎn)間關(guān)系的知識(shí)推理做鋪墊。

      3.2 知識(shí)推理與結(jié)果展示

      Neo4j圖數(shù)據(jù)庫(kù)與傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)一樣提供了增(CREATE)、刪(DELETE)、改(SET)、查(MATCH)等操作,在完成數(shù)據(jù)映射和知識(shí)存儲(chǔ)之后,圖數(shù)據(jù)庫(kù)可通過Cypher語(yǔ)言中的CREATE語(yǔ)句創(chuàng)建圖結(jié)構(gòu),便捷地實(shí)現(xiàn)文物實(shí)體、挖掘地點(diǎn)、館藏機(jī)構(gòu)、挖掘時(shí)間等不同的實(shí)體及其關(guān)系的檢索、遍歷、查詢等功能。Neo4j中不同的顏色代表不同類型的實(shí)體,節(jié)點(diǎn)之間的邊則代表了實(shí)體直接存在的相關(guān)關(guān)系,如連接文物實(shí)體與館藏機(jī)構(gòu)之間的有向邊,表示文物與館藏機(jī)構(gòu)之間存在收藏與被收藏的關(guān)系。在本文實(shí)際應(yīng)用中,查詢館藏機(jī)構(gòu)為“湖北省博物館”相關(guān)的文物內(nèi)容過程大致為:通過Cypher語(yǔ)句查詢后,得到與湖北省博物館有關(guān)的所有館藏可移動(dòng)文物,此時(shí)不僅得到了與其路徑為1的相關(guān)實(shí)體信息,還可以進(jìn)一步展示這些實(shí)體的所有屬性特征,如圖3所示(為使圖的美感與整潔,此處僅顯示湖北省博物館四大“鎮(zhèn)館之寶”的主要關(guān)聯(lián)信息),其中黃色顯示了檢索結(jié)果中的館藏機(jī)構(gòu)為湖北省博物館,藍(lán)色為與其路徑為1的各個(gè)實(shí)體,包括“越王勾踐劍”“元青花四愛圖梅瓶”“曾侯乙編鐘”“鄖縣人頭骨化石”,且能清晰地看到各個(gè)實(shí)體的相關(guān)屬性特征。以“越王勾踐劍”為例,可以看出其出土位置為“湖北江陵望山一號(hào)楚墓”,出土?xí)r間為“1965年12月”,所屬年代為“春秋時(shí)代”,文化故事為“臥薪嘗膽”。

      通過使用Protégé構(gòu)建可移動(dòng)文物的知識(shí)本體,并結(jié)合Neo4j來實(shí)現(xiàn)本體模型到知識(shí)圖譜的轉(zhuǎn)換,突破了傳統(tǒng)模式如元數(shù)據(jù)模型、本體模型等對(duì)文物信息資源在描述、存儲(chǔ)及推理上的種種局限。面向文物本體,從“發(fā)掘時(shí)間”“發(fā)掘地點(diǎn)”“館藏機(jī)構(gòu)”“材質(zhì)”“文化”等多角度、多維度進(jìn)行探討和分析,利用了Neo4j架構(gòu)靈活、擴(kuò)展性好、可靠性強(qiáng)及內(nèi)置Web應(yīng)用程序等優(yōu)勢(shì),采用Cypher編程語(yǔ)言高效精準(zhǔn)的對(duì)相關(guān)數(shù)據(jù)進(jìn)行檢索、推理、發(fā)現(xiàn),避免了當(dāng)前關(guān)系型數(shù)據(jù)庫(kù)在面對(duì)此類數(shù)據(jù)難以存儲(chǔ)和檢索的困難,且圖譜可視化效果和檢索效率比單純利用Protégé的效果要更好,故構(gòu)建可移動(dòng)文物的知識(shí)圖譜在應(yīng)用層面具有重要意義。

      4 可移動(dòng)文物關(guān)聯(lián)數(shù)據(jù)的存儲(chǔ)與發(fā)布

      關(guān)聯(lián)數(shù)據(jù)作為資源描述和組織的最終表現(xiàn)形式,被用來發(fā)布和連接各類數(shù)據(jù)信息和知識(shí),為其在語(yǔ)義挖掘和語(yǔ)義互操作等方面提供良好的應(yīng)用?;谇拔囊褬?gòu)建的可移動(dòng)文物本體模型,使用關(guān)聯(lián)數(shù)據(jù)技術(shù)可以將文物知識(shí)資源在類層面和數(shù)據(jù)層面上實(shí)現(xiàn)文物實(shí)體間的關(guān)系鏈接,從而使可移動(dòng)文物領(lǐng)域形成一個(gè)有序組織且相互聯(lián)系的有機(jī)整體。本節(jié)將從實(shí)踐層面利用可移動(dòng)文物的本體模型和知識(shí)圖譜進(jìn)行語(yǔ)義網(wǎng)絡(luò)上的知識(shí)存儲(chǔ)與發(fā)布。

      4.1 可移動(dòng)文物關(guān)聯(lián)數(shù)據(jù)的存儲(chǔ)

      本體構(gòu)建工具Protégé存儲(chǔ)的格式為OWL格式,但是這種存儲(chǔ)格式在后期進(jìn)行修改及關(guān)系定義方面較難,故本文采用關(guān)系型數(shù)據(jù)庫(kù)Mysql來對(duì)可移動(dòng)文物信息資源進(jìn)行存儲(chǔ)和管理,使用Mysql數(shù)據(jù)庫(kù)版本為MySQL 5.7.17 Community Server,同時(shí)利用第三方工具SQLyog對(duì)數(shù)據(jù)表進(jìn)行更加方便的操作。本文創(chuàng)建了名為Culture_Relic的數(shù)據(jù)庫(kù),以可移動(dòng)文物的核心類作為表的類別,共構(gòu)建了5個(gè)表即實(shí)體表、時(shí)間表、地點(diǎn)表、文化表和資源表。以實(shí)體表(Entity)為例,包含可移動(dòng)文物的編號(hào)、名稱、類別、級(jí)別、造型、用途、質(zhì)地、文物來源、完殘程度、尺寸、重量、簡(jiǎn)介等屬性字段,構(gòu)建實(shí)體表結(jié)構(gòu)如表5所示。

      創(chuàng)建的二維表除了包含數(shù)據(jù)屬性信息,同時(shí)包含核心類中的屬性字段在數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)類型、字段長(zhǎng)度以及區(qū)分其是否為主鍵或外鍵,如表5所示的實(shí)體表,文物實(shí)體的普查登記號(hào)作為實(shí)體二維表的主鍵,被用于標(biāo)識(shí)該二維表存儲(chǔ)的實(shí)例信息。除此之外,數(shù)據(jù)表的存儲(chǔ)模式采用的是多元模式,通過創(chuàng)建外鍵來關(guān)聯(lián)其他物理表。由此,就形成了表與表之間的鏈接操作。

      4.2 可移動(dòng)文物關(guān)聯(lián)數(shù)據(jù)的發(fā)布

      D2RQ是目前較為常用的RDF映射平臺(tái),其通過虛擬RDF圖來訪問關(guān)系數(shù)據(jù)庫(kù)系統(tǒng),而無(wú)需復(fù)制成RDF存儲(chǔ)[15]。D2RQ的工作流程大致為首先采用Generate-mapping工具來為Culture_Relic數(shù)據(jù)庫(kù)創(chuàng)建映射文件,生成了Culture_Relic.ttl映射文件。其次,在命令行中啟動(dòng)d2r-server服務(wù)器,執(zhí)行d2r-server Culture_Relic.n3命令,完成對(duì)可移動(dòng)文物的關(guān)聯(lián)數(shù)據(jù)創(chuàng)建與發(fā)布。最后,打開瀏覽器輸入Localhost:2020即可在瀏覽器端進(jìn)行訪問,最終的可移動(dòng)文物的關(guān)聯(lián)數(shù)據(jù)發(fā)布平臺(tái)主頁(yè)如圖4所示,頂端為導(dǎo)航欄,顯示內(nèi)容為之前在MySQL數(shù)據(jù)庫(kù)中創(chuàng)建的5個(gè)表,下方的提示信息表明可以通過網(wǎng)絡(luò)瀏覽器即HTML頁(yè)面和語(yǔ)義網(wǎng)瀏覽器即RDF頁(yè)面查看該表包含的具體信息,底部為SPARQL的查詢接口,除了瀏覽器查詢外,該平臺(tái)同時(shí)提供可供專業(yè)人士操作的SPARQL查詢接口進(jìn)行操作。

      用戶在實(shí)體表(Entity)頁(yè)面上,任意選擇一項(xiàng)可移動(dòng)文物,即可進(jìn)入相應(yīng)的詳情頁(yè)面。在該頁(yè)面可清晰查看該實(shí)體的數(shù)據(jù)屬性特征及相關(guān)信息。以“越王勾踐劍”為例,包含了“名稱”“完殘程度”“普查登記號(hào)”等數(shù)據(jù)屬性信息,如圖5所示。

      根據(jù)物理表和本體的創(chuàng)建規(guī)則,不同屬性的值由其內(nèi)容所決定,如“名稱”“完殘程度”“尺寸”“文物來源”等字段的值以字符串形式呈現(xiàn),而“地址”“文化”“時(shí)間”等字段以URI地址形式呈現(xiàn),體現(xiàn)出關(guān)聯(lián)數(shù)據(jù)相互鏈接的特性,點(diǎn)擊該鏈接,則頁(yè)面會(huì)繼續(xù)跳轉(zhuǎn)至與該鏈接包含內(nèi)容相關(guān)的其他實(shí)體信息頁(yè)面。二維表之間通過鏈接相互串聯(lián),從而實(shí)現(xiàn)數(shù)據(jù)之間的互聯(lián),如對(duì)查詢到的地址(Location)信息直接點(diǎn)擊,結(jié)果如圖6所示。通過將數(shù)據(jù)進(jìn)行可視化的關(guān)聯(lián)可以得到比在數(shù)據(jù)庫(kù)中瀏覽更好的檢索效果。

      5 結(jié) 語(yǔ)

      本文通過對(duì)本體的概念進(jìn)行分析后,結(jié)合已有的本體標(biāo)準(zhǔn),以湖北省博物館為例,構(gòu)建了可移動(dòng)文物的知識(shí)本體模型,并用Protégé軟件完成了模型的實(shí)例創(chuàng)建。之后將本體導(dǎo)入到Neo4j圖數(shù)據(jù)庫(kù)中完成知識(shí)圖譜的構(gòu)建,以便提供更好的存儲(chǔ)、展示及推理效果。最后基于文物知識(shí)本體及知識(shí)圖譜,使用關(guān)系型數(shù)據(jù)庫(kù)MySQL創(chuàng)建表存儲(chǔ)相應(yīng)的數(shù)據(jù)信息,同時(shí)借助D2RQ平臺(tái)來實(shí)現(xiàn)關(guān)聯(lián)數(shù)據(jù)的存儲(chǔ)和發(fā)布。本研究的相關(guān)內(nèi)容為相似領(lǐng)域的研究提供了借鑒思想,在未來的研究中會(huì)進(jìn)一步拓展研究領(lǐng)域,構(gòu)建出大型的文物信息資源知識(shí)本體并進(jìn)行知識(shí)圖譜的展示和關(guān)聯(lián)數(shù)據(jù)的發(fā)布,進(jìn)而增強(qiáng)文物信息資源的傳承與共享。

      參考文獻(xiàn)

      [1]Jin W,Wang Z,Zhang D,et al.Combining Knowledge with Deep Convolutional Neural Networks for Short Text Classification[C]//Twenty-Sixth International Joint Conference on Artificial Intelligence,2017.

      [2]Peng C,Thinh V D,Jung J J.Knowledge Graph-based Metaphor Representation for Literature Understanding[J].Digital Scholarship in the Humanities,2021.

      [3]丁雅琴.基于知識(shí)圖譜的醫(yī)療問答系統(tǒng)研究與開發(fā)[D].武漢:華中師范大學(xué),2020.

      [4]張淼.基于中文知識(shí)圖譜的智能問答系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].武漢:華中師范大學(xué),2018.

      [5]吳瓊,鮑泓.基于地理本體的不可移動(dòng)文物信息參考模型研究及應(yīng)用[J].計(jì)算機(jī)科學(xué),2008,(3):113-116,212.

      [6]Yang W,Dong Y.Exploration and Implementation of Ontology-based Cultural Relic Knowledge Map Integration Platform[C]//AIP Conference Proceedings.AIP Publishing LLC,2018,1967(1):020018.

      [7]劉煒.關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望[J].大學(xué)圖書館學(xué)報(bào),2011,29(2):5-12.

      [8]林海青,樓向英,夏翠娟.圖書館關(guān)聯(lián)數(shù)據(jù):機(jī)會(huì)與挑戰(zhàn)[J].中國(guó)圖書館學(xué)報(bào),2012,38(1):58-67,112.

      [9]陳氫,劉文梅.基于關(guān)聯(lián)數(shù)據(jù)的企業(yè)數(shù)據(jù)治理可視化框架研究[J].現(xiàn)代情報(bào),2021,41(6):76-87,107.

      [10]Mouzakitis S,Papaspyros D,Petychakis M,et al.Challenges and Opportunities in Renovating Public Sector Information By Enabling Linked Data and Analytics[J].Information Systems Frontiers,2017,19(2):321-336.

      [11]朱學(xué)芳,王若宸.非遺圖像語(yǔ)義信息本體構(gòu)建及其關(guān)聯(lián)數(shù)據(jù)存儲(chǔ)和發(fā)布研究[J].現(xiàn)代情報(bào),2021,41(6):54-63.

      [12]何春雨,滕春娥.非物質(zhì)文化遺產(chǎn)知識(shí)本體構(gòu)建——以赫哲族非遺資源為例[J].情報(bào)科學(xué),2021,39(4):140-147,156.

      [13]rdf-rdf[EB/OL].http://www.l3s.de/~minack/rdf2rdf/,2021-07-12.

      [14]Neosemantics[EB/OL].https://github.com/neo4j-labs/neosemantics,2021-07-12.

      [15]D2RQ-Accessing Relational Databases as Virtual RDF Graphs[EB/OL].http://d2rq.org/,2021-07-12.

      (責(zé)任編輯:郭沫含)

      猜你喜歡
      知識(shí)圖譜
      國(guó)內(nèi)外智庫(kù)研究態(tài)勢(shì)知識(shí)圖譜對(duì)比分析
      國(guó)內(nèi)信息素養(yǎng)研究的知識(shí)圖譜分析
      國(guó)內(nèi)圖書館嵌入式服務(wù)研究主題分析
      國(guó)內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢(shì)
      近十五年我國(guó)小學(xué)英語(yǔ)教學(xué)研究的熱點(diǎn)、問題及對(duì)策
      基于知識(shí)圖譜的產(chǎn)業(yè)集群創(chuàng)新績(jī)效可視化分析
      基于知識(shí)圖譜的智慧教育研究熱點(diǎn)與趨勢(shì)分析
      國(guó)內(nèi)酒店品牌管理研究進(jìn)展的可視化分析
      從《ET&S》與《電化教育研究》對(duì)比分析中管窺教育技術(shù)發(fā)展
      專家知識(shí)圖譜構(gòu)建研究
      芒康县| 南开区| 铜川市| 华容县| 饶阳县| 简阳市| 云霄县| 丹东市| 东阿县| 金乡县| 陕西省| 石门县| 富源县| 高平市| 抚州市| 通江县| 江源县| 厦门市| 遂溪县| 萍乡市| 成武县| 克拉玛依市| 咸阳市| 亳州市| 鹰潭市| 宁强县| 油尖旺区| 托克逊县| 商洛市| 扎囊县| 时尚| 庄浪县| 凤山县| 阜阳市| 静乐县| 达日县| 大足县| 临安市| 峨山| 泸州市| 义乌市|