• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于關(guān)聯(lián)數(shù)據(jù)的LAM館藏資源整合

    2022-09-24 14:32:12賈君枝
    晉圖學(xué)刊 2022年3期
    關(guān)鍵詞:數(shù)據(jù)模型資源整合館藏

    賈君枝

    (中國人民大學(xué) 信息資源管理學(xué)院,北京 100872)

    0 導(dǎo)言

    現(xiàn)代公共文化服務(wù)體系的形成很大程度上依賴于公共文化數(shù)字化資源整體建設(shè)水平。各個公共文化機(jī)構(gòu)以“孤島”方式建設(shè)公共數(shù)字文化資源的模式已經(jīng)很難滿足公眾對數(shù)字文化資源的需求[1]。單個文化機(jī)構(gòu)資源數(shù)量畢竟有限,圖書館、檔案館、博物館(LAM)等文化機(jī)構(gòu)館藏資源有機(jī)地整合,將會有效地提升資源加工、組織及利用效率,通過文化機(jī)構(gòu)資源合作共建帶動公共文化數(shù)字化服務(wù)能力提升。從當(dāng)前國內(nèi)LAM機(jī)構(gòu)資源整合實踐看,更多是通過統(tǒng)一平臺將各成員機(jī)構(gòu)的資源統(tǒng)一展示,各機(jī)構(gòu)之間資源并沒有有機(jī)地集成,缺乏明確的資源統(tǒng)籌協(xié)調(diào)機(jī)制、缺乏資源深度整合的成熟模式及方法,從而制約了我國公共文化數(shù)字資源的大范圍共享及利用,信息服務(wù)效率較為低下。隨著中國數(shù)字化戰(zhàn)略的發(fā)展,公共文化資源數(shù)字化步伐的加快,圖書館、檔案館、博物館所積聚的大量結(jié)構(gòu)化數(shù)據(jù),不僅面臨著深層次加工與開發(fā)利用的現(xiàn)實問題,而且作為高價值的結(jié)構(gòu)化數(shù)據(jù)集合,以共享開放方式可以更廣泛地服務(wù)于其他領(lǐng)域,帶動社會全面創(chuàng)新與進(jìn)步。

    關(guān)聯(lián)數(shù)據(jù)等語義網(wǎng)技術(shù)的迅速發(fā)展,旨在運(yùn)用開放互聯(lián)方式有機(jī)地實現(xiàn)資源之間的連接,有效地減少資源管理分散和重復(fù)建設(shè)等問題,能夠跨越機(jī)構(gòu)之間界限及數(shù)據(jù)異構(gòu)性,提高各個機(jī)構(gòu)之間資源互操作效率。將關(guān)聯(lián)數(shù)據(jù)技術(shù)運(yùn)用到LAM館藏資源整合中,運(yùn)用數(shù)據(jù)模型將不同機(jī)構(gòu)的資源整合在統(tǒng)一語義框架中,采用資源描述框架表示描述對象之間的關(guān)系,將LAM館藏資源表示成一個語義明確的數(shù)據(jù)網(wǎng)絡(luò),不僅方便普通用戶更準(zhǔn)確、全面地獲取信息,而且有助于機(jī)器對數(shù)據(jù)做進(jìn)一步處理,服務(wù)于問答、數(shù)據(jù)挖掘、知識發(fā)現(xiàn)等多種應(yīng)用場景,提升數(shù)字文化資源利用水平。本文旨在客觀分析國內(nèi)LAM館藏資源難度,明確關(guān)聯(lián)數(shù)據(jù)優(yōu)勢的基礎(chǔ)上,提出基于關(guān)聯(lián)數(shù)據(jù)的LAM館藏資源整合實現(xiàn)的流程及其推動措施,以幫助國內(nèi)LAM機(jī)構(gòu)提高館藏資源整合效率,提升資源開發(fā)利用能力。

    1 LAM館藏資源整合難度分析

    LAM館藏資源整合是將不同機(jī)構(gòu)的異構(gòu)資源以統(tǒng)一的元數(shù)據(jù)形式表示而形成的有序化資源集合,其很大程度上依賴于各個整合機(jī)構(gòu)館藏資源的數(shù)字化水平。數(shù)據(jù)標(biāo)準(zhǔn)化、開放性程度越高,越有益于整合。館藏資源的整合不是簡單地將分布在不同機(jī)構(gòu)的資源通過統(tǒng)一呈現(xiàn)的方式提供給用戶,不單純是資源聚集和淺層關(guān)聯(lián)[2],應(yīng)是館藏資源內(nèi)容層面的語義整合,需要將彼此間的資源進(jìn)行合并、聚類及構(gòu)建語義關(guān)聯(lián),以滿足用戶不同層面的服務(wù)需求。就當(dāng)前LAM館藏資源整合水平看,存在著整合過程各種格式混雜、數(shù)據(jù)內(nèi)容丟失、集成程度不高等問題,而這些問題的產(chǎn)生源于一定程度上存在著的整合難度,主要體現(xiàn)在館藏資源數(shù)字化程度、元數(shù)據(jù)標(biāo)準(zhǔn)及其描述顆粒度等方面。

    1.1 LAM館藏資源數(shù)字化建設(shè)水平不一

    我國圖書館、檔案館、博物館隸屬于不同的上級機(jī)構(gòu),其數(shù)字化發(fā)展水平差別較大。20世紀(jì)90年代因特網(wǎng)迅速發(fā)展推動了各個領(lǐng)域數(shù)字化建設(shè)。數(shù)字圖書館出現(xiàn)帶動了館藏資源的全面數(shù)字化,機(jī)讀目錄(MARC)已成為各大圖書館采用的共同標(biāo)準(zhǔn),為圖書館內(nèi)部實現(xiàn)資源共享及數(shù)字資源標(biāo)準(zhǔn)化提供了便利。相比其他領(lǐng)域,圖書館館藏數(shù)據(jù)標(biāo)準(zhǔn)化程度較高,但由于MARC數(shù)據(jù)格式復(fù)雜,不易于外部數(shù)據(jù)進(jìn)行交換,具有封閉性特點,導(dǎo)致圖書館館藏資源開放度不高。檔案館館藏數(shù)字化始于2000年后,檔案資源對象多樣,立檔單位類型不一,其數(shù)字化發(fā)展水平不均衡,2010年國家檔案局發(fā)布了《數(shù)字檔案館建設(shè)指南》,為數(shù)字檔案館建設(shè)提供了標(biāo)準(zhǔn)規(guī)范和建設(shè)依據(jù)[3],旨在提升公共檔案服務(wù)能力及資源共享能力。檔案館館藏數(shù)字化進(jìn)一步得到發(fā)展,相對而言,檔案館資源對外開放度不高,多限于機(jī)構(gòu)內(nèi)部用戶使用,影響了其進(jìn)一步開發(fā)利用的能力。博物館數(shù)字化建設(shè)約在20世紀(jì)90年代末,隨著文化資源交流與共享需求提升,各大博物館著手于自身藏品的建設(shè),數(shù)字博物館開始出現(xiàn),2001年財政部、國家文物局聯(lián)合開展了“文物調(diào)查及數(shù)據(jù)庫管理系統(tǒng)建設(shè)項目”及其2012年國務(wù)院印發(fā)《關(guān)于開展第一次全國可移動文物普查的通知》促進(jìn)了藏品的科學(xué)管理和有效利用[4]。并隨著國際各種描述博物館藏品標(biāo)準(zhǔn)的出現(xiàn),博物館館藏的數(shù)字化質(zhì)量水平不斷提升,數(shù)字化資源服務(wù)能力逐步增強(qiáng),對外資源的開放度相對較高。

    1.2 LAM館藏資源元數(shù)據(jù)標(biāo)準(zhǔn)不一

    由于各機(jī)構(gòu)擁有的資源類型差異,元數(shù)據(jù)標(biāo)準(zhǔn)不一樣。圖書館以圖書、期刊等資源為主,統(tǒng)一采用CNMARC數(shù)據(jù)描述,為圖書館內(nèi)部之間的數(shù)據(jù)交流提供了便利,但與圖書館以外的機(jī)構(gòu)數(shù)據(jù)交流存在一定的困難。檔案館以為文書、照片、書信、聲像等為主,除遵循《檔案著錄規(guī)則(總則)》(ISAD/G)、《檔案著錄規(guī)則》(DA T18-1999)之外,由于所包含的資源對象差異性較大,需針對性采用不同的元數(shù)據(jù)標(biāo)準(zhǔn),如《照片檔案管理規(guī)范》(GB11821-2002)、《文書類電子文件元數(shù)據(jù)方案》(DA/T 46-2009)等,形成了多樣化檔案資源描述標(biāo)準(zhǔn)。博物館資源以藏品為主,涉及手稿、繪畫、雕塑、裝飾、標(biāo)本及照片等,除了遵循國家文物局2001年制定了《博物館藏品信息指標(biāo)體系規(guī)范(試行)》外,各個博物館針對不同資源,結(jié)合藝術(shù)品描述類目(CDWA)、視覺資源協(xié)會核心類目(VRA Core)、國際文獻(xiàn)工作委員會概念參考模型(CIDOC CRM)等多個適用于博物館藏品描述的國際標(biāo)準(zhǔn)[5],定義了自己的元數(shù)據(jù)標(biāo)準(zhǔn)。由于LAM機(jī)構(gòu)之間元數(shù)據(jù)結(jié)構(gòu)及其格式差異較大,為互操作帶來了一定困難[6]。可以看出,LAM館藏資源所使用的元數(shù)據(jù)標(biāo)準(zhǔn)很大程度上依賴于資源所屬類型,隨著元數(shù)據(jù)標(biāo)準(zhǔn)發(fā)展的專業(yè)化趨勢,各個機(jī)構(gòu)所使用的元數(shù)據(jù)類型不斷增多,從而為資源整合帶來了一定復(fù)雜度。

    1.3 資源描述的顆粒度大小不一

    圖書館長期以揭示單件為主,以書目記錄方式描述一本圖書的題名、作者、出版社、主題等基本信息。檔案館以揭示館藏為核心,記錄了案卷的題名、密級、數(shù)量及單位信息,并輔之以文件的題名、責(zé)任者、編號、保管期限等基本信息,形成館藏目錄數(shù)據(jù)庫。博物館以揭示藏品為主,記錄了藏品的名稱、類別、質(zhì)地、功用、形態(tài)等信息。不同機(jī)構(gòu)描述的顆粒度大小不一且描述信息側(cè)重點不同,圖書館、博物館以揭示單件資源為主,檔案館以揭示館藏為主,比如人物檔案更多地揭示人物整體信息,而對其所收藏的相關(guān)照片、信件及日記等單件描述少[7]。各機(jī)構(gòu)資源描述中,缺乏細(xì)粒度描述,多以基本元素為主,沒有明確地表示各類資源之間關(guān)系類型,描述深度不夠,這些差異性及其線性描述方式從而影響了資源整合的效果。

    2 關(guān)聯(lián)數(shù)據(jù)在LAM館藏數(shù)據(jù)整合中的優(yōu)勢

    長期以來LAM館藏資源的整合主要采用基于元數(shù)據(jù)映射的互操作模式,將不同機(jī)構(gòu)的元數(shù)據(jù)映射到統(tǒng)一到元數(shù)據(jù)標(biāo)準(zhǔn),完成不同格式的數(shù)據(jù)轉(zhuǎn)換。映射作為互操作的重要方法,通過將一種格式表示的數(shù)據(jù)轉(zhuǎn)換成另一種格式表示的數(shù)據(jù)而實現(xiàn)不同數(shù)據(jù)的合并,建立不同元數(shù)據(jù)標(biāo)準(zhǔn)之間的對照表是核心步驟,但由于不同標(biāo)準(zhǔn)差異性大,并不能建立一一對應(yīng)關(guān)系,存在著有些元素找不到對應(yīng),多個元素對應(yīng)一個元素,不能完全匹配等多種情況,導(dǎo)致部分語義內(nèi)容丟失、整合效果不理想。

    作為語義網(wǎng)的一種典型應(yīng)用,關(guān)聯(lián)數(shù)據(jù)旨在通過建立數(shù)據(jù)之間互聯(lián)實現(xiàn)數(shù)據(jù)的發(fā)布、消費(fèi)及再利用。依賴于資源描述框架(RDF)模型,不僅方便地刻畫出所描述資源對象的特征,而且以謂詞方式連接不同的資源對象,將異構(gòu)資源整合到一個數(shù)據(jù)網(wǎng)絡(luò)中,使分散在不同機(jī)構(gòu)、不同系統(tǒng)的數(shù)據(jù)高效率地整合在一起。因此將關(guān)聯(lián)數(shù)據(jù)運(yùn)用到LAM館藏資源整合中,能夠在一定程度上避免元數(shù)據(jù)映射帶來的數(shù)據(jù)丟失情況,提高整合質(zhì)量。通過數(shù)據(jù)模型將不同機(jī)構(gòu)的元數(shù)據(jù)模式集成在統(tǒng)一語義框架中,所構(gòu)建的類與類、屬性與屬性間關(guān)系,充分揭示出不同元素之間的各種對應(yīng)關(guān)系,突破原有元數(shù)據(jù)映射的單個語義關(guān)系(以等同映射為主),從而較好地實現(xiàn)不同元數(shù)據(jù)標(biāo)準(zhǔn)之間的重用及共享,一定程度上提高了數(shù)據(jù)互操作效率。除了整合LAM機(jī)構(gòu)的內(nèi)部資源,還可以建立與外部資源之間的廣泛鏈接,豐富擴(kuò)展了LAM館藏機(jī)構(gòu)以外的數(shù)據(jù),使整合范圍進(jìn)一步擴(kuò)大。整合后的數(shù)據(jù)采用開放互聯(lián)方式進(jìn)行發(fā)布,為后期的數(shù)據(jù)開發(fā)再利用提供了高價值的RDF數(shù)據(jù)集?;陂_放關(guān)聯(lián)數(shù)據(jù)的圖書館、檔案館、博物館數(shù)字資源整合模式成為近年來LAM合作領(lǐng)域研究的焦點。為推動關(guān)聯(lián)數(shù)據(jù)在LAM館藏整合的廣泛使用,從2011年開始,連續(xù)召開四界的國際圖書館、檔案館、博物館關(guān)聯(lián)開放數(shù)據(jù)峰會(The International Linked Open Data in Libraries, Archives & Museums Summit, LOD-LAM),旨在促進(jìn)關(guān)聯(lián)開放數(shù)據(jù)在LAM整合方面的研究和應(yīng)用[8]。歐洲數(shù)字圖書館(Europeana)作為關(guān)聯(lián)數(shù)據(jù)整合的典型,克服成員館不同元數(shù)據(jù)標(biāo)準(zhǔn)的差異性,實現(xiàn)了以EDM數(shù)據(jù)模型為核心的資源整合,包含5 800萬數(shù)字對象,與外部資源Dbpedia、GeoNames、GEMET建立鏈接,推動了歐洲文化遺產(chǎn)資源大范圍傳播與共享。其部分?jǐn)?shù)據(jù)集已成為關(guān)聯(lián)開放數(shù)據(jù)云圖(LOD)中的重要構(gòu)成[9]?;谒峁┑腁PI接口,Europeana及其合作機(jī)構(gòu)設(shè)計開發(fā)了功能多樣的APP程序達(dá)到158個,為需求方的系統(tǒng)開發(fā)和服務(wù)創(chuàng)新提供孵化環(huán)境[10],LAM資源整合的社會影響力得到進(jìn)一步提升。

    3 基于關(guān)聯(lián)數(shù)據(jù)的LAM館藏資源整合實現(xiàn)

    將來自成員館元數(shù)據(jù)收割完成后,可以依據(jù)關(guān)聯(lián)數(shù)據(jù)實現(xiàn)步驟將LAM資源整合劃分為定義數(shù)據(jù)模型、建立數(shù)據(jù)模型與元數(shù)據(jù)模式的映射、轉(zhuǎn)換元數(shù)據(jù)記錄、與外部資源建立鏈接、發(fā)布數(shù)據(jù)五大步驟,如圖1所示。

    Fig.1 Integration steps of LAM collection resources based on linked data圖1 基于關(guān)聯(lián)數(shù)據(jù)的LAM館藏資源整合步驟

    3.1 定義數(shù)據(jù)模型

    數(shù)據(jù)模型用來描述LAM整體館藏資源的類、屬性及關(guān)系,采用統(tǒng)一顆粒度方式定義了資源描述的基本結(jié)構(gòu),發(fā)揮著頂層本體的作用。其不僅能揭示館藏內(nèi)外部特征,還能表示不同資源實體間的關(guān)系,以實現(xiàn)跨機(jī)構(gòu)不同資源的聚類。數(shù)據(jù)模型確定需遵循以下原則。

    基于實體分析構(gòu)建。圖書館、檔案館、博物館的資源是關(guān)于實物、人、事件等信息,每一條館藏記錄可能涉及了多個實體信息,抽取能夠反映所整合資源特征的最小描述單元-實體來重新拆分、組合原有的館藏記錄。應(yīng)用實體分析方法,從當(dāng)前各機(jī)構(gòu)描述的元數(shù)據(jù)層面抽取出適合的實體作為類對待,明確實體類間關(guān)系,根據(jù)類所具有的屬性特征構(gòu)建出一個類層次框架。實體作為較小的共享描述單位,符合當(dāng)前語義網(wǎng)技術(shù)發(fā)展,有助于數(shù)據(jù)的加工與再利用。其中LAM資源共有的實體有館藏(實體對象集合)、實體對象(圖書、藏品、文件等)、代理(實體相關(guān)的責(zé)任者)、時間、地點、事件、概念等。實體關(guān)系有整體與部分、等級、來源、作品、版本、主題、相關(guān)責(zé)任者等。

    類的選取及定義過程中,盡可能重用來自書目、檔案和博物館領(lǐng)域的書目記錄的功能需求(FRBR)、編碼檔案描述(EDA)、CIDOC CRM和實體數(shù)據(jù)模型(EDM)等成熟的國際化數(shù)據(jù)模型,將來自不同領(lǐng)域的類整合搭建成一個有序化概念體系,提高所構(gòu)建數(shù)據(jù)模型的數(shù)據(jù)交換能力,減少構(gòu)建成本。選取整合機(jī)構(gòu)共有的元素作為候選類或?qū)傩裕热缫恍┩ㄓ迷仡}名、創(chuàng)建者、創(chuàng)建日期、格式、類型需進(jìn)行明確定義,有助于保留整合機(jī)構(gòu)數(shù)據(jù)的語義,提高整合效率。定義的類與屬性概括程度盡可能高,能夠有效地覆蓋到所整合機(jī)構(gòu)的元數(shù)據(jù)集合。盡可能定義最小的類與屬性集合,以便于通過映射實現(xiàn)數(shù)據(jù)模型的擴(kuò)展。LAM館藏資源整合中,許多機(jī)構(gòu)以EDM為基本數(shù)據(jù)模型,使用該命名空間所定義的類及屬性,重用了FOAF、BIO、VIVO、都柏林核心元數(shù)據(jù)倡議(DCMI)等詞表,并對其進(jìn)行擴(kuò)展,定義了自己的命名空間,共同作用形成一個可以表述LAM館藏資源特征的數(shù)據(jù)模型[11]。

    3.2 建立數(shù)據(jù)模型與各元數(shù)據(jù)標(biāo)準(zhǔn)映射

    LAM成員館的館藏元數(shù)據(jù)標(biāo)準(zhǔn)作為來源數(shù)據(jù),建立與數(shù)據(jù)模型(目標(biāo)數(shù)據(jù))之間的對應(yīng)關(guān)系。通常在明確元素的含義基礎(chǔ)上建立準(zhǔn)確地對應(yīng)關(guān)系,由專家參與完成。為提高映射的準(zhǔn)確性及一致性,需建立映射規(guī)則,明確映射類型(包含完全匹配、上下位匹配)及匹配順序,完成映射對照表。梳理出成員館館藏中所描述的主要資源對象,首先建立元素與數(shù)據(jù)模型的類之間的對應(yīng)關(guān)系,并將單件與館藏、單件與單件等已有資源對象之間的關(guān)系,轉(zhuǎn)換為類與類間的關(guān)系。再建立元素與數(shù)據(jù)模型的屬性之間的對應(yīng)關(guān)系,比如每一個單件的題名、類型、形態(tài)等對應(yīng)的元素作為實體類的屬性處理。從匹配順序看,需先建立完全匹配關(guān)系,即元素與數(shù)據(jù)模型中類或?qū)傩哉Z義完全或近似相同,如果找不到完全匹配,則考慮上下位等級匹配,元素作為數(shù)據(jù)模型的子類或子屬性,使用rdfs:subClassOf或rdfs:subPropertyOf表示它們之間的對應(yīng)關(guān)系。如果元素找不到對應(yīng)關(guān)系,則考慮延用成員館已使用的元素名或者重用其他詞表的類或?qū)傩裕ㄟ^定義或引入命名空間,將其作為數(shù)據(jù)模型的擴(kuò)展類或?qū)傩?,以盡可能保留成員機(jī)構(gòu)已使用的描述元素。

    3.3 轉(zhuǎn)換元數(shù)據(jù)記錄及進(jìn)行數(shù)據(jù)合并

    數(shù)據(jù)模型與元數(shù)據(jù)模式的映射屬于模式層映射,其明確了館藏數(shù)據(jù)轉(zhuǎn)換的框架,為元數(shù)據(jù)記錄轉(zhuǎn)換提供了模板。元數(shù)據(jù)記錄轉(zhuǎn)換是將成員館館藏記錄按照所定義的數(shù)據(jù)模型進(jìn)行表達(dá),將已有格式的元數(shù)據(jù)記錄轉(zhuǎn)換成RDF格式的數(shù)據(jù)。由于來自于不同成員館的館藏元數(shù)據(jù)記錄互有重合及聯(lián)系,則需進(jìn)一步合并,形成統(tǒng)一的RDF數(shù)據(jù)集。數(shù)據(jù)轉(zhuǎn)換內(nèi)容包括URI創(chuàng)建、RDF文檔生成。需為每一個描述實體對象創(chuàng)建URI,以便更好地識別資源,尤其對于元數(shù)據(jù)的取值來自于一個或多個詞表,如許多機(jī)構(gòu)的主題元素對應(yīng)的主題詞、類號,來自某一主題詞表或者分類表,則需將字符串轉(zhuǎn)換成相應(yīng)的URI。定義數(shù)據(jù)轉(zhuǎn)換規(guī)則,將館藏記錄轉(zhuǎn)換成所對應(yīng)類的實例或者屬性值,應(yīng)用自動轉(zhuǎn)換程序?qū)⒊蓡T館原有的MARC格式、XML格式及其關(guān)系數(shù)據(jù)庫等轉(zhuǎn)換成RDF格式進(jìn)行存儲。對于數(shù)據(jù)模型所定義的類或?qū)傩?,一些成員館原有元數(shù)據(jù)標(biāo)準(zhǔn)中沒有提及,需要進(jìn)一步分辨以添加新的屬性值或進(jìn)行類實例化。運(yùn)用一定的匹配算法,識別分布在不同機(jī)構(gòu)、不同記錄的同一實體,對同一實體對象的多條記錄進(jìn)行合并或者建立關(guān)聯(lián)。

    3.4 與外部資源建立鏈接

    建立與外部資源之間的鏈接,旨在進(jìn)一步豐富LAM館藏集合。外部資源包含詞表和數(shù)據(jù)集。如果所定義的屬性值取值來源于已發(fā)布為關(guān)聯(lián)數(shù)據(jù)的主題詞表、分類表、名稱規(guī)范檔等,則應(yīng)建立與這些詞表的相應(yīng)鏈接。如果所描述的對象與外部數(shù)據(jù)集所指代的是同一實體,運(yùn)用自動匹配技術(shù),將轉(zhuǎn)換后元數(shù)據(jù)記錄與外部資源進(jìn)行匹配,建立自動鏈接,以豐富語義內(nèi)容。目前與圖書館、檔案館、博物館相關(guān)的外部常用的數(shù)據(jù)集有:名稱規(guī)范檔如國際虛擬規(guī)范檔(VIAF)、GeoNames、德國國家圖書館規(guī)范檔(GND)、蓋蒂地理名稱表(TGN),網(wǎng)絡(luò)百科如維基百科、維基數(shù)據(jù),受控詞表如美國國會標(biāo)題表、杜威十進(jìn)分類法、藝術(shù)和建筑類詞表(AAT)等。

    3.5 發(fā)布數(shù)據(jù)

    運(yùn)用一定的發(fā)布平臺將統(tǒng)一RDF數(shù)據(jù)集及其數(shù)據(jù)模型發(fā)布,供用戶自由獲取,提供API、SPARQL端口等多種獲取方式,便于機(jī)器及用戶能夠及時地獲取相關(guān)數(shù)據(jù),在此基礎(chǔ)上開展查詢、問答、重用、知識發(fā)現(xiàn)及各種深層次開發(fā)應(yīng)用。數(shù)據(jù)模型發(fā)布有助于其他LAM機(jī)構(gòu)館藏資源整合時進(jìn)行重用共享,如歐洲數(shù)字圖書館的EDM發(fā)布導(dǎo)致許多機(jī)構(gòu)采用該模型表示數(shù)據(jù)集,從而為后期大規(guī)模的整合帶來了便利。

    4 推動國內(nèi)LAM館藏資源整合的保障措施

    基于關(guān)聯(lián)數(shù)據(jù)的LAM館藏資源的整合對于提升LMA館藏資源數(shù)字化建設(shè)水平及服務(wù)能力有重要意義。但從國內(nèi)現(xiàn)有LAM發(fā)展水平看,推動LAM資源整合發(fā)展需要從以下方面做進(jìn)一步保障,從而為整合順利實施提供良好基礎(chǔ)。

    4.1 增強(qiáng)LAM機(jī)構(gòu)資源開放性

    LAM館藏資源是我國文化資源的重要構(gòu)成,也是我國數(shù)字文化基礎(chǔ)設(shè)施的重要部分,資源的開放性意味著可以與LAM機(jī)構(gòu)內(nèi)外的資源進(jìn)行快速整合,以實現(xiàn)資源跨領(lǐng)域、跨機(jī)構(gòu)深層次利用。LAM機(jī)構(gòu)需增強(qiáng)資源開放意識,資源開放度越高,被利用的可能性越大,資源所發(fā)揮的價值愈大。各個機(jī)構(gòu)應(yīng)積極參與到資源共享與開放運(yùn)動中,遵循數(shù)據(jù)的可存取、可發(fā)現(xiàn)、可操作及重用(FAIR)原則[12],將機(jī)構(gòu)內(nèi)部可重用、高價值數(shù)據(jù)采用RDF形式發(fā)布,以保證資源最大程度地被利用。

    4.2 提升LAM館藏元數(shù)據(jù)質(zhì)量

    LAM資源整合是在已有館藏元數(shù)據(jù)基礎(chǔ)上實現(xiàn),整合質(zhì)量一定程度上取決于原有館藏元數(shù)據(jù)的質(zhì)量水平。各個機(jī)構(gòu)在資源建設(shè)中應(yīng)該注重盡可能采用使用較廣泛的元數(shù)據(jù)標(biāo)準(zhǔn),資源描述中應(yīng)確保數(shù)據(jù)記錄的準(zhǔn)確性、完整性與及時更新,只有將元數(shù)據(jù)記錄保持在一定的質(zhì)量水平,才能在整合中確保數(shù)據(jù)轉(zhuǎn)換的語義盡可能保留,減少數(shù)據(jù)質(zhì)量控制成本,提升整合效率。

    4.3 加強(qiáng)外部數(shù)據(jù)資源的可用性

    LAM與其他資源建立關(guān)聯(lián)所形成的數(shù)據(jù)網(wǎng)絡(luò)更有益于實現(xiàn)數(shù)據(jù)價值,發(fā)揮數(shù)據(jù)整合作用。而外部數(shù)據(jù)資源的形式化程度及可獲取性都會影響著數(shù)據(jù)關(guān)聯(lián)。目前我國可用的LAM外部資源,尤其以關(guān)聯(lián)數(shù)據(jù)形式存在的有價值的數(shù)據(jù)不多,從而為數(shù)據(jù)更廣范圍地整合帶來了一定的難度,需要進(jìn)一步增強(qiáng)詞表、政府?dāng)?shù)據(jù)、文化教育與經(jīng)濟(jì)、網(wǎng)絡(luò)百科等重要數(shù)據(jù)的開放與關(guān)聯(lián),并定義相應(yīng)的命名空間及其相應(yīng)URI以便被參引,形成良好的開放關(guān)聯(lián)數(shù)據(jù)生態(tài)系統(tǒng),以數(shù)據(jù)驅(qū)動帶動數(shù)字化經(jīng)濟(jì)創(chuàng)新發(fā)展。

    猜你喜歡
    數(shù)據(jù)模型資源整合館藏
    館藏
    少先隊活動與校外資源整合的實踐與探索
    “五育并舉”下家校社資源整合的價值意義
    博物館的生存之道:館藏能否變賣?
    海外并購中的人力資源整合之道
    中國外匯(2019年19期)2019-11-26 00:57:32
    面板數(shù)據(jù)模型截面相關(guān)檢驗方法綜述
    知還印館藏印選——古印篇
    智慧高速資源整合方式實踐
    加熱爐爐內(nèi)跟蹤數(shù)據(jù)模型優(yōu)化
    電子測試(2017年12期)2017-12-18 06:35:36
    介紹兩件館藏青銅器
    文物春秋(2014年2期)2014-12-24 21:23:05
    龙游县| 利津县| 霍邱县| 滦南县| 绥宁县| 泸州市| 四川省| 朝阳区| 东乡| 石林| 井研县| 太和县| 车致| 封开县| 项城市| 霸州市| 廊坊市| 沈丘县| 镇原县| 桦南县| 邵武市| 富锦市| 五家渠市| 阿拉尔市| 太仓市| 丰镇市| 中超| 华坪县| 鲁甸县| 文昌市| 永春县| 南安市| 河南省| 乐山市| 普格县| 嘉鱼县| 双柏县| 确山县| 呈贡县| 柯坪县| 河东区|