• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      網(wǎng)絡環(huán)境下書目信息關(guān)聯(lián)數(shù)據(jù)化的實現(xiàn)方法

      2022-12-15 02:50:34
      圖書館論壇 2022年12期
      關(guān)鍵詞:數(shù)據(jù)模型書目本體

      高 斌

      0 前言

      自20 世紀末全球信息網(wǎng)(World Wide Web,WWW)興起以來,許多數(shù)字重制或數(shù)字原生信息由WWW承載,通過互聯(lián)網(wǎng)傳播至全球。隨著語義網(wǎng)與關(guān)聯(lián)數(shù)據(jù)(Linked Data,LD)應用發(fā)展,語義網(wǎng)利用LD技術(shù)將WWW網(wǎng)頁內(nèi)容結(jié)構(gòu)化,將現(xiàn)有文件網(wǎng)轉(zhuǎn)換為數(shù)據(jù)網(wǎng),方便建立不同數(shù)據(jù)之間的關(guān)聯(lián)。然而,圖書情報(以下簡稱“圖情”)界處于機讀編目格式(Machine-Readable Catalog,MARC)與LD并存的復合式環(huán)境[1],即處于MARC 與LD 并存的過渡時期,必須同時處理LD與既有MARC記錄。因此,將MARC數(shù)據(jù)轉(zhuǎn)換成LD以融入語義網(wǎng)成為亟待解決的課題。近年許多圖書館將MARC數(shù)據(jù)轉(zhuǎn)換成LD,包括大英圖書館(British Library,BL)、西班牙國家圖書館(Biblioteca Nacionalde Espa?a,BNE)、瑞典皇家圖書館(Kungl. Biblioteket,KB)、法國國家圖書館(Bibliothèque nationale de France,BNF)、德國國家圖書館(Deutsche National Bibliothek,DNB),以及美國LD4L(linked data forlibraries)、LD4P(linked data for production)與書目工作流程(BIBFLOW)等計劃。就發(fā)展現(xiàn)狀而言,從聯(lián)機計算機圖書館中心(Online Computer Library Center,OCLC)兩次LD調(diào)查報告可知,將MARC轉(zhuǎn)換為LD時,已采取不同的LD技術(shù)及其相關(guān)作業(yè)方式與流程[2]。此外,許多案例已采取不同本體作為建立數(shù)據(jù)模型的參考基礎(chǔ)。觀察語義網(wǎng)的應用發(fā)展歷程,圖情界將MARC數(shù)據(jù)轉(zhuǎn)換為LD的方式、作業(yè)流程與結(jié)果不盡相同,但未有文獻就MARC數(shù)據(jù)轉(zhuǎn)換為LD的方式展開深入探討。為此,本文分析現(xiàn)有轉(zhuǎn)換方式的功能定位、實際結(jié)果、特點及其相關(guān)議題,作為MARC 數(shù)據(jù)轉(zhuǎn)換為LD 時的決策參考,以選取合適的轉(zhuǎn)換方式及其相關(guān)配套措施。

      1 現(xiàn)狀、議題與轉(zhuǎn)換

      1.1 發(fā)展現(xiàn)狀

      迄今涉及LD 的研究與應用眾多。實質(zhì)上,LD 以資源描述框架(Resource Description Framework,RDF)為數(shù)據(jù)模型,用以界定與劃分不同事物間的關(guān)系,且以RDF語法加以描述。換言之,LD以數(shù)據(jù)為中心,以RDF三元陳述等方式描述事物,以利于機器理解[3],而非以文獻為中心及以記錄為單位的信息組織方式[4]。萬維網(wǎng)聯(lián)盟(World Wide Web Consortium,W3C)LD工作手冊發(fā)布的LD作業(yè)有七大要素:建立數(shù)據(jù)模型、統(tǒng)一資源標識符(Uniform Resource Identifier,URI)、盡可能利用現(xiàn)有詞匯、發(fā)布人機讀取的描述、轉(zhuǎn)成RDF、指定授權(quán)條款及提供數(shù)據(jù)公開獲取與對外宣傳[5]。

      圖情界處于轉(zhuǎn)換LD過渡時期,仍然持續(xù)使用MARC描述相關(guān)數(shù)據(jù),屬于MARC與LD共存的復合式環(huán)境[6]。如何將書目數(shù)據(jù)轉(zhuǎn)換成LD已成為議題。在歐洲,BL、KB、BNE、BNF與DNB等采取批次轉(zhuǎn)換方式。美國加州大學戴維斯分校圖書館在書目工作流程中,利用圖書館自動化系統(tǒng)批次加入URI至MARC相關(guān)欄目,或采用相關(guān)軟件工具(包括Scribe與BIBFRAME Editor)批次轉(zhuǎn)換MARC為LD[7];美國LD4P計劃參與斯坦福大學圖書館“曳光彈計劃”,探討有關(guān)MARC與非MARC記錄轉(zhuǎn)成LD的工作流程有4種,前2種主要是針對圖書館自動化系統(tǒng)MARC記錄,轉(zhuǎn)換成美國國會圖書館(Library of Congress,LC)的書目框架(Bibliographic Framework,BIBFRAME)詞匯[8],后2種是針對數(shù)字典藏庫的非MARC記錄,經(jīng)由元數(shù)據(jù)對象描述模型格式轉(zhuǎn)換成BIBFRAME。

      1.2 相關(guān)議題

      發(fā)布LD時,第一,在于選擇適當?shù)谋倔w或自行發(fā)展本體作為LD數(shù)據(jù)模型之用。針對圖情界LD現(xiàn)狀的系統(tǒng)化評議結(jié)果之一是選擇適當本體,而OCLC第二次LD實施現(xiàn)狀調(diào)查結(jié)果項目之一也是有關(guān)本體的選擇[9]。由此可知,一般LD案例似乎傾向不自行發(fā)展本體,而以選用現(xiàn)有本體為主。第二,在美國伊利諾大學香檳分校圖書館實踐中,選擇本體時并未達成共識;在伊朗國家圖書館暨檔案館(National Library and Archive of IRAN,NLAI)LD 實踐中,對選擇適當本體仍缺乏標準。另外,在采取MARC對照至BIBFRAME、OCLC WorldCat(OCLC 聯(lián)機書目數(shù)據(jù)庫)的Schema.org(標記的語義詞匯表,是Google,Bing,Yandex 和Yahoo!合作的結(jié)果,通過這些標記以搜索引擎認可的方式來標記他們結(jié)構(gòu)化的網(wǎng)頁)、BNE采用的書目記錄功能需求(Functional Requirements for Bibliographic Records,F(xiàn)RBR)型RDF詞匯。在哈佛大學圖書館LD案例使用的MARC本體、資源描述與檢索(Resource Description&Access,RDA)第一群組與都柏林詞匯的研究案例中,建議選擇本體時,應考慮本體的長久性。第三,有關(guān)URI命名方面,URI 除用來為每一事物命名以方便識別外,事物的描述不再以記錄為單位,改以RDF三元陳述方式描述,且事物可進一步區(qū)分為人、機構(gòu)、地名與概念等,同時還以URI 加以命名標示。而OCLC則將事物區(qū)分為作品、個人、機構(gòu)與事件。第四,在重復使用既有詞匯以描述事物及其彼此關(guān)系方面并不容易。在NLAI 實踐中,建議不要采用廣泛使用的詞匯,而應使用已被接受為標準的詞匯為原則。依據(jù)比較WorldCat使用Schema.org 與BL 的英國國家書目(British National Bibliography,BNB)使用不同本體來描述書目屬性的分析結(jié)果中,前面兩個事例在使用與混搭既有詞匯方面并未有共識。此外,如果混搭兩種以上不同詞匯時,此種情形會產(chǎn)生互操作的問題。第五,在建立與外部LD 資源關(guān)聯(lián)時,一般圖書館自動化系統(tǒng)或相關(guān)軟件工具必須經(jīng)過自動化的調(diào)和與人工判斷后,建立與外部URI 關(guān)聯(lián),完成豐富化作業(yè),進而達成內(nèi)外部LD的整合,成為語義網(wǎng)的一部分。第六,基于內(nèi)外部LD 資源關(guān)聯(lián)前提下,有學者認為此種LD關(guān)聯(lián)結(jié)果有助于提供額外的相關(guān)脈絡信息作為詮釋信息之用,無形中提供使用者一個探索相關(guān)信息的新起點,以用于整合不同來源信息形成知識圖譜(Knowledge Graph,KG)等功能[10]。

      1.3 轉(zhuǎn)換方式

      隨著LD應用發(fā)展,圖情界研究如何將書目信息轉(zhuǎn)化為LD,尤其是長久以來所使用的各類MARC 數(shù)據(jù)。依據(jù)LD的導入與應用演化歷程,分別采用書目本體、關(guān)聯(lián)型MARC 與Schema.org等3種轉(zhuǎn)換方式。

      (1)書目本體轉(zhuǎn)換方式主要是許多國家圖書館著手大量批次轉(zhuǎn)換MARC為 LD,如 BL、KB、BNE、BNF 與DNB。以BNF 的音樂家舒伯特為例,LD轉(zhuǎn)換過程以參考FRBR發(fā)展的BNF書目本體進行LD模型化,同時使用兩種以上既有的詞匯標準描述資源,除以書目本體的結(jié)構(gòu)呈現(xiàn)LD相關(guān)信息外,更進一步提供關(guān)聯(lián)式的跨庫檢索與類似Wikipedia信息卡等附加信息,如圖1所示,而原始BNF的MARC記錄并未有任何改變。

      圖1 BNF提供有關(guān)Franz Schubert的LD相關(guān)信息

      (2)隨著信息時代發(fā)展,MARC也與時俱進調(diào)整相關(guān)策略,例如網(wǎng)絡電子資源的應用發(fā)展需求,在MARC書目記錄格式增加欄號856 及其分欄$u,以描述獲取其網(wǎng)址與環(huán)境條件等相關(guān)信息。隨著LD的發(fā)展,MARC也適時調(diào)整以反映LD的需求,主要包括了分欄$0、$1與$47,形成關(guān)聯(lián)型MARC。以共享虛擬發(fā)掘環(huán)境(Share Virtual Discovery Environment, Share- VDE) 的“Jane Austen”作者為例,Share-VDE已采用MARC100、650、651、700、758 與 830 等欄號有關(guān)LD的分欄,經(jīng)由豐富作業(yè)加入外部LD資源URI,以達成LD驅(qū)動式目錄,如圖2所示。

      圖2 Share-VDE提供的LD范例

      (3)以網(wǎng)絡搜索引擎曝光度為主要訴求,即采用Schema.org結(jié)構(gòu)化描述網(wǎng)頁內(nèi)容,主要目的是提供符合搜索引擎需求的描述數(shù)據(jù),既提高結(jié)構(gòu)化網(wǎng)頁內(nèi)容的曝光率,也有利于搜索引擎將其增值為KG服務?;旧蟂chema.org 符合RDF數(shù)據(jù)模型要求,且能以RDFa、Microdata 與JSON-LD等3種格式嵌入網(wǎng)頁內(nèi)容,讓網(wǎng)頁內(nèi)容由文件變成結(jié)構(gòu)化數(shù)據(jù)。除網(wǎng)絡書店商業(yè)機構(gòu)外,圖情界已有OCLC的WorldCat與主題術(shù)語的分布式應用數(shù)據(jù)庫(Faceted Application of Subject Terminology,F(xiàn)AST),以及圖書館關(guān)聯(lián)網(wǎng)(Library Link Network,LLN)等實踐。截至目前,雖然Schema.org與書目信息密切相關(guān)的領(lǐng)域僅限于創(chuàng)作作品項下的文章、地圖集、圖書、合集、地圖、電影、叢書與期刊等子類別,數(shù)據(jù)類型的描述屬性方面也有較多限制。因此,利用網(wǎng)絡書目信息擴充Schema.org 結(jié)構(gòu)化的網(wǎng)頁內(nèi)容,從而滿足文化產(chǎn)業(yè)界對關(guān)聯(lián)化書目的需求。

      由以上案例可知,LD導入語義網(wǎng)的方式與時俱進,可劃分為3 個階段與方法,依序包括書目本體、關(guān)聯(lián)型MARC 與Schema.org等3種轉(zhuǎn)換方式,圖情界應選擇何種MARC轉(zhuǎn)換為LD方式,值得研究。因此,探討書目本體、關(guān)聯(lián)型MARC與Schema.org等3種LD 轉(zhuǎn)換方式的實際結(jié)果、相關(guān)議題與模型,能讓圖情界掌握其LD轉(zhuǎn)換方式,為MARC轉(zhuǎn)換為LD提供參考。

      2 轉(zhuǎn)換方法

      如何選擇適合方法將現(xiàn)有書目數(shù)據(jù)轉(zhuǎn)換成LD,依據(jù)4種LD應對方式,包括書目本體、關(guān)聯(lián)型MARC、Schema.org,或者保持原狀。以前3 種LD 應對方式為研究對象,其中在以BIBFRAME為代表的書目本體方面,則是重新定義擴大為圖情界的書目本體,包括完全采用既有本體或參考既有本體以發(fā)展本身需求的本體。因而,除BIBFRAME外,也包括FRBR,以及參考前述BIBFRAME 或FRBR 所發(fā)展的本體等,如表1 所示。在研究對象方面,分別選取BL、BNF、LLN與LD4P計劃之一的Share-VDE為研究樣本。 其中選擇 LLN, 而未選 OCLC WorldCat的主要原因在于LLN網(wǎng)站對外釋放較多與本研究預計分析項目的相關(guān)信息。另以W3C的LD工作手冊官方文件所列的七大要素為依據(jù),再融合上述相關(guān)議題所探討的關(guān)聯(lián)外部LD資源及脈絡化信息與KG等兩項額外要素,依據(jù)要素逐一分析上述4個研究樣本的轉(zhuǎn)換結(jié)果、特點及相關(guān)議題。

      表1 本文的研究樣本、本體及其參考網(wǎng)站與文獻

      3 結(jié)果研究

      3.1 建立數(shù)據(jù)模型

      除BL與BNF屬于自行發(fā)展外,其他兩個案例都采用圖情界既有本體。在BL案例中,為了擴及至圖書館領(lǐng)域外,BL采取自行發(fā)展的BL本體建立數(shù)據(jù)模型,而不采用FRBR,希望能擴至圖情界以外的使用者。在BNF 案例中,則以FRBR為主要基礎(chǔ)發(fā)展出BNF本體,以建立數(shù)據(jù)模型。在LLN中,則采用BIBFRAME簡版為數(shù)據(jù)模型,即將MARC 記錄轉(zhuǎn)換成BIBFRAME后,再以BIBFRAME 與Schema.org 等發(fā)布LD。最后,Share-VDE采用BIBFRAME為書目本體,同時搭配MARC的LD相關(guān)欄號與分欄以建立數(shù)據(jù)模型[11]。

      3.2 URI命名

      (1)BNF 采用典藏資源鍵值(Archival Resource Key,ARK)作為識別碼,并進一步區(qū)分為作品、期刊、表演、作者(含個人與團體)、主題、地名與年代等類型,除了年代以“https://data.bnf.fr/date/xxxx/”為起首字串標示,其中“xxxx”為特定公元年,其余都以“https://data.bnf.fr/ark:/12148/cbyyyyyy”為起首字串標示,其中“yyyyyy”代表為字串。上述URI類型的范例:

      https://data.bnf.fr/ark:/12148/cb13736057t(作品:老子指略例)

      https://data.bnf.fr/ark:/12148/cb44445087n(期刊:藝術(shù)市場報告)

      https://data.bnf.fr/ark:/12148/cb42140363g(表演:100 kilos et ses éléphants)

      https://data.bnf.fr/ark:/12148/cb118896036( 個 人 :Jane Austen(1775-1817))

      https://data.bnf.fr/ark:/12148/cb119938537(主題:1er siécle)

      https://data.bnf.fr/ark:/12148/cb15365390f( 地 名 :Zone de fracture de 15°20(Atlantique Nord))

      https://data.bnf.fr/date/-3200/(年代:The year-3200)

      (2)BL采取領(lǐng)域名稱結(jié)合FRBR三大群組概念將URI劃分為資源、代理者與概念等3種,區(qū)分不同類型LD。以“http://bnb.data.bl.uk/id”為URI起首,再區(qū)分為書目資源、生年、卒年、個人、家族、機構(gòu)、出版者/經(jīng)銷者、出版事件、預計出版事件、出版開始事件、出版結(jié)束事件、代理者、叢書、概念14種,其中資源又可細分題名作品與出版事件,而概念又再區(qū)分為23版杜威十進分類號、地名與美國國會主題詞表(Library of Congress Subject Headings,LCSH),上述URI類型的部分范例:

      http://bnb.data.bl.uk/id/resource/006892790title/work(作品)

      http://bnb.data.bl.uk/id/person/AustenJane1775-1817/birth(生年)

      http://bnb.data.bl.uk/id/person/AustenJane1775-1817/death(卒年)

      http://bnb.data.bl.uk/id/resource/006892790/publication event/NewMilfordConnLondonTheTobyPress2003(出版事件)

      http://bnb.data.bl.uk/id/resource/017547414/projectedpublicationevent/NewYorkO(預計出版事件)

      http://bnb.data.bl.uk/id/person/AustenJane1775- 1817(個人)

      http://bnb.data.bl.uk/id/concept/family/lcsh/Carnegiefamily(家族)

      http://bnb.data.bl.uk/id/concept/lcsh/AustenJane1775-1817(概念)

      http://bnb.data.bl.uk/id/agent/AustenJane1775-1817(代理者)

      http://bnb.data.bl.uk/id/series/AndrewCarnegielectureseries(叢書)

      http://bnb.data.bl.uk/id/organization/CambridgeUniversityPress(機構(gòu))

      http://bnb.data.bl.uk/id/concept/ddc/e23/823.7(杜威分類號)

      http://bnb.data.bl.uk/id/concept/place/lcsh/England(地名)

      http://bnb.data.bl.uk/id/concept/lcsh/SocialclassesEnglandHistoryJuvenilefiction(LCSH)

      (3)LLN依循BIBFRAME Lite書目本體并加以區(qū)分為17種類型,且只能經(jīng)由網(wǎng)絡版URI網(wǎng)頁內(nèi)容的“類型”一欄得知。此外,URI分為本地化與LLN 網(wǎng)絡兩種,前者為單一圖書館所屬的URI,后者則是LLN一致命名的URI,兩者分別標示彼此的URI,以利相互參照關(guān)聯(lián)。以LLN網(wǎng)絡版URI為例,所有LD都稱為資源,資源之下又可區(qū)分為代理者、合集、概念、著作權(quán)事件、家族、形式、實例、清單、會議、機構(gòu)、個人、地名、提供者事件、叢書、時間、主題與作品等17 種類型。以“Austen Jane,1775-1817”為例,LLN 網(wǎng)絡版URI 為“http://library.link/resource/qLB5U0TEdog/”,本地化則有“http://link.library.anaheim.net/resource/qLB5U0TEdog/”與“http://sara-hightower.library.link/resource/qLB5U0TEdog/”等兩個以上的URI,且網(wǎng)絡版URI與本地化URI呈現(xiàn)一對多關(guān)系;換言之,一個網(wǎng)絡版URI 可對應至不同的LLN 成員圖書館URI。上述類型的LLN網(wǎng)絡版URI與本地化URI部分范例:

      http://library.link/resource/QRJ578jeKxI/(機構(gòu):A Golden Book)

      http://link.library.anaheim.net/resource/QRJ578jeKxI/

      http://library.link/resource/yYE- PTDjgbA/( 作 品 :Emma)

      http://link.library.anaheim.net/resource/yYE-PTDjgbA/

      http://library.link/resource/AEmKrN8cGjQ/( 實 例 :Emma)

      http://link.library.anaheim.net/resource/AEmKrN8cGjQ/

      http://library.link/resource/lSk-JFiV1Q4(地名:Japan)

      http://link.library.anaheim.net/resource/lSk-JFiV1Q4/

      http://library.link/resource/0fwbFRyZ3vI/(主題:International relations)

      http://link.library.anaheim.net/resource/0fwbFRyZ3vI/

      http://library.link/resource/AEC5qOtSQyk/( 形 式 :Biography)

      http://link.library.anaheim.net/resource/AEC5qOtSQyk/

      (4)Share-VDE與URI命名似乎并沒有特別區(qū)分。事實上,Share-VDE在URI命名方面結(jié)合BIBFRAME 的類別名稱,以BIBFRAME 的3個核心層次與代理者的關(guān)鍵概念為主要依據(jù)。所以,URI 以“http://share-vde.org/sharevde/rdfBibframe/”為起始,再依BIBFRMAE 第二版區(qū)分為作品、實例、個人、出版者等類別,其中作品、個人、出版者等類別再加上字符串共同組合而成,而實例則是加上圖書館文字代碼與系統(tǒng)記錄號共同組成,上述URI類型的范例如下所示。另外4個案例的URI命名方式見表2。

      表2 URI命名方式

      http://share-vde.org/sharevde/rdfBibframe/Work/9862294(作品:Pride and prejudice)

      http://share-vde.org/sharevde/rdfBibframe/Instance/DU KE000317902(實例:杜克大學圖書館)

      http://share-vde.org/sharevde/rdfBibframe/Agent/593384(個人:Jane Austen)

      http://share-vde.org/sharevde/rdfBibframe/Publisher/126(出版者:Harcourt Brace&Company(1993-1999))

      3.3 使用現(xiàn)有詞匯

      整體而言,4個案例都采用兩種以上的現(xiàn)有詞匯,且可分為W3C與非W3C兩種,除了常見的詞匯(包括DC elements、DC terms、FOAF、RDF、RDFs、SKOS 與 XMLs)外,有幾點值得注意:第一,BL 與BNF 兩個除采用現(xiàn)有詞匯外,還有自行發(fā)展的書目本體詞匯,同時也使用了RDA本體相關(guān)詞匯。第二,在LLN中,除采用自行發(fā)展的LLN詞匯外,也采用Schema.org與Zepheria發(fā)展的簡版BIBFRAME,而Share-VDE 中,則是采用 BIBFRAME 第二版及 LC 的BIBFRMAE延伸版詞匯。第三,4個案例中在控制詞匯方面,采用相關(guān)標準的詞匯,強化控制詞匯的描述語義,包括SKOS、MADS與FOAF等常用的標準,甚至在BL中,采取了Event、Org、WGS84 Geo Positioning等標準詞匯。第四,BL與LLN另外采用W3C的VOID標準,主要用來描述RDF數(shù)據(jù)集,以利于這些數(shù)據(jù)的發(fā)掘、獲取與標示不同數(shù)據(jù)集間的關(guān)系。最后,除BL、BNF與 LLN 采用 Schema.org 外,LLN 還額外采用RDFa,以利于KG的產(chǎn)生。4個案例具體使用現(xiàn)有詞匯情況如表3所示。

      表3 現(xiàn)有詞匯

      3.4 發(fā)布人機讀取的LD描述及RDF轉(zhuǎn)換

      依據(jù)W3C LD工作手冊的定義,人讀描述是指人可閱讀的網(wǎng)頁內(nèi)容,而機讀描述則是提供RDF 數(shù)據(jù)文檔,或是使用前述W3C的VOID 標準詞匯予以描述。在本文的研究案例中,都提供人讀與機讀LD 描述,但RDF 格式不盡相同,以BL 與BNF 提供的RDF 格式種類最多,詳情如表4 所示。換言之,所有研究案例都已完成W3C 關(guān)聯(lián)數(shù)據(jù)工作手冊第五項元素的RDF轉(zhuǎn)換。

      表4 人讀與機讀的LD描述現(xiàn)狀

      3.5 指定授權(quán)條款

      除了Share-VDE外,其余都有開放式授權(quán)條款,并以知識共享(Creative Commons,CC)為主。例如BL采用CC的CC0 1.0通用公共領(lǐng)域貢獻宣言,而LLN則是采用CC BY 4.0姓名標示的授權(quán)條款。在BNF方面,則是采用開放式授權(quán)條款,著重于數(shù)據(jù)著作權(quán)的再利用與姓名標示,而上述條款與現(xiàn)有的英國政府開放政府授權(quán)、知識共享的姓名標示與開放數(shù)據(jù)姓名標示等授權(quán)條款相容。

      3.6 關(guān)聯(lián)外部LD資源

      4個研究樣本都有建立外部LD資源的關(guān)聯(lián),如表5所示。有幾種情形值得注意:第一,有些案例僅限于圖情領(lǐng)域的LD 資源,如LLN 目前只關(guān)聯(lián)至LC 的關(guān)聯(lián)數(shù)據(jù)服務(LC Linked Data Service,LC LDS)與虛擬國際權(quán)威檔(Virtual International Authority File,VIAF)。第二則是擴大至圖情界以外的LD資源,包括BL、BNF與Share-VDE。第三,BNF與Share-VDE針對個人方面提供縮略圖,主要來源是Wikipedia,而Share-VDE甚至依意大利語與英語提供不同語言版的數(shù)字影像縮略圖。第四,BNF與Share-VDE也提供關(guān)聯(lián)式的關(guān)鍵字查詢功能,直接關(guān)聯(lián)至其他數(shù)據(jù)庫進行跨庫查詢。

      表5 外部LD資源

      3.7 脈絡化信息與KG

      BL網(wǎng)站本身除了提供內(nèi)部關(guān)聯(lián)外,LD呈現(xiàn)方式仍采取類似一般線上目錄條列式呈現(xiàn)BNB的 LD,以“Austen Jane,1775-1817”為例,除了有關(guān)Jane Austen個人的基本信息外,還包括有關(guān)Jane Austen的作品、Jane Austen的相關(guān)著作與相關(guān)信息如圖3 所示。在BNF 方面,除了自Wikipedia提供個人的數(shù)字影像縮略圖外,也提供了內(nèi)外部的LD 資源,且以類似FRBR模式的結(jié)構(gòu)化方式呈現(xiàn)LD數(shù)據(jù)間關(guān)系。其中在BNF管轄范圍內(nèi)的LD資源,無論目錄信息或數(shù)字檔案,都以類似KG方式顯示(包括條列式文本、縮略圖或兩者皆有),供使用者參考如圖1所示。至于外部關(guān)聯(lián)方面,只提供關(guān)聯(lián)名稱與網(wǎng)址,并未提供類似KG功能。在LLN方面,首先提供BIBFRAME的作品、實例與單個等類別的相關(guān)信息,同時提供此書目LD內(nèi)外關(guān)聯(lián)的統(tǒng)計數(shù)據(jù),及有關(guān)此實體館藏的聯(lián)合目錄信息如圖4所示。在Share-VDE方面,除了自Wikipedia提供個人的數(shù)字縮略圖外,也提供Wikipedia的信息卡信息,及內(nèi)部關(guān)聯(lián)的作品、相關(guān)人名、相關(guān)作品與外部LD資源關(guān)聯(lián)等相關(guān)關(guān)聯(lián)信息,同時在作品頁面下,提供聯(lián)合目錄信息與實體館藏的圖書館圖標如圖2b所示。

      圖3 BL BNB提供有關(guān)Jane Austen的LD相關(guān)信息

      圖4 LLN的阿納海姆公共圖書館(Anaheim Public Library)提供Jane Austen文獻的LD相關(guān)信息

      4 討論

      由以上分析結(jié)果可知,將MARC轉(zhuǎn)換為LD的3 種方式已達到W3C LD 工作手冊的多數(shù)要求,且各具特色。有關(guān)3 種轉(zhuǎn)換方式的相關(guān)議題,試從數(shù)據(jù)模型的結(jié)構(gòu)化呈現(xiàn)、URI命名方式的形態(tài)與政策、現(xiàn)有詞匯的應用方式、外部LD資源的關(guān)聯(lián)效益、外部LD資源的關(guān)聯(lián)原則與指引等方面加以探討。

      (1)數(shù)據(jù)模型的結(jié)構(gòu)化呈現(xiàn):類別與關(guān)系。由于各案例采用不同的模型,能否依原有模型的結(jié)構(gòu)化關(guān)系呈現(xiàn)LD化結(jié)果供使用者使用,就顯得十分重要。就結(jié)構(gòu)化關(guān)系而言,所有研究案例都能顯示,一方面4個案例都采取文本型的結(jié)構(gòu)關(guān)系條列方式顯示LD 及LD 超鏈接,但結(jié)構(gòu)關(guān)系并無法達成關(guān)聯(lián)查詢;另一方面,由于4 個研究案例參考BIBFRAME 或FRBR17書目本體作為建立數(shù)據(jù)模型之用。優(yōu)點是兩個書目本體是全球圖情界的重要標準規(guī)范,都由著名權(quán)威機構(gòu)維護,一來URI具備永久性;二來也被全球圖情界認可與采納,且維護單位都會致力與現(xiàn)有圖情界的其他標準規(guī)范(如MARC、RDA)對照,至于與非圖情界LD標準規(guī)范對照的統(tǒng)一窗口,保持圖情界內(nèi)外間的互操作性。

      (2)URI命名方式的樣態(tài)與政策。整體而言,BL、LLN 與SHAREVDE都是依書目本體作為URI的命名依據(jù),而BNF則未依此方式規(guī)劃URI的命名,而是單純采用ARK。對于采用相同書目本體的機構(gòu)而言,BL、LLN與SHARE-VDE提供LD的URI實例具備LD資源的識別功能,極易區(qū)分不同書目本體類別與實例的LD與其URI,利于外部LD資源的多樣化的識別與選擇,進而促成現(xiàn)有LD的再利用。另外,在BL 案例中,也可能發(fā)現(xiàn)“Austen Jane,1775-1817”具有兩個URI,一個為個人,另一個為概念。

      (3)現(xiàn)有詞匯的應用方式。依本文“使用現(xiàn)有詞匯”一節(jié)內(nèi)容,可以發(fā)現(xiàn)研究案例中,除采取現(xiàn)有的本體或后設(shè)數(shù)據(jù)元素集為依據(jù)建立數(shù)據(jù)模型外,也可以從“關(guān)聯(lián)外部LD資源”一節(jié)得知這些案例也使用了外部LD資源,實際利用現(xiàn)有的LD型控制詞匯。若依據(jù)W3C圖書館LD孵化小組報告內(nèi)容,是將LD 區(qū)分為后設(shè)數(shù)據(jù)元素集、數(shù)據(jù)值詞匯與數(shù)據(jù)集等3種。換言之,以研究案例使用現(xiàn)有詞匯的方式而言,可以歸納為兩種,一種是采用現(xiàn)有的本體類別名稱或后設(shè)數(shù)據(jù)元素集數(shù)據(jù)元素名稱作為建立數(shù)據(jù)模型之用,第二種是選用現(xiàn)有的數(shù)據(jù)值詞匯作為既有LD實例的數(shù)據(jù)著錄,也能經(jīng)由多樣化作業(yè)建立外部LD資源的關(guān)聯(lián),兩者作用大不相同。

      (4)外部LD資源的關(guān)聯(lián)效益。以研究案例為探討范圍,可發(fā)現(xiàn)LD化后的結(jié)果各有差異,可區(qū)分為4種類型。第一種是BL仍采取一般線上目錄服務,以文本型條列式與內(nèi)外部LD關(guān)聯(lián)串連為主要的結(jié)果呈現(xiàn)。第二種類型是達到聯(lián)合目錄的效果,包括LLN如圖4所示與Share-VDE如圖2b)所示等。第三種是關(guān)聯(lián)式的跨庫檢索,如BNF除了利用URI關(guān)聯(lián)BNF平臺本身的內(nèi)部URI外,也以URI為依據(jù),增加了跨數(shù)據(jù)庫的關(guān)聯(lián)查詢。第四種類型是接近KG或Wikipedia的信息卡形式,以擷取外部LD資源至圖書館的LD平臺,如BNF與Share-VDE等。

      (5)外部LD資源的關(guān)聯(lián)原則與指引。就外部LD資源關(guān)聯(lián)的類型而言,可區(qū)分為3種。第一種只以圖情界范圍內(nèi)的外部LD資源為主,如BL與LLN。第二種除了圖情界的外部LD 資源為主外,也擴及相關(guān)的維基(Wiki)資源,包括Wikipedia與Wikidata,如Share-VDE。第三種類型是跳出圖情界的外部LD資源(如BNF),其原因可能在于為了擴大潛在的使用者觸及層面或盡可能建立外部LD資源的鏈接。整體而言,建立外部LD資源的關(guān)聯(lián)主要目的是針對某一LD加入不同面向的相關(guān)信息,以提供多元觀點的信息。當前圖情界對于外部LD資源關(guān)聯(lián)的選擇、數(shù)量及類型等尚未有任何共識。因而,亟待一個類似最佳指引,引導圖情界有關(guān)外部LD 資源的關(guān)聯(lián),尤其在多樣化作業(yè)流程中的識別與選擇。

      5 結(jié)論

      依導入LD至語義網(wǎng)的過程而言,首先是BL與BNF案例,是以發(fā)展所屬的書目本體為主,采取批次大量轉(zhuǎn)換為LD方式為主要目的。在BL的案例中可發(fā)現(xiàn),圖情界早期大量批次的轉(zhuǎn)換方式注重LD 化,并未如BNF 案例提供許多增值服務,包括跨庫的關(guān)聯(lián)查詢與類似Wikipedia信息卡等。之后,隨著關(guān)聯(lián)型MARC的出現(xiàn),參與LD4P Share-VDE計劃的北歐國家圖書館與北美大學圖書館則是具體落實與驗證關(guān)聯(lián)型MARC的可行性,也額外提供LD驅(qū)動式虛擬式聯(lián)合目錄等相關(guān)信息。除此之外,以Zepheria為首的LLN案例,范圍以英美公共圖書館為主,采取以BIBFRAME 簡版與Schema.org 落實LD,以網(wǎng)絡搜索引擎的曝光度及未來可能的KG應用服務為主要方向,同時也達成聯(lián)合目錄的效果。最后,發(fā)現(xiàn)圖情界對數(shù)據(jù)采取平行策略,一方面將MARC予以LD化;另一方面保留原始圖書館自動化系統(tǒng)的MARC數(shù)據(jù),且原始MARC數(shù)據(jù)未有任何改變。就實際的適用性而言,3種LD轉(zhuǎn)換方式各具特色,但適用情形大不相同。如果圖書館以提供多元化信息供使用者參考使用,則由外而內(nèi)的LD消費方式較為適合,包括書目本體批次LD化與關(guān)聯(lián)型MARC的LD化等兩種方式較為合適,但其缺點則是以圖書館目錄為范圍,并未主動將書目LD轉(zhuǎn)成符合網(wǎng)絡搜索引擎所需的結(jié)構(gòu)化數(shù)據(jù)。反之,如果以LD 發(fā)布為主要目的,除提供符合Schema.org 標準的結(jié)構(gòu)化數(shù)據(jù),用以列入網(wǎng)絡搜索引擎的索引與查詢范圍外,未來更可被豐富為KG與SG。另一方面,從KB的聯(lián)合目錄先后經(jīng)歷FRBR與BIBFRAME兩次不同的書目本體批次LD 化過程中,可發(fā)現(xiàn)MARC與LD并存的平行策略是多數(shù)現(xiàn)有圖情界采取的方式,兼具務實穩(wěn)定性與實驗開創(chuàng)性等雙重特征,畢竟最佳的LD型自動化系統(tǒng)與線上公用目錄仍在發(fā)展變動中。除此之外,如果仿效BNF同時導入書目本體批次LD化與Schema.org化方式,雖具備LD發(fā)布與消費雙重效益,所需成本也必須審慎評估。本文是從W3C LD工作手冊所規(guī)范的七大要素及其他項目,探討3種轉(zhuǎn)換方式的實際結(jié)果。從4個研究案例中發(fā)現(xiàn),此3種轉(zhuǎn)換方式各具特色與發(fā)展前景,可作為圖情界在評估轉(zhuǎn)MARC為LD時的重要參考。

      猜你喜歡
      數(shù)據(jù)模型書目本體
      Abstracts and Key Words
      哲學分析(2023年4期)2023-12-21 05:30:27
      推薦書目《初春之城》
      都市人(2022年3期)2022-04-27 00:44:57
      對姜夔自度曲音樂本體的現(xiàn)代解讀
      中國音樂學(2020年4期)2020-12-25 02:58:06
      面板數(shù)據(jù)模型截面相關(guān)檢驗方法綜述
      加熱爐爐內(nèi)跟蹤數(shù)據(jù)模型優(yōu)化
      電子測試(2017年12期)2017-12-18 06:35:36
      《我應該感到自豪才對》的本體性教學內(nèi)容及啟示
      文學教育(2016年27期)2016-02-28 02:35:15
      Care about the virtue moral education
      卷宗(2013年6期)2013-10-21 21:07:52
      面向集成管理的出版原圖數(shù)據(jù)模型
      本刊郵購書目
      一種顧及級聯(lián)時空變化描述的土地利用變更數(shù)據(jù)模型
      延边| 新丰县| 集安市| 龙井市| 鄂托克前旗| 曲麻莱县| 手游| 松江区| 罗田县| 房山区| 博兴县| 越西县| 阳东县| 治多县| 丰都县| 广西| 鄂伦春自治旗| 龙川县| 阿拉善左旗| 天祝| 敖汉旗| 达拉特旗| 鹤岗市| 巴林左旗| 富裕县| 绍兴市| 浮梁县| 祁门县| 牡丹江市| 安远县| 镇赉县| 谷城县| 美姑县| 英德市| 尚义县| 曲靖市| 南召县| 天台县| 汽车| 垫江县| 德格县|