楊 靜 楊 崢 蔣蓓蓓
(金陵圖書館 江蘇南京 210019)
BIBFRAME是由美國國會圖書館(Library of Congress,LC)聯(lián)合Zepheira公司于2011年發(fā)起的“書目框架先導計劃”,旨在開發(fā)一種替代MARC的書目數(shù)據(jù)格式[1]。BIBFRAME繼承了FRBR的思想,通過描述實體、屬性、實體間的層級關(guān)系來構(gòu)建模型,用來增強書目信息在Web環(huán)境中的發(fā)現(xiàn)。
2013年1月BIBFRAME1.0模型發(fā)布,提供了具體的元數(shù)據(jù)方案,并聯(lián)合德國國家圖書館、大英圖書館及聯(lián)機計算機圖書館中心(Online Computer Library Center,OCLC)等機構(gòu)進行了大量的測試和開發(fā),后于2016年1月發(fā)布了BIBRRAME2.0,版本發(fā)布后吸引了更多國家申請加入測試。目前其官網(wǎng)發(fā)布了BIBFRAME2.0與MARC21之間相互轉(zhuǎn)換工具、轉(zhuǎn)換規(guī)范、BIBFRAME編輯器、BIBFRAME2.0詞表等。
BIBFRAME2.0書目框架模型(見圖1)與之前的1.0版本最大的區(qū)別就是取消Authority(規(guī)范)和Annotation(注釋)兩個核心級別,新增Item(單件),即將所要描述的信息簡化為三個核心級別:Work(作品)、Instance(實例)和Item(單件),三者共同構(gòu)成了BIBFRAME2.0的三個層次,分別是Work(作品)代表的內(nèi)容層次,Instance(實例)代表的載體層次,和Item(單件)代表的單件層次,再通過定義相關(guān)的類、屬性、關(guān)系來對文獻資源進行富含語義的關(guān)系揭示[2]。
圖1 BIBFRAME2.0 書目框架模型
其中Work(作品)描述的是不同名稱以及不同表達方式的同一作品,是一個抽象的集合,具有subject(主題)、agent(代理)、event(事件)等屬性;Instance(實例)描述的是載體層次,是Work(作品)的具體化表現(xiàn),因為一個作品很可能包括很多實例,可能是電子版,也可能是印刷本,所以具有format(格式)和publisher(出版者)等屬性;Item(單件)通常理解為圖書館館藏信息的描述,如借閱狀態(tài)、副本信息等,該信息可以幫助用戶直接獲得所需資源,具有held by(持有者)和barcode(條形碼)等屬性。
BIBFRAME模型基于關(guān)聯(lián)數(shù)據(jù)技術(shù),注重描述實體之間、實體屬性之間的關(guān)系。如模型中Work(作品)、Instance(實例)和Item(單件)三個核心級別之間存在“has(有)”的關(guān)系,Work(作品)“有”Instance(實例),Instance(實例)“有”Item(單件)。還利用統(tǒng)一資源標識符(Uniform Resource Identifier,URI)來標識“作品”“實例”“單件”及其屬性,使書目數(shù)據(jù)實現(xiàn)在互聯(lián)網(wǎng)上的發(fā)布和共享。
雖然BIBFRAME誕生的目標就是為了取代MARC,但在目前還未開發(fā)完全的情況下,仍保持著與MARC的相互兼容,它繼承了MARC的語義性和一致性。美國國會圖書館在BIBFRAME官網(wǎng)上發(fā)布了BIBFRAME到MARC21的雙向轉(zhuǎn)換工具,并規(guī)定了轉(zhuǎn)換規(guī)范和轉(zhuǎn)換程序[3]。
在BIBFRAME2.0模型中,Work(作品)層次集合的是抽象的內(nèi)容,包含不同題名、不同語種或者不同表現(xiàn)形態(tài)的同一作品,具有subject(主題)、agent(代理)、event(事件)等屬性。Instance(實例)層次則描述的Work(作品)的具象內(nèi)容,具有fomart(格式)和publisher(出版者)等屬性。Work(作品)和Instance(實例)之間是1對n的關(guān)系[4],因為同一件作品可能包含多個實例,舉例來說,《不能說的秘密》這部作品在BIBFRAME2.0層級中屬于一個抽象內(nèi)容,因為它可以對應電影《不能說的秘密》、話劇《不能說的秘密》、電子書《不能說的秘密》、印刷本小說《不能說的秘密》等多個實例,于是每個實例又對應著不同的格式和出版者等屬性。將抽象層次和具象層次分開描述,同時給抽象和具象的內(nèi)容及其屬性都賦予URI,可以更準確地展示它們之間的關(guān)系,從而提高檢索的準確性和全面性。
雖然BIBFRAME的名稱叫書目框架模型,但其目標遠不止對于書目數(shù)據(jù)的描述,還包括地圖、數(shù)據(jù)集、靜態(tài)圖像、動態(tài)圖像、音頻、樂譜、舞譜、物體、多媒體、混合資料等多種形式的資源[5]。在各國的應用測試過程中,BIBFRAME官方也提供多種元數(shù)據(jù)映射方案,如MODS(元數(shù)據(jù)對象描述模型)、EAD(編碼檔案描述模型)、Pica+(荷蘭圖書館自動化中心,一種元數(shù)據(jù)格式)、DCMI(都柏林核心集)等,因此,BIBFRAME的適用范圍并不僅限于圖書館,還包括檔案館、博物館等機構(gòu)。
關(guān)聯(lián)數(shù)據(jù)四原則是萬維網(wǎng)的發(fā)明者蒂姆·伯納斯·李(Tim Berners Lee)于2006年提出的關(guān)于建立數(shù)據(jù)之間鏈接的四個原則,即給所有事物賦予一個URI;用HTTP URI來標識資源,使數(shù)據(jù)資源能夠在網(wǎng)絡(luò)環(huán)境下通過HTTP協(xié)議訪問獲??;訪問HTTP URI標識的資源時,可以根據(jù)標識的URI發(fā)現(xiàn)更有意義的相關(guān)資源;提供相關(guān)的URI鏈接,以便用戶可以發(fā)現(xiàn)更多的關(guān)聯(lián)對象[6]。在BIBFRAME2.0模型的設(shè)計中,也遵循了關(guān)聯(lián)數(shù)據(jù)四原則的內(nèi)涵,即不論在哪一個層級,不論是抽象還是具體的內(nèi)容,或是其各種屬性,都有一個HTTP URI來標識;BIBFRAME采用RDF(Resource Description Framework,資源描述框架)的編碼方式,當有人查詢一個URI時,使用標準的RDF提供與當前資源相關(guān)的其他有用信息;當發(fā)布書目數(shù)據(jù)時,與更多相關(guān)資源的HTTP URI建立語義鏈接,提高用戶發(fā)現(xiàn)、獲取和使用網(wǎng)絡(luò)中潛在的相關(guān)信息資源的能力。
2013年8月BIBFRAME官方發(fā)布了一份《BIBFRAME使用案例與需求》討論稿,里面提出了BIBFRAME的15個應用場景[7],這些應用場景不僅面向圖書館工作人員,也面向讀者,甚至是面向圖書館以外的機構(gòu)使用。以下將整合選取其中8個方面的內(nèi)容試做分析,展示基于關(guān)聯(lián)技術(shù)的BIBFRAME是如何揭示書目信息,簡化編目工作,并且使書目信息隨著網(wǎng)絡(luò)發(fā)揮前所未有的價值,使未來社會知識活動中的不同角色都能夠從書目信息中獲得支持和服務(wù)成為可能。
需要指出的是,BIBFRAME采用SPARQL語言作為查詢語言,即SPARQL Protocol and RDF Query Language的縮寫,專門用于訪問和操作RDF數(shù)據(jù)。W3C的RDF數(shù)據(jù)存取小組(RDF Data Access Working Group, RDAWG)對其進行了標準化。在2008年,SPARQL1.0成為W3C官方所推薦的標準,2013年發(fā)布了SPARQL1.1[8]。
BIBFRAME可以根據(jù)客戶端的地理信息方便地為用戶提供SoLoMo(社交本地移動)服務(wù)。例如,當讀者需要查找附近30英里以內(nèi)的一本書,就可以用SPARQL語句實現(xiàn):
SELECT ?work ?inst ?lib
WHERE {
?work bf:title "PhantomTollbooth"
?inst bf:instanceOf ?work
?holdings bf:holds ?inst
?holdings bf:heldBy ?lib
?lib gs:nearby(40.1583 83.0742 30) .
}
用戶輸入作品題名(bf:title "PhantomTollbooth"),查找條件為該作品的某些實例(bf:inst a nceO f?work),通過用戶查詢的設(shè)備定位坐標(40.1583 83.0742 30),查找出符合距離條件的圖書館館藏(?holdings bf:heldBy ?lib)。其實這種SoLoMo服務(wù)早已根植于各類互聯(lián)網(wǎng)應用中了,是一種基于本地的移動社交概念,如大眾點評APP中,用戶可以根據(jù)某一位置查找附近某一距離內(nèi)的餐飲、景點、住宿、休閑等服務(wù),并可以按照距離、評價等順序排列。同樣,BIBFRAME書目框架模型也可以根據(jù)客戶端的地理信息方便地為用戶提供SoLoMo服務(wù),甚至設(shè)想可以加入距離內(nèi)實體書店、檔案館、博物館的關(guān)聯(lián)數(shù)據(jù)搜索結(jié)果,只要他們同樣采用BIBFRAME對書目、檔案、藏品進行編目,由此可以增加用戶發(fā)現(xiàn)資源、獲取資源的途徑。
用戶在查找圖書館館藏的某件作品時,BIBFRAME會優(yōu)先顯示適應當前設(shè)備的實例類型,如手機端、平板端就會推薦電子資源。用SPARQL語句實現(xiàn)如下:
SELECT ?work ?inst ?lib
WHERE {
?work bf:title "Fahrenheit451"
?work bf:hasInstanceOf ?inst
?inst rdf:type bf:Ebook
?inst bf:fomat
}
當讀者需要找一本Fahrenheit451的書時,BIBFRAME根據(jù)當前設(shè)備的情況優(yōu)先顯示Ebook資源種類,于是顯示了一本來源于idpf網(wǎng)站上epub格式的電子資源實例。
目前,國內(nèi)外的圖書館幾乎采用的都是MARC格式的編目格式,其檢索方式一般為:用戶查詢某作品,須先進入圖書館OPAC檢索平臺,根據(jù)所選擇的題名、責任者、主題詞等檢索點,才能檢索出與MARC字段相對應的結(jié)果,在檢索結(jié)果頁面可以獲得該作者在本OPAC系統(tǒng)上的其他作品鏈接,國內(nèi)用戶可獲得豆瓣、當當、谷歌讀書等網(wǎng)絡(luò)社區(qū)關(guān)于本作品討論、書評、購買的鏈接。而BIBFRAME以數(shù)據(jù)關(guān)聯(lián)技術(shù)為基礎(chǔ),以URI來標識“作品”或者其“主題”“代理”“事件”等屬性,采用RDF數(shù)據(jù)建模,能夠使書目數(shù)據(jù)易于被萬維網(wǎng)識別和處理,擴大檢索范圍,提高檢索結(jié)果的質(zhì)量。
BIBFRAME的設(shè)計比一般的書目格式更具開放性,不僅在圖書館領(lǐng)域,在檔案館、博物館等機構(gòu)同樣適用,因為它可以描述文本、地圖、數(shù)據(jù)集、靜態(tài)圖像、動態(tài)圖像、音頻、樂譜、舞譜、物體、多媒體、混合資料共11種資源類型,其對某一資源的檢索結(jié)果可以是全方位、多元化的立體屬性。同時為MARC、MODS、RDA、FRBR等多種元數(shù)據(jù)提供映射方案,為BIBFRAME連接世界打開了一扇窗戶[9]。
可以設(shè)想當用戶檢索某一歷史人物時,不僅可以檢索到有關(guān)該歷史人物在圖書館里的單一文本形式的文獻資源,還可以獲得圖書館外的資源,例如博物館里與該人物關(guān)聯(lián)的歷史事件、考古挖掘、出土文物,檔案館里與該人物關(guān)聯(lián)的手稿、作品、檔案,甚至是視頻網(wǎng)站上與該人物關(guān)聯(lián)的影視作品等全方位的檢索結(jié)果。這類似于維基百科的詞條,可以通過鏈接自由跳轉(zhuǎn)到我們感興趣的對象或者內(nèi)容上去。
BIBFRAME另一方面也簡化了編目人員的工作流程。如果編目人員獲得一件作品,是The Shadow Club的電子資源,作者是Neal Shusterman,需要將其添加至本地圖書館,那么編目人員只要在圖書館聯(lián)合編目系統(tǒng)中搜索到關(guān)于該作者的所有電子資源,將符合條件的實例拷貝到本地,賦予一個本地URI并添加它與本地作品的關(guān)系,同時為該實例添加item(單件),即館藏信息URI。
當一件作品原作用A語種出版后,可能會被翻譯成B語種、C語種、D語種……全球發(fā)行,那么在書目信息中就需要經(jīng)常更新信息,在BIBFRAME中,作品Work是以HTTP URI來標識的,具有唯一性和共享性,全球各地的圖書館員都可以通過互聯(lián)網(wǎng),引用該作品的書目信息。當有新的語種信息產(chǎn)生時,只需要通過觸發(fā)器(Trigger),向原作品擁有者發(fā)出通知[10],例如作者Kurt Vonnegut的作品Bluebread被翻譯成了印地語,那么印度的圖書館員便會操作如下:
(1)在網(wǎng)絡(luò)上的BIBFRAME規(guī)范控制服務(wù)中查詢該作品的原作者。
…
bf:title”Bluebread”
(2)拷貝該作品書目信息到本地,賦予一個本地的URI,編輯添加本地語種信息。
a bf:Monograph;
bf:title”Barbablu”;
bf:author< http://bibframe.org/auth/people/kurt_vonnegut>;
bf:translator
BIBFRAME中圖書館采訪人員在文獻采購階段就可以率先開始部分編目工作了。由于采購人員在流程一開始就已經(jīng)知道了采訪對象的基本信息,所以可以先行在采購目錄中添加“Work”(作品)、“Instance”(實例)、“Item”(單件)等部分信息,讀者在查詢時也可以看到某作品或?qū)嵗幱凇皁n order”(已訂購)的狀態(tài)。當編目人員正式開始編目時,會發(fā)現(xiàn)聯(lián)合編目系統(tǒng)中已經(jīng)有新采購資源的部分書目信息,這就是前期采訪人員所添加的,此時,編目人員只需接受更新,便會大大減少后期編目工作量。
(1)采訪人員在聯(lián)機編目系統(tǒng)中查找采購訂單上的作品和實例。
在編目人員拿到具體實例之后就可以繼續(xù)添加館藏地(bf:physicalLocation)、分類號(bf:shelfMarkCLC)等單件信息。
在MARC編目中,編目信息之間缺乏關(guān)聯(lián),無法識別用戶語義檢索的需求。如在某圖書館的OPAC檢索系統(tǒng)中,責任者輸入“冰心”,可以檢索到368條記錄,而輸入“謝婉瑩”則僅搜到2條記錄,且不是同一個人。而在BIBFRAME中,可以利用關(guān)聯(lián)數(shù)據(jù)中owl:sameAs在不同規(guī)范實體間建立等同關(guān)系。
這樣,當讀者檢索謝婉瑩時,也能檢索到冰心的作品。
BIBFRAME的問世,表明了圖書館界也在積極順應技術(shù)進步和社會需求,利用關(guān)聯(lián)技術(shù)深度揭示書目信息所蘊含的知識,挖掘書目信息的價值,使其不再“藏于深閨”。這不僅是對圖書館內(nèi)部的采訪、編目、參考咨詢等業(yè)務(wù)在工作流程上的全方位的革新,更是對圖書館人工作、服務(wù)理念的轉(zhuǎn)變,圖書館人要著眼于服務(wù)知識生產(chǎn)、傳播、消費等全生態(tài)鏈條,使知識生產(chǎn)、文化交流中的不同角色都能夠在圖書館得到供需適配的支持和服務(wù)。
BIBFRAME在美國國會圖書館、Zepheira公司、聯(lián)機計算機圖書館中心以及高校圖書館的共同合作下持續(xù)完善。在2021年冬季召開的年會上,美國國會圖書館宣布BIBFRAME 100計劃的目標調(diào)整為“成功達成80%—90%的編目員使用BIBFRAME編目”。從新生事物的演化規(guī)律來看,一項事物一旦突破了關(guān)鍵技術(shù)的制約,就會迅速和蓬勃的發(fā)展,BIBFRAME具有遠超MACR的諸多優(yōu)勢和廣闊前景。目前我國僅有上海圖書館的家譜知識平臺,以關(guān)聯(lián)數(shù)據(jù)技術(shù)為基礎(chǔ),設(shè)計了BIBFRAME家譜本體,以及華東師范大學的數(shù)字方志集成平臺基于BIBFRAME2.0等詞表構(gòu)建數(shù)字方志知識庫本體模型,并正式上線服務(wù)。所以,我國圖書情報界必須盡快達成共識,搶抓機遇、乘勢而上,積極開展相關(guān)研究和國際交流,為我國“智慧圖書館”乃至“智慧社會”建設(shè)作出更大貢獻。