?!《?,華蘇永
館藏資源底層通用整體數(shù)據(jù)關(guān)聯(lián)模型研究*
常娥,華蘇永
細(xì)粒度、語義化和開放性是館藏資源組織的三大需求。文章借鑒各種知識組織理論與方法,尤其是關(guān)聯(lián)數(shù)據(jù)技術(shù),嘗試構(gòu)建館藏資源底層數(shù)據(jù)整體關(guān)聯(lián)的通用架構(gòu)。該模型由資源層、知識層和中間層等三層關(guān)聯(lián)結(jié)構(gòu)構(gòu)成,提供更加一般化、普適性的資源組織框架,以充分滿足館藏資源、知識單元各自及其之間各種復(fù)雜的語義關(guān)系深度揭示與表達(dá)的需求。
知識組織關(guān)聯(lián)數(shù)據(jù)通用模型
引用本文格式常娥,華蘇永.館藏資源底層通用整體數(shù)據(jù)關(guān)聯(lián)模型研究[J].圖書館論壇,2016(8):7-12.
面對信息環(huán)境的變遷,圖書館館藏資源正發(fā)生著深刻的變化,主要表現(xiàn)在3個方面:(1)館藏資源發(fā)展迅猛、分布離散,成為集紙質(zhì)文獻(xiàn)資料、電子資源和網(wǎng)絡(luò)資源于一體的綜合館藏資源體系;(2)館藏文獻(xiàn)資源基本完成由紙質(zhì)文獻(xiàn)到數(shù)字化資源的轉(zhuǎn)換,并將不斷朝著數(shù)據(jù)化的方向發(fā)展;(3)館藏資源的類型不斷拓展,不僅包括圖書、期刊、報(bào)紙、手稿、研究數(shù)據(jù)等實(shí)際館藏資源,還包括建立在實(shí)際館藏資源之上的各種描述,即衍生館藏資源,如書目數(shù)據(jù)、各種元數(shù)據(jù)方案、主題表、分類表以及規(guī)范文檔[1]。
大數(shù)據(jù)時代,館藏資源從形態(tài)到內(nèi)容都發(fā)生了深刻變化,這給館藏資源組織與利用帶來重大挑戰(zhàn)。圖書館試圖從系統(tǒng)層面、元數(shù)據(jù)層面乃至資源層面將各種資源加以融合,然而無論是資源導(dǎo)航、OPAC整合、資源發(fā)現(xiàn)系統(tǒng)、網(wǎng)絡(luò)信息聚合或信息共享空間等整合方式,均在數(shù)據(jù)融合范圍、深度及效果等方面不盡如人意。關(guān)聯(lián)數(shù)據(jù)(Linked Data)為突破館藏資源組織困境提供了全新的思路,借助關(guān)聯(lián)數(shù)據(jù)技術(shù)以細(xì)粒度、語義化、開放關(guān)聯(lián)的方法組織各類館藏資源,繼而進(jìn)行知識的深度挖掘、發(fā)現(xiàn)與利用,已成為圖書情報(bào)學(xué)界研究的熱點(diǎn)問題。然而關(guān)聯(lián)數(shù)據(jù)的實(shí)際應(yīng)用離不開知識本體的支持,因此目前圖書館界首先要解決的問題是盡快建立館藏資源底層整體數(shù)據(jù)關(guān)聯(lián)的通用框架,以實(shí)現(xiàn)網(wǎng)絡(luò)環(huán)境下圖書館資源動態(tài)、關(guān)聯(lián)、開放與多維的揭示與利用。
早在20世紀(jì)60年代,英國著名情報(bào)學(xué)家布魯克斯就指出了文獻(xiàn)組織與知識組織的區(qū)別,并認(rèn)為理想的知識組織是對文獻(xiàn)中的知識單元進(jìn)行分析,找到人們創(chuàng)造與思考的相互影響與聯(lián)系的結(jié)點(diǎn)[2]。但學(xué)者們同樣敏銳地意識到,文獻(xiàn)資源組織的實(shí)質(zhì)就是一種知識組織[3],文獻(xiàn)資源組織和知識組織只是組織層次的區(qū)分而已[4]。文獻(xiàn)資源組織和知識組織既有聯(lián)系,又有區(qū)別。文獻(xiàn)資源組織主要依據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)對文獻(xiàn)資源外部特征信息進(jìn)行組織,而知識組織主要依據(jù)各種知識組織系統(tǒng)對文獻(xiàn)資源內(nèi)部知識進(jìn)行組織。
根據(jù)布魯克斯的設(shè)想,利用知識單元之間的邏輯關(guān)系表達(dá),可將文獻(xiàn)資源網(wǎng)絡(luò)轉(zhuǎn)變?yōu)橛芍R單元直接連接的概念網(wǎng),這是一種理想的知識組織狀態(tài),是知識組織的最高目標(biāo)。如果實(shí)現(xiàn)了文獻(xiàn)資源的全語義化表達(dá),在知識網(wǎng)絡(luò)中即可進(jìn)行各種知識單元的檢索、推理和整合,那么知識網(wǎng)絡(luò)是否可取代文獻(xiàn)資源本身呢?這一問題值得我們思考。如果答案是肯定的,那么則無需在知識組織模型中建立知識單元與文獻(xiàn)資源之間的關(guān)聯(lián),反之則需要建立這種聯(lián)系,因此,這一問題的答案直接影響著館藏資源知識組織模型的整體設(shè)計(jì)。
本文認(rèn)為,無論知識網(wǎng)絡(luò)中建立了多么豐富的關(guān)聯(lián),它始終無法取代文獻(xiàn)資源本身,原因在于:知識即聯(lián)系,對知識的組合與拆分形成了不同粒度的知識單元。文獻(xiàn)本身就是一種知識單元,它是由人腦對細(xì)粒度知識單元進(jìn)行分析、推理與綜合等創(chuàng)造性活動后,得到的粗粒度知識單元。為了區(qū)分知識單元的粒度,一般使用文獻(xiàn)代替粗粒度知識單元,使用知識單元代替細(xì)粒度知識單元。對于知識服務(wù)而言,何種粒度的知識單元最合適,目前學(xué)術(shù)界還未形成定論。從學(xué)術(shù)研究層面而言,文獻(xiàn)的略讀和精讀一直都是交替進(jìn)行的,計(jì)算機(jī)還無法取代人腦進(jìn)行知識創(chuàng)新。因此,文獻(xiàn)資源在過去、現(xiàn)在及未來都是人類最寶貴的知識資源。
王松林認(rèn)為,目前文獻(xiàn)資源仍是圖書館的組織對象[5],這是圖書情報(bào)學(xué)科與其他領(lǐng)域知識組織研究的重要區(qū)別。然而,館藏資源組織不能僅停留在傳統(tǒng)元數(shù)據(jù)方式的信息組織層面,而是要深入資源內(nèi)容層面進(jìn)行知識組織,這一點(diǎn)毋庸置疑。伴隨著大量數(shù)字化科研成果的產(chǎn)出,館藏資源不僅有圖書、期刊、學(xué)術(shù)博客、研究數(shù)據(jù)等眾多記錄形式,而且往往以復(fù)合數(shù)字對象的形式存在[6],需要同時處理文獻(xiàn)資源、知識單元各自及其之間的各種復(fù)雜關(guān)聯(lián)關(guān)系。
圖書館學(xué)領(lǐng)域一直致力于尋求文獻(xiàn)、信息和知識序化與關(guān)聯(lián)的最佳組織模型,從早期的目錄索引,到MARC機(jī)讀目錄、DC元數(shù)據(jù)標(biāo)準(zhǔn)、本體模型(Ontology),再到關(guān)聯(lián)數(shù)據(jù)。以MARC機(jī)讀目錄為代表的現(xiàn)行元數(shù)據(jù)標(biāo)準(zhǔn),是一種以文獻(xiàn)為基本單位的粗粒度資源組織方法,因無法解決資源描述的異構(gòu)性和語義性問題[7],所以無法使圖書館擺脫信息孤島的束縛。而本體模型雖可實(shí)現(xiàn)圖書館資源的語義化描述和知識組織,但在資源關(guān)聯(lián)的廣度和深度上未能提供更多的幫助。此外,元數(shù)據(jù)方法和本體模型,均不支持資源的開放獲取。
近年來,關(guān)聯(lián)數(shù)據(jù)技術(shù)的迅猛發(fā)展,以及圖書館界新一代編目標(biāo)準(zhǔn)RDA的發(fā)展,為館藏資源最佳組織模型的探尋指明了新的發(fā)展方向。然而關(guān)聯(lián)數(shù)據(jù)僅僅是一個技術(shù)框架,在此基礎(chǔ)之上還需融入元數(shù)據(jù)和本體模型,以解決資源描述的異構(gòu)性和語義性問題,進(jìn)行知識與資源的深度關(guān)聯(lián)。美國、德國、法國、瑞典等國家圖書館紛紛發(fā)布了包含書目、規(guī)范主題詞、規(guī)范人名等資源在內(nèi)的關(guān)聯(lián)數(shù)據(jù)集[8]。由于這些數(shù)據(jù)集以特定館藏資源為對象,缺乏整體的數(shù)據(jù)關(guān)聯(lián)框架,因此數(shù)據(jù)集關(guān)聯(lián)的范圍和程度有限,有些僅是內(nèi)部關(guān)聯(lián),與非圖書館數(shù)據(jù)集的粘合度并不高,難以成為開放數(shù)據(jù)網(wǎng)絡(luò)中的交通樞紐或核心節(jié)點(diǎn)。
以FRBR模型為核心的新一代編目標(biāo)準(zhǔn)RDA,正處于實(shí)施與應(yīng)用的初級階段[9],雖設(shè)計(jì)了關(guān)聯(lián)準(zhǔn)備,然而如何利用關(guān)聯(lián)數(shù)據(jù)技術(shù)為RDA的元素、概念詞表及其相互關(guān)系提供表達(dá)、描述和管理——是選擇將完整的RDA編目數(shù)據(jù)發(fā)布為關(guān)聯(lián)數(shù)據(jù),抑或選擇其核心元素進(jìn)行轉(zhuǎn)換,仍需進(jìn)一步研究[10]。
國內(nèi)在理論研究方面主要是國外關(guān)聯(lián)數(shù)據(jù)的概念、技術(shù)框架、典型數(shù)據(jù)集等相關(guān)研究的引介以及我國圖書館利用關(guān)聯(lián)數(shù)據(jù)重組館藏資源開展知識服務(wù)的思考[11-12]。學(xué)者們對于關(guān)聯(lián)數(shù)據(jù)的發(fā)布與消費(fèi)技術(shù)、開放應(yīng)用協(xié)議等進(jìn)行了分析[13-15],并探討了基于關(guān)聯(lián)數(shù)據(jù)的館藏?cái)?shù)字資源語義聚合模型[16-17]。在應(yīng)用實(shí)踐方面,雖然國內(nèi)尚未有圖書館徹底將書目資源發(fā)布為關(guān)聯(lián)數(shù)據(jù)集[18],關(guān)聯(lián)數(shù)據(jù)中樞Datahub中收錄的中文關(guān)聯(lián)數(shù)據(jù)集極少,但上海圖書館和中國科學(xué)技術(shù)信息研究所等機(jī)構(gòu)搭建了關(guān)聯(lián)數(shù)據(jù)實(shí)驗(yàn)系統(tǒng),其中上海圖書館在2015年底將家譜數(shù)據(jù)發(fā)布為關(guān)聯(lián)數(shù)據(jù),并于2016年3月首家率先推出提供了標(biāo)準(zhǔn)消費(fèi)接口的家譜關(guān)聯(lián)數(shù)據(jù)開放平臺,以提供家譜數(shù)據(jù)的開發(fā)與利用[19],這標(biāo)志著我國圖書館界對于關(guān)聯(lián)數(shù)據(jù)的研究已經(jīng)進(jìn)入應(yīng)用階段。
總體來說,關(guān)聯(lián)數(shù)據(jù)為館藏資源細(xì)粒度、語義關(guān)聯(lián)的開放組織奠定了技術(shù)基礎(chǔ),國內(nèi)對于關(guān)聯(lián)數(shù)據(jù)的應(yīng)用實(shí)踐剛剛起步,還處于借鑒國外先進(jìn)經(jīng)驗(yàn)階段。
館藏資源的組織不能僅停留在傳統(tǒng)元數(shù)據(jù)方式的信息組織層面,而是要深入到資源的知識內(nèi)容層面。從文獻(xiàn)資源的整體揭示與組織,深化到文獻(xiàn)中的數(shù)據(jù)、公式、事實(shí)、結(jié)論等知識單元的關(guān)聯(lián)組織,這是科技進(jìn)步與發(fā)展帶來的必然結(jié)果。然而,在知識控制單位重心發(fā)生轉(zhuǎn)變的過程中,并不是非此即彼的,需用全面的視角來研究知識單元與文獻(xiàn)資源間的組織與關(guān)聯(lián),即需揭示和表達(dá)文獻(xiàn)資源、知識單元各自及其之間的三重復(fù)雜語義關(guān)聯(lián),以滿足知識整體且快速的聯(lián)通,以及檢索與發(fā)現(xiàn)的功能。
因此,本文在綜合借鑒各種知識組織理論與方法,充分考慮與現(xiàn)有相關(guān)元數(shù)據(jù)標(biāo)準(zhǔn)的兼容性,在FRBR/FRAD/FRSAD三者集成與擴(kuò)展的綜合概念框架之上,通過引入包含研究背景、材料方法、模型假設(shè)、實(shí)驗(yàn)數(shù)據(jù)、結(jié)果討論等項(xiàng)目的學(xué)術(shù)元數(shù)據(jù)框架,構(gòu)建圖書館資源底層通用的整體數(shù)據(jù)關(guān)聯(lián)模型(Bottom Common Organization Model of the Whole Library Knowledge Resource,以下簡稱“BCOM模型”),詳見圖1。BCOM模型為館藏資源、知識單元各自及其之間的各種復(fù)雜語義關(guān)系建立了3層關(guān)聯(lián)結(jié)構(gòu),即資源層、知識層和中間層,極大地增強(qiáng)了館藏資源數(shù)據(jù)關(guān)聯(lián)網(wǎng)絡(luò)的整體連通性,無論是從資源出發(fā),還是從知識單元出來,都能迅速關(guān)聯(lián)并發(fā)現(xiàn)用戶所需的知識或資源。
圖1 底層通用的整體數(shù)據(jù)關(guān)聯(lián)模型
3.1資源關(guān)聯(lián)層
該層主要揭示資源與資源之間的關(guān)聯(lián)關(guān)系。在DC、MARC等傳統(tǒng)資源組織模型中,資源之間的關(guān)聯(lián)關(guān)系是粗糙的、隱含的。例如,DC模型通過“相關(guān)”屬性建立了資源之間的關(guān)聯(lián),然而沒有具體定義資源間語義關(guān)系的類型。在BCOM模型中,將資源關(guān)聯(lián)作為獨(dú)立層次進(jìn)行構(gòu)建,以增進(jìn)資源之間關(guān)系的語義表達(dá)與快速連通。
BCOM模型將采用RDF框架和URI標(biāo)識符描述資源之間的關(guān)系,即以“資源-屬性-值”三元組形式進(jìn)行描述,并對第一組元“資源”賦予URI號碼。由于該層描述的是資源與資源之間的關(guān)系,因此第三組元“屬性值”的取值是資源,同樣應(yīng)賦予URI號碼。資源關(guān)聯(lián)層主要通過文獻(xiàn)之間的引用與概念同現(xiàn)建立關(guān)聯(lián)。
3.2資源與知識關(guān)聯(lián)層
該層又稱為中間層,主要揭示資源與知識單元之間的關(guān)聯(lián)關(guān)系,在同現(xiàn)關(guān)聯(lián)的基礎(chǔ)上,附加學(xué)術(shù)元數(shù)據(jù)和書目元數(shù)據(jù),建立各種語義關(guān)聯(lián)。
在中間層,BCOM模型致力于將資源的內(nèi)容特征描述深入化,同時兼顧外部特征描述,從而形成了學(xué)術(shù)元數(shù)據(jù)和書目元數(shù)據(jù)這兩套不同的元數(shù)據(jù)標(biāo)準(zhǔn)。其中書目元數(shù)據(jù)主要借鑒和吸收了MARC和DC相關(guān)元數(shù)據(jù)項(xiàng),用以描述資源外部特征,而學(xué)術(shù)元數(shù)據(jù)則將重點(diǎn)探尋比關(guān)鍵詞方式要具體,比文獻(xiàn)資源本身要凝練的一種內(nèi)容表達(dá)框架。換言之是將MARC和DC中的關(guān)鍵詞和分類號等主題描述元素項(xiàng)抽取出來,進(jìn)行具體化,以充分揭示資源的主題內(nèi)容。
在中間層,BCOM模型仍將采用RDF框架和URI標(biāo)識符描述資源與知識之間的關(guān)聯(lián)關(guān)系,其中第二組元“屬性”即為學(xué)術(shù)元數(shù)據(jù)項(xiàng)和書目元數(shù)據(jù)項(xiàng),第三組元“屬性值”的取值是知識單元。知識單元是否應(yīng)設(shè)置URI標(biāo)識符的問題將在下一小節(jié)中討論。
3.3知識關(guān)聯(lián)層
該層主要揭示了知識單元之間的關(guān)聯(lián)關(guān)系。無論是復(fù)雜的知識組織系統(tǒng)(知識本體),還是簡單的知識組織系統(tǒng)(詞表),語義關(guān)系主要包含等級關(guān)系、等同關(guān)系、相關(guān)關(guān)系和并列關(guān)系這4種類型。不同學(xué)科領(lǐng)域?qū)@4種類型語義關(guān)系進(jìn)行更加細(xì)致、具體而深入地表達(dá),從而構(gòu)建了各種領(lǐng)域知識本體。
在知識層,BCOM模型將融合FRAD與FRSAD模型中的人、機(jī)構(gòu)、概念、實(shí)物、事件、地點(diǎn)等概念,以及FRBR模型中的作品層概念,重新梳理、定義各知識概念間的基本語義關(guān)系。所謂基本語義關(guān)系是指與領(lǐng)域無關(guān)的事物之間通用的語義關(guān)系,包括人物關(guān)系、地點(diǎn)關(guān)系、時間關(guān)系,以及通用主題概念關(guān)系等。此外,BCOM模型將采用開放的方式,逐步構(gòu)建領(lǐng)域知識本體,以進(jìn)一步豐富知識層概念之間的語義關(guān)系。
值得一提的是,科學(xué)研究數(shù)據(jù)是一個特例,它既可歸屬于資源層,又可歸屬于知識層。本研究將從文獻(xiàn)(著作、論文)中分解出的研究數(shù)據(jù)作為知識單元,利用學(xué)術(shù)元數(shù)據(jù)框架與資源層文獻(xiàn)進(jìn)行關(guān)聯(lián)和映射,而將圍繞某項(xiàng)科學(xué)研究,實(shí)驗(yàn)前后所產(chǎn)生的一系列、整套數(shù)據(jù)作為一種資源,除了在資源層利用引用和同現(xiàn)方式建立各種關(guān)聯(lián)外,還將利用書目元數(shù)據(jù)框架與知識層概念建立聯(lián)結(jié)。
在知識層,BCOM模型仍將采用RDF框架和URI標(biāo)識符描述知識間的關(guān)聯(lián)關(guān)系,其中第二組元“屬性”除了包含基本語義關(guān)系外,還將包含各種領(lǐng)域概念關(guān)系,第一組元“資源”和第三組元“屬性值”的取值都是知識單元。由于該層包含人、機(jī)構(gòu)、實(shí)物、地點(diǎn)、時間、事件等各種知識概念,對其進(jìn)行規(guī)范控制十分必要,因此BCOM模型對存在同義現(xiàn)象的知識單元將賦予URI符號進(jìn)行標(biāo)識,以解決語義異構(gòu)問題。
1998年國際圖聯(lián)構(gòu)建FRBR本體模型,定義書目描述的4層結(jié)構(gòu),即“作品(work)-內(nèi)容表達(dá)(expression)-載體表現(xiàn)(manifestation)-單件(item)”。RDA是FRBR模型的實(shí)踐者,因此RDA中的元素設(shè)計(jì)全部與FRBR模型的層次結(jié)構(gòu)相對應(yīng)。然而有機(jī)構(gòu)和學(xué)者始終認(rèn)為RDA過于復(fù)雜,對其推廣與應(yīng)用前景十分擔(dān)憂。2011年,美國國會圖書館(LC)設(shè)計(jì)并推出了新的書目框架計(jì)劃BIBFRAME(Bibliographic Framework Initiative),它將FRBR模型中的4層結(jié)構(gòu)簡化為“作品(work)-實(shí)例(instance)”兩層結(jié)構(gòu),并且增加規(guī)范數(shù)據(jù)(authority)和注釋數(shù)據(jù)(annotation)以適應(yīng)規(guī)范控制和擴(kuò)展描述的需求[20]。
顯然,BIBFRAME是作為RDA的競爭者出現(xiàn)的,BIBFRAME對RDA的概念層次進(jìn)行了簡化,與RDA不完全一致。然而這種簡化其實(shí)是一種更一般化,使得BIBFRAME成為一個更大的容器,對其進(jìn)行擴(kuò)展,完全可以容納FRBR模型所有的描述功能。同時,BIBFRAME還吸收了MARC/MODS、DC、Schema.org中的元素定義,共設(shè)計(jì)了約300個屬性,分屬52個類。
然而BIBFRAME的開發(fā)尚未完成,還存在許多不確定性,主要是規(guī)范控制和注釋模型的爭議較大。2015年6月,在BIBFRAME詞表修訂中,LC曾建議取消規(guī)范控制類及其屬性,將規(guī)范原有子類直接歸屬于頂級類資源,如將ISBN等均作為頂級類[21]。由此可見,國際圖聯(lián)、美國國會圖書館,以及OCLC對于開放數(shù)據(jù)時代,以關(guān)聯(lián)數(shù)據(jù)為基礎(chǔ)的館藏資源描述與組織框架仍在不斷探索之中,誰也無法預(yù)言RDA和BIBFRAME最終發(fā)展形態(tài)。
無論是RDA,還是BIBFRAME,都將資源與知識單元放在同一個層次進(jìn)行討論,未深入揭示資源的主題內(nèi)容,并且對于主題概念間的關(guān)系描述較弱,仍側(cè)重書目關(guān)系描述。BCOM模型則將資源與知識單元分層處理,單獨(dú)構(gòu)建了資源層、知識層關(guān)聯(lián),并將資源的內(nèi)容特征描述和外部特征描述進(jìn)行分離,形成中間層元數(shù)據(jù)標(biāo)準(zhǔn)。這不僅強(qiáng)化了資源主題內(nèi)容的揭示功能和主題概念關(guān)系的描述功能,而且增強(qiáng)了整個資源組織框架在資源層和知識層的整體連通性。這是BCOM模型相比于RDA和BIBFRAME模型的重要區(qū)別。
此外,除了增強(qiáng)館藏資源數(shù)據(jù)網(wǎng)絡(luò)的整體連通性外,BCOM模型還具有一定的領(lǐng)域通用性,主要體現(xiàn)在以下3個方面:(1)資源層、知識層和中間層,這3層架構(gòu)對于任何領(lǐng)域的資源組織都是通用的,利用BCOM模型無論是從資源,還是從知識單元出來,都能迅速關(guān)聯(lián)并發(fā)現(xiàn)用戶所需知識或文獻(xiàn)資源;(2)學(xué)術(shù)元數(shù)據(jù)框架和書目元數(shù)據(jù)框架也是領(lǐng)域通用的,旨在連通資源層與知識層;(3)采用RDF和URI描述資源、知識概念及其之間各種語義關(guān)系,滿足了通用、語義化、開放與互聯(lián)的需求。
最后,值得一提的是,由于RDA和BIBFRAME框架側(cè)重資源外部書目屬性表達(dá),因此其語義關(guān)系是相對固定的,而BCOM模型則將具有學(xué)科差異性,因?yàn)橐胪耆l(fā)揮BCOM模型資源組織與發(fā)現(xiàn)的功能,需強(qiáng)化知識層概念語義關(guān)系的表達(dá)。BCOM模型在知識層將采用完全開放的形式,構(gòu)建各種領(lǐng)域知識本體,以豐富知識層各種語義關(guān)系的表達(dá)。未來本研究將借鑒BIBFRAME和DCMI應(yīng)用綱要機(jī)制,制定BCOM模型的領(lǐng)域綱要,以適應(yīng)特定領(lǐng)域知識本體的構(gòu)建需要。綱要將規(guī)定領(lǐng)域知識如何繼承和分解,可以復(fù)用哪些詞表和屬性等,使BCOM成為一個更大的通用“容器”。
現(xiàn)代研究表明,大腦神經(jīng)細(xì)胞的數(shù)量約有150億之多,它們之間形成了極其復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),彼此溝通,相互影響,每個細(xì)胞與其他細(xì)胞可產(chǎn)生2000多種聯(lián)系[22]??茖W(xué)知識存在普遍聯(lián)系,序化并還原知識間的連接關(guān)系是知識組織的重要目標(biāo)。相比于人類神經(jīng)細(xì)胞間的廣泛聯(lián)系,在傳統(tǒng)人工組織的知識系統(tǒng)中,每個知識節(jié)點(diǎn)與其他節(jié)點(diǎn)的聯(lián)系卻十分有限,遠(yuǎn)遠(yuǎn)無法滿足知識普遍聯(lián)系、高速傳遞的需要。因此,需要對粗粒度的知識進(jìn)行碎片化處理與挖掘,提取出研究對象、背景、問題、目標(biāo)、方法、過程、結(jié)果、結(jié)論、討論;分析出概念、原理、觀點(diǎn)、規(guī)范、標(biāo)準(zhǔn)、設(shè)計(jì)、技巧、事實(shí)、數(shù)據(jù)、人物等知識單元,并揭示文獻(xiàn)資源、知識單元各自及其之間的各種復(fù)雜語義關(guān)聯(lián),從而構(gòu)建復(fù)雜知識關(guān)聯(lián)網(wǎng)絡(luò),以使文獻(xiàn)資源及其所承載的知識在開放數(shù)據(jù)網(wǎng)絡(luò)中,得到廣泛而深入的利用。有鑒于此,綜合借鑒各種知識組織理論與方法,尤其是關(guān)聯(lián)數(shù)據(jù)技術(shù),本文嘗試構(gòu)建館藏資源底層整體數(shù)據(jù)關(guān)聯(lián)的通用架構(gòu),即通用數(shù)據(jù)關(guān)聯(lián)模型BCOM,該模型旨在提供更加一般化、普適性的資源組織框架,以充分滿足館藏資源、知識單元各自及其之間各種復(fù)雜語義關(guān)系的深刻揭示與表達(dá)需求。BCOM模型通過豐富知識節(jié)點(diǎn)間的聯(lián)系,使人工知識網(wǎng)絡(luò)盡可能接近真實(shí)、客觀存在的知識網(wǎng)絡(luò),以促進(jìn)知識廣泛而深入的利用。
[1]常娥,孟祥保.圖書館資源組織中的數(shù)據(jù)關(guān)聯(lián)特征研究[J].圖書館論壇,2016(2):49-56.
[2]文庭孝,劉曉英,劉進(jìn)軍.知識關(guān)聯(lián)的理論基礎(chǔ)研究[J].圖書館,2010(4):9-11.
[3]王子舟,王碧瀅.知識的基本組分——文獻(xiàn)單元和知識單元[J].中國圖書館學(xué)報(bào),2003(1):5-11.
[4][5]王松林.圖書館組織對象及其層次研究[J].中國圖書館學(xué)報(bào),2010(1):40-44.
[6]白海燕.基于關(guān)聯(lián)數(shù)據(jù)的信息組織深度序化初探[EB/OL].[2016-03-23].http://www.caigou.com.cn/ lib/ziliao_detail.asp?id=20201.
[7]劉煒,李大鈴,夏翠娟.元數(shù)據(jù)與知識本體[J].圖書館雜志,2004(6):50-54.
[8]Library Linked Data[EB/OL].[2016-03-23].http:// datahub.io/group/about/lld.
[9]OCLC的RDA政策聲明[EB/OL].[2016-03-23]. http://catwizard.net/posts/20120229210233.html.
[10]Byrne G,Goddard L.The strongest link:Libraries and LinkedData[J].D-LibMagazine,2010(9).
[11]黃永文.關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2010(5):1-7.
[12]劉煒.關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望[J].大學(xué)圖書館學(xué)報(bào),2011(2):5-11.
[13]夏翠娟,劉煒,趙亮,等.關(guān)聯(lián)數(shù)據(jù)的發(fā)布技術(shù)及其實(shí)現(xiàn)——以Drupal為例[J].中國圖書館學(xué)報(bào),2012 (1):49-57.
[14]夏翠娟,劉煒.關(guān)聯(lián)數(shù)據(jù)的消費(fèi)技術(shù)及其實(shí)現(xiàn)[J].大學(xué)圖書館學(xué)報(bào),2013(3):29-37.
[15]張春景,劉煒,夏翠娟,等.關(guān)聯(lián)數(shù)據(jù)開放應(yīng)用協(xié)議[J].中國圖書館學(xué)報(bào),2012(1):43-48.
[16]歐石燕.面向關(guān)聯(lián)數(shù)據(jù)的語義數(shù)字圖書館資源描述與組織框架設(shè)計(jì)與實(shí)現(xiàn)[J].中國圖書館學(xué)報(bào),2012(11):58-71.
[17]游毅,成全.試論基于關(guān)聯(lián)數(shù)據(jù)的館藏資源聚合模式[J].情報(bào)理論與實(shí)踐,2013(1):109-114.
[18]鐘遠(yuǎn)薪,李田章,劉煒.OPAC混搭關(guān)聯(lián)數(shù)據(jù)應(yīng)用研究[J].現(xiàn)代圖書情報(bào)技術(shù),2013(4):25-29.
[19]黃啟哲.上圖推出“家譜知識服務(wù)平臺”[N].文匯報(bào),2016-02-18(9).
[20]蘇建華.淺議RDA與BIBFRAME[J].現(xiàn)代情報(bào),2015 (1):156-158.
[21]BIBFRAME打算取消“規(guī)范”核心類[EB/OL]. [2016-03-20].http://catwizard.net/posts/tag/bibframe.
[22]林格.教育,要敢于面對事實(shí)[N].教育時報(bào),2009-02-07(4).
(責(zé)任編輯:付偉棠)
Bottom Common Organization Model of the Whole Library Knowledge Resource
CHANG E,HUA Su-yong
Fine grit,semantization and openness play key roles in organizing library collection resources.The article constructs the bottom common organization model of the whole library knowledge resource on the basis of the various kinds of the knowledge methods,especially the linked data technology.The model is made up of 3 layers:links among the resources,links between resource and knowledge,and the links among knowledge.In the article,the common and universal resource organization frame is presented in order to express the complex semantic relation of resource and knowledge.
knowledge organization;linked data;common model
*本文系國家社會科學(xué)基金項(xiàng)目“圖書館資源組織中的數(shù)據(jù)關(guān)聯(lián)機(jī)制研究”(項(xiàng)目編號:14CTQ005)研究成果之一
常娥,東南大學(xué)圖書館副研究館員;華蘇永,東南大學(xué)圖書館館員。
2016-04-06