鄭一波 陳瑞 曾建勛
(1. 中國科學(xué)技術(shù)信息研究所,北京 100038;2. 武漢大學(xué)信息管理學(xué)院,武漢 430072)
聯(lián)合目錄是綜合揭示若干館藏機構(gòu)內(nèi)文獻(xiàn)資料分布情況的統(tǒng)一目錄,是在一定著錄規(guī)則下合作編制的書目記錄。世界上最早出現(xiàn)的聯(lián)合目錄是13世紀(jì)的《英格蘭圖書館登記冊》,各國聯(lián)合目錄工作在19世紀(jì)以后逐步發(fā)展。美國OCLC的WorldCat是最具有代表性的聯(lián)機聯(lián)合目錄數(shù)據(jù)庫,也是世界上收錄范圍最廣、文獻(xiàn)量最大、用戶最多的書目記錄數(shù)據(jù)庫。我國有代表性的聯(lián)合目錄有高等教育文獻(xiàn)保障體系(CALIS)聯(lián)合目錄數(shù)據(jù)庫、全國圖書館聯(lián)合編目中心(OLCC)數(shù)據(jù)、國家科技圖書文獻(xiàn)中心(NSTL)聯(lián)合目錄等。這些聯(lián)合目錄一方面能幫助用戶了解文獻(xiàn)的來源渠道,獲取館藏指引服務(wù);另一方面能有效揭示全國、各區(qū)域文獻(xiàn)資源分布情況,為資源采購、調(diào)整和保障策略的制定提供依據(jù),為館際互借和文獻(xiàn)交換、復(fù)制、傳遞等資源共享服務(wù)創(chuàng)造條件,促進(jìn)文獻(xiàn)資源的高效利用。
隨著數(shù)字出版的快速發(fā)展,大量數(shù)字資源爆發(fā)式增長,資源特征、出版模式、載體形式、編目規(guī)則和資源服務(wù)模式等均發(fā)生巨大變化,用戶獲取信息的渠道也發(fā)生顯著變化,聯(lián)合目錄在資源建設(shè)和資源服務(wù)方面面臨全新的挑戰(zhàn)。傳統(tǒng)聯(lián)合目錄以揭示圖書館館藏印本資源為主,在實際應(yīng)用中存在不同維度的交叉重復(fù),并且對開放獲取資源和數(shù)據(jù)庫在內(nèi)的電子資源館藏信息的揭示有限[1]。為了突破數(shù)字環(huán)境下聯(lián)合目錄的建設(shè)瓶頸,美國OCLC[2]、日本國立國會圖書館[3]以及國內(nèi)NSTL等已經(jīng)轉(zhuǎn)變傳統(tǒng)聯(lián)合目錄建設(shè)模式,不斷擴充電子資源元數(shù)據(jù),通過內(nèi)外資源元數(shù)據(jù)的廣泛集成優(yōu)化資源發(fā)現(xiàn)服務(wù)。數(shù)字環(huán)境正在深刻影響著聯(lián)合目錄的發(fā)展,我國亟需結(jié)合當(dāng)下用戶資源發(fā)現(xiàn)需求,重新定位聯(lián)合目錄的職能,革新聯(lián)合目錄構(gòu)建方式,創(chuàng)新發(fā)展聯(lián)合目錄體系,以適應(yīng)時代發(fā)展的要求。
在以印本為主體的資源建設(shè)時期,聯(lián)合目錄通過多個圖書館館藏信息的集成,為用戶提供獲取文獻(xiàn)資源的線索,有效促進(jìn)文獻(xiàn)資源的整合和共享。進(jìn)入數(shù)字出版時代,數(shù)字資源快速增長,信息環(huán)境發(fā)生巨大變化,傳統(tǒng)聯(lián)合目錄正面臨全新的挑戰(zhàn),亟需創(chuàng)新發(fā)展以適應(yīng)數(shù)字環(huán)境的新要求。
(1)傳統(tǒng)聯(lián)合目錄局限于印本館藏資源,多元化資源整合困難。數(shù)字時代,電子資源不斷拓展,文獻(xiàn)資源規(guī)模持續(xù)擴大,資源形態(tài)呈現(xiàn)多元化趨勢;各類型電子資源分散于不同機構(gòu)、數(shù)據(jù)庫系統(tǒng)和網(wǎng)站。傳統(tǒng)聯(lián)合目錄以MARC機讀目錄作為圖書館聯(lián)合編目的主流形式,雖然適當(dāng)加入、更新和擴充一系列新的字段以揭示電子資源,但總體來說格式復(fù)雜、表達(dá)方式煩瑣、數(shù)據(jù)描述范圍有限,并且不易被解析和交換,由于受書目數(shù)據(jù)編制規(guī)則及其方法的限制,難以適應(yīng)越來越細(xì)的電子資源描述粒度和服務(wù)需求,亟需拓展當(dāng)前聯(lián)合目錄的數(shù)據(jù)字段。因此,數(shù)字環(huán)境下聯(lián)合目錄的創(chuàng)新需要整合傳統(tǒng)MARC格式和數(shù)字資源元數(shù)據(jù),充分揭示各類型文獻(xiàn)資源分布,以滿足多元形態(tài)、分布式網(wǎng)絡(luò)資源的采集整合需求。
(2)傳統(tǒng)聯(lián)合目錄資源組織粒度較粗,資源發(fā)現(xiàn)功能不足。傳統(tǒng)聯(lián)合目錄對于書目數(shù)據(jù)的組織,基本以檢索文獻(xiàn)為目的,主要揭示文獻(xiàn)資源的外部特征和館藏信息,往往一條書目記錄對應(yīng)著一個文獻(xiàn)整體,其實質(zhì)是一種以文獻(xiàn)為基本單位的粗粒度的數(shù)據(jù)描述[4],對文獻(xiàn)資源深層次的揭示有限,描述字段無法脫離書目記錄獨立存在,并且描述字段之間也缺乏必要的聯(lián)系,語義揭示能力有限,資源發(fā)現(xiàn)功能明顯較弱。在數(shù)字時代,元數(shù)據(jù)因其可讀性、易用性和可擴展性強的優(yōu)勢更適應(yīng)當(dāng)前文獻(xiàn)資源的組織利用,能夠提供對特定資源足夠全面的描述信息,對文獻(xiàn)資源的揭示可以包括描述、獲取、服務(wù)等多個維度,對資源的揭示粒度可以從書目層級逐步深入到篇章級別乃至文章內(nèi)部的知識單元。因此,數(shù)字環(huán)境下聯(lián)合目錄的創(chuàng)新需要依托海量的元數(shù)據(jù)擴展資源描述范圍、細(xì)化資源揭示粒度,實現(xiàn)文獻(xiàn)資源與服務(wù)的精準(zhǔn)配置。
(3)傳統(tǒng)聯(lián)合目錄資源建設(shè)相對封閉,資源獲取能力薄弱。傳統(tǒng)聯(lián)合目錄資源建設(shè)整體上以圖書館為主,缺乏出版社等其他主體的參與,導(dǎo)致資源規(guī)模及服務(wù)能力有限。編目資源僅限于合作機構(gòu)的內(nèi)部館藏,但圖書館具有所有權(quán)的館藏資源規(guī)模不大,主要以紙質(zhì)文獻(xiàn)為主,大量的電子資源僅購買了有使用權(quán)的文獻(xiàn)資源數(shù)據(jù)庫,編目元數(shù)據(jù)也多局限于自身具有所有權(quán)的館藏資源元數(shù)據(jù),元數(shù)據(jù)規(guī)模十分有限,僅依靠圖書館自身構(gòu)建或者購買全部文獻(xiàn)資源和元數(shù)據(jù)并不現(xiàn)實。在資源服務(wù)方面,欠缺動態(tài)的交互機制,無法與網(wǎng)絡(luò)資源進(jìn)行有效鏈接,難以突破館際界限,用戶難以獲得館藏未訂購資源。因此,突破館際界限,實現(xiàn)內(nèi)外部資源數(shù)據(jù)的集成以及跨界協(xié)同服務(wù)的開展是數(shù)字環(huán)境下聯(lián)合目錄創(chuàng)新亟待解決的問題。
(4)傳統(tǒng)聯(lián)合目錄面臨被開放鏈接機制替代和邊緣化的風(fēng)險。數(shù)字環(huán)境下,用戶越來越傾向于使用網(wǎng)絡(luò)搜索引擎作為信息查找的起點,更愿意在一個全面、開放、易用的系統(tǒng)中通過“一站式”檢索來獲取所需要的信息[5]。文獻(xiàn)資源描述與信息服務(wù)已不再是圖書情報機構(gòu)的專屬領(lǐng)域,出版商、集成商正在參與其中,并通過發(fā)展最初的書目數(shù)據(jù)庫到開發(fā)二次文獻(xiàn)數(shù)據(jù)庫,再向全文數(shù)據(jù)庫乃至分析工具型數(shù)據(jù)庫發(fā)展,使元數(shù)據(jù)的集成應(yīng)用模式逐步深入,而不局限于單一的資源發(fā)現(xiàn)功能。傳統(tǒng)聯(lián)合目錄的書目數(shù)據(jù)集成優(yōu)勢逐步喪失,其在數(shù)據(jù)規(guī)模、數(shù)據(jù)深度、數(shù)據(jù)應(yīng)用和服務(wù)等方面均落后于出版商、集成商的元數(shù)據(jù)集成相關(guān)實踐。
聯(lián)合目錄功能實質(zhì)為一個“中間轉(zhuǎn)化層”,是連接資源擁有方和用戶的橋梁,基本方式是向用戶展示資源信息、獲取方式信息以及其他相關(guān)推薦,為用戶提供多種資源獲取和服務(wù)路徑[6]。當(dāng)前,圖書館資源發(fā)現(xiàn)系統(tǒng)迅猛發(fā)展,致力于文獻(xiàn)元數(shù)據(jù)資源的大規(guī)模集成整合為用戶提供快捷、高效的資源發(fā)現(xiàn)服務(wù),資源發(fā)現(xiàn)系統(tǒng)不僅需要幫助用戶發(fā)現(xiàn)資源,還需要拓展用戶資源獲取途徑,建立集用戶檢索、查找、獲取的“一站式”服務(wù)功能,這離不開聯(lián)合目錄對多來源、多類型資源的綜合揭示和資源調(diào)度[7],但是傳統(tǒng)聯(lián)合目錄體系受書目資源范圍、書目數(shù)據(jù)結(jié)構(gòu)、建設(shè)模式等方面的限制,文獻(xiàn)資源發(fā)現(xiàn)、定位和調(diào)度功能有限。因此,在數(shù)字環(huán)境下創(chuàng)新聯(lián)合目錄體系,旨在面向資源發(fā)現(xiàn)系統(tǒng)變革聯(lián)合目錄資源的組織和管理方式,構(gòu)建新型聯(lián)合目錄體系,實現(xiàn)多來源、多載體、多類型文獻(xiàn)資源的整合和發(fā)現(xiàn),更好地發(fā)揮資源集成優(yōu)勢,提升用戶資源獲取能力,推動文獻(xiàn)資源的共享利用。
數(shù)字環(huán)境下新型聯(lián)合目錄體系是在繼承原有聯(lián)合目錄體系的基礎(chǔ)上,由多元主體協(xié)同共建共享,通過擴大資源范圍、細(xì)化資源描述粒度、革新目錄體系結(jié)構(gòu)、豐富聯(lián)合目錄服務(wù)功能而構(gòu)建的基于多類型文獻(xiàn)資源元數(shù)據(jù)集成整合的新型聯(lián)合目錄體系。具體來說,新型聯(lián)合目錄體系仍以圖書館為建設(shè)主體,同時結(jié)合各類型信息服務(wù)機構(gòu),以跨界協(xié)同的方式建設(shè)聯(lián)合目錄,并協(xié)同開展不同層級的發(fā)現(xiàn)服務(wù);在原有印本資源揭示基礎(chǔ)上,整合各類型電子資源;繼續(xù)發(fā)揮圖書館書目控制優(yōu)勢,不斷發(fā)展完善數(shù)字資源的著錄規(guī)則和數(shù)據(jù)規(guī)范;在聯(lián)合目錄數(shù)據(jù)結(jié)構(gòu)方面,不僅描述資源的描述信息、館藏信息,并且增加獲取信息、權(quán)益信息、管理信息元素集,尤其是電子資源的定位鏈接;優(yōu)化聯(lián)合目錄服務(wù)系統(tǒng),在傳統(tǒng)文獻(xiàn)查詢、文獻(xiàn)傳遞服務(wù)的基礎(chǔ)上,拓展文獻(xiàn)獲取、資源精準(zhǔn)匹配、針對用戶不同需求的個性化服務(wù)等,擴展聯(lián)合目錄服務(wù)外延。新型聯(lián)合目錄體系在信息資源、建設(shè)主體、標(biāo)準(zhǔn)規(guī)范、目錄結(jié)構(gòu)、服務(wù)體系方面發(fā)生較大變化,具體框架見圖1。
圖1 新型聯(lián)合目錄體系框架
傳統(tǒng)的聯(lián)合目錄主要整合印本館藏資源,存儲信息的載體是書本、雜志、報刊或磁帶、磁盤等有形的實體,載體形式比較單一。新型聯(lián)合目錄編目的對象不再局限于圖書、期刊等紙質(zhì)文獻(xiàn),包括科技期刊、會議文獻(xiàn)、文集匯編、工具書、科技報告、科技專著、學(xué)位論文、檔案資料等常規(guī)的圖書、期刊等電子資源,還包括多介質(zhì)資源如音頻、視頻、圖像資料、縮微資料、科研數(shù)據(jù)、課件資料、動畫資料等,資源類型的不同帶來資源描述的差異,需要建立各類型資源的書目描述規(guī)范,全面揭示各類型資源的外部特征、內(nèi)容特征和館藏特征。從來源方式上看,尤其是數(shù)字資源來源多樣,主要有館藏自建資源、出版商訂購資源、開放獲取資源。這些資源形態(tài)多元,往往一個資源存在多個版本、多個來源,這就要求聯(lián)合目錄必須適應(yīng)信息環(huán)境的變革,兼顧紙本資源和數(shù)字資源,做好多類型、多載體、多格式、多來源文獻(xiàn)資源的元數(shù)據(jù)描述和組織揭示,構(gòu)建集印本資源與電子資源于一體的聯(lián)合目錄集成化體系,支撐后續(xù)的資源發(fā)現(xiàn)以及信息服務(wù)。
新型聯(lián)合目錄的建設(shè)主體除圖書館之外,應(yīng)聯(lián)合學(xué)術(shù)出版商、書商、數(shù)據(jù)服務(wù)商、搜索引擎等多元主體協(xié)同參與構(gòu)建和服務(wù),它們既是聯(lián)合目錄資源集成的源頭,又是資源發(fā)現(xiàn)服務(wù)的主體,實現(xiàn)聯(lián)合目錄資源建設(shè)、元數(shù)據(jù)集成到服務(wù)功能實現(xiàn)的全方位跨界協(xié)同[1]。數(shù)字環(huán)境下,任何機構(gòu)都難以實現(xiàn)對文獻(xiàn)資源的完整保證,聯(lián)合目錄的建設(shè)需要突破小資源、小環(huán)境的書目組織觀念,不再局限于圖書館聯(lián)盟機構(gòu)的內(nèi)部館藏,而是將各類型文獻(xiàn)信息服務(wù)機構(gòu)的數(shù)字資源列入聯(lián)合目錄資源建設(shè)范疇,多方主體協(xié)同參與構(gòu)建新型聯(lián)合目錄。一方面,這些內(nèi)容提供商處于信息服務(wù)產(chǎn)業(yè)鏈上游具有資源優(yōu)勢,并掌握大量的元數(shù)據(jù)資源,是聯(lián)合目錄記錄的重要數(shù)據(jù)基礎(chǔ),通過多來源元數(shù)據(jù)集成整合構(gòu)建聯(lián)合目錄,以保證聯(lián)合目錄資源的時效性和文獻(xiàn)類型的多樣化;另一方面,多方主體在資源、技術(shù)、服務(wù)等方面協(xié)同構(gòu)建多層次的發(fā)現(xiàn)服務(wù)體系,融合眾多文獻(xiàn)資源信息,打破館際資源界限,支持資源獲取信息指引,進(jìn)行聯(lián)合目錄基礎(chǔ)數(shù)據(jù)的雙向流動和互利共享,拓展聯(lián)合目錄知識服務(wù)的邊界。
標(biāo)準(zhǔn)規(guī)范的建設(shè)是新型聯(lián)合目錄數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)的重要組成部分,直接影響聯(lián)合目錄整體服務(wù)水平。當(dāng)前書目數(shù)據(jù)格式有的是MARC格式,有的是元數(shù)據(jù),聯(lián)合目錄對這些書目數(shù)據(jù)的集成整合需要建立統(tǒng)一的標(biāo)準(zhǔn)規(guī)范,旨在使用同一套元數(shù)據(jù)方案對不同的文獻(xiàn)類型、不同載體形式、不同書目層級以及不同來源的文獻(xiàn)資源進(jìn)行統(tǒng)一的描述。圖書館需要結(jié)合聯(lián)合目錄幫助用戶查找、識別、選擇、瀏覽及獲取資源的功能需求特點,兼顧不同類型資源元數(shù)據(jù)的多項特征,參考國際上成熟的各類型元數(shù)據(jù)標(biāo)準(zhǔn)或自制元數(shù)據(jù)標(biāo)準(zhǔn),設(shè)計能兼容各類型、各領(lǐng)域元數(shù)據(jù)特點的標(biāo)準(zhǔn)規(guī)范體系,明確元數(shù)據(jù)的結(jié)構(gòu)標(biāo)準(zhǔn)、內(nèi)容標(biāo)準(zhǔn)、取值標(biāo)準(zhǔn)、交換標(biāo)準(zhǔn)、統(tǒng)一資源標(biāo)識符,便于對眾多元數(shù)據(jù)的統(tǒng)一描述、規(guī)范標(biāo)引和格式轉(zhuǎn)化。同時,書目規(guī)范控制是聯(lián)合目錄集成效果的重要標(biāo)準(zhǔn)規(guī)范,需要擴大規(guī)范控制范圍[8],結(jié)合分類標(biāo)準(zhǔn)、主題規(guī)范文檔、會議規(guī)范文檔、期刊規(guī)范文檔、作者規(guī)范文檔、機構(gòu)規(guī)范文檔等科研實體規(guī)范建立相關(guān)標(biāo)目的相互參照,這樣有助于統(tǒng)一標(biāo)目,引導(dǎo)用戶準(zhǔn)確查找資源信息;有助于對聯(lián)合目錄中特定標(biāo)目統(tǒng)一修改和刪除,全面快速更新或清理聯(lián)合目錄中的非規(guī)范化標(biāo)目,提高檢索精度;有助于通過規(guī)范記錄實現(xiàn)數(shù)據(jù)關(guān)聯(lián),如對連續(xù)出版物期刊品種書目數(shù)據(jù)與物理本的單冊進(jìn)行關(guān)聯(lián)等,真正實現(xiàn)聯(lián)合目錄數(shù)據(jù)的整合。
新型聯(lián)合目錄的目錄結(jié)構(gòu)必須革新聯(lián)合目錄的元數(shù)據(jù)體系,擴大資源描述范圍。描述信息不僅包括作者、標(biāo)題、主題、館藏等簡單信息,還應(yīng)包括內(nèi)容、載體、位置與獲取方式、制作和利用方式,關(guān)聯(lián)資源信息等的詳細(xì)描述,尤其是對跨機構(gòu)服務(wù)資源的服務(wù)方式和服務(wù)范圍要進(jìn)行詳細(xì)描述,以發(fā)揮聯(lián)合目錄文獻(xiàn)揭示、規(guī)范導(dǎo)航、組織管理的作用。
新型聯(lián)合目錄元數(shù)據(jù)體系需要在揭示不同類型資源的描述信息、館藏信息的基礎(chǔ)上,增加資源的獲取信息、權(quán)益信息和管理信息以及依據(jù)具體類型資源特點形成的特色信息的元素集,具體見圖2。①描述信息元素集,包括內(nèi)外部特征。外部特征元素中通常包括文獻(xiàn)類型、載體類型、媒介類型、編目源載體、識別號、題名、責(zé)任者、語種、出版信息、版本、簡介、注釋、目次等。內(nèi)容特征元素中包括主題詞、關(guān)鍵詞、分類號。對于一些連續(xù)出版物復(fù)雜的資源類型如科技期刊、會議文獻(xiàn),需要充分揭示叢編信息、歷史沿革、卷期信息、層級結(jié)構(gòu)等。②館藏信息元素集,揭示資源分布信息,包括館藏序號、機構(gòu)代碼、成員館經(jīng)費來源、成員館訂購品種、機構(gòu)位置、服務(wù)狀態(tài)、IP地址范圍、服務(wù)接口、服務(wù)響應(yīng)時間等。③獲取信息元素集,包括可獲取性、獲取地址、獲取范圍、獲取時限、獲取資源類型、關(guān)聯(lián)信息,說明可獲取資源是元數(shù)據(jù)、題名摘要層次的內(nèi)容,還是全文內(nèi)容;通過IP地址建立文獻(xiàn)收藏機構(gòu)與資源的關(guān)系,幫助獲取資源,提供可以鏈接全文的URL,實現(xiàn)資源的唯一定位,有效擴展聯(lián)合目錄資源建設(shè)范圍。④權(quán)益信息元素集,補充完善數(shù)字資源權(quán)益與獲取信息的相關(guān)元素集及元素,保障資源獲取的可靠性和使用的合法性,包括版權(quán)聲明、許可協(xié)議、使用權(quán)利權(quán)限等。⑤管理信息元素集,描述書目管理的相關(guān)信息,包括書目創(chuàng)建時間、書目更新時間、書目提交單位、書目審核人、書目審核日期等。
圖2 新型聯(lián)合目錄元數(shù)據(jù)體系
構(gòu)建新型聯(lián)合目錄集成服務(wù)系統(tǒng),支持聯(lián)合目錄協(xié)同化管理,擴展聯(lián)合目錄服務(wù)功能。編目系統(tǒng)支持多來源元數(shù)據(jù)的集成整合,可以批量上傳和下載元數(shù)據(jù),也可以新增、刪除或修改元數(shù)據(jù);注冊系統(tǒng)主要針對大規(guī)模元數(shù)據(jù)統(tǒng)一集成中元數(shù)據(jù)資產(chǎn)注冊,記錄元數(shù)據(jù)資源歸屬、分布情況、版權(quán)屬性,登記元數(shù)據(jù)所屬機構(gòu)、揭示元數(shù)據(jù)的轉(zhuǎn)換規(guī)則、使用范圍、使用規(guī)則等,有利于元數(shù)據(jù)的管理、更新和協(xié)調(diào)使用;管理系統(tǒng)是對聯(lián)合目錄的綜合管理,包括聯(lián)合目錄數(shù)據(jù)庫的管理、聯(lián)盟成員管理、權(quán)限管理、更新維護(hù)等;服務(wù)系統(tǒng)實現(xiàn)統(tǒng)一的訪問界面,提供靈活的檢索、查詢到獲取所需資源的“一站式”服務(wù),支持通過館際互借、文獻(xiàn)傳遞、定位鏈接獲取全文,用戶可以通過資源詳情頁直接鏈接跳轉(zhuǎn)到資源獲取頁面,為防止單一路徑鏈接失敗的情況,在標(biāo)記主記錄數(shù)據(jù)來源及訪問地址的同時,設(shè)置“更多來源選擇”功能以顯示這一資源的其他鏈接地址,提供所有來源的鏈接路徑;對于無法直接提供全文的資源,提供資源獲取輔助信息,實現(xiàn)基于聯(lián)合目錄對眾多文獻(xiàn)資源(包括訂購和未訂購的資源)的全面發(fā)現(xiàn)。依據(jù)聯(lián)合目錄的數(shù)據(jù)結(jié)構(gòu)和參與機構(gòu)的特點協(xié)同服務(wù),支持元數(shù)據(jù)層面、檢索獲取、聯(lián)目數(shù)據(jù)分析、功能接口調(diào)用等不同層面的發(fā)現(xiàn)服務(wù)。
傳統(tǒng)的聯(lián)合目錄的構(gòu)建依托于圖書館聯(lián)盟,按照統(tǒng)一制定的標(biāo)準(zhǔn)規(guī)范將各成員館的書目數(shù)據(jù)整合在一起,為每條書目數(shù)據(jù)編制館藏信息。數(shù)字環(huán)境下,實施多主體協(xié)同構(gòu)建聯(lián)合目錄元數(shù)據(jù)體系的策略是行之有效的路徑,既可實現(xiàn)多方共贏,又能滿足用戶需求。聯(lián)合目錄的建設(shè)從單純的文獻(xiàn)編目整合向多來源元數(shù)據(jù)集成整合方向轉(zhuǎn)變,以多元元數(shù)據(jù)作為編目數(shù)據(jù)源,整合不同來源、不同描述的元數(shù)據(jù)信息,構(gòu)建以元數(shù)據(jù)為核心的信息資源開放目錄體系[9],實現(xiàn)異構(gòu)資源的共享。對于這些多來源、多渠道元數(shù)據(jù)資源,沒有統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,將無法實現(xiàn)元數(shù)據(jù)的統(tǒng)一描述、規(guī)范標(biāo)引和集成整合[10],因此在聯(lián)合目錄元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范的基礎(chǔ)上(見2.3標(biāo)準(zhǔn)規(guī)范),需要進(jìn)行自主加工,集成整合到統(tǒng)一的數(shù)據(jù)集合中,建立元數(shù)據(jù)采集、處理、整合流程,有序?qū)崿F(xiàn)多來源元數(shù)據(jù)的歸并統(tǒng)一,同時需要加強集成各環(huán)節(jié)的質(zhì)量管理,保障統(tǒng)一、規(guī)范、高質(zhì)量的聯(lián)合目錄建設(shè)。
元數(shù)據(jù)來源具有多渠道性,主要分為圖書館目錄數(shù)據(jù),出版商、數(shù)據(jù)庫商的元數(shù)據(jù),以及互聯(lián)網(wǎng)上免費的OA資源,來源渠道不同,元數(shù)據(jù)描述字段不一、質(zhì)量層次不一,數(shù)據(jù)粒度描述不一。元數(shù)據(jù)的獲取包括參與成員的批量上傳、協(xié)議收集、自動采集等多種方式:①各圖書館本地館藏書目元數(shù)據(jù)是聯(lián)合目錄主要的覆蓋內(nèi)容,主要依托聯(lián)合編目系統(tǒng)對這些書目元數(shù)據(jù)進(jìn)行批量上傳;②出版社、數(shù)據(jù)庫商、電子書商、文摘索引提供商等內(nèi)容提供商的資源,往往設(shè)置版權(quán)保護(hù),不對外提供元數(shù)據(jù),則需要開展談判溝通,從互利互惠的角度平衡雙方訴求,明確元數(shù)據(jù)收集范圍和使用權(quán)限,按照協(xié)議規(guī)定的方式進(jìn)行元數(shù)據(jù)的收集;③一些開放資源和難以獲得授權(quán)的資源元數(shù)據(jù),可以采用元數(shù)據(jù)收割技術(shù),周期性地對這些平臺的數(shù)據(jù)資源進(jìn)行自動采集,并將其轉(zhuǎn)化為結(jié)構(gòu)化的元數(shù)據(jù)存儲到聯(lián)合目錄系統(tǒng)中。
不同來源的元數(shù)據(jù)所遵循的數(shù)據(jù)格式以及數(shù)據(jù)描述的粒度各不相同,難以達(dá)到完全的統(tǒng)一,要對不同格式的元數(shù)據(jù)進(jìn)行有效組織和管理,前提是遵從聯(lián)合目錄的數(shù)據(jù)規(guī)則進(jìn)行元數(shù)據(jù)轉(zhuǎn)化映射,實現(xiàn)各元數(shù)據(jù)間的互操作。因此需要先對各來源的元數(shù)據(jù)結(jié)構(gòu)和屬性進(jìn)行分析,明確包含的各項元素名稱、元素定義、元素之間的關(guān)系。對照聯(lián)合目錄的元數(shù)據(jù)結(jié)構(gòu)及統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,制定相應(yīng)的元數(shù)據(jù)映射/匹配規(guī)則,確定元數(shù)據(jù)之間的映射關(guān)系,對不同類型的元數(shù)據(jù)按照一致的映射結(jié)構(gòu)進(jìn)行相互映射和統(tǒng)一的格式轉(zhuǎn)換。由于數(shù)據(jù)來源各異,需要處理的元數(shù)據(jù)格式和映射關(guān)系多樣,遵循映射粒度最小化、元素值對應(yīng)的原則,需在實踐中不斷積累和完善映射規(guī)則,建立映射規(guī)則庫,為機器自動化映射轉(zhuǎn)化做準(zhǔn)備。
數(shù)據(jù)來源具有多渠道性,需要判斷是否為同一資源的元數(shù)據(jù)描述,對同一文本資源的元數(shù)據(jù)描述進(jìn)行整合,以屬性完整、質(zhì)量規(guī)范的元數(shù)據(jù)作為主記錄,同時將這些不同渠道進(jìn)行合并,提供同一資源的多來源指引。這一過程需要不斷發(fā)現(xiàn)和確認(rèn)重復(fù)數(shù)據(jù),設(shè)計查重規(guī)則匹配,分別從母體、卷期、篇級、來源渠道等多個層次對資源進(jìn)行查重與歸一,制定不同類型元數(shù)據(jù)的查重策略,對重復(fù)冗余的元數(shù)據(jù)進(jìn)行修改、剔除和合并,最后實現(xiàn)多來源渠道合并[11],形成完整的聯(lián)合目錄數(shù)據(jù)。集成整合的聯(lián)合目錄實現(xiàn)了印本資源和電子資源的整合統(tǒng)一,數(shù)據(jù)格式統(tǒng)一、結(jié)構(gòu)清晰,經(jīng)過整合后元數(shù)據(jù)豐富,可以實現(xiàn)更細(xì)致的文獻(xiàn)分面導(dǎo)航、知識要素關(guān)聯(lián)分析,并且提供資源來源指引,為用戶提供圖書館內(nèi)部的、外部的、擁有的、授權(quán)的以及可免費獲取的文獻(xiàn)資源信息。
元數(shù)據(jù)多元異構(gòu)特征帶來元數(shù)據(jù)采集、轉(zhuǎn)化、整合的復(fù)雜性,需要進(jìn)行聯(lián)合目錄元數(shù)據(jù)質(zhì)量管理,優(yōu)化工作流程,形成對集成整合各個環(huán)節(jié)的有效控制。①嚴(yán)格遵循聯(lián)合目錄元數(shù)據(jù)集成規(guī)則和集成程序。數(shù)據(jù)準(zhǔn)備階段,應(yīng)向元數(shù)據(jù)提供方明確可接受的、兼容的數(shù)據(jù)標(biāo)準(zhǔn)以及字段必備程度等,甚至提供統(tǒng)一的元數(shù)據(jù)示范文本,明確數(shù)據(jù)格式規(guī)范;固化元數(shù)據(jù)獲取流程,從數(shù)據(jù)準(zhǔn)備、提交、校驗(格式校驗、內(nèi)容抽查)各流程明確,防止出錯。②加強數(shù)據(jù)檢查程序建設(shè),對不同類型的文獻(xiàn)數(shù)據(jù)、不同來源的著錄格式進(jìn)行反復(fù)數(shù)據(jù)清洗,進(jìn)行查重匹配、發(fā)現(xiàn)異常數(shù)據(jù),根據(jù)字段的定義、屬性、閾值、關(guān)聯(lián)關(guān)系等對數(shù)據(jù)進(jìn)行分析,并按照一定的規(guī)則對這些異常數(shù)據(jù)進(jìn)行清洗和更正,最后進(jìn)行數(shù)據(jù)質(zhì)量分析,盡量從數(shù)據(jù)采集源頭避免噪聲數(shù)據(jù)的產(chǎn)生[12]。③在參與主體的管理上采取等級制度,需經(jīng)過專門的培訓(xùn)和嚴(yán)格的認(rèn)證,為進(jìn)行聯(lián)合目錄數(shù)據(jù)維護(hù)的成員單位分配不同的編目權(quán)限和范圍,所有編目成員可通過申請對書目數(shù)據(jù)或規(guī)范文檔進(jìn)行修改。④對于數(shù)據(jù)的維護(hù)除了專家團(tuán)隊的實施管理,還應(yīng)該鼓勵所有成員的參與和監(jiān)督,各成員單位雖然等級權(quán)限不同,但都能實際參與其中,有效實現(xiàn)對聯(lián)合目錄數(shù)據(jù)的廣泛監(jiān)督。同時,建立元數(shù)據(jù)評估機制,對數(shù)據(jù)質(zhì)量的評估重視用戶參與,根據(jù)用戶的滿意程度,對元數(shù)據(jù)庫本身的覆蓋范圍、易用性、數(shù)據(jù)質(zhì)量等方面不斷完善。
新型聯(lián)合目錄的創(chuàng)新發(fā)展必須開展跨界協(xié)同,圖書館需要聯(lián)合多個主體開展協(xié)同工作,通過開展“館社”“館商”“館店”等跨界合作,打通“采、藏、借、閱”,使資源突破館際界限,極大地縮短從資源建設(shè)到資源獲取、資源服務(wù)的時間;通過API的方式實現(xiàn)圖書館、出版社、數(shù)據(jù)庫商等擁有的資源、服務(wù)和業(yè)務(wù)能力的開放式調(diào)用,推動聯(lián)合目錄服務(wù)功能的轉(zhuǎn)型升級。在跨界協(xié)同過程中,只有建立起良好的協(xié)同生態(tài),各主體才能有動力持續(xù)參與到跨界協(xié)同中來,才能保障跨界協(xié)同的長期發(fā)展。應(yīng)建立橫聯(lián)各類型圖書情報機構(gòu),跨越主要出版商、集成商的資源共享聯(lián)盟,加強頂層設(shè)計和組織管理,明確參與各主體的權(quán)利和責(zé)任,通過清晰的資源權(quán)屬關(guān)系管理、統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范和層次體系來確保聯(lián)盟運行的協(xié)調(diào)性和持續(xù)性。協(xié)同工作復(fù)雜,各參與主體面臨同一項工作可能有不同的既有流程,并且在協(xié)同中面臨不同的投入產(chǎn)出,如果缺乏合理的協(xié)作流程和利益配套機制,將無法建立長期穩(wěn)定的協(xié)同關(guān)系。因此,為保障協(xié)同工作的順利開展,需要有配套協(xié)同機制才能保障順暢運轉(zhuǎn),既要覆蓋協(xié)同事項的各個業(yè)務(wù)流程環(huán)節(jié),也要注重利益協(xié)調(diào)機制的設(shè)計,在協(xié)作對象的選擇、協(xié)作方案的設(shè)計等各個環(huán)節(jié)需要優(yōu)先考慮協(xié)作共贏,對協(xié)作中可能出現(xiàn)的利益沖突形成解決預(yù)案,確保各方能夠在合作中獲得收益[13]。
新型聯(lián)合目錄的建設(shè)及服務(wù)依賴于對多來源資源元數(shù)據(jù)的收集、整合、分析、利用,必須保障聯(lián)合目錄元數(shù)據(jù)的持續(xù)更新維護(hù)。元數(shù)據(jù)作為新的生產(chǎn)要素,具有信息資源增值功能,很多數(shù)據(jù)庫內(nèi)容商為了商業(yè)競爭而壟斷元數(shù)據(jù)資源,其中版權(quán)是影響元數(shù)據(jù)集成共享的重要因素。多元主體共建資源聯(lián)合目錄需要確保元數(shù)據(jù)合法、大膽主張元數(shù)據(jù)權(quán)益,充分運用合理使用原則和例外條款合理使用元數(shù)據(jù),針對大規(guī)模元數(shù)據(jù)統(tǒng)一集成體系中元數(shù)據(jù)的資產(chǎn)歸屬認(rèn)定,建立元數(shù)據(jù)資產(chǎn)認(rèn)定與注冊機制,了解元數(shù)據(jù)的資產(chǎn)歸屬和分布情況,厘清元數(shù)據(jù)主體與元數(shù)據(jù)記錄者的權(quán)利邊界,全面登記元數(shù)據(jù)所屬機構(gòu),并揭示和保存元數(shù)據(jù)的版權(quán)屬性信息,明確不同主體在不同場景中的權(quán)利內(nèi)容和權(quán)利保障,激勵元數(shù)據(jù)的使用,促進(jìn)元數(shù)據(jù)的管理、更新和協(xié)調(diào)使用。從數(shù)據(jù)來源的角度,完善元數(shù)據(jù)授權(quán)許可機制,與出版商、數(shù)據(jù)庫商開展談判溝通,從互利互惠的角度平衡雙方訴求,簽訂元數(shù)據(jù)收集和利用協(xié)議,明確元數(shù)據(jù)所有權(quán),許可使用的范圍、數(shù)量,使用方式,使用限制,雙方承擔(dān)的責(zé)任義務(wù)等,保證元數(shù)據(jù)權(quán)利歸屬清晰[14],進(jìn)而規(guī)避版權(quán)風(fēng)險。在集成前,檢查元數(shù)據(jù)提供方(出版商、數(shù)據(jù)庫商)的資質(zhì),審查其元數(shù)據(jù)版權(quán)證明文件,主動履行形式上的合法性審查義務(wù),防止因元數(shù)據(jù)來源不明而造成的侵權(quán)風(fēng)險。對授權(quán)許可獲得的元數(shù)據(jù)履行合理的注意義務(wù),制定適當(dāng)?shù)陌鏅?quán)聲明和用戶使用條款以對用戶元數(shù)據(jù)使用行為加以規(guī)范。
新型聯(lián)合目錄基于元數(shù)據(jù)從資源一般描述到語義層面的揭示,可以對書目數(shù)據(jù)進(jìn)行深層次的挖掘與語義層次的展示,支持向語義檢索、知識網(wǎng)絡(luò)構(gòu)建、知識關(guān)聯(lián)揭示等應(yīng)用方向拓展,從語義層面實現(xiàn)書目資源的組織和聚合,提高書目數(shù)據(jù)的開放性和關(guān)聯(lián)程度,推進(jìn)聯(lián)合目錄的數(shù)據(jù)服務(wù)和知識服務(wù),以滿足不同應(yīng)用場景下的服務(wù)需求。通過URI、元數(shù)據(jù)等技術(shù)將書目數(shù)據(jù)結(jié)構(gòu)化,基于RDA、FRBR書目模型充分揭示各類型資源所涉及的實體、屬性及實體之間的關(guān)系,對傳統(tǒng)書目數(shù)據(jù)資源描述進(jìn)一步優(yōu)化,使各書目之間、書目記錄中各實體對象間、書目記錄涉及主體和內(nèi)容之間建立邏輯關(guān)系,形成一張知識網(wǎng)絡(luò),使書目數(shù)據(jù)架構(gòu)更加立體化。優(yōu)化全部資源的檢索、顯示和排序功能設(shè)計,完善分面體系設(shè)置,實現(xiàn)目錄資源的多維度導(dǎo)航和智能化展示,方便用戶通過與分面體系的交互實現(xiàn)對資源的過濾和篩選。基于對資源主題描述的深度,強化文獻(xiàn)資源內(nèi)容、質(zhì)量的全面揭示,對文獻(xiàn)資源中有價值的多個主題或某一主題的全方面充分揭示,多設(shè)置入口主題詞,以滿足用戶從不同角度、不同論題檢索書目信息的需要,同時增加目錄資源選擇及辨識的功能,讓使用者可以在查詢目錄時,除了題名之外可以關(guān)聯(lián)到資料的目次甚至是書評,方便協(xié)助其選擇資源。
新型聯(lián)合目錄將資源共建共享范圍拓展至圖書館外,有效實現(xiàn)圖書館資源與館外資源、印本資源與電子資源的有效整合,使得用戶可以獲取資源的途徑和類型更加多元,但是如果僅通過聯(lián)合目錄信息對用戶所需的資源進(jìn)行羅列,反而不利于用戶的選擇,可以通過主動感知用戶實時需求,建立適應(yīng)電子資源及用戶情景敏感的一體化資源調(diào)度知識庫,協(xié)助用戶在更大范圍內(nèi)優(yōu)選服務(wù)路徑[15]。資源調(diào)度的文獻(xiàn)信息獲取來自于聯(lián)合目錄元數(shù)據(jù)的集成管理,必須保障充分揭示文獻(xiàn)資源信息,并提供獲取文獻(xiàn)方式(包括資源鏈接、館藏指引等),在館藏信息統(tǒng)一元數(shù)據(jù)索引集成的基礎(chǔ)上,根據(jù)用戶情景信息及其變化,與相關(guān)資源和服務(wù)進(jìn)行匹配,通過資源與服務(wù)和用戶需求相適應(yīng)的調(diào)度機制,向用戶提供最合適的資源及獲取方式。也就是根據(jù)用戶偏好及使用環(huán)境,按照資源質(zhì)量、獲取權(quán)限、資源位置、資源載體類型、資源價格等進(jìn)行優(yōu)先級排序,提供不同類型數(shù)字資源和不同服務(wù)方式之間的開放動態(tài)鏈接,這一功能拓展了聯(lián)合目錄的服務(wù)外延,可以根據(jù)用戶需求提供個性化的服務(wù),提高資源獲取的準(zhǔn)確性和服務(wù)提供的可靠性。
數(shù)字時代對聯(lián)合目錄發(fā)展提出新的要求,面對當(dāng)下資源生產(chǎn)和服務(wù)模式的變化,需要發(fā)展創(chuàng)新聯(lián)合目錄體系,擴展聯(lián)合目錄建設(shè)范疇,賦予聯(lián)合目錄新的內(nèi)涵,開展聯(lián)合目錄建設(shè)的跨界合作,重構(gòu)聯(lián)合目錄元數(shù)據(jù)結(jié)構(gòu),以元數(shù)據(jù)集成整合方式構(gòu)建集印本資源與電子資源于一體的聯(lián)合目錄集成化體系,拓展聯(lián)合目錄應(yīng)用環(huán)境和服務(wù)模式,從傳統(tǒng)的館際互借、文獻(xiàn)傳遞、網(wǎng)絡(luò)遠(yuǎn)程傳遞,擴展到互聯(lián)網(wǎng)等數(shù)據(jù)搜索服務(wù)平臺,從揭示文獻(xiàn)資源位置擴展到主動的、實時的資源調(diào)度服務(wù),在聯(lián)合目錄元數(shù)據(jù)深層次挖掘和語義分析的基礎(chǔ)上,實現(xiàn)文獻(xiàn)資源多維度、多脈絡(luò)的揭示,推動文獻(xiàn)資源的聚合和共享。與此同時,新型聯(lián)合目錄的共建共享有賴于統(tǒng)一標(biāo)準(zhǔn)規(guī)范體系的建設(shè)、完備的版權(quán)管理機制和配套的利益共享機制,實現(xiàn)聯(lián)合目錄資源建設(shè)、元數(shù)據(jù)集成到服務(wù)功能的全方位跨界協(xié)同,催生聯(lián)合目錄新業(yè)態(tài)發(fā)展態(tài)勢,確保資源發(fā)現(xiàn)服務(wù)的高效性和可持續(xù)性。