王昆鵬 陳鈺 王樹(shù)斌
摘要:利用MASHUP技術(shù),可以實(shí)現(xiàn)書目擴(kuò)展信息應(yīng)用,在OPAC系統(tǒng)中顯示圖書封面、章節(jié)目錄等內(nèi)容。現(xiàn)在在大部分的OPAC系統(tǒng)中都可以實(shí)現(xiàn),但應(yīng)用的情況比較混亂,缺乏統(tǒng)一的標(biāo)準(zhǔn)規(guī)范。
關(guān)鍵詞:MASHUP技術(shù);OPAC系統(tǒng);書目擴(kuò)展信息
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)27-6391-02
Abstract: MASHUP technology, can achieve bibliography extended information applications, display book covers, chapter directory and other content in OPAC system. Now most of the OPAC system can be achieved, but the situation is chaotic applications, the lack of uniform standards.
Key words: MASHUP technology; OPAC system; bibliography extended information
OPAC,即聯(lián)機(jī)公共查詢目錄 (Online Public Access Catalogue),是圖書館重要的館藏檢索工具。OPAC是隨著信息技術(shù)在圖書館領(lǐng)域的應(yīng)用而產(chǎn)生的,最初只是對(duì)傳統(tǒng)卡片目錄的簡(jiǎn)單數(shù)字化,給讀者提供一種計(jì)算機(jī)檢索工具。隨著互聯(lián)網(wǎng)的快速發(fā)展和普及,OPAC已經(jīng)取代卡片目錄,作為館藏的主要檢索工具,是現(xiàn)代圖書館信息管理系統(tǒng)一個(gè)必不可少的部分。
OPAC的檢索數(shù)據(jù)源是圖書館的書目元數(shù)據(jù),即MARC數(shù)據(jù)。MARC數(shù)據(jù)是一種結(jié)構(gòu)化的數(shù)據(jù),這使得檢索非常方便。但目前的MARC數(shù)據(jù)容納的字段有限,例如國(guó)內(nèi)普遍使用的CNMARC,就不含書籍封面、章節(jié)目錄等信息,這些沒(méi)在MARC中定義的書目信息,可以稱之為書目擴(kuò)展信息。在OPAC系統(tǒng)中,書目擴(kuò)展信息因?yàn)椴皇菆D書館書目元數(shù)據(jù)的內(nèi)容,所以無(wú)法向讀者提供。這不僅與現(xiàn)在互聯(lián)網(wǎng)的豐富內(nèi)容相較有些脫節(jié),也不利于對(duì)館藏書目的揭示,不能更好地方便讀者對(duì)書目信息的檢索利用。
1 實(shí)現(xiàn)書目擴(kuò)展信息應(yīng)用的途徑
在OPAC系統(tǒng)中顯示MARC定義內(nèi)容以外的書目擴(kuò)展信息,目前主要采用MASHUP技術(shù)實(shí)現(xiàn)。所謂MASHUP技術(shù)是將兩種以上使用公共或者私有數(shù)據(jù)庫(kù)的web應(yīng)用加在一起,形成一個(gè)整合應(yīng)用,利用從系統(tǒng)外部第三方數(shù)據(jù)源獲取的內(nèi)容和功能來(lái)創(chuàng)建全新的服務(wù)。通過(guò)MASHUP技術(shù),可以將外部的書目擴(kuò)展數(shù)據(jù)和圖書館的書目數(shù)據(jù)整合顯示在OPAC系統(tǒng)中,從而實(shí)現(xiàn)書目擴(kuò)展信息服務(wù)。
書目擴(kuò)展信息服務(wù)最主要的問(wèn)題是如何獲取數(shù)據(jù),圖書館在進(jìn)行書目著錄時(shí)并沒(méi)有包含這些信息?,F(xiàn)在獲取數(shù)據(jù)的方法主要有三種:
1) 采集著錄書目擴(kuò)展信息數(shù)據(jù),構(gòu)建新的元數(shù)據(jù)。采集整理書籍封面、章節(jié)目錄、內(nèi)容簡(jiǎn)介、作者簡(jiǎn)介等內(nèi)容信息,作為原來(lái)書目數(shù)據(jù)的補(bǔ)充,在OPAC系統(tǒng)中提供給讀者。清華大學(xué)圖書館為了在OPAC中顯示圖書封面,便對(duì)館藏書目封面進(jìn)行過(guò)掃描采集。自建數(shù)據(jù)的方法能夠完善館藏書目信息,并在數(shù)據(jù)質(zhì)量、使用權(quán)限等方面有足夠保障。但不足之處在于成本過(guò)高,新建數(shù)據(jù)需要對(duì)館藏書目逐一進(jìn)行信息采集,對(duì)于現(xiàn)在許多藏書量以百萬(wàn)計(jì)的圖書館來(lái)說(shuō),這會(huì)是一項(xiàng)浩繁的工作。
2) 從互聯(lián)網(wǎng)上免費(fèi)獲取書目擴(kuò)展信息?;ヂ?lián)網(wǎng)上擁有大量的書目數(shù)據(jù)信息,這些信息直接面向網(wǎng)絡(luò)用戶,雖然不如圖書館的數(shù)據(jù)規(guī)范詳實(shí),但卻在很多地方更加實(shí)用,而且有些內(nèi)容正是圖書館數(shù)據(jù)中缺少的。比如圖書封面、章節(jié)目錄、內(nèi)容簡(jiǎn)介、試讀內(nèi)容等等,這些信息亞馬遜、當(dāng)當(dāng)網(wǎng)、豆瓣網(wǎng)、超星數(shù)字圖書館等網(wǎng)站上都比較完備。除此之外,還可以獲取圖書銷量、書評(píng)等內(nèi)容提供給讀者作為參考。獲取信息的技術(shù)有兩種,一種是通過(guò)網(wǎng)站提供的API接口,目前豆瓣網(wǎng)就有開(kāi)放的API接口;二是當(dāng)網(wǎng)站不對(duì)外提供API接口時(shí),通常采用屏幕抓取技術(shù)來(lái)實(shí)現(xiàn)。南京大學(xué)圖書館以豆瓣網(wǎng)作為數(shù)據(jù)源,實(shí)現(xiàn)了在OPAC系統(tǒng)中顯示書目擴(kuò)展信息。免費(fèi)獲取數(shù)據(jù)雖然方便、成本低,但也存在著較多問(wèn)題。首先是數(shù)據(jù)的覆蓋面有限,互聯(lián)網(wǎng)上的書目數(shù)據(jù)主要集中在暢銷類和大眾普及讀物方面的圖書,專業(yè)性強(qiáng)的或者是出版時(shí)間較早的圖書數(shù)據(jù)較少涉及。而這兩類圖書又恰好是很多圖書館尤其是高校圖書館的主要館藏。所以,采用免費(fèi)從互聯(lián)網(wǎng)獲取數(shù)據(jù)源的方法,獲取的數(shù)據(jù)有限,只能滿足部分需求。其次,獲取的數(shù)據(jù)質(zhì)量難以保障,互聯(lián)網(wǎng)數(shù)據(jù)雖然內(nèi)容豐富,但并沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)約束,隨意性較為明顯,且不能確保內(nèi)容正確。第三,數(shù)據(jù)源缺乏穩(wěn)定性,從互聯(lián)網(wǎng)獲取數(shù)據(jù),無(wú)法有效的控制數(shù)據(jù)源,數(shù)據(jù)源有任何的變動(dòng)都有可能造成獲取數(shù)據(jù)失敗,讓書目擴(kuò)展信息服務(wù)無(wú)法保證持續(xù)穩(wěn)定。
3) 在自建和免費(fèi)獲取兩種方式獲取數(shù)據(jù)之外,現(xiàn)在也有商業(yè)數(shù)據(jù)提供。有機(jī)構(gòu)或廠商已經(jīng)完成了書目擴(kuò)展信息的數(shù)據(jù)采集,并構(gòu)建了規(guī)范的數(shù)據(jù)源。以云計(jì)算的方式提供給圖書館,同樣使用MASHUP技術(shù)與圖書館OPAC系統(tǒng)整合,實(shí)現(xiàn)書目擴(kuò)展信息服務(wù)。這種方式可以免去圖書館采集數(shù)據(jù)的繁瑣工作,在書目數(shù)據(jù)的覆蓋量、質(zhì)量、穩(wěn)定性等方面也能保障。只是需要支付一定的費(fèi)用。
2 書目擴(kuò)展信息應(yīng)用情況調(diào)查
雖然通過(guò)技術(shù)手段或商業(yè)方法可以在圖書館OPAC系統(tǒng)中整合進(jìn)書目擴(kuò)展信息,但這個(gè)服務(wù)并不是必不可少的內(nèi)容,受限于觀念、技術(shù)和經(jīng)費(fèi)等原因,書目擴(kuò)展信息服務(wù)在國(guó)內(nèi)高校圖書館OPAC系統(tǒng)中應(yīng)用的水平差距較大。個(gè)別技術(shù)能力強(qiáng)和經(jīng)費(fèi)充足的圖書館,通過(guò)自己開(kāi)發(fā)建設(shè),已經(jīng)具備了很好的書目擴(kuò)展信息服務(wù)。而其他的大部分圖書館,主要是依靠本館OPAC系統(tǒng)自身的功能。
OPAC系統(tǒng)一般是作為自動(dòng)化業(yè)務(wù)的一部分與圖書館信息系統(tǒng)集成在一起的。國(guó)內(nèi)高校圖書館采用的集成管理系統(tǒng)不盡相同,既有國(guó)外開(kāi)發(fā)的系統(tǒng),也有國(guó)內(nèi)開(kāi)發(fā)的系統(tǒng)。國(guó)外的系統(tǒng)有UNICORN/ HORIZON、INNOPAC、ALEPH 等,國(guó)內(nèi)的系統(tǒng)有匯文、ILAS、melinets、金盤、妙思、SULCMIS等。在“211”高校中,使用國(guó)外管理系統(tǒng)的有28所,站總數(shù)的24%,使用國(guó)內(nèi)管理系統(tǒng)有90所高校圖書館,站總數(shù)的76%。國(guó)外管理系統(tǒng)用戶分別為ALEPH 11家,UNICORN/ HORIZON 10家,INNOPAC 7 家。使用國(guó)外管理系統(tǒng)主要集中在重點(diǎn)高校圖書館,39所“985”高校中,使用國(guó)外系統(tǒng)的有 18家,占總數(shù)的46%。國(guó)內(nèi)管理系統(tǒng)用戶分別為匯文、melinets、金盤幾個(gè)系統(tǒng)用戶數(shù)比較多。
使用國(guó)外管理系統(tǒng)用戶中,有部分用戶實(shí)現(xiàn)了書目擴(kuò)展信息服務(wù),OPAC中可以顯示圖書封面、章節(jié)目錄、內(nèi)容簡(jiǎn)介等內(nèi)容。所有這些擴(kuò)展信息服務(wù)都是通過(guò)商業(yè)付費(fèi)的形式,由Ex Libris公司的Primo系統(tǒng)實(shí)現(xiàn)。Primo提供完整的Web 2.0功能:包括檢索詞提示、標(biāo)簽、評(píng)論、以及Wiki、網(wǎng)絡(luò)摘要、著者簡(jiǎn)介、網(wǎng)絡(luò)目次等各種資源,并采用Mashup技術(shù)將這些內(nèi)容整合在一起,呈現(xiàn)一個(gè)信息豐富的頁(yè)面。
國(guó)內(nèi)管理系統(tǒng)中,用戶最多的匯文系統(tǒng),其最新版的OPAC整合了豆瓣網(wǎng)的內(nèi)容,直接可以顯示圖書封面、章節(jié)目錄等內(nèi)容,而較前的舊版本則沒(méi)有此功能。Melinets系統(tǒng)和金盤系統(tǒng)本身沒(méi)有實(shí)現(xiàn)書目擴(kuò)展信息顯示的功能,但最新版的OPAC預(yù)留了接口和顯示空間,需要用戶提供對(duì)接數(shù)據(jù)源,部分用戶采用商業(yè)付費(fèi)的形式從第三方獲取了書目擴(kuò)展信息數(shù)據(jù)和服務(wù),主要使用的是聯(lián)圖(libtop)公司的XOPAC,可以在opac系統(tǒng)中顯示圖書封面、作者簡(jiǎn)介、摘要、目錄、Tag標(biāo)簽、網(wǎng)絡(luò)書評(píng)等內(nèi)容。
3 結(jié)束語(yǔ)
在OPAC中實(shí)現(xiàn)書目擴(kuò)展信息服務(wù),在技術(shù)上難度不大,主要的困難依然是數(shù)據(jù)源。如果圖書館進(jìn)行單獨(dú)的開(kāi)發(fā)不太現(xiàn)實(shí),需要投入大量的人力財(cái)力,而且很多圖書館在沒(méi)有這個(gè)能力。所以依靠OPAC系統(tǒng)自身實(shí)現(xiàn),或借助第三方服務(wù)商實(shí)現(xiàn)都是不錯(cuò)的途徑。但現(xiàn)在的書目擴(kuò)展信息服務(wù)還比較混亂,一方面獲取到的數(shù)據(jù)不規(guī)范,不同的數(shù)據(jù)來(lái)源內(nèi)容也不一樣;另一方面由于很多OPAC系統(tǒng)沒(méi)有開(kāi)放的接口,從第三方獲取的服務(wù)與OPAC對(duì)接比較麻煩,致使很多前端用戶接口顯示雜亂不友好。所以,為了能在OPAC中提供良好的書目擴(kuò)展信息服務(wù),制定一個(gè)關(guān)于元數(shù)據(jù)和API接口的標(biāo)準(zhǔn)規(guī)范是非常有必要的。
參考文獻(xiàn):
[1] 喬歡,劉漫,陳志新. OPAC歷史沿革及其發(fā)展趨勢(shì)[J]. 國(guó)家圖書館學(xué)刊, 2006 (4): 5-9.
[2] 王海英,汪其英. 國(guó)內(nèi)現(xiàn)有主要OPAC的調(diào)查研究[J]. 農(nóng)業(yè)圖書情報(bào)學(xué)刊, 2011 (12): 48-53.
[3] 李田章. 基于Mashup模式的OPAC資源整合_以整合豆瓣網(wǎng)圖書封面為例 [J]. 圖書館論壇, 2011(5): 119-121.
[4] 馮亞惠. 我國(guó)圖書館新型OPAC系統(tǒng)現(xiàn)狀的調(diào)查_(kāi)馮亞惠[J]. 圖書館雜志, 2010(1): 46-55.
[5] 司莉,陳新元. 我國(guó)高校圖書館OPAC系統(tǒng)的功能_省略_校排名30強(qiáng)圖書館的OPAC為例_司莉[J]. 現(xiàn)代圖書情報(bào)技術(shù), 2009(Z1): 28-32.
[6] 周虹,張蓓,竇天芳,等. 清華大學(xué)圖書館OPAC書封服務(wù)的設(shè)計(jì)與實(shí)現(xiàn)_周虹[J]. 現(xiàn)代圖書情報(bào)技術(shù), 2008(8): 84-87.
[7] 雷艷,楊靜海. 簡(jiǎn)述CNMARC與UNIMARC的不同之處_雷艷[J]. 圖書情報(bào)工作, 1993(6): 38-39+64.