張毅
(華東師范大學(xué)圖書(shū)館,上海 200241)
隨著互聯(lián)網(wǎng)的迅速發(fā)展,大數(shù)據(jù)與人工智能技術(shù)的成熟,讀者閱讀行為的不斷改變,需要圖書(shū)館在館藏建設(shè)與資源揭示方面不斷創(chuàng)新。近年來(lái),電子館藏的總量與增加量已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)紙質(zhì)館藏[1],但是圖書(shū)館現(xiàn)在還只能通過(guò)OPAC對(duì)紙質(zhì)館藏進(jìn)行簡(jiǎn)單管理,沒(méi)有有效的手段對(duì)浩如煙海的電子館藏進(jìn)行管理揭示[2]。原因在于每種電子資源都有各自獨(dú)立的平臺(tái),并且各種平臺(tái)之間無(wú)法互操作,形成一個(gè)個(gè)“信息孤島”。讀者在使用圖書(shū)館資源時(shí)需要在多個(gè)不同平臺(tái)之間切換,無(wú)法有效找到需要的資料[3]。由于缺少功能完備的電子資源管理工具,圖書(shū)館沒(méi)有辦法掌握所購(gòu)買(mǎi)的各種資源是否符合讀者需求,容易造成資源錯(cuò)配。
雖然圖書(shū)館很早就意識(shí)到這種問(wèn)題的存在,也嘗試使用各種手段去解決問(wèn)題。如通過(guò)建立電子資源導(dǎo)航[4],為讀者提供圖書(shū)館所購(gòu)買(mǎi)的數(shù)據(jù)庫(kù)列表,但是讀者只有在明確知道自己所找的資源的具體位置時(shí)才有幫助,而且需要檢索多個(gè)數(shù)據(jù)平臺(tái),并且對(duì)檢索的結(jié)果進(jìn)行去重排序等工作。當(dāng)數(shù)據(jù)平臺(tái)量比較少時(shí),這種方式可以實(shí)現(xiàn),但是現(xiàn)如今圖書(shū)館少則有幾十個(gè)數(shù)據(jù)庫(kù)與期刊,多則有幾百個(gè)數(shù)據(jù)庫(kù)與期刊,人工方式篩選數(shù)據(jù)會(huì)造成遺漏;第二種方式是建立聯(lián)邦檢索[5],這種方式是利用各種系統(tǒng)提供的接口,實(shí)時(shí)查詢(xún),并將查詢(xún)記錄返回給讀者,雖然可以減少讀者在不同平臺(tái)之間搜索數(shù)據(jù)的麻煩,但是因?yàn)闊o(wú)法事先對(duì)不同平臺(tái)數(shù)據(jù)進(jìn)行清洗加工,導(dǎo)致返回?cái)?shù)據(jù)質(zhì)量差,而且同時(shí)檢索多個(gè)平臺(tái),系統(tǒng)響應(yīng)速度會(huì)非常慢。由于缺少管理電子資源的有效方法與工具,圖書(shū)館雖然擁有經(jīng)過(guò)專(zhuān)家鑒定的高質(zhì)量?jī)?nèi)容資源,但無(wú)法有效地揭示給讀者,讀者最終只能使用搜索引擎查找與甄別互聯(lián)網(wǎng)上參差不齊的資料。圖書(shū)館與讀者都亟需一種可以全面揭示圖書(shū)館資源的系統(tǒng),在這種背景下,發(fā)現(xiàn)系統(tǒng)(discovery system)應(yīng)運(yùn)而生[6]。
美國(guó)國(guó)家教育統(tǒng)計(jì)中心對(duì)發(fā)現(xiàn)系統(tǒng)的定義是:它獨(dú)立于圖書(shū)館特定的資源平臺(tái),采取適當(dāng)?shù)臋C(jī)制對(duì)圖書(shū)館多種館藏進(jìn)行檢索,對(duì)檢索到的內(nèi)容進(jìn)行相關(guān)性排序,并呈現(xiàn)讀者感興趣的內(nèi)容,可以根據(jù)類(lèi)別、作者或者日期等來(lái)縮小檢索結(jié)果,提供相關(guān)內(nèi)容建議,改進(jìn)檢索方式[7]。美國(guó)國(guó)家信息標(biāo)準(zhǔn)組織指出了圖書(shū)館發(fā)現(xiàn)系統(tǒng)未來(lái)發(fā)展的方向[8],分析了發(fā)現(xiàn)系統(tǒng)從在線目錄、元搜索到資源發(fā)現(xiàn)的發(fā)展過(guò)程。其中元搜索階段已經(jīng)基本具備發(fā)現(xiàn)系統(tǒng)的功能,限于技術(shù)環(huán)境的發(fā)展階段,最初元搜索系統(tǒng)采取分布式檢索方式獲取資源,而很少采取集中式元數(shù)據(jù)匯聚模式[9]。
本文所闡述的發(fā)現(xiàn)系統(tǒng)指的是集中式元搜索模式,采用預(yù)先收割的方式存入統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)體系中,對(duì)元數(shù)據(jù)進(jìn)行去重、清洗、標(biāo)注、索引等操作,形成一個(gè)龐大的元數(shù)據(jù)索引庫(kù),不斷地對(duì)索引庫(kù)進(jìn)行更新與優(yōu)化,并按照發(fā)現(xiàn)系統(tǒng)獲取元數(shù)據(jù)的不同方式分為資源發(fā)現(xiàn)系統(tǒng)與學(xué)術(shù)搜索引擎兩大類(lèi)。資源發(fā)現(xiàn)系統(tǒng)的元數(shù)據(jù)是自有或者與數(shù)據(jù)庫(kù)提供商合作,通過(guò)數(shù)據(jù)收割協(xié)議獲取元數(shù)據(jù),數(shù)據(jù)質(zhì)量高、時(shí)效性好;學(xué)術(shù)搜索引擎的元數(shù)據(jù)來(lái)自其機(jī)器爬蟲(chóng)通過(guò)HTTP協(xié)議在互聯(lián)網(wǎng)抓取的數(shù)據(jù),雖然獲取的數(shù)據(jù)范圍廣,但質(zhì)量參差不齊。
資源發(fā)現(xiàn)系統(tǒng)最早出現(xiàn)于2008年,聯(lián)機(jī)計(jì)算機(jī)圖書(shū)館中心(Online Computer Library Center,OCLC)推出了全球第一款資源發(fā)現(xiàn)系統(tǒng)World cat Local,緊隨其后的是Series Solution公司的Summon(2009年7月)、Ebsco公司的EDS(2010年1月)及Ex Libris公司的Primo(2010年6月),形成4種發(fā)現(xiàn)系統(tǒng)。根據(jù)供應(yīng)商原有業(yè)務(wù)的不同,這4種發(fā)現(xiàn)系統(tǒng)各具特色。Ex Libris公司是圖書(shū)館集成系統(tǒng)提供商,沒(méi)有數(shù)據(jù)庫(kù)資源,需要與大多數(shù)數(shù)據(jù)庫(kù)廠商合作獲取元數(shù)據(jù),所以Primo系統(tǒng)在元數(shù)據(jù)收集、處理及揭示方面比較中立。Summon與EDS都是由內(nèi)容提供商開(kāi)發(fā)的發(fā)現(xiàn)系統(tǒng),由于其自身具有龐大的電子資源,而且在資源發(fā)現(xiàn)領(lǐng)域耕耘多年,所以數(shù)據(jù)內(nèi)容更加豐富[10]。國(guó)內(nèi)資源發(fā)現(xiàn)系統(tǒng)起步較晚,但由于對(duì)中文數(shù)據(jù)收集更加全面準(zhǔn)確,本地化做得更好,移動(dòng)互聯(lián)網(wǎng)與社交網(wǎng)絡(luò)功能豐富,所以在國(guó)內(nèi)市場(chǎng)的表現(xiàn)并不輸于國(guó)外產(chǎn)品,國(guó)內(nèi)的資源發(fā)現(xiàn)系統(tǒng)有超星發(fā)現(xiàn)與維普智立方等。
搜索引擎天然地在資源收集方面擁有優(yōu)勢(shì),可以通過(guò)機(jī)器爬蟲(chóng)在整個(gè)互聯(lián)網(wǎng)中搜集資料,然后通過(guò)索引提供給用戶(hù)使用[11]。學(xué)術(shù)搜索引擎的出現(xiàn)遠(yuǎn)早于發(fā)現(xiàn)系統(tǒng),2004年11月谷歌公司推出第一款學(xué)術(shù)搜索引擎——谷歌學(xué)術(shù)。2006年1月擴(kuò)展到中文學(xué)術(shù)資源,隨后在2009年11月微軟學(xué)術(shù)推出微軟學(xué)術(shù)搜索,但目前仍不支持中文。2014年是國(guó)內(nèi)學(xué)術(shù)搜索引擎爆發(fā)的一年,百度學(xué)術(shù)和360好搜紛紛問(wèn)世。學(xué)術(shù)搜索引擎由于其背后強(qiáng)大的技術(shù)支持,完全免費(fèi)開(kāi)放使用,受到讀者和圖書(shū)館的歡迎。谷歌學(xué)術(shù)和微軟學(xué)術(shù)在英文文獻(xiàn)覆蓋方面有優(yōu)勢(shì);百度學(xué)術(shù)和360好搜更加擅長(zhǎng)中文知識(shí)的發(fā)現(xiàn);百度學(xué)術(shù)專(zhuān)門(mén)為圖書(shū)館提供數(shù)據(jù)整合接口,圖書(shū)館可以將本館購(gòu)買(mǎi)的電子資源與紙質(zhì)資源元數(shù)據(jù)上傳到百度學(xué)術(shù),實(shí)現(xiàn)數(shù)據(jù)的深度融合[12]。
本研究調(diào)查時(shí)間段為2018年10—12月,調(diào)查了113所“211工程”高校圖書(shū)館[13],通過(guò)圖書(shū)館的主頁(yè)獲取其采用的發(fā)現(xiàn)系統(tǒng)情況,有4所高校圖書(shū)館的官網(wǎng)無(wú)法打開(kāi),可獲得數(shù)據(jù)的高校圖書(shū)館有109所,詳細(xì)調(diào)查信息如表1所示。本文的數(shù)據(jù)分析以這109所可獲取數(shù)據(jù)的高校圖書(shū)館為依據(jù)。
可以看到,109所“211工程”高校中,引進(jìn)發(fā)現(xiàn)系統(tǒng)的有94所,其中使用資源發(fā)現(xiàn)系統(tǒng)的有88所,使用學(xué)術(shù)搜索引擎的有37所。引進(jìn)中文資源發(fā)現(xiàn)系統(tǒng)的有66所(中文資源發(fā)現(xiàn)系統(tǒng)只有超星發(fā)現(xiàn)),引進(jìn)外文資源發(fā)現(xiàn)系統(tǒng)的有68所(外文資源發(fā)現(xiàn)系統(tǒng)分別是Primo、Summon、Find+、EDS),中英文發(fā)現(xiàn)系統(tǒng)都采用的有46所。既引進(jìn)資源發(fā)現(xiàn)系統(tǒng)又采用學(xué)術(shù)搜索引擎的高校有31所,占引進(jìn)學(xué)術(shù)搜索引擎高校的84%,其中有6所高校只引進(jìn)了學(xué)術(shù)搜索引擎。采用的學(xué)術(shù)搜索引擎有3種,分別是百度學(xué)術(shù)、谷歌學(xué)術(shù)及微軟學(xué)術(shù)。從使用的比例來(lái)看,百度學(xué)術(shù)占了絕大多數(shù),113所“211工程”高校中有32%的高校圖書(shū)館采用百度學(xué)術(shù),使用率占學(xué)術(shù)搜索引擎的95%。谷歌學(xué)術(shù)使用量少的原因是國(guó)內(nèi)不能直接訪問(wèn)谷歌學(xué)術(shù)網(wǎng)站,只能通過(guò)谷歌學(xué)術(shù)鏡像訪問(wèn),而鏡像的穩(wěn)定性比較差。微軟學(xué)術(shù)使用率低的原因是其產(chǎn)品存在問(wèn)題,它不支持圖書(shū)館本地資源整合且沒(méi)有中文數(shù)據(jù)等缺陷。各種發(fā)現(xiàn)系統(tǒng)的具體采用比例如圖1所示,可以發(fā)現(xiàn),學(xué)術(shù)搜索引擎的使用比例并不低,百度學(xué)術(shù)比資源發(fā)現(xiàn)系統(tǒng)超星使用量少,但是高于其他4種外文資源發(fā)現(xiàn)系統(tǒng)。
資源發(fā)現(xiàn)系統(tǒng)的建設(shè)方式一般有3種,最常用的方式是直接采購(gòu)成熟的產(chǎn)品,配上本館的電子數(shù)據(jù)庫(kù)與紙質(zhì)館藏元數(shù)據(jù),這種方式最為簡(jiǎn)單方便。發(fā)現(xiàn)系統(tǒng)產(chǎn)品已經(jīng)比較成熟,圖書(shū)館不需要耗費(fèi)過(guò)多的人力物力去建設(shè),而且均為云平臺(tái),不需要在圖書(shū)館本地搭建服務(wù)器,無(wú)須圖書(shū)館投入人力去維護(hù)。采用這種方式的有華東師范大學(xué)圖書(shū)館的超星發(fā)現(xiàn)與Summon系統(tǒng)、清華大學(xué)的Primo系統(tǒng)及南開(kāi)大學(xué)的EDS系統(tǒng)等。第二種是聯(lián)合研發(fā)模式,這種方式的優(yōu)點(diǎn)非常明顯,可以做到一站式檢索,深入與圖書(shū)館的OPAC整合,用戶(hù)體驗(yàn)最好。采用這種建設(shè)方式的圖書(shū)館有重慶大學(xué)“弘深搜索”,是對(duì)傳統(tǒng)OPAC的升級(jí),讀者可以一站式檢索電子資源與紙質(zhì)圖書(shū)(“弘深搜索”底層的元數(shù)據(jù)由超星公司提供)。第三種是采用開(kāi)源軟件方式建設(shè)發(fā)現(xiàn)系統(tǒng),常見(jiàn)的發(fā)現(xiàn)系統(tǒng)開(kāi)源軟件有vufind、endeca、blacklight、scriblio等。如北京大學(xué)、西安交通大學(xué)利用scriblio構(gòu)建的新一代OPAC系統(tǒng)。
表1 “211工程”高校圖書(shū)館發(fā)現(xiàn)系統(tǒng)調(diào)查結(jié)果
圖1 “211”工程高校各種發(fā)現(xiàn)系統(tǒng)的采用情況
采用學(xué)術(shù)搜索引擎實(shí)現(xiàn)圖書(shū)館資源發(fā)現(xiàn)的方式比較單一,微軟學(xué)術(shù)沒(méi)有中文學(xué)術(shù)數(shù)據(jù),只有外文數(shù)據(jù),而且不能與圖書(shū)館資源整合。谷歌學(xué)術(shù)需要在圖書(shū)館本地構(gòu)建鏈接解析器(link resolver)[14],將圖書(shū)館本地?cái)?shù)據(jù)提交給谷歌學(xué)術(shù),由于國(guó)內(nèi)只能通過(guò)鏡像網(wǎng)站訪問(wèn)谷歌學(xué)術(shù),并不穩(wěn)定。國(guó)內(nèi)圖書(shū)館采用的學(xué)術(shù)搜索引擎主要是百度學(xué)術(shù),圖書(shū)館可以將購(gòu)買(mǎi)的電子數(shù)據(jù)庫(kù)、本館館藏等提交給百度學(xué)術(shù),由百度學(xué)術(shù)對(duì)這些數(shù)據(jù)進(jìn)行解析,通過(guò)IP控制實(shí)現(xiàn)針對(duì)本館的資源揭示;圖書(shū)館還可以對(duì)百度學(xué)術(shù)的界面進(jìn)行修改,使其更加本地化。將本館電子資源整合到百度學(xué)術(shù)的高校有浙江大學(xué)、南京大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)等;將本館紙質(zhì)館藏與百度學(xué)術(shù)融合的高校比較少,如中南大學(xué)。
為挖掘發(fā)現(xiàn)系統(tǒng)特點(diǎn)對(duì)高校圖書(shū)館發(fā)現(xiàn)系統(tǒng)選擇的影響,本文對(duì)國(guó)內(nèi)關(guān)注度比較高的4種資源發(fā)系統(tǒng)和3種學(xué)術(shù)搜索引擎進(jìn)行調(diào)查分析,具體調(diào)查結(jié)果見(jiàn)表2。
表2 發(fā)現(xiàn)系統(tǒng)特征調(diào)查
分別從元數(shù)據(jù)特征、系統(tǒng)特征、整合本館資源、在線科研等方面進(jìn)行分析,可知發(fā)現(xiàn)系統(tǒng)有以下特征。
(1)元數(shù)據(jù)特征。除谷歌學(xué)術(shù)和微軟學(xué)術(shù)外,其他5種系統(tǒng)的元數(shù)據(jù)總量都可以查到。從查到的結(jié)果看,Summon的數(shù)據(jù)量最大,有9億條記錄;其次是超星發(fā)現(xiàn)有5.5億條記錄。3種國(guó)外的發(fā)現(xiàn)系統(tǒng)主要收錄英文數(shù)據(jù),而超星發(fā)現(xiàn)以中文為主。數(shù)據(jù)的來(lái)源方面,資源發(fā)現(xiàn)系統(tǒng)的數(shù)據(jù)基本上來(lái)自數(shù)據(jù)庫(kù)商,沒(méi)有收錄萬(wàn)維網(wǎng)的數(shù)據(jù),Summon和EDS數(shù)據(jù)主要是自有數(shù)據(jù),而Primo的數(shù)據(jù)來(lái)自合作的數(shù)據(jù)庫(kù)商,超星電子書(shū)是自有數(shù)據(jù),期刊主要來(lái)自合作的數(shù)據(jù)庫(kù)商。學(xué)術(shù)搜索引擎的數(shù)據(jù)主要來(lái)自爬蟲(chóng)機(jī)器人從萬(wàn)維網(wǎng)中抓取的數(shù)據(jù),經(jīng)過(guò)清洗索引后形成,其中微軟學(xué)術(shù)沒(méi)有中文數(shù)據(jù)。由此可見(jiàn),資源發(fā)現(xiàn)系統(tǒng)的數(shù)據(jù)質(zhì)量更高,而學(xué)術(shù)搜索引擎的數(shù)據(jù)面更廣。
(2)系統(tǒng)特征。系統(tǒng)的響應(yīng)速度極大地影響用戶(hù)體驗(yàn)的好壞,從調(diào)查的結(jié)果中發(fā)現(xiàn),國(guó)外資源發(fā)現(xiàn)系統(tǒng)的響應(yīng)速度很慢,主要是因?yàn)榘l(fā)現(xiàn)系統(tǒng)基本上都是云端部署,在國(guó)內(nèi)沒(méi)有數(shù)據(jù)中心,每次訪問(wèn)都要從國(guó)外服務(wù)器返回?cái)?shù)據(jù),所以速度很慢,而且不穩(wěn)定。從調(diào)查的結(jié)果看,學(xué)術(shù)搜索引擎的響應(yīng)非常迅速,百度學(xué)術(shù)只需16毫秒,瞬間就可以返回查詢(xún)結(jié)果,用戶(hù)體驗(yàn)極好。相較于資源發(fā)現(xiàn)系統(tǒng),學(xué)術(shù)搜索引擎會(huì)提供一些免費(fèi)的原文,并且學(xué)術(shù)搜索引擎全部是免費(fèi)使用,基于搜索引擎的強(qiáng)大技術(shù),大多數(shù)學(xué)術(shù)搜索引擎都可以實(shí)現(xiàn)讀者檢索行為學(xué)習(xí),幫助讀者更好地發(fā)現(xiàn)自己需要的資料。
(3)與本館資源整合情況。整體上來(lái)說(shuō)資源發(fā)現(xiàn)系統(tǒng)與本館資源整合較好,都可以做到發(fā)現(xiàn)系統(tǒng)查詢(xún)結(jié)果跳轉(zhuǎn)到館藏OPAC。其中Primo幾乎可以取代本館的OPAC,不僅可以查看本館的館藏位置,而且有預(yù)約續(xù)借等功能。學(xué)術(shù)搜索引擎與本館的整合度較低,沒(méi)有一個(gè)學(xué)術(shù)搜索引擎可以顯示本館館藏的位置,但基本上可以實(shí)現(xiàn)紙質(zhì)資源與電子資源的一站式發(fā)現(xiàn)。
(4)在線科研情況。在線科研方面,學(xué)術(shù)搜索引擎功能強(qiáng)大,其中百度學(xué)術(shù)和谷歌學(xué)術(shù)都有學(xué)者主頁(yè),學(xué)者可以訂閱、收藏所需要的資料,但是資源發(fā)現(xiàn)系統(tǒng)沒(méi)有這些功能。在移動(dòng)科研方面,所有的發(fā)現(xiàn)系統(tǒng)都提供移動(dòng)網(wǎng)站,但是與微信對(duì)接的只有百度學(xué)術(shù),讀者關(guān)注百度學(xué)術(shù)的微信公眾賬號(hào),可以獲取自己訂閱的資料,使用過(guò)程比較方便。
發(fā)現(xiàn)系統(tǒng)與圖書(shū)館資源整合能力體現(xiàn)了發(fā)現(xiàn)系統(tǒng)資源覆蓋能力。除學(xué)術(shù)搜索引擎外,一般的資源發(fā)現(xiàn)系統(tǒng)都可以覆蓋圖書(shū)館的電子期刊與紙質(zhì)館藏,但是圖書(shū)館還有很多自建數(shù)據(jù)庫(kù),這些數(shù)據(jù)庫(kù)之間存在非常巨大的差異,在圖書(shū)館內(nèi)以一個(gè)個(gè)“信息孤島”的形式存在,由于“211工程”高校數(shù)量太多,本文僅對(duì)師范類(lèi)“211”工程高校圖書(shū)館特藏資源的特征進(jìn)行調(diào)查。調(diào)查時(shí)間為2018年11月,調(diào)查方法是通過(guò)圖書(shū)館的主頁(yè)及電話咨詢(xún),并且參考2015年全國(guó)師范院校圖書(shū)館聯(lián)盟文獻(xiàn)資源建設(shè)調(diào)查問(wèn)卷[15],調(diào)查結(jié)果見(jiàn)表3。可以看出特藏資源的類(lèi)型、平臺(tái),以及數(shù)據(jù)庫(kù)管理軟件存在巨大的差異,發(fā)現(xiàn)系統(tǒng)要整合這些資源存在不小的挑戰(zhàn)。但是它們的數(shù)據(jù)管理軟件都具有導(dǎo)出數(shù)據(jù)與對(duì)外提供訪問(wèn)接口的能力,這就為特藏資源整合到資源發(fā)現(xiàn)系統(tǒng)提供了方法。發(fā)現(xiàn)系統(tǒng)只需要提供特藏資源導(dǎo)入格式標(biāo)準(zhǔn),圖書(shū)館將特藏資源按照一定標(biāo)準(zhǔn)提交給發(fā)現(xiàn)系統(tǒng),發(fā)現(xiàn)系統(tǒng)即可以實(shí)現(xiàn)對(duì)圖書(shū)館特藏資源的統(tǒng)一發(fā)現(xiàn)。
表3 師范類(lèi)“211工程”高校圖書(shū)館特藏資源特征
發(fā)現(xiàn)系統(tǒng)的使用率是衡量發(fā)現(xiàn)系統(tǒng)好壞的重要指標(biāo)之一。谷歌趨勢(shì)可以反映某一區(qū)域內(nèi)關(guān)鍵詞檢索頻次,文本通過(guò)谷歌趨勢(shì)查詢(xún)了2015年12月—2018年12月Primo、EDS、Summon、百度學(xué)術(shù)、超星發(fā)現(xiàn)的熱度變化[16],調(diào)查范圍是中國(guó)(見(jiàn)圖2)。由于采用“超星發(fā)現(xiàn)”作為關(guān)鍵詞沒(méi)有記錄,所以改為“超星”進(jìn)行比對(duì)。從圖2可以看出,2017年1月之前資源發(fā)現(xiàn)系統(tǒng)的熱度比百度學(xué)術(shù)高,尤其是Primo系統(tǒng),但之后百度學(xué)術(shù)熱度迅速升高,而且遠(yuǎn)高于資源發(fā)現(xiàn)系統(tǒng)。此外,國(guó)外發(fā)現(xiàn)系統(tǒng)的熱度在降低,而國(guó)內(nèi)的超星發(fā)現(xiàn)熱度在上升,這也與筆者所在華東師范大學(xué)采用的超星發(fā)現(xiàn)和Summon兩種系統(tǒng)的使用情況相符,根據(jù)發(fā)現(xiàn)系統(tǒng)供應(yīng)商提供的訪問(wèn)數(shù)據(jù),2017年超星發(fā)現(xiàn)訪問(wèn)量是95.43萬(wàn)次,Summon訪問(wèn)量是4.23萬(wàn)次,使用中文發(fā)現(xiàn)系統(tǒng)是外文發(fā)現(xiàn)系統(tǒng)的20倍。
圖2 5種發(fā)現(xiàn)系統(tǒng)熱度隨時(shí)間變化的趨勢(shì)
通過(guò)對(duì)“211工程”高校采用的發(fā)現(xiàn)系統(tǒng)調(diào)查,發(fā)現(xiàn)系統(tǒng)之間的優(yōu)勢(shì)區(qū)別很大,這與發(fā)現(xiàn)系統(tǒng)提供商自身的主營(yíng)業(yè)務(wù)有關(guān),Summon與Primo在數(shù)據(jù)庫(kù)方面有優(yōu)勢(shì),而EDS和超星發(fā)現(xiàn)在電子圖書(shū)方面做得更好。學(xué)術(shù)搜索引擎在萬(wàn)維網(wǎng)數(shù)據(jù)獲取方面更有優(yōu)勢(shì)。發(fā)現(xiàn)系統(tǒng)與區(qū)位也有巨大的關(guān)系,國(guó)內(nèi)發(fā)現(xiàn)系統(tǒng)擅長(zhǎng)中文數(shù)據(jù)揭示,外文發(fā)現(xiàn)在中文揭示方面比較弱,根據(jù)發(fā)現(xiàn)系統(tǒng)的特點(diǎn)與“211工程”高校對(duì)發(fā)現(xiàn)系統(tǒng)的選擇分析,本文給出系統(tǒng)選型的一些建議。
調(diào)查中可以看出113所“211工程”高校中有86%的高校都已經(jīng)采用發(fā)現(xiàn)系統(tǒng),這些高校中有師范類(lèi)、工科類(lèi)、藝術(shù)類(lèi)等,在選擇發(fā)現(xiàn)系統(tǒng)上,圖書(shū)館可以根據(jù)學(xué)校的類(lèi)型挑選。如師范類(lèi)院校,北京師范大學(xué)圖書(shū)館選擇了Primo、超星發(fā)現(xiàn)與百度學(xué)術(shù)3種發(fā)現(xiàn)系統(tǒng),華東師范大學(xué)的發(fā)現(xiàn)系統(tǒng)是Summon與超星發(fā)現(xiàn),南京師范大學(xué)是Primo與超星發(fā)現(xiàn)。從這3所師范高校圖書(shū)館所選擇的發(fā)現(xiàn)系統(tǒng)中可以得到,每家圖書(shū)館都引進(jìn)了中英文兩種資源發(fā)現(xiàn)系統(tǒng),中文發(fā)現(xiàn)系統(tǒng)都是超星發(fā)現(xiàn),而外文發(fā)現(xiàn)系統(tǒng)是Summon與Primo,其中北京師范大學(xué)還采用了學(xué)術(shù)搜索引擎(百度學(xué)術(shù))??梢?jiàn),師范類(lèi)高校在選擇發(fā)現(xiàn)系統(tǒng)時(shí),可以考慮從上述發(fā)現(xiàn)系統(tǒng)中選擇。
讀者是發(fā)現(xiàn)系統(tǒng)的最終使用者,所以引進(jìn)發(fā)現(xiàn)系統(tǒng)要盡量考慮到讀者的需求,不同類(lèi)型的讀者對(duì)發(fā)現(xiàn)系統(tǒng)的需求差別很大。如高校學(xué)生會(huì)比較喜歡使用百度學(xué)術(shù)這樣的學(xué)術(shù)搜索引擎,一是由于學(xué)生接觸的百度的產(chǎn)品比較多;二是本科階段學(xué)生對(duì)資源的要求不高,百度學(xué)術(shù)一般可以滿足讀者的需求;三是百度學(xué)術(shù)還有幫助讀者撰寫(xiě)學(xué)位論文的功能,更加適合學(xué)生使用。而從事專(zhuān)業(yè)學(xué)術(shù)研究的科研人員更愿意選擇Summon與超星發(fā)現(xiàn)這樣的資源發(fā)現(xiàn)系統(tǒng),因?yàn)檫@類(lèi)用戶(hù)的研究?jī)?nèi)容更加專(zhuān)業(yè),學(xué)術(shù)搜索引擎從互聯(lián)網(wǎng)上抓取的數(shù)據(jù)質(zhì)量無(wú)法達(dá)到用戶(hù)的要求。
移動(dòng)互聯(lián)網(wǎng)時(shí)代,移動(dòng)設(shè)備成為讀者科研活動(dòng)的重要工具,在眾多的資源發(fā)現(xiàn)系統(tǒng)中,只有超星公司有移動(dòng)客戶(hù)端,并且使用方便,如果讀者的移動(dòng)學(xué)習(xí)活動(dòng)比較多,那么超星發(fā)現(xiàn)是一個(gè)好的選擇。學(xué)術(shù)搜索引擎方面,百度學(xué)術(shù)移動(dòng)化功能較好,百度學(xué)術(shù)開(kāi)通了微信公眾賬號(hào),讀者關(guān)注百度學(xué)術(shù)微信公眾賬號(hào),就可以在微信中查看自己訂閱的內(nèi)容。
資源發(fā)現(xiàn)系統(tǒng)需要支付費(fèi)用才可以使用,而學(xué)術(shù)搜索引擎都是免費(fèi)開(kāi)放的,所以圖書(shū)館也可以根據(jù)自身經(jīng)費(fèi)選擇發(fā)現(xiàn)系統(tǒng)。雖然資源發(fā)現(xiàn)系統(tǒng)數(shù)據(jù)質(zhì)量高,可以更好地與圖書(shū)館自有資源整合,但是需要經(jīng)費(fèi)支持才可以使用,所以對(duì)于暫時(shí)經(jīng)費(fèi)不足的圖書(shū)館,也可以使用學(xué)術(shù)搜索引擎。百度學(xué)術(shù)可以將紙質(zhì)館藏與電子館藏融合到百度學(xué)術(shù)中,并且通過(guò)IP控制,對(duì)本校讀者開(kāi)放自有資源。使用百度學(xué)術(shù)揭示資源的圖書(shū)館有中國(guó)農(nóng)業(yè)大學(xué)、北京林業(yè)大學(xué)、中國(guó)礦業(yè)大學(xué)等高校,而且上述高校只采用了學(xué)術(shù)搜索引擎,沒(méi)有購(gòu)買(mǎi)資源發(fā)現(xiàn)系統(tǒng)。
在調(diào)查的“211工程”高校中,與本館OPAC融合中比較有特色的是重慶大學(xué)圖書(shū)館的發(fā)現(xiàn)系統(tǒng),它不是將本館OPAC數(shù)據(jù)整合到發(fā)現(xiàn)系統(tǒng)中,而是將超星發(fā)現(xiàn)系統(tǒng)的數(shù)據(jù)整合到本館的圖書(shū)館主頁(yè),讀者可以在圖書(shū)館主頁(yè)實(shí)現(xiàn)OPAC數(shù)據(jù)與發(fā)現(xiàn)系統(tǒng)數(shù)據(jù)的統(tǒng)一檢索,而無(wú)須跳轉(zhuǎn)到發(fā)現(xiàn)系統(tǒng)商的網(wǎng)站。清華大學(xué)圖書(shū)館的OPAC與Primo系統(tǒng)深度融合,可以在Primo發(fā)現(xiàn)系統(tǒng)中登錄讀者借閱賬號(hào),實(shí)現(xiàn)本館紙質(zhì)館藏的續(xù)借及預(yù)約等功能。在與本館OPAC整合方面,學(xué)術(shù)搜索引擎功能比較差,基本上資源發(fā)現(xiàn)系統(tǒng)都可以做到查看本館紙質(zhì)圖書(shū)館館藏地,而學(xué)術(shù)搜索引擎目前無(wú)法實(shí)現(xiàn)。
現(xiàn)階段發(fā)現(xiàn)系統(tǒng)還無(wú)法在中英文資源方面同時(shí)并重,國(guó)外的發(fā)現(xiàn)系統(tǒng)對(duì)外文資源收錄較好,而國(guó)內(nèi)的發(fā)現(xiàn)系統(tǒng)在中文資源收錄方面較好,所以在資源發(fā)現(xiàn)系統(tǒng)選擇時(shí)需要考慮到本館資源的語(yǔ)種類(lèi)型。從調(diào)查的結(jié)果看,同時(shí)采用中英文兩種發(fā)現(xiàn)系統(tǒng)的高校有46所,占88所采用資源發(fā)現(xiàn)系統(tǒng)高校的52%,如中國(guó)人民大學(xué)、北京航空航天大學(xué)、上海交通大學(xué)等高校都是采用中英文兩種發(fā)現(xiàn)系統(tǒng)。
學(xué)術(shù)搜索引擎方面,百度學(xué)術(shù)與谷歌學(xué)術(shù)都同時(shí)支持中英文資源發(fā)現(xiàn),國(guó)內(nèi)的百度學(xué)術(shù)中文資源豐富,而谷歌學(xué)術(shù)在英文方面支持較好,而微軟學(xué)術(shù)只支持英文數(shù)據(jù)。對(duì)于學(xué)術(shù)搜索引擎,由于其免費(fèi)的特點(diǎn),圖書(shū)館都可以采用,給讀者多一個(gè)選擇。
本文通過(guò)對(duì)113所“211工程”高校圖書(shū)館發(fā)現(xiàn)系統(tǒng)使用的調(diào)查,分析國(guó)內(nèi)高校主要采用的發(fā)現(xiàn)系統(tǒng)類(lèi)型、建設(shè)方式,以及每種系統(tǒng)的功能特點(diǎn),得出發(fā)現(xiàn)系統(tǒng)已經(jīng)成為圖書(shū)館必備的資源統(tǒng)一揭示工具,無(wú)論是圖書(shū)館對(duì)電子資源的管理需求,還是讀者對(duì)紙電資源統(tǒng)一發(fā)現(xiàn)的需要,發(fā)現(xiàn)系統(tǒng)都不可或缺?,F(xiàn)階段發(fā)現(xiàn)系統(tǒng)進(jìn)展非常巨大,有一些發(fā)現(xiàn)系統(tǒng)已經(jīng)可以整合本館OPAC的所有功能,但是整體上發(fā)現(xiàn)系統(tǒng)還處于成長(zhǎng)階段,有很多不完善的地方。如還沒(méi)有一種發(fā)現(xiàn)系統(tǒng)可以滿足中英文資料的統(tǒng)一發(fā)現(xiàn),在與圖書(shū)館OPAC系統(tǒng)融合方面也存在諸多障礙,這需要圖書(shū)館與資源發(fā)現(xiàn)系統(tǒng)供應(yīng)商共同努力,提升發(fā)現(xiàn)系統(tǒng)的功能。雖然資源發(fā)現(xiàn)系統(tǒng)優(yōu)勢(shì)在于元數(shù)據(jù)質(zhì)量及整合圖書(shū)館本地資源方面,但是學(xué)術(shù)搜索引擎也有很多方面值得資源發(fā)現(xiàn)系統(tǒng)學(xué)習(xí),如系統(tǒng)響應(yīng)速度、在線科研及機(jī)器學(xué)習(xí)等。希望通過(guò)本研究能給圖書(shū)館采用發(fā)現(xiàn)系統(tǒng)提供一些建議,為讀者提供更加優(yōu)質(zhì)的知識(shí)服務(wù)體驗(yàn)。