鐘 萍
(安徽大學(xué),合肥 230039)
?
基于大數(shù)據(jù)的圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)研究
——以安徽大學(xué)圖書館為例
鐘 萍
(安徽大學(xué),合肥 230039)
大數(shù)據(jù)時代為圖書館構(gòu)建開放數(shù)據(jù)信息服務(wù)系統(tǒng)提供了新環(huán)境,同時也對圖書館服務(wù)系統(tǒng)提出了更高要求。文章在對大數(shù)據(jù)環(huán)境下圖書館開放數(shù)據(jù)信息服務(wù)進(jìn)行整體分析的基礎(chǔ)上,對該服務(wù)系統(tǒng)的構(gòu)建要素進(jìn)行分析闡釋,提出圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)的四個構(gòu)建版塊,以期促進(jìn)圖書館開放數(shù)據(jù)信息服務(wù)的發(fā)展。
大數(shù)據(jù);圖書館;開放信息資源;開放數(shù)據(jù)信息服務(wù)
大數(shù)據(jù)環(huán)境下,我國圖書館的開放數(shù)據(jù)信息服務(wù)發(fā)展愈加迅速,國內(nèi)外學(xué)者也對開放數(shù)據(jù)信息服務(wù)進(jìn)行了深入的討論研究。有效地利用大數(shù)據(jù)的背景環(huán)境,圖書館可以進(jìn)一步解決開放存取資源和本館數(shù)字資源整合等問題。目前,圖書館界的數(shù)字資源整合方式大致上經(jīng)歷了數(shù)據(jù)整合、信息整合和知識整合三個階段,三者是交叉存在于圖書館信息服務(wù)過程中,而非鏈性的繼承關(guān)系。實際上,圖書館數(shù)字資源整合的最高形態(tài)正是數(shù)據(jù)信息知識整合,這也是未來圖書館資源服務(wù)發(fā)展的趨勢。
大數(shù)據(jù)環(huán)境下,圖書館開放數(shù)據(jù)信息服務(wù)整體上要從服務(wù)思路、服務(wù)目標(biāo)、服務(wù)層次三方面進(jìn)行把握,以在宏觀上加深對開放數(shù)據(jù)信息服務(wù)的理解。
1.1 開放數(shù)據(jù)信息服務(wù)的思路
所謂開放數(shù)據(jù)信息服務(wù),是指將分散在網(wǎng)絡(luò)上多種形式、多種內(nèi)容的數(shù)字資源服務(wù),通過一定的整合方式進(jìn)行有效組織并達(dá)到集成目的的一種服務(wù)方式。目前廣泛使用的開放數(shù)據(jù)信息服務(wù)以O(shè)A資源整合為主,例如跨庫檢索系統(tǒng)的OA資源整合、基于OPAC系統(tǒng)的數(shù)字資源整合等。這些數(shù)據(jù)信息整合方式體現(xiàn)了大數(shù)據(jù)環(huán)境下資源開放獲取的內(nèi)涵。要注意的是,圖書館的開放數(shù)據(jù)信息服務(wù)不僅要實現(xiàn)資源層面的大量整合,還要實現(xiàn)相關(guān)服務(wù)的綁定與一體化,切忌將資源與服務(wù)分裂開來,只有融合了數(shù)據(jù)信息與服務(wù)的一站式開放數(shù)據(jù)信息服務(wù),才能更好地滿足用戶的需求。
1.2 開放數(shù)據(jù)信息服務(wù)的目標(biāo)
在明確服務(wù)思路的基礎(chǔ)上,筆者認(rèn)為開放數(shù)據(jù)信息服務(wù)要實現(xiàn)以下三個目標(biāo):(1)創(chuàng)建行之有效的OA資源收集機制。很多科研機構(gòu)和數(shù)據(jù)庫出版商都陸續(xù)加入到了OA運動中,使得網(wǎng)絡(luò)上形成了大量的OA學(xué)術(shù)資源,圖書館OA資源建設(shè)應(yīng)利用多種渠道搜集完善自身的數(shù)據(jù)庫,從而實現(xiàn)數(shù)據(jù)的全面覆蓋。(2)搭建OA資源一站式檢索平臺。大數(shù)據(jù)環(huán)境下的開放信息資源收集與整合,必須依靠一站式檢索平臺為用戶提供無障礙檢索服務(wù),將面向用戶的信息資源透明化[1]。(3)實現(xiàn)分布式OA數(shù)據(jù)資源的集成整合。OA資源內(nèi)容多、分布廣,單一的信息服務(wù)機構(gòu)很難全面覆蓋,圖書館可以采用集成的方式將分散的資源整合起來,以便于用戶的檢索與獲取。
1.3 開放數(shù)據(jù)信息服務(wù)的層次
基于大數(shù)據(jù)的圖書館開放數(shù)據(jù)信息服務(wù)可具化為信息整合層次。以馬文峰為代表的學(xué)者認(rèn)為信息整合是指通過某種標(biāo)準(zhǔn)或機制,描述、整合、鏈接不同形式與不同載體的信息資源,使得相對獨立的數(shù)據(jù)信息之間搭建起聯(lián)系,實現(xiàn)信息的全面整合與用戶的方便獲取。其中,信息內(nèi)容的深層次整合表現(xiàn)形式主要有引文鏈接、全文搜索、信息門戶等,而淺層次的信息整合方式則有OPAC目錄整合、導(dǎo)航模式等多種類型。
基于大數(shù)據(jù)的圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)包含四個構(gòu)建要素:資源層、數(shù)據(jù)處理層、應(yīng)用層以及用戶交互層。
2.1 資源層——存取資源
資源層的作用在于存取各種開放的資源信息,宏觀方面包括OA期刊、IR、Eprints、OA搜索引擎、深網(wǎng)資源、個人學(xué)術(shù)站點和其它Web資源等等。微觀方面,資源層主要是指MARC、DC、OAI、DOI、Open URL 和 RDF等描述OA資源的各種元數(shù)據(jù)。目前安徽大學(xué)圖書館基本實現(xiàn)OA資源的收集與展示,中國光學(xué)期刊網(wǎng)、中國植物數(shù)據(jù)庫等開放數(shù)據(jù)信息免費向該校讀者提供使用[2]??傊?,資源層是構(gòu)建大數(shù)據(jù)環(huán)境下圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)的核心要素。
2.2 數(shù)據(jù)處理層——數(shù)據(jù)分類
大數(shù)據(jù)環(huán)境下圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)宏觀方面的數(shù)據(jù)處理層往往并不復(fù)雜。一般來說,不需要繁瑣復(fù)雜的技術(shù)手段支持,也不需要開發(fā)者投入過多的智力勞動。數(shù)據(jù)處理層的主要作用是將OA資源進(jìn)行分類處理,從而形成數(shù)據(jù)上的邏輯統(tǒng)一。微觀層面的元數(shù)據(jù)處理則是OA資源整合的關(guān)鍵層次,主要在于對元數(shù)據(jù)的提取、加工和處理,最終形成統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),并進(jìn)行本地化存儲。
2.3 應(yīng)用層——應(yīng)用服務(wù)
數(shù)據(jù)處理層宏觀層面的簡單運作使得應(yīng)用層的宏觀作用也相對簡單,主要在于提供給用戶簡單的鏈接和檢索服務(wù)。例如安徽大學(xué)圖書館主頁的OA資源版塊即提供了中國科技期刊開放獲取平臺的鏈接,方便本校師生直接獲取該平臺的開放數(shù)據(jù)資源。而微觀層面的應(yīng)用層相對復(fù)雜,主要為用戶提供元數(shù)據(jù)的檢索服務(wù)、OPAC檢索服務(wù)以及個性化服務(wù)等應(yīng)用,是大數(shù)據(jù)環(huán)境下圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)的創(chuàng)新所在。
2.4 用戶交互層——交流交互
用戶交流層在宏觀方面形成的面向用戶的終端服務(wù)普遍突破了學(xué)科導(dǎo)航、資源導(dǎo)航等單向提供數(shù)據(jù)服務(wù)的方式,取而代之的是可以提供信息門戶、一站式檢索平臺等服務(wù),便于圖書館發(fā)揮信息技術(shù)的優(yōu)勢,加強用戶與圖書館的交流,從而重新界定了圖書館和用戶之間的關(guān)系,實現(xiàn)彼此間的即時交互。
總而言之,基于大數(shù)據(jù)的圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)模型四要素是以資源層為基礎(chǔ),以數(shù)據(jù)處理層為技術(shù)環(huán)節(jié),在應(yīng)用層具體體現(xiàn),并最終呈現(xiàn)在用戶交互層,形成一項完整的開放式數(shù)據(jù)信息服務(wù)流程(見圖 1)。
在分析了大數(shù)據(jù)背景下圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)四要素的基礎(chǔ)上,筆者提出該系統(tǒng)構(gòu)建如下:建立圖書館本館IR,實現(xiàn)開放存取資源整合;架構(gòu)SOA模型,實現(xiàn)用戶服務(wù)資源整合;應(yīng)用OLAP技術(shù),實現(xiàn)開放資源知識整合;搭建OA資源導(dǎo)航系統(tǒng),實現(xiàn)統(tǒng)一檢索。
圖1 基于大數(shù)據(jù)的圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)四要素[3]
3.1 構(gòu)建本館IR,實現(xiàn)開放存取資源整合
圖書館通常被認(rèn)為是知識的存儲機構(gòu),擔(dān)負(fù)著保存文獻(xiàn)與數(shù)據(jù)的任務(wù)。在大數(shù)據(jù)環(huán)境下,圖書館有責(zé)任與義務(wù)收集保存數(shù)字信息,創(chuàng)建開放數(shù)據(jù)信息環(huán)境。以李春明為代表的學(xué)者提出:圖書館在開放信息資源服務(wù)過程中應(yīng)該構(gòu)建屬于本館的IR,依托IR來提供長期且持續(xù)的開放式服務(wù),達(dá)到長期保存和可持續(xù)獲取的圖書館功能[4]。目前,斯坦福大學(xué)的LOCKSS系統(tǒng)、英國大學(xué)圖書館聯(lián)合體的CEDRAS等都是取得成功的該館IR先例。基于大數(shù)據(jù)的圖書館開放數(shù)據(jù)信息服務(wù)IR模型構(gòu)建把整個過程分為資源層、元數(shù)據(jù)管理層、數(shù)據(jù)倉儲構(gòu)建層和應(yīng)用層四個層面(見圖2)。資源層主要指開放網(wǎng)絡(luò)環(huán)境下各種類型的存取數(shù)字資源,既包括OA期刊資源、OA機構(gòu)知識庫、OA學(xué)科知識庫,也包括預(yù)印本和其它形式的開放資源,而元數(shù)據(jù)管理層的作用則是利用元數(shù)據(jù)抽取轉(zhuǎn)換協(xié)議從資源層中的OA資源中提取元數(shù)據(jù),并將其標(biāo)準(zhǔn)化,以實現(xiàn)元數(shù)據(jù)和數(shù)據(jù)管理的統(tǒng)一和標(biāo)準(zhǔn)。與此同時,元數(shù)據(jù)的管理層將不同類型的數(shù)據(jù)信息和元數(shù)據(jù)進(jìn)行轉(zhuǎn)化,完成相關(guān)的有效操作。數(shù)據(jù)倉儲構(gòu)建層的作用在于將統(tǒng)一標(biāo)準(zhǔn)的元數(shù)據(jù)和數(shù)據(jù)進(jìn)行存儲,并按照元數(shù)據(jù)、數(shù)據(jù)內(nèi)容分門別類形成各種類型的數(shù)據(jù)庫,為應(yīng)用層提供數(shù)據(jù)支持。IR系統(tǒng)在應(yīng)用層主要實現(xiàn)的就是查詢和檢索功能,這種系統(tǒng)不僅可以提供用戶服務(wù),同時還可以為其它系統(tǒng)提供元數(shù)據(jù)。由此可見,大數(shù)據(jù)背景下的開放數(shù)據(jù)信息服務(wù)系統(tǒng)模型中,圖書館既是數(shù)據(jù)提供者,也是數(shù)據(jù)服務(wù)者。
圖2 基于開放存取資源整合圖書館IR構(gòu)建邏輯框架圖[5]
3.2 架構(gòu)SOA模型,實現(xiàn)用戶服務(wù)資源整合
基于大數(shù)據(jù)的圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)還要以用戶服務(wù)為構(gòu)建導(dǎo)向,即利用中間技術(shù)實現(xiàn)各分布式子系統(tǒng)的有機組織和集成,最終達(dá)到有效整合龐雜數(shù)據(jù)信息的目的,其構(gòu)建指導(dǎo)思想是以信息技術(shù)為支撐,以用戶服務(wù)為中心。首先對用戶進(jìn)行客觀而全面的分析,并提供符合讀者用戶需求的高效增值服務(wù)模式,這種模式又被稱為SOA模型。將SOA引入圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)構(gòu)建中,有利于解決現(xiàn)存的數(shù)據(jù)庫異構(gòu)性等問題,原因在于SOA架構(gòu)定義了服務(wù)提供者、服務(wù)注冊中心和服務(wù)請求者三種角色,三者定位明確,能夠?qū)崿F(xiàn)用戶服務(wù)資源整合,真正將圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)打造成為集知識資源與服務(wù)為一體的開放式服務(wù)系統(tǒng)。
3.3 應(yīng)用OLAP技術(shù),實現(xiàn)開放資源知識整合
圖書館開放資源知識整合從一定程度上來說是一種理想化的構(gòu)建模式,其運作流程為:將開放存取資源納入到圖書館的數(shù)字資源體系中,利用OLAP技術(shù)實現(xiàn)針對分布式環(huán)境下的數(shù)字資源的統(tǒng)一檢索和獲取目標(biāo)資源的無縫鏈接,同時為注冊用戶提供多種類型的個性化服務(wù),最后通過開發(fā)的知識整合系統(tǒng),集提供信息、資源和服務(wù)于一體。大數(shù)據(jù)的環(huán)境背景決定了圖書館開放資源知識整合需要在異構(gòu)數(shù)據(jù)信息系統(tǒng)中不斷進(jìn)行收集和集成整合工作,通過對OA資源知識的篩選和提取,存儲相應(yīng)的數(shù)據(jù)要素,最終構(gòu)建起圖書館的本體庫。其中,開放數(shù)據(jù)信息服務(wù)系統(tǒng)的基礎(chǔ)是信息整合部分,而OA數(shù)據(jù)資源的來源和渠道十分廣泛,既可以是學(xué)術(shù)性較強的公共網(wǎng)絡(luò),也可以是數(shù)字圖書館,還可以是圖書館OPAC系統(tǒng)。
3.4 搭建OA資源導(dǎo)航系統(tǒng),實現(xiàn)統(tǒng)一檢索平臺
圖書館OA資源信息導(dǎo)航系統(tǒng)是將不同的信息資源的檢索入口統(tǒng)一整合在一起,提供信息的集成式服務(wù),是將不同數(shù)據(jù)庫中電子資源數(shù)據(jù)按照類型、順序、學(xué)科等角度進(jìn)行分類的平臺。OA資源導(dǎo)航系統(tǒng)的基本功能有利于幫助用戶在開放式數(shù)據(jù)網(wǎng)絡(luò)環(huán)境下,通過資源分類、關(guān)鍵詞等方式快速定位數(shù)據(jù)信息。在OA資源導(dǎo)航系統(tǒng)構(gòu)建方面,安徽大學(xué)圖書館取得了一定突破。安徽大學(xué)圖書館首頁上設(shè)置了專門的OA資源窗口,作為大數(shù)據(jù)環(huán)境下圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)的統(tǒng)一檢索平臺,該校OA資源庫提供了30個開放數(shù)據(jù)庫,并按照不同類型、不同來源進(jìn)行分類,同時支持讀者用戶的自助檢索,使全校讀者切實享受到大數(shù)據(jù)背景下圖書館構(gòu)建開放數(shù)據(jù)信息服務(wù)的便利性。
綜上所述,在基于大數(shù)據(jù)的圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)構(gòu)建過程中,要明確構(gòu)建思路、服務(wù)目標(biāo)與服務(wù)層次,從資源層、數(shù)據(jù)處理層、應(yīng)用層以及用戶交互層四要素著手,構(gòu)建本館IR、架構(gòu)SOA模型、應(yīng)用OLAP技術(shù)、搭建OA資源導(dǎo)航系統(tǒng),以實現(xiàn)圖書館開放數(shù)據(jù)信息服務(wù)系統(tǒng)有效實施。
[1] 孫坦.開放信息環(huán)境:學(xué)術(shù)圖書館信息資源建設(shè)的重定義與再造[J].中國圖書館學(xué)報,2013(3):9-17.
[2] 安徽大學(xué)圖書館[EB/OL].[2016-06-07]http://www.lib.ahu.edu.cn/do/list.php?fid=19.
[3] 蔣玲.開放存取模式下圖書館發(fā)展對策研究[D].大連.遼寧師范大學(xué),2007.
[4] 黎艷.圖書館如何開發(fā)與利用開放存取資源[J].現(xiàn)代情報,2010(1):66-69.
[5] 馬漫江.開放存取期刊與高校圖書館電子期刊資源建設(shè)發(fā)展策略研究[D].湘潭.湘潭大學(xué),2009.
(責(zé)任編輯:王靖雯)
Research on the Model of Open Data Information Service System in Library Based on Big Data——Taking the Library of Anhui University as an Example
ZHONG Ping
(Anhui University, Hefei 230039, China)
The era of big data provides a new environment for the construction of open data information service system in library, and puts forward higher requirements for the library service system. Based on the interpretation of the open data information service in library under the environment of big data,this paper analyzes and expounds the construction elements of the service system, and finally puts forward four construction sections in the open data information service system in library, in order to promote the open data library information service.
big data; library; open information resources; open data information service
2015省級質(zhì)量工程項目(2015jyxm768);安徽大學(xué)圖書館科研項目(TSG14806)
G255.76
A
1006-1525(2016)06-0070-04
鐘 萍,女,研究館員。
2016-05-08