吳瑩瑩
關(guān)鍵詞:大數(shù)據(jù);圖書館;資源整合
摘?要:在科技力量的推動下,各級圖書館紛紛走上了數(shù)字化發(fā)展的道路。在大數(shù)據(jù)環(huán)境下,圖書館應(yīng)創(chuàng)新信息資源管理模式,這也是圖書館未來的發(fā)展趨勢。文章分析了大數(shù)據(jù)環(huán)境下圖書館信息資源管理模式的創(chuàng)新方式,以期為未來圖書館信息資源整合工作的開展提供借鑒。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2020)02-0135-02
1?大數(shù)據(jù)環(huán)境的產(chǎn)生以及圖書館信息資源整合重要性分析
1.1?大數(shù)據(jù)環(huán)境的產(chǎn)生
2012年之后,大數(shù)據(jù)越來越多地被人們所提及,并被廣泛應(yīng)用到各個領(lǐng)域中?!都~約時報》《華爾街日報》等知名報紙都刊登過與大數(shù)據(jù)有關(guān)的報道。互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的出現(xiàn)產(chǎn)生了大量的數(shù)據(jù)信息,這些信息數(shù)據(jù)決定了某個領(lǐng)域的未來發(fā)展。今天的人們都處于大數(shù)據(jù)環(huán)境下,雖然真正的大數(shù)據(jù)意識還沒有成型,但已成為共識。大數(shù)據(jù)(Big Data)是指多個領(lǐng)域中的數(shù)據(jù)迅速膨脹、變大所產(chǎn)生的新型海量數(shù)據(jù)信息,而真正的大數(shù)據(jù)概念并不是表面的海量數(shù)據(jù),而是對海量數(shù)據(jù)進行的數(shù)據(jù)挖掘,從中獲取更為重要的信息。
1.2?圖書館信息資源整合的重要性
信息資源整合是對所有信息資源進行聚合、融合的意思,將看似無關(guān)、實則有實際聯(lián)系的數(shù)據(jù)信息整理成一個有機整體的過程和結(jié)果,最終形成一個有效的系統(tǒng)。信息資源整合可以被理解為是將信息資源進行優(yōu)化組合的一種動態(tài)概念。圖書館的信息資源構(gòu)成是將圖書館的信息進行收集、加工、利用和傳播,如圖書館MARC格式目錄的資源整合、圖書館自建學(xué)位論文數(shù)據(jù)庫的資源整合、圖書館購買使用權(quán)的數(shù)據(jù)或視頻監(jiān)控數(shù)據(jù)整合、圖書館文件管理庫信息資源整合以及圖書館網(wǎng)絡(luò)虛擬館藏信息資源等。由于圖書館各種信息的載體不同、類型不同,所涉及的資源檢索程序也不同,圖書館需要把些看似無關(guān)實則有實際聯(lián)系的數(shù)據(jù)整合為一個有機整體,并通過不同的使用權(quán)限,為圖書館的讀者利用帶來更多的便利。
2?圖書館信息資源整合的類型和模式
2.1?圖書館區(qū)域信息資源整合
圖書館的館藏信息大體上是按照館藏區(qū)域進行劃分的,區(qū)域劃分又可分為地理劃分、主體劃分和個體劃分。
地理劃分是按照不同國家的文獻資源整合,這是一種宏觀的信息數(shù)據(jù),涉及全球范圍內(nèi)各個圖書館的信息,這種宏觀信息資源整合需要保證各個環(huán)節(jié)的標準統(tǒng)一、協(xié)調(diào)性統(tǒng)一,實現(xiàn)全球數(shù)據(jù)信息的互通有無和資源共享。目前,“中國知網(wǎng)”作為我國第一大圖書館網(wǎng)絡(luò)虛擬數(shù)據(jù)庫,就是集合了多個國家文獻信息的一個網(wǎng)絡(luò)圖書館平臺?!癈AIJS全國高校文獻保障體系”的聯(lián)合編目系統(tǒng)通過執(zhí)行Z39.50協(xié)議,也是集合了不同平臺的異構(gòu)OPAC數(shù)據(jù)庫,建設(shè)了全國書目整合系統(tǒng)。
主體劃分是指對不同圖書館的信息資源進行整合,對集合的信息開展信息內(nèi)容發(fā)布和信息服務(wù)的工作。例如,在上海交通大學(xué)圖書館、北京大學(xué)圖書館的書目信息數(shù)據(jù)庫,讀者只需通過圖書館主體劃分方式就能檢索到圖書館館藏數(shù)據(jù)[1]。目前,主體劃分方式需要在圖書館信息平臺的基礎(chǔ)上進行數(shù)據(jù)整合,但我國很多偏遠地區(qū)圖書館的網(wǎng)絡(luò)系統(tǒng)比較松散,且資源利用程度不高,處于相對獨立的局面,已成為制約圖書館在信息資源管理過程中采用主體劃分方式的一個主要因素。
單體劃分是指將某一個圖書館的多種信息數(shù)據(jù)進行整合,這種整合方式具體表現(xiàn)為該館的圖書內(nèi)容檢索、學(xué)科檢索、館員檢索、跨數(shù)據(jù)庫檢索等。目前,大部分圖書館都采用這種劃分方式,便于館員及讀者的管理和使用。
2.2?館藏信息層次劃分資源整合
按照館藏信息層次劃分是指將圖書館的數(shù)據(jù)信息進行資源層次劃分后再進行檢索的行為。淺度信息是指館藏的基本信息,對信息數(shù)據(jù)并沒有進行深加工,如館藏書目、數(shù)量、分布等。層次劃分的優(yōu)勢是查詢界面簡潔易懂,即使出現(xiàn)重復(fù)數(shù)據(jù)也很容易被分辨出來,但其缺點是數(shù)據(jù)信息整合能力弱,沒有進行深度融合。
中度信息是指將館藏的數(shù)據(jù)信息進行重復(fù)信息排除整合,提供給用戶的不僅是查詢界面,而且是不重復(fù)的高質(zhì)量信息[2]。目前,“Web of Knowledge學(xué)術(shù)資源體系”就是采用了中度信息整合方式,提供了多個數(shù)據(jù)庫的交叉檢索,并且會對檢索數(shù)據(jù)進行查重處理,節(jié)省了用戶對海量數(shù)據(jù)重復(fù)內(nèi)容的排除時間。
深度信息是指將圖書館的知識管理理念深入讀者服務(wù)中,打破了每個數(shù)據(jù)庫資源的分割現(xiàn)狀,按照知識單元體的形式提供給用戶。這種形式下的檢索效率更快,并且融合的數(shù)據(jù)更多。
從以上分析可以看出,信息整合的層次越深,證明信息資源整合的效果越好,讀者吸收和利用信息的效率越高。
3?大數(shù)據(jù)背景下圖書館信息資源管理模式創(chuàng)新方式
3.1?形成數(shù)據(jù)挖掘理念,擴大區(qū)域信息整合
在大數(shù)據(jù)環(huán)境下,圖書館一定要保證信息整合效率,采用數(shù)據(jù)挖掘技術(shù),最大限度地滿足讀者的需求[3]。首先,圖書館要合理借鑒國外經(jīng)驗。在全球市場發(fā)展的環(huán)境下,圖書館作為社會文化提升的主要場所,是每個國家對外發(fā)展的文化資源和財富。圖書館要積極借鑒、吸納、汲取國外先進的信息資源整合理念,采用信息技術(shù)和信息手段,對圖書館信息資源進行合理的開發(fā),實現(xiàn)圖書館信息資源的整合。其次,圖書館要重視發(fā)揮信息資源整合的優(yōu)勢。目前,圖書館的優(yōu)勢是能夠結(jié)合網(wǎng)絡(luò)信息資源構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)庫,減少不必要的重復(fù)建設(shè)[4]。因此,圖書館信息資源整合要抓住資源和技術(shù)的特點,將有關(guān)聯(lián)的信息進行收集、鑒別、剖析和總結(jié),進而形成一個專題數(shù)據(jù)庫,并從該數(shù)據(jù)庫中提取數(shù)據(jù)挖掘技術(shù)所要用到的數(shù)據(jù)信息,便于開展今后的信息整合工作。
3.2?結(jié)合數(shù)據(jù)挖掘技術(shù),進行深度信息整合
為了擴大區(qū)域信息整合,圖書館不僅要處理好單體劃分,將本館信息進行深入融合,還要將主體劃分方式、地理劃分方式融合到一起。為此,圖書館要樹立數(shù)據(jù)挖掘理念,學(xué)習(xí)數(shù)據(jù)挖掘技術(shù),提高數(shù)據(jù)整合能力。
地理劃分是將全球圖書館的信息綜合起來形成一個數(shù)據(jù)庫,或?qū)⑵渌麍D書館的數(shù)據(jù)平臺鏈接到本館的一種方式,因此圖書館要應(yīng)用統(tǒng)計分析類數(shù)據(jù)挖掘技術(shù)。目前,有許多統(tǒng)計類數(shù)據(jù)的挖掘工具軟件可供圖書館使用,在使用統(tǒng)計類數(shù)據(jù)挖掘技術(shù)時,圖書館要明確挖掘?qū)ο螅槍ν诰驅(qū)ο筮M行數(shù)據(jù)統(tǒng)計,并選擇合適的統(tǒng)計模型,進行分析處理和分析結(jié)果的分步驗證[5]。目前,圖書館應(yīng)用最廣泛的就是SPSS統(tǒng)計分析軟件,該軟件通過ODBC數(shù)據(jù)庫接口與圖書館的各種數(shù)據(jù)信息文件相連,并將其轉(zhuǎn)換為SPSS文件形式進行數(shù)據(jù)統(tǒng)計,利用回歸分析、相關(guān)分析、統(tǒng)計分析的挖掘形式對圖書館館藏數(shù)據(jù)、使用周期、文獻資源建設(shè)、借閱趨勢等進行分析和判斷。對于主體劃分方式,圖書館要結(jié)合我國現(xiàn)有的信息平臺,利用知識類數(shù)據(jù)挖掘技術(shù),選擇常用的關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)、遺傳算法等技術(shù)手段[6]。關(guān)聯(lián)規(guī)則是對主體圖書館的數(shù)據(jù)進行分析,讓讀者了解圖書館信息產(chǎn)生的因果關(guān)系,有助于讀者從源頭上選擇資源內(nèi)容和個體圖書館。神經(jīng)網(wǎng)絡(luò)是一種預(yù)測型模型,該模型對圖書館的讀者群體進行分類,按照主題劃分形式,根據(jù)不同讀者群體的特點和閱讀習(xí)慣等各項指標建立神經(jīng)網(wǎng)絡(luò)模型。圖書館利用神經(jīng)網(wǎng)絡(luò)模型能夠更加快速地對信息進行整合處理,從中提取出相關(guān)信息,并將有用的信息提供給管理人員和讀者。目前,大部分圖書館都能對自身信息進行整合,且效果較好[7]。但是,為了深度融合個體信息數(shù)據(jù),圖書館要采用多種手段解決本館的不確定問題,在處理過程中無需對以往數(shù)據(jù)整合內(nèi)容進行技術(shù)處理和信息挖掘,而要針對某些問題找出其內(nèi)在規(guī)律,用于文獻資源建設(shè)、各項決策分析及知識發(fā)現(xiàn)。
4?結(jié)語
綜上所述,信息資源整合是大數(shù)據(jù)背景下出現(xiàn)的一種工作需要,圖書館要根據(jù)不同信息類型、不同信息形態(tài)對相關(guān)信息進行整合。圖書館要從宏觀和微觀的角度規(guī)范信息資源整合的行為,宏觀方面是構(gòu)建全球圖書館的信息數(shù)據(jù)平臺,從中汲取大量有用數(shù)據(jù),豐富圖書館的數(shù)據(jù)信息;微觀方面是圖書館的自身數(shù)據(jù)整合。大數(shù)據(jù)背景下的圖書館信息資源整合是一項系統(tǒng)工程,既要保證整體的戰(zhàn)略發(fā)展方向,還要顧及局部信息的重疊。因此,圖書館不僅要重視信息資源整合模式,還要研究具體的應(yīng)用技術(shù),更好地促進圖書館信息資源整合工作的開展。
參考文獻:
[1] 湯德強.圖書館館藏數(shù)字資源安全管理措施研究[J].傳媒論壇,2019(24):147-148.
[2] 張娟,鄧菲.大數(shù)據(jù)環(huán)境下圖書館信息組織對策分析[J].四川圖書館學(xué)報,2019(6):11-14.
[3] 陳詩蓮.新信息環(huán)境下高校圖書館資源采訪優(yōu)化策略[J].中國管理信息化,2019(24):157-158.
[4] 何望枝.大數(shù)據(jù)背景下數(shù)字圖書館建設(shè)面臨的問題及解決[J].中外企業(yè)家,2019(36):105.
[5] 廖宇峰.基于云計算的圖書館大數(shù)據(jù)創(chuàng)新服務(wù)探析[J].內(nèi)蒙古科技與經(jīng)濟,2019(22):150-151,153.
[6] 李晨,魏墨濟,李憲毅.淺析大數(shù)據(jù)時代下的智慧圖書館建設(shè)[J].內(nèi)蒙古科技與經(jīng)濟,2019(22):158,160.
[7] 王慧娜.大數(shù)據(jù)時代圖書館信息資源建設(shè)策略研究[J].智庫時代,2019(47):104-105.
(編校:崔?萌)